Ekstraksi Ciri Produktivitas Dinamis untuk Prediksi Topik Pakar dengan Model Discrete Choice

Diana Purwitasari, Chastine Fatichah, Surya Sumpeno, Mauridhi Hery Purnomo

Abstract


Rekomendasi pakar yang aktif atau produktif dapat mendukung kelancaran kolaborasi penelitian. Kegiatan publikasi dan sitasi menjadi indikasi produktivitas seorang pakar. Konfirmasi ketertarikan pakar akan suatu subjek terlihat dengan produktivitasnya di topik tersebut. Dikarenakan fokus riset pakar dapat berubah, kontribusi pada makalah ini adalah model Discrete Choice (Discrete Choice Model, DCM) untuk prediksi topik pakar yang dianggap utama berdasarkan produktivitasnya. DCM menggunakan ciri hasil ekstraksi data bibliografi, yaitu relasi sitasi dan teks judul serta intisari dari artikel milik pakar. Sebelum proses ekstraksi ciri produktivitas dan ciri dinamis untuk representasi perubahan fokus riset dari tiap pakar, pengklasteran teks judul dengan KMeans++ dilakukan untuk identifikasi topik riset. Ada enam jenis ciri produktivitas dan lima kriteria dinamis pada tiap ciri untuk merepresentasikan perilaku pakar terhadap fokus risetnya, sehingga untuk setiap topik hasil pengklasteran akan direpresentasikan sebagai suatu pilihan bidang riset dari seorang pakar dengan 30 ciri hasil ekstraksi. Uji coba yang dilakukan menggunakan pendekatan regresi logistik multinomial untuk DCM dan log-likelihood sebagai indikator pengujian model dari ciri. DCM yang dihasilkan menunjukkan perilaku pakar terkait produktivitas dengan aktif publikasi dan banyak menerima sitasi memberikan nilai presisi pada proses prediksi topik sebesar 80%. Beberapa kombinasi ciri memberikan hasil prediksi yang lebih baik. Hal tersebut terlihat dengan nilai presisi yang lebih rendah, yaitu 60%, jika prediksi topik dilakukan dengan model dari ciri terkait banyak publikasi saja atau banyak sitasi saja.

Keywords


Prediksi Topik; Ekstraksi Ciri Produktivitas; Profil Pakar; Model Discrete Choice; Data Bibliografi

Full Text:

PDF

References


K. Balog, Y. Fang, M. de Rijke, P. Serdyukov, dan L. Si, “Expertise Retrieval,” Found. Trends Inf. Retr., Vol. 6, No. 2–3, hal. 127–256, Feb. 2012.

F. Xia, Z. Chen, W. Wang, J. Li, dan L.T. Yang, “MVCWalker: Random Walk-Based Most Valuable Collaborators Recommendation Exploiting Academic Factors,” IEEE Trans. Emerg. Top. Comput., Vol. 2, No. 3, hal. 364–375, Sep. 2014.

F. Alarfaj, U. Kruschwitz, D. Hunter, and C. Fox, “Finding the Right Supervisor: Expert-Finding in a University Domain,” Proc. 2012 Conf. North Am. Chapter Assoc. Comput. Linguist. Hum. Lang. Technol. Student Res. Work, 2012, hal. 1–6.

F. Xia, W. Wang, T.M. Bekele, dan H. Liu, “Big Scholarly Data: A Survey,” IEEE Trans. Big Data, Vol. 3, No. 1, hal. 18–35, Mar. 2017.

S. Lin, W. Hong, D. Wang, dan T. Li, “A Survey on Expert Finding Techniques,” J. Intell. Inf. Syst., Vol. 49, No. 2, hal. 255–279, Oct. 2017.

H. Deng, I. King, dan M.R. Lyu, “Formal Models for Expert Finding on DBLP Bibliography Data,” 2008 Eighth IEEE International Conference on Data Mining, 2008, hal. 163–172.

Z. Yang, J. Tang, B. Wang, J. Guo, dan J. Li, “Expert2Bólè : From Expert Finding to Bólè Search,” Proc. 15th ACM Conf. Knowl. Discov. data Min., 2009, hal. 1–4.

J. Tang, “AMiner: Toward Understanding Big Scholar Data,” Proceedings of the Ninth ACM International Conference on Web Search and Data Mining, 2016, hal. 467.

D. Purwitasari, C. Fatichah, I. K. E. Purnama, S. Sumpeno, dan M.H. Purnomo, “Inter-Departmental Research Collaboration Recommender System Based on Content Filtering in a Cold Start Problem,” 2017 IEEE 10th International Workshop on Computational Intelligence and Applications, IWCIA 2017 - Proceedings, 2017, hal. 177-184.

L. Guo, X. Cai, F. Hao, D. Mu, C. Fang, dan L. Yang, “Exploiting Fine-Grained Co-Authorship for Personalized Citation Recommendation,” IEEE Access, Vol. 5, hal. 12714–12725, 2017.

G. Panagopoulos, G. Tsatsaronis, dan I. Varlamis, “Detecting Rising Stars in Dynamic Collaborative Networks,” J. Informetr., Vol. 11, No. 1, hal. 198–222, 2017.

H. Jiang, “A Nested Logit-Based Approach to Measuring Air Shopping Screen Quality and Predicting Market Share,” J. Revenue Pricing Manag., Vol. 8, No. 2, hal. 134–147, Mar. 2009.

H. Jiang, X. Qi, dan H. Sun, “Choice-Based Recommender Systems: A Unified Approach to Achieving Relevancy and Diversity,” Oper. Res., Vol. 62, No. 5, hal. 973–993, Oct. 2014.

M. Paredes, E. Hemberg, U. O’Reilly, dan C. Zegras, “Machine Learning or Discrete Choice Models for Car Ownership Demand Estimation and Prediction?,” 2017 5th IEEE International Conference on Models and Technologies for Intelligent Transportation Systems (MT-ITS), 2017, hal. 780–785.

A. Nurilham, D. Purwitasari, dan C. Fatichah, “Ekstraksi Frasa pada Pelabelan Kelompok Artikel Ilmiah dengan Penggabungan Klaster berdasarkan MaximumCommonSubgraph,” J. Nas. Tek. Elektro dan Teknol. Inf., Vol. 7, No. 3, hal. 249-257, 2018.

M. Ben-Akiva dan S.R. Lerman, Discrete Choice Analysis : Theory and Application to Travel Demand, Cambridge, USA: MIT Press, 1985.

V. Aguirregabiria dan P. Mira, “Dynamic Discrete Choice Structural Models: A Survey,” J. Econom., Vol. 156, No. 1, hal. 38–67, 2010.

E. Lancsar, J. Louviere, C. Donaldson, G. Currie, dan L. Burgess, “Best Worst Discrete Choice Experiments in Health: Methods and an Application,” Soc. Sci. Med., Vol. 76, hal. 74–82, 2013.

G. Antonini, M. Bierlaire, dan M. Weber, “Discrete Choice Models of Pedestrian Walking Behavior,” Transp. Res. Part B Methodol., Vol. 40, No. 8, hal. 667–687, 2006.

D. McFadden, “The Measurement of Urban Travel Demand,” J. Public Econ., Vol. 3, No. 4, hal. 303–328, 1974.

D.R. Radev, P. Muthukrishnan, V. Qazvinian, dan A. Abu-Jbara, “The ACL Anthology Network Corpus,” Lang. Resour. Eval., Vol. 47, No. 4, hal. 919–944, Dec. 2013.

J. Santoso et al., “Self-Training Naive Bayes Berbasis Word2Vec untuk Kategorisasi Berita Bahasa Indonesia,” J. Nas. Tek. Elektro dan Teknol. Inf., vol. 7, no. 2, pp. 158–166, 2018.

A. Zaini, M. A. Muslim, dan Wijono, “Pengelompokan Artikel Berbahasa Indonesia Berdasarkan Struktur Laten Menggunakan Pendekatan Self Organizing Map,” J. Nas. Tek. Elektro dan Teknol. Inf., Vol. 6, No. 3, hal. 259–267, 2017.

O. Somantri dan M. Khambali, “Feature Selection Klasifikasi Kategori Cerita Pendek Menggunakan Naïve Bayes dan Algoritme Genetika,” J. Nas. Tek. Elektro dan Teknol. Inf., Vol. 6, No. 3, hal. 301–306, 2017.

R. Řehůřek dan P. Sojka, “Software Framework for Topic Modelling with Large Corpora,” Proceedings of the LREC 2010 Workshop on New Challenges for NLP Frameworks, 2010, hal. 45–50.

F. Pedregosa, G. Varoquaux, A. Gramfort, V. Michel, B. Thirion, O. Grisel, M. Blondel, P. Prettenhofer, R. Weiss, V. Dubourg, J. Vanderplas, A. Passos, dan D. Cournapeau, “Scikit-learn: Machine Learning in Python,” J. Mach. Learn. Res., Vol. 12, hal. 2825–2830, 2011.

P. J. Rousseeuw, “Silhouettes: A graphical aid to the interpretation and validation of cluster analysis,” J. Comput. Appl. Math., Vol. 20, hal. 53–65, 1987.




DOI: http://dx.doi.org/10.22146/jnteti.v7i4.460

Refbacks

  • There are currently no refbacks.


Copyright (c) 2018 Jurnal Nasional Teknik Elektro dan Teknologi Informasi (JNTETI)

JNTETI (Jurnal Nasional Teknik Elektro dan Teknologi Informasi)

Departemen Teknik Elektro dan Teknologi Informasi, Fakultas Teknik Universitas Gadjah Mada
Jl. Grafika No 2. Kampus UGM Yogyakarta 55281
+62 274 552305
jnteti@ugm.ac.id