Klasifikasi Masa Tunggu Alumni Untuk Mendapatkan Pekerjaan Berdasarkan Kompetensi Menggunakan Algoritma C4.5 (Studi Kasus : Fasilkom Unsika)
Abstract
Abstract
Tracking college graduates needs to be done to find out how their current job status is, especially the waiting time to get a job, as an indicator of the quality of college graduates. Information technology support such as data mining can be used as tools to generate knowledge. This study aims to predict the waiting time for alumni to get a job using a single decision tree algorithm (C4.5) and compare the decision tree algorithm (C4.5) with the forward selection feature. Data processing uses the C4.5 algorithm with the help of RapidMiner Studio software. The results show that the decision tree algorithm (C4.5) with the forward selection feature achieves the best performance with 80.37% accuracy, 79.56% precision, 81.34% recall, 80.40% f-measure and 0.914 AUC which includes into the excellent classification category. Thus, the C4.5 algorithm based on Forward Selection is proven to increase the level of accuracy, compared to a single decision tree (C4.5) algorithm, which is characterized by an increase in the accuracy value of 25.93%.
Keywords: Data Mining, Decision Tree, C4.5, Classification, Graduates Waiting Time
Abstrak
Pelacakan alumni perguruan tinggi perlu dilakukan untuk mengetahui bagaimana status pekerjaan mereka saat ini, khususnya waktu tunggu dalam mendapatkan pekerjaan, sebagai salah indikator kualitas lulusan perguruan tinggi. Dukungan teknologi informasi seperti data mining dapat digunakan sebagai tools untuk menghasilkan suatu pengetahuan. Penelitian ini bertujuan untuk memprediksi waktu tunggu alumni mendapatkan pekerjaannya dengan menggunakan algoritma decision tree (C4.5) tunggal dan dibandingkan algoritma decision tree (C4.5) dengan fitur forward selection. Pengolahan data menggunakan algoritma C4.5 dengan bantuan software RapidMiner Studio. Hasilnya menunjukkan bahwa algoritma decision tree (C4.5) dengan fitur forward selection meraih performa terbaik dengan nilai accuracy 80,37%, precision 79,56%, recall 81,34%, f-measure 80,40% dan AUC 0.914 yang termasuk ke dalam kategori excellent classification. Dengan demikian, algoritma C4.5 berbasis Forward Selection terbukti dapat meningkatkan tingkat akurasi, dibandingkan dengan algoritma decision tree (C4.5) tunggal, yang ditandai dengan peningkatan nilai akurasi sebesar 25,93%
Kata kunci: Data Mining, Decision Tree, C4.5, Klasifikasi, Waktu Tunggu Alumni
References
Adnyana I. M. B. Implementasi Naive Bayes Untuk Memprediksi Waktu Tunggu Alumni Dalam Memeperoleh Pekerjaan. Seminar Nasional Teknologi & Sains (SAINTEKS). 2020: 131-134.
Amrinda G.D. Analisis Klasifikasi Waktu Tunggu Kerja Dengan Metode Support Vector Machine dan Naive Bayes Classification. Skripsi MIPA. Universitas Islam Indonesia, Yogyakarta. 2018
Anisa, Mesran. Analisa Pola Pekerjaan Lulusan STMIK Budi Darma Menerapkan Metode C4.5. Konferensi Nasional Teknologi Informasi dan Komputer, 2018, (2): 446-449.
Apriliana, Natalis R, Jumadil N. Implementasi Text Mining Klasifikasi Skripsi Menggunakan Metode Naïve Bayes Classifier. Semantik. 2017, 3(2): 187–94.
Ardianysah D, Walim. Algoritma C4.5 Untuk Klasifikasi Calon Peserta Lomba Cerdas Cermat Siswa SMP Dengan Menggunakan Aplikasi RapidMiner. Jurnal Inkofar. 2018, 1(2): 5-12.
Asroni, Respati B, Riyadi S. Penerapan Algoritma C4.5 untuk Klasifikasi Jenis Pekerjaan Alumni di Universitas Muhammadiyah Yogyakarta. Semesta Teknika. 2018, 21(2): 158-165.
Aziz M. F, Defiyanti, S, Sari, B. N. Perbandingan Algoritma Cart dan K-Nearest Neighbor Untuk Prediksi Luas Lahan Panen Tanaman Padi di Kabupaten Karawang. Jurnal TAM ( Technology Acceptance Model). 2018, 9(2): 74- 78.
Bahar, B. Model Pengujian Akurasi Berbasis Empiris Pada Algoritma A-Priori. Jutisi: Jurnal Ilmiah Teknik Informatika dan Sistem Informasi, 2019, 8(2): 45-56.
Bode A. K-Nearest Neighbor Dengan Feature Selection Menggunakan Backward Selection Untuk Prediksi Harga Komoditi Kopi Arabika. Jurnal Ilmiah. 2017, 9(2): 188-195.
Cahyaningtyas R, Luqman. R, Yolana I. H. Klasifikasi Kompetensi Alumni Berdasarkan Masa Tunggu Alumni untuk Mendapatkan Pekerjaaan Menggunakan Metode Algoritma C4.5. KILAT. 2017, 9(2)_: 297-310.
Chusna, H. A,Rumiati, A. T. Penerapan Metode K-Means dan Fuzzy C-Means untuk Pengelompokan Sekolah Menengah Pertama (SMP) di Indonesia Berdasarkan Standar Nasional Pendidikan (SNP). JURNAL SAINS DAN SENI ITS. 2020, 9(2): 216-223.
Eka S, Murtiadi A, Muh. Ikhsan Alif. S. Analisis Kesesuaian Kompetensi Alumni Uin Alauddin Terhadap Kepuasan Stakeholder. Jurnal Minds: Manajemen Ide dan Inspirasi, 2016, 3(1): 27-57
Fahriah S, Wiktasari. Algoritma C4.5 Berbasis Forward Selection Untuk Klasifikasi Bidang Minat Studi Mahasiswa Teknik Informatika. Jurnal Teknik Elektro Terapan. 2021, 10(1): 1-6.
Fanani M. R. Algoritma Naive Bayes Berbasis Forward Selection Untuk Prediksi Bimbingan Konseling Siswa. Jurnal DISPROTEK. 2020, 11(1):13-22.
Fitriani E. Perbandingan Algoritma C4.5 dan Naïve Bayes Untuk Menentukan Kelayakan Penerima Bantuan Program Keluarga Harapan. SISTEMASI:Jurnal Sistem Informasi. 2020, 9(1): 103-115.
Han, J, Kamber, M, Pei, J. Data mining Concepts and Techniques. Waltham: Morgan Kaufmann. 2012
Khoirudin, Hadi S, Nugroho A. Analisa dan Penerapan Metode Neural Networks Dalam Mengidentifikasi Faktor-Faktor Masa Tunggu Kerja Lulusan. Pengembangan Rekayasa dan Teknologi. 2020, 16(1): 17-22.
Larose, D. T. Discovering Knowledge In Data An Introduction. A John Wiley & Sons, Inc. 2005.
Mardi Y. Data Mining : Klasifikasi Menggunakan Algoritma C4.5. Jurnal Edik Informatika. 2019, 2(2): 213-219.
N. Nuraeni. Penentuan Kelayakan Kredit Dengan Algoritma Naïve Bayes Classifier : Studi Kasus Bank Mayapada Mitra Usaha Cabang Pgc. Teknik Komputer, 2017, 3(1): 9–15.
Nanja M, Purwanto. Metode K-Nearest Neighbor Berbasis Forward Selection Untuk Prediksi Harga Komoditi Lada. Jurnal Pseudocode 2015, 2(1): 53-64.
Novakovic, J. D., Veljovic´, A., Ilic, S. S., Papic, Z., & Tomovic, M. Evaluation of Classification Models in Machine Learning. Theory and Applications of Mathematics & Computer Science. 2017, 7(1): 39-46.
Nugroho M. F, Wibowo S. Fitur Seleksi Forward Selection Untuk Menentukan Atribut Yang Berpengaruh Pada Klasifikasi Kelulusan Mahasiswa Fakultas Ilmu Komputer UNAKI Semarang Menggunakan Algoritma Naive Bayes. Jurnal informatika UPGRIS. 2017, 3(1): 63-70.
Purba, S. D, Sirait, P, Arwin. Credit Card Risk Classification Using KNearest Neighbor Weighted Algorithm Based on Forward Selection. Jurnal Mantik. 2020, 4(3): 1551-1559.
Takdirillah, R. Penerapan Data Mining Menggunakan Algoritma Apriori Terhadap Data Transaksi Penjualan Bisnis Ritel. Edumatic: Jurnal Pendidikan Informatika. 2020, 4(1): 37–46.
Uruilal, I, Supit, C. J, Jansen, T. Prediksi Banjir Di Sungai Ranowangko Kecamatan Amurang Kabupaten Minahasa Selatan. Jurnal Sipil Statik. 2020. 8(2): 167-174.
Wahyono H, Dwiza R. Prediksi Calon Pendonor Darah Potensial Dengan Algoritma Naive Bayes, K-Nearest Neighbors dan Decision Tree C4.5. JURIKOM (Jurnal Riset Komputer). 2020, 7(1): 7-14.
Wahyono, Nugroho A. Penerapan Algoritma C4.5 Untuk Prediksi Tingkat Kompetensi Karyawan PT Multistarda Arah Sarana. JOUTICA. 2018, 3(1): 145-150
Wulandari. N. Analisis Minat Belajar Siswa Pada Lembaga Pendidikan Indonesia Amerika Perumnas 3 Bekasi Dengan Metode C4.5. Jurnal Rekayasa Informasi. 2019, 8(1): 22-31.
How To Cite This :
Refbacks
- There are currently no refbacks.