Penerapan Metode Smote Extreme Gradient Boosting Untuk Klasifikasi Penyakit Kanker Serviks Di Kota Medan
Abstract
Cervical cancer or often referred to as cervical cancer is a cancer that forms cervical tissue, cases of cervical cancer occur every year, making it the number 2 killer in Indonesia. This is very concerning considering that cervical cancer is one of the cancers that can be prevented early on but is very difficult to detect. Therefore, a classification is needed for prevention detection, the problem in classification is the classification of unbalanced data where the distribution of samples in all known classes of observations does not have the same proportions. The purpose of this study was to determine the application and results of the accuracy of the Smote Extreme Gradient Boosting method in classifying cervical cancer in hospitals. Dr. Pirngadi, Medan City. This research is a quantitative research, using the smote extreme gradient method. This study found 69 cases of cervical cancer classified using the XGBOOST algorithm and the Smote algorithm as a data imbalance problem solver which is a very good solution because the results of the accuracy of the Area Under Cover (AUC) Smote extreme gradient boosting method yield a value of 1.00% which is classified as the best classification.
Keywords: Binary Classification; SmoteXgboot; Area Under Cover; Matrix; Variables
Abstrak
Kanker serviks atau sering disebut dengan kanker leher rahim merupakan kanker yang membentuk jaringan leher rahim, kasus kanker serviks terjadi setiap tahunnya, menjadikannya pembunuh nomor 2 di Indonesia. Hal ini sangat memprihatinkan mengingat kanker serviks merupakan salah satu kanker yang dapat dicegah sejak dini tetapi sangat sulit dideteksi keberadaannya. Oleh karena itu diperlukan klasifikasi untuk deteksi pencegahannya, permasalahan dalam klasifikasi adalah klasifikasi data yang tidak seimbang dimana sebaran sampel pada semua kelas pengamatan yang diketahui tidak memiliki proporsi yang sama. Tujuan penelitian ini adalah untuk mengetahui penerapan dan hasil keakuratan metode Smote Extreme Gradient Boosting dalam mengklasifikasi penyakit kanker serviks di RSUD. Dr. Pirngadi Kota Medan. Penelitian ini merupakan penelitian kuantitatif, menggunakan metode smote extreme gradient. Penelitian ini didapatkan 69 kasus kanker serviks yang diklasifikasikan menggunakan algoritme XGBOOST dan algoritme Smote sebagai pemecah masalah ketidakseimbangan data sangat menjadi solusi karena pada hasil tingkat keakuratan Area Under Cover (AUC) metode Smote extreme gradient boosting menghasilkan nilai 1.00% yang mana klasifikasi tergolong dalam klasifikasi terbaik.
Keywords
References
F. Ali, R. Kuelker, and B. Wassie, “Understanding cervical cancer in the context of developing countries,” Ann. Trop. Med. Public Heal., vol. 5, no. 1, pp. 3–15, 2019, doi: 10.4103/1755-6783.92871.
H.P. Samadi, ''Yes, I Know Everything abaut Kanker Serviks! Mengenal, Mencegahnya, Bagaimana Anda Menjalani Pengobatan''. Solo: Metagraf, PT Tiga Serangkai Pustaka Mandiri, 2018.
Suparyanto, Kanker Leher Rahim (Carinoma Cervix), 2019. hhtp://dr.suparyanto. blogspot.com/2011/04/Kanker-Leher-Rahim-Carinoma Cervix. html. (Diakses pada tanggal 9 Januari 2019).
M. A. J. P. American Cancer Society. Cancer facts & figures 2013. Atlanta: American Cancer Society, 2019.
N. P. Y. T. Wijayanti, E. N. Kencana, And I. W. Sumarjaya, “Smote: Potensi Dan Kekurangannya Pada Survei,” E-Jurnal Mat., vol. 10, no. 4, p. 235, 2021, doi: 10.24843/mtk.2021.v10.i04.p348.
Kamber, Micheline, Data Mining: Concept and Techniques Second Edition, Morgan Kaufmann Publishers, 2020.
Q. Wang, A hybrid sampling SVM approach to imbalanced data classification. In Abstract and applied analysis, Hawai, Vol. 2014.
H.P. Samadi, ”Yes, I Know Everything abaut Kanker Serviks! Mengenal, Mencegahnya, Bagaimana Anda Menjalani Pengobatan. Solo: Metagraf, PT Tiga Serangkai Pustaka Mandiri, 2019
J. Brownlee, "Imbalanced Classification with Python". Machine Learning Mastery, 2020.
N. Adhelia, "Implementasi metode random forest dan xgboost pada klasifikasi customer churn. Skripsi. Yogyakarta: Fakultas Matematika dan IPA. pp. 38-66, 2020.
T. Chen, & C. Guestrin, "Xgboost: A Scalable Tree Boosting System. In Proceedings Of The 22nd Acm Sigkdd International Conference On Knowledge Discovery And Data Mining, pp. 785-794, 2019.
R. Ubaidillah, M. Muliadi, D. T. Nugrahadi, M. R. Faisal, and R. Herteno, “Implementasi XGBoost Pada Keseimbangan Liver Patient Dataset dengan SMOTE dan Hyperparameter Tuning Bayesian Search,” J. Media Inform. Budidarma, vol. 6, no. 3, p. 1723, 2022, doi: 10.30865/mib.v6i3.4146.
G. A. Shafila, “Implementasi Metode Extreme Gradient Boosting (Xgboost ) untuk Klasifikasi pada Data Bioinformatika (Studi Kasus : Penyakit Ebola , GSE 122692),” Dspace.Uii.Ac.Id, pp. 1–77, 2020, [Online]. Available: https://dspace.uii.ac.id/bitstream/ handle/123456789/29276/16611022 Gregy Addis Shafila.pdf?sequence=1&isAllowed=y
E. Sri, "Penerapan Metode Extreme Gradient Boosting (XGBOOST) pada Klasifikasi Nasabah Kartu Kredit". JOMTA Journal of Mathematics: Theory and Applications vol. 4, no. 1, pp. 21-26, 2022.
B. Robert and E. B. Brown, “No 主観的健康感を中心とした在宅高齢者における 健康関連指標に関する共分散構造分析Title,” no. 1, pp. 1–14, 2022.
S. E. Herni Yulianti, Oni Soesanto, and Yuana Sukmawaty, “Penerapan Metode Extreme Gradient Boosting (XGBOOST) pada Klasifikasi Nasabah Kartu Kredit,” J. Math. Theory Appl., vol. 4, no. 1, pp. 21–26, 2022, doi: 10.31605/jomta.v4i1.1792.
D. M. El Faritsi, D. Saripurna, and I. Mariami, “Sistem Pendukung Keputusan Untuk Menentukan Tenaga Pengajar Menggunakan Metode MOORA,” J. Sist. Inf. Triguna Dharma (JURSI TGD), vol. 1, no. 4, p. 239, 2022, doi: 10.53513/jursi.v1i4.4948.
A.N. Rachmi, "Implementasi Metode Random Forest Dan Xgboost Pada Klasifikasi Customer Churn". Tugas Akhir. Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Islam Indonesia Yogyakarta, 2020.
M. Syukron, R. Santoso, and T. Widiharih, “Perbandingan Metode Smote Random Forest Dan Smote Xgboost Untuk Klasifikasi Tingkat Penyakit Hepatitis C Pada Imbalance Class Data,” J. Gaussian, vol. 9, no. 3, pp. 227–236, 2020, doi: 10.14710/j.gauss.v9i3.28915.
Yendrizal, “Penentuan Siswa SMK Kimia Analisa Terbaik Yang Akan Dikirim Mengikuti Olimpiade Kimia Tingkat Nasional Menerapkan Metode Entropy dan MOORA,” J. Media Inform. Budidarma, vol. 4, no. 1, pp. 963–969, 2020, doi: 10.30865/mib.v4i4.2350.
R. Siringoringo, “Klasifikasi data tidak Seimbang menggunakan algoritme SMOTE dan k-nearest neighbor,” J. ISD, vol. 3, no. 1, pp. 44–49, 2018.
P. Septiana Rizky, R. Haiban Hirzi, and U. Hidayaturrohman, “Perbandingan Metode LightGBM dan XGBoost dalam Menangani Data dengan Kelas Tidak Seimbang,” J Stat. J. Ilm. Teor. dan Apl. Stat., vol. 15, no. 2, pp. 228–236, 2022, doi: 10.36456/jstat.vol15.no2.a5548.
M. R. Givari, M. R. Sulaeman, and Y. Umaidah, “Perbandingan Algoritme SVM, Random Forest Dan XGBoost Untuk Penentuan Persetujuan Pengajuan Kredit,” Nuansa Inform., vol. 16, no. 1, pp. 141–149, 2022, doi: 10.25134/nuansa.v16i1.5406.
A Damayanti, “LANDASAN TEORI 3.1 Data Mining,” pp. 3–13, 2019, [Online]. Available: https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=&cad=rja&uact=8&ved=2ahUKEwiDsLXgh9X2AhXEQ3wKHcsMAEsQFnoECAIQAQ&url=http%3A%2F%2Feprints.akakom.ac.id%2F6689%2F4%2F4_19780420%2520200501%25202%2520001_BAB_III.pdf&usg=AOvVaw1zmzc5dR6q4_wwT0F6vd
J. Juliono, & D.J. Pasya, "Forcasting Produk Domestik Regional Bruto Atas Dasar Harga Konstan Menurut Pengeluaran Menggunakan Metode Doubel Exponential Smoothing". Jurnal Ilmiah Ekonomi Manajemen Jurnal Ilmiah Multi Science, vol. 13, no. 1, pp. 49-57, 2022.
T. T. Maskoen and D. Purnama, “Area Under the Curve dan Akurasi Cystatin C untuk Diagnosis Acute Kidney Injury pada Pasien Politrauma,” Maj. Kedokt. Bandung, vol. 50, no. 4, pp. 259–264, 2018, doi: 10.15395/mkb.v50n4.1342.
How To Cite This :
Refbacks
- There are currently no refbacks.