Penerapan Metode Smote Extreme Gradient Boosting Untuk Klasifikasi Penyakit Kanker Serviks Di Kota Medan

Debi Anggitasyah(1*),Machrani Adi Putri Siregar(2)
(1) Universitas Islam Negeri Sumatera Utara
(2) Universitas Islam Negeri Sumatera Utara
(*) Corresponding Author
DOI : 10.35889/jutisi.v12i2.1479

Abstract

Cervical cancer or often referred to as cervical cancer is a cancer that forms cervical tissue, cases of cervical cancer occur every year, making it the number 2 killer in Indonesia. This is very concerning considering that cervical cancer is one of the cancers that can be prevented early on but is very difficult to detect. Therefore, a classification is needed for prevention detection, the problem in classification is the classification of unbalanced data where the distribution of samples in all known classes of observations does not have the same proportions. The purpose of this study was to determine the application and results of the accuracy of the Smote Extreme Gradient Boosting method in classifying cervical cancer in hospitals. Dr. Pirngadi, Medan City. This research is a quantitative research, using the smote extreme gradient method. This study found 69 cases of cervical cancer classified using the XGBOOST algorithm and the Smote algorithm as a data imbalance problem solver which is a very good solution because the results of the accuracy of the Area Under Cover (AUC) Smote extreme gradient boosting method yield a value of 1.00% which is classified as the best classification.

Keywords: Binary Classification; SmoteXgboot; Area Under Cover; Matrix; Variables

 

Abstrak

Kanker serviks atau sering disebut dengan kanker leher rahim merupakan kanker yang membentuk jaringan leher rahim, kasus kanker serviks terjadi setiap tahunnya, menjadikannya pembunuh nomor 2 di Indonesia. Hal ini sangat memprihatinkan mengingat kanker serviks merupakan salah satu kanker yang dapat dicegah sejak dini tetapi sangat sulit dideteksi keberadaannya. Oleh karena itu diperlukan klasifikasi untuk deteksi pencegahannya, permasalahan dalam klasifikasi adalah klasifikasi data yang tidak seimbang dimana sebaran sampel pada semua kelas pengamatan yang diketahui tidak memiliki proporsi yang sama. Tujuan penelitian ini adalah untuk mengetahui penerapan dan hasil keakuratan metode Smote Extreme Gradient Boosting dalam mengklasifikasi penyakit kanker serviks di RSUD. Dr. Pirngadi Kota Medan. Penelitian ini merupakan penelitian kuantitatif, menggunakan metode smote extreme gradient.  Penelitian ini didapatkan 69 kasus kanker serviks yang diklasifikasikan menggunakan algoritme XGBOOST dan algoritme Smote sebagai pemecah masalah ketidakseimbangan data sangat menjadi solusi karena pada hasil tingkat keakuratan Area Under Cover (AUC) metode Smote extreme gradient boosting menghasilkan nilai 1.00% yang mana klasifikasi tergolong dalam klasifikasi terbaik.

 

Keywords


Klasifikasi Biner; SmoteXgboot; Area Under Cover; Matrix; Variabel

References


F. Ali, R. Kuelker, and B. Wassie, “Understanding cervical cancer in the context of developing countries,” Ann. Trop. Med. Public Heal., vol. 5, no. 1, pp. 3–15, 2019, doi: 10.4103/1755-6783.92871.

H.P. Samadi, ''Yes, I Know Everything abaut Kanker Serviks! Mengenal, Mencegahnya, Bagaimana Anda Menjalani Pengobatan''. Solo: Metagraf, PT Tiga Serangkai Pustaka Mandiri, 2018.

Suparyanto, Kanker Leher Rahim (Carinoma Cervix), 2019. hhtp://dr.suparyanto. blogspot.com/2011/04/Kanker-Leher-Rahim-Carinoma Cervix. html. (Diakses pada tanggal 9 Januari 2019).

M. A. J. P. American Cancer Society. Cancer facts & figures 2013. Atlanta: American Cancer Society, 2019.

N. P. Y. T. Wijayanti, E. N. Kencana, And I. W. Sumarjaya, “Smote: Potensi Dan Kekurangannya Pada Survei,” E-Jurnal Mat., vol. 10, no. 4, p. 235, 2021, doi: 10.24843/mtk.2021.v10.i04.p348.

Kamber, Micheline, Data Mining: Concept and Techniques Second Edition, Morgan Kaufmann Publishers, 2020.

Q. Wang, A hybrid sampling SVM approach to imbalanced data classification. In Abstract and applied analysis, Hawai, Vol. 2014.

H.P. Samadi, ”Yes, I Know Everything abaut Kanker Serviks! Mengenal, Mencegahnya, Bagaimana Anda Menjalani Pengobatan. Solo: Metagraf, PT Tiga Serangkai Pustaka Mandiri, 2019

J. Brownlee, "Imbalanced Classification with Python". Machine Learning Mastery, 2020.

N. Adhelia, "Implementasi metode random forest dan xgboost pada klasifikasi customer churn. Skripsi. Yogyakarta: Fakultas Matematika dan IPA. pp. 38-66, 2020.

T. Chen, & C. Guestrin, "Xgboost: A Scalable Tree Boosting System. In Proceedings Of The 22nd Acm Sigkdd International Conference On Knowledge Discovery And Data Mining, pp. 785-794, 2019.

R. Ubaidillah, M. Muliadi, D. T. Nugrahadi, M. R. Faisal, and R. Herteno, “Implementasi XGBoost Pada Keseimbangan Liver Patient Dataset dengan SMOTE dan Hyperparameter Tuning Bayesian Search,” J. Media Inform. Budidarma, vol. 6, no. 3, p. 1723, 2022, doi: 10.30865/mib.v6i3.4146.

G. A. Shafila, “Implementasi Metode Extreme Gradient Boosting (Xgboost ) untuk Klasifikasi pada Data Bioinformatika (Studi Kasus : Penyakit Ebola , GSE 122692),” Dspace.Uii.Ac.Id, pp. 1–77, 2020, [Online]. Available: https://dspace.uii.ac.id/bitstream/ handle/123456789/29276/16611022 Gregy Addis Shafila.pdf?sequence=1&isAllowed=y

E. Sri, "Penerapan Metode Extreme Gradient Boosting (XGBOOST) pada Klasifikasi Nasabah Kartu Kredit". JOMTA Journal of Mathematics: Theory and Applications vol. 4, no. 1, pp. 21-26, 2022.

B. Robert and E. B. Brown, “No 主観的健康感を中心とした在宅高齢者における 健康関連指標に関する共分散構造分析Title,” no. 1, pp. 1–14, 2022.

S. E. Herni Yulianti, Oni Soesanto, and Yuana Sukmawaty, “Penerapan Metode Extreme Gradient Boosting (XGBOOST) pada Klasifikasi Nasabah Kartu Kredit,” J. Math. Theory Appl., vol. 4, no. 1, pp. 21–26, 2022, doi: 10.31605/jomta.v4i1.1792.

D. M. El Faritsi, D. Saripurna, and I. Mariami, “Sistem Pendukung Keputusan Untuk Menentukan Tenaga Pengajar Menggunakan Metode MOORA,” J. Sist. Inf. Triguna Dharma (JURSI TGD), vol. 1, no. 4, p. 239, 2022, doi: 10.53513/jursi.v1i4.4948.

A.N. Rachmi, "Implementasi Metode Random Forest Dan Xgboost Pada Klasifikasi Customer Churn". Tugas Akhir. Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Islam Indonesia Yogyakarta, 2020.

M. Syukron, R. Santoso, and T. Widiharih, “Perbandingan Metode Smote Random Forest Dan Smote Xgboost Untuk Klasifikasi Tingkat Penyakit Hepatitis C Pada Imbalance Class Data,” J. Gaussian, vol. 9, no. 3, pp. 227–236, 2020, doi: 10.14710/j.gauss.v9i3.28915.

Yendrizal, “Penentuan Siswa SMK Kimia Analisa Terbaik Yang Akan Dikirim Mengikuti Olimpiade Kimia Tingkat Nasional Menerapkan Metode Entropy dan MOORA,” J. Media Inform. Budidarma, vol. 4, no. 1, pp. 963–969, 2020, doi: 10.30865/mib.v4i4.2350.

R. Siringoringo, “Klasifikasi data tidak Seimbang menggunakan algoritme SMOTE dan k-nearest neighbor,” J. ISD, vol. 3, no. 1, pp. 44–49, 2018.

P. Septiana Rizky, R. Haiban Hirzi, and U. Hidayaturrohman, “Perbandingan Metode LightGBM dan XGBoost dalam Menangani Data dengan Kelas Tidak Seimbang,” J Stat. J. Ilm. Teor. dan Apl. Stat., vol. 15, no. 2, pp. 228–236, 2022, doi: 10.36456/jstat.vol15.no2.a5548.

M. R. Givari, M. R. Sulaeman, and Y. Umaidah, “Perbandingan Algoritme SVM, Random Forest Dan XGBoost Untuk Penentuan Persetujuan Pengajuan Kredit,” Nuansa Inform., vol. 16, no. 1, pp. 141–149, 2022, doi: 10.25134/nuansa.v16i1.5406.

A Damayanti, “LANDASAN TEORI 3.1 Data Mining,” pp. 3–13, 2019, [Online]. Available: https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=&cad=rja&uact=8&ved=2ahUKEwiDsLXgh9X2AhXEQ3wKHcsMAEsQFnoECAIQAQ&url=http%3A%2F%2Feprints.akakom.ac.id%2F6689%2F4%2F4_19780420%2520200501%25202%2520001_BAB_III.pdf&usg=AOvVaw1zmzc5dR6q4_wwT0F6vd

J. Juliono, & D.J. Pasya, "Forcasting Produk Domestik Regional Bruto Atas Dasar Harga Konstan Menurut Pengeluaran Menggunakan Metode Doubel Exponential Smoothing". Jurnal Ilmiah Ekonomi Manajemen Jurnal Ilmiah Multi Science, vol. 13, no. 1, pp. 49-57, 2022.

T. T. Maskoen and D. Purnama, “Area Under the Curve dan Akurasi Cystatin C untuk Diagnosis Acute Kidney Injury pada Pasien Politrauma,” Maj. Kedokt. Bandung, vol. 50, no. 4, pp. 259–264, 2018, doi: 10.15395/mkb.v50n4.1342.


The PDF file you selected should load here if your Web browser has a PDF reader plug-in installed (for example, a recent version of Adobe Acrobat Reader).

If you would like more information about how to print, save, and work with PDFs, Highwire Press provides a helpful Frequently Asked Questions about PDFs.

Alternatively, you can download the PDF file directly to your computer, from where it can be opened using a PDF reader. To download the PDF, click the Download link above.

Fullscreen Fullscreen Off

Full Text: File PDF (Indonesian)

How To Cite This :

Refbacks

  • There are currently no refbacks.