Analisis Klasifikasi Risiko Penyakit Jantung Menggunakan Metode Random Forest

Alfina Damayanti(1*),Donny Maulana(2),M. Zubair Abdurrohman(3)
(1) Universitas Pelita Bangsa
(2) Universitas Pelita Bangsa
(3) Universitas Pelita Bangsa
(*) Corresponding Author
DOI : 10.35889/progresif.v22i2.3609

Abstract

Heart disease is one of the leading causes of death worldwide, making early detection crucial to reduce the risk of complications and mortality. The advancement of machine learning technology enables fast and accurate analysis of medical data to support the diagnostic process. This study aims to develop a classification model for heart disease risk using the Random Forest algorithm. The dataset used is the Heart Disease Dataset from Kaggle, consisting of 1,025 patient records with 14 medical attributes, such as age, gender, blood pressure, cholesterol level, and maximum heart rate. The methodology applied is CRISP-DM, which includes Data Understanding, Data Preparation, Modeling, Evaluation, and Deployment. Model Evaluation is conducted using a confusion matrix, cross-validation, and ROC-AUC. The results show that the Random Forest algorithm achieves a high Accuracy of 99.96% and a cross-validation score of 0.996. The variables chest pain, ca, and thalach are identified as the most influential factors in the prediction.

Keywords: Heart Disease; Random Forest; Machine learning; Classification; CRISP-DM

 

Abstrak

Penyakit jantung merupakan salah satu penyebab utama kematian di dunia sehingga deteksi dini sangat penting untuk mengurangi risiko komplikasi dan kematian. Perkembangan teknologi machine learning memungkinkan analisis data medis secara cepat dan akurat dalam membantu proses diagnosis. Penelitian ini bertujuan membangun model klasifikasi risiko penyakit jantung menggunakan Algoritma Random Forest. Dataset yang digunakan adalah Heart Disease Dataset dari Kaggle yang terdiri dari 1025 data pasien dengan 14 atribut medis, seperti usia, jenis kelamin, tekanan darah, kadar kolesterol, dan detak jantung maksimum. Metode yang digunakan adalah CRISP-DM meliputi Data Understanding, Data Preparation, Modeling, Evaluation, dan Deployment. Evaluasi model dilakukan menggunakan confusion matrix, cross validation, dan ROC-AUC. Hasil penelitian menunjukkan bahwa Random Forest menghasilkan akurasi tinggi dengan nilai 99,96% serta cross validation sebesar 0,996. Variabel chest pain, ca, dan thalach menjadi faktor paling berpengaruh dalam prediksi.

Kata kunci: Penyakit jantung; Random Forest; Machine learning; Klasifikasi; CRISP-DM.

References


A. M. A. Rahim, I. Y. R. Pratiwi, and M. A. Fikri, “Klasifikasi Penyakit Jantung Menggunakan

Metode Synthetic Minority Over-Sampling Technique dan Random Forest Classifier,” Indonesian Journal of Computer Science (IJCS), vol. 12, no. 5, pp. 2995–3011, Oct. 2023. doi: 10.33022/ijcs.v12i5.3413.

A. S. Hidayat, A. Sunyoto, and H. Al Fatta, “Klasifikasi Penyakit Jantung Menggunakan

Random Forest Classifier,” Jurnal Sistem Komputer dan Kecerdasan Buatan, vol. 7, no. 1, pp. 45–52, Sep. 2023. doi: 10.47970/siskom-kb.v7i1.464.

F. Firmansyah and A. Yulianto, “Prediksi Penyakit Jantung Menggunakan Algoritma Random

Forest,” Jurnal Minfo Polgan, vol. 12, no. 2, pp. 1560–1568, Nov. 2023. doi: 10.33395/jmp.v12i2.13214.

A. Rahmada and E. R. Susanto, “Peningkatan Akurasi Prediksi Penyakit Jantung dengan

Teknik SMOTEENN pada Algoritma Random Forest,” Jurnal Pendidikan dan Teknologi Indonesia, vol. 4, no. 12, pp. 795–803, Jan. 2025. doi: 10.52436/1.jpti.524.

B. E. Sianga, M. C. Mbago, and A. S. Msengwa, “Predicting the prevalence of cardiovascular

diseases using machine learning algorithms,” Intelligence-Based Medicine, vol. 11, Art. no. 100199, Jan. 2025. doi: 10.1016/j.ibmed.2025.100199.

N. Nasution, F. B. Nasution, and M. A. Hasan, “Predicting Heart Disease Using Machine

Learning: An Evaluation of Logistic Regression, Random Forest, SVM, and KNN Models on the UCI Heart Disease Dataset,” IT Journal Research and Development (ITJRD), vol. 9, no. 2, pp. 140–152, Mar. 2025. doi: 10.25299/itjrd.2025.17941.

S. Yuliasari and A. Rahmatulloh, “Performance Analysis and Accuracy of Machine learning Algorithms for Heart Disease Prediction,” Telematika: Jurnal Informatika dan Teknologi Informasi, vol. 22, no. 3, pp. 98–106, Oct. 2025. doi: 10.31515/telematika.v22i3.14022.

A. Lutfia, G. Gunawan, R. S. Rohman, and A. Gunawan, “Penerapan Seleksi Fitur Gain Ratio pada Prediksi Penyakit Jantung Berbasis Naïve Bayes,” Jurnal Responsif, vol. 6, no. 1, pp. 1–10, Feb. 2024. doi: 10.54082/responsif.v6i1.956.

E. R. Susanto and A. E. Pranajaya, “Optimasi Random Forest untuk Prediksi Penyakit Jantung Menggunakan SMOTEENN dan Grid Search,” Jurnal Pendidikan dan Teknologi Indonesia, vol. 5, no. 7, pp. 1965–1979, Jul. 2025. doi: 10.52436/1.jpti.855.

D. N. Handayani and S. Qutub, “Penerapan Random Forest Untuk Prediksi Dan Analisis Kemiskinan,” RIGGS: Journal of Artificial Intelligence and Digital Business, vol. 4, no. 2, pp. 405–412, May 2025. doi: 10.31004/riggs.v4i2.512.

A. Lutfia, G. Gunawan, R. S. Rohman, and A. Gunawan, “Penerapan Seleksi Fitur Gain Ratio pada Prediksi Penyakit Jantung Berbasis Naïve Bayes,” Jurnal Responsif, vol. 6, no. 1, pp. 1–10, Feb. 2024. doi: 10.54082/responsif.v6i1.956.

M. N. Fahmi, “Implementasi Machine learning menggunakan Python Library: Scikit-Learn (Supervised dan Unsupervised Learning),” Sains Data: Jurnal Studi Matematika dan Teknologi, vol. 1, no. 2, pp. 87–96, Dec. 2023. doi: 10.52620/sainsdata.v1i2.31.

E. S. Ompusunggu, A. Nainggolan, and M. K. Sihombing, “Penentuan Kelayakan Promosi Pegawai Menggunakan Algoritma Random Forest Classifier dan XGBoost Classifier,” Jurnal TEKINKOM, vol. 6, no. 2, pp. 345–352, Dec. 2023. doi: 10.37600/tekinkom.v6i2.949.

A. Az Zahra, N. Istiana, and A. Wibowo, “Implementasi Interpolasi Polinomial Bentuk Baku dan Metode Selisih Terbagi Newton Menggunakan Excel dan Google Colab,” GAUSS: Jurnal Pendidikan Matematika, vol. 8, no. 1, pp. 1–13, Jun. 2025. doi: 10.30656/gauss.v8i1.10589.

R. S. Nurhalizah, R. Ardianto, and P. Purwono, “Analisis Supervised dan Unsupervised Learning pada Machine learning: Systematic Literature Review,” Jurnal Ilmu Komputer dan Informatika, vol. 4, no. 1, pp. 61–72, Aug. 2024. doi: 10.54082/jiki.168.

P. Gupta and H. Mathur, “Design and Development of an Efficient Heart Disease Prediction System Using Comprehensive Hybrid Machine learning Algorithm: A Survey,” International Journal of Innovative Research in Technology (IJIRT), vol. 11, no. 2, pp. 124–131, Jul. 2024. ISSN: 2349-6002.

I. K. A. Jayaditya and I. G. A. G. A. Kadyanan, “Implementasi Random Forest pada Klasifikasi Penyakit Kardiovaskular dengan Hyperparameter Tuning Grid Search,” Jurnal Nasional Teknologi Informasi dan Aplikasinya (JNATIA), vol. 2, no. 1, pp. 219–226, Nov. 2023. doi: 10.24843/JNATIA.2023.v02.i01.p25.

S. B. S. Mugdha, M. Uddin, and H. Das, “A Comprehensive Approach to Heart Disease Analysis Using Machine learning Algorithms,” International Journal of Automation and Smart Technology, vol. 14, no. 1, pp. 1–11, 2024, doi: 10.5875/gkz48s35.

E. P. W. Mandala and D. E. Putri, “Penerapan Algoritma Decision Tree dalam Menentukan Kelayakan Penerima Bantuan Program Keluarga Harapan,” Progresif: Jurnal Ilmiah Komputer, vol. 22, no. 1, pp. 126–134, Feb. 2026. doi: 10.35889/progresif.v22i1.3494.

N. Novianti, S.P.A. Alkadri, & I. Fakhruzi, “Klasifikasi Penyakit Hipertensi Menggunakan etode Random Forest. Progresif: Jurnal Ilmiah Komputer, Vol. 20, No. 1, pp. 380-392, 2024.


How To Cite This :

Refbacks

  • There are currently no refbacks.