Klasifikasi Penyakit Hipertensi Menggunakan Metode Random Forest
Abstract
This study discusses the classification of hypertension using the Random Forest method with a focus on age as the main factor. Given the serious impact of hypertension on health, research aims to simplify understanding of the problem, identify treatment gaps, and propose algorithm-based solutions. Using the PPG-BP Database, research methods involve problem identification, data collection, preprocessing, Random Forest modeling, hyperparameter tuning, and model evaluation. The findings show a high level of accuracy, 98% on training data and 95% on testing data, with the model being able to predict hypertension classification based on the variables age, blood pressure, heart rate and body mass index. Despite data imbalance, the preprocessing steps proved to be effective. The research conclusions contribute to the understanding of disease classification, especially hypertension, as well as practical guidance in efforts to prevent and treat it.
Keywords: Classification; Data Mining; Hypertension; Random Forest
Abstrak
Penelitian ini membahas klasifikasi penyakit hipertensi menggunakan metode Random Forest dengan fokus pada usia sebagai faktor utama. Dengan dampak serius hipertensi terhadap kesehatan, penelitian bertujuan untuk menyederhanakan pemahaman masalah, mengidentifikasi celah penanganan, dan mengusulkan solusi berbasis algoritma. Menggunakan PPG-BP Database, metode penelitian melibatkan identifikasi masalah, pengumpulan data, preprocessing, permodelan Random Forest, tuning hyperparameter, dan evaluasi model. Hasil temuan menunjukkan tingkat akurasi tinggi, 98% pada data training dan 95% pada data testing, dengan model mampu memprediksi klasifikasi hipertensi berdasarkan variabel usia, tekanan darah, detak jantung, dan indeks massa tubuh. Meskipun ada ketidakseimbangan data, langkah-langkah preprocessing terbukti efektif. Simpulan penelitian memberikan kontribusi pada pemahaman klasifikasi penyakit, khususnya hipertensi, serta panduan praktis dalam upaya pencegahan dan penanganannya.
Kata kunci: Klasifikasi; Data Mining; Hypertension; Random Forest
References
H. J, J. Andri, T. D. Payana, M. B. Andrianto, and A. Sartika, “Kualitas Tidur Berhubungan dengan Perubahan Tekanan Darah pada Lansia,” J. Kesmas Asclepius, vol. 2, no. 1, pp. 1–11, 2020, doi: 10.31539/jka.v2i1.1146.
S. Hanny and Setyani2 Hanny, “Jurnal kedokteran dan kesehatan,” Kefir a new role as nutraceuticals, vol. 7, no. 5, pp. 200–209, 2016.
P. Purwono et al., “Model Prediksi Otomatis Jenis Penyakit Hipertensi Dengan Pemanfaatan Algoritma Machine Learning Artificial Neural Network,” Insect (Informatics Secur. J. Tek. Inform., vol. 7, no. 2, pp. 82–90, 2022.
J. H. Saing, “Hipertensi pada Remaja,” Sari Pediatr., vol. 6, no. 4, p. 159, 2016, doi: 10.14238/sp6.4.2005.159-65.
S. Adi, “Komparasi Metode Support Vector Machine (Svm), K-Nearest Neighbors (Knn), Dan Random Forest (Rf) Untuk Prediksi Penyakit Gagal Jantung,” J. Ilm. Mat., vol. 10, no. 02, pp. 258–268, 2022.
E. Erlin, Y. Desnelita, N. Nasution, L. Suryati, and F. Zoromi, “Dampak SMOTE terhadap Kinerja Random Forest Classifier berdasarkan Data Tidak seimbang,” MATRIK J. Manajemen, Tek. Inform. dan Rekayasa Komput., vol. 21, no. 3, pp. 677–690, 2022, doi: 10.30812/matrik.v21i3.1726.
I. R. Hikmah and R. N. Yasa, “Perbandingan Hasil Prediksi Diagnosis pada Indian Liver Patient Dataset (ILPD) dengan Teknik Supervised Learning Menggunakan Software Orange,” J. Telemat., vol. 16, no. 2, pp. 69–76, 2021.
K. Abdul Khalim, U. Hayati, and A. Bahtiar, “Perbandingan Prediksi Penyakit Hipertensi Menggunakan Metode Random Forest Dan Naïve Bayes,” JATI (Jurnal Mhs. Tek. Inform., vol. 7, no. 1, pp. 498–504, 2023, doi: 10.36040/jati.v7i1.6376.
M. F. R. Aditya and N. L. Azizah, “Prediction of Hypertension Disease Using Decision Tree and Random Forest Methods [ Prediksi Penyakit Hipertensi Menggunakan metode Decision Tree dan Random Forest ],” pp. 1–9, doi: https://doi.org/10.21070/ups.3200.
H. Malik, M. Nuh, and M. H. Fatoni, “Perancangan Database Informasi Medis untuk Sistem Prediksi Hipertensi,” J. Tek. ITS, vol. 9, no. 1, 2020, doi: 10.12962/j23373539.v9i1.45686.
P. L. Gilabert et al., “An efficient combination of digital predistortion and ofdm clipping for power amplifiers,” Int. J. RF Microw. Comput. Eng., vol. 19, no. 5, pp. 583–591, 2009, doi: 10.1002/mmce.20381.
J. R. Thompson and B. L. Licklider, “Visualizing Urban forestry: Using concept maps to assess student performance in a learning-centered classroom,” J. For., vol. 109, no. 7, pp. 402–408, 2011.
I. N. Abrar and A. Abdullah, “Klasifikasi Penyakit Liver Menggunakan Metode Elbow Untuk Menentukan K Optimal pada Algoritma K-Nearest Neighbor ( K-NN ),” vol. 12, pp. 218–228, 2023.
A. Harun and D. Putri Ananda, “Analisa Sentimen Opini Publik Tentang Vaksinasi Covid-19 di Indonesia Menggunakan Naïve bayes dan Decission Tree,” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 1, no. 1, pp. 58–64, 2021, doi: 10.57152/malcom.v1i1.63.
T. Praningki and I. Budi, “Sistem Prediksi Penyakit Kanker Serviks Menggunakan CART, Naive Bayes, dan k-NN,” Creat. Inf. Technol. J., vol. 4, no. 2, p. 83, 2018, doi: 10.24076/citec.2017v4i2.100.
How To Cite This :
Refbacks
- There are currently no refbacks.