Perbandingan Algoritma NBC dan SVM dalam Analisis Sentimen Terhadap Dampak Kesehatan Rokok Elektrik

Hani Rahmawati(1),Isa Faqihuddin Hanif(2*)
(1) Universitas Muhammadiyah Prof. DR. HAMKA
(2) Universitas Muhammadiyah Prof. DR. HAMKA
(*) Corresponding Author
DOI : 10.35889/progresif.v21i2.2903

Abstract

There is no optimal method for accurately classifying public opinion, so an analytical approach is needed that is able to capture the nuances of public sentiment regarding the health impacts of e-cigarettes. This study examines public perception of the health impacts of electronic cigarettes using two classification algorithms: NBC and SVM. Data sourced from social media X (formerly Twitter) underwent stages of data cleaning, sentiment labeling, TF-IDF weighting, and data balancing through the SMOTE technique. Performance evaluation was conducted using four key metrics: accuracy, precision, recall, and f1-score. NBC achieved 80.5% accuracy with high recall despite low precision. In contrast, SVM recorded superior performance with 95.2% accuracy and more consistent balance between precision and recall. Therefore, the Support Vector Machine (SVM) algorithm is recommended as a more effective method for analyzing public sentiment regarding electronic cigarettes.

Keywords: Electronic Cigarette; Entiment Analysis; Naïve Bayes Classifier; Support Vector Machine.

Abstrak

Belum adanya metode yang optimal untuk mengklasifikasikan opini publik secara akurat, sehingga diperlukan pendekatan analitik yang mampu menangkap nuansa sentimen masyarakat terhadap dampak kesehatan rokok elektrik. Studi ini mengkaji persepsi publik terhadap dampak kesehatan rokok elektrik dengan menerapkan dua algoritma klasifikasi: NBC dan SVM. Data yang bersumber dari media sosial X (eks Twitter) diproses melalui tahapan pembersihan data, pelabelan sentimen, pembobotan menggunakan TF-IDF, serta penyeimbangan data menggunakan teknik SMOTE. Evaluasi performa dilakukan menggunakan empat metrik utama: accuracy, precision, recall, dan f1-score. NBC memperoleh akurasi sebesar 80,5% dengan recall tinggi meskipun precision-nya rendah. Sebaliknya, SVM mencatat performa superior dengan akurasi 95,2% serta keseimbangan precision dan recall yang lebih konsisten. Oleh karena itu, algoritma Support Vector Machine (SVM) direkomendasikan sebagai metode yang lebih efektif dalam menganalisis sentimen publik terhadap rokok elektrik.

Kata kunci: Analisis Sentimen; Rokok Elektrik; Naïve Bayes Classifier; Support Vector Machine.

References


“Kementerian Kesehatan dan WHO Menerbitkan Laporan Global Adult Tobacco Survey Indonesia 2021,” WHO INDONESIA. https://www.who.int/indonesia/id/news/detail/22-08-2024-ministry-of-health-and-who-release-global-adult-tobacco-survey-indonesia-report-2021

E. Apriani, F. Oktavianalisti, L. D. H. Monasari, I. Winarni, and I. F. Hanif, “Analisis Sentimen Penggunaan TikTok Sebagai Media Pembelajaran Menggunakan Algoritma Naïve Bayes Classifier,” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 4, no. 3, pp. 1160–1168, 2024, doi: 10.57152/malcom.v4i3.1482.

A. Muhammadin and I. A. Sobari, “Analisis Sentimen Pada Ulasan Aplikasi Kredivo Dengan Algoritma Svm Dan Nbc,” Reputasi J. Rekayasa Perangkat Lunak, vol. 2, no. 2, pp. 85–91, 2021, doi: 10.31294/reputasi.v2i2.785.

D. R. Aditya, E. Supriyati, and T. Listyorini, “Analisis Sentimen Pengguna Twitter Terhadap Rokok Elektrik (Vape) Di Indonesia Menggunakan Metode Naïve Bayes,” JIPI (Jurnal Ilm. Penelit. dan Pembelajaran Inform., vol. 7, no. 1, pp. 43–50, 2022, doi: 10.29100/jipi.v7i1.2145.

M. Khadapi and V. Maruli Pakpahan, “Analisis Sentimen Berbasis Jaringan LSTM dan BERT terhadap Diskusi Twitter tentang Pemilu 2024,” JUKI J. Komput. dan Inform., vol. 6, no. 2, pp. 130–137, 2024, [Online]. Available: https://www.ioinformatic.org/ index.php/JUKI/article/view/681

H. D. Ahmad, E. Y. Puspaningrum, and R. Mumpuni, “Studi Performa TF-IDF dan Word2Vec Pada Analisis Sentimen Cyberbullying,” Router J. Tek. Inform. dan Terap., no. 2, pp. 94–106, 2024, [Online]. Available: https://doi.org/10.62951/router.v2i2.76

R. Kosasih and A. Alberto, “Analisis Sentimen Produk Permainan Menggunakan Metode TF-IDF Dan Algoritma K-Nearest Neighbor,” InfoTekJar J. Nas. Inform. dan Teknol. Jar., vol. 6, no. 1, pp. 134–139, 2021, [Online]. Available: https://doi.org/10.30743/infotekjar.v6i1.3893

A. Azrul, A. Irma Purnamasari, and I. Ali, “Analisis Sentimen Pengguna Twitter Terhadap Perkembangan Artificial Intelligence Dengan Penerapan Algoritma Long Short-Term Memory (Lstm),” JATI (Jurnal Mhs. Tek. Inform., vol. 8, no. 1, pp. 413–421, 2024, doi: 10.36040/jati.v8i1.8416.

C. Very et al., “JEPIN (Jurnal Edukasi dan Penelitian Informatika) Optimasi Klasifikasi Sentimen Menggunakan Random Forest dengan Preprocessing K-Means Clustering dan SMOTE,” JEPIN (Jurnal Edukasi dan Penelit. Inform., vol. 10, no. 3, pp. 389–400, 2024.

D. Andriyani, Ahmad Faqih, and Sandy Eka Permana, “The Effect of SMOTE Application on Support Vector Machine Performance in Sentiment Classification on Imbalanced Datasets,” J. Artif. Intell. Eng. Appl., vol. 4, no. 2, pp. 752–757, 2025, doi: 10.59934/jaiea.v4i2.742.

M. R. F. Rahmatullah, P. N. Andono, Affandy, and M. A. Soeleman, “Improving Random Forest Performance for Sentiment Analysis on Unbalanced Data Using SMOTE and BoW Integration: PLN Mobile Application Case Study,” Sci. J. Informatics, vol. 12, no. 1, pp. 1–10, 2025, doi: 10.15294/sji.v12i1.19295.

J. P. Setiadi and S. Sugiyamta, “Analisis dan Visualisasi Berbasis Web Sentimen Pengguna Jenius Menggunakan Naïve Bayes Classifier,” J. Teknol. Sist. Inf. dan Apl., vol. 7, no. 1, pp. 245–254, 2024, doi: 10.32493/jtsi.v7i1.37981.

R. Damanhuri and V. A. Husein, “Analisis Sentimen pada Ulasan Aplikasi Access by KAI Berbahasa Indonesia Menggunakan Word-Embedding dan Classical Machine Learning,” J. Masy. Inform., vol. 15, no. 2, pp. 97–106, 2024, doi: 10.14710/jmasif.15.2.62383.

M. CAHYO, “ANALISIS PREDIKSI KELULUSAN MAHASISWA DENGAN METODE NAIVE BAYES CLASSIFIER (Studi Kasus: Program Studi Diploma III Teknologi Bank Darah di,” 2024, [Online]. Available: https://eprints.utdi.ac.id/10436/

R. Hidayat, M. Fikry, Y. Yusra, F. Yanto, and E. P. Cynthia, “Penerapan Naïve Bayes Classifier dalam Klasifikasi Sentimen Publik di Twitter terhadap Puan Maharani,” JUKI J. Komput. dan Inform., vol. 6, no. 1, pp. 100–108, 2024, doi: 10.53842/juki.v6i1.479.

A. Mudya Yolanda and R. Tri Mulya, “Implementasi Metode Support Vector Machine untuk Analisis Sentimen pada Ulasan Aplikasi Sayurbox di Google Play Store,” VARIANSI J. Stat. Its Appl. Teach. Res., vol. 6, no. 2, pp. 76–83, 2024, doi: 10.35580/variansiunm258.

G. R. Ditami, E. F. Ripanti, and H. Sujaini, “Implementasi Support Vector Machine untuk Analisis Sentimen Terhadap Pengaruh Program Promosi Event Belanja pada Marketplace,” J. Edukasi dan Penelit. Inform., vol. 8, no. 3, p. 508, 2022, doi: 10.26418/jp.v8i3.56478.

D. Normawati and S. A. Prayogi, “Implementasi Naïve Bayes Classifier Dan Confusion Matrix Pada Analisis Sentimen Berbasis Teks Pada Twitter,” J. Sains Komput. Inform. (J-SAKTI, vol. 5, no. 2, pp. 697–711, 2021.

R. Chandra and E. M. Sipayung, “Analisis Sentimen Ulasan Aplikasi Samsat Digital Nasional Menggunakan Algoritma Naive Bayes Classifier,” J. Nas. Teknol. dan Sist. Inf., vol. 10, no. 3, pp. 156–164, 2025, doi: 10.25077/teknosi.v10i3.2024.156-164.

A. Susanto, M. P. Mahardika, and H. Purwantiningrum, “Pemberdayaan Kesehatan Remaja : Edukasi Bahaya Rokok Elektrik bagi Siswa SMA Negeri 2 Tegal,” J. Pengabdi. UNDIKMA, vol. 4, no. 3, p. 634, 2023, doi: 10.33394/jpu.v4i3.8178.


How To Cite This :

Refbacks

  • There are currently no refbacks.