Pengelompokan Analisis Sentimen Komentar Youtube Terhadap Pengambilalihan Jalan Rusak di Lampung Menggunakan Algoritma Clustering

Niko Purnomo(1*),Windu Gata(2)
(1) Fakultas Teknologi Informasi, Ilmu Komputer, Universitas Nusa Mandiri, Jakarta, Indonesia
(2) Universitas Nusa Mandiri
(*) Corresponding Author
DOI : 10.35889/progresif.v20i2.1936

Abstract

Clustering is a method to group data into groups with certain similarities. This research analyzes text clustering on YouTube video comments about damaged road repairs in Lampung. Three clustering algorithms were used: K-means, DBSCAN, and HDBSCAN. The results showed a silhouette score for K-means of -0.348, DBSCAN of 0.836, and HDBSCAN of 0.106. Theme analysis on DBSCAN clusters showed better clustering than K-means and HDBSCAN. DBSCAN clusters are easier to infer because the topics of each cluster are well classified. Thus, DBSCAN proved superior in clustering text comments, with the highest silhouette score of 0.836% in the case of damaged road repair in Lampung.

Keywords: Analisis Sentimen; Clustering; K-means; DBSCAN; HDBSCAN 

 

Abstrak

Clustering adalah metode untuk mengelompokkan data ke dalam kelompok-kelompok dengan kemiripan tertentu. Penelitian ini menganalisis pengelompokan teks pada komentar video YouTube tentang perbaikan jalan rusak di Lampung. Tiga algoritma clustering digunakan: K-means, DBSCAN, dan HDBSCAN. Hasil penelitian menunjukkan skor siluet untuk K-means sebesar -0,348, DBSCAN sebesar 0,836, dan HDBSCAN sebesar 0,106. Analisis tema pada cluster DBSCAN menunjukkan pengelompokan yang lebih baik dibandingkan K-means dan HDBSCAN. Cluster DBSCAN lebih mudah disimpulkan karena topik tiap cluster terklasifikasi dengan baik. Dengan demikian, DBSCAN terbukti lebih unggul dalam mengelompokkan komentar teks, dengan skor siluet tertinggi 0,836% pada kasus perbaikan jalan rusak di Lampung.

Kata Kunci: Analisis Sentimen; Clustering, K-means; DBSCAN; HDBSCAN.  

References


A. N. H. Regita and I. Santoso, "Analisis Sentimen Publik Terhadap Pengambilalihan Jalan

Rusak Di Lampung Menggunakan Algoritma K-Nearest Neighbors (KNN)," IKRA-ITH

Informatika:Jurnal Komputer dan Informatika, vol. 7, no. 2, pp. 176-182, 2023.

F. Abdulloh, F. Ferian, and I. R. Pambudi, "Analisis sentimen pengguna YouTube terhadap

program vaksin COVID-19," Csrid (Computer Science Research and Its Development

Journal), vol.13,no.3,pp. 141-148, 2021.

A. M. Barik, R. Mahendra, and M. Adriani, "Normalization of Indonesian-English code-mixed

Twitter data," in Proc. 5th Workshop on Noisy User-generated Text (W-N T), 2019, pp. 1-10.

M. Z. Fauzi and A. Abdullah, "Clustering of public opinion on natural disasters in Indonesia

using DBSCAN and K-Medoids algorithms," Journal of Physics: Conference Series, vol.

, no.1,pp.1-7, 2021.

A. Ali, "Klasterisasi Data Rekam Medis Pasien Menggunakan Metode K-Means Clustering

di Rumah Sakit Anwar Medika Balong Bendo Sidoarjo," MATRIK: Jurnal Manajemen, Teknik

Informatika dan Rekayasa Komputer, vol. 19, no. 1, pp. 186-195, 2019.

A. P. Riani, A. Voutama, and T. Ridwan, "Penerapan K-Means clustering dalam

pengelompokan hasil belajar peserta didik dengan metode Elbow," Jurnal Teknologi Sistem

Informasi dan Sistem Komputer TGD, vol. 6, no.1,pp.164-172,2023.

D. A. I. C. Dewi and D. A. K. Pramita, "Analisis Perbandingan Metode Elbow dan Silhouette

pada Algoritma Clustering K-Medoids dalam Pengelompokan Produksi Kerajinan Bali,"

Matrix: Jurnal Manajemen Teknologi dan Informatika,vol.9,no.3,pp.102-109,2019.

W. Jing, C. Zhao, and C. Jiang, "An improvement method of DBSCAN algorithm on cloud

computing," Procedia Computer Science,vol.147, pp. 596-604, 2019.

I. Ghamarian and E. A. Marquis, "Hierarchical density-based cluster analysis framework for

atom probetomography data,"Ultramicroscopy, vol. 200, pp. 28-38, 2019.

I. K. A. Wirayasa and H. Santoso, "Analisis Employee Satisfaction Menggunakan Teknik

Clustering Dan Classification Machine Learning," Progresif: Jurnal Ilmiah Komputer, vol. 18,

no.1,pp.1-10,2022.

I. Kurniawan, I. Susanto, "Implementasi Metode K-Means dan Naïve Bayes Classifier untuk

Analisis Sentimen Pemilihan Presiden (Pilpres) 2019," Jurnal Eksplora Informatika, vol. 9,

no.1,pp.1-10,2019.

M. I. Aditama, et al., "Analisis Klasifikasi Sentimen Pengguna Media Sosial Twitter Terhadap

Pengadaan Vaksin COVID-19," Journal Information Engineering and Educational Technology, vol.

X,no.2549,2020..

Rahmawati, Atika, Aris Marjuni, and Junta Zeniarja. "Analisis Sentimen Publik Pada Media

Sosial Twitter Terhadap Pelaksanaan Pilkada Serentak Menggunakan Algoritma Support

Vector Machine." Creative Communication and Innovative Technology Journal 10.2 (2017):

-206.

A. G. Arja, "Penerapan Sentimen Analis Menggunakan Metode Naïve Bayes Dan SVM,"

Jurnal Ilmu Data,vol. 2, no. 12, 2022.

S. Khairunnisa, A. Adiwijaya, and S. A. Faraby, "Pengaruh Text Preprocessing terhadap

Analisis Sentimen Komentar Masyarakat pada Media Sosial Twitter (Studi Kasus Pandemi

COVID-19),"Jurnal Media Informatika Budidarma, vol. 5, no. 2, pp. 406-414, 2021.

I. M. A. Purniawan, G. M. A. Sasmita, and I. P. A. E. Pratama, "Clustering Berita

Menggunakan Algoritma Tf-Idf dan K-Means Dengan Memanfaatkan Sumber Data Crawling

Pada Situs Detik.com," Jurnal Ilmiah Teknologi dan Komputer, vol. 3, no. 1, pp. 821-830,

M. Z. Fauzi and A. Abdullah, "Clustering of public opinion on natural disasters in Indonesia

using DBSCAN and K-Medoids algorithms," Journal of Physics: Conference Series, vol.

,no.1,pp.1-7, 2021.

W. Saefudin, A. Komarudin, and R. Ilyas, "Visualisasi Kumpulan Berita Dalam Bentuk Peta

Digital Dengan Metode Term Frequency-Inverse Document Frequency dan Gazetteer," in

Proc.Seminar Nasional Sains dan Teknologi Informasi (SENSASI), vol. 2, no. 1, 2019.

M. Z. Fauzi and A. Abdullah, "Clustering of public opinion on natural disasters in Indonesia

using DBSCAN and K-Medoids algorithms," Journal of Physics: Conference Series, vol.

,no.1,pp.1-7, 2021.

N. P. E. Merliana and A. J. Santoso, "Analisa Penentuan Jumlah Cluster Terbaik pada

Metode K-Means Clustering," presented at the Conf., 2015.

D. A. I. C. Dewi and D. A. K. Pramita, "Analisis Perbandingan Metode Elbow dan Silhouette

pada Algoritma Clustering K-Medoids dalam Pengelompokan Produksi Kerajinan Bali,"

Matrix:Jurnal Manajemen Teknologi dan Informatika, vol. 9, no. 3, pp. 102-109, 2019.

T. Purwanti, W. Ramdhan, and S. Santoso, "Penerapan Metode Klasterisasi K-Means untuk

Strategi Promosi Pada SMK Tamansiswa Sukadamai," JUTSI: Jurnal Teknologi dan Sistem

Informasi,vol.1,no. 2, pp. 141-146, 2021.


How To Cite This :

Refbacks

  • There are currently no refbacks.