Perbandingan Algoritma K-Means dan DBSCAN dalam Pengelompokkan Data Penjualan Elektronik

Tria Setyani(1*),Yulia Indriani(2),Muhammad Fadli(3),Erliyan Redy Susanto(4)
(1) Universitas Teknokrat Indonesia
(2) Universitas Teknokrat Indonesia
(3) Politeknik Negeri Lampung
(4) Universitas Teknokrat Indonesia
(*) Corresponding Author
DOI : 10.35889/progresif.v21i2.2775

Abstract

This study aims to compare the performance of the K-Means and DBSCAN algorithms in clustering electronic sales data at CV Rey Gasendra. Clustering methods are used to identify sales patterns based on the transaction intensity of each product. The K-Means algorithm was implemented by determining the optimal number of clusters using the Elbow Method and Silhouette Score evaluation. Meanwhile, DBSCAN was applied using a density-based approach, which does not require specifying the number of clusters in advance and relies on eps and minPts parameters. The results showed that K-Means produced more stable and interpretable clusters with a Silhouette  Score of 0.961, whereas DBSCAN excelled in detecting outliers and handling irregular data distributions, despite generating a large amount of noise. Performance evaluation using metrics such as Silhouette  Score, Davies-Bouldin Index (DBI), and Sum of Squared Errors (SSE) indicated that K-Means is more suitable for structured product segmentation, while DBSCAN is more effective for exploring unusual sales patterns. These findings can support data-driven business decisions, such as marketing strategies, inventory management, and product recommendations.

Keywords: K-Means; DBSCAN; Clustering; Sales data; Product segmentation

 

Abstrak

Penelitian ini bertujuan untuk membandingkan kinerja algoritma K-Means dan DBSCAN dalam pengelompokan data penjualan elektronik pada CV Rey Gasendra. Metode clustering digunakan untuk mengidentifikasi pola penjualan berdasarkan intensitas transaksi setiap produk. Algoritma K-Means diimplementasikan dengan penentuan jumlah klaster optimal menggunakan metode Elbow dan evaluasi Silhouette Score. Sementara itu, DBSCAN diimplementasikan dengan pendekatan berbasis kepadatan, tanpa memerlukan jumlah klaster awal, dan menggunakan parameter eps serta minPts.  Hasil penelitian menunjukkan bahwa K-Means memberikan hasil clustering yang lebih stabil dan mudah diinterpretasikan dengan Silhouette Score mencapai 0,961, sedangkan DBSCAN unggul dalam mendeteksi outlier dan menangani data dengan distribusi tidak beraturan, meskipun menghasilkan banyak noise. Evaluasi performa berdasarkan metrik seperti Silhouette Score, Davies-Bouldin Index (DBI), dan Sum of Squared Errors (SSE) menunjukkan bahwa K-Means lebih cocok digunakan untuk segmentasi produk penjualan yang terstruktur, sedangkan DBSCAN lebih efektif untuk eksplorasi pola penjualan yang tidak lazim. Temuan ini dapat membantu pengambilan keputusan bisnis berbasis data, seperti strategi pemasaran, manajemen stok, dan rekomendasi produk.

Kata kunci: K-Means; DBSCAN; Clustering; Data penjualan; Segmentasi produk

References


T. Setyani, A. F. Octaviansyah, and R. Andika, “Penerapan Data Mining Menggunakan Metode K-Means Clustering Pada Penjualan Handphone Dan Elektronik ( Studi Kasus : Cv Rey Gasendra),” vol. 5, no. 1, pp. 18–22, 2024.

R. Anitha and A. Kannan, “Data mining techniques for business intelligence: A comparative study of clustering algorithms,” Int. J. Data Min. & Knowl. Manag. Process, vol. 12, no. 2, pp. 1–14, 2022.

S. D. K. Wardani, A. S. Ariyanto, M. Umroh, and D. Rolliawati, “Perbandingan Hasil Metode Clustering K-Means, Db Scanner & Hierarchical Untuk Analisa Segmentasi Pasar,” JIKO (Jurnal Inform. dan Komputer), vol. 7, no. 2, pp. 191-202, 2023, doi: 10.26798/jiko.v7i2.796.

M. Ahmed and A. Khan, “An enhanced DBSCAN for high-dimensional data clustering,” J. Intell. & Fuzzy Syst., vol. 38, no. 4, pp. 4835–4843, 2020.

P. Lestari and I. Saputra, “Clustering penjualan dengan algoritma K-Means dan visualisasi menggunakan PCA,” J. Sist. Inf., vol. 17, no. 2, pp. 142–150, 2021.

F. M. Pranata, S. H. Wijoyo, and N. Y. Setiawan, “Analisis Performa Algoritma K-Means dan DBSCAN Dalam Segmentasi Pelanggan Dengan Pendekatan Model RFM,” vol. 1, no. 1, pp. 2548–964, 2017, [Online]. Available: http://j-ptiik.ub.ac.id

J. Han, J. Pei, and M. Kamber, Data mining: Concepts and techniques, 4th ed. Morgan Kaufmann, 2021.

A. Andrianto and E. Elisa, “Analisis Clustering Dengan K-Means Untuk Pengelompokkan Penjualan Elektronik Pada Batam It Mart,” Comput. Sci. Ind. Eng., vol. 8, no. 1, pp. 19–26, 2023, doi: 10.33884/comasiejournal.v8i1.6633.

I. Sufairoh, A. C. Rani, K. Amalia, and D. Rolliawati, “Perbandingan Hasil Analisis Clustering Metode K-Means, DBSCAN Dan Hierarchical Pada Data Marketplace Electronic Phone,” JOINS (Journal Inf. Syst., vol. 8, no. 1, pp. 97–105, 2023, doi: 10.33633/joins.v8i1.8016.

T. I. Berliana, E. Budianita, A. Nazir, and F. Insani, “Clustering Data Persediaan Barang Menggunakan Metode Elbow dan DBSCAN,” J. Sist. Komput. dan Inform., vol. 5, no. 2, pp. 258-267, 2023, doi: 10.30865/json.v5i2.7089.

A. Lega, P. Adytia, and S. Lailiyah, “Penerapan Algoritma K-Means Clustering Untuk Klasterisasi Penjualan Smartphone Pada Carin Cell,” KLIK Kaji. Ilm. Inform. dan Komput., vol. 4, no. 1, pp. 649–657, 2023.

R. Jha and B. Baniya, “Comparative analysis of K-Means and DBSCAN clustering algorithms for customer segmentation,” J. Big Data Res., vol. 9, no. 1, pp. 15–25, 2023, doi: 10.1016/j.bdr.2023.100053.

A. Santoso and B. Nugroho, “Implementasi metode PCA dan K-Means dalam segmentasi data pelanggan,” J. Teknol. Inf. dan Ilmu Komput., vol. 8, no. 3, pp. 355–363, 2021.

Sisca Agustin Diani Budiman, Diah Safitri, and Dwi Ispriyanti, “Perbandingan Metode K-Means dan Metode DBSCAN Pada Pengelompokan Rumah Kost Mahasiswa di Kelurahan Tembalang Semarang,” J. Gaussian, vol. 5, no. 4, pp. 757–762, 2016.

Y. P. Putra and H. Wibowo, “Analisis clustering data penjualan menggunakan metode K-Means dan DBSCAN,” J. Teknol. dan Sist. Komput., vol. 10, no. 2, pp. 100–109, 2022.

F. D. Wahyuningtyas, A. Arafat, A. Stiawan, and D. Rolliawati, “Komparasi Algoritma Hierarchical, K-Means, dan DBSCAN pada Analisis Data Penjualan Melalui Facebook,” Explor. J. Sist. Inf. dan Telemat., vol. 14, no. 1, pp. 1-12, 2023, doi: 10.36448/jsit.v14i1.2931.

A. M. Siregar and T. Silalahi, “Perbandingan algoritma K-Means dan DBSCAN untuk klasifikasi data penjualan barang elektronik,” J. Sist. Inf. dan Teknol., vol. 5, no. 1, pp. 67–75, 2023.

H. Sutrisno and A. Pratama, “Optimalisasi segmentasi penjualan dengan algoritma K-Means dan DBSCAN,” J. Data Min. dan Sist. Inf., vol. 4, no. 1, pp. 55–62, 2022.

D. Rahmawati and N. Fitria, “Evaluasi metode clustering untuk data penjualan ritel,” J. Tek. Inform. dan Sist. Inf., vol. 9, no. 1, pp. 95–104, 2023.

V. Sharma and P. Gupta, “Performance evaluation of clustering algorithms in sales data mining,” Procedia Comput. Sci., vol. 185, pp. 332–339, 2021, doi: 10.1016/j.procs.2021.05.035.

A. Fauzi, R. Supriyadi, and N. Maulidah, “Deteksi Penyakit Kanker Payudara dengan Seleksi Fitur berbasis Principal Component Analysis dan Random Forest,” J. Infortech, vol. 2, no. 1, pp. 96–101, 2020, doi: 10.31294/infortech.v2i1.8079.

R. A. Widodo and A. Jananto, “Implementasi Data Mining dalam Clustering Menu Favorit Pada Cafe Anetos . Coffeebrunch Menggunakan Algoritme K-Means,” J. Ilm. Komput., vol. 19, pp. 710–724, 2023.


How To Cite This :

Refbacks

  • There are currently no refbacks.