Deteksi Fake Review Menggunakan Metode Support Vector Machine dan Naïve Bayes Di Tokopedia

Habib Alamsyah(1*),Yana Cahyana(2),Adi Rizky Pratama(3)
(1) Universitas Buana Perjuangan Karawang
(2) Universitas Buana Perjuangan Karawang
(3) Universitas Buana Perjuangan Karawang
(*) Corresponding Author
DOI : 10.35889/jutisi.v12i2.1222

Abstract

In the world of online business and services, product and service reviews can have a major influence on user trust and purchasing decisions. However, there is a risk of fake reviews that can affect user trust and purchase decisions. Therefore, detecting fake reviews is very important to avoid fraud and increase user trust. The techniques used in detecting fake reviews are Support vector machine (SVM) and Naïve Bayes. SVM and Naïve Bayes are machine learning algorithms used to classify data into positive and negative categories. In the implementation results using SVM on fake review detection, it appears that SVM and Naïve Bayes can classify reviews into two categories with fairly high accuracy. Through the implementation of SVM and Naïve Bayes, it has been identified that the patterns that are often found in fake reviews are excessive use of words and inconsistent with the actual user experience, so that they can help identify fake reviews more effectively. With the results of the implementation of SVM and Naïve Bayes on fake review detection, several stages in this study used the SVM and Naïve Bayes methods, namely preprocessing, word weighting using TF-IDF, which then implemented the SVM and Naïve Bayes methods. The SVM test results can detect reviews with an accuracy of up to 94.38% and Naïve Bayes produces an accuracy of 91.57%.

Keywords: support vector machine; naïve bayes; fake review; detection; machine learning.

 

Abstrak

Dalam dunia bisnis dan layanan online, review produk dan layanan dapat memberikan pengaruh yang besar terhadap kepercayaan dan keputusan pembelian pengguna. Namun, terdapat risiko review palsu atau fake review yang dapat mempengaruhi kepercayaan dan keputusan pembelian pengguna. Oleh karena itu, pendeteksian fake review sangat penting dilakukan untuk menghindari penipuan dan meningkatkan kepercayaan pengguna. Teknik yang digunakan dalam pendeteksian fake review adalah Support vector machine (SVM) dan Naïve bayes. SVM dan Naïve bayes adalah algoritma machine learning yang digunakan untuk mengklasifikasikan data ke dalam kategori positif dan negatif. Dalam hasil implementasi menggunakan SVM pada pendeteksian fake review, terlihat bahwa SVM dan Naïve bayes dapat mengklasifikasikan review ke dalam dua kategori dengan akurasi yang cukup tinggi. Melalui implementasi SVM dan Naïve bayes, berhasil teridentifikasi bahwa pola-pola yang sering terdapat pada fake review adalah penggunaan kata-kata berlebihan dan tidak konsisten dengan pengalaman pengguna sebenarnya, sehingga dapat membantu dalam mengidentifikasi review palsu dengan lebih efektif. Dengan adanya hasil implementasi SVM dan Naïve bayes pada pendeteksian fake review, Adapun beberapa tahapan dalam penelitian ini menggunakan metode SVM dan Naïve bayes yaitu preprocessing, pembobotan kata menggunakan TF-IDF, yang selanjutnya implementasi metode SVM dan Naïve Bayes. Hasil pengujian SVM dapat mendeteksi review dengan akurasi yang mencapai 94,38% serta Naïve Bayes menghasilkan akurasi sebesar 91,57%.

 

Keywords


support vector machine; naïve bayes; fake review; deteksi; machine learning.

References


V. Stefanny and B. Tiara, “Overview Perbandingan Jumlah User Fintech (Peer-To-Peer Lending) Dengan Jumlah Pengguna Internet Di Indonesia Pada Masa Pandemi Covid-19,” Insa. Pembang. Sist. Inf. dan Komput., vol. 9, no. 1, pp. 134–141, 2021, doi: 10.58217/ipsikom.v9i1.194.

Katadata, “Proyeksi Pembeli dan Penetrasi Pembeli Digital Indonesia (2016-2022E),” katadata.co.id, 2018. https://databoks.katadata.co.id/datapublish/2018/03/27/berapa-pembeli-digital-indonesia

S. N. Alsubari et al., “Data analytics for the identification of fake reviews using supervised learning,” Comput. Mater. Contin., vol. 70, no. 2, pp. 3189–3204, 2022, doi: 10.32604/cmc.2022.019625.

A. Awalina and F. A. Bachtiar, “Klasifikasi Ulasan Palsu Menggunakan Borderline Over- Sampling ( Bos ) Dan Support Vector Machine ( Svm ) ( Studi Kasus : Ulasan Tempat Makan ) Spam Review Classification Using Borderline Over-Sampling and,” J. Teknol. Inf. dan Ilmu Komput., vol. 9, no. 2, pp. 419–426, 2022, doi: 10.25126/jtiik.202295692.

J. Fontanarava, G. Pasi, and M. Viviani, “Feature analysis for fake review detection through supervised classification,” Proc. - 2017 Int. Conf. Data Sci. Adv. Anal. DSAA 2017, vol. 2018-Janua, pp. 658–666, 2017, doi: 10.1109/DSAA.2017.51.

M. Zhuang, G. Cui, and L. Peng, “Manufactured opinions: The effect of manipulating online product reviews,” J. Bus. Res., vol. 87, no. February 2017, pp. 24–35, 2018, doi: 10.1016/j.jbusres.2018.02.016.

T. Reimer and M. Benkenstein, “When good WOM hurts and bad WOM gains: The effect of untrustworthy online reviews,” J. Bus. Res., vol. 69, no. 12, pp. 5993–6001, 2016, doi: 10.1016/j.jbusres.2016.05.014.

B. E. Pasaribu, A. Herdiani, and W. Astuti, “Deteksi Fake Reviews Menggunakan Support Vector Machine,” vol. 6, no. 2, pp. 8788–8797, 2019.

R. S. H. Istanto, F. A. Bachtiar, and A. Ridok, “Pengaruh Word Affect Intensities Terhadap Deteksi Ulasan Palsu,” J. Teknol. Inf. dan Ilmu …, vol. 9, no. 2, pp. 427–434, 2022, doi: 10.25126/jtiik.202295652.

I. Handayani, I. J. Dewanto, and D. Andriani, “Pemanfaatan RinfoForm Sebagai Media Pengumpulan Data Kinerja Dosen,” Technomedia J., vol. 2, no. 2, pp. 14–28, 2018, doi: 10.33050/tmj.v2i2.321.

A. Amalia, M. S. Lydia, S. D. Fadilla, and M. Huda, “Perbandingan Metode Klaster dan Preprocessing Untuk Dokumen Berbahasa Indonesia,” J. Rekayasa Elektr., vol. 14, no. 1, pp. 35–42, 2018, doi: 10.17529/jre.v14i1.9027.

T. Jo, Text Categorization: Approaches, vol. 45. 2019. doi: 10.1007/978-3-319-91815-0_6.

A. Syihabudin, A. Juwita, and A. Pratama, “Penerapan Algoritma Naive Bayes Untuk Analisis Sentimen Terhadap Produk Motor Matic Honda Beat dan Scoopy,” vol. IV, pp. 95–101, 2023.

P. A. Telnoni, “Pelabelan Data Dengan Latent Dirichlet Allocation dan K-Means Clustering pada Data Twitter Menggunakan Bahasa Indonesia,” J. Elektro dan Telekomun. Terap., vol. 7, no. 2, p. 885, 2021, [Online]. Available: http://journals.telkomuniversity.ac.id/jett/article/view/3442

R. A. Rizal, I. S. Girsang, and S. A. Prasetiyo, “Klasifikasi Wajah Menggunakan Support Vector Machine (SVM),” REMIK (Riset dan E-Jurnal Manaj. Inform. Komputer), vol. 3, no. 2, p. 1, 2019, doi: 10.33395/remik.v3i2.10080.

M. I. Fikri, T. S. Sabrila, and Y. Azhar, “Perbandingan Metode Naïve Bayes dan Support Vector Machine pada Analisis Sentimen Twitter,” Smatika J., vol. 10, no. 02, pp. 71–76, 2020, doi: 10.32664/smatika.v10i02.455.

D. Ismafillah, T. Rohana, and Y. Cahyana, “Implementasi Model Support Vector Machine dan Logistic Regression Untuk Memprediksi Penyakit Stroke,” vol. 10, no. 1, pp. 248–256, 2023, doi: 10.30865/jurikom.v10i1.5478.

H. N. Irmanda and Ria Astriratma, “Klasifikasi Jenis Pantun Dengan Metode Support Vector Machines (SVM),” J. RESTI (Rekayasa Sist. dan Teknol. Informasi), vol. 4, no. 5, pp. 915–922, 2020, doi: 10.29207/resti.v4i5.2313.

L. Mutawalli, M. T. A. Zaen, and W. Bagye, “KLASIFIKASI TEKS SOSIAL MEDIA TWITTER MENGGUNAKAN SUPPORT VECTOR MACHINE (Studi Kasus Penusukan Wiranto),” J. Inform. dan Rekayasa Elektron., vol. 2, no. 2, p. 43, 2019, doi: 10.36595/jire.v2i2.117.

A. Setiyono and H. F. Pardede, “Klasifikasi Sms Spam Menggunakan Support Vector Machine,” J. Pilar Nusa Mandiri, vol. 15, no. 2, pp. 275–280, 2019, doi: 10.33480/pilar.v15i2.693.

N. M. Putry, “Komparasi Algoritma Knn Dan Naïve Bayes Untuk Klasifikasi Diagnosis Penyakit Diabetes Mellitus,” EVOLUSI J. Sains dan Manaj., vol. 10, no. 1, 2022, doi: 10.31294/evolusi.v10i1.12514.

A. Sihombing and A. C. . Fong, “Fake Review Detection on Yelp Dataset Using Classification Techniques in Machine Learning,” IEEE, pp. 64–68, 2019, doi: https://doi.org/10.1109/IC3I46837.2019.9055644.

Y. Yuliana, P. Paradise, and K. Kusrini, “Sistem Pakar Diagnosa Penyakit Ispa Menggunakan Metode Naive Bayes Classifier Berbasis Web,” CSRID (Computer Sci. Res. Its Dev. Journal), vol. 10, no. 3, p. 127, 2021, doi: 10.22303/csrid.10.3.2018.127-138.

R. Tineges, A. Triayudi, and I. D. Sholihati, “Analisis Sentimen Terhadap Layanan Indihome Berdasarkan Twitter Dengan Metode Klasifikasi Support Vector Machine (SVM),” J. Media Inform. Budidarma, vol. 4, no. 3, p. 650, 2020, doi: 10.30865/mib.v4i3.2181.


The PDF file you selected should load here if your Web browser has a PDF reader plug-in installed (for example, a recent version of Adobe Acrobat Reader).

If you would like more information about how to print, save, and work with PDFs, Highwire Press provides a helpful Frequently Asked Questions about PDFs.

Alternatively, you can download the PDF file directly to your computer, from where it can be opened using a PDF reader. To download the PDF, click the Download link above.

Fullscreen Fullscreen Off

Full Text: File PDF (Indonesian)

How To Cite This :

Refbacks

  • There are currently no refbacks.