Implementasi Sistem Prediksi Harga Motor Bekas Menggunakan Algoritma Categorical Boosting
Abstract
This study is intended to design a web-based system for predicting used motorcycle prices by employing the Categorical Boosting (CatBoost) algorithm. The research problem stems from the subjective process of setting used motorcycle prices, which is affected by multiple factors and frequently results in inaccurate price estimates. The research methodology covers data collection from the OLX Indonesia platform, followed by data preprocessing, feature engineering, data partitioning with a train–test split approach, and model construction using the CatBoost Regressor algorithm. The experimental results indicate that the prediction model attains a coefficient of determination of 0.9166 on the training set and 0.9149 on the test set. These findings suggest that the model performs well, accounting for more than 91% of the variance in used motorcycle prices and producing stable price predictions without notable overfitting. The system is deployed using Streamlit, enabling users to obtain used motorcycle price predictions in a faster, interactive, and more objective manner.
Keywords: Used Motorcycle; Machine Learning; CatBoost; Streamlit
Abstrak
Penelitian ini dimaksudkan untuk merancang sebuah sistem prediksi harga motor bekas berbasis web dengan memanfaatkan algoritma Categorical Boosting (CatBoost). Permasalahan penelitian berangkat dari praktik penentuan harga motor bekas yang masih bersifat subjektif dan dipengaruhi beragam faktor sehingga kerap menghasilkan estimasi harga yang kurang akurat. Metode yang digunakan mencakup pengumpulan data dari platform OLX Indonesia, preprocessing data, feature engineering, pembagian data menggunakan skema train–test split, serta pemodelan dengan algoritma CatBoost Regressor. Hasil pengujian memperlihatkan bahwa model prediksi memperoleh nilai koefisien determinasi (R²) sebesar 0,9166 pada data latih dan 0,9149 pada data uji. Temuan ini mengindikasikan bahwa model memiliki kinerja yang baik, karena mampu menjelaskan lebih dari 91% variasi harga motor bekas serta menghasilkan prediksi yang konsisten tanpa gejala overfitting yang berarti. Sistem kemudian diimplementasikan menggunakan Streamlit sehingga pengguna dapat memperoleh estimasi harga motor bekas dengan lebih cepat, interaktif, dan bersifat lebih objektif.
Keywords
References
“Statistic Distribution – AISI,” Asosiasi Industri Sepeda Motor Indonesia, 2026. [Online]. Available: https://www.aisi.or.id/statistic/. Accessed: Jan. 18, 2026.
I. Amansyah, J. Indra, E. Nurlaelasari, and A. R. Juwita, “Prediksi Penjualan Kendaraan Menggunakan Regresi Linear: Studi Kasus pada Industri Otomotif di Indonesia,” Innov. J. Soc. Sci. Res., vol. 4, no. 4, pp. 1199–1216, 2024.
C. Whenjaya, H. Susanto, and Herman, “Model Prediksi Harga Mobil Bekas Menggunakan Regresi Linear Berganda Berdasarkan Fitur Kendaraan,” J. Digit. Ecosyst. Nat. Sustain., vol. 4, no. 2, pp. 95–99, 2024, doi: 10.63643/jodens.v4i2.263.
M. R. Ardiansyah, Y. B. Utomo, and M. S. Anam, “Pengembangan Aplikasi Prediksi Harga Motor Bekas Berbasis Regresi Linear Berganda dengan Mempertimbangkan Faktor Penentu Harga,” JISCOM, vol. 3, pp. 1–8, 2025.
M. A. Saputra, U. Hayati, T. Informatika, M. Informatika, R. Linier, and D. Mining, “Estimasi Harga Mobil Bekas Toyota Yaris Menggunakan Regresi Linear,” J. Mhs. Tek. Inform., vol. 8, no. 2, pp. 1696–1701, 2024.
N. O. Idris and F. Pontoiyo, “Evaluasi Model Machine Learning untuk Prediksi Harga Mobil dengan Perbandingan Ensemble dan Regresi Linear,” J. Ilmu Komput. dan Sist. Inf., vol. 4, no. 1, pp. 129–143, 2025, doi: 10.70340/jirsi.v4i1.181.
L. P. Nasyuli, I. Lubis, and A. M. Elhanafi, “Penerapan Model Machine Learning Algoritma Gradient Boosting dan Linear Regression Melakukan Prediksi Harga Kendaraan Bekas,” J. Ilmu Komput. dan Sist. Inf., vol. 2, no. 2, pp. 299–310, 2023, doi: 10.70340/jirsi.v2i2.56.
A. S. B. A. F. Srg, “Sistem Informasi Peramalan Penjualan Sepeda Motor Bekas Menggunakan Metode Winter Exponential Smoothing pada CV Kenon Motor,” J. Rekayasa Sist., vol. 2, no. 3, pp. 1346–1359, 2024. [Online]. Available: https://kti.potensi-utama.org/index.php/jureksi/article/view/1481.
A. Masdiyanto, R. B. Kiyosaki, S. Hakiki, and others, “Application of the Naive Bayes Data Mining Algorithm to Predict Used Motorcycle Purchase Decisions,” J. Inform. Technol. Educ. Eng. Higher Appl. (JITEEHA), vol. 2, no. 1, 2025. [Online]. Available: https://journal.iteeacademy.org/index.php/jiteeha/article/view/39.
A. Professor, N. Niharika, S. Sravani, and D. Rakshini, “Enhanced Used Car Price Prediction Using Artificial Neural Networks and Ensemble Machine Learning Models,” J. Eng. Sci., vol. 16, no. 4, 2025.
U. Mishra, A. Rathi, A. Tomar, R. Saini, and S. Tomar, “Used Cars Price Prediction Using Machine Learning,” SSRN Electron. J., vol. 12, no. 4, pp. 970–976, 2024, doi: 10.2139/ssrn.4502021.
J. Huang, Z. Yu, Z. Ning, and D. Hu, Used Car Price Prediction Analysis Based on Machine Learning, vol. 1. Atlantis Press International BV, 2023, doi: 10.2991/978-94-6463-010-7_37.
M. D. H. Kusuma and S. Hidayat, “Penerapan Model Regresi Linier dalam Prediksi Harga Mobil Bekas di India dan Visualisasi dengan Menggunakan Power BI,” J. Indones. Manaj. Inform. dan Komun., vol. 5, no. 2, pp. 1097–1110, 2024, doi: 10.35870/jimik.v5i2.629.
A. Faqih and T. Sugihartono, “Perbandingan Algoritma XGBoost dan LSTM dalam Prediksi Harga Saham Tesla Menggunakan Data Tahun 2025,” J. Pendidik. dan Teknol. Indones., vol. 5, no. 6, pp. 1563–1573, 2025, doi: 10.52436/1.jpti.836.
P. A. Azhar, M. A. Pratama, and R. Fitriani, “Prediksi Harga Mobil Audi Bekas Menggunakan Model Regresi Linear dengan Framework Streamlit,” J. Technol. Informatics, vol. 6, no. 1, pp. 22–28, 2024, doi: 10.37802/joti.v6i1.763.
C. Longani, S. P. Potharaju, and S. Deore, “Price Prediction for Pre-owned Cars Using Ensemble Machine Learning Techniques,” Adv. Parallel Comput., vol. 39, pp. 178–187, 2021, doi: 10.3233/APC210194.
V. Waghmare, V. Hinchageri, P. Kadam, and B. B. Godbole, “AI-Based Vehicle Price Detection and Evaluation System,” Int. J. Adv. Res. Sci. Commun. Technol., pp. 1557–1576, 2025, doi: 10.48175/ijarsct-29486.
J. Huang, “Price Prediction and Analysis of Price Influencing Factors for Second-hand Car Sales in AutoTrader Based on XGBoost Algorithm,” World Sci. Res. J., vol. 11, no. 9, 2025, doi: 10.6911/WSRJ.202509.
A. P. Kohan et al., “Komparasi Akurasi Regresi Linear Berganda dan Decision Tree Prediksi Harga Motor Bekas Berbasis Website,” INFOTECH J., vol. 11, no. 2, pp. 386–393, 2025, doi: 10.31949/infotech.v11i2.16430.
Y.R. Bere, & F.A.I Ahda, "Perbandingan Metode Decision Tree dan Logistic Regression dalam Klasifikasi Tingkat Obesitas Berdasarkan Gaya Hidup. Jutisi: Jurnal Ilmiah Teknik Informatika dan Sistem Informasi, vol. 15, no. 2, pp. 746-756, 2026, doi:http://dx.doi.org/10.35889/jutisi.v15i2.3591.
How To Cite This :
Refbacks
- There are currently no refbacks.










