Penerapan Algoritma Random Forest dan SMOTE untuk Prediksi Risiko Putus Sekolah Siswa Sekolah Menengah Kejuruan
DOI:
https://doi.org/10.51454/decode.v5i3.1360Keywords:
Machine Learning, Putus Sekolah, Random Forest, SMOTE, SMKAbstract
Tingkat putus sekolah di Sekolah Menengah Kejuruan (SMK) merupakan tantangan serius yang mempengaruhi kualitas sumber daya manusia Indonesia. Penelitian ini bertujuan mengembangkan model prediktif untuk mengidentifikasi siswa berisiko putus sekolah di SMK dengan menggunakan data akademik dan sosioekonomik sebanyak 1.690 siswa. Metode penelitian membandingkan empat algoritma klasifikasi (Random Forest, Logistic Regression, SVM, dan XGBoost) dengan penerapan SMOTE untuk mengatasi ketidakseimbangan data. Validasi model dilakukan menggunakan cross-validation 5-fold dan interval kepercayaan 95%. Hasil penelitian menunjukkan bahwa kombinasi Random Forest dan SMOTE menghasilkan performa terbaik dengan akurasi 99,54%, presisi 100%, recall 99,09%, F1-Score 99,54%, dan AUC-ROC 100%. Penerapan SMOTE meningkatkan recall secara signifikan dari 0% menjadi 99,09%, menegaskan efektivitas teknik penyeimbangan data. Model yang dikembangkan ini tidak hanya berfungsi sebagai sistem peringatan dini, tetapi juga memberikan kontribusi ilmiah terhadap bidang educational data mining dengan menunjukkan efektivitas kombinasi Random Forest dan SMOTE dalam konteks data SMK Indonesia yang tidak seimbang, dan secara praktis dapat dijadikan dasar bagi sekolah dalam merancang kebijakan intervensi berbasis data untuk menurunkan angka putus sekolah.
References
Bisri, A., & Rachmatika, R. (2019). Integrasi Gradient Boosted Trees dengan SMOTE dan Bagging untuk Deteksi Kelulusan Mahasiswa. Jurnal Nasional Teknik Elektro dan Teknologi Informasi (JNTETI), 8(4), 390–398.
Darmawan, A., Yudhisari, I., Anwari, A., & Makruf, M. (2023). Pola Prediksi Kelulusan Siswa Madrasah Aliyah Swasta Dengan Support Vector Machine Dan Random Forest. Sinkron: Jurnal dan Penelitian Teknik Informatika, 12(1), 387-400. https://doi.org/10.33395/jmp.v12i1.12388
Han, J., Kamber, M., & Pei, J. (2017). Data mining: Concepts and techniques (3rd ed.). Elsevier.
Hassan, H., Ahmad, N., & Anwar, S. (2022). Educational Data Mining: Prediction Of Students' Academic Performance Using Machine Learning Algorithms. Smart Learning Environments, 9(11), 1-19. https://doi.org/10.1186/s40561-022-00192-z
He, H., & Garcia, E. A. (2009). Learning From Imbalanced Data. IEEE Transactions on Knowledge and Data Engineering, 21(9), 1263–1284. https://doi.org/10.1109/TKDE.2008.239
Kamsurya, R., Hayat, M. A. M., & Bakti, R. Y. (2024). Klasifikasi Mahasiswa Berpotensi Putus Studi Menggunakan Algoritma Naive Bayes Pada Fakultas Teknik Unismuh Makassar. Arus Jurnal Sains dan Teknologi, 2(2), 511-517. https://doi.org/10.57250/ajst.v2i2.673
Krisnabayu, R. Y., Supianto, A. A., & Wicaksono, S. A. (2021). Prediksi Siswa Putus Sekolah Dengan Menggunakan Algoritma Bayesian Network (Studi pada: SMA Islam Al Wahid Kepung). Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, 5(13), 6077-6086.
Marcolino, M. R., Porto, T. R., Primo, T. T., Targino, R. (2025). Student Dropout Prediction Through Machine Learning Optimization: Insights From Moodle Log Data. Scientific Reports, 15(1), 9840. https://doi.org/10.1038/s41598-025-93918-1
Martins, M. V., Baptista, L., Machado, J., & Realinho, V. (2023). Multi-Class Phased Prediction Of Academic Performance And Dropout In Higher Education. Applied Sciences, 13(8), 4693. https://doi.org/10.3390/app13084693
Matz, S. C., Bukow, C. S., Peters, H., Deacons, C., & Stachl, C. (2023). Using Machine Learning To Predict Student Retention From Socio-Demographic Characteristics And App-Based Engagement Metrics. Scientific Reports, 13, 10074. https://doi.org/10.1038/s41598-023-32484-w
Olorunfemi, O. I., & Obagbuwa, I. C. (2019). A Machine Learning Approach To Student Dropout Prediction. International Journal of Education and Development using ICT, 15(2), 1–14.
Psyridou, M., Tziritis, E., Spyridou, A., & Barbounaki, S. (2024). Machine Learning Predicts Upper Secondary Education Dropout As Early As The End Of Primary School. Scientific Reports, 14, 14156. https://doi.org/10.1038/s41598-024-63629-0
Putra, A. (2024). Solusi Prediksi Mahasiswa Drop Out Pada Program Studi Sistem Informasi Fakultas Ilmu Komputer Universitas Bina Darma. Simetris: Jurnal Teknik Mesin, Elektro dan Ilmu Komputer, 8(1), 45-52. https://doi.org/10.24176/simet.v8i1.893
Putri, S. A., & Saputra, H. N. (2024). Penerapan Algoritma Random Forest Dan SMOTE Untuk Prediksi Risiko Putus Sekolah Siswa SMK. DECODE: Jurnal Pendidikan Teknologi Informasi, 4(1), 1-8. https://doi.org/10.51454/decode.v4i1.170
Rachmatika, R., & Bisri, A. (2020). Perbandingan Model Klasifikasi untuk Evaluasi Kinerja Akademik Mahasiswa. JEPIN (Jurnal Edukasi dan Penelitian Informatika), 6(3), 417-422. https://doi.org/10.26418/jp.v6i3.43097
Rahman, S., Islam, K., & Ahmed, R. (2022). Predicting Student's Dropout In University Classes Using Two-Layer Ensemble Machine Learning Approach: A Novel Stacked Generalization. Computers and Education: Artificial Intelligence, 3, 100051. https://doi.org/10.1016/j.caeai.2022.100051
Ramadhani, R., & Hendriyani, Y. (2024). Prediksi Prestasi Siswa Berbasis Data Mining Menggunakan Algoritma Decision Tree (Studi kasus: SMKN 2 Padang). Voteteknika: Vocational Teknik Elektronika dan Informatika, 9(3), 78-85. https://doi.org/10.24036/voteteknika.v9i3.112633
Realinho, V., Machado, J., Baptista, L., & Martins, M. V. (2022). Predicting Student Dropout And Academic Success. Data, 7(11), 146. https://doi.org/10.3390/data7110146
Sugiyono. (2019). Metode Penelitian Kuantitatif, Kualitatif, dan R&D. Alfabeta.
Witten, I. H., Frank, E., Hall, M. A., & Pal, C. (2017). Data Mining: Practical Machine Learning Tools And Techniques (4th ed.). Morgan Kaufmann.
Yumi, Lukman, & Bakti, R. Y. (2024). Klasifikasi Mahasiswa Berpotensi Putus Studi Menggunakan Algoritma Decision Tree Pada Fakultas Teknik Unismuh Makassar. Arus Jurnal Sains dan Teknologi, 2(2), 532-542. https://doi.org/10.57250/ajst.v2i2.674
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Salsabila Azhari Putri, Rinna Rachmatika

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.









