Penerapan Algoritma Random Forest dan SMOTE untuk Prediksi Risiko Putus Sekolah Siswa Sekolah Menengah Kejuruan

Authors

  • Salsabila Azhari Putri Teknik Informatika Universitas Pamulang
  • Rinna Rachmatika Teknik Informatika Universitas Pamulang

DOI:

https://doi.org/10.51454/decode.v5i3.1360

Keywords:

Machine Learning, Putus Sekolah, Random Forest, SMOTE, SMK

Abstract

Tingkat putus sekolah di Sekolah Menengah Kejuruan (SMK) merupakan tantangan serius yang mempengaruhi kualitas sumber daya manusia Indonesia. Penelitian ini bertujuan mengembangkan model prediktif untuk mengidentifikasi siswa berisiko putus sekolah di SMK dengan menggunakan data akademik dan sosioekonomik sebanyak 1.690 siswa. Metode penelitian membandingkan empat algoritma klasifikasi (Random Forest, Logistic Regression, SVM, dan XGBoost) dengan penerapan SMOTE untuk mengatasi ketidakseimbangan data. Validasi model dilakukan menggunakan cross-validation 5-fold dan interval kepercayaan 95%. Hasil penelitian menunjukkan bahwa kombinasi Random Forest dan SMOTE menghasilkan performa terbaik dengan akurasi 99,54%, presisi 100%, recall 99,09%, F1-Score 99,54%, dan AUC-ROC 100%. Penerapan SMOTE meningkatkan recall secara signifikan dari 0% menjadi 99,09%, menegaskan efektivitas teknik penyeimbangan data. Model yang dikembangkan ini tidak hanya berfungsi sebagai sistem peringatan dini, tetapi juga memberikan kontribusi ilmiah terhadap bidang educational data mining dengan menunjukkan efektivitas kombinasi Random Forest dan SMOTE dalam konteks data SMK Indonesia yang tidak seimbang, dan secara praktis dapat dijadikan dasar bagi sekolah dalam merancang kebijakan intervensi berbasis data untuk menurunkan angka putus sekolah.

References

Bisri, A., & Rachmatika, R. (2019). Integrasi Gradient Boosted Trees dengan SMOTE dan Bagging untuk Deteksi Kelulusan Mahasiswa. Jurnal Nasional Teknik Elektro dan Teknologi Informasi (JNTETI), 8(4), 390–398.

Darmawan, A., Yudhisari, I., Anwari, A., & Makruf, M. (2023). Pola Prediksi Kelulusan Siswa Madrasah Aliyah Swasta Dengan Support Vector Machine Dan Random Forest. Sinkron: Jurnal dan Penelitian Teknik Informatika, 12(1), 387-400. https://doi.org/10.33395/jmp.v12i1.12388

Han, J., Kamber, M., & Pei, J. (2017). Data mining: Concepts and techniques (3rd ed.). Elsevier.

Hassan, H., Ahmad, N., & Anwar, S. (2022). Educational Data Mining: Prediction Of Students' Academic Performance Using Machine Learning Algorithms. Smart Learning Environments, 9(11), 1-19. https://doi.org/10.1186/s40561-022-00192-z

He, H., & Garcia, E. A. (2009). Learning From Imbalanced Data. IEEE Transactions on Knowledge and Data Engineering, 21(9), 1263–1284. https://doi.org/10.1109/TKDE.2008.239

Kamsurya, R., Hayat, M. A. M., & Bakti, R. Y. (2024). Klasifikasi Mahasiswa Berpotensi Putus Studi Menggunakan Algoritma Naive Bayes Pada Fakultas Teknik Unismuh Makassar. Arus Jurnal Sains dan Teknologi, 2(2), 511-517. https://doi.org/10.57250/ajst.v2i2.673

Krisnabayu, R. Y., Supianto, A. A., & Wicaksono, S. A. (2021). Prediksi Siswa Putus Sekolah Dengan Menggunakan Algoritma Bayesian Network (Studi pada: SMA Islam Al Wahid Kepung). Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer, 5(13), 6077-6086.

Marcolino, M. R., Porto, T. R., Primo, T. T., Targino, R. (2025). Student Dropout Prediction Through Machine Learning Optimization: Insights From Moodle Log Data. Scientific Reports, 15(1), 9840. https://doi.org/10.1038/s41598-025-93918-1

Martins, M. V., Baptista, L., Machado, J., & Realinho, V. (2023). Multi-Class Phased Prediction Of Academic Performance And Dropout In Higher Education. Applied Sciences, 13(8), 4693. https://doi.org/10.3390/app13084693

Matz, S. C., Bukow, C. S., Peters, H., Deacons, C., & Stachl, C. (2023). Using Machine Learning To Predict Student Retention From Socio-Demographic Characteristics And App-Based Engagement Metrics. Scientific Reports, 13, 10074. https://doi.org/10.1038/s41598-023-32484-w

Olorunfemi, O. I., & Obagbuwa, I. C. (2019). A Machine Learning Approach To Student Dropout Prediction. International Journal of Education and Development using ICT, 15(2), 1–14.

Psyridou, M., Tziritis, E., Spyridou, A., & Barbounaki, S. (2024). Machine Learning Predicts Upper Secondary Education Dropout As Early As The End Of Primary School. Scientific Reports, 14, 14156. https://doi.org/10.1038/s41598-024-63629-0

Putra, A. (2024). Solusi Prediksi Mahasiswa Drop Out Pada Program Studi Sistem Informasi Fakultas Ilmu Komputer Universitas Bina Darma. Simetris: Jurnal Teknik Mesin, Elektro dan Ilmu Komputer, 8(1), 45-52. https://doi.org/10.24176/simet.v8i1.893

Putri, S. A., & Saputra, H. N. (2024). Penerapan Algoritma Random Forest Dan SMOTE Untuk Prediksi Risiko Putus Sekolah Siswa SMK. DECODE: Jurnal Pendidikan Teknologi Informasi, 4(1), 1-8. https://doi.org/10.51454/decode.v4i1.170

Rachmatika, R., & Bisri, A. (2020). Perbandingan Model Klasifikasi untuk Evaluasi Kinerja Akademik Mahasiswa. JEPIN (Jurnal Edukasi dan Penelitian Informatika), 6(3), 417-422. https://doi.org/10.26418/jp.v6i3.43097

Rahman, S., Islam, K., & Ahmed, R. (2022). Predicting Student's Dropout In University Classes Using Two-Layer Ensemble Machine Learning Approach: A Novel Stacked Generalization. Computers and Education: Artificial Intelligence, 3, 100051. https://doi.org/10.1016/j.caeai.2022.100051

Ramadhani, R., & Hendriyani, Y. (2024). Prediksi Prestasi Siswa Berbasis Data Mining Menggunakan Algoritma Decision Tree (Studi kasus: SMKN 2 Padang). Voteteknika: Vocational Teknik Elektronika dan Informatika, 9(3), 78-85. https://doi.org/10.24036/voteteknika.v9i3.112633

Realinho, V., Machado, J., Baptista, L., & Martins, M. V. (2022). Predicting Student Dropout And Academic Success. Data, 7(11), 146. https://doi.org/10.3390/data7110146

Sugiyono. (2019). Metode Penelitian Kuantitatif, Kualitatif, dan R&D. Alfabeta.

Witten, I. H., Frank, E., Hall, M. A., & Pal, C. (2017). Data Mining: Practical Machine Learning Tools And Techniques (4th ed.). Morgan Kaufmann.

Yumi, Lukman, & Bakti, R. Y. (2024). Klasifikasi Mahasiswa Berpotensi Putus Studi Menggunakan Algoritma Decision Tree Pada Fakultas Teknik Unismuh Makassar. Arus Jurnal Sains dan Teknologi, 2(2), 532-542. https://doi.org/10.57250/ajst.v2i2.674

Downloads

Published

2025-10-20

How to Cite

Putri, S. A., & Rachmatika, R. (2025). Penerapan Algoritma Random Forest dan SMOTE untuk Prediksi Risiko Putus Sekolah Siswa Sekolah Menengah Kejuruan. Decode: Jurnal Pendidikan Teknologi Informasi, 5(3), 903–910. https://doi.org/10.51454/decode.v5i3.1360

Issue

Section

Articles