Crop Yield Prediction for Agriculture Using Machine Learning Regression Models
Crop Yield Prediction for Agriculture Using Machine Learning Regression Models
Keywords:
prediksi hasil panen, machine learning, random forest, regresi, pertanian presisiAbstract
Produktivitas pertanian dipengaruhi oleh variabel iklim, kondisi agronomi, serta penggunaan input budidaya, sehingga akurasi prediksi hasil panen menjadi tantangan penting dalam penerapan pertanian presisi. Meskipun berbagai studi sebelumnya telah menerapkan model machine learning untuk estimasi hasil panen, sebagian besar penelitian belum membandingkan performa beberapa algoritma regresi sekaligus pada dataset multinegara dengan keragaman komoditas dan kondisi lingkungan yang tinggi. Kesenjangan ini menunjukkan perlunya analisis komprehensif untuk mengidentifikasi model yang paling stabil dan akurat dalam memprediksi hasil panen. Penelitian ini bertujuan untuk mengevaluasi dan membandingkan kinerja tiga model regresi machine learning—Decision Tree Regressor, Random Forest Regressor, dan Gradient Boosting Regressor—dalam memprediksi hasil panen berdasarkan variabel area, jenis tanaman, curah hujan, temperatur, dan penggunaan pestisida. Metode penelitian meliputi preprocessing data (penghapusan kolom tidak relevan, encoding kategorikal, standarisasi fitur numerik), deteksi dan penghapusan outlier menggunakan Z-Score, pembagian data latih-uji 80:20, serta optimasi hyperparameter menggunakan GridSearchCV dengan k-fold cross-validation. Dataset yang digunakan merupakan data historis yield agrikultur global dengan berbagai variasi iklim, komoditas, dan wilayah. Hasil penelitian menunjukkan bahwa Random Forest Regressor menghasilkan performa terbaik dengan nilai MAE sebesar 3053,90 dan R² sebesar 0,9860 setelah penerapan One-Hot Encoding, penghapusan outlier, dan tuning hyperparameter. Temuan ini menunjukkan bahwa model ensemble berbasis pohon memberikan stabilitas prediksi yang lebih tinggi dibandingkan model tunggal maupun boosting. Penelitian ini memberikan kontribusi berupa identifikasi model paling efektif untuk prediksi hasil panen pada skala wilayah luas serta menunjukkan potensi penerapan machine learning dalam mendukung pengambilan keputusan pada pertanian presisi.
Downloads
Published
Issue
Section
License
Copyright (c) 2026 Prosiding Seminar Nasional Amikom Surakarta

This work is licensed under a Creative Commons Attribution 4.0 International License.
