Implementasi Algoritma XGBoost, CatBoost, dan LGBM untuk Klasifikasi Pencemaran Udara
DOI:
https://doi.org/10.54371/jiip.v8i12.10102Abstract
Penelitian ini bertujuan untuk mengklasifikasikan tingkat pencemaran udara di Kota Surabaya menggunakan metode supervised learning berbasis algoritma ensemble boosting, yaitu XGBoost, CatBoost, dan LightGBM. Dataset terdiri atas lima parameter kualitas udara (PM10, SO?, CO, O?, dan NO?) yang diproses melalui tahapan pembersihan, encoding, dan normalisasi. Evaluasi model dilakukan menggunakan metrik akurasi, precision, recall, dan F1-score. Hasil penelitian menunjukkan bahwa ketiga model mampu mempelajari pola data dengan baik, meskipun performanya dipengaruhi oleh ketidakseimbangan kelas. Model XGBoost memberikan performa optimal setelah penerapan teknik ClassWeight dan penggabungan kelas minoritas, dengan akurasi 0.9594, precision 0.8632, recall 0.7787, dan F1-score 0.8098. Model CatBoost dan LightGBM juga menunjukkan performa baik, masing-masing mencapai F1-score tertinggi 0.7549 dan 0.7263 setelah penyeimbangan data. Temuan ini menegaskan efektivitas teknik penanganan ketidakseimbangan data serta memberikan dasar bagi pengembangan sistem prediksi kualitas udara yang lebih akurat dan adaptif.







