Penerapan Algoritma Extreme Gradient Boosting (Xgboost) Untuk Analisis Risiko Kredit
Abstract
Berdasarkan data outstanding pinjam online, pada bulan Maret tahun ini kredit tidak lancar (30-90 hari) melonjak sebesar Rp3,58 triliun (71,13% YoY) dengan pinjaman perseorangan tertinggi sebesar Rp3,3 triliun dan selebihnya dari badan usaha. Kemudian yang mengalami kredit macet melebihi 90 hari pada bulan Maret 2023 sebesar Rp1,43 triliun dari total sisa pinjaman yang belum terbayar oleh debitur. Nilai ini meningkat jauh sebesar Rp1,35 triliun (65,33%) dibandingkan pada periode sebelumnya (YoY), di mana sebesar Rp1,14 triliun adalah kredit macet dari perseorangan. Hal ini terjadi karena berawal dari kurangnya keakuratan dalam proses screening customer. Penelitian ini bertujuan untuk mengklasifikasikan calon debitur menggunakan teknik data mining dengan menggunakan algoritma XGBoost. Metode atau langkah-langkah untuk mencapai tujuan dari penelitian ini adalah metodologi Knowledge Discovery in Database (KDD), yang terdiri dari lima langkah yaitu data selection, data preprocessing, data transformation, data mining, dan evaluation. Dataset berjumlah 1000 row data yang terdiri dari 700 good dan 300 bad, dengan 21 variabel (V1 sampai dengan V20) sedangkan V21 merupakan target atau output. Untuk menganalisis data, 10 skenario model dibangun untuk mengidentifikasi model yang terbaik. Hasil model menunjukan bahwa performa model semakin baik setelah dilakukan SMOTE dengan nilai accuracy dan nilai AUC yang mengalami peningkatan. Model terbaik didapatkan pada skrenario 1 (data train 90% dan 10 data test) dengan nilai accuracy 0,83 dan AUC 0,918. Dari hasil evaluasi model menunjukan bahwa algoritma XGBoost dapat digunakan untuk menganalisis data kredit sebelum menerima/ menolak pengajuan kredit.
References
Bandyopadhyay, A. (2016). Managing portfolio credit risk in banks. Managing Portfolio Credit Risk in Banks, 1–361. https://doi.org/10.1017/CBO9781316550915
Chen, T., & Guestrin, C. (2016). XGBoost: A scalable tree boosting system. Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 13-17-Augu, 785–794. https://doi.org/10.1145/2939672.2939785
Cherif, I. L., & Kortebi, A. (2019). On using eXtreme Gradient Boosting (XGBoost) Machine Learning algorithm for Home Network Traffic Classification. IFIP Wireless Days, 2019-April, 1–6. https://doi.org/10.1109/WD.2019.8734193
Delima, R., Hosianna, M., Pebrianty, D., Amalia, J., & Analysis, A. C. R. (2023). Credit Risk Analysis dengan Algoritma Extreme Gradient Boosting dan Adaptive Boosting. 05, 1–7.
Donald R. van Deventer, Kenji Imai, and M. M. (2013). Advanced Financial Risk Management: Tools and Techniques for Integrated Credit Risk and Interest Rate Risk Management.
Elmayati, E. (2017). Data Mining Dengan Metode Clustering Untuk Pengolahan Informasi Persediaan Obat Pada Klinik Srikandi Medika Berbasis Web. Pelita Informatika: Informasi Dan Informatika, 16(4), 357–362. https://ejurnal.stmik-budidarma.ac.id/index.php/pelita/article/view/531/482
Enry, U., & Umaidah, Y. (2022). Data Analytics (p. Mandala).
Ginting, I. F. P., Saripurna, D., & Fitriani, E. (2021). Penerapan Data Mining Dalam Menentukan Pola Ketersediaan Stok Barang Berdasarkan Permintaan Konsumen Di Chykes Minimarket Menggunakan Algoritma Apriori. Jurnal SAINTIKOM (Jurnal Sains Manajemen Informatika Dan Komputer), 20(1), 28. https://doi.org/10.53513/jis.v20i1.2504
Givari, M. R., Sulaeman, M. R., & Umaidah, Y. (2022). Perbandingan Algoritma SVM, Random Forest Dan XGBoost Untuk Penentuan Persetujuan Pengajuan Kredit. Nuansa Informatika, 16(1), 141–149. https://doi.org/10.25134/nuansa.v16i1.540
Ha, J., Kambe, M., & Pe, J. (2011). Data Mining: Concepts and Techniques. In Data Mining: Concepts and Techniques. https://doi.org/10.1016/C2009-0-61819-5
Hanif, I. (2020). Implementing Extreme Gradient Boosting (XGBoost) Classifier to Improve Customer Churn Prediction. https://doi.org/10.4108/eai.2-8-2019.2290338
Herni Yulianti, S. E., Oni Soesanto, & Yuana Sukmawaty. (2022). Penerapan Metode Extreme Gradient Boosting (XGBOOST) pada Klasifikasi Nasabah Kartu Kredit. Journal of Mathematics Theory and Application, 4(1), 21–26. https://doi.org/10.31605/jomta.v4i1.1792
Kadiyala, A., & Kumar, A. (2018). Applications of Python to evaluate environmental data science problems. In Environmental Progress and Sustainable Energy (Vol. 36, Issue 6, pp. 1580–1586). John Wiley and Sons Inc. https://doi.org/10.1002/ep.12786
Marceau, L., Qiu, L., Vandewiele, N., & Charton, E. (2019). A comparison of Deep Learning performances with other machine learning algorithms on credit scoring unbalanced data. Ml. http://arxiv.org/abs/1907.12363
Miranda, A., & Muslim Lhaksmana, K. (2022). Classification Analysis of Waiting Period for Telkom University Alumni to Get Jobs Using Decision Tree and Support Vector Machine. Technology and Science (BITS), 4(2). https://doi.org/10.47065/bits.v4i2.1963
Prasojo, B., & Haryatmi, E. (2021). Analisa Prediksi Kelayakan Pemberian Kredit Pinjaman dengan Metode Random Forest. Jurnal Nasional Teknologi Dan Sistem Informasi, 7(2), 79–89. https://doi.org/10.25077/teknosi.v7i2.2021.79-89
Pushner, D. C., & Bouteille, S. (2013). The Handbook of Credit Risk Management: Originating, Assessing, and Managing Credit Exposures.
Putri, D. Y., Andreswari, R., & Hasibuan, M. A. (2022). Analysis of Students Graduation Target Based on Academic Data Record Using C4.5 Algorithm Case Study: Information Systems Students of Telkom University.
Usriyati, R., Priyono, N., & Khabibah, N. A. (2022). Penanganan Kredit Bermasalah (Non Performing Loan) Pada PT. BPR BKK Muntilan (Perseroda). Akuntansi Dan Manajemen, 17(1), 60–71. https://doi.org/10.30630/jam.v17i1.176
Virantika, E., Kusnawi, K., & Ipmawati, J. (2022). Evaluasi Hasil Pengujian Tingkat Clusterisasi Penerapan Metode K-Means Dalam Menentukan Tingkat Penyebaran Covid-19 di Indonesia. Jurnal Media Informatika Budidarma, 6(3), 1657. https://doi.org/10.30865/mib.v6i3.4325
Wang, C., Deng, C., & Wang, S. (2020). Imbalance-XGBoost: leveraging weighted and focal losses for binary label-imbalanced classification with XGBoost. Pattern Recognition Letters, 136, 190–197. https://doi.org/10.1016/j.patrec.2020.05.035