Abstrak
Kompleksitas gejala depresi remaja diakui sebagai tantangan kesehatan masyarakat dunia. Jika tidak terdeteksi dan tertangani, gejala depresi dapat secara signifikan mengurangi kualitas hidup dan berpotensi menjadi depresi berat pada masa selanjutnya. Penelitian ini bertujuan untuk mengembangkan model machine learning untuk memprediksi perkembangan gejala depresi dari remaja, serta mengungkap prediktor yang memiliki hubungan signifikan dengannya. Penelitian didesain dengan menggunakan data Indonesia Family Life Survey (IFLS). Dataset dibangun dari hasil survey tiga gelombang, yaitu tahun 2000, 2007, dan 2014. Hasil analisis menunjukkan sejumlah variabel terkait faktor sosio-demografi, kesehatan, ekonomi, psikososial, kehidupan anggota rumah tangga, dan lingkungan rumah, memiliki hubungan signifikan terhadap perkembangan gejala depresi remaja. Model machine leaerning yang dikembangkan adalah gabungan dua model; Model-1 memprediksi perkembangan gejala depresi selama 7 tahun dan Model-2 memprediksi perkembangan gejala depresi selama 14 tahun. Pada Model-1, kinerja prediksi terbaik dicapai oleh Random Forest dengan akurasi 0,93, AUC 0,72, precision 0,93, recall 1,00, dan F1-Score 0,97. Sedangkan pada Model-2, kinerja prediksi terbaik dicapai oleh Regresi Logistik dengan akurasi 0,77, AUC 0,65, precision 0,78, recall 0,97, dan F1-Score 0,87. Model ini telah berhasil di-deploy ke dalam aplikasi mobile bernama D’Symptomata yang berpotensi dikembangkan lebih lanjut untuk mendukung skrining potensi risiko perkembangan gejala depresi di kalangan remaja Indonesia.
The complexity of adolescent depressive symptoms is one of the public health challenges. If left untreated, depressive symptoms can significantly reduce quality of life and potentially lead to major depression in the future. This study aims to develop a machine learning model to predict the development of depressive symptoms in adolescence and their predictors. The dataset is built from three wave IFLS surveys, 2000, 2007, and 2014. The results showed several variables socio-demography, health, economic, psychosocial, household members, and house environment factors, had a significant relationship with the development of adolescent depressive symptoms. The machine learning model developed is a combination of two models; Model-1 which predicted the development of depressive symptoms over 7 years and Model-2 for 14 years. On Model-1, the best prediction performance was achieved by Random Forest with an accuracy of 0.93, AUC 0.72, precision of 0.93, recall of 1.00, and F1-Score 0.97. In Model 2, the best prediction performance was achieved by Logistic Regression with an accuracy of 0.77, AUC of 0.65, precision of 0.78, recall of 0.97, and F1-Score 0.87. This model has been successfully deployed into a mobile application D'Symptomata to support screening for the development of depressive symptoms among Indonesian adolescents.