Anemia merupakan masalah kesehatan global, yang bisa terjadi pada siapa saja, terutama di kalangan remaja putri, yang dapat berdampak pada pertumbuhan, perkembangan, produktivitas pada generasi selanjutnya. Prevalensi anemia tahun 2021 secara global pada perempuan usia 15–49 tahun sebesar 33,7%, dan di Indonesia tahun 2023 tercatat 15,5% pada kelompok usia 15–24 tahun. Tujuan dari penelitian, yaitu untuk mengembangkan prediksi risiko anemia menggunakan pendekatan algoritma machine learning dalam konteks program kesehatan remaja putri di Indonesia. Penelitian ini menggunakan data dari Survei Kesehatan Indonesia (SKI) 2023 untuk mengidentifikasi faktor risiko utama anemia, seperti status gizi, pola konsumsi makanan, sosio-ekonomi, penyakit infeksi dan kronis. Hasil penelitian didapatkan model terbaik Random forest dengan AUC 0,768, akurasi 0,707, skor F1 0,706, presisi 0,712, dan recall sebesar 0,707. Prediktor dalam penelitian ini, yaitu pekerjaan, lokasi tempat tinggal, ukuran keluarga, status menstruasi, pola konsumsi sayur dan hasil olahannya, pola konsumsi buah dan hasil olahannya, pola konsumsi daging, unggas, dan hasil olahannya, pola konsumsi ikan, kerang, dan hasil olahannya, pola konsumsi susu dan hasil olahannya, pola konsumsi telur dan hasil olahannya, diare, pneumonia, dan kecacingan. Rancangan sistem didasarkan pada model prediksi terbaik dan ditampilkan dalam bentuk wireframe.
Anemia is a global health problem, which can happen to anyone, especially among adolescent girls, which can have an impact on growth, development, productivity in the next generation. The prevalence of anemia in 2021 globally in women aged 15-49 years is 33.7%, and in Indonesia in 2023 it is 15.5% in the age group 15-24 years. The purpose of the study was to develop anemia risk prediction using a machine learning algorithm approach in the context of adolescent girls' health programs in Indonesia. This study used data from the 2023 Indonesian Health Survey (IHS) to identify the main risk factors for anemia, such as nutritional status, food consumption patterns, socio-economics, infectious and chronic diseases. The results obtained the best Random forest model with AUC 0.768, accuracy 0.707, F1 score 0.706, precision 0.712, and recall of 0.707. The predictors in this study are occupation, location of residence, family size, menstrual status, consumption patterns of vegetables and their processed products, consumption patterns of fruits and their processed products, consumption patterns of meat, poultry, and their processed products, consumption patterns of fish, shellfish, and their processed products, consumption patterns of milk and their processed products, consumption patterns of eggs and their processed products, diarrhea, pneumonia, and helminthiasis. The system design is based on the best prediction model and displayed in wireframe view.