Latar belakang: Preeklamsia merupakan sindroma kompleks yang timbul pada ibu hamil yang disebabkan oleh perubahan fisiologi pembuluh darah pada saat konsepsi. Dampak kesehatan yang timbul dari kehamilan dengan preeklamsia sangat luas. Sejauh ini berbagai upaya telah ditempuh untuk dapat melakukan prediksi akan terjadinya preeklamsia. Keterbatasan kemampuan statistik mengolah berbagai jenis prediktor saat ini bisa ditingkatkan dengan menggunakan metode machine learning (ML).
Tujuan: Penelitian ini bertujuan untuk melakukan pemodelan prediksi terhadap kejadian preeklamsia menggunakan ML menggunakan fitur yang serupa dengan fitur yang ada di fasyankes primer
Metodologi: Penelitian ini menggunakan disain restrospektif kohort dengan menggunakan data sekunder dari ibu hamil yang melakukan pemeriksaan antenatal di RS Budi Kemuliaan Jakarta yang direkrut pada periode waktu Juli 2012 hingga April 2015 dan diikuti hingga terjadi persalinan. Data tersebut adalah data yang dikumpulkan pada penelitian sebelumnya untuk melihat berbagai faktor risiko dari terjadinya hipertensi dalam kehamilan. Faktor risiko yang diteliti meliputi riwayat diabetes melitus (DM) sebelumnya, riwayat hipertensi sebelumnya, riwayat DM dalam keluarga, riwayat hipertensi dalam keluarga, riwayat merokok, primigraviditas, rerata tekanan arteri (MAP), indeks masa tubuh (BMI) sebelum kehamilan, terhadap kejadian preeklamsia. Permodelan dilakuan dengan menggunakan beberapa model dalam pembelajaran mesin: Random Forest, Logistic Regression, Support Vector Machine (SVM), Decision Tree, dan K-Nearest Neighbour (KKN) untuk mendapatkan model terbaik.
Hasil: Model Suport Vector Machine (SVM) dengan pembelajaran mesin yang disertai dengan re-sampling (undersampling) pada kumpulan data dan perlakuan hyperparameter tuning berhasil mendapatkan akurasi 70,31 %, sensitifitas 67,5 %, spesifisitas 57,23%, dan AUC 0.68.
Kesimpulan: Model SVM menunjukkan kinerja paling baik di antara model prediksi lain pada kumpulan data dan fitur yang tersedia. Model tersebut menghasilkan akurasi 70% dan AUC sebesar 0,68. Model ini mampu mencapai sensitivitas 67,5% dan spesifisitas 57,23%, dengan presisi (positive predictive value) sebesar 74,98%. Artinya, dari seluruh prediksi positif, sekitar 75% adalah benar, sementara sisanya adalah positif palsu. Temuan ini menunjukkan bahwa model prediksi berbasis SVM memiliki potensi untuk dikembangkan lebih lanjut. Optimasi sensitivitas dan spesifisitas menjadi prioritas pada penelitian lanjutan agar model lebih akurat dalam prediksi dan lebih efektif dalam deteksi dini preeklampsia di layanan primer.
Background: Preeclampsia is a complex syndrome that arises in pregnant women caused by physiological changes in blood vessels at the time of conception. The health impacts arising from pregnancy with preeclampsia are widespread. So far, various efforts have been taken to be able to predict the occurrence of preeclampsia. The limitations of statistical ability to process various types of predictors today can be improved by using machine learning (ML) methods.
Objective: This study aims to model predictions for the incidence of preeclampsia using machine learning based on features found in primary health facilities
Methodology: This study uses a cohort retrospective design using secondary data from pregnant women who underwent antenatal care at Budi Kemuliaan Hospital Jakarta who were recruited in the period from July 2012 to April 2015 and followed until delivery. The data was collected in previous studies to look at various risk factors for the occurrence of hypertension in pregnancy. The risk factors studied included history of diabetes mellitus (DM), history of hypertension, a family history of DM, a family history of hypertension, a history of smoking, primigravidity, mean arterial pressure (MAP), body mass index (BMI) before pregnancy, and the incidence of preeclampsia. The modeling was carried out using several models in machine learning: Random Forest, Logistic Regression, Support Vector Machine (SVM), Decision Tree, and K-Nearest Neighbour (KKN) to get the best model.
Results: The Support Vector Machine (SVM) model with machine learning accompanied by re-sampling (undersampling) on the dataset and hyperparameter tuning treatment managed to obtain an accuracy of 70.31%, sensitivity of 67.5%, specificity of 57.23%, and AUC of 0.68.
Conclusion: The SVM model shows the best performance among other prediction models for the available datasets and features. The model produces 70% accuracy and an AUC of 0.68. This model was able to achieve sensitivity of 67.5% and specificity of 57.23%, with a precision of 74.98% which provide the positive predictions about 75% are true, while the rest are false positives. These findings suggest that SVM prediction models have the potential to be further developed. Sensitivity and specificity optimization are priorities in further research to achieve a more robust model with optimum accuracy to predict preeclampsia and more effective in early detection of preeclampsia in primary care.