Influenza like illness (ILI) merupakan gejala infeksi penyakit pernapasan akut yang menimbulkan beberapa gejala seperti tubuh panas, batuk selama 10 hari terakhir, influenza like illness memiliki gejala yang hampir sama dengan infeksi pernapasan lainnya. Coronavirus, flu burung dan flu babi merupakan penyakit yang memiliki gejala yang serupa dengan influenza like illnes dengan dampak kesehatan yang dialami. Penggunaan data sosial media X di Indonesia mencapai 24 juta serta termasuk 4 terbesar didunia, berdasarkan berberapa penelitian penggunaan data sosial media X dapat digunakan sebagai upaya deteksi dini penyakit seperti influenza like illnes. Tujuan dalam peneltian ini adalah menggunakan data sosial media X untuk identifikasi influenza like illnes berdasarkan di Jawa Barat. Penelitian menggunakan penelitian eksploratif pengembangan klasifikasi teks yang menggunakan data sosial media X dengan machine learning clustering dan klasifikasi teks. Hasil penelitian menggunakan pendeakatan machine learning clustering didapatkan 2 kelompok dalam dataset yaitu kelompok kasus dan bukan kasus, kemudian hasil penelitian klasifikasi menggunakan algoritma support vector machine, naïve bayes, random forest dan XGBoost. Berdasarkan hasil pendekatan unigram dengan algoritma random forest dengan jumlah pohon 700 merupakan algoritma terbaik dalam klasifikasi teks mencapai akurasi 0.72.
Influenza-like illness (ILI) is a symptom of acute respiratory infection that causes several symptoms such as fever, coughing for the past 10 days, and influenza-like illness has symptoms that are almost the same as other respiratory infections. Coronavirus, avian flu, and swine flu are diseases with symptoms similar to influenza-like illness, each with their own health impacts. The use of social media platform X in Indonesia has reached 24 million users, making it one of the top four largest user bases globally. According to several studies, social media data from X can be utilised as an early detection tool for diseases like influenza-like illness. The objective of this study is to use social media data from X to identify influenza-like illnesses in West Java. The study employs an exploratory approach to text classification using social media data from X, combined with machine learning clustering and text classification techniques. The results of the machine learning clustering approach identified two groups in the dataset: cases and non-cases. The classification results were obtained using the support vector machine, naïve Bayes, random forest, and XGBoost algorithms. Based on the unigram approach with the random forest algorithm and 700 trees, this algorithm was the best for text classification, achieving an accuracy of 0.72.