Klasifikasi Berbasis Machine Learning untuk Prediksi Kondisi Kesehatan Berdasarkan Gejala Umum COVID-19

Ahmad Roni Husaini

Sari


Penelitian ini bertujuan untuk membangun sistem klasifikasi sederhana berbasis machine learning yang dapat digunakan untuk memprediksi kondisi kesehatan seseorang berdasarkan gejala-gejala umum yang berkaitan dengan COVID-19. Gejala-gejala tersebut meliputi demam, batuk, sakit tenggorokan, kelelahan, hingga sesak napas. Dataset digunakan dari platform Kaggle, dengan total data sebanyak 316.800 baris, mencakup atribut-atribut gejala dalam bentuk binominal (0/1), serta dua atribut kategorikal utama yaitu Negara dan Kondisi. Penelitian ini menggunakan algoritma Naive Bayes, yaitu algoritma klasifikasi probabilistik yang ringan, cepat, dan sangat efektif untuk data kategorikal yang independen antar fitur. Proses penelitian dilakukan menggunakan RapidMiner Studio, yaitu perangkat lunak pemrosesan data berbasis antarmuka visual yang mendukung eksplorasi dan evaluasi model tanpa memerlukan pemrograman. Evaluasi performa dilakukan dengan menggunakan metrik akurasi dan classification error. Hasil pengujian menunjukkan bahwa model yang dibangun mampu mengklasifikasikan kondisi kesehatan dengan tingkat akurasi sebesar 92.5% dan tingkat kesalahan klasifikasi sebesar 7.5%. Tingginya nilai akurasi ini menunjukkan potensi nyata dari penerapan Naive Bayes untuk skrining kesehatan berbasis gejala. Sistem ini diharapkan dapat diterapkan sebagai alat bantu dalam proses triase awal, diagnosis mandiri, maupun integrasi dengan aplikasi kesehatan digital berbasis AI.

Kata kunci— Naive Bayes, RapidMiner, klasifikasi, COVID-19, kesehatan, machine learning.


Teks Lengkap:

PDF

Referensi


Bishop, C. M. (2006). Pattern Recognition and Machine Learning. Springer.

Han, J., Kamber, M., & Pei, J. (2012). Data Mining: Concepts and Techniques (3rd ed.). Morgan Kaufmann.

Tan, P. N., Steinbach, M., & Kumar, V. (2019). Introduction to Data Mining (2nd ed.). Pearson.

Witten, I. H., Frank, E., Hall, M. A., & Pal, C. J. (2016). Data Mining: Practical Machine Learning Tools and Techniques (4th ed.). Morgan Kaufmann.

Pang-Ning Tan, Michael Steinbach, & Vipin Kumar. (2005). Introduction to Data Mining. Pearson Addison Wesley.

Aggarwal, C. C. (2015). Data Mining: The Textbook. Springer.

Raschka, S., & Mirjalili, V. (2019). Python Machine Learning (3rd ed.). Packt Publishing.

Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction (2nd ed.). Springer.

Zhang, H. (2004). The Optimality of Naive Bayes. AAAI Conference on Artificial Intelligence, 1, 562–567.

Patil, A., & Biradar, S. (2020). Early Prediction of COVID-19 using Machine Learning Algorithms. International Journal of Engineering Research & Technology (IJERT), 9(06), 135–140.

Sarker, I. H. (2021). Machine Learning: Algorithms, Real-World Applications and Research Directions. SN Computer Science, 2(3), 160. https://doi.org/10.1007/s42979-021-00592-x

Shinde, A., Suryawanshi, A., & Borkar, P. (2021). Machine Learning Models for COVID-19 Future Forecasting. International Research Journal of Engineering and Technology (IRJET), 8(6), 4058–4062.

Choudhury, T., & Desai, S. (2020). Predicting COVID-19 Symptoms Using Machine Learning Techniques. International Journal of Engineering and Advanced Technology (IJEAT), 10(1), 245–250.

RapidMiner Documentation. (2023). RapidMiner Operator Reference Guide. Retrieved from: https://docs.rapidminer.com/

Kaggle. (2023). COVID-19 Symptoms and Patient Health Dataset. Retrieved from: https://www.kaggle.com/datasets (atau gunakan: https://shorturl.at/FyP1v)

Kumar, S., & Paul, G. (2020). Prediction of COVID-19 using Machine Learning Models: A Review. Materials Today: Proceedings, 45, 5405–5410.

Wang, L., & Wong, A. (2020). COVID-Net: A Tailored Deep Convolutional Neural Network Design for Detection of COVID-19 Cases from Chest X-Ray Images. Scientific Reports, 10, Article 19549.

López, D., & Luna, C. (2021). Application of Machine Learning for COVID-19 Screening Based on Symptoms. Computers in Biology and Medicine, 135, 104660.

Sharma, P., & Bhardwaj, A. (2021). Comparative Study of Classification Algorithms for COVID-19 Prediction. Procedia Computer Science, 183, 247–254.

Manogaran, G., & Thota, C. (2019). Data Analytics for Intelligent Healthcare. Springer.


Refbacks

  • Saat ini tidak ada refbacks.



EJECTS: Jurnal Computer, Technology, and Informations System

Gedung Fakultas Ilmu Komputer, Universitas Darwan Ali, JL. Batu Berlian, No. 10, Sampit, Kabupaten Kotawaringin Timur, Provinsi Kalimantan Tengah, 74322

Creative Commons Licence
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.

View My Stats