Prediksi Penyakit Jantung Dengan Random Forest Melalui Teknik Imputasi Dan Feature Scaling Pada Preprocessing Data

Authors

  • Ainus Syaadah Student
  • Aprillia Ayu
  • Ishaq Daulay

Keywords:

penyakit jantung, random forest, imputasi data, festure scaling, preprocessing

Abstract

Abstrak Penyakit jantung merupakan salah satu penyebab utama tingginya angka kematian di dunia, sehingga diperlukan metode prediksi yang andal untuk mendukung upaya deteksi dini. Dalam pengolahan data medis, sering dijumpai permasalahan berupa nilai hilang serta perbedaan skala antar fitur, yang menjadikan tahap preprocessing sebagai bagian penting sebelum pemodelan dilakukan. Penelitian ini bertujuan untuk menganalisis pengaruh teknik imputasi dan feature scaling terhadap kinerja algoritma Random Forest dalam memprediksi penyakit jantung. Dataset yang digunakan mengandung sejumlah missing values dan memiliki variasi skala fitur, sehingga diterapkan beberapa skenario preprocessing, yaitu tanpa preprocessing, dengan imputasi data, serta kombinasi imputasi dan feature scaling. Algoritma Random Forest digunakan sebagai metode klasifikasi, sementara evaluasi kinerja model dilakukan menggunakan metrik akurasi, presisi, recall, dan F1-score melalui validasi silang. Hasil penelitian menunjukkan bahwa penerapan imputasi maupun kombinasi imputasi dan feature scaling tidak menghasilkan peningkatan kinerja yang signifikan dibandingkan dengan penggunaan data mentah. Hal ini berkaitan dengan karakteristik Random Forest yang relatif tidak sensitif terhadap perbedaan skala fitur. Meskipun demikian, preprocessing tetap berperan penting dalam meningkatkan kualitas dan kesiapan data sebelum tahap pemodelan.

Kata Kunci— penyakit jantung, Random Forest, imputasi data, feature scaling, preprocessing.

Downloads

Published

2026-02-22