Proyek ini bertujuan untuk melakukan klasifikasi pada dataset Breast Cancer menggunakan algoritma Random Forest. Dataset yang digunakan berasal dari scikit-learn, yang dapat diakses melalui link ini. Hasil dari klasifikasi menunjukkan performa yang sangat baik dengan skor ROC-AUC sebesar 0.995.
- Mengidentifikasi faktor-faktor penting yang memengaruhi diagnosis kanker payudara.
- Melakukan evaluasi model klasifikasi dengan metrik seperti ROC-AUC untuk memastikan keakuratan prediksi.
- Memberikan rekomendasi berdasarkan analisis untuk membantu pengambilan keputusan klinis.
- Feature Importance: Beberapa fitur yang paling berpengaruh dalam klasifikasi adalah "mean radius", "mean texture", dan "worst perimeter".
- Model Performance: Random Forest menghasilkan ROC-AUC sebesar 0.995, yang menunjukkan kemampuan model untuk membedakan antara pasien dengan kanker ganas dan jinak secara sangat akurat.
- Confusion Matrix: Model memiliki tingkat akurasi yang tinggi dengan jumlah kesalahan prediksi yang sangat rendah.
- Peningkatan Model: Kombinasikan Random Forest dengan teknik hyperparameter tuning untuk lebih meningkatkan performa model.
- Implementasi Klinis: Gunakan model ini sebagai alat bantu diagnostik tambahan, namun tetap harus divalidasi lebih lanjut sebelum diimplementasikan dalam praktik klinis.
- Fitur Penting: Fokus pada fitur-fitur penting seperti "mean radius" dalam analisis lebih lanjut, karena fitur ini memiliki pengaruh yang besar terhadap hasil klasifikasi.
Untuk pertanyaan atau diskusi lebih lanjut, Anda dapat menghubungi saya melalui:
Email: maresyatwattimena@gmail.com atau LinkedIn: www.linkedin.com/in/maresyathiowattimena
Terima kasih telah membaca! Saya terbuka untuk masukan dan saran terkait proyek ini. God bless you!