Apakah masalah ketidakseimbangan kelas? Ini adalah masalah dalam pembelajaran mesin di mana jumlah kelas data (positif) jauh lebih rendah daripada jumlah kelas data lain (negatif).
- Apa maksudnya dengan masalah ketidakseimbangan kelas?
- Apakah contoh ketidakseimbangan kelas?
- Apakah ketidakseimbangan kelas dan bagaimana anda berurusan dengannya?
- Apakah masalah ketidakseimbangan kelas dan mengapa ia adalah satu cabaran untuk ramalan?
Apa maksudnya dengan masalah ketidakseimbangan kelas?
Masalah ketidakseimbangan kelas biasanya berlaku apabila terdapat lebih banyak contoh beberapa kelas daripada yang lain. Dalam kes sedemikian, pengelas standard cenderung dibanjiri oleh kelas besar dan mengabaikan yang kecil.
Apakah contoh ketidakseimbangan kelas?
Ketidakseimbangan kelas adalah normal dan dijangka dalam aplikasi ML biasa. Contohnya: Dalam pengesanan penipuan kad kredit, kebanyakan urus niaga adalah sah, dan hanya sebahagian kecil. Dalam pengesanan spam, sebaliknya: kebanyakan e -mel yang dihantar di seluruh dunia hari ini adalah spam.
Apakah ketidakseimbangan kelas dan bagaimana anda berurusan dengannya?
Salah satu teknik ketidakseimbangan kelas yang diterima pakai untuk menangani dataset yang sangat tidak seimbang dipanggil resampling. Ia terdiri daripada membuang sampel dari kelas majoriti (bawah sampel) dan/atau menambah lebih banyak contoh dari kelas minoriti (over-sampling).
Apakah masalah ketidakseimbangan kelas dan mengapa ia adalah satu cabaran untuk ramalan?
Klasifikasi tidak seimbang secara khusus sukar kerana pengagihan kelas yang sangat miring dan kos salah klasifikasi yang tidak sama rata. Kesukaran klasifikasi tidak seimbang dikompaun oleh sifat seperti saiz dataset, bunyi label, dan pengedaran data.