- Apa masalahnya dengan oversampling?
- Mengapa kita harus menggunakan oversampling?
- Adakah idea yang baik untuk terlalu banyak?
- Adakah oversampling baik dalam pembelajaran mesin?
Apa masalahnya dengan oversampling?
oversampling rawak boleh meningkatkan kemungkinan berlaku terlalu banyak, kerana ia membuat salinan tepat contoh kelas minoriti. Dengan cara ini, pengelas simbolik, misalnya, mungkin membina peraturan yang nampaknya tepat, tetapi sebenarnya meliputi satu contoh yang direplikasi.
Mengapa kita harus menggunakan oversampling?
Oversampling adalah amalan memilih responden supaya sesetengah kumpulan membuat bahagian yang lebih besar daripada sampel tinjauan daripada yang mereka lakukan dalam populasi. Oversampling kumpulan kecil boleh menjadi sukar dan mahal, tetapi ia membolehkan pemilihan untuk memberi penerangan tentang kumpulan yang sebaliknya akan terlalu kecil untuk dilaporkan.
Adakah idea yang baik untuk terlalu banyak?
Oversampling adalah cara yang terkenal untuk berpotensi meningkatkan model yang terlatih pada data tidak seimbang. Tetapi penting untuk diingat bahawa oversampling secara tidak betul boleh menyebabkan pemikiran model akan umum lebih baik daripada yang sebenarnya.
Adakah oversampling baik dalam pembelajaran mesin?
Oversampling rawak
Untuk algoritma pembelajaran mesin yang dipengaruhi oleh pengedaran miring, seperti rangkaian saraf buatan dan SVM, ini adalah teknik yang sangat berkesan.