- Sekiranya saya menggunakan undersampling atau oversampling?
- Bila atau mengapa kita harus menggunakan oversampling?
- Bilakah anda harus melakukan undersampling?
- Adakah idea yang baik untuk terlalu banyak?
Sekiranya saya menggunakan undersampling atau oversampling?
Kaedah oversampling menduplikasi atau membuat contoh sintetik baru dalam kelas minoriti, sedangkan kaedah undersampling memadam atau menggabungkan contoh dalam kelas majoriti. Kedua -dua jenis resampling boleh berkesan apabila digunakan secara berasingan, walaupun boleh menjadi lebih berkesan apabila kedua -dua jenis kaedah digunakan bersama.
Bila atau mengapa kita harus menggunakan oversampling?
Terdapat tiga sebab utama untuk melaksanakan oversampling: untuk meningkatkan prestasi anti-aliasing, meningkatkan resolusi dan mengurangkan bunyi bising.
Bilakah anda harus melakukan undersampling?
Undersampling sesuai apabila terdapat banyak data untuk analisis yang tepat. Saintis data menggunakan semua peristiwa yang jarang berlaku tetapi mengurangkan bilangan peristiwa yang banyak untuk membuat dua kelas bersaiz sama.
Adakah idea yang baik untuk terlalu banyak?
Oversampling adalah cara yang terkenal untuk berpotensi meningkatkan model yang terlatih pada data tidak seimbang. Tetapi penting untuk diingat bahawa oversampling secara tidak betul boleh menyebabkan pemikiran model akan umum lebih baik daripada yang sebenarnya.