- Apakah kaedah terbaik untuk mengendalikan data yang hilang?
- Bagaimana anda mengendalikan data yang hilang dalam dataset?
Apakah kaedah terbaik untuk mengendalikan data yang hilang?
Bermaksud, median dan mod
Ini adalah salah satu kaedah yang paling biasa untuk memberi nilai apabila berurusan dengan data yang hilang. Dalam kes di mana terdapat sebilangan kecil pemerhatian yang hilang, saintis data dapat mengira min atau median pemerhatian yang ada Open_in_new.
Bagaimana anda mengendalikan data yang hilang dalam dataset?
Salah satu cara mengendalikan nilai yang hilang adalah penghapusan baris atau lajur yang mempunyai nilai null. Sekiranya mana -mana lajur mempunyai lebih daripada separuh nilai sebagai batal maka anda boleh menjatuhkan keseluruhan lajur. Dengan cara yang sama, baris juga boleh dijatuhkan jika mempunyai satu atau lebih nilai lajur sebagai batal.