Apa itu VAD dalam Pengiktirafan Ucapan?
6.1. Pengenalan. Pengesanan Aktiviti Suara (VAD) adalah teknik di mana kehadiran atau ketiadaan ucapan manusia dikesan. Pengesanan boleh digunakan untuk mencetuskan proses. VAD telah digunakan dalam aplikasi dan peranti yang dikawal pertuturan seperti telefon pintar, yang boleh dikendalikan dengan menggunakan arahan pertuturan.
Bagaimana WebRTC VAD berfungsi?
WebRTC memisahkan audio ke dalam bingkai, setiap bingkai mempunyai nombor yang sepadan (0 atau 1). Kami menggunakan bingkai 30ms untuk WebRTC, jadi setiap 250 ms bahagian dibahagikan kepada 8 bingkai, nilai min mereka digunakan sebagai treshold untuk plot.