Berapa banyak pekali MFCC yang harus saya gunakan?
Dalam amalan, pekali 8-13 MFCC pertama digunakan untuk mewakili bentuk spektrum. Walau bagaimanapun, beberapa aplikasi memerlukan lebih banyak pekali pesanan yang lebih tinggi untuk menangkap maklumat padang dan nada. Sebagai contoh, dalam pengiktirafan ucapan Cina sehingga 20 pekali cepstral mungkin bermanfaat [130].
Apakah output MFCC?
Output selepas memohon MFCC adalah matriks yang mempunyai vektor ciri yang diekstrak dari semua bingkai. Dalam matriks output ini baris mewakili nombor bingkai dan lajur yang sepadan mewakili pekali vektor ciri yang sepadan [1-4]. Akhirnya matriks output ini digunakan untuk proses klasifikasi.
Berapakah panjang hop di MFCC?
MFCC mempunyai dua hujah (yang sebenarnya melalui STFT yang mendasari). win_length adalah bilangan sampel yang termasuk dalam setiap tempoh masa; ia mungkir hingga 2048, atau ~ 93ms pada 22 kHz SR. hop_length adalah bilangan sampel antara tingkap berturut -turut; lalai adalah 512, atau 23 ms yang anda kirakan.