- Mengapa kita menggunakan DCT di MFCC?
- Apa yang dimaksudkan dengan ekstrak MFCC?
- Apakah output MFCC?
- Bagaimana MFCC digunakan dalam Pengiktirafan Ucapan?
Mengapa kita menggunakan DCT di MFCC?
DCT adalah langkah terakhir proses utama pengekstrakan ciri MFCC. Konsep asas DCT adalah menghubungkan nilai spektrum MEL untuk menghasilkan perwakilan yang baik dari spektrum harta tanah tempatan. Pada dasarnya konsep DCT adalah sama seperti transformasi Fourier songsang.
Apa yang dimaksudkan dengan ekstrak MFCC?
Teknik pengekstrakan ciri MFCC pada dasarnya termasuk mengaplikasikan isyarat, memohon DFT, mengambil log magnitud, dan kemudian melengkapkan frekuensi pada skala mel, diikuti dengan menggunakan DCT songsang.
Apakah output MFCC?
Output selepas memohon MFCC adalah matriks yang mempunyai vektor ciri yang diekstrak dari semua bingkai. Dalam matriks output ini baris mewakili nombor bingkai dan lajur yang sepadan mewakili pekali vektor ciri yang sepadan [1-4]. Akhirnya matriks output ini digunakan untuk proses klasifikasi.
Bagaimana MFCC digunakan dalam Pengiktirafan Ucapan?
MFCC adalah ciri -ciri popular yang diekstrak dari isyarat pertuturan untuk digunakan dalam tugas pengiktirafan. Dalam model ucapan penapis sumber, MFCC difahami mewakili penapis (saluran vokal). Sambutan kekerapan saluran vokal agak lancar, sedangkan sumber ucapan bersuara dapat dimodelkan sebagai kereta api impuls.