- Adakah pembelajaran mendalam digunakan untuk pengiktirafan pertuturan?
- Bolehkah rangkaian saraf digunakan untuk pengiktirafan pertuturan?
- Apakah teknik peningkatan pertuturan?
- Bolehkah kita menggunakan RNN untuk pengiktirafan pertuturan?
Adakah pembelajaran mendalam digunakan untuk pengiktirafan pertuturan?
Dalam era pembelajaran yang mendalam, rangkaian saraf telah menunjukkan peningkatan yang ketara dalam tugas pengiktirafan pertuturan. Pelbagai kaedah telah digunakan seperti Rangkaian Neural Convolutional (CNNs), Rangkaian Neural Berulang (RNNs), sementara rangkaian pengubah baru -baru ini telah mencapai prestasi yang hebat.
Bolehkah rangkaian saraf digunakan untuk pengiktirafan pertuturan?
Rangkaian saraf sangat kuat untuk pengiktirafan ucapan. Terdapat pelbagai rangkaian untuk proses ini. RNN, LSTM, Rangkaian Neural Deep dan Hybrid HMM-LSTM digunakan untuk Pengiktirafan Ucapan.
Apakah teknik peningkatan pertuturan?
Beberapa teknik peningkatan ucapan telah dilaporkan dalam kesusasteraan [32]. Mereka termasuk penolakan spektrum [33, 34, 41], penapisan Wiener dan Kalman [35], anggaran MMSE [36], penapisan sikat [32], kaedah subspace [37, 38], dan pampasan spektrum fasa [39, 40].
Bolehkah kita menggunakan RNN untuk pengiktirafan pertuturan?
RNN nampaknya lebih semula jadi untuk pengiktirafan pertuturan daripada MLP kerana ia membolehkan kebolehubahan dalam panjang input [17]. Motivasi untuk menerapkan rangkaian saraf berulang ke domain ini adalah untuk memanfaatkan keupayaan mereka untuk memproses ciri-ciri spektrum jangka pendek tetapi masih bertindak balas terhadap peristiwa temporal jangka panjang.