語 音 辨 識
以二維倒頻譜為基礎的噪音下多語者語音辨識
簡 介
在眾多語音參數中,二維倒頻譜它同時將語音信號局部的特性與整體的變化包含在一個係數矩陣中。根據分析在乾淨音下,在係數矩陣較低階係數區域的參數為重要的語音參數。因此只需小部份的係數被用來形成參數向量,代表該語音,每一個語音信號是用一個參數向量而不是一串參數向量代表,所以它所需儲存參數空間較少且計算量少。但是根據分析在噪音環境下,它的辨識率會急速下降,為了解決此一問題,我們研究提出以二維倒頻譜為基礎的改良式二維倒頻方法來提高在噪音下的辨識率。改良式二維倒頻方法是利用一個高通濾波器對音框方向加以濾除噪音成份,並且應用基因遺傳演算法則從所得的係數矩陣中找尋具有抗雜訊的係數以提高噪音下的辨識率。在實驗部份我們利用五種噪音源及十位語者的語音資料來辨識國語數字。最後我們由實驗結果可以看出我們的法方的確可以提高在噪音下的辨識率。現在我們主要研究方向為噪音下的語音訊號切割。
 
辨 識 程 序 圖

抗 雜 訊 語 音 辨 識 系 統
用TF algorithm切音的辨識結果

用SONFIN切音的辨識結果

用Mlti-layer Feed-forward Nework切音的辨識結果