中文連續數字辨識

 
中文連續數字辨識
電控八八級 張紋碩
研 究 方 向
  在今天這個時代,靠著通訊技術的進步,有許多的事情,人們可以不用出門就完成,例如人們可以利用電話查詢系統查詢遠端的資訊、查詢個人帳號或是經由電話訂票等,這些應用中,有很多都會需要使用到數字的輸入,目前的技術,多是需要人們自己由電話按鍵輸入,因此如何能夠有一個更親和的介面,對使用者將會有很大的方便,因此中文連續數字的辨識就成了一個必要的技術,這技術能夠使人們再透過電話輸入身份字號、帳號、或是信用卡號碼來處理事物時,能夠更佳方便。
基本連續音辨識系統基本方塊圖
研 究 成 果
  在連續音辨識的領域中,有很多的演算法被提出來解決連續音的辨識問題,其中有一種辨識法則,稱為one-state algorithm。使用one-state algorithm來作連續語音辨識器時,會遇到兩個主要的問題。第一個問題是由於在one-state algorithm進行辨識時,參考模型本身的好壞會嚴重影響one-state algorithm的辨識率。由於好的參考模型會有效的增加連續音辨識效果,因此提出一個主軸空間隱藏式馬可夫模型(PSHMMs)來改善參考模型本身的辨識效果,根據實驗顯示,在單字音辨識時,主軸空間隱藏式馬可夫模型會比傳統的隱藏式馬可夫模型約多3%的辨識率,而在連續音的辨識上,則可明顯增加6.61%的辨識率

  另一個問題是通常使用於one-state algorithm的參考模型為隱藏式馬可夫模型,由於隱藏式馬可夫模型本身並沒有辦法提供足夠的語音暫態模型,於是有一個新的參數稱為principal component variance (PCV)參數被提出,再配合上前人提出的「狀態長度限制」方法,可以彌補因語音的暫態資訊不足所造成的錯誤。實驗結果顯示,在連續音辨識中加入暫態資訊,對特定語者中文連續數字音辨識能提高7.94%,而對不特定語者的中文連續數字音辨識則可提高13.89%的辨識率。

  應用上面提出的兩個方法,配合上one-state algorithm以及一套20人的連續數字資料庫,設計出了一套改進後的連續數字辨識系統,在中文連續數字的辨識上,實驗結果顯示出比傳統的辨識系統增加了20.5%的辨識率,達到75.85%的辨識率,這是在沒有加入文法限制的所得到的實驗結果,未來如果根據不同的需要加上了文法規則,則可以再增加系統效率。