門禁系統之語者辨認技術

基於獨立成分分析與基因演算法之語者辨認技術

A Text-Independent Speaker Identification Based on ICA and GA Approach

研究生:黃瑞文            指導教授:林進燈博士

主  題

在許多場合中都需要辨識人們的身分,目前大多使採用卡片或指紋認證,但這些都比不上利用語音辨識來的方便。不用攜帶物品,不必什麼大動作,只要開口說幾句話,語音辨識系統便能自動依據要求達成工作,這在人類提升生活便利方面是極有吸引力的。為此,本研究主題著重於建立語者身分辨認的環境,為了方便使用,採取字詞不相關的概念,也就是說,辨認身分時語者可任意說其想要說的詞語。

我們的整個語者系統系統架構如下

 

基於時間-頻率獨立成分調變之語者辨認系統的訓練流程

 

基於時間-頻率獨立成分調變之語者辨認系統的測試流程


當語者任意說出一句話
,我們會先從這句話抽取出這句話在頻率上的特徵,經由時間-頻率獨立成分調變後,得到同時具有時域和頻域特性的語者特徵,再經過語者模擬的方式去建立語者的模型,之後輸入的聲音,便可直接跟這個語者模型比較,來辨認出語者的身分。

求取時間-頻率獨立成分的流程圖如下: 當我們抽取到詞語中的所有特徵向量,一次求出一個獨立成分基底,最後便可利用所有求的的獨立基底進行時間-頻率獨立成分調變,獲得更具代表性的特徵向量。

,或許只要其中的某些基底便可達成我們想要的辨認結果,因此我們使用了一個求取最佳解的方法--基因演算法。

 

基因演算法的基底挑選流程如下:基於基因演化法則,我們可不斷從原有基底中選取某部分基底,得到新的基底組合,並測試其辨認能力,如此不斷演化,最後便可得到辨識結果最佳的基底。

 

實驗結果

The identification rate for different value of qf for 21 speakers

The value of qf

Based on TFIC filtering

Based on TFPC filtering

1

100%

100%

2

100%

100%

3

100%

100%

4

100%

100%

5

100%

100%

6

100%

100%

7

100%

100%

8

100%

100%

9

100%

100%

10

100%

100%

 

The identification rate for different value of qf for 249 speakers based on MAT-2000 database

The value of qf

Based on TFIC filtering

Based on TFPC filtering

1

97.99%

95.18%

3

98.39%

95.58%

5

95.98%

92.37%

 

The identification rate for different value of qf for 249 speakers based on MAT-2000 database for reduced bases by ICA and PCA

qf

Type of filtering

Dimqf

Dimqf -1

Dimqf -2

Dimqf -3

Dimqf -4

Dimqf -5

Dimqf -6

Dimqf -7

Dimqf -8

1

TFIC

97.99%

97.99%

97.99%

97.59%

93.17%

 

 

 

 

TFPC

95.18%

95.18%

93.17%

92.37%

92.77%

 

 

 

 

3

TFIC

98.39%

97.59%

97.18%

97.99%

96.38%

95.98%

95.98%

95.58%

94.38%

TFPC

95.58%

94.78%

91.97%

90.76%

91.97%

89.16%

93.17%

87.55%

84.38%

5

TFIC

95.98%

95.98%

95.98%

95.58%

95.18%

92.77%

93.98%

89.96%

 

TFPC

92.37%

93.57%

91.16%

89.96%

90.36%

88.35%

91.16%

87.55%

 

 

The identification rate directed against the situation when qf = 1, 3, 5 in the critical point using the basis chosen by GA optimizer

The value of qf

Number of chosen basis

Identification rate(%)

1

8

97.18

3

28

96.38

5

53

93.57