語 音 合 成

 
中文語音合成系統
功能  架構  規格  發展  現有軟體技術  Demo      English Version
一、功能
TTS(Text-To-Speech)是一種將文字輸入轉換成語音輸出的系統。本實驗室所發展的中文語音合成系統,其主要功能可將使用者所輸入的中文文字轉換成相對應的中文語音輸出,且可由使用者自訂輸出語音的效果,如下:
  1. 多語者選擇:可選擇男聲或女聲作為語音合成輸出。
  2. 語調高低:可調整輸出語調的高低。
  3. 說話速度快慢:可調整語者說話速度的快慢。
  4. 迴音效果:可加入迴音的效果(可自由調整效果的大小)。
二、架構
本實驗室中文語音合成系統的主要架構方塊圖如下所示:
三、規格
系統需求:
  1. Pentium 75 MHz
  2. Windows 95/98 or NT4.0
  3. Hard Disk with a Minimum of 20 Mbytes of storage
  4. 16 Mbytes of RAM
  5. Sound Blaster 16 or Compatible Sound Card
四、發展
近年來,在中文語音合成技術的發展,已有數個研究團體投入相關的研究中,本實驗室亦深知其未來的潛力,投入相當的人力與物力,從事中文語音合成的研究,並且目前已有相當不錯的研究成果,已可達到實際應用的水準。儘管如此,本實驗室仍本著研究的精神,繼續研究此方面之技術以期達到更好的中文語音合成系統。在此方面正在進行的研究包括:蒐集更齊全的資料庫(含特殊用詞)、提升韻律產生器之精度。
五、現有軟體技術
在目前現有的軟體技術上,我們已經完成了一套中文語音合成軟體,可自動安裝(setup)於個人電腦(符合第三點規格)上。在這套軟體中,我們主要的功能函數(動態連結DLL)詳列如下:

 
函數名稱 功能
TTS_initialize() 初始化詞庫與語音資料庫
TTS_textanalysis() 分析句法
TTS_prosody() 產生韻律訊息
TTS_synthesis() 合成語音
TTS_release() 釋放記憶體
AudioConfig() 規劃音效裝置
AudioOpen() 打開音效裝置
AudioClose() 關閉音效裝置
AudioPlay() 撥放聲音
AudioStop() 停止撥放
AudioPause() 暫停撥放
AudioResume() 暫停後繼續撥放

六、Demo