語(yǔ)言是人類交流信息的最自然、最有效的手段。長(zhǎng)期以來(lái),讓機(jī)器“聽(tīng)懂”人類語(yǔ)言來(lái) 實(shí)現(xiàn)語(yǔ)音控制一直是人機(jī)交互領(lǐng)域和智能控制領(lǐng)域研究的重點(diǎn)和難點(diǎn)。隨著自動(dòng)化控制技30 術(shù)、信息處理技術(shù)及人工智能技術(shù)的高速發(fā)展,語(yǔ)音交互憑借其高效、自然、靈活的優(yōu)點(diǎn)越 來(lái)越受到科研人員的關(guān)注,語(yǔ)音控制技術(shù)已經(jīng)成為智能控制的一種新的發(fā)展趨勢(shì)。 從技術(shù)上講,語(yǔ)音識(shí)別屬于多維模式識(shí)別和智能接口的范疇。它是一項(xiàng)集聲學(xué)、語(yǔ)音學(xué)、計(jì)算機(jī)、信息處理、人工智能等于一身的綜合技術(shù),可廣泛應(yīng)用在信息處理、通信和電子系統(tǒng)、自動(dòng)控制等領(lǐng)域。 語(yǔ)音控制技術(shù)包括語(yǔ)音識(shí)別和語(yǔ)音合成兩項(xiàng)關(guān)鍵技術(shù),其中語(yǔ)音識(shí)別技術(shù)是機(jī)器的“聽(tīng) 覺(jué)系統(tǒng)”,機(jī)器通過(guò)識(shí)別和理解過(guò)程將人類語(yǔ)音信號(hào)轉(zhuǎn)換為相應(yīng)的文本或命令信息。語(yǔ)音合成技術(shù)是機(jī)器的“發(fā)音系統(tǒng)”,它可以將任意文本信息實(shí)時(shí)轉(zhuǎn)換為自然流暢的語(yǔ)音朗讀出來(lái),使機(jī)器可以像人類一樣開(kāi)口說(shuō)話。 本文以嵌入式微控制器為核心,采用主流高性能語(yǔ)音識(shí)別處理芯片和語(yǔ)音合成芯片,設(shè)計(jì)了一種語(yǔ)音交互控制系統(tǒng),該系統(tǒng)具有體積小、功耗低和通用型強(qiáng)的特點(diǎn),可以應(yīng)用于智能語(yǔ)音玩具、小型嵌入式控制設(shè)備,也可作為獨(dú)立語(yǔ)音控制子模塊應(yīng)用于大型智能設(shè)備,因此本系統(tǒng)具有廣泛的應(yīng)用前景。
|