- 相關(guān)推薦
基于LD3320的語(yǔ)音識別系統在家庭電路中的模擬應用
摘 要:本研究旨在為行動(dòng)不便的殘障人士或者老年人的家居生活提供便利和幫助,使他們能夠通過(guò)語(yǔ)音識別系統對家用電器、照明系統、門(mén)窗開(kāi)關(guān)等實(shí)現智能控制。通過(guò)查找資料,對比參數、價(jià)格、識別率等方面的信息,最終采用了基于LD3320的語(yǔ)音識別系統進(jìn)行家庭電路控制模擬應用。系統由四部分構成,即:YS-LD語(yǔ)音識別模塊、STM32單片機控制單元、LED顯示單元、繼電器輸出單元。LD3320語(yǔ)音識別芯片感應語(yǔ)音――通過(guò)STM32單片機運算分析――發(fā)出信號――控制繼電器――電器工作。經(jīng)過(guò)測試,本套系統的語(yǔ)音辨識率高達90%,造價(jià)僅155元,并且無(wú)需用戶(hù)自行建立語(yǔ)音模型及開(kāi)發(fā)語(yǔ)音識別算法,降低了應用開(kāi)發(fā)的技術(shù)門(mén)檻,有利于推廣應用。

關(guān)鍵詞:語(yǔ)音控制;單片機;語(yǔ)音識別芯片;
一、課題背景
學(xué)校常會(huì )組織我們到貴陽(yáng)市盲聾啞學(xué)校送愛(ài)心,與殘障孩子親密互動(dòng),今年也不例外。那些殘章的孩子來(lái)到這個(gè)世界,只能用他們僅存的方式去感知世界萬(wàn)物,在他們的世界里只有一種顏色,那就是黑色。我不禁想,在學(xué)校還有老師的照拂,可他們總有一日要長(cháng)大,要開(kāi)啟自己的人生旅程。要是我能為他們做哪怕一點(diǎn)點(diǎn)事,就算只是為他們的家庭生活提供一些幫助也是好的。我想,如果能利用我在機器人社中學(xué)到的傳感器、電子電路、單片機等專(zhuān)業(yè)知識,對家庭電路進(jìn)行智能化改造,讓家庭的電路“聰明”起來(lái),使他們能夠聽(tīng)得懂主人的指令而進(jìn)行相應的操作,那就可以對有殘障的人和對一些不良于行的病人或老人的家庭生活都能提供很大的便利。于是,有了我的這個(gè)設計――基于LD3320的語(yǔ)音識別系統在家庭電路中的模擬應用。
二、模型設計
(一)模塊功能
(二)模型組成
(三)主要電子元件工作原理與功能說(shuō)明
1、LD3320語(yǔ)音識別芯片
LD3320語(yǔ)音識別芯片采用的是ASR(Auto Speech Recognitio)技術(shù),是YS-LD語(yǔ)音識別模塊的核心。它是對大量的語(yǔ)音數據經(jīng)語(yǔ)言學(xué)家語(yǔ)音模型分析,建立數學(xué)模型,并經(jīng)過(guò)反復訓練提取基元語(yǔ)音的細節特征,以及提取各基元間的特征差異,得到在統計概率最優(yōu)化意義上的各個(gè)基元語(yǔ)音特征,最后才由資深工程師將算法以及語(yǔ)音模型轉換成硬件芯片并應用在嵌入式系統中。
LD3320有兩種使用模式,即“觸發(fā)識別模式”和“循環(huán)識別模式”?梢酝ㄟ^(guò)編程,設置兩種不同的使用模式。
觸發(fā)識別模式:系統的主控MCU在接收到外界一個(gè)觸發(fā)后,啟動(dòng)LD3320芯片的一個(gè)定時(shí)識別過(guò)程,在這個(gè)定時(shí)過(guò)程中說(shuō)出要識別的語(yǔ)音關(guān)鍵詞語(yǔ)。這個(gè)過(guò)程結束后,需要再次觸發(fā)才能再次啟動(dòng)一個(gè)識別過(guò)程。
循環(huán)識別模式:系統的主控MCU反復啟動(dòng)識別過(guò)程。如果沒(méi)有人說(shuō)話(huà)就沒(méi)有識別結果,則每次識別過(guò)程的定時(shí)到時(shí)后再啟動(dòng)一個(gè)識別過(guò)程;如果有識別結果,則根據識別作相應處理后再啟動(dòng)一個(gè)識別過(guò)程。
根據本案模型的設計特點(diǎn),采用語(yǔ)音觸發(fā)識別模式。LD3320芯片最多支持50個(gè)識別條目,每個(gè)識別條目是標準普通話(huà)的漢語(yǔ)拼音(小寫(xiě)),每2個(gè)字(漢語(yǔ)拼音)之間用1個(gè)空格間隔。例如表1,只需要把識別的關(guān)鍵詞語(yǔ)以漢語(yǔ)拼音字符串的形式傳送進(jìn)芯片,該芯片已封裝了基于標準普通話(huà)的語(yǔ)音模型數據和語(yǔ)音識別算法,無(wú)需進(jìn)行任何語(yǔ)音訓練即可投入開(kāi)發(fā)應用。
2、STM32單片機控制單元
本案模擬系統主控單元采用意法半導體ARM-Cortex架構的STM32F1系列超低功耗單片機作為控制核心。
該單元完成幾大功能:
向LD3320模塊提供時(shí)鐘振蕩信號,以驅動(dòng)片上DSP(數字信號處理器 )工作;
通過(guò)SPI(串行外設接口)串行通信方式向LD3320模塊寫(xiě)入預定義的控制命令拼音串,并讀取語(yǔ)音模塊返回的識別結果編碼;
根據識別結果驅動(dòng)負載電路(LED單元(發(fā)光二極管)、繼電器單元)的動(dòng)作。
當LD3320模塊完成一次識別過(guò)程后,通過(guò)中斷請求方式通知主控單元處理,主控單元獲知中斷請求后會(huì )暫時(shí)中止當前的任務(wù)執行,轉而跳轉到中斷服務(wù)例程(ISR Route),在該例程中通過(guò)SPI總線(xiàn)從LD3320模塊讀取識別編碼,根據識別編碼的不同執行對應控制功能。通過(guò)點(diǎn)亮、熄滅指令對應發(fā)光二極管或驅動(dòng)繼電器接通主回路得到運行結果。
3、LED顯示單元
本案模擬系統用六個(gè)共陽(yáng)極發(fā)光二極管(LED)來(lái)模擬家庭中廚房、工作間、臥室、走廊、衛生間、陽(yáng)臺的燈泡開(kāi)關(guān)狀況,工作時(shí)主控單片機則根據語(yǔ)音命令,采用輸出低電平方式進(jìn)行驅動(dòng)點(diǎn)亮。
4、繼電器輸出單元
繼電器輸出單元可接收主控單片機的高低電平控制信號以接通或斷開(kāi)主回路。主回路根據實(shí)際需求可以用于大電壓,交、直流供電的負載驅動(dòng)。本案模擬系統用繼電器單元實(shí)現家庭電扇的通斷控制。
(四)系統軟件開(kāi)發(fā)環(huán)境
本案模擬系統的軟件開(kāi)發(fā)只針對STM32F103主控單元進(jìn)行,軟件代碼完成以下功能:
LD3320底層驅動(dòng)(對其內部寄存器的讀寫(xiě)、時(shí)序的控制);
STM32F103硬件單元和用戶(hù)變量的初始化;
用戶(hù)語(yǔ)音命令拼音串的寫(xiě)入;
中斷服務(wù)ISR(完成負載電路的驅動(dòng)控制)。
軟件開(kāi)發(fā)基于A(yíng)RM公司的Keil開(kāi)發(fā)環(huán)境,完成從代碼編輯到編譯、調試、燒寫(xiě)一系列過(guò)程。
(五)設備成本
三、設備實(shí)測
(一)控制命令
LD3320語(yǔ)音識別芯片中最多可以寫(xiě)入50條語(yǔ)音控制指令,可以根據用戶(hù)需要定制個(gè)性化的語(yǔ)音控制功能。本案設備的設計初衷是為了探索LD3320語(yǔ)音識別芯片在家庭電路中的模擬應用,故只寫(xiě)入了比較基本的18條指令。
(二)設備測試
在寫(xiě)入程序,完成硬件連線(xiàn)并加電復位后,系統即進(jìn)入運行狀態(tài)。向系統說(shuō)出控制命令(盡可能用普通話(huà), 不過(guò)實(shí)測時(shí)對貴陽(yáng)本地方言還是有較高識別率),比如說(shuō)“廚房打開(kāi)”、“走廊關(guān)閉”、“電扇啟動(dòng)”、“運行流水燈”等命令后,系統會(huì )根據識別結果執行對應動(dòng)作,點(diǎn)亮/熄滅LED或者通/斷電扇運行。
為了更好的檢測語(yǔ)音識別效果,實(shí)驗中選擇多個(gè)不同音色的人在家庭(比較安靜)環(huán)境下分別進(jìn)行測試,每個(gè)詞語(yǔ)測試50遍。部分非特定人的語(yǔ)音命令測試的正確識別數據比例見(jiàn)表4:由上表可知,在家庭(比較安靜)環(huán)境下,對于語(yǔ)音命令的平均識別率可達到90%以上。
四、設備優(yōu)勢與應用展望
(一)設備優(yōu)勢
1、本案設備成本低、語(yǔ)音辨識率高、響應快速,可以直接安裝于家庭電路中實(shí)現語(yǔ)音智能控制。
2、由于LD3320 可以動(dòng)態(tài)編輯的識別關(guān)鍵詞語(yǔ)列表,因此其可以應用的范圍大大超過(guò)了那些不可以改變識別列表的芯片。
3、可以根據用戶(hù)的需求進(jìn)行控制命令寫(xiě)入,實(shí)現可定制、個(gè)性化的智能控制。
(二)應用展望
1、應對家庭生活突發(fā)狀況
在本語(yǔ)音識別系統中只是初步嘗試了對用電器通、斷電控制,而在現在社會(huì )中有很多的空巢老人,他們獨自生活,如果在家中出現意外或突發(fā)疾病,隨時(shí)都有可能危及生命。如果在本案系統中可以添加“緊急呼叫”的語(yǔ)音控制,當出現突發(fā)狀況時(shí)可以使用該功能觸發(fā)電話(huà)自動(dòng)撥打物管、救護車(chē)、親屬等重要聯(lián)系人;蛘咴摽刂婆c小區物管相連,每當有人有緊急呼叫時(shí),物管的終端緊急呼叫燈亮起,并觸發(fā)揚聲器發(fā)出警報聲,使物管人員迅速到場(chǎng)解決問(wèn)題。
2、實(shí)現家用電器的語(yǔ)音控制
(1)電磁爐/微波爐/智能家電操作
在現在的家電中,各種各樣的設置越來(lái)越繁復。用戶(hù)在使用過(guò)程中,還要不斷地對家電進(jìn)行功能切換。在引入LD3320 芯片后,可以用語(yǔ)音直接控制這些家電。比如用語(yǔ)音來(lái)控制電磁爐把火力調整到“煎炸”或者是“慢燉”。
(2)數碼像框
數碼像框中存放了許多的照片和視頻,同時(shí)又具有多種播放的方式。一般是通過(guò)按鍵或者遙控器的方式來(lái)對其進(jìn)行操作,但是這樣的操作并不方便。在引入了LD3320 提供的語(yǔ)音識別功能后,用戶(hù)可以最自然地用語(yǔ)音去點(diǎn)播想要顯示的照片,或者改變數碼像框的顯示方式。使得這樣的數碼產(chǎn)品更加具有人性化的操作界面。
3、機頂盒/彩電遙控器
隨著(zhù)數字電視的普及,家庭中可以收看到的電視節目也越來(lái)越豐富。大家也就苦于在眾多的頻道中迅速選擇到自己想要看的頻道。在把LD3320 語(yǔ)音識別芯片集成進(jìn)機頂盒/彩電遙控器后,用戶(hù)只需要對著(zhù)遙控器說(shuō)出想要看的電視頻道的名字,就可以快速地選擇。比如用戶(hù)可以說(shuō)出“奧運體育”,就可以轉到體育頻道來(lái)觀(guān)看精彩的體育比賽了。
4、智能玩具/對話(huà)玩具
在電視購物中曾經(jīng)出現過(guò)可以人機對話(huà)的玩具,比如金福豬,金福狗等。這些玩具采用的語(yǔ)音識別只能支持固定的10 條左右的語(yǔ)音命令,比如“你好”,“我想聽(tīng)歌”等等。采用LD3320 芯片,可以利用其動(dòng)態(tài)編輯識別關(guān)鍵詞語(yǔ)列表的性能,讓玩具實(shí)現及其復雜的對話(huà)腳本。避免了玩具的嚴重同質(zhì)化。
(三)公共服務(wù)設施的語(yǔ)音控制
1、自動(dòng)售貨機、地鐵自動(dòng)售票機等銷(xiāo)售型服務(wù)設施
在自動(dòng)售貨機、地鐵自動(dòng)售票機等銷(xiāo)售型服務(wù)設施中安裝語(yǔ)音操作模塊。人們可以對著(zhù)售貨機說(shuō)出要買(mǎi)的商品,比如“可口可樂(lè )”或者“面巾紙”投幣后商品就自動(dòng)售出。在北京、上海等大都市中,外地旅客較多,對地鐵線(xiàn)路不熟悉導致買(mǎi)票時(shí)不知道票價(jià)也不知道如何購買(mǎi)。有了語(yǔ)音操作界面后,只需要對著(zhù)售票機說(shuō)出要去的地方或者想要到達的站點(diǎn),根據屏幕提示放入紙幣,就可以方便地買(mǎi)到車(chē)票。
2、公共照明系統、輔助設施的語(yǔ)音控制
在公共場(chǎng)合幫助殘疾人士、行動(dòng)不便的老人或小孩非接觸地去控制公共照明系統或輔助設施(地下通道輪椅臺等)的運行。
3、樓宇電視的廣告點(diǎn)播
目前分眾傳媒等公司的樓宇廣告設施,遍布幾乎所有的寫(xiě)字樓,也在廣告投放上取得了良好的效果。但是目前用戶(hù)在接受廣告時(shí),都是被動(dòng)地去接受信息。對于其中感興趣的廣告,只能是等待下次再看到時(shí)進(jìn)行仔細地了解,沒(méi)有辦法進(jìn)行主動(dòng)式地廣告查詢(xún)。
引入LD3320 語(yǔ)音識別芯片后,用戶(hù)可以用語(yǔ)音去方便地查詢(xún)想要了解的廣告信息。比如操作樓宇廣告“重新播放”“上一條”來(lái)重新觀(guān)看一條廣告;蛘“汽車(chē)”來(lái)點(diǎn)播想要看的汽車(chē)廣告。
這樣的語(yǔ)音操作,不需要增加額外的鍵盤(pán)輸入和觸摸屏輸入,又可以讓用戶(hù)與廣告充分互動(dòng),取得更佳的效果。
五、結語(yǔ)
使用LD3320 芯片可以在一定程度上完成這樣的語(yǔ)音控制系統,給人們的生活帶來(lái)更便利的語(yǔ)音交互界面。作為一種新的人機交互界面,會(huì )逐步地走入人們的日常生活,在適合用語(yǔ)音控制的地方給人們提供更多的便利。
參考文獻:
[1]陳喜春.基于LD3320語(yǔ)音識別專(zhuān)用芯片實(shí)現的語(yǔ)音控制,[J]. 電子技術(shù)設計與應用. 2011年11月
[2]金鑫,田犇,闕大順. 基于的LD3320語(yǔ)音控制系統設計實(shí)現.[J].電腦與信息技術(shù).2011年12月.第19卷第6期
[3]洪家平.LD3320的嵌入式語(yǔ)音識別系統的應用.[J].單片機與嵌入式系統應用.2012年.第2期
【基于LD3320的語(yǔ)音識別系統在家庭電路中的模擬應用】相關(guān)文章:
基于HMM的語(yǔ)音識別技術(shù)在嵌入式系統中的應用03-18
ISD4004語(yǔ)音芯片在語(yǔ)音報站器中的應用03-19
語(yǔ)音處理芯片AC48105在低速語(yǔ)音編碼設備中的應用03-18
藍牙芯片ROK 101 007在語(yǔ)音系統中的應用03-27