電子設備中的語音和音頻控製進展
發布時間:2023-06-21 來源:Mouser 責任編輯:wenwei
【導讀】言yan語yu是shi人ren們men表biao達da思si想xiang和he願yuan望wang的de一yi種zhong有you效xiao方fang式shi。在zai工gong業ye時shi代dai到dao來lai之zhi前qian,人ren類lei發fa現xian動dong物wu可ke以yi被bei訓xun練lian用yong來lai識shi別bie和he響xiang應ying讓rang它ta們men執zhi行xing某mou些xie任ren務wu的de基ji本ben命ming令ling。
下xia一yi個ge合he乎hu邏luo輯ji的de發fa展zhan應ying該gai是shi開kai發fa一yi種zhong使shi用yong聲sheng音yin信xin號hao與yu機ji器qi進jin行xing交jiao流liu,並bing指zhi揮hui機ji器qi行xing動dong的de方fang法fa。近jin年nian來lai,以yi語yu音yin和he音yin頻pin作zuo為wei電dian子zi設she備bei的de控kong製zhi界jie麵mian越yue來lai越yue受shou歡huan迎ying,並bing且qie這zhe種zhong技ji術shu也ye在zai不bu斷duan發fa展zhan,以yi滿man足zu用yong戶hu的de期qi望wang和he新xin應ying用yong的de要yao求qiu。
在zai本ben文wen中zhong,我wo們men將jiang解jie釋shi用yong語yu音yin和he音yin頻pin信xin號hao控kong製zhi電dian子zi設she備bei和he機ji器qi的de好hao處chu,並bing回hui顧gu如ru何he實shi現xian這zhe種zhong控kong製zhi。我wo們men還hai將jiang展zhan示shi這zhe種zhong控kong製zhi界jie麵mian現xian在zai可ke以yi如ru何he能neng夠gou嵌qian入ru到dao離li線xian設she備bei,以yi及ji它ta們men提ti供gong的de音yin頻pin控kong製zhi體ti驗yan如ru何he能neng夠gou大da幅fu度du改gai善shan。
使用語音控製電子設備
采用語音控製實現與機器交互有幾個明顯好處:
●對人類來說,語音是一種直觀的交流形式,這種口頭傳達指令的方式更容易。
●即(ji)使(shi)一(yi)個(ge)人(ren)的(de)眼(yan)睛(jing)和(he)手(shou)正(zheng)在(zai)用(yong)於(yu)其(qi)它(ta)事(shi)情(qing),語(yu)音(yin)交(jiao)流(liu)仍(reng)然(ran)可(ke)能(neng)。實(shi)時(shi)的(de)語(yu)音(yin)控(kong)製(zhi)也(ye)很(hen)方(fang)便(bian),例(li)如(ru)在(zai)駕(jia)車(che)等(deng)某(mou)些(xie)應(ying)用(yong)場(chang)景(jing)下(xia),試(shi)圖(tu)通(tong)過(guo)觸(chu)摸(mo)來(lai)控(kong)製(zhi)車(che)內(nei)其(qi)它(ta)設(she)備(bei)是(shi)違(wei)法(fa)的(de)。
●語音是控製機器的一種有效媒介,采用語音控製機器,可以在不需要複雜指令的情況下進行監聽和響應。
●在zai設she備bei中zhong集ji成cheng語yu音yin控kong製zhi能neng夠gou最zui大da限xian度du地di減jian少shao許xu多duo設she備bei對dui觸chu屏ping的de需xu求qiu。這zhe對dui於yu處chu於yu遠yuan程cheng或huo便bian攜xie式shi電dian池chi供gong電dian設she備bei來lai說shuo尤you其qi理li想xiang,在zai這zhe些xie設she備bei中zhong,減jian小xiao尺chi寸cun和he降jiang低di功gong耗hao是shi常chang見jian的de設she計ji挑tiao戰zhan。對dui於yu具ju有you多duo個ge用yong戶hu的de應ying用yong來lai說shuo,去qu掉diao觸chu屏ping控kong製zhi也ye更geng加jia符fu合he衛wei生sheng要yao求qiu。
●如圖1suoshi,duiyumouxiecanjirenlaishuo,chupingkongzhikenengshiyizhongbuxianshidexuanze,yineryuyinkeyichengweiyizhongyouxiaodezhichigongju。tongguoyuyinyujiqijinxingjiaohukeyongyuzhixingzhurukaimenzhileiderenwu,huozhetongguoyuanchengtongxinlaichuanshugerenzuijindejiankangzhuangkuang。
圖1:聲控機器人助手。(來源:Shutterstock的PaO_STUDIO)
語音控製設備的音頻前端(AFE)包括麥克風陣列和信號處理模塊。AFE能夠處理來自多通道麥克風陣列的信號,以消除任何背景噪聲或設備本身回放產生的幹擾。然後,該信號被發送到“喚醒詞(wake-word)”檢測引擎,例如經過在設備上預先編程,可識別出“Alexa”或“OK Google”等單詞。通過使用多種信號處理算法,能夠消除多種不需要的幹擾信號。語音控製解決方案的組成部分包括:
麥克風陣列:語音激活係統需要一個或多個麥克風來捕獲音頻控製信號。在選擇麥克風陣列時,重要的考慮因素包括尺寸、成本、性能和穩健性。優化組合來自多麥克風陣列的不同信號有助於提高音頻信號鏈的信噪比(SNR)。
到達方向(DoA)檢測器:用於確定用戶相對於被控設備的位置,以便麥克風陣列可以將波束調整為語音的方向。
波束成形器:它接受來自DoA檢測器的聲音,同時去除來自其他方向的聲音。其性能取決於麥克風陣列的幾何形狀、SNR以及波束寬度和背景噪聲水平等。
聲學回聲消除器(AEC):它會消除設備揚聲器本身的播放信號(例如,設備揚聲器正在播放音樂時收到語音指令),以便清晰地拾取用戶語音指令。
自適應幹擾消除器(AIC):它能夠消除來自其他聲音源的外部噪聲,這些噪聲很難用傳統的波束成形器消除,例如,其他設備產生的較大噪聲。
喚醒詞檢測器:將來自AFE的經過處理語音信號與喚醒詞庫進行比較,例如可使用喚醒詞檢測算法的“Hey Google”,這種算法通常是機器學習模型的一部分。更大的模型則更準確,例如,1MB訓練模型比64kB模型更準確,但處理強度更大。需要大的喚醒詞模型來準確地檢測喚醒詞,從而減少錯誤警報的數量。
D類音頻放大器
gaikongzhijiemiandeyuyinchulibufenjingguodaliangkaifa,xianzaijishishidichengbendeshebeiyenengtigongzhunquedeyuyinshibienengli。raner,jiemiandeyinpinduanshoudaodeguanzhumingxianjiaoshao,zheyiweizheyugaoduanyinpinshebeixiangbi,xuduozaoqizhinengyangshengqiheqitazhichiyinpindewulianwang(IoT)設備所產生的音質較差。
yuyuyinkongzhixiangguanderenhexinchanpindoukenengbeirenweifensanlerenmenduizhexiequediandeguanzhu。raner,suizhezhinengshebeiyuelaiyueguangfancaiyong,xiaofeizheduiqitigongdeyinpintiyanqiwangyeyuelaiyuegao。chuantongAB類音頻放大器的低效率使其無法用於低功率物聯網設備,幸運的是,幾家芯片製造商最近推出了一係列高級D類(lei)音(yin)頻(pin)放(fang)大(da)器(qi),體(ti)現(xian)了(le)對(dui)以(yi)前(qian)可(ke)用(yong)音(yin)頻(pin)放(fang)大(da)器(qi)的(de)重(zhong)大(da)改(gai)進(jin),其(qi)中(zhong)許(xu)多(duo)產(chan)品(pin)都(dou)是(shi)專(zhuan)門(men)為(wei)在(zai)智(zhi)能(neng)技(ji)術(shu)和(he)物(wu)聯(lian)網(wang)設(she)備(bei)中(zhong)實(shi)現(xian)高(gao)品(pin)質(zhi)音(yin)頻(pin)而(er)開(kai)發(fa)。
德州儀器 (Texas Instruments)的TAS2770 15W輸入音頻放大器能夠提高響度和音頻質量,它具有更強的語音捕獲能力,意味著語音控製設備的操作更容易、更自然。Maxim Integrated(現在屬於Analog Devices旗下品牌)開發了MAX98357 和MAX98358 D類放大器,效率達到92%,可提供3.2W的AB類音頻性能,這些放大器的簡化框圖如圖2所示。Diodes Incorporated的PAM8106具有較低功耗,使其能夠在由1.5V鉛酸電池和3.5V鋰離子電池驅動的設備中很好地運行。
圖2:Maxim Integrated D類音頻放大器簡化框圖。(來源:Maxim Integrated)
離線語音控製
亞馬遜的Alexa和穀歌助手(Google Assistant)等deng基ji於yu雲yun的de解jie決jue方fang案an很hen容rong易yi用yong於yu具ju有you穩wen定ding互hu聯lian網wang連lian接jie的de設she備bei,但dan對dui於yu那na些xie沒mei有you穩wen定ding互hu聯lian網wang或huo根gen本ben沒mei有you連lian接jie的de設she備bei來lai說shuo,離li線xian語yu音yin控kong製zhi則ze是shi一yi個ge更geng好hao的de解jie決jue方fang案an。例li如ru,如ru果guo某mou個ge產chan品pin需xu要yao響xiang應ying簡jian單dan的de單dan詞ci指zhi令ling,如rugo、stop、reset等(通常稱為關鍵字識別),那麼在設備本身進行本地處理則很有意義。使用低成本的嵌入式微控製器可以實現簡單的關鍵字指令係統,例如可使用恩智浦(NXP)基於EdgeReady MCU的離線本地語音控製解決方案。它采用i.MX RT交叉MCU,開發人員能夠快速將語音控製集成到他們的產品中。恩智浦基於i.MX RT106S的解決方案包括SLN-LOCAL2-IOT開發工具包,如圖3所示。
該開發工具包配備了在FreeRTOS上運行的全部集成軟件,並提供有軟件開發工具包(SDK),以便快速驗證概念。離線語音控製也有助於解決許多消費者的隱私問題,因為他們擔心自己的係統容易受到在線黑客的攻擊。
圖3:恩智浦的SLN-LOCAL2-IOT離線語音控製解決方案。(來源:恩智浦)
結論
語yu音yin和he音yin頻pin正zheng在zai快kuai速su成cheng為wei許xu多duo智zhi能neng設she備bei的de首shou選xuan控kong製zhi界jie麵mian,這zhe種zhong技ji術shu尤you其qi適shi合he在zai低di功gong耗hao和he便bian攜xie式shi物wu聯lian網wang設she備bei中zhong使shi用yong,因yin為wei它ta能neng夠gou消xiao除chu對dui昂ang貴gui且qie耗hao電dian的de數shu字zi顯xian示shi器qi的de要yao求qiu。許xu多duo早zao期qi係xi統tong的de音yin頻pin質zhi量liang較jiao差cha,隻zhi能neng使shi用yong雲yun連lian接jie解jie決jue方fang案an來lai實shi現xian。
然而,隨著新一代高效D類lei音yin頻pin放fang大da器qi的de出chu現xian,使shi製zhi造zao商shang能neng夠gou確que保bao其qi設she備bei為wei消xiao費fei者zhe提ti供gong高gao質zhi量liang的de音yin頻pin體ti驗yan。而er且qie現xian在zai也ye可ke提ti供gong一yi些xie其qi它ta解jie決jue方fang案an,能neng夠gou在zai互hu聯lian網wang連lian接jie不bu穩wen定ding或huo根gen本ben沒mei有you互hu聯lian網wang連lian接jie的de情qing況kuang下xia實shi現xian設she備bei的de語yu音yin控kong製zhi。這zhe些xie創chuang新xin表biao明ming,隨sui著zhe人ren們men越yue來lai越yue習xi慣guan這zhe種zhong控kong製zhi界jie麵mian,語yu音yin控kong製zhi技ji術shu有you能neng力li適shi應ying新xin的de需xu求qiu,而er且qie這zhe種zhong發fa展zhan趨qu勢shi還hai會hui不bu斷duan繼ji續xu。
免責聲明:本文為轉載文章,轉載此文目的在於傳遞更多信息,版權歸原作者所有。本文所用視頻、圖片、文字如涉及作品版權問題,請聯係小編進行處理。
推薦閱讀:
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
- 築基AI4S:摩爾線程全功能GPU加速中國生命科學自主生態
- 一秒檢測,成本降至萬分之一,光引科技把幾十萬的台式光譜儀“搬”到了手腕上
- AI服務器電源機櫃Power Rack HVDC MW級測試方案
- 突破工藝邊界,奎芯科技LPDDR5X IP矽驗證通過,速率達9600Mbps
- 通過直接、準確、自動測量超低範圍的氯殘留來推動反滲透膜保護
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall




