【自動對焦:語音識別  邊緣計算】

1:語音識別是一門交叉學科。近二十年來,語音識別技術取得顯著進步,開始從實驗室走向市場。人們預計,未來10年內(nèi),語音識別技術將進入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務、消費電子產(chǎn)品等各個領域。 語音識別聽寫機在一些領域的應用被美國新聞界評為1997年計算機發(fā)展十件大事之一。很多專家都認為語音識別技術是2000年至2010年間信息技術領域十大重要的科技發(fā)展技術之一。 語音識別技術所涉及的領域包括:信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等等。

2:邊緣計算,是指在靠近物或數(shù)據(jù)源頭的一側,采用網(wǎng)絡、計算、存儲、應用核心能力為一體的開放平臺,就近提供最近端服務。其應用程序在邊緣側發(fā)起,產(chǎn)生更快的網(wǎng)絡服務響應,滿足行業(yè)在實時業(yè)務、應用智能、安全與隱私保護等方面的基本需求。邊緣計算處于物理實體和工業(yè)連接之間,或處于物理實體的頂端。而云端計算,仍然可以訪問邊緣計算的歷史數(shù)據(jù)。

3:聯(lián)大品佳推出了基于MediaTek Filogic 130A(MT7933)的Wi-Fi 6 AIoT邊緣計算語音識別方案。該方案將先進的Wi-Fi和藍牙功能與最新的語音處理和電源管理技術相結合,可為智能音箱、智能家居、家庭娛樂和汽車多媒體娛樂提供新的設計思路。

 

 

2022年3月16日,致力于亞太地區(qū)市場的領先半導體元器件分銷商---大聯(lián)大控股宣布,其旗下品佳推出基于聯(lián)發(fā)科(MediaTek)Filogic 130A(MT7933)的Wi-Fi 6 AIoT邊緣計算語音識別方案。

 

 

圖示1-大聯(lián)大品佳基于MediaTek產(chǎn)品的Wi-Fi 6 AIoT邊緣計算語音識別方案的展示板圖

全球疫情的爆發(fā)加速了數(shù)字轉(zhuǎn)型、智能物聯(lián)網(wǎng)的發(fā)展進程。為有效對抗疫情,減少人們在日常生活中的直接觸碰,非接觸式技術被廣泛使用在各大場景中。其中,語音識別技術作為非接觸式技術的一種,其通過語音或語音命令與裝置設備進行互動,在后疫情時代備受關注。基于此背景,大聯(lián)大品佳推出了基于MediaTek Filogic 130A(MT7933)的Wi-Fi 6 AIoT邊緣計算語音識別方案。該方案將先進的Wi-Fi和藍牙功能與最新的語音處理和電源管理技術相結合,可為智能音箱、智能家居、家庭娛樂和汽車多媒體娛樂提供新的設計思路。

 

圖示2-大聯(lián)大品佳基于MediaTek產(chǎn)品的Wi-Fi 6 AIoT邊緣計算語音識別方案的場景應用圖

MediaTek全新無線連網(wǎng)系統(tǒng)單芯片F(xiàn)ilogic 130A(MT7933)整合了微控制器、AI引擎、Wi-Fi 6和藍牙5.2及電源管理單元(PMU)、獨立音頻數(shù)字信號處理器(DSP)等單元。其中,音頻數(shù)字信號處理器(DSP)能夠使設備制造商輕松地在其產(chǎn)品中添加語音助手和其他服務。憑借先進的功能與高集成度,本方案可為小尺寸裝置提供節(jié)能、可靠及高效的網(wǎng)絡連接,是各類物聯(lián)網(wǎng)(IoT)裝置的極佳選擇。

不僅如此,F(xiàn)ilogic 130A所具備的語音活動檢測(VAD)技術也極具智能化。當其在檢測到人類語音時,會自動忽略音頻中的靜音片段,從聽到人類語音后才會進行音頻處理以達到低功耗目的。且無論是設計簡化的單一麥克風,或是多個矩陣麥克風,F(xiàn)ilogic 130A皆能進行回音消除AEC(Acoustic Echo Cancelling)、遠場處理(Far-Field Process)等功能來增強語音識別。

 

圖示3-大聯(lián)大品佳基于MediaTek產(chǎn)品的Wi-Fi 6 AIoT邊緣計算語音識別方案的方塊圖

除此之外,F(xiàn)ilogic 130A也支持本機語音命令,通過預先定義的語音指令,即使在無網(wǎng)絡連線、網(wǎng)絡延遲情形下,一樣能輕松通過語音命令來控制設備。如:控制燈光、音量以及播放、暫停音樂、前后首等音頻控制。

核心技術優(yōu)勢:

聯(lián)發(fā)科技MediaTek全新無線連網(wǎng)系統(tǒng)單芯片F(xiàn)ilogic 130A(MT7933),整合獨立音頻數(shù)字訊號處理器(DSP),可便捷地為產(chǎn)品增加語音助理等服務。使用的HiFi4 DSP具有3個ADC / 2 DAC和專用SRAM,可提供超低功耗、Always-On的麥克風功能,具有語音活動檢測(VAD)和喚醒詞(Wake Word)支持功能。

大聯(lián)大品佳集團提供全方位技術支持,從前期開發(fā)設計適合的音訊硬體、增減修改預定義的本機語音命令及調(diào)整音頻處理效能。量產(chǎn)階段的無線連接效能測試等。

方案規(guī)格:

應用處理器:

ARM®Cortex-M33 MCU具浮點運算,運作時脈300MHz;

1MB嵌入式SRAM和8MB虛擬SRAM(PSRAM);

支持外接serial flash達16MB,支持就地執(zhí)行(XIP);

網(wǎng)絡安全硬件加密引擎包含AES、DES/3DES、SHA、ECC、TRNG;

支持47組GPIOs多工切換SPI,I2C,Aux ADC,UART,及GPIO功能;

支持12 DMA channels。

音頻數(shù)字訊號處理器(DSP):

Cadence®Tensilica®HiFi4處理器,運作時脈600MHz;

Audio Codec具有2組ADC及1組DAC;

256KB內(nèi)嵌SRAM memory;

語音活動檢測(VAD)和喚醒詞(Wake Word);

3.5mm音頻埠外接主動式喇叭。

Wi-Fi技術規(guī)格:

雙頻段IEEE 802.11 1T1R a/b/g/n/ax 5GHz及2.4GHz;

2.4G/5GHz頻帶,20MHz頻寬MCS0 ~ MCS8。

藍牙技術規(guī)格:

符合Bluetooth v5.0,傳輸速率2Mbps PHY,支持長距離Long-range及LE Advertising Extensions。

 


 

關于大聯(lián)大控股:

大聯(lián)大控股是全球第一、亞太區(qū)最大的半導體元器件分銷商*,總部位于臺北(TSE:3702),旗下?lián)碛惺榔?、品佳、詮鼎及友尚,員工人數(shù)約5,000人,代理產(chǎn)品供貨商超250家,全球80個分銷據(jù)點,2021年營業(yè)額達278.1億美金(自結)。大聯(lián)大開創(chuàng)產(chǎn)業(yè)控股平臺,專注于國際化營運規(guī)模與在地化彈性,長期深耕亞太市場,以「產(chǎn)業(yè)首選.通路標桿」為愿景,全面推行「團隊、誠信、專業(yè)、效能」之核心價值觀,連續(xù)21年蟬聯(lián)「優(yōu)秀國際品牌分銷商獎」肯定。面臨新制造趨勢,大聯(lián)大致力轉(zhuǎn)型成數(shù)據(jù)驅(qū)動(Data-Driven)企業(yè),建置在線數(shù)字化平臺─「大大網(wǎng)」,并倡導智能物流服務(LaaS, Logistics as a Service)模式,協(xié)助客戶共同面對智能制造的挑戰(zhàn)。大聯(lián)大從善念出發(fā)、以科技建立信任,期望與產(chǎn)業(yè)「拉邦結派」共建大競合之生態(tài)系,并以「專注客戶、科技賦能、協(xié)同生態(tài)、共創(chuàng)時代」十六字心法,積極推動數(shù)字化轉(zhuǎn)型。