第六代Wi-Fi 人工智能物聯(lián)網(wǎng) 邊緣計算語音識別方案:大聯(lián)大品佳集團推新
【自動對焦:語音識別 邊緣計算】
1:語音識別是一門交叉學科。近二十年來,語音識別技術取得顯著進步,開始從實驗室走向市場。人們預計,未來10年內(nèi),語音識別技術將進入工業(yè)、家電、通信、汽車電子、醫(yī)療、家庭服務、消費電子產(chǎn)品等各個領域。 語音識別聽寫機在一些領域的應用被美國新聞界評為1997年計算機發(fā)展十件大事之一。很多專家都認為語音識別技術是2000年至2010年間信息技術領域十大重要的科技發(fā)展技術之一。 語音識別技術所涉及的領域包括:信號處理、模式識別、概率論和信息論、發(fā)聲機理和聽覺機理、人工智能等等。
2:邊緣計算,是指在靠近物或數(shù)據(jù)源頭的一側,采用網(wǎng)絡、計算、存儲、應用核心能力為一體的開放平臺,就近提供最近端服務。其應用程序在邊緣側發(fā)起,產(chǎn)生更快的網(wǎng)絡服務響應,滿足行業(yè)在實時業(yè)務、應用智能、安全與隱私保護等方面的基本需求。邊緣計算處于物理實體和工業(yè)連接之間,或處于物理實體的頂端。而云端計算,仍然可以訪問邊緣計算的歷史數(shù)據(jù)。
3:聯(lián)大品佳推出了基于MediaTek Filogic 130A(MT7933)的Wi-Fi 6 AIoT邊緣計算語音識別方案。該方案將先進的Wi-Fi和藍牙功能與最新的語音處理和電源管理技術相結合,可為智能音箱、智能家居、家庭娛樂和汽車多媒體娛樂提供新的設計思路。
2022年3月16日,致力于亞太地區(qū)市場的領先半導體元器件分銷商---大聯(lián)大控股宣布,其旗下品佳推出基于聯(lián)發(fā)科(MediaTek)Filogic 130A(MT7933)的Wi-Fi 6 AIoT邊緣計算語音識別方案。
圖示1-大聯(lián)大品佳基于MediaTek產(chǎn)品的Wi-Fi 6 AIoT邊緣計算語音識別方案的展示板圖
全球疫情的爆發(fā)加速了數(shù)字轉(zhuǎn)型、智能物聯(lián)網(wǎng)的發(fā)展進程。為有效對抗疫情,減少人們在日常生活中的直接觸碰,非接觸式技術被廣泛使用在各大場景中。其中,語音識別技術作為非接觸式技術的一種,其通過語音或語音命令與裝置設備進行互動,在后疫情時代備受關注。基于此背景,大聯(lián)大品佳推出了基于MediaTek Filogic 130A(MT7933)的Wi-Fi 6 AIoT邊緣計算語音識別方案。該方案將先進的Wi-Fi和藍牙功能與最新的語音處理和電源管理技術相結合,可為智能音箱、智能家居、家庭娛樂和汽車多媒體娛樂提供新的設計思路。
圖示2-大聯(lián)大品佳基于MediaTek產(chǎn)品的Wi-Fi 6 AIoT邊緣計算語音識別方案的場景應用圖
MediaTek全新無線連網(wǎng)系統(tǒng)單芯片F(xiàn)ilogic 130A(MT7933)整合了微控制器、AI引擎、Wi-Fi 6和藍牙5.2及電源管理單元(PMU)、獨立音頻數(shù)字信號處理器(DSP)等單元。其中,音頻數(shù)字信號處理器(DSP)能夠使設備制造商輕松地在其產(chǎn)品中添加語音助手和其他服務。憑借先進的功能與高集成度,本方案可為小尺寸裝置提供節(jié)能、可靠及高效的網(wǎng)絡連接,是各類物聯(lián)網(wǎng)(IoT)裝置的極佳選擇。
不僅如此,F(xiàn)ilogic 130A所具備的語音活動檢測(VAD)技術也極具智能化。當其在檢測到人類語音時,會自動忽略音頻中的靜音片段,從聽到人類語音后才會進行音頻處理以達到低功耗目的。且無論是設計簡化的單一麥克風,或是多個矩陣麥克風,F(xiàn)ilogic 130A皆能進行回音消除AEC(Acoustic Echo Cancelling)、遠場處理(Far-Field Process)等功能來增強語音識別。
圖示3-大聯(lián)大品佳基于MediaTek產(chǎn)品的Wi-Fi 6 AIoT邊緣計算語音識別方案的方塊圖
除此之外,F(xiàn)ilogic 130A也支持本機語音命令,通過預先定義的語音指令,即使在無網(wǎng)絡連線、網(wǎng)絡延遲情形下,一樣能輕松通過語音命令來控制設備。如:控制燈光、音量以及播放、暫停音樂、前后首等音頻控制。
核心技術優(yōu)勢:
聯(lián)發(fā)科技MediaTek全新無線連網(wǎng)系統(tǒng)單芯片F(xiàn)ilogic 130A(MT7933),整合獨立音頻數(shù)字訊號處理器(DSP),可便捷地為產(chǎn)品增加語音助理等服務。使用的HiFi4 DSP具有3個ADC / 2 DAC和專用SRAM,可提供超低功耗、Always-On的麥克風功能,具有語音活動檢測(VAD)和喚醒詞(Wake Word)支持功能。
大聯(lián)大品佳集團提供全方位技術支持,從前期開發(fā)設計適合的音訊硬體、增減修改預定義的本機語音命令及調(diào)整音頻處理效能。量產(chǎn)階段的無線連接效能測試等。
方案規(guī)格:
應用處理器:
ARM®Cortex-M33 MCU具浮點運算,運作時脈300MHz;
1MB嵌入式SRAM和8MB虛擬SRAM(PSRAM);
支持外接serial flash達16MB,支持就地執(zhí)行(XIP);
網(wǎng)絡安全硬件加密引擎包含AES、DES/3DES、SHA、ECC、TRNG;
支持47組GPIOs多工切換SPI,I2C,Aux ADC,UART,及GPIO功能;
支持12 DMA channels。
音頻數(shù)字訊號處理器(DSP):
Cadence®Tensilica®HiFi4處理器,運作時脈600MHz;
Audio Codec具有2組ADC及1組DAC;
256KB內(nèi)嵌SRAM memory;
語音活動檢測(VAD)和喚醒詞(Wake Word);
3.5mm音頻埠外接主動式喇叭。
Wi-Fi技術規(guī)格:
雙頻段IEEE 802.11 1T1R a/b/g/n/ax 5GHz及2.4GHz;
2.4G/5GHz頻帶,20MHz頻寬MCS0 ~ MCS8。
藍牙技術規(guī)格:
符合Bluetooth v5.0,傳輸速率2Mbps PHY,支持長距離Long-range及LE Advertising Extensions。
關于大聯(lián)大控股:
大聯(lián)大控股是全球第一、亞太區(qū)最大的半導體元器件分銷商*,總部位于臺北(TSE:3702),旗下?lián)碛惺榔?、品佳、詮鼎及友尚,員工人數(shù)約5,000人,代理產(chǎn)品供貨商超250家,全球80個分銷據(jù)點,2021年營業(yè)額達278.1億美金(自結)。大聯(lián)大開創(chuàng)產(chǎn)業(yè)控股平臺,專注于國際化營運規(guī)模與在地化彈性,長期深耕亞太市場,以「產(chǎn)業(yè)首選.通路標桿」為愿景,全面推行「團隊、誠信、專業(yè)、效能」之核心價值觀,連續(xù)21年蟬聯(lián)「優(yōu)秀國際品牌分銷商獎」肯定。面臨新制造趨勢,大聯(lián)大致力轉(zhuǎn)型成數(shù)據(jù)驅(qū)動(Data-Driven)企業(yè),建置在線數(shù)字化平臺─「大大網(wǎng)」,并倡導智能物流服務(LaaS, Logistics as a Service)模式,協(xié)助客戶共同面對智能制造的挑戰(zhàn)。大聯(lián)大從善念出發(fā)、以科技建立信任,期望與產(chǎn)業(yè)「拉邦結派」共建大競合之生態(tài)系,并以「專注客戶、科技賦能、協(xié)同生態(tài)、共創(chuàng)時代」十六字心法,積極推動數(shù)字化轉(zhuǎn)型。
微信聯(lián)盟:大聯(lián)大微信群、邊緣計算微信群、語音識別微信群、模式識別微信群、解決方案微信群,各細分行業(yè)微信群:點擊這里進入。
鴻達安視:水文水利在線監(jiān)測儀器、智慧農(nóng)業(yè)在線監(jiān)測儀器 金葉儀器: 氣體/顆粒物/煙塵在線監(jiān)測解決方案
西凱昂:SMC氣動元件、力士樂液壓元件、倍加福光電產(chǎn)品等 山東諾方: 顆粒物傳感器、粉塵濃度傳感器
深圳金瑞銘:RFID射頻識別、智能傳感器等物聯(lián)網(wǎng)解決方案 北京英諾艾智: 容錯服務器、邊緣計算解決方案
評論排行