WTK6900F-B04模塊是用于物聯網交互及控制領域的智能MCU模塊。該智能模塊基于深度神經網絡(DNN-HMM)語音識別技術,實現了高識別率、高實時性、本地和云端結合、高度一體化的語音識別及處理功能;可以實現語義識別等特定智能語音交互效果。同時該模塊具備常規MCU的控制及計算處理能力,可以實現各類需要通信及控制的應用。
該模塊從語音輸入開始,語音檢測,語音特征提取及DNN運算完全采用硬件架構設計,軟件主要進行語音解碼和語音播報。該模塊具有較高的運算性能及低成本、低功耗、小尺寸等優勢。在應用方面,該模塊可以支持本地語音檢測、喚醒,以及三百條離線命令詞條的識別,模塊支持回音消除功能,支持雙麥功能。模塊可通過UART將命令推送到設備原有的上位機,實現簡單的語音交互接口。
離線命令詞自學習是指在非聯網狀態,用戶通過語音對話的方式,更改默認的命令詞;后續用戶可以通過改設定的特定命令詞進行語音識別。該種更改方式滿足終端用戶的個性化自定義的需求,可以給客戶帶來更好的用戶體驗。離線命令詞自學習可存儲模板數量,最多為15個。
◆ ARM Cortex-M4F,最高運行頻率200MHz;
◆ 內置 512KB SRAM;
◆ 內置 ASR 硬件加速引擎;
◆ 語音特征提取引擎(FE);
◆ 支持本地語音識別解碼;
◆ 支持低功耗語音喚醒;
◆ 支持回音消除功能;
◆ 內置1路UART接口;
◆ 內置2通道16bit SAR ADC;
◆ 支持外接晶體和有源晶振;
◆ 內置 PLL;
◆ 內置上電及欠壓復位電路;
◆ IO 供電:3V,內核供電:1.2V;
◆ 支持睡眠待機模式;
◆ 內置獨立看門狗和窗口看門狗;
◆ 支持超時產生中斷或復位;
◆ 語音活動檢測引擎(VAD),支持 VAD 參數可調;