WTK6900F-B03模塊是專用于物聯網交互及控制領域的智能MCU語音模塊。該智能模塊基于目前最先進的深度神經網絡(DNN-HMM)語音識別技術,實現了高識別率、高實時性、本地和云端結合、高度一體化的語音識別及處理功能;可以實現語義識別等特定智能語音交互效果。同時該模塊具備常規MCU的控制及計算處理能力,可以實現各類需要通信及控制的應用。
該模塊從語音輸入開始,語音檢測,語音特征提取及DNN運算完全采用硬件架構設計,軟件主要進行語音解碼和語音播報。該模塊具有較高的運算性能及低成本、低功耗、小尺寸等優勢。在應用方面,該模塊可以支持本地語音檢測、喚醒,以及三百條離線命令詞條的識別,模塊支持回音消除功能,支持雙麥功能。模塊可通過UART將命令推送到設備原有的上位機,實現簡單的語音交互接口。
注1:最大支持三百條離線命令詞識別,支持雙麥功能;
注2:請參閱有關電氣規格及典型應用的數據表;
注3:出廠時詞條已默認,不可更改,如需定制其他詞條請先聯系業務。
◆ ARM Cortex-M4F,最高運行頻率200MHz ;
◆ 內置 512KB SRAM;
◆ 內置 ASR 硬件加速引擎 ;
◆ 語音活動檢測引擎(VAD),支持 VAD 參數可調;
◆ 語音特征提取引擎(FE);
◆ 支持本地語音識別解碼;
◆ 支持低功耗語音喚醒;
◆ 支持回音消除功能;
◆內置1路UART接口,1路SPI接口;
◆ 支持外接晶體和有源晶振;
◆ 內置;
◆ 內置上電及欠壓復位電路;
◆ IO 供電:3V,內核供電:1.2V;