整合MCU技術 加速語音辨識市場成熟 智慧應用 影音
Microchip
ST Microsite

整合MCU技術 加速語音辨識市場成熟

  • DIGITIMES企劃

RelaJet洞見未來創辦人Blue Chen。
RelaJet洞見未來創辦人Blue Chen。

在2018年的IFA大會上,Amazon公佈其下Alexa的各項數據,目前Alexa已經擁有超過5萬個功能,並與2萬種設備相容,合作品牌則超過3,500個,顯示出智慧語音控制已然來到。不過RelaJet洞見未來創辦人Blue Chen指出,目前市場上的語音辨識技術,仍有許多問題尚未解決,而RelaJet則透過安富利,將本身研發的演算法,結合NXP的MCU,設計出新一代語音辨識引擎。

目前市場上的語音辨識演算法,當多人同時講話時,若頻率與能量都接近時,往往無法分別單一的特定人聲,對於會在戶外使用的智慧化設備而言,會產生控制上的困擾。因此現在的作法大多是採集大量的個人語音音檔,並以聲紋和頻率分離,但這種作法需要長時間分析;另一種則是以透過物理麥克風陣列解決,不過需要一定的硬體成本,同時麥克風角度也必須不斷調整。

RelaJet的語音引擎則可在單一麥克風的設計下,做出人聲分離,同時只需現場3~5秒的音檔,就可精準判斷出人聲,若應用在聽障助聽器時,使用者可以聽取單一人聲,無論其音量大小,都不影響聲音品質,未來將可應用於各類型IT設備或遠距會議系統中,提供更精準、更具智慧的語音服務。