個人聽清楚聲音三大關鍵:音量、音頻、聽力圖
聲音是人體的五感之一,但聲音的頻率過去在IT產業相對較不受重視,如今物聯網透過底層的設備擷取訊號做為分析,未來語音頻率預料將變成系統必須處理的訊號種類之一。元鼎音訊(UnlimiterHear)董事長楊國屏於「音訊演算法在IoT上的應用發展」中就指出,雖然相較於其他技術,音訊屬於冷門領域,不過隨著物聯網應用的逐步拓展,未來發展潛力極為雄厚,成長力道也將逐步浮現。
楊國屏指出,目前國外已開始注意到音訊市場,並著手制定相關規範,IEEE(電機電子工程學會)已成立IEEE-P2650委員會著手制定智慧手機聽力測驗標準,元鼎音訊正是此聽力標準委員會的會員,元鼎音訊同時也在智慧型手機上設計了個人聽力測驗應用程式(MFA Hearing Test App),透過此一免費應用程式,使用者將可測試出自身的聽力。
除了學研機構,現在廠商也動作頻頻,在AI領域,近年來家庭語音助理如Amazon的Alexa、Google的Google Assistant等,已成為全球IT產業焦點。楊國屏表示,語音助理設備透過AI運算使用者的聲音,因此聲音的品質相當重要,他指出各種語言都會有不易辨別的高頻子音,例如英文的F與S就容易被混淆,在AIoT系統中,若訊號不清楚,後端的處理單元會無法運算,因此聲音品質在此類系統中,將會被高度要求。
對於聲音品質,過去的設備都只著重於音量大小,但聲音是由60%~70%的頻率加上30%~40%的音量所組成,因此音頻才是關鍵。楊國屏表示,多數人超過10歲就聽不到18KHz的聲音,即使音量再大也聽不到,因此如果用移頻的方式,將此頻率聲音轉移到多數人都可聽到的6KHz頻率範圍內,即使音量不大,聲音仍然清晰。目前元鼎開發出的MFA毫秒移頻技術,就以此方式,將之應用於智慧行動裝置、智慧聽戴裝置、智慧家居裝置、智慧健康裝置等與音訊相關的設備中。
根據與元鼎音訊合作的台灣電信公司表示,使用移頻技術後,一般人使用通訊App與3G/市話通話時,可改善4KHz以上高頻子音的消失問題,在通訊App互通使用G.711語音編碼通話時,可於通訊App以16KHz取樣頻率錄音後,先經移頻調整並重新取樣8 KHz再編碼傳送,也可改善相同問題,由此可以看出,移頻技術已可實際應用,並改善聲音品質。
目前元鼎音訊提供音量、頻率和個人聽力圖三種參數合一解決方案,並已廣泛使用於助聽器、輔聽器、智慧耳機、智慧家庭語音裝置、汽車語音裝置...等。楊國屏表示,依據每個人耳朵的不同聽力,所開發出專屬音頻演算法IP,可方便的嵌入晶片中,讓傳統的音訊裝置快速升級為智慧音訊裝置,提供差異化產品的同時,也讓人類生活更多采多姿。