利用深度學習模型 大幅減少音訊雜訊 智慧應用 影音
DTIOT
世平

利用深度學習模型 大幅減少音訊雜訊

  • 台北訊

中央研究院副研究員曹昱。
中央研究院副研究員曹昱。

在一個課堂場景,輕微聽損的學生可能礙於空間距離、背景噪音,無法聽清楚老師的話語,因而影響學習效果。然而只要採用中央研究院副研究員曹昱研發的除噪系統,即可借助深度學習模型有效降低音訊雜訊,甚至搭配手機App將語音轉成文字,讓學生能藉由文字判讀聽到的話語。

曹昱指出,2015年開始,他與研究團隊夥伴針對人工電子耳開發除噪演算法,並為此發表兩篇論文,榮獲國家新創獎;爾後再將研究觸角延伸到助聽器。事實上人工電子耳和助聽器的原理相似,只是前者屬於植入式,後者類似耳機型式。

借助深度學習模型有效降低音訊雜訊。

借助深度學習模型有效降低音訊雜訊。

目前曹昱團隊已與與振興醫院力博宏主任以及陽明大學賴穎暉教授合作,進行人工電子耳的真人實測。至於助聽器部份,則屬於與某大電腦廠商的合作案,且除了助聽器外還研發智慧音箱,都是先除噪、再做語音辨識。論及今年研究成果上的突破,在於將此系統做進手機,係因助聽器功能與一般藍牙耳機差不多,加上美國政府現正力推助聽器平價化,所以不少大企業看準手機普及性高、運算能力強,很適合做為中介站,也紛紛將助聽器功能做到手機上。

日後老師講課,其聲音會透過藍牙發射器傳送到學生的手機,就算學生與老師的距離遠,都可利用內建於App的除噪演算法,將雜訊濾除、得以聽清楚老師的話,還可進一步結合語音辨識功能,把聲音轉成文字,更加理解老師表達的內容。

曹昱解釋,嚴格來說,上述應用情境算是「輔聽」、而非「助聽」,只因藍牙耳機僅有放大功能,並無矯正功能,所以即使聽覺健全的學生,也可藉此增進對於老師講課內容的理解。