台灣多元語言的語音AI辨識技術創新 麗臺助力長問科技引領多領域應用 智慧應用 影音
Microchip
ADI

台灣多元語言的語音AI辨識技術創新 麗臺助力長問科技引領多領域應用

  • 尤嘉禾台北

長問科技副總經理陳又碩。麗臺
長問科技副總經理陳又碩。麗臺

語音辨識技術正在改變多項產業的運作模式,成為節省人力成本與提升效率的關鍵利器。長問科技打造出台灣在地的語音AI辨識系統,橫跨國、台、英、客語言的輸入與輸出,成為企業數位轉型的重要動力,其應用範圍涵蓋金融、電信、醫療、法律、教育、媒體等領域,達到超過95%的辨識準確率,還能針對不同產業的專業詞彙進行語言模型優化,甚至結合大型語言模型(LLM)提高語音AI辨識的準確性,進一步增強用戶體驗。

語音AI辨識的多元應用實例,有效提升企業效能

長問科技的語音AI辨識系統,專注於台灣在地語言的研發,採用單一模型實現多語言混合辨識,無需切換模型即可處理不同語言的輸入與輸出,適用於多種情境。以金融業者客服為例,該系統能將台灣常見的語言精準辨識成文字,後續再進行語義分析、判斷客戶的情緒,提供更貼近需求的服務。同時,該系統亦能透過RESTful API、WebSocket、MRCPv2,整合客服系統,提升了操作的便利性與效率。

在公部門的應用中,長問科技的語音AI辨識技術運用於政府會議記錄、防疫記者會直播、選舉辯論等公共活動的即時字幕生成,實現台灣常見語言的無縫互通。此外,長問科技使用客委會的「台灣客語語音資料庫」建立語音API,並與客委會團隊合作開發出四縣腔及海陸腔的虛擬主播,僅需輸入稿件即可進行播報,為客家文化的推廣提供助力,進一步展現了語音AI辨識技術的社會價值。

長問科技的系統大多採客製化開發,能根據不同產業的需求優化專業詞彙庫,確保精準識別產業術語,這在金融、醫療、法律等高度專業化領域尤為重要。此外,系統還能靈活調整辨識速度,以適應不同受眾的需求(如年輕人或老年人),進一步提升辨識精準度和使用體驗。

在媒體產業中,長問科技的語音AI辨識技術應用於Delay Live電視節目,大幅減少了傳統人工聽打字幕的工作量及壓力。透過專業詞彙庫的優化,即使面對節目內容廣泛、話題多變的挑戰,系統依舊能夠精準辨識產業術語。這項技術降低了50%的人力,並且字幕工作人員增加了40%的休息時間,字幕工作人員只需集中於校正AI輸出結果,極大地提高了效率。

麗臺科技助力強化AI算力

為了滿足即時語音AI辨識對高計算性能的需求,長問科技選用了麗臺科技的高效能AI硬體設備,特別是NVIDIA RTX 6000 Ada Generation GPU與WinFast GS4850T 伺服器的結合,強大的算力平台為語音AI辨識系統提供了穩定且高效的支援,確保能在應用環境中快速反應。

長問科技副總經理陳又碩指出:「麗臺的優勢在於其卓越的效能、合理的成本以及專業的技術諮詢服務。我們的客戶通常有客製化需求,針對資料的大小,麗臺能提供精準的建置建議。」

語音AI辨識系統助力跨文化交流

面對技術快速發展,長問科技預計持續提升語音AI辨識的精準度,更計劃擴展辨識語言的廣度,長問科技副總經理陳又碩說:「我們預計再新增客語的大埔腔、饒平腔、詔安腔,把台灣的語系做好之後,跨國的語音辨識也是未來的目標,計劃加入日語與越南語的辨識,以滿足更多產業的需求,進一步促進跨文化交流。」

通過高性能硬體和先進技術的結合,語音AI辨識應用正逐漸改變我們生活的方式,長問科技副總經理陳又碩分享:「語音AI辨識是未來的趨勢,隨著技術的進步,人類與機器溝通可以透過精準的數位化語音,很快便能實現人機自然的口語互動。」未來,隨著技術的不斷成熟,語音AI辨識將帶來更多的創新和可能性。

關鍵字