語音技術領導者賽微科技 客製化車用語音服務驚艷市場 智慧應用 影音
太陽誘電株式會社
Event

語音技術領導者賽微科技 客製化車用語音服務驚艷市場

  • 周維棻台北

賽微的語音關鍵技術深獲國際著名車廠及一線車用多媒體主機廠青睞。圖為賽微科技業務經理陳柏沅。
賽微的語音關鍵技術深獲國際著名車廠及一線車用多媒體主機廠青睞。圖為賽微科技業務經理陳柏沅。

賽微科技成立於2000年,走過16個年頭,如今是全球重要語音技術及解決方案提供商。核心技術能力在於「語音辨識」及「語音合成」,並擁有豐富平台移植經驗,開發平台包含Android、Windows、QNX、Linux,合作對象涵蓋海內外ODM業者和品牌商,HTC、宏碁、華碩皆是旗下客戶。

從2004年至今,全球共計超過280款、7,500萬台行動設備和超過40萬台車機導入賽微語音技術。賽微科技業務經理陳柏沅表示,賽微的交談式語音互動介面應用,早期從聲控玩具、一般型手機切入,逐漸往消費性產品、車用語音領域深入;此外,賽微在智慧家庭、居家醫療照護、服務業皆有布局,隨著穿戴式裝置、IoT聯網設備對語音需求的提升,未來勢必持續擴大應用市場及使用群眾。

持續研發語音關鍵技術  產品方案獨樹一幟

目前賽微的語音解決方案項目多元,像是輸入文字就能透過語音念出,更新版本也不用重新錄製的CReader– Text-To-Speech SDK;屬於指令式命令程式的CListener– Command-based VR SDK,則支援上千筆動態指令辨識,整個架構除單詞的Single Command外,還可接受Pre、Central、Post的多詞組搭配指令,在有限資源的嵌入式裝置達到最佳效率的演算。

賽微於2015年底推出CCLever–Local free speech control SDK,是目前的核心方案。CCLever SDK針對手機、車機的計算能力設計架構,可在離線的環境下於預設的功能範圍內實現自然口語辨識,在沒有完全符合指令時也能實現語音辨識。其所能處理的複雜程度較高,在互動體驗的彈性度上也更為提升。

CCLever SDK具備三大特色:第一,自然口語語音操作。擴展條目指令式語音辨識到自然口語互動,使用者無需記憶操作指令,對語氣詞、贅詞、前後雜音等有較佳的容許能力。第二,不需連網也能於終端設備上辨識運算。使用過程不因網路訊號有無或好壞而受限,不需建構及維護營運網路伺服器系統,且使用者個資更能受到妥善保護。第三,完善的開發工具。開發者可自主設計,配合應用優化辨識內容,並掌控開發時程與資訊安全。

除CCLever SDK之外,賽微的其他解決方案還包含CSpotter– Trigger command SDK(always listening),針對關鍵字辨識做喚醒應用,詞彙以外的字詞聲音不會誤觸發;CNavi Pro – POI/Address speech input SDK針對客戶不同系統的圖資,辨別圖資內容的詞彙,做客制化的程式設計;Speaker Verification SDK人別判斷技術,針對不同命令者錄製的語言標籤,透過擷取每個人的聲音特徵值,做出人別辨別應用。

目前,賽微所開發的語音技術共可支援32國語言,甚至同樣語系針對不同地區口音做到細緻分類;CListener和CSpotter產品,光是英文語系就已做到區分北美、英國、澳洲、華人等口音,而CReader支援語言的High Quality version版本,更能提供整句文章朗讀功能。

三大車用語音使用情境  打造更彈性化的人機互動

目前賽微在車用語音方案的導入,技術已臻成熟,且合作業者不乏國際著名車廠及一線(Tier one)車用多媒體主機廠。陳柏沅指出,目前賽微在車用領域,合作對象有Luxgen、Toyota、Honda、怡利、鼎天、大陸車機廠路暢、好幫手等,相關應用包含人名撥號、聲控點歌、電臺調頻、聲控導航、模式切換等功能。

若再進一步檢視車用環境所使用到的語音服務,賽微的技術支援能提供三種使用情境。情境一:藍牙撥號及主機操控,採用技術有CReader– Text-To-Speech SDK、CListener– Command-based VR SDK,具體的應用功能有人名撥號、多媒體點播、聲控點歌、模式切換、電台點播。

情境二:導航聲控,行車過程最怕駕駛分心尋找地址而造成事故意外,透過聲控找路導航是目前最合適的解決方案。導航軟體整合CNavi– POI/Address speech input SDK技術,直接利用聲音輸入景點或地址;並透過CReader– Text-To-Speech SDK將辨識結果、路名、路況念出。透過不同方案的交互使用,讓使用者可完成「hands free」、「eyes free」的全語音操控。

情境三:簡易指令操控(non OS),可在MCU等級的平台上運行CSpotter,實現像是模式切換、音量調大、上一首歌等固定控制指令。

持續開發新產品切入新興科技市場

除了上述語音辨識技術,陳柏沅表示為讓賽微語音辨識能在不同的環境下有更好的效能表現,賽微在聲音訊號處理的技術開發上不遺餘力,目前已開發有Noise Reduction?Suppression噪音消除?抑制,及AEC(Acoustic Echo Cancellation)回音消除等解決方案。

不論NR或AEC皆屬聲音訊號處理的一環,AEC+語音辨識技術實現「語音打斷?語音插話」(Voice barge-in)的情境,讓用戶無需等待系統提示音念完,即可通過說話來打斷系統的提示音,並直接下達指令。

而這類型的聲控方案,在市場端有越來越多的客戶提出客製化需求,其他聲音訊號處理方案還包含Far-field Recording、Beam-forming Recording、Speaker Tracking。賽微累積10餘年的豐富經驗和成功案例,未來在智慧家庭、醫療照護的應用上令人期待。