觸控﹧語音﹧體感輸入技術 PC操控再進化 智慧應用 影音
MongoDB
ST Microsite

觸控﹧語音﹧體感輸入技術 PC操控再進化

  • DIGITIMES企畫

Microchip推出基於電場(E-field)感應的GestICR專利3D手勢控制技術。Microchip
Microchip推出基於電場(E-field)感應的GestICR專利3D手勢控制技術。Microchip

早期電腦採用文字命令的輸入方式,透過「鍵盤」(Keyboard)為輸入與互動工具,後來電腦進入圖型化介面後,加入了「滑鼠」 (Mouse)做為輸入裝置。而電腦遊戲的普及,促使廠商開發出各式遊戲控制器(Controller),如「搖桿」(Joystick/Game Pad),甚至「賽車方向盤」(Racing Wheel)等… 而在繪圖市場也有廠商開發出「數位手寫板/繪圖板」(Graphics Tablet、Digitizer)等輔助輸入裝置。這些裝置都是以手來透過特定的硬體裝置,達到輸入的目的。

直到後來PDA (例如Palm、Pocket PC)流行的年代,採「觸控筆輸入」(Stylus Input)為主要輸入方式。而在2007年以後,智慧型手機(如iPhone、Android手機)與平板電腦(如iPad、Android平板)等行動裝置的風行,直接用手「觸控輸入」(Touch Input)的方式,成為當今多媒體娛樂裝置的主流。

適合客廳等較大空間的PC體感控制器 (Asus)

適合客廳等較大空間的PC體感控制器 (Asus)

業界高度期待、桌電或筆電專用PC體感控制器 (Leap Motion)

業界高度期待、桌電或筆電專用PC體感控制器 (Leap Motion)

支援手勢輸入,以控制電視或玩遊戲的智慧型電視 (Samsung)

支援手勢輸入,以控制電視或玩遊戲的智慧型電視 (Samsung)

不少軟體廠商將軟體移植到上述行動裝置,透過觸控方式來控制,而遊戲也可以透過內建陀螺儀(Gyroscope)和重力感應器(G Sensor)等「感測器」(Sensor)來控制,以直覺且方便的操作模式,正式脫離鍵盤與滑鼠操控的時代。

手勢、體感產品的興起

拜微機電元件的成功研發,廠商並把各種微機電技術元件(如加速度計、慣性陀螺儀、光電、生物、壓力…等)導入消費性電子產品(包含PDA、手機、平板等產品,以及遊戲機、個人電腦、汽車電子等),使得體感、手勢動作等獨特操控方式,可為產業界帶來不少創新應用,也為人類生活帶來了更直覺、更智慧的生活應用。

以遊戲機為例,以前以搖桿控制的方式直到任天堂推出Wii才有突破,其採用創新的「體感控制器」(Motion Controller),透過手部傳感方式來進行遊戲,為體感遊戲開創先河,接著Sony也推出PS Move來回應,爾後微軟推出Kinect、Sony推出PS Move等「體感控制器」,讓玩家藉由手勢或身體來控制遊戲,為業界帶來全新的娛樂革命。

Wii Remote或PS Move屬於內建微機電元件的控制器,透過手部傳感的些微動作來達到控制的目的。而Kinect、PS Move則是屬於透過視訊攝影機(Webcam)來偵測肢體動作,以分辨出有效移動進而控制。尤其後者的應用更多元,像是可透過「人臉辨識」(Face Recognition)的技術,將人臉圖像換形成特徵,並即時對攝影人臉進行比對與識別,用以當作登入系統或解鎖之用。目前電腦軟體(例如Luxand的Blink! Pro for Windows軟體)、智慧型手機(如Android 4.0以上的手機)皆可透過人臉辨識來登入或解鎖系統,更甚者還可以透過「影像辨識」(Image Recognition)方式,偵測使用者的動作來控制(例如Samsung Galaxy S4的Air Gesture揮手控制技術,來換歌曲、翻頁、接聽電話)。

至於當紅的智慧型電視(Smart TV),也紛紛導入體感控制技術,例如Hitachi、Panasonic、TCL、Samsung…等智慧電視產品,也支援臉部辨識技術來識別用戶登入,此外也可透過手勢遙控,藉由手勢的比劃,來進行轉台、調音量與調亮度等動作,在客廳也能輕鬆享受視聽娛樂。

開口直接說 語音辨識讓輸入更直覺

除了手勢、體感之外,「語音辨識」(Voice Recognition)可說是最直覺的輸入方式。只是,早期的語音辨識技術/軟體、語音中文輸入法,礙於技術的障礙,在辨識之前,使用者必須先依照畫面的指示,先行練習發音一遍,讓系統錄製你的聲紋語音檔,並建立您專屬的辨識資料庫之後,才能有較佳的語音輸入品質。當今Windows 7/8電腦內建的語音辨識功能,便屬於此類。

語音辨識的應用與突破,直到近兩年來雲端應用的普及,才慢慢出現曙光。包含蘋果在2011年推出的iOS 5版本內建的Siri (人工智慧助理軟體)、Google在2011年推出的Voice Search(語音搜尋)服務,以及Samsung於2012年推出自家S Voice(語音助手)在內,三者皆是採用「自然語言處理」 (Natural Language Processing) 技術,讓電腦聽「懂」人類的語言。因此用戶不需預先學習、錄音、建立辨識資料庫,只要對著裝置正常說話,系統會將錄製好的聲音檔,直接上傳至該專屬的雲端伺服器去做分析與辨識,並將結果回傳至用戶的裝置上,以進行裝置控制或資訊洽詢。

上述的語音辨識技術,除了應用在手機與平板等行動裝置之外,近年來電視大廠也紛紛將語音辨識技術,導入在自家最新推出的智慧型電視產品上(例如Samsung、Panasonic),透過語音命令(Voice Command)、比起遙控器更直覺的方式,來控制電視。

PC專用的體感觸控裝置

上述提到的觸控、體感、語音等輸入方式,已在行動裝置(智慧型手機、平板電腦、衛星導航機…)、消費性電子(MP3、智慧相機、智慧手錶、智慧電視…)等產品上行之有年,至於在我們常用的PC個人電腦上,也開始可以看到這些輸入裝置逐漸流行…

例如微軟在2012年10月推出的Windows 8作業系統,首度支援觸控輸入,除自家的Surface RT、Surface Pro平板+電腦之外,各電腦系統廠商也紛紛推出具備觸控功能的Windows 8筆電、變形筆電、AIO桌電…等產品,早在Computex 2012已先提早亮相,而Computex 2013將會有更多新產品吸引買家目光。

至於PC體感控制器,目前有微軟的Kinect for Windows,還有華碩的Xtion Pro體感系統,但因為體積稍嫌龐大,適合掛載於螢幕上,且有距離限制,較適合客廳或較大的環境。至於在小型PC體感控制技術上,目前最受業界矚目的產品,就屬Leap Motion公司的產品。

Leap Motion公司創立於2010年,在2012年5月公布Leap Motion體感控制技術,是一隻接在USB埠的感測裝置,約半包香菸的大小,放在桌電或筆電的鍵盤前方,並將正面朝上。內建雙攝影機與三組紅外線感測器,可營造出電腦螢幕前端約1公尺的半球型偵測區域(150度的視野),可偵測與追蹤使用者的細微手指運動,它以290FPS的速度追蹤雙手和10根手指的運動,最小可以追蹤到0.01mm的運動,比針頭還要小,而且使用者不會注意到延遲的情形。

Leap Motion控制器,可以讓PC使用者在電腦螢幕面前透過雙手揮舞來控制,包括網頁的翻頁、精密繪圖、地圖的放大/縮小/平移、模擬遊戲的觸控操作、甚至射擊遊戲的槍枝發射、飛行遊戲的控制…等各種應用,只要程式支援,便可以各種想像得到的方式做控制,以體驗如鋼鐵人電影中男主角的手勢控制。目前其開發套件已經發給全世界對該技術有興趣的開發者,用以催生新程式的開發。

Leap Motion控制器預計2013年7月22日正式供貨,建議售價為79.99美元。屆時該公司也提供支援體感控制的Airspace軟體商城,供用戶下載。而看在此技術的未來性,已有不少廠商與Leap Motion合作。例如華碩將於2013年稍晚的高階AiO桌電,與搭載Intel Haswell架構的筆電上,隨附Leap Motion控制器。而HP初期將搭售Leap Motion控制器,未來將直接內建相關技術並嵌入HP的裝置中。

Microchip也在Computex展中,展出其專利的GestICR 技術,是世界上第一款基於電場(E-field)感應的3D手勢控制技術,可提供低功耗、精確、快速和強大的手部位置追蹤與自由空間手勢識別,能夠為廣泛的終端產品實現下一個維度的直覺式、基於手勢的非接觸式使用者介面。

除了以上技術與新產品,在Computex 2013裡,有更多體感控制的系統產品或輸入周邊展出,吸引不少廠商買主駐足了解。