巨量資訊關鍵4V 提升產業競爭力 智慧應用 影音
意法半導體
優立測

巨量資訊關鍵4V 提升產業競爭力

  • 曾怡穎

在數位化與資訊化的潮流下,「巨量資料」(Big Data)分析已成為創新競爭力的一大關鍵,也是世界各先進國家與企業投入研究的重要領域。根據IBM預估,2015年全球資料量將可突破8,000 Exabyte(EB,1EB=100萬Terabyte),如果換算為每片容量25GB、厚度1.2mm的光碟,堆疊起來的高度相當於80萬座台北101。

然而目前在台灣,巨量資料的發展投入還不算多。為能推升產業競爭優勢,今年5月工研院正式成立「巨量資訊科技中心」,不只是台灣第一個以巨量資料處理分析為核心的研發中心,更將透過工研院的多元領域研究及資源整合力量,並且具體規劃創新技術應用方向,為產業的競爭力加值。

「資料分析」的觀念其實並不算新,就像考生在應試前,會先找考古題來參考一般,藉由過去所產生的資料數據,經分析與判斷之後,當成是未來的行動與決策依據,這種現象在生活中相當普遍。像是企業就經常運用以往的營業銷售資料與市場情報,來預測未來的財務營收狀況;氣象分析報告也需要透過收集而來的大量資料進行研判,才能提出更精確的天氣資訊。

但是和過去相比,現今資料的處理與分析卻顯得更為複雜,包括受到網際網路普及、感測器科技進步等因素影響,使得能夠收集、偵測的資料量愈來愈大,種類也愈來愈多;如何從龐大的資料中將沒有價值的部分去除、取出有用的資料,並加以分析、組合與運用,便是巨量資料科技的研發重點。

例如提供線上收看電影與電視節目服務的Netflix,就根據用戶的性別、年齡,以及曾經觀看過的偏好影片類型,還有被用戶設為朋友群組的收視狀況與評分等資料,整合成有效的推薦系統,不但能影響用戶的收視決定,更與客戶滿意度和業績有直接關聯。

以Netflix在全球擁有近3,000萬的龐大用戶數,顯然這套推薦系統無法以人工來執行,必定得由機器來代勞,去蕪存菁取出具有價值的資訊,才能提供消費市場所強調的「個人化服務」,這也正是巨量資料技術的力量。

而且除了面臨「量」(Volume)的增加外,巨量資料從收集、處理、分析並提供決策等過程,也因應當前網路交易等現象,必須要做到即時的反應與運作;例如當客戶上線登入後,網頁上就要能立刻顯示推薦商品或促銷資訊,因此對「速度」(Velocity)的要求也更高;不像過去企業分析營運資料時,即使進行好幾天也沒關係。

現在巨量資料技術還會遇到許多資料的「多樣性」(Variety);例如網路上的影像、聲音、符號,以及感測器、監控設備、行動裝置等,都是資料的來源與範疇,不再只是單純的文字或數字,因此需要更新的技術來解決這些新的問題。同時在這大量、快速的處理過程中,如何維持資料的可信度(Veracity)也相當重要,尤其網路上的資料常會出現錯誤、重複、不完整、彼此抵觸等情況,和企業內部自行產生資料的正確性大不相同。

而這四個「V」,也正是巨量資料分析技術所強調的特性與挑戰,以及工研院成立「巨量資訊科技中心」所努力的目標。

巨量資料技術雖然是以軟體為主,但也需要硬體的搭配;而目前全球許多資訊或科技廠商,以及學校、研發機構等,也競相加入巨量資料技術的市場與研究,甚至有不少新創公司投入。為能在未來創造更顯著的效益,工研院巨資中心的定位與研發方向,則是著重在應用分析層次,透過實際應用的領域及用途發展分析技術,同時也將結合更多開放資源(open source),開發分析計算的平台,以提供產業更完整的解決方案。

目前工研院巨資中心亦選定了數個研發目標,並與產業共同合作。其一就是製造業中的LED產業,並以多數業者所關注的「良率」切入,導入巨量資料分析的模式,透過收集溫度、壓力、時間等各項參數,藉以判斷並改善製程與產品品質,不只能夠協助降低成本、提升獲利,也更能配合引進更新、更複雜的製程技術。

另一項研究發展則是在超商零售業的銷售預測上,藉由巨量資料分析可以更清楚地了解消費需求與銷售情況,減少庫存及浪費造成的損失,以及倚靠人力經驗判斷的不確定性。此外,利用視訊分析辨識技術來過濾影像資料,進而打擊犯罪、維護治安的應用,也已和警政署及多個縣市警察局合作。

工研院在機械、綠能、電子光電、資訊通訊、材化、生醫等產業跨領域的整合,更成為工研院巨量資料分析在全球競爭的最佳利器,相信未來在更多資源與人才挹注下,能為更多的台灣產業提升競爭力並帶來更高的營運效益。 (本文由工研院巨量資訊科技中心余孝先主任提供,DIGITIMES整理)