美商敏博系統存儲股份有限公司
台灣技術顧問
吳銘哲
英特內軟體股份有限公司
專案二部經理
潘慧君
痞客邦
研發中心總監
林瑞男
大數軟體有限公司
執行長
丘祐瑋
我們提供本研討會主講者同意授權的演講檔案,歡迎參與來賓下載。
如果遇到檔案無法下載,請檢查您的電腦是否有以下狀況,而造成下載問題:
毋庸置疑,儘管幾個年頭過去,「Big Data」熱度依舊不減,稱得上是當今企業不容輕忽的顯學。究其主因,乃在於這門經常翻譯為「巨量資料」或「大數據」的課題,委實創造了許多讓人動容的傳奇故事,包括老生常談的Target預測女性消費者懷孕、Walmart發現啤酒與尿布的銷售量呈現高度正相關,以及Netflix藉由大數據分析觀眾收視習慣,決定紙牌屋劇情走向,進而創造收視熱潮。
影響所及,舉凡精準行銷、精準醫療、智慧製造、智慧交通、智慧家庭、智慧建築、智慧社區、智慧城市等偉大題材,都拜Big Data畫龍點睛所賜,因而漫天飛舞。
撇開前述若干流於高遠的意境不
資訊爆炸時代來臨,網路與社群媒體大量湧現,使傳統媒體的經營益發困頓。5年前,老字號華文媒體聯合報系有鑑於媒體生態轉變,不宜眷戀舊有成功模式,決定找新出路,積極推動數位匯流新服務概念,希望深入瞭解用戶行為偏好,進而做到「任何時間、任何地點、合適載具,在同一載具上,可精準提供用戶需要的服務」,讓自己轉型蛻變為「精準媒體」。
這個創新求變願景,驅使聯合報系踏上大數據(Big Data)之路。5年後的今天,該報系擁有聯合報、經濟日報、聯合晚報、Upaper等4份為人熟知的台灣紙媒,及聯合新聞網、聯合知識庫、聯合影音網、udn讀書吧等眾多數位媒體,亦先後孵化其他多元事業如udn買東
持平而論,大數據非此刻才誕生的新議題,經過幾年激盪延燒,各產業皆已認同其運用價值,亟思加以導入,希望讓行銷與業務拓展更加精準。但以往多數企業礙於資源不足,加上工具不完善,導致相關應用推動不順;直至近兩年,愈來愈多企業懂得借力使力,紛紛評估採用公有雲服務,以化解種種難題,此風潮可望在2017年達到新高峰。
伊雲谷數位科技雲端事業單位總經理林儀指出,大數據之所以難為,一方面因為涉及大量運算,需動用眾多伺服器,對企業可謂財務負擔,尤其當運算資源不足以應付臨時性分析應用需求時,更令企業不知所措,另一方面,企業想做好大數據分析,需要延攬資料科學家,建構許多資料模型,並針對諸多工具進
不可諱言,Big Data分析議題不僅火熱,且已延燒到各產業。就一般人認知,積極投入此道的用戶,要嘛是如同商場等錢多的單位,要嘛是猶如製造業等自動化程度較高的單位;但事實上,兩大族群以外的業態,即便經費與資源相對不足,照樣有大數據應用需求。
英特內軟體知識策略處知識長趙孝倫指出,多年前,為了提供農業生產、食品加工、冷鏈運輸、連鎖通路等一站式服務,藉由生產端到消費端層層把關,使民眾吃得安心健康,該公司與其餘4家資服業者齊力打造食品安全供應鏈解決方案,成立「產聯國際」公司,推出「登就保」業主自我管理系統(旨在建立加工食品追蹤溯源機制),使英特內開始與食品業大數據結下不解之緣。
工欲善其事,必先利其器,任何人要挖掘Big Data背後涵義,都必須懂得運用一些程式語言,例如深受資料科學界喜愛的R與Python,即是不可不識的關鍵項目。
回顧5年前,台灣企業或學界對這些大數據程式語言所知有限,癥結在於英文介面產生學習阻礙;為此一群有志推動大數據、資料科學商業應用的人,決定推動漢化教學與培訓工作,遂在2012年成立中華R軟體學會,並在隔年(2013)成立台灣資料科學與商業應用協會。
前述兩會,算是台灣最早設立的Big Data推動組織,而國立臺北商業大學資訊與決策科學研究所教授暨資料科學應用研究中心主任鄒慶士博士,同時擔任兩會的理
今時今日,基於第三平台衍生的應用主題,著實多不勝數,但不論是物聯網、工業4.0、智慧電動車、智慧家庭…等等看似型態互異的應用,背後皆需高度倚賴大量數據蒐集、整理與分析;此乃Big Data題材持續發酵多年,迄今熱度不減的原因所在。
日立數據系統(HDS)台灣分公司技術經理梁萬宇指出,以往HDS在日立集團的角色定位,儘管已偏向IT基礎設備的提供者,但側重於儲存系統一環,爾後集團著眼於第三平台崛起,創新轉型的浪潮勢不可擋,單憑儲存一塊不足以涵蓋總體需求,故HDS順勢蛻變為含括更多元軟硬體工具的IT基礎供應者,也意識到Big Data重要性,於兩年前購併Pentaho,補強大數
深究台灣中小企業推動跨境貿易的過程,往往因為遍尋不到新買家,及不知如何提升詢單量、開創新業務、強化升品牌曝光度,因而坐困愁城,將台灣外貿推向連續走黑的低迷氛圍。
為此,阿里巴巴國際交易市場(以下簡稱「阿里巴巴B2B」)在去年(2016)偕同生態圈夥伴共創「台灣外貿生態圈」,希冀阿里巴巴B2B之於全球化平台及大數據優勢,輔以各夥伴分別在跨境物流、通關、金流、電商人才培育媒合等方面的能量展現,讓中小企業不再孤軍奮戰,而將彼此優秀產品與服務凝聚在一起,共同迎戰全世界競爭對手。
具體而言,所謂的「台灣外貿生態圈」,裡頭包含了一環、一圈兩大精髓,「一環」意指跨
毋庸置疑,包括大數據(Big Data)、人工智慧(AI)、機器學習(Machine Learning;ML),乃至深度學習(Deep Learning;DL),都是當今熱明顯學,伴隨這些議題相繼引領風騷,不僅造就了許多顛覆市場的獨角獸企業,也可望為百年企業注入新的DNA,徹底改善競爭體質。
換句話說,無論新創公司或老牌企業,只要真正進入數據分析之堂奧,都可望從中挖掘致勝線索,洞見未來趨勢浪潮,獲取源源不斷的創新養分;因此包括Big Data、AI、ML或DL等泛資料科學的技術項目,不管問世時間長或短,亦不管先前發展態勢是快或慢,至少在此時此刻,甚至是今後5年、10年,它
從過去「巨量資料」,直到現在「大數據」,不論辭彙如何演變,Big Data發展力道始終不減,愈來愈多企業也堅信,只要善用Big Data,不管想要降低營運成本、增裕收益來源,所有美好事物都可望手到擒來。
因此Big Data的觸角已擴張到各個垂直領域,舉凡製造業的工業4.0,金融業的金融科技(FinTech),醫療業的精準醫療,零售業的O2O全通路,種種新的商業模式,都需倚靠大數據分析來支撐。
但不可諱言,企業想真正從Big Data淘金,絕非一蹴可幾之事,首先需要訂定明確目標,知道自己想要解決什麼難題,或滿足什麼需求,此釐清所需蒐集資料範圍,據以打
在2007跨年之際,大陸知名網紅羅胖,說了一句發人深省的話,每個人的時間只有固定24小時,消費者為何要有限時間分配給你?故時間已成為各家企業爭相搶奪的稀少資源,而對於行銷工作者,時間尤其是最大的敵人。
電通安吉斯集團台灣集思總經理夏雨農表示,身處動態競爭時代,企業必須不斷跟內部自我競爭,及跟外部市場競爭,因此需要借助大數據分析找出關鍵洞見,藉以改變競爭力;決勝之道有二,一是對內,合理支配自己的時間,二是對外,即時掌握消費者關鍵決策時機。
欲展現大數據價值,背後亟需一個閉環架構予以支撐,以「數據驅動」為起點,先藉由集中化資料回答明確問題,接著進入「大數
大數據服務許多企業都想導入,但當企業鑽研愈深,就會發現大數據並不簡單,特別是應用情境變化莫測。每秒20萬筆Request,明天可能就飆升到400萬筆。今天靠著批次處理就已足夠,明天卻需要做即時串流分析,才能滿足效能需求。面對類似的問題,企業常難以適時應變。
各種大數據應用場景,所需運算速度、儲存空間、處理技術都不同,企業實在無法一一追逐,此時公有雲服務就是很好的寄託。伊雲谷數位科技資深解決方案架構師江蕙芸指出,該公司代理的AWS(Amazon Web Services),因應各式各樣大數據應用,提供相當豐富的工具,包括用來處理資料轉換(ETL)的Amazon EMR,免伺
現今企業蒐集到的資料,多經由人工程序(如Key-in)產生,展望未來隨著物聯網、工業4.0之發展,分分秒秒都將湧入由機器產生的資料,且數量愈趨龐大,使資料來源益發繁雜,若企業未能建立有效混合不同資料,唯恐阻礙大數據分析應用進程。
日立數據系統(HDS)顧問陳建瑋指出,當前企業普遍存在兩個資料世界,一是以交易資料、客戶基本資料為主的結構化數據,企業通常運用現有ETL(萃取轉換載入)工具,將這些數據匯入資料倉儲,再進行商業分析,整段歷程耗時且辛苦。
另一世界是基於網路、社群媒體或地理位置的非結構化數據,企業往往利用現有工具,將數據整理後匯入NoSQL
不可諱言,論及大數據應用歷程,不管資料的讀取或寫入,都亟需良好的I/O效能支撐,一旦效能不彰,恐讓整體應用價值大打折扣;因此凡是欲推動大數據的企業,為了避免敗筆出現,都必須扎穩基本功,全力優化I/O效能。
但可惜的是,無論SAN或NAS等傳統儲存技術,皆有不短的發展歷史,憑藉早期設計的架構,能否因應Flash、雲端或大數據分析等不同新元素的加入,依然達到最佳化效率?確實值得商榷。
有鑑於此,創始於2008年的美商敏捷存儲系統(Nimble),便以消除儲存效能瓶頸為初衷,希冀藉由突破性技術發展成果,有效運用Flash特性,另搭配奠基於雲端的人工智慧分析
對經營百貨、量販零售、連鎖加盟店或電子商務的企業而言,不時面對為數龐大、忠誠度未必很高的顧客群,如何讓廣大顧客願意在自己的場域消費,甚至擴大消費規模,無疑是一門不得不做、卻不易做的苦功,故推動巨量資料加值應用的迫切性很高;但事實上,需要做大數據的行業不僅止於此。
英特內軟體專案二部經理潘慧君指出,以其深耕的團膳市場而論,同樣亟需實踐大數據。她說,幾年前英特內著眼食安事件不斷,於是植基於該公司Dream Maker開發工具,打造出貫穿農業生產、食品安全製造、冷鏈物流、營運管理、餐飲連鎖、食品安全雲等環節的「食品一條龍」解決方案。
爾後英特內拓展應用觸角
毋庸置疑,包括物聯網(IoT)、人工智慧(AI),都可謂當今顯學;深究它們之所以備受關注,在於不僅能解決諸多社會挑戰,更有助強化產業競爭力,終至實現一個安全且安心的價值社會。
台灣恩悌悌(NTT Taiwan)資深經理森一浩指出,NTT集團基於前述願景,近年持續加碼推動大數據,一方面發展IA(Intelligence Amplifier),旨在提升人類的能力,二方面發展AI,設法借助科技模擬人類的智力與思想,幫助人們解決更多問題。
針對AI,NTT已推出corevo平台,主要研究方向含括「助理(Agent)-AI」、「心動(Heart-Touchin
毋庸置疑,對於社群網站、內容創作平台,乃至其他型式網路服務業者而言,若能善用大數據,即可望擴增收益來源、提升作業效能、優化使用者體驗,重要性不言可喻。因此一向自許成為台灣「生活百科全書」的痞客邦(PIXNET),對大數據分析著力甚深。
痞客邦研發中總監林瑞男表示,PIXNET收集的大數據,涵蓋搜尋、瀏覽、分享、按讚、留言等網路行為資料,其將累積的大數據彙整、分析、歸納後,運用至站內系統的廣告推送、行銷活動、社群商務各種面向,致力創造出更好、更精準的服務。
林瑞男接著說,所謂社群行銷與大數據的關聯性,主要發生在4個關鍵項目,分別是族群輪廓、族群標籤、聲
社群媒體的興起,使訊息的傳遞更加無遠弗屆;此一發展態勢,對於從事公關或行銷工作的人,影響可謂重大,只因正所謂水能載舟、亦能覆舟,如果善用社群媒體,固然有助創造行銷價值,但相反的若是處理不當,唯恐造成公關危機,比方說近期包括某某求職交流平台、某某烘焙坊,以及某某連鎖咖啡店,都因而吃上大虧。
大數軟體公司執行長丘祐瑋指出,時值「後真相」時代,社群媒體是一個典型的同溫層,大家樂於在裡頭建立自己的世界,不同的世界,詮釋與解讀真相的角度都不一樣。你只要合乎他們的喜好,你就是網紅,但哪天你不慎惹怒他們,就可能發生公關危機;而且即使是再小的聲音,都可以讓危機在網路世界快速散佈。