剖析大數據失利癥結 重整旗鼓找回核心價值
近幾年多數人應該都曾聽聞類似話語,每10分鐘,全球就產生近1.4億封電子郵件、266萬次Google搜尋、逾500萬次Youtube影片點閱、1.1萬張相片上傳至Flickr…等等,日復一日,累積的數據部位自然龐大,正是支撐巨量資料分析概念的主要理由;然而,要做好這件事,其實並不容易。
隨著市場變遷速度加劇,再加上市場競爭態勢趨於激烈,使得多數企業的經營高層有所頓悟,深知意欲在混戰局面上脫穎勝出,絕對不宜繼續憑藉經驗、感覺甚至猜測來制定商業決策,而必須紮紮實實地靠數字來說話,只不過,可能潛藏商業決勝因子的資訊,不僅見諸於結構化資料,有更多部分存在於非結構化資料,單憑現有技術或系統架構,並不足以在合理時間內對此進行儲存、運算、處理,也難以有效分效出可以解讀的資訊,故而驅使企業投入大數據分析。
換言之,靠著大數據,企業可望從中探索一些未知相關性(Unknown Correlation)、市場趨勢,抑或未顯露的模式(Hidden Patterns)的知識應用,進而加以發現、挖掘,為營運創新增添豐沛動能。
早在2001年,Gartner的分析師Doug Laney,即發表了一篇名為「3D Data Management: Controlling Data Volume, Velocity, and Variety」文章,清楚點出三個有關於資料處理的主要挑戰,分別是資料量、速度與多樣性;時隔十多年,當時的立論依然適用,且據此形成了大數據的3V特性。
當然,日後又有不同人士,意圖加入真實性(Veracity)、波動性(Volatility)、價值(Value)、有效性(Validity)…等等更多的「V」,以期詮釋與解讀大數據,而且聽來都言之成理。無論有多少個V,哪怕只有最初始的三個最基本元素,都意謂大數據相當難搞,所以企業必須引進相關技術方案,藉此突破種種難關,實現大數據分析願景。
五大技術方案 助企業練就大數據功力
這些技術方案是什麼?總括來說,可區分為五大類型,由底層而上,依序是資料倉儲或資料庫系統(含關聯式資料庫、NoSQL資料庫)、資料管理工具、資料整合工具(含ETL、MDM)、商業智慧(BI)工具,以及位居最上層的先進分析軟體,若依市場產值而論,則以先進分析軟體、BI、資料倉儲/資料庫三者相對較大,各個都有逾130億美元的實力。
其中先進分析軟體意指資料探勘(Data Mining)、文字探勘(Text Mining)與預測性建模等加值型技術方案,乃是賴以展現數據價值的最終依歸,年複合增長率尤其可觀。
著眼於大數據分析效益無窮,近年來諸多企業也紛紛導入上列解決方案,開始執行資料挖掘分析;然而據業者統計,發現雖然有高達六成以上比重的企業,已經投入程度不一的巨量資料分析動作,可惜真正能夠萃取價值者,卻僅有兩成五不到,換言之,有超過一半自認已經推動巨量資料分析的企業,並未因此而受益,幾乎形同白忙一場,充其量也只是花了大把鈔票,做到解讀當下營運現狀的程度。
為何如此多數企業事與願違?業者分析箇中癥結如下:首先,許多企業所採用的技術頗為過時,無法支撐所有型態的資料分析需求,更不足以應付不可預期的分析作業負載,當務之急需要引進更為有效的資料管理與整合技術。其次,常見的應用場景是,企業內部不同單位各做各的分析,導致形成一個個孤島(Silo),以如此片段的分析成果而論,根本無從釐清不同部門之間交互作用,自然不足以幫助最高決策主管綜觀全局,做出最為完善的商業決策。
第三,多數企業的IT與業務單位之間,彼此缺乏有效連結(Alignment),以致IT費心協助推動各項分析活動,卻始終無法與公司商業目標掛鉤。
補強大數據價值鏈 避免淪落解讀現狀之低層次
總結來說,一個真正有效的大數據價值鏈,從無到有,必須歷經資料的蒐集、整合、正規化、分析直至最終的可視化等五個不同里程碑,倘若企業肇因於上述癥結,使得最終分析成果淪於營運現狀的解讀,等同於只完了前三項里程碑,投資報酬率當然未盡理想。
業者建議,如果企業為前述現象所困擾,理應儘速審視自我的資料分析架構,是否具備五個完整層次,依序是資料蒐集與基本分析、資料整合、商業報表與分析、預測性分析(Predictive Analytics),乃至最上層的時效性分析(Prescriptive Analytics),一旦備妥這些必要機制,即可掌握要領知悉「已經發生何事」、「為何會發生此事」、「應針對此事採取哪些行動方案」、「預測未來可能還會發生哪些事件」、「有效管理與控制未來事件的發展脈絡」,一步步實現大數據分析的最高價值。
具體來說,藉助良好的大數據分析機制,企業不難精準掌握對其貢獻度較高的顧客群為何,接著妥善運用跨部門資源,想方設法促使這些目標客戶群,持續對公司產生高盈利貢獻而不墜,更有甚者,還能巧妙融會貫通所有的內外部數據,預測這些目標客戶群的下一步需求為何,最終依據這些需求擬定極具誘因的行銷方案,誘使客戶買單,對公司挹注更高的貢獻。
IT與營運部門協同分析預測 為企業開創最高價值
有鑑於此,已有供應商瞄準大數據價值所應具備的資料蒐集、整合、正規化、分析、可視化等五個完整構面,進行產品佈局。以戴爾(Dell)為例,即以「與平台或數據無關」為訴求,推出一系列模組化方案,包括藉由Toad執行資料管理功能,Boomi滿足內外部資料交換需求,Toad Intelligence Central(TIC)進行商業智慧分析,Statistica負責執行先進分析,而最終分析成果,不僅可藉助多元化圖表類型與文字描述而營造高度可視性,還可進一步回饋到Marketo自動化行銷、或Salesforce客戶關係管理等系統工具,確使企業商業決策可立即被付諸實現。
前述模組化方案,皆可適用於Oracle、SQL Server、Hadoop、MongoDB或IBM DB2等不同平台,換言之,企業不論採用何種資料管理系統,都能夠利用Toad執行深度監控,持續剖析並診斷其效能瓶頸,確保資料庫恆常維持最佳運作狀態。
值得一提的,透過Statistica先進分析工具,有助於企業推動預測性建模,且不只是把數據模型建好、再被動等待結果是否印證,而是將此數據模型部署到企業的真實營運流程,以便於適時發揮預警功效;而Statistica經由多次改版,於去年(2015)第四季推出第13版,標榜加強支援在大數據先進分析領域相當火紅的R語言,故而能順勢承接運用由不同領域專家透過R語言所催生的各式分析套件,此外也支援多項資料應用功能,讓企業可植基於假設性的情境模擬,預先洞見各種商業決策的可能性。
當然不可諱言,根據前已述及的各種大數據分析失敗原因,有一項重大項目,即是企業IT與業務單位無法緊密鏈結,以致各項看來神奇的資料探勘分析成果,始終無法契合企業的營運規則或目標,讓分析成果淪為漂亮的摘要報告,不具備高價值,之所以出現這個失望結局,固然與技術方案是否完整到位不無關聯,但卻非壓垮駱駝的關鍵稻草。
在此前提下,企業意欲在大數據分析方面締造最佳成效,引進完備的技術工具還不夠,仍應設法促使IT與營運部門齊力進行協同分析預測,若有必要,甚至不排除引進外部專業顧問來促成此事,只因為唯有如此,企業才能真正練就雄厚功力,繼而成為當今「以數據為導向」的新經濟時代贏家。