巨量資料方案選項趨於多樣化 智慧應用 影音
Microchip Q1
DForum0515

巨量資料方案選項趨於多樣化

BI、儲存備份系統與DW 為三大熱門解決方案。
BI、儲存備份系統與DW 為三大熱門解決方案。

正所謂工欲善其事、必先利其器,企業用戶意欲獲取巨量資料所帶來的種種效益,少不得需要部署相關工具,尤其因應過去鮮少碰觸的非結構式資料,無法藉由現有的運算或分析系統加以處理,更需要思索引進全新的解決方案,並使之能鏈結到企業既有的應用系統,藉由新舊工具的並用,延展出整個巨量資料的構圖。

隨著巨量資料蔚為IT業界新顯學,想當然爾,一些與之相關的產品、解決方案或專業服務,自然接踵而至,令企業用戶目不暇給。

擁有逾400台PC者 對資料整合?ETL需求甚殷。

擁有逾400台PC者 對資料整合?ETL需求甚殷。

2013年IT預算逾千萬者 相對青睞Big Data Appliance。

2013年IT預算逾千萬者 相對青睞Big Data Appliance。

正因如此,DIGITIMES在費心推動2013年企業巨量資料應用調查活動的同時,自然需要納入諸如「下列與巨量資料相關的解決方案中,哪些是貴公司較具需求的項目?」題目,藉以探究現階段企業對於這些產品的接受意願。

BI、儲存備份系統與DW 為三大熱門解決方案
調查結果出爐,含括OLAP、Reporting與Data Mining在內的商業智慧(BI)分析軟體,由於扮演著巨量資料真正展現價值的最後一哩路,是有志投入相關應用的企業,不容或缺的工具,重要性不言可喻,因此一舉拿下37.9%票數而摘冠。

此外,巨量資料也是一種資料型態,既然是資料,自然需要搭配採用儲存或管理的載體,與這些目的相關的高效能儲存備份系統、資料倉儲,能見度亦隨之攀升,同樣成為票數逾3成的熱門選項;連帶的,環繞於儲存備份、資料倉儲等主軸的其他重要工具,包括資料歸檔軟體、資料整合/ETL軟體,雙雙挾兩成餘票數躋身前五名。

另一方面,綜觀2012年期間各大巨量資料研討會,Splunk現身頻率不低,算是鋒頭頗健,因而帶動了「IT搜尋引擎」的能見度,此次亦以近兩成獲票率取得不錯名次。深究IT搜尋引擎的奧妙之處,乃在於它強調不需要資料庫、不用事先萃取欄位、不需客製化連接器,便能立刻即時蒐集、應用與分析巨量資料,堪稱是用戶切入巨量資料殿堂的一大捷徑,自然容易產生莫大吸引力。

除了前述六大熱門解決方案外,此項調查所產生的第7名,則是Big Data Appliance,其得票率為15.9%。有部分用戶認為,過往IT人員最深沈的痛苦,即是遭到廠商的「綁架」或「挾持」,意即採用了專屬系統後,接著下來不管是升級或擴充,通通都得求助於原來的供應商,即使是裡頭一顆硬碟、一片I/O卡,都是廠商說了算,要求多少錢,用戶就只能乖乖支付,以往的大型主機如此,少部分資料倉儲系統,似乎也有這般特質,擺脫此一夢魘都來不及了,怎可能繼續遁入Appliance這個軟硬體一手包辦的封閉世界?但不可否認,巨量資料所涉及的處理技術,不論是Hadoop、MapRecuce、HDFS等種種環節,對多數企業來說,未免太過艱澀,要想深入理解它們、建構它們的難度真的太高,與其如此,倒不如取其折衷之道直接引進Big Data Appliance,確實不失為可行之計。

其餘得票率超過一成的解決方案選項,還包括了「Hadoop套件」的12.5%、「叢集系統管理軟體」的10.4%,以及「NoSQL資料庫」的10.3%。令人稍感詑異的,強調能滿足平行處理(Parallel Processing;MPP)需求的「欄位式資料庫」,由於相關產品多出自一線大廠,再加上此類產品放諸於整個巨量資料處理構面,也的確處在極其重要的戰略位置,因此稱得上是角逐巨量資料商機的「一級戰區」,無奈用戶可能尚未體察其重要性,僅給予9.2%還不到一成的支持度,亟待提升的空間依然不小。

擁有逾400台PC者 對資料整合?ETL需求甚殷
此時將巨量資料解決方案需求度之統計結果,搭配企業PC總台數條件進行交叉比對,藉以瞭解各規模層級的企業,備感興趣的產品是否一致。

結果顯示,座落在「<25台」區間的小型或微型企業,由於對Hadoop或MapReduce極為陌生,但也無力深入鑽研,所以最傾向套用直接打包好的套件(例如Cloudera的CDH),循化繁為簡的途徑來切入。但值得一提的,此群體成員自認對巨量資料應用需求較低,因此填答「都不需要」的比例達20%,算是不低的水準。

以Cloudera的CDH為例,即是將部署及維護Hadoop所需採用的一切工具,一次打包成為單一發行套件,俾使企業只消運用一張光碟,就可以快速安裝Hadoop平台,從而降低部署難度;然有業者提醒,Hadoop套件骨子裡仍是一大堆開放原始碼產物,這些軟體的研發步調,取決於原本的開發社群,而非套件供應商之手,萬一哪天原本的社群宣布放棄,套件供應商連同用戶都將陷於無以為繼的窘境,因此企業若須因應關鍵業務考量,凡事仍宜再三考慮。

其餘族群,需求標的大抵相似,都圍繞在商業智慧分析軟體、高效能儲存備份系統、資料倉儲、資料歸檔軟體等幾個選項;唯獨「≧401台」族群深知Hadoop與現存應用系統之間亟需整合,並視此為專案成敗的關鍵之一,因此對「資料整合/ETL軟體」選項投以相對較高的關注,否則一旦好不容易藉由MapRecuce或HDFS處理了巨量資料,卻無法鏈結到企業既有應用系統,無異只是新增了一個全新的Silo,任由活在封閉的Hadoop國度,其實沒有太大意義。

2013年IT預算逾千萬者 相對青睞Big Data Appliance
繼續針對巨量資料解決方案的需求度進行交叉分析,此處分析維度則轉向「2013年資訊預算」條件,藉以探究擁有不同IT預算規模的企業,最感興趣的產品或服為何。

經過統計,預算落在新台幣千萬元以下的企業,需求大致如出一轍,普遍都對在商業智慧分析軟體、高效能儲存備份系統、資料倉儲或資料歸檔軟體等熱門產品,投以較大的關注。

至於預算大於千萬的企業,除了對於資料整合/ETL軟體的需求更顯殷切外,也發現「≧5000萬」族群對於Big Data Appliance青睞有加,認為這般具備軟硬合一,且同時涵蓋運算、儲存甚至網路的整合裝置,即可降低自行建構Hadoop的繁瑣程度,快速接軌後端分析平台,坐收立竿見影之效。