歸檔工作要竟全功 先深入瞭解資料特徵 智慧應用 影音
DFORUM
Event

歸檔工作要竟全功 先深入瞭解資料特徵

  • 耿慧茹台北

前言:因為資料種類的不同,進行歸檔的作法與思維也大不相同,在此要詳細討論的是,歸檔解決方案,應用在不同資料上的差異,以及產業對於歸檔解決方案的需求。

或許有些人認為,廠商倡導資料歸檔的「企圖」,只是為了要販售更多的儲存空間,還有希望藉著客戶對更多儲存空間的採購,進一步採用自家所推出的歸檔軟體,這種「軟硬兼施」的方式,可讓客戶與廠商間,更加牢不可分。

企業進行郵件歸檔的原因

企業進行郵件歸檔的原因

郵件歸檔示意圖

郵件歸檔示意圖

資料庫歸檔示意圖

資料庫歸檔示意圖

但越來越多企業,願意買單導入,這代表企業資料儲存,的確面臨許多待解決的問題,透過解決方案篇的討論,讀者將更瞭解歸檔對不同資料的管理,所帶來的效益。

只要是能被存取的資料,一旦累積到一定的數量,就會需要進行歸檔的工作。而歸檔解決方案的種類,可以由資料性質來區分。一般來說,企業資料可分為結構式(Structured Data),如:各種應用程式底層的資料庫(Database);半結構式(Semi-structured Data),如:電子郵件(E-mail);以及非結構式(Unstructured Data),如:文書檔案、語音記錄、圖片、照片等。大致上來說,結構式資料的歸檔方式較為特殊;而半結構式、非結構式的檔案,歸檔方式是差不多的。

業界一般將歸檔區分為資料庫歸檔與檔案資料歸檔2種,依照資料種類,及歸檔工作的複雜程度,分別為:零散檔案(包括電子郵件)的歸檔,及主要應用系統(如:ERP、MES等)資料庫的歸檔。

資料庫歸檔要竟全功 考驗廠商領域知識的廣度與深度

針對應用系統及其下的資料庫歸檔,最主要的目的,就是為了提高系統的效能。主要應用系統的歸檔,其複雜度明顯較高。精誠資訊BCS事業部協理林孝祐指出,要對應用系統內的資料庫進行歸檔,必須先瞭解該系統的工作流程(workflow),再決定切分的方式,才不會發生歸檔完成後,資料讀取不到的情況。

至於哪些主要系統需要進行歸檔呢?在不同產業,需要進行歸檔的系統都不太一樣。一般來說,無分產業,企業最重要、工作最吃重,資料累積最快的系統,都是ERP,因此針對ERP的歸檔解決方案,也是最多的。

不過現階段在台灣,需要進行資料庫歸檔的企業,嚴格說來並不多。一方面是由於企業資料成長,還沒達到需要執行歸檔的門檻,另一方面,廠商的市場教育有限,許多企業對於歸檔的認知都還不太清楚。

此外,系統效能低落的問題,還可以透過硬體來改善。現在伺服器的處理效能越來越強大,在系統運作效率,因為快速成長的資料而下降時,許多企業都會優先考慮更新處理速度更快的伺服器主機、採購更大的資料庫,或者透過AP tuning、系統作業調校等方式來解決問題。

另一個讓企業對資料庫歸檔方案卻步的原因,在於資料庫歸檔的技術門檻較高,若協助導入的廠商,對該系統運作流程的知識掌握不足,歸檔就很有可能失敗,因此衡量起來,寧可先追加硬體,解決眼前的問題再說。林孝祐認為,改善硬體治標不治本,當公司業務量日趨繁重,線上系統的資料庫暴增到1個程度時,再怎麼調校硬體,將是徒勞無功。

因市場有限,企業規模普遍不大,因此現階段台灣大多數企業,都沒有對應用程式進行歸檔的急迫需求,但若是產業裡面居領導地位的企業,不妨開始思考要如何對陳年營運資料進行管裡的問題。

前進國際績效管理服務部解決方案事業處經理劉本淦指出,針對應用程式的歸檔,應該是越早進行越好,如果等到系統效能低落時,才去思考要如何切分資料庫,或如何劃分系統流程,所耗費的導入時間與顧問諮詢費用,都會大幅度成長。

檔案歸檔主要目的為方便資料查詢 先確立資料命名政策將事半功倍

現階段最常被歸檔的非結構式資料,就是電子郵件。這是由於現在,企業與客戶進行業務往來時,大量使用電子郵件,有必要建立1套易於查詢的管理機制,作為業務流程的完整記錄;此外,如Part 1所述,多項國際法規,對於企業電子郵件的保存,有較清楚的規定,這些都讓電子郵件的歸檔,更受到重視。

針對電子郵件的歸檔,提供解決方案的,多數是過去專門從事郵件管理的廠商(如:網擎資訊、中華數位科技),這些廠商挾其對電子郵件結構的瞭解,搭配硬體廠商的設備,推出整套的郵件歸檔解決方案,試圖吸引客戶的採用。

儘管許多企業導入郵件歸檔,都是為了因應各種法規,但網擎資訊行銷企畫張世鋒認為,企業歸檔的原則不需要完全按照法令規範來制訂,這是因為資料可能應用在各種用途上,包括:提供內部稽核使用,或用來提升顧客滿意度,甚至是未來公司進行知識管理的重要資源,因此企業應該結合IT部門、使用者部門的討論,共同制訂出公司郵件歸檔(或非結構資料歸檔)的大原則,再共同落實。

也有廠商針對一般檔案的歸檔,推出相關解決方案,如:EMC的Documentum Archiving Service,就提供以事件為主軸的歸檔方式。EMC資深產品行銷總監李百飛指出,舉凡企業會議、專案中所累積的文件、檔案、語音記錄、即時通訊記錄,都可透過該項服務,進行內容管理。當日後有必要調閱、稽核時,將節省相當的時間。

還有1種檔案歸檔,主要目的在於將歸檔後的資料,作更有價值的應用。例如:醫療影像、氣象圖片、衛星探勘記錄等,這些檔案所佔的空間很大,又常常需要被存取,廠商因此將描述這些圖片、檔案的元資料(Metadata),直接放入磁碟陣列中,方便資料的查詢,與後續空間的擴充,如:EMC的Centerra、Sun的ST 5800,及HDS的內容歸檔平台(Hitachi Content Archive Platform;HCAP),都是提供這類解決方案的產品。

非結構式資料的歸檔,與企業主要系統的運作流程無直接相關,只針對檔案本身,進行管理,因此專案進行起來,相對來說較為簡單,企業要注意的是,為每一筆資料,制訂好命名原則,然後確實按照此原則來進行儲存、備份、歸檔,這樣在日後應用搜尋引擎進行查詢時,就能事半功倍了。