備齊SOP/EOP/MOP文件與DCIM系統 建立完整維運管理機制 智慧應用 影音
MongoDB
Event

備齊SOP/EOP/MOP文件與DCIM系統 建立完整維運管理機制

  • DIGITIMES企劃

透過SOP,任何設備從現場開關一路到負載端的過程,如何按部就班執行操作,皆有明確的指引。
透過SOP,任何設備從現場開關一路到負載端的過程,如何按部就班執行操作,皆有明確的指引。

目前擔任台達電子資通訊基礎設施事業群關鍵基礎架構事業部台灣區業務部經理的林士基,亦是台灣智慧能源產業協會(TaiSEIA)理事長,在協會成員共同努力下,一方面讓TaiSEIA 101標準(智慧家庭之裝置互連協定)成為國家標準,二方面亦對綠色機房議題著力甚深,幾年前推出機房建置指引書,下一步將力推OM Ready(Operations & Maintenance Ready)理念,讓用戶在面對每項機房系統與設備時,都清楚如何實施維護與保養。

林士基指出,OM Ready為維運無縫接軌之意,不僅設計端基於機房永續維運之目標而執行設計規劃,施工階段亦須基於相同的永續維運目標,執行諸多事務,例如設備何時進場、性能測試結果如何,相關資料都應該備齊,做為日後維護保養的重要依據。

台達電子資通訊基礎設施事業群關鍵基礎架構事業部台灣區業務部經理林士基認為,藉由落實OM Ready,有助於設備商提升專案管理實力,清楚掌控交期、開機、調試、系統整合測試、文件產出乃至用戶抽測等完整步驟,某種程度已逐步取代工程公司的功能。

台達電子資通訊基礎設施事業群關鍵基礎架構事業部台灣區業務部經理林士基認為,藉由落實OM Ready,有助於設備商提升專案管理實力,清楚掌控交期、開機、調試、系統整合測試、文件產出乃至用戶抽測等完整步驟,某種程度已逐步取代工程公司的功能。

儘管設備已通過廠驗與單機測試,初步確認性能與可用性並無問題,但當設備運抵現場並完成安裝後,仍需執行功能測試、整體性能測試、確效驗證等後續驗測程序。

儘管設備已通過廠驗與單機測試,初步確認性能與可用性並無問題,但當設備運抵現場並完成安裝後,仍需執行功能測試、整體性能測試、確效驗證等後續驗測程序。

設備性能測試,有助企業提升機房維運軟實力

就機房設備供應商角度來說,首先必須將廠驗(FAT)、單機測試(SAT)、功能測試(FPT)、整體性能測試(IST)、確效驗證(VMP)等等所有該執行的測試程序做好做滿,這點非常重要。以FPT為例,也許不少人認為既然做過FAT與SAT,便已充分證明設備確實可用,為何多此一舉執行FPT測試?但每個用戶環境不一,且設備在安裝、運送的過程也難保沒有閃失,故有必要在現場安裝好設備之後,接著將負載送上來,按用戶端的實際狀況執行操作,實地測試設備性能是否如同當初的設計要求。

以空調箱溫濕度控制系統來說,往往在歷經一段時間過後,泵浦(Pump)電流值就可能偏離當初預設水準,如果不經測試,就會讓這個誤差持續存在,對於日後機房維運產生不利影響。過去用戶鮮少要求廠商執行相關測試,然而隨著OM Ready的推廣,期望促使這些測試成為機房施工階段的必經程序,只因這些測試對於用戶端負責系統維運的操作工程師非常重要,蘊含諸多無形價值,做過幾次測試、累積Template文件後,就會更了解系統操作流程,繼而提升軟實力,更懂得如何善加處理機房維運事宜。

除了測試外,設備供應商另有重責大任,需要負責產出標準作業程序書(SOP)、緊急作業程序書(EOP),以及維運作業程序書(MOP)。林士基進一步說明,這些作業程序書對用戶極其重要,有了SOP,便可清楚掌握設備從現場開關一路到負載端的明確操作流程;有了MOP,即知道該如何針對設備做檢查、清潔保養;有了EOP,在面對設備異常時就不會驚慌失措,也不會一味只想著致電廠商求救,多數情況下只要根據設備的燈號狀態,就能從EOP文件中按圖索驥,找出問題癥結點,然後自行予以排除,如果問題較為嚴重,也可在與廠商技術人員電話溝通的過程中,明確告知問題狀態,俾使技術人員一到現場便能以最快速度直接排除錯誤,而非費時查找故障原因。

憑藉維運管理手冊,第一天便可上手營運

值得一提的,前述SOP、MOP及EOP等文件,並非任由個別設備商各寫各的,而是需要由專案的系統整合商或統包商加以整合,連同資產管理DCIM、環控監控BMS等系統,一併納入機房永續維運管理機制,務求讓機房維運人員能一目瞭然,在第一天便可輕鬆上手營運。

舉例來說,不斷電系統(UPS)必須接到配電盤,而配電盤還會往上串接發電機,若僅由UPS、配電盤、發電機各自產出文件,彼此間缺乏統合、串聯與對應,那麼用戶就算看完三份文件,可能仍舊摸不著頭緒;但如果藉助一套完整維運管理手冊,舉凡發電機、配電盤、UPS乃至配電工程等不同環節的文件都會加以整合,當用戶遭逢機房電力問題時,就比較容易探查是哪個環節出狀況,也知道如何按照預設的標準步驟來排除故障。

綜觀現今一些較符合OM Ready精神的建置案,台達電子參與的頻率不低,但因應不同個案可能扮演不同角色,有時提供整套基礎設施,有時僅提供DCIM(Data center infrastructure management);而DCIM肩負設備資產管理任務,所有攸關設備進場、安裝、效能測試等等資料皆由DCIM系統掌控,重要性不言而喻,機房設備總有來來去去,有些新設備需要被納管,有些舊設備若發生異常則需要做告警排除或產出維修工單,凡此種種,過往用戶都會急Call廠商協助解決,今後即可透過維運管理手冊,幫助用戶練就DCIM自主管理能力。