勤誠震撼亮相2024 OCP峰會 展示DC-MHS與MGX模組化伺服器方案
每年秋季在美國加州聖荷西舉行的OCP全球峰會(OCP Global Summit)是全球開放運算社群的一大盛會,聚集了業界領袖、研究人員及先鋒共同探討OCP專案的最新進展,分享未來挑戰與創新機遇。今年的2024 OCP全球峰會於10月15日至17日舉行,主題為「從創意到影響力」,強調OCP在加速回應新興趨勢與市場需求上的創新承諾,推動資料中心產業的開放性、效率、可持續性與擴展性。
實際走訪OCP峰會現場,不難發現各家業者無不積極大秀實力,現場展出最新伺服器方案,身為全球伺服器機殼領導廠商,勤誠興業於本次OCP峰會中展示基於OCP DC-MHS架構的最新一代伺服器方案,並推出基於NVIDIA MGX架構的AI伺服器機殼產品,現場更可在不同展位看到勤誠的與不同系統廠及品牌廠合作開發的新產品,勤誠積極助力客戶加速新世代產品的研發與上市,搶佔市場先機。
前進OCP Summit,展示新世代伺服器方案
勤誠全球研發及產品開發處協理張鵬程表示,OCP(Open Compute Project)是由Meta(當時為Facebook)、Intel、Rackspace和Goldman Sachs於2011年共同創立的非營利組織,旨在推動開放式資料中心硬體架構,為會員及業界推廣產品設計和實務應用。
OCP最初的目的是為內容或應用服務的雲服務提供商(CSP)提供即用的硬體解決方案,當時Meta受益最多。由於其龐大的需求,OCP逐漸發展成一個強大的社群組織,對整個IT產業產生了深遠影響。像OCP的I/O模組規範和OAM架構等技術已被廣泛認可和採用,例如OCP I/O模組已成為資料中心的標準,NVIDIA的HGX與OAM架構相輔相成。其他CSP如AWS、微軟和Oracle雖未完全採用OCP架構,但也參考了相關規範,催生了許多「OCP Like」產品。
張鵬程認為,隨著標準OCP產品及OCP類產品的發展,OCP已成為全球最具影響力的標準行業組織之一,涵蓋了從上游的IC公司如Intel、AMD、NVIDIA,到中游的CSP、ODM/SI業者,再到下游的零組件供應商。這也是勤誠2024年決定參加OCP盛會的重要考量之一。過去,勤誠主要協助客戶參展及產品展示,而今年則希望透過此盛會積極成為行業中的關鍵角色,因此,除了在OCP峰會上展示了新一代伺服器機殼解決方案外,勤誠也在評估加入OCP委員會,以期為IT產業做出更大的貢獻。
DC-MHS與MGX,融匯於OCP生態圈
DC-MHS(資料中心模組化硬體系統)是勤誠在此次展會的核心展示技術之一。此技術的目標是制定開放規範,構建一個具有彈性和可擴展性的生態系統,以應對現代資料中心日益增長的運算、傳輸及儲存需求。DC-MHS的發展歷程可以追溯到早期的ATX和SSI標準,其目標是在更高效的硬體環境中滿足資料中心的通用需求。
自2010年以來,SSI 規範逐漸無法滿足高效能資料中心的需求,業界開始轉向各種專有規格。然而,隨著需求的集中化,越來越多的企業選擇聚焦於開放標準。最終,DC-MHS的初步框架於2020年確立。
勤誠與Intel合作開發了首個DC-MHS概念驗證平台,並與眾多的ODM和SI業者合作,推出了多款基於該平台的通用運算產品。隨後,AMD也加入了DC-MHS生態系,Dell和HPE的加入更進一步加速了標準的發展和普及。
DC-MHS與OCP(開放計算專案)標準的結合進一步推動了其發展,使雲服務提供商(CSP)的需求得以納入,最終促成了OCP新標準SDNO的誕生。勤誠現已全面支援SDNO,並與主要的IC公司、OEM廠商及系統整合商密切合作,推動這一新標準的普及和發展。
此外,勤誠針對AI應用的MGX產品也與OCP SDNO標準緊密相關,與DC-MHS形成互補。無論是DC-MHS還是MGX,雙方都在不斷加強與OCP的聯繫,依託這一生態平台,推動資料中心解決方案的多樣化發展。
「雖然各企業的起點不同,但面對的挑戰和問題卻有許多共通之處,因此解決方案之間存在相似性。」張鵬程表示,「這些共通點能夠整合為行業共識,進而形成標準化的解決方案。這就是為什麼現在正是最佳時機,我們需要更加積極地推廣基於DC-MHS和MGX平台的關鍵產品,提升市場認知,讓這些產品觸及更多潛在客戶。」
擁抱好的架構,健康有序迎向可預見未來
DC-MHS 的發展由兩大規格支撐,分別是FLW和DNO。FLW主要針對雙插槽(Dual Socket)規格,專為滿足高效能運算需求設計;而DNO則偏向單插槽(Single Socket)設計,目標是支持主流應用,尤其是在多I/O應用場景下發揮更大作用。
後續推出的SDNO繼承了FLW和DNO的架構,並進一步加入了更多雲服務供應商(CSP)的需求,預留了更多靈活性。從DC-MHS到SDNO,兩者在設計理念和規格上保持高度的互通性。例如,許多知名品牌的 1U及2U通用伺服器產品,大多基於 FLW 架構,並發展出「Dual Socket + 32 DIMMs」的高性能配置。相較於FLW,DNO的尺寸約為其一半,但在此空間中為更多I/O配置提供了支持,特別適合GPU應用場景。
以 NVIDIA MGX 架構為例,最新的產品 GB200 就是基於 DNO 架構設計。MGX 為 CSP 客戶提供 1U及2U 尺寸的伺服器應用,如年初推出的 NVL72 將 1U Compute Tray部署在單一機櫃中,最多可承載 72 個 B200 晶片。NVL36 則為 2U Compute Tray應用的延伸。在企業應用方面,MGX 提供的 2U 獨立機型可支持傳統的 PCIe GPU 卡,最多可配置四張 GPU 卡,並支持氣冷散熱。此外,MGX 也提供 4U 機型,能承載 8 到 16 張 PCIe GPU 卡,同時支持氣冷或液冷散熱。MGX 的產品組合涵蓋了從密度要求較高的 1U 到2U 和 4U 產品,有氣冷或液冷的不同散熱模式,可應對不同的應用需求。
張鵬程強調,無論是 DC-MHS 還是 MGX,都是一種架構(Architecture)。勤誠正在基於這些架構建設生態系統,這些架構為不同的應用場景提供支撐。正是有了這些架構與標準,整個業界才能在共同的規範下健康、有序地發展應用。勤誠今年特別由執行長陳亞男親自領軍帶隊參加OCP峰會,勤誠計劃與上下游合作夥伴共同發展這些生態系,從而為終端客戶提供更好的服務,並引領未來的技術方向。