NVIDIA B100/B200即將出貨 為何氣冷散熱仍為主流? 智慧應用 影音
英飛凌
IC975

NVIDIA B100/B200即將出貨 為何氣冷散熱仍為主流?

  • 李立達台北

因應NVIDIA B100/B200系列的氣冷散熱需求,伺服器機殼高度都拉升到8~10U。李建樑攝
因應NVIDIA B100/B200系列的氣冷散熱需求,伺服器機殼高度都拉升到8~10U。李建樑攝

伺服器供應鏈透露,NVIDIA的Blackwell系列晶片:B100、B200即將出貨,搭載該晶片的伺服器系統預計第3季中後期量產,值得關注的是,搭載2種晶片出貨的散熱系統,仍以3D VC的氣冷散熱為主。

然業者也表示,B200的散熱設計功率(TDP)高達1000瓦,已經是氣冷能夠解決的極限,接下來,液(水)冷散熱才有辦法解決更高瓦數,只是液(水)冷散熱的滲透比率,仍須視NVIDIA的GB系列銷售狀況而定。

NVIDIA最新的Blackwell系列AI伺服器何時出貨備受矚目,之前英業達於法說會時指出,將於年底或2025年初出貨,然廣達、鴻海都表示,搭載最新一代NVIDIA晶片伺服器將於2024年第3季出貨。

供應鏈指出,各家都按照自家客戶需求與量產行程推估出貨時間,不一致本屬正常,此外,各家並未說清楚到底出貨的是Blackwell系列何種產品,因為B100、B200與GB200的出貨時間並不相同。

供應鏈指出,預計第3季中下旬,搭載B100、B200的HGX系統將量產出貨,在經過整機測試後出貨,卡在晶片供應仍需時間ramp up,初期以小批量為主,至於GB200系列,量產時間將落在2025年。

供應鏈直言,目前GB200連板子都還沒看到,因此無法設計、測試相關機構件、系統等,預計要等到2025年。至於B100、B200量產出貨時間差不多,都在第3~4季。

伺服器供應鏈指出,目前搭載B100及B200晶片的AI伺服器散熱設計,仍會以3D VC的氣冷散熱為主。

有趣的是,B100、B200的TDP已經分別達到800及1000瓦,伺服器系統廠仍採用氣冷散熱。為何與散熱模組廠之前宣稱,500瓦以上已很難用氣冷散熱解決的說法不同?

系統業者解釋,若單純以散熱模組來看,晶片TDP到500瓦以上確實已經瀕臨氣冷散熱的極限,然當晶片置入主機板中,可透過主機板的系統設計,強化氣冷風流,解熱的能力,會比單純用模組散熱強。

然業者也表示,當晶片瓦數,如同B200,已經拉高至1,000瓦,用氣冷散熱已經是極限,主要原因是,氣冷散熱需要空間,尤其是3D VC,機殼的高度需要拉高到9U、甚至10U,已是極限。

目前主流的伺服器機櫃高度都在42U高度,除了伺服器,還需要置放網路交換器、電源供應器、防火牆,並考慮散熱空間等,伺服器機殼高度提高,意味能放置的伺服器數量變少,也擠壓其他零組件空間。

此次COMPUTEX 2024各家伺服器廠攤位展出的機種,已經可看到此趨勢,因應NVIDIA的B100及B200晶片,各家推出的MGX產品設計,都採氣冷及高U數設計。

舉例來說,美超微(Supermicro)在COMPUTEX展出的B100 HGX系統,採用8U氣冷方案、B200是採用10U氣冷方案。雲達展出的HGX系統,分別有5U、7U與9U,其中B200搭配的是9U高度伺服器。

伺服器供應鏈指出,液(水)冷散熱的解熱瓦數,勢必高於氣冷散熱,在NVIDIA掀開散熱的天花板後,晶片散熱需求只會往上拉升,然技術導入也須考量現實,而資料中心現實狀況是氣冷仍為主流。

除非新建的資料中心,會考慮後續晶片升級後的散熱需求,改採水(液)冷設計,包括樓板高度、承重到水管都須重新調整,否則現有資料中心都會盡量採用氣冷散熱解決。

此外,有多少資料中心需要導入最高效的AI晶片?業界指出,除了AI中的訓練(training)需耗費大量運算,才需採用最高效能的AI晶片,多數資料中心其實不需如此,自然也尚不需導入液(水)冷。


責任編輯:陳奭璁