賽靈思加速器卡專為高效能運算和大數據作業負載而打造 智慧應用 影音
AIEXPO2024
Event

賽靈思加速器卡專為高效能運算和大數據作業負載而打造

  • 賴品如台北

賽靈思全新加速器卡Alveo U55C。賽靈思
賽靈思全新加速器卡Alveo U55C。賽靈思

賽靈思在Super Computing 2021(SC21)大會宣布推出Alveo U55C資料中心加速器卡,和一款基於標準、由API驅動的叢集解決方案,以用於大規模部署FPGA。Alveo U55C加速器卡可以為高效能運算(HPC)和資料庫作業負載提供卓越的單位功耗效能,並透過Xilinx HPC叢集解決方案輕鬆擴展。

全新的Alveo U55C加速器卡是專為HPC和大數據作業負載而打造,也是賽靈思有史以來最強大的Alveo加速器卡,運算密度和HBM容量是Alveo加速器產品組合中最高的一款產品。運行大規模運算作業負載的客戶可受惠於這款結合賽靈思基於RoCE v2的全新叢集解決方案,並在其現有的資料中心基礎設施和網路,運行採用FPGA的強大HPC叢集。

賽靈思執行副總裁暨資料中心事業部總經理Salil Raje表示:「將Alveo的運算能力擴展至HPC作業負載變得比以往更加簡單、高效且強大。在架構上,像Alveo卡一般的FPGA加速器,能以最低成本為許多運算密集型的作業負載提供最高效能。我們透過導入基於標準的做法,使客戶能在現有的基礎設施和網路上打造Alveo HPC叢集。藉由此方法,我們將這些優勢大規模地應用在所有的資料中心,是Alveo和自行調適運算在資料中心領域能更廣泛應用的重大進展。」

為HPC和大數據應用而打造

Alveo U55C卡結合了目前HPC作業負載所需的許多關鍵特性,能提供更高的資料平行處理能力、卓越的記憶體管理、優化的資料遷移處理流程,以及在Alveo產品組合中最出色的單位功耗效能。Alveo U55C卡為單槽全高半長(FHHL)外形,最大功耗僅150瓦。

與前一代的雙槽Alveo U280相比,Alveo U55C提供更優異的運算密度,還將HBM2容量翻倍至16GB。Alveo U55C以更小的外形尺寸提供更強的運算力,有助於建構以Alveo加速器為基礎的密集叢集。它專為如大數據分析和AI應用等需要擴展效能的高密度串流數據、高I/O數學運算和大型運算難題而打造。

利用RoCE v2和資料中心銜接並結合200 Gbps頻寬,這款API驅動的叢集解決方案使Alveo網路在效能和延遲方面得以媲美InfiniBand網路,且無須限制特定供應商。MPI整合功能使HPC開發者可以從賽靈思Vitis統一軟體平台擴展Alveo資料處理。無論是伺服器平台或是網路基礎架構,都能夠運用現有的開源標準和架構,橫跨數百張Alveo卡進行效能擴展並共享作業負載和記憶體。

軟體開發者和資料科學家可以運用Vitis平台對應用程式和叢集的高階編程能力,實現Alveo和自行調適運算的優勢。賽靈思大力投入Vitis開發平台和工具,讓不具備硬體專業知識的軟體開發者和資料科學家得以更輕鬆地使用自行調適運算。

Vitis平台支援PyTorch和TensorFlow等主流AI架構,以及C、C++和Python等高階程式語言,使開發者能利用特定API和函式庫打造領域解決方案,或利用賽靈思軟體開發套件在資料中心內輕鬆加速關鍵HPC作業負載。

HPC客戶使用案例

澳洲聯邦科學與工業組織(CSIRO)擁有全球最大的無線電天文天線陣列。CSIRO利用Alveo U55C卡處理其平方公里陣列(Square Kilometer Array)無線電望遠鏡中的訊號。

將Alveo卡部署為具備HBM的網路連接加速器,能為HPC訊號處理叢集提供大規模的傳輸量。以Alveo加速器為基礎的叢集讓CSIRO能夠處理龐大的運算任務,例如將來自13.1萬個天線的即時資料聚合、過濾、準備和處理。

420張Alveo U55C卡由支援P4的100Gbs交換器達到完全連線,可為訊號處理叢集提供460GB的HBM2頻寬。Alveo U55C叢集的處理效能可達每秒15Tb的總傳輸量,功耗更低且更具成本效益。CSIRO現正完成Alveo參考設計,以幫助其他無線電天文學或相關產業取得成功。

全球幾乎所有的汽車公司都採用Ansys LS-DYNA的碰撞模擬軟體。安全性和結構系統設計往往取決於模型效能,因其能透過電腦輔助設計有限元素法(FEM)的模擬技術來降低物理碰撞測試的成本。

FEM求解器是驅動具備數億自由度模擬的主要演算法,而這些龐大的演算法可以分解為像是PCG、稀疏矩陣、ICCG等更基礎的求解器。與x86 CPU相比,LS-DYNA利用超平行資料處理在大量Alveo卡進行效能擴展,可提高5倍以上的效能。

如此一來,就能在Alveo資料處理中提升每個時脈週期的工作效率,讓LS-DYNA客戶受益於突破性的模擬時程。

Ansys戰略合作夥伴總監Wim Slagter表示:「秉持創新不懈的精神,我們很高興能與賽靈思合作,在我們的LS-DYNA模擬應用中大幅加速有限元素求解器,顯現出隱式有限元素法90%的運算負載特性。我們期待透過賽靈思加速的助力,實現產業創新者未來在設計與開發的使命。」

頂尖的圖分析平台供應商TigerGraph使用多張Alveo U55C卡,為兩種最高效能演算法進行叢集和加速,驅動以圖為基礎的推薦和叢集引擎。對於資料科學家來說,圖資料庫是一個顛覆性的平台。圖從資料孤島中蒐集資料,並聚焦於資料間的關係。圖領域的下一個突破是能即時找到這些答案。

Alveo U55C將推薦引擎的查詢和預測時間從數分鐘縮短至數毫秒。與以CPU為基礎的叢集相比,使用多張U55C卡來擴展分析,出色的運算力和記憶體頻寬可將圖查詢速度提升高達45倍,品質評分也提升高達35%,從而大幅提升可信度,也能將誤報率降至個位數。