NVIDIA推出Mellanox 400G InfiniBand 智慧應用 影音
EVmember
DForum0515

NVIDIA推出Mellanox 400G InfiniBand

  • 賴品如台北

NVIDIA Mellanox NDR 400G InfiniBand 產品系列。
NVIDIA Mellanox NDR 400G InfiniBand 產品系列。

NVIDIA(輝達)於SC20大會上,宣布推出NVIDIA Mellanox 400G InfiniBand,這是400Gb/s網速的端到端網路解決方案,可為全球的人工智慧(AI)和高效能運算用戶提供最快的網路互連效能,同時成功將運算、可程式化和軟體定義三種技術結合,成為軟體定義、硬體加速的可程式設計網路,為全球的研究人員和工程人員設計新一代運算系統,並針對應用效能的提升提供了新的思維。

NVIDIA Mellanox InfiniBand NDR產品是第7代的InfiniBand產品,利用100Gb/s的PAM4 Serdes技術,實現了較前一代產品兩倍提升的400Gb/s單埠傳輸頻寬,同時透過增加更多、更快的加速引擎,實現了更強大的運算和通訊能力。

「Speed of Light」是關於NDR InfiniBand技術的第一個特徵,透過加倍的頻寬、更快的訊息率,讓基於RDMA、GPU Direct RDMA和GPU Direct Storage等先進通訊技術的應用效能得到了進一步的提升。InfiniBand網路是自然的SDN網路,可以讓使用者根據應用的屬性來選擇各種不同的網路拓撲,以達到最優化的效能,如Fat-Tree、DragonFly+、各種Torus等。

例如,透過DragonFly+網路拓撲可以同時在四個交換器Hop內達到一百萬個節點間的同時通訊,這個規模遠遠超出了 E級超算 、甚至10 E 級超算或百E級超算需要的規模;同時其自然的SDN屬性也讓動態路由和網路壅塞控制變得更容易。

InfiniBand動態路由已被廣泛地應用到各種網路拓撲中,成為優化通訊效能的關鍵角色,如美國橡樹嶺國家實驗室的Summit超級電腦就透過動態路由將超級電腦中心全網的通訊效率從60%提升到了96%。NDR InfiniBand交換器在1U空間內可以支援64個400Gb/s的埠或128個200Gb/s的埠,提供較上一代交換器3倍的埠密度;它還將交換器系統的聚合雙向吞吐量提高5倍,達到每秒1.64 petabits,是埠數最多、交換容量最大的交換器。

InfiniBand安全卸載是針對Cloud Native的應用場景,InfiniBand已取得Open Stack的官方軟體支援,透過自帶的硬體IPSec、TLS、AES、Root of Trust等功能,讓資料不論是在網路中移動時,還是在向儲存中落盤時都能以線速效能取得並解密,實現在虛擬化環境或容器化環境中的安全保障。

軟體可程式設計讓InfiniBand的應用場景得到了進一步的延伸,可程式化的NDR InfiniBand不僅可以讓使用者處理資料的標頭,還可以針對資料的路徑進行操作,例如使用者可以自訂規則並對資料路徑進行操作,或是讓資料無需送到CPU便可直接在網路中進行預處理。使用者還可以針對資料的通訊特徵進行提取,接著利用AI技術進行訓練,得到不同應用資料的通用通訊特徵,若發現有異常通訊資訊,則可以向管理員主動發出預警。

NVIDIA網路事業部門資深副總裁Gilad Shainer表示,對人工智慧客戶而言,最重要的工作是應對越來越複雜的應用,它們都需要更快、更聰明且更具擴充性的網路。NVIDIA Mellanox 400G InfiniBand的巨大吞吐量與智慧加速引擎,讓高效能運算、人工智慧與超大規模雲端基礎架構可以透過更低的成本與複雜性,達成無與倫比的效能。

Exascale等級的AI和高效能運算時代已經來臨,同時也帶來新的挑戰。由軟體定義、硬體加速、針對網路運算的可程式設計NDR InfiniBand產品將於2021年第2季推出樣本。NDR產品的出現,將會大幅提升Exascale等級的AI和高效能運算系統的效能和效率,並簡化系統的管理和操作、降低系統的總擁有成本,進而保護資料中心的投資。


關鍵字