AMD發佈Radeon Instinct加速推機器智慧
AMD發表新策略,在伺服器運算中以全新硬體與開源軟體方案,加速機器智慧新時代,其設計大幅提升效能與效率,並更易於深度學習工作負載的執行。
全新Radeon Instinct加速器將為客戶提供強大且基於GPU的解決方案以執行深度學習推論與訓練工作。除了新推出的硬體方案,AMD同時發表MIOpen,乃針對GPU加速器設計的免費開源函式庫,協助執行高效能機器智慧方案。另外還推出以AMD ROCm軟體為基礎的全新優化深度學習框架,為機器智慧工作負載的演進奠定基礎。
平價的高容量儲存、大量的感應驅動資料以及飛快增長的使用者產生的內容,在全球各地產生以Exabytes計的資料。近期在機器智慧演算法與高效能GPU獲得諸多進展,使處理與解讀資料的程度得到數個量級的提升,幾乎能即時產生資料洞察。Radeon Instinct為機器智慧打造開放軟體產業體系的藍圖,協助加速洞察推論與演算法訓練。
AMD總裁暨執行長蘇姿丰博士表示,Radeon Instinct設計旨在於MIOpen與ROCm內的高效能GPU加速器與免費開源軟體大幅加快機器智慧的發展速度。結合高效能運算與繪圖功能以及跨世代產品藍圖,AMD為業界唯一擁有GPU與x86矽專業技術的公司,不僅能滿足資料中心種類廣泛的需求,還能協助推動機器智慧的多元發展。
在上週舉行的AMD技術高峰會上,來自1026間實驗室、Inventec、SuperMicro、加拿大多倫多大學氫強度映射實驗(CHIME)無線電望遠鏡計劃,以及Xilinx的客戶與夥伴均讚賞Radeon Instinct的推出,探討如何使用AMD的機器智慧與深度學習技術,以及如何從Radeon Instinct中獲益。
Radeon Instinct加速器特性包含被動式冷卻、符合單根I/O虛擬化技術(SR-IOV)業界標準的AMD多重GPU硬體虛擬化技術,以及針對多重GPU點對點支援的64-bit PCle龐大基址寄存器支援。
Radeon Instinct加速器設計以支援廣泛的機器智慧應用程式
Radeon Instinct MI6加速器基於廣受推崇的Polaris GPU架構,這款被動式冷卻推論加速器針對作業?時間?焦耳進行最佳化,FP16效能在150瓦的板卡功耗與16GB的GPU記憶體下,能達到5.7 TFLOPS的尖峰值。
Radeon Instinct MI8加速器運用高效能低功耗的「Fiji」Nano GPU,為一款微型異質化高效能運算與推論加速器,FP16效能在僅耗用少於175瓦的板卡功耗與4GB的高頻寬記憶體(HBM)配備下,就能達到8.2 TFLOPS的尖峰值。
Radeon Instinct MI25加速器將採用AMD下一代高效能Vega GPU架構,除了針對深度學習訓練設計,並為追求即時解決方案進行優化。
眾多開源解決方案為Radeon Instinct硬體挹注動能
MIOpen GPU加速函式庫:協助解決高性能機器智慧執行的挑戰,免費的開源MIOpen GPU加速函式庫預計在2017年第1季釋出,針對各種標準常式提供GPU調校的執行方案,包括卷積、池化(pooling)、活化函數、正規化及張量格式等。
ROCm深度學習框架:ROCm平台現已為各種熱門深度學習框架優化,包含Caffe、Torch 7及Tensorflow,讓程式開發人員能專注於訓練類神經網路,透過ROCm多方面的整合設計省去低階效能的調校作業。
ROCm以作為解決下一波機器智慧難題的基礎為目標,搭配線性代數與張量方面的特定領域編譯器、開放式編譯器,以及程式語言執行階段等資源。
AMD也同時投入研發超越當今PCIe Gen3標準的互連技術,進一步推動未來機器智慧應用程式的效能。此外,AMD正在與多個開放式高效能I/O標準合作,支援廣泛的產業體系伺服器CPU架構包括X86、OpenPOWER以及ARM AArch64。
作為CCIX、Gen-Z與OpenCAPI的創始成員,AMD將致力於為Radeon Instinct開發未來的25 Gbit/s phi加速器以及機架型連接模組。Radeon Instinct產品預計在2017上半年推出,想瞭解更多資訊請瀏覽Radeon.com/Instinct。