AMD發佈Radeon Instinct加速推機器智慧

孫昌華／台北
2016/12/16 01:56
分享

AMD發表新策略，在伺服器運算中以全新硬體與開源軟體方案，加速機器智慧新時代，其設計大幅提升效能與效率，並更易於深度學習工作負載的執行。

全新Radeon Instinct加速器將為客戶提供強大且基於GPU的解決方案以執行深度學習推論與訓練工作。除了新推出的硬體方案，AMD同時發表MIOpen，乃針對GPU加速器設計的免費開源函式庫，協助執行高效能機器智慧方案。另外還推出以AMD ROCm軟體為基礎的全新優化深度學習框架，為機器智慧工作負載的演進奠定基礎。

平價的高容量儲存、大量的感應驅動資料以及飛快增長的使用者產生的內容，在全球各地產生以Exabytes計的資料。近期在機器智慧演算法與高效能GPU獲得諸多進展，使處理與解讀資料的程度得到數個量級的提升，幾乎能即時產生資料洞察。Radeon Instinct為機器智慧打造開放軟體產業體系的藍圖，協助加速洞察推論與演算法訓練。

AMD總裁暨執行長蘇姿丰博士表示，Radeon Instinct設計旨在於MIOpen與ROCm內的高效能GPU加速器與免費開源軟體大幅加快機器智慧的發展速度。結合高效能運算與繪圖功能以及跨世代產品藍圖，AMD為業界唯一擁有GPU與x86矽專業技術的公司，不僅能滿足資料中心種類廣泛的需求，還能協助推動機器智慧的多元發展。

在上週舉行的AMD技術高峰會上，來自1026間實驗室、Inventec、SuperMicro、加拿大多倫多大學氫強度映射實驗(CHIME)無線電望遠鏡計劃，以及Xilinx的客戶與夥伴均讚賞Radeon Instinct的推出，探討如何使用AMD的機器智慧與深度學習技術，以及如何從Radeon Instinct中獲益。

Radeon Instinct加速器特性包含被動式冷卻、符合單根I/O虛擬化技術(SR-IOV)業界標準的AMD多重GPU硬體虛擬化技術，以及針對多重GPU點對點支援的64-bit PCle龐大基址寄存器支援。

Radeon Instinct加速器設計以支援廣泛的機器智慧應用程式

Radeon Instinct MI6加速器基於廣受推崇的Polaris GPU架構，這款被動式冷卻推論加速器針對作業？時間？焦耳進行最佳化，FP16效能在150瓦的板卡功耗與16GB的GPU記憶體下，能達到5.7 TFLOPS的尖峰值。

Radeon Instinct MI8加速器運用高效能低功耗的「Fiji」Nano GPU，為一款微型異質化高效能運算與推論加速器，FP16效能在僅耗用少於175瓦的板卡功耗與4GB的高頻寬記憶體(HBM)配備下，就能達到8.2 TFLOPS的尖峰值。

Radeon Instinct MI25加速器將採用AMD下一代高效能Vega GPU架構，除了針對深度學習訓練設計，並為追求即時解決方案進行優化。

眾多開源解決方案為Radeon Instinct硬體挹注動能

MIOpen GPU加速函式庫：協助解決高性能機器智慧執行的挑戰，免費的開源MIOpen GPU加速函式庫預計在2017年第1季釋出，針對各種標準常式提供GPU調校的執行方案，包括卷積、池化(pooling)、活化函數、正規化及張量格式等。

ROCm深度學習框架：ROCm平台現已為各種熱門深度學習框架優化，包含Caffe、Torch 7及Tensorflow，讓程式開發人員能專注於訓練類神經網路，透過ROCm多方面的整合設計省去低階效能的調校作業。

ROCm以作為解決下一波機器智慧難題的基礎為目標，搭配線性代數與張量方面的特定領域編譯器、開放式編譯器，以及程式語言執行階段等資源。

AMD也同時投入研發超越當今PCIe Gen3標準的互連技術，進一步推動未來機器智慧應用程式的效能。此外，AMD正在與多個開放式高效能I/O標準合作，支援廣泛的產業體系伺服器CPU架構包括X86、OpenPOWER以及ARM AArch64。

作為CCIX、Gen-Z與OpenCAPI的創始成員，AMD將致力於為Radeon Instinct開發未來的25 Gbit/s phi加速器以及機架型連接模組。Radeon Instinct產品預計在2017上半年推出，想瞭解更多資訊請瀏覽Radeon.com/Instinct。

關鍵字

超微機器學習 GPU

加入已選取到「關鍵字追蹤」什麼是「關鍵字追蹤」

議題精選－開源電子軟硬體開發平台專輯