NVIDIA GPU再強化 GPU運算新世紀來臨
NVIDIA GPU技術大會(GPU Technology Conference)全球海外巡迴首站於上周在台北完美落幕,現場吸引超過2,200多名科學技術人員、開發者、研究人員、政府與企業領袖以及媒體等共襄盛舉。
GTC為人工智慧與深度學習技術的頂級盛會,與會者不僅能深入了解 GPU解決方案與超級電腦的最新發展,更重要的是,來自不同領域的專家、開發者以及研究人員能透過此次機會相互交流、激發更多火花。
2018年3月於美國聖荷西所舉辦的首場GTC吸引超過8,000多人參與,現場展示各種AI應用的最新突破,從醫療、大數據、高效能運算到虛擬實境,以及更多採用NVIDIA技術的先進解決方案應用成果。
NVIDIA於2018年美國GTC發布DGX-2人工智慧超級電腦,為AI技術人員夢想中的產品。強大的DGX-2系統是企業級的雲端伺服器,其設計核心是為滿足高效能運算與人工智慧領域的發展,內含16個Tensor核心的Tesla V100 GPU,較2017年推出的DGX-1效能提升10倍,同時擁有高達512GB的HBM記憶體,配置12個NVSwitch光纖互連技術,為全球首款為AI系統提供運算效能達2 petaFLOPS的單一伺服器。DGX-2由NVIDIA DGX軟體堆疊以及基於NVSwitch技術所打造的可擴充架構所組成。
在此次專訪中,NVIDIA解決方案架構暨工程副總裁Marc Hamilton 分享他對於GTC與台灣科技產業生態系發展的看法,Hamilton帶領他的技術工程團隊與客戶及合作夥伴共同推出基於NVIDIA人工智慧與深度學習、專業視覺化以及高效能運算的解決方案。透過多次與生態系夥伴及開發者的交流,Hamilton對於台灣的AI發展步伐相當了解。
AI正著手解決HPC等級的擴充問題
AI技術透過改變我們的工作模式、增加人機互動合作以及開創人工智慧所驅動的創新新世代來提升企業整體競爭力。AI解決方案正迅速躍昇成為最具成效的新科技,企業絡繹不絕地積極投入AI解決方案的懷抱,而DGX-2躬逢其盛,提供一個可立即採用的解決方案,同時兼顧未來擴充所需的AI效能。
DGX-2是專為AI和HPC作業負載所設計,透過具高度彈性的移轉技術來簡化AI擴充的速度,並藉由大量深度學習所組成的運算叢集結合虛擬化技術,在共享基礎架構環境中大幅改善用戶和作業負載隔離。透過加速部署模型以及易於擴充的開放式架構,開發團隊以及資料科學家得以投入更多時間來挖掘洞察,並減少建立基礎架構的時間。
以氣象預報系統為例。進行天氣預報的HPC應用需要處理大規模的運算節點,透過基於流體流量、物理學以及其他參數的運算變化,氣象預測因應而生。
氣象預測的精準度取決於模型與演算法的準確性,尤其是有多少重點資料被呈現出來。進行氣象預測需要安排一系列複雜的前、中、後處理作業,且所有的預測必須即時交付。預測應用程序於伺服器節點上運作,並透過分布在運算節點上的監控程式接收報告。
由於HPC系統動則牽涉數以千計的多核心處理器,深度學習技術需要龐大的資料並且彼此交互傳遞與運算,因此記憶體的需求馬上水漲船高,許多HPC的應用軟體需要將資料直接匯入到GPU的記憶體,以獲得最大的運算效能,有時記憶體不足,耗費在搬運記憶體的時間將會降低整體效能,因此當把多個GPU組合來應用時,記憶體的大小與GPU彼此間記憶體的傳輸速度將決定一切。
NVSwitch透過NVLink將GPU間的資料吞吐量極大化
記憶體是當今深度神經網路(Deep Neural Networks;DNN)中最大的挑戰之一。
DNN需要高速的記憶體以存取資料、重量參數以及激活,而開發人員正努力面對DRAM設備中有限的記憶體頻寬,因為AI系統將透過這些記憶體頻寬存取DNN中大量的重量參數與激活。
NVIDIA在2016年發表基於Pascal架構的Tesla P100 GPU時,發現以前仰賴PCI Express的資料傳輸通道與技術已經陷入瓶頸,無法負荷多個GPU間的資料吞吐量,於是積極部署GPU間的資料交換與互連新技術,而NVLink技術便應運而生。
透過單一GPU可支援多達6個NVLink連結,可提供各個獨立GPU之間更高的頻寬,或於低頻寬間仍能直接連接到GPU。事實上,NVIDIA的混合式立方網絡(Hybrid Mesh Cube)限制了單一NVLink叢集至8個GPU的大小,即便它是一個NUMA設置仍無法讓每個GPU皆能看到彼此。利用8個以上的GPU 需要透過InfiniBand連接多個系統,從而失去NVLink與緊密連結的GPU中記憶體共享與低延遲的優勢。
DGX-2需要將16顆Volta GPU整合至一個伺服器架構中,因此NVIDIA推出NVSwitch,其設計旨在利用一個交換器晶片來切換更多不同的 NVLink連接,單一個NVSwitch具備18個全頻寬,運算效能是單一Tesla V100 GPU的3倍,而所有的NVSwitch讓各GPU能互連。
NVSwitch的目標是為了增加叢集GPU的數量並支援16個GPU配置,而在DGX-2上共設計了12個NVSwitch連接,提供多達216個資料通道的記憶體頻寬,滿足GPU間每秒最大的300GB資料吞吐量,DGX-2較DGX-1系統提升兩倍的速度,這個進化讓資料科學家與系統開發者得以進行更複雜的AI應用。
有鑑於TensorFlow以及所有主要的深度學習架構所採用的NVIDIA NCCL(NVIDIA Common Collectives Library),深度學習架構如 TensorFlow不再需要了解伺服器中底層的NVLink拓樸結構。
NVIDIA的AI軟體堆疊經過全面優化及更新後能支援採用DGX-2及其他DGX系統的開發者,其中包含NVIDIA CUDA、TensorRT、NCCL、cuDNN以及專為機器人所設計的Isaac軟體開發套件(SDK)。
Hamilton表示:「TensorRT 4.0為NVIDIA推出的優化推論加速器新版本。目前TensorRT 4.0已整合到TensorFlow 1.7 ,而TensorRT 4.0為當今最受歡迎的深度學習架構之一。」NVIDIA的工程師非常了解自家GPU,透過針對基於GPU平台的優化和高效能runtime,使TensorRT 4.0 軟體能加速深度學習推論於各領域應用。
Hamilton表示:「許多TesorFlow的用戶將能從最高推論效能中獲益,並藉由TensorRT 了解清楚的工作流程。TensorRT能提供FP16與INT8精準的推論內容,以及高達8倍的推論吞吐量(與低延遲目標中的GPU執行相比)。」
在邊緣運算領域,TensorRT可以部署在NVIDIA DRIVE自駕車與NVIDIA Jetson嵌入式平台。而每個架構上的深度神經網路都能在資料中心的NVIDIA DGX系統上進行訓練,並部署到所有的邊緣裝置上。透過TensorRT,開發人員能專注於研發新穎的深度學習應用,而不用費心為推論部署進行繁瑣的效能調校。
HGX-2雲端伺服器平台為大型資料中心建立運算參考架構
NVIDIA旗艦級產品DGX-2超級電腦預計於2018年第3季正式量產上市,為了有效整合台灣的伺服器ODM大廠、生態系夥伴以及全球主要的伺服器國際品牌,NVIDIA於台北舉行的GTC發布HGX-2雲端伺服器平台,NVIDIA自家的DGX-2便是採用HGX-2所設計的旗艦級產品。
伺服器相關產業一直是台灣ODM大廠中,始終保持強勁競爭力的產業之一,透過AI領域的發展機會將有助於台灣系統製造商持續前進。NVIDIA工程團隊與台灣ODM大廠保持密切的往來合作,協助縮短從設計到生產部署的開發時間。
HGX-2的設計旨在滿足HPC與 AI 領域持續成長的應用需求。這些伺服器品牌與ODM大廠正在設計基於HGX-2的系統,為超大數據中心打造各種客製化設計的GPU 加速系統。
HGX-2具備兩項突破性功能,包含NVIDIA NVSwitch 網狀互連架構,能順暢串連16個內建Tensor Core 的 NVIDIA Tesla V100 GPU。透過HGX-2伺服器建構組件,伺服器製造商將能打造完整的伺服器平台,以滿足各種資料中心的需求。
台灣的AI應用與未來
Hamilton這幾年與台灣各產業保持密切的互動,針對AI訓練計畫,預計培育3,000位AI技術開發人員,藉由與台灣科技部的「博士創新之星計劃(LEAP)」合作,提供博士後研究的菁英人士相關實習與AI研究專案參與,其中關於智慧醫療的專案最令人期待,目前利用AI技術打造疾病預測研究,逐漸開展人工智慧技術進入台灣醫療體系。
另外,Hamilton指出AI的影像判讀技術用在晶圓檢測已有不錯的起步,晶圓損壞與錯誤檢測牽涉精密的檢測機台以及工程人員長時間的付出,透過AI的自動偵測與判讀技術,將可降低檢測成本並掌握時效,對台灣的半導體產業有相當大的幫助。此技術目前也逐步擴展至PCB產業的錯誤偵測與品質檢測應用,AI的應用總是帶來令人驚喜連連的創新發展。
- 亞源參與COMPUTEX 2018 多元化電源產品獲好評
- 僑威聚焦充電領域 EV充電樁與無線充電吸睛COMPUTEX
- 威聯通推出TVS-951X多媒體10GBASE-T NAS
- ZOTAC CUP MASTERS 亞洲區決賽冠軍出爐
- 走出行動藩籬 高通欲以更多專用晶片打通關
- 聯芸科技於COMPUTEX圓滿展出固態硬碟控制晶片
- COMPUTEX新創圓桌會議:共築全球新創生態系
- 宜鼎推工業級DDR4 2666 全面抗硫化加值不加價
- 威聯通榮獲2018 COMPUTEX Best Choice Award
- 智慧製造需求普及 業者搶攻工業4.0供應鏈商機
- InnoVEX新創團隊競相投入 IoT、AI、健康與生物科技
- 緯穎攜手中華電信合作 體現新一代資料中心技術
- 中磊展出全系列NB-IoT及LTE-M產品
- 神達旗下Mio展出車用軟硬體解決方案
- 為物聯網應用添上眼睛 晶睿通訊展現三大解決方案
- 振樺積極發展新零售布局 展出三合一線上/線下解決方案
- 英特爾於COMPUTEX發表最新處理器 分享未來PC願景
- AMI儲存應用解決方案 深化台灣VDI整合與應用市場
- 滿足資料、影像、電源傳輸 行動裝置導入USB Type-C介面應用更全面
- 智慧管理需求大增 宜鼎iCAP雲端管理平台應用看漲
- 5G加速物聯網發展 完善整合測試能掌握商機
- 技嘉攜手Intel共同見證40年處理器千倍效能演進
- QNAP人工智慧醫療應用 顛覆NAS應用可能
- 融合行動支付、Beacon 傳統商圈轉型智慧化
- 聯網啟動新創意 AIoT揭開智慧生活序幕
- 群暉於COMPUTEX期間展出新產品、軟體與系統升級
- 華碩COMPUTEX發表全新NB並展現保健穿戴裝置
- 智慧音箱透過AI與硬體擴展優化產品使用體驗
- 優納比首次以主題館形式COMPUTEX InnoVEX亮相
- 芝奇展示極速DDR4 5066MHz記憶體
- 3D感測、3D成像跨出消費電子裝置 強化醫療、工控、車用領域布局
- 電競、工控商機各領風騷 記憶體廠競推新品輪番搶睛
- 大、小尺寸面板價格不同調 牽動品牌業者運籌帷幄空間
- 新零售帶動商店無人化 飛捷集團強調行動、自助新體驗
- 高速率、低延遲性 5G商轉將提升多元應用
- SECO布局亞洲嵌入式系統 拓展智慧醫療系統的版圖
- 巽晨國際COMPUTEX展出60GHz多項應用揭示5G商機
- COMPUTEX 2018 尚茂參展 聚焦AI及軟硬體整合
- 技術與應用並進 物聯網發展速度加快
- HDMI將於COMPUTEX展出最新規格
- 萬旭電業2018 COMPUTEX展出One stop cable solution
- 理義科技-曲面、異型、防爆觸控面板與保護玻璃的市場先驅者
- AI扮演創新觸媒 推動汽車智慧化革命
- 選購車用儲存解決方案 穩定性與客製化能力缺一不可
- 車用電子設計開發 環境、材料、法規三者將是關鍵
- 電動車市場加速 僑威聯手起而行綠能讓充電樁效能最佳化
- 法令規範+廠商積極投入 電動車市場成長態勢明確
- 掌握無人車商機 利基市場將是台廠最佳機會
- 發展自動駕駛 車聯網、AI、嵌入式運算缺一不可
- 正美集團智能標籤解決方案 為您打開物聯網第一扇門
- 全漢COMPUTEX展出5G、IoT、區塊鏈、電競方案
- COMPUTEX 2018 打造AORUS夢幻電競空間
- 映泰專業加密貨幣挖礦主機板隆重登場 挖礦無須轉接卡
- 全何科技V-Color 全新產品重裝來襲
- 邊緣運算落地應用 5大產品聚焦COMPUTEX 2018
- NVIDIA GPU再強化 GPU運算新世紀來臨
- TSC Auto ID於COMPUTEX以全新風貌 打造產業應用專區
- 邁倫與雲達聯合展出ConnectX-5解決方案
- 物聯智慧公布GDPR個人資料保護合規白皮書
- Socionext攜手致伸科技進軍COMPUTEX
- 電競市場正夯 COMPUTEX各家電競新品拚場
- COMPUTEX 2018強打智慧家庭、AIoT應用
- 擁有全球最完整健保制度 台發展區塊鏈鎖定醫療應用
- 尚茂智能智慧商舖系統解決方案
- StarFab首創伯樂匯 啟動線上新創輔導平台
- 全球科技巨頭競逐區塊鏈賽局
- 台睿精工VCM多元應用 掌握手機觸覺回饋商機
- 智微科技全新高速外接式存儲裝置系列解決方案
- 兆易創新推出多款GD32E103系列MCU
- 敏博發表新一代SSD、高速DRAM模組與雲端監控平台
- 映泰為區塊鏈運算及加密貨幣挖礦打造一站式解決方案
- 瞻誠科技第三代DVB-T2系列產品正式推出
- Wincomm醫療等級無風扇熱插拔觸控電腦榮獲多項大獎
- 品佳推出新唐科技ISD 91200智慧電子鎖解決方案
- 泓格參與COMPUTEX2018 展示新工業物聯網雲方案
- KEYDEX標竿創意於COMPUTEX展出語音翻譯麥克風
- 東芝推出工業用及工廠自動化光繼電器
- Xperi聚焦智慧家居等三大市場 持續催生創新技術
- 宜鼎最新研發資料保存技術 SSD不再怕熱
- 手機、AI、物聯網大整合 三者齊聚打造未來生活
- AIoT生態系統裝置突波保護設計
- AIoT應用走向分流 家用設備智慧更接地氣
- AI翻轉物聯網架構 PaaS將扮演關鍵角色
- Dialog SmartBond產品系列增加藍牙網狀網路支援
- 5G刺激物聯網應用創意 電信商業模式走向多元
- 突破人才不足困境 軟硬整合已成台灣AI發展契機
- 天奕科技COMPUTEX展示「AI級」無線室內定位技術
- 金融、醫療產業導入區塊鏈技術引爆服務創新能量
- 手機快充與周邊商機 威鋒USB PD 3.0晶片率先獲認證
- LitePoint 5G測試解決方案助力縮短上市時程
- ICY DOCK為AI、HPC和IoT領域提供優質產品優勢
- 筆記型電腦出貨持續成長 平價變形筆電威脅平板市場
- AMI與KingTiger結盟 展現電腦系統的超高穩定性與效能
- 數據傳輸須臾間 人類生活大變革
- 電競者的最佳夥伴七彩虹iGame Z370主機板
- 十銓科技高效儲存產品稱霸業界 強勢席捲COMPUTEX 2018
- COMPUTEX 2018開展 AI、5G、IoT、電競與VR、區塊鏈為五大亮點
- COMPUTEX搭配InnoVEX、SmarTEX兩大特展 提供多面向數位轉型解決方案
- COMPUTEX打造AIoT生態系供應鏈 業者搶搭順風車
- 雲達科技於COMPUTEX展出AI及5G新解決方案
- 業界推動區塊鏈自律組織 盼政府低監管提供友善環境
- 通訊標準混用問題難解? 客製化模擬測試快速解決困擾
- 物聯網商機驚人 三雄決戰雲端
- 科技新浪潮崛起 誰領風騷?
- 公信2018台北國際電腦展 推出最新解決方案
- Mavin Air-X全球最優質、最小、10小時的真無線耳機
- 建立與眾不同的優勢 亞源深耕特定電源領域有成
- 鎧應將於COMPUTEX 2018實現數位看板零售整合
- 全何科技V-Color將於COMPUTEX展出新產品
- 宇瞻科技於COMPUTEX展覽期間 大秀工控研發實力
- 十銓電競魅力強勢席捲COMPUTEX 2018
全新T-FORCE RGB炫光飆速新視野 - SECO布局AIOT提供FPGA與CPU的解決方案
- TSLG耐落防鬆技術Value Solution Provider
- 物聯智慧Kalay平台與AI接軌 IoT應用升級
- 七彩虹與承啟科技於COMPUTEX展示最新板卡技術
- 晶睿通訊與趨勢科技攜手 網路攝影機資安全面提升
- 威聯通於COMPUTEX 2018展示人工智慧醫療影像應用
- 點亮智慧城市 宜鼎創新物聯方案於COMPUTEX首次亮相
- 公信深耕汽車電子 進軍高規格工業電腦領域
- 掌握物聯網趨勢脈動 宇瞻揭幕COMPUTEX展期亮點
- 威鋒宣布取得USB-IF協會USB PD 3.0認證
- 亞源集團參展COMPUTEX 2018展現電源研發技術優勢
- Beseye於COMPUTEX展出多項AI功能影像分析技術
- 微軟COMPUTEX 2018專題演講-建構智慧未來
- COMPUTEX 2018 Intel主題演講開始報名
- 芝奇COMPUTEX 2018主辦超頻改裝大賞
- COMPUTEX 2018打造亞洲最具規模新創平台
- 台灣新創開發節點組網傳輸技術 IoT設備更新可望省下近70%傳輸成本
- InnoVEX 2018 全球最大的國家代表團-荷蘭
- 超微新平台接連上陣 祥碩今年營運新高可期
- 21國頂尖新創齊聚COMPUTEX 以色列也看好台灣實力
- 電源技術創新求變 持續追求更高效能
- InnoVEX創新與新創展區六大亮點 搶攤藍海新商機
- 搶食英特爾地盤 超微力攻商用戰場 Ryzen Pro首獲戴爾、聯想、惠普3大大廠相挺
- Deep Force評選為最佳認知解決方案供應商之一
- 麗臺、無敵科技與長庚大學簽署合作備忘錄
- IOTA將於InnoVEX談分散式帳本應用
- COMPUTEX將展出多樣化嵌入式產品
- COMPUTEX 2018區分六大應用主題 將首度加入5G與區塊鏈
- COMPUTEX 2018將於6月5日登場 聚焦AI、5G、區塊鏈
- COMPUTEX官方獎項 增列物聯網項目
- AI商機熱度攀升 成COMPUTEX 2018亮點