3D圖形運算與繪圖晶片 智慧應用 影音
工研院
ADI

3D圖形運算與繪圖晶片

  • DIGITIMES企劃

AMD以R290X雙核心晶片+水冷套件,打造頂級Radeon R9 295X2顯卡。Source:AMD
AMD以R290X雙核心晶片+水冷套件,打造頂級Radeon R9 295X2顯卡。Source:AMD

10多年來,NVIDIA與AMD雙方在3D圖形處理效能與畫質的競逐,從雙顯示卡、三顯示卡甚至四顯示卡平行處理,強熱散熱風扇甚至水冷套件的導入,簡直像是F1賽車界的集雙方研發與遊戲廠商支援做競逐。

當2014年新一代的頂級顯卡像AMD Radeon R290X、R295X2,到NVIDIA新強打的GeForce GTX 980顯卡的推出,意義不只是3D效能評分的破萬或成長幾倍,而是它們帶動從遊戲人物的膚色、神韻,周遭場景與物體的色澤、光跡反射已進逼好萊塢電影等級,這也正是獨立顯卡即便價位破萬甚至好幾萬,仍能獲得遊戲狂、電競玩家的青睞,成為引領個人電腦影像處理能力不斷進化的火車頭。

以28nm製程GM204架構打造的NVIDIA GeForce GTX980。Source:NVIDIA

以28nm製程GM204架構打造的NVIDIA GeForce GTX980。Source:NVIDIA

NVIDIA/AMD持續推出高效能行動獨立顯示晶片,Intel則強化內建顯示晶片來因應。NVIDIA/AMD/Intel

NVIDIA/AMD持續推出高效能行動獨立顯示晶片,Intel則強化內建顯示晶片來因應。NVIDIA/AMD/Intel

More 3D than Moore  旗艦顯示卡世代交替

自AMD於2006年購併ATI並取得其繪圖晶片技術以來,打造出融合圖形處理器(GPU)與中央處理器(CPU)異質類架構(Heterogeneous System Architecture;HSA)的加速處理器(Accelerated Processing Unit;APU)以主攻桌機、筆電與嵌入式市場之外,對於在繪圖與遊戲效能級市場頗有名號的Radeon系列所需的獨立型繪圖卡(Graphics Card)仍積極經營,並以低功耗適切效能的特性,在筆電市場佔先,還搶下蘋果Mac Pro的大單。

AMD在2013年Q4出貨Hawaii架構的Radeon R9 290X及290繪圖卡,經過兩季後,於4月進一步推出針對專業繪圖市場所使用的FirePro W9100,以及針對發燒遊戲玩家打造的頂級Radeon R9 295X2顯示卡(代號Vesuvius)。

前者率先提供16GB GDDR5繪圖記憶體,創下業界最大繪圖記憶體容量,充分發揮出Hawaii的512bit匯流排架構,適用於4K UHD (3840x2160)即時繪圖?影像處理的專業繪圖環境,最多可以支援6個4K顯示器串接的工作場合。

Radeon R9 295X2遊戲繪圖卡則是以技術展示為主的旗艦限量級產品,提供究極級的夢幻規格。卡上直接內建兩顆28nm製程、1,018MHz的Radeon R9 290X繪圖晶片,每顆R290X晶片集結62億顆電晶體、內建2,816個串流處理器(Stream Processor),以及獨特的512bit繪圖記憶體匯流排架構。

雙晶片相當於兩張Radeon R9 290顯卡做CrossFire(雙卡串連),具備5,732個串流處理器核心,卡上設計PLX PEX8747 PCI-E Gen3(8GT/s)高速切換晶片,將2x4GB GDDR5(共8GB)記憶體,各自以320GB/s記憶體頻寬連接到R290X繪圖核心並協同運算。

函式部分支援OpenCL、C++、AMP、DirectCompute 11與微軟DirectX 11.2,以及AMD自家開發的GCN原生介面Mantle API。對外介面部分支援PCI Express 3.0規格,顯示器連接部分一組Dual-Link DVI介面以及4組mini-DisplayPort 1.2介面,建議售價為1,499美元,零售通路報價約新台幣5萬元。

R9 295X2系統設計功耗(TDP)高達500W,為此AMD特別導入了美商Asetek設計的一體式水冷系統,來解決繪圖晶片的散熱問題。顯示卡供電設計仍採用2組8pin PCI-E連接頭供應,據AMD表示以一組8pin PCI-E連接頭可提供12V、最大30A(360W)的輸出,兩組8pin PCI-E連接頭足以因應,唯一限制是單12V輸出得28A,雙12V合併輸出得50A。

已有廠商改設計成4組8pin PCI-E連接頭的版本來運行Radeon R9 295X2,但仍建議至少選購600?800W的電源供應器,才能應付這個超級吃電怪獸。

而NVIDIA隨即在10月19日正式發表基於第十代NVIDIA GPU微架構-Maxwell(GM204)的全新GeForce GTX 980、GeForce GTX 970繪圖卡。

這一批仍以台積電28nm製程製作,GeForce GTX 980晶片具備52.2億電晶體,核心時脈採1,126MHz設計,可超頻至1,216MHz,內部塞入多達2,048個CUDA處理核心;GeForce GTX 970晶片的核心時脈為1,050MHz,可超頻至1,178MHz,具備了1,664個CUDA處理核心。

兩者GPU核心內建4個64Bit記憶體控制器,圖形記憶體匯流排寬度為256bit匯流排設計,L2快取容量增加為2MB以增加快取命中率,同時ROP著色處理單元進化至第三代高壓縮比的像素區塊壓縮引擎,為此GM204核心較上一代節省約25%記憶體頻寬。

為了顯示出進逼照片、電影等實境攝錄影的遊戲光影效果,GeForce GTX980/970首度支援像素全域照明(Voxel Global Illumination;VXGI)技術,結合全新軟體運算法及硬體加速運算,以即時方式執行計算每一個物體表面針對某個直接光源與間接反射光源的著色渲染效果,取代過去須靠遊戲預先計算間接照明反射的呈現效果,遊戲人物、物體表面與場景之間會隨著人物移動而有不同直接與間接光跡反射的即時光影效果。

GeForce GTX980/970最大記憶體容量為4GB GDDR5,並且支援Dual-Link DVI、HDMI 2.0以及3個Display Port 1.2顯示埠介面設計;支援4K UHD(3840x2160)、4K Cinema(4096x2160)甚至5K(5120x3200)顯示器支援能力。

而GeForce GTX980/970亦支援DSR動態超高解析度,將遊戲畫面的畫質以4K等級即時處理後,再降低至符合使用者螢幕的Full HD 1920x1080p原生解析度顯示,即便在Full HD顯示器上,仍可呈現優於原Full HD解析度著色處理的遊戲影像。

第十代Maxwell(GK204)核心較第九代Kepler (GK110)核心更注重能源效益。相較上代 Kepler GPU微架構繪圖卡,全新GeForce GTX 980效能相當於前兩代GeForce GTX 680的兩倍,也比GeForce GTX 780快上50%。

但系統設計功耗僅165W,遠低於GeForce GTX 780的250W以及GeForce GTX 680的195W,折算其每瓦浮點運算效能值高達30GFLOPS。推薦的電源供應器至少400?600W。GeForce GTX 980、970售價分別為549、329美元。

行動裝置繪圖晶片效能大躍進

在行動裝置像是x86變形平板、ARM架構的平板與智慧手機,過去受限於功耗與行動裝置的體積,其內部使用的圖形晶片,在3D影像處理與效能上總是乏善可陳;但是在近年來NVIDIA與AMD競逐於繪圖晶片效能王座的征戰下,加上既有的Imagination (原PowerVR團隊)、ARM的Mali GPU等競逐,也是顯得熱鬧滾滾。

NVIDIA針對高階遊戲?電競筆電,所推出的GeForce GTX 880M行動繪圖晶片,委託台積電以28nm先進製程製作,運作頻率達954MHz;採最新的Kepler核心架構,具備1,536個渲染單元(Shader)與128個材質貼圖單元(TMU)設計,具備256位元寬度GDDR5記憶體匯流排設計,最大繪圖記憶體容量為8GB,可以支援到HDMI 2.0/eDP 1.2 (3840x2160 4K UHD)解析度。

超微(AMD)在2014年亦針對高階遊戲?電競筆電,推出Radeon R9 M290X行動獨立顯示晶片,時脈為850MHz,採台積電28nm製程,具備1,280個渲染單元(Shader)、80個材質貼圖單元及256位元GDDR5記憶體匯流排設計,最大繪圖記憶體容量為4GB。支援DirectX 11.2、OpenGL 4.3,以及HDMI 2.0/eDP 1.2 (3840x2160 4K UHD)解析度輸出。

Intel從2013年發表的Haswell第四代處理器(Core i3-4xxx、i5-4xxx、i7-4xxx),與2014年推出的Haswell Refresh處理器,以最頂級的Intel Iris Pro 5200等GPU,其採取CPU內建GPU的必要電路,同時外面加上128MB eDRAM,以2.5D中介板(2.5D Interposer)方式封裝成單一晶片外觀,可支援DirectX 11.1、OpenGL 4.2,並支援DP 1.2與HDMI 1.4等規格,2D/3D繪圖效能比前一代提升7倍,也威脅到中低階筆電、變形平板甚至獨立顯示卡的市場。

在ARM架構部分,安謀(ARM)自家的Mali-T76x GPU,則已推進到16核心GPU加4K顯示能力,目前有台灣聯發科(MTK)的MT6732、MT6752處理器,大陸瑞芯微電子(Rockchip)的RK3288處理器所採用。

NVIDIA於2014年公布代號Logan(金鋼狼)的Tegra K1處理器-以28nm製程,Kepler繪圖處理器核心技術,採192個CUDA(shader)渲染核心加上2.3GHz4核ARM Cortex-A15、單核Cortex-A7所打造的Tegra K1處理器,提供驚人的3D視覺運算新體驗。小米平板宣布採用Tegra K1圖形處理晶片,以地球最快速的3D平板為訴求,搶佔全球的目光。

像蘋果(Apple)在2014年9月下旬發表iPhone 6/6+手機,其所採用的A8處理器,就採用來自Imagination授權的6核心PowerVR GX6650的繪圖IP技術,一樣具備192個的渲染單元,以及多達384個32位元浮點運算單元,其工作頻率為300MHz,理論浮點性能高達115.2GFLOPS,跟NVIDIA Tegra K1挑戰。