因應巨量資料需求之高密集運算晶片發展趨勢 智慧應用 影音
DFORUM
Event

因應巨量資料需求之高密集運算晶片發展趨勢

  • DIGITIMES企劃DIGITIMES企劃

IBM POWER8處理器針對雲端?大數據需求所打造。IBM
IBM POWER8處理器針對雲端?大數據需求所打造。IBM

數以百億計的行動終端,仍須借助各種高速行動?無線區域網路,上傳到雲端供應商的資料中心做彙整、分析與應用,並藉由雲端伺服器甚至高效能運算伺服器的平行協同統合運算,也進而推動相關運算晶片的核心架構、執行效能、製程與封裝工藝的進化...

雲端、行動、物聯與穿戴  激化雲端?高效能伺服器需求

Oracle/Fujitsu的SPARC64 X+處理器架構。Fujitsu

Oracle/Fujitsu的SPARC64 X+處理器架構。Fujitsu

Intel Itanium也進展到八核心,但軟體整合與自家x86-64 XEON的衝突仍有待排解。Intel

Intel Itanium也進展到八核心,但軟體整合與自家x86-64 XEON的衝突仍有待排解。Intel

據Cisco VNI 2014預測,全球網路IP月流量將從2014年64.476 Exa Bytes,以年複合成長率21%速度,增加到2018年的131.553 Exa Bytes。

但雲端運算,仍須藉由雲端伺服器甚至高效能運算(High Performance Computing;HPC)伺服器平行協同統合運算,並提供雲端前方幾十百億終端用戶裝置所需的服務。因此從部署於雲端前線的架設方式(叢集運算、平行式運算),到所需要的處理器晶片,以及相關系統、API之間的整合,也得因應未來超高速網路封包傳輸,以及大數據?海量資料的即時分析、運算能力與日俱進。

以雲端?高效能運算伺服器的處理器晶片,均以先進製程來微縮線路間距,採取多達6~12核心+平行多線程(Symetric Multi-Thread;SMT)的64位元微架構設計,並且整合內嵌式高速記憶體作為高速快取記憶體與對外記憶體匯流排的高速緩衝設計。所採用的晶片封裝技術,也從MCP(Multi-Chip Package)多晶片封裝、3D立體堆疊(3D Stacks)與2.5D中介板(2.5D Interposer)邁進。

像是IBM Power8系列、Oracle(原SUN) SPARC、英特爾(Intel)安騰Itanium 9500、XEON E3/5/7系列、XEON Phi系列、超微(AMD) Opteron與安謀(ARM) Cortex A57/A53等處理器。而輝達(NVIDIA)、超微(AMD)憑藉著其繪圖處理器由於具備平行化多管線SIMD浮點運算能力,也成為建構雲端?HPC高效能伺服器輔助型處理器?介面卡。處理器廠商也跟伺服器、SI供應商合作,不惜重心打造數以萬計運算核心,達到百萬兆級運算(ExaScale)的超級電腦,要搶奪全球超級電腦Top 500排名可見一斑。

IBM Power8威力再現

由IBM華生研究中心所開發的效能優化增強型RISC架構延展出來的POWER(Performance Optimization With Enhanced RISC)處理器系列,曾攻佔各種高效能工作站、伺服器與嵌入式系統的心坎,也攫獲過蘋果PowerMac、PowerBook系列電腦的心,甚至Xbox 360處理器也有其矽智財IP的影子。

從1990年2月用於RISC System/6000工作站?伺服器,1998年POWER3、POWER4從選擇性到全面性實作64位元POWER指令集;2004年5月以130奈米SOI絕緣矽製程,打造雙核心?平行雙線緒的POWER5處理器核心架構,以四顆多晶片構裝(Multi-Chip Module;MCM)而聲名大噪。2007年65奈米SOI製程POWER6處理器首增加VMX指令集,時脈推進到4.7GHz。而2010年推出的POWER7首度內建8核心,但時脈降為3.2GHz;每核心執行四線緒,以及同樣四顆實體矽晶片的MCM封裝。

ISSCC’13國際固態電子電路研討會上,IBM正式發表POWER8處理器架構。其以先進的22奈米SOI絕緣矽製程打造,集結15道金屬電路層,矽晶電路面積為650mm2,運作時脈高達4GHz。POWER8處理器採6~12核心設計,每個核心採8線分派?10線發送?16個執行單元(8 dispatch/10 Issues/16 exec units)設計,可平行執行八個線緒(8 Threads),並且具備32KB L1指令快取、64KB L1資料快取與512MB第二階快取記憶體容量。12個核心之間以相互連通的96MB eDRAM作為第三階快取記憶體,可外接128MB eDRAM做為L4快取架構。

POWER8處理器除了時脈、製程與核心數量的增加之外,在於編碼與記憶體擴充性的強化,處理器內建PCIe 3.0匯流排控制器原生電路,光搭配16線道(x16 lane) PCIe介面卡時,雙向傳輸頻寬達到32GB/s。同時POWER8改為多核交易型記憶體(Transactional Memory)架構,並首度提供協同加速處理器介面(Coherent Accelerator Processor Interface;CAPI),能讓協同處理器晶片快速直接連通、取得POWER8快取內容來做協同運算。

2013年8月IBM與Google、Mellanox、NVIDIA及泰安電腦(Tyan)宣布合組OpenPOWER聯盟,推廣IBM Power處理器架構的平台朝開放發展。可程式化邏輯閘陣列(FPGA)大廠拓朗半導體(Altera),該年11月宣布支援OpenPOWER聯盟的OpenCL軟體開發套件(SDK);輝達(NVIDIA)於2014年4月宣佈Q4在其最新世代繪圖加速器(代號Telsa)的平行運算程式平台介面(Compute Unified Device Architecture;CUDA)中加入對POWER8的支援。

由IBM帶領NVIDIA、Altera、Google等重量級大廠所籌組的OpenPOWER聯盟,在雲端?高效能運算市場開始攻城掠地,成為英特爾不能忽視的對手。

甲骨文?富士通SPARC64 X+

強調可延展性處理器架構的SPARC(Scalable Processor ARChitecture)處理器,由美國昇陽微電腦(SUN Microsystems)於1987年所開發,跟MIPS、IBM POWER系列同屬80年代知名的精簡指令型(RISC)架構的處理器。由SPARC系列處理器建構的工作站?伺服器平台,執行由昇陽自行開發的Solaris作業系統。隨後昇陽將SPARC處理器IP智財轉移到子公司SPARC國際,逐步朝向架構開放,並授權給像是日本富士通半導體(Fujitsu semiconductor)、現代微電子(Hyundai Electronics)、Cypress、C-Cube、LSL Logic等作為伺服器?工作站?嵌入式處理器的應用。

昇陽自家工作站?伺服器使用的SPARC Tx系列處理器晶片,過去均交由德儀(TI)代工生產,而取得SPARC處理器IP電路授權的富士通,依自身需要來投單製造大型工作站?伺服器所需的SPARC64 X系列處理器。甲骨文(Oracle)於2010年1月以74億美元併購昇陽微電腦(SUN Microsystems)並取得伺服器處理器?平台等硬體技術,開始追加SPARC M系列伺服器晶片。

在2013年Q4,富士通發表以28nm製程製造的16核心SPARC64 X規格。工作時脈達到3GHz,每個核心可執行兩個線緒(2 Threads/core)。每個SPARC64 X CPU具備128KB的L1快取記憶體(64KB指令,128KB資料),L2快取記憶體容量最高到24MB。富士通設計了可安插多達64個處理器模組插槽(64 Sockets)的SPARC64 M10系列伺服器,單一伺服器系統最多可同時執行2048個平行線緒。而今年將推出相同28奈米製程、同為16核心但微調時脈到3.7GHz的SPARC64 X+處理器,明年(2015)將推改採20nm製程的SPARC64 Xifx處理器,但時脈規格、核心術語與晶圓面積則未確定。

英特爾八核心Itanium 9500系列

2012年秋季IDF開發者論壇中,英特爾正式發布其IA64架構的Itanium家族的最新成員—Itanium 9500系列(原始代號Poulson)。採32奈米製程,工作時脈範圍為1.7~2.53GHz;具備4~8核心設計,每個CPU核心具備獨立的256KB D-Cache與512KB I-Cache,6MB L2快取記憶體,以及八核心共享的24~32MB L3快取記憶體,設計功率為130~170W。

以最頂級的Itanium 9560處理器來說,具備8核心加上每個核心具備平行多線緒(Simultaneous Multi-Threading;SMT),因此1顆8核心Itanium 9560就等同於16-Way SMT、16顆邏輯處理器或執行16線緒的執行能力。既有的Itanium伺服器系統,可藉由換裝Poulson處理器卡匣的方式,升級到16路晶片多線緒等級的平行運算能力。

Itanium家族是採用迥異於目前PC/NB的x86/x64架構的EPIC(IA64)指令集架構的特性,從電路設計上剔除掉以往過於複雜的非循序執行(Out of Order Execution;OOOE)指令解碼?分派電路,藉助外部編譯軟體以及內部超長指令集架構的相互配合,把軟體程式碼編譯成執行單元指令互不衝突的指令群,藉以發揮出超長指令集(VLIW)平行處理的效能。

受限於IA64核心架構的OOOE非循序執行特性,許多執行緒無法藉助硬體來均分派每個邏輯處理器,因此Itanium伺服器每一次處理器硬體架構的世代交替,無論是核心數或線緒數的升級,都必須仰賴編譯器重新針對不同核心的Itanium特性重新編譯並做排程最佳化,才有可能充分發揮其多核多緒的執行效能。

由於架構在中階與入門伺服器市場上,由英特爾自家小師弟XEON E3/5/7系列伺服器處理器所把持,目前僅剩惠普(HP)有推出採用Itanium處理器架構的雲端伺服器?高效能工作站。甲骨文(Oracle)曾基於策略考量,於2011年3月宣佈不再針對Itanium的IA64伺服器架構去開發軟體,導致被惠普一狀告上法院,並在2012年8月由法院判決強制Oracle須繼續對惠普?英特爾安騰(Itanium)伺服器平台架構持續進行軟體移植?支援的工作,雲端?高效能伺服器的戰火猛烈可見一斑。

關鍵字