AI應用需求推升新一代半導體運算架構持續創新 智慧應用 影音
蔡司
Event

AI應用需求推升新一代半導體運算架構持續創新

  • 魏淑芳DIGITIMES企劃

GPU為內部設置大量運算單元,透過平行運算提升巨量資料處理能力,比傳統運算架構更適合處理數值分析或人工智慧應用。nvidia
GPU為內部設置大量運算單元,透過平行運算提升巨量資料處理能力,比傳統運算架構更適合處理數值分析或人工智慧應用。nvidia

新一代半導體製程受限材料物理極限,摩爾定律下的發展速度已有逐步放緩現象,反而是採人工智慧新的設計概念、透過多元整合提供半導體軟?硬體與系統的新優化方案。

摩爾定律(Moore’s Law)一直以來,均為半導體業界視為產業或技術發展圭臬,有趣的是在產製半導體技術關鍵的物理材料限制,在材料本身的最小化或是傳導電性的極限所致,使得發展更密集、單位線徑更小線路對應的半導體產品卻越來越困難,即便從新的處理架構或導入新方案改善晶片微小化與高性能化的產品改善,但可改善半導體性能的空間已經越來越小。

突破現有運算架構瓶頸,使用新一代GPU來處理高效運算需求形成新應用趨勢。nvidia

突破現有運算架構瓶頸,使用新一代GPU來處理高效運算需求形成新應用趨勢。nvidia

人工智慧、數值分析應用需求強勁,現有運算架構處理出現瓶頸,新一代為巨量數值分析/AI應用的運算需求平台相應而生,圖為nvidia為AI分析應用開發的Volta GPU。nvidia

人工智慧、數值分析應用需求強勁,現有運算架構處理出現瓶頸,新一代為巨量數值分析/AI應用的運算需求平台相應而生,圖為nvidia為AI分析應用開發的Volta GPU。nvidia

追求微縮製程效益有限 成本問題影響高階產品開發

過往半導體業者多半以追求IC產品更小的製程節點,作為技術方案挑戰的方向,因為半導體內部的節點越小,即表示內部的線路越小、更密集,而當單位半導體空間可以製作的線路越多、更密集,自然可以製作的電晶體數或是邏輯閘數量可大幅增進,這對於產製更高效能、功能更多的產品或晶片有極大的好處,而一向以來也成為半導體產業追求產品優化的主要方向。

但實際的現況是各種物理材料的電性表現都有其物理材料極限,雖然科學界一再實驗探索新材料導入的可能性,但在發展全新材料的途徑看似無法一時有大的突破,反而必須不同的思維路徑來建構新的晶片開發方向,使用已趨優化極致的晶片基礎下創建更優異的半導體運算或處理性能。

導入高階製程效益有限 對小型開發業者不利

當然,持續在材料科學下苦工使用更高階的製程或方法,在目前技術應用上還可以達到優化半導體產品性能的目的,但現實是投入優化製程的成本,可能已遠高於半導體零組件的應用價值,這對於執著優化半導體的製程或更新穎的材料並不務實。

尤其是目前主流製程多落在15奈米上下,在製程的成本與效益才能達到應用終端產品的成本需求,僅有高性能、高容量要求的記憶體或是處理器半導體這類高單價零組件產品,才會選擇更小線徑的高階製程,例如10奈米以下的進階製程。

更大的問題是,當半導體製程挑戰10奈米以下進階製程時,其產製半導體的設備成本即呈現倍數翻漲,連帶如產品製作良率也會大受影響,更具體的來看,弱勢挑戰如7奈米半導體製程,業界評估光是晶片投產就可能花費近1億美元投入,晶片開發時程也會因此拖到超過1個季度才能有第一批樣片產出,影響開發成本與時程甚巨,這也只有大規模的半導體產品集團才有能力投入。

另一個技術難點是當線徑微縮下,半導體內部的漏電流問題也會更趨嚴重,小則影響半導體的功耗與穩定性表現,大則可能導致半導體零組件的耐用度壽命受影響,這對小規模的半導體業者會顯得更難以進入高階晶片製程。

新穎運算架構 可為終端應用找到新解法

另一個角度檢視,目前電腦或應用系統大致脫離不了von Neuman架構的基礎,von Neuman架構也被稱馮諾伊曼模型(Von Neumann model)或普林斯頓架構(Princeton architecture),但von Neuman架構基本是將處理器與記憶體分開建置,當運算效能一般影響並不大。

隨著運算效能驟增,系統將頻繁運作將儲存單元的資料傳輸至處理器進行運算與取得結果,頻繁運行的狀態下即導致運算效能被I/O瓶頸所限制,反而新一代以憶阻器memristor或類神經運算的結構,或許還有機會在有限的半導體技術限制下找到優化產品效能的蹊徑。

另一個半導體產業思維,即利用GPU(graphics processing unit)高效運算特性,來處理如機器學習或進階AI系統應用需求,GPU加速運算為使用圖形處理單元再搭配CPU運算處理,藉由GPU的高效特性提供如數值分析、科學分析、工程應用等龐雜資料處理分析需求,透過將巨量數值高密集的分析工作負荷移轉至GPU處理、同時藉由CPU處理常規運算的程式碼。

檢視這類機器學習或大量數值分析的運算架構,其實可以理解CPU為設置有數個運算核心主要處理序列程式碼的運算需求,反之,GPU為擁有數千個運算核心的運算架構,可提供更高效率的平行運算處理資源,使用這類新穎架構也能在現有的半導體材料瓶頸下找到處理繁複數值運算的新解法,而這類運算架構目前已逐步落實在科學分析、人工智慧、自駕車等應用場域。

AI應用需求驟增 大量數值分析需求推升新架構產出

未來AI技術應用,將會成為許多產業的應用驅動力,像是越來越熱門的自動駕駛車開發技術,就導入了大量感測器、高解析度圖像分析的視訊串流AI處理分析,在分析影像的設計若全由中央處理器運作,現有的半導體技術開發成本將會居高不下,在技術商品化的方向可能成本就是一大門檻。

新的做法反而是將分析與數值處理的技術落在更前緣的資料取得端點,例如在擷取高階視訊串流時即預先處理分析,先以30f/s速度處理視訊預先分析預警,在於後端系統針對各個分析結果進行判斷與處理,完整建構自動駕駛車應用需求的核心系統。

除了追求半導體新的製程外,半導體業界也嘗試透過新的架構、電路、封裝方法、演算法強化半導體的運行效能或使用價值,簡單的說,就不會再是單靠優化半導體的內部線徑微縮或是塞入更多的電晶體,來實現性能或功能的改善,反而必須透過更多的方法、技術方案與全新架構,重新檢視應用系統的需求,透過系統的整體優化而不再將性能提升的關鍵全都落在半導體零組件上頭。


議題精選-2018 SEMICON