智慧應用 影音
Microchip
ADI

AI風潮引爆矽光子應用

AI應用大爆發,也加速矽光子技術的開發速度。

2023年9月的SEMICON Taiwan會議中,矽光子(Si photonics)技術引起熱烈討論。

在9月5日「矽光子國際論壇」中,筆者也受邀與台積電、日月光、工研院、美國Cisco及日本愛德萬測試(Advantest)的專家同台,主持人是日月光執行長吳田玉,共同討論矽光子技術在人工智慧(AI)世代中,所能扮演的角色。以下是個人在這個議題中,所表達的看法。

眾所周知,矽光子技術已經發展超過20年,主要是利用CMOS成熟製程,將處理光訊號所需的光導管、調變器、光柵、耦合器,甚至光偵測器等主被動元件整合在矽基板上。目前唯一無法整合進矽基板者,是半導體雷射,因為涉及到不同的材料系統,只能以封裝的方法處理。矽光子基板負責將光的訊號轉換為電訊號,此為接收端,發射端就是將電訊號經由雷射轉換為光訊號。由於使用成熟半導體製程,在微小化、集成度、量產的良率,甚至成本都具有優勢。再加上使用光訊號,對比於電訊號,又有著高頻寬、低延遲(low latency)以及低功耗的優勢。

自從光纖通訊在1980年代被引進之後,一直擔任訊號傳輸的角色。初期在人類使用數據量還不大的時候,光通訊運用在長距離的傳輸,如海底光纜、大都會地區的網路。隨著數據量的提升,光通訊開始進入區域網路。近來生成式人工智慧(generative AI)的興起,最大的數據產生及傳輸量是發生在AI伺服器之間,因為任何一個大型的模型,都包含數百億個參數,而每次訓練所要花費的算力是驚人的,這些都依賴晶片彼此間的平行運算以及數據交換。

拜半導體先進製程之賜,目前處理或計算1個指令,只需要1~2 nsec的時間;但是數據傳輸速度的增幅,卻永遠跟不上算力的增加。光是在光纖內運行1公尺距離會產生5 nsec的延遲,因此AI伺服器的算力有相當的時間在等待數據而停滯。若改用電訊號來傳輸,等待的時間就更久了。解決之道當然就是將轉換光訊號的裝置,愈靠近CPU/GPU/ASIC晶片愈好,以改善訊號延遲,這中間最好避免掉電路板。因此,co-package optics(CPO)包含矽光子基板,便應運而生。

CPO目前主力是放在交換器(switch)內,將矽光子基板與處理電訊號IC晶片,以堆疊(stacking)的封裝方式結合,再連接上光纖,比鄰於各式IC處理器,這就是最靠近及最低延遲的選擇方案了。

在2000年代中期,IBM在其年度的技術展望(Technology Outlook),特別提出光連結(Optical interconnect)為未來技術的重點。IBM非常自豪於技術上的預測,也表示自己從來沒有預測失敗過,有的只是發生時間的早晚。彼時並不知道會有AI運算的蓬勃發展,也不清楚半導體的技術會進展到3奈米以下。但是很明確的是,人類在數據傳輸的使用量會持續地增加,而矽光子技術將在光連結上扮演重要的角色。

當時光連結的提出,也不清楚是會發生在晶片與晶片間(chip to chip)訊號的連結,還是載板之間(board to board)訊號的連結,或者是伺服器架間(rack to rack)的訊號連結。如今伺服器架間的訊號連結,甚至於架上的層與層之間(unit to unit),已經廣泛地採用光連結技術。而晶片之間訊號的連結,已經被台積電的先進封裝技術3DIC/CoWoS/chiplet/fabric,使用電訊號交換給解決了。

接下來的重頭戲會是載板之間的訊號連結,目前的主力還是使用電訊號的連接,至於光的連結就拭目以待。

CPO結合矽光子技術,提供AI風潮中提升數據傳輸速度的最佳解決方式,這對於產業生態鏈卻是一個巨大的改變。

傳統使用插拔(pluggable)光模組的生態系,並不會坐以待斃。在今年(2023)的全球光通訊大會(OFC)上,linear-drive pluggable optics(LPO)即受到廣泛的注意,被視為傳統勢力的一大反撲。

Linear-drive的概念是拿掉插拔光模組內re-timer/DSP功能,而增加在ASIC內訊號處理的負擔,如此便減低模塊內的訊號延遲及功耗。因此之故,可以再往前推進1~2個世代的產品,而整個產業生態鏈不會有太大的變化。如同半導體製程所使用的浸潤式DUV微影設備,在不改變DUV曝光機的生態下,又往前推進幾個世代,直到EUV曝光機接手。

矽光子CPO的世代終究是會來臨,若LPO順利推展,可能會使發生的時間延後。事實上,linear-drive的概念亦可以使用在CPO上,如此不論在訊號延遲及功耗上,又會有更佳的表現。

本文感謝與鄭鴻儒博士的討論。

曾任中央大學電機系教授及系主任,後擔任工研院電子光電所副所長及所長,2013年起投身產業界,曾擔任漢民科技策略長、漢磊科技總經理及漢磊投資控股公司執行長。