近來看到某家硬體上市公司的股價起伏,肇因於市場猜測主要客戶可能因為精進的影像智能技術讓產品的鏡頭數量降低。此主要的核心技術為計算攝影(computational photography,電腦視覺技術的次領域),可以利用多顆鏡頭來提升拍照品質:如提高解析度、低光拍攝、或是模擬出景深效果等。多顆鏡頭提供多樣性的訊號來源,數量的多寡,取決於成本以及最終產品將展現的功能。
計算攝影技術決定鏡頭的數量,也可能會改變數位相機上的影像處理管線(Image Pipeline)。傳統感光元件捕捉到的訊號為了達到好的成像結果,必須經過相當步驟(如去馬賽克、降噪等)逐步調整訊號,這些都在ISP(Image Signal Processor)晶片上完成。相信這些使用多時的晶片,因為卷積網路的進展,也會受到智能技術翻轉。如成像時知道畫面種類時能有更好的調教品質,甚至有機會設計卷積網路直接由感光元件轉換為高品質的成像。
智能技術也翻轉傳統產業。即將進入市場的嶄新數位後視鏡,以相機及演算法來取代傳統鏡面。搭配電腦視覺領域近來的諸多進展,有機會提供更多智能安全防護:如低亮度影像提昇、雨霧影像補強、甚至主動安全維護等。這當然對傳統硬體供應商是個威脅,但也提供市場嶄新機會,如提升硬體價值、採用更多智能晶片或是鏡頭數量等。
智能技術有機會應用在各種終端產品,引發典範轉移,帶來威脅,也開啟了新的機會。這樣的影響也不僅在電子資訊,已經蔓延到各個產業。
所以AI + X似乎是擁抱典範轉移時,放諸各領域的思考策略。X有可能是我們既有(或是未來)的任何用品或服務;X可以是硬體,音箱、後視鏡、門鈴、汽車、武器裝備,可以是生產製程、信貸核發、新藥開發,也可能是活生生的律師、客服人員等。如果智能技術能激發新的應用或是提升價值的話(特別是在效率、安全、生產力等),對X所在的生態鏈都是個威脅(以及機會)。
值得思考各個產業有機會的AI + X在哪裡呢?深度瞭解各種智能技術的發展,透過智能團隊的建立或是請益外部專家,再加上個別垂直產業的產品需求,AI + X會是典範轉移時,尋覓機會所在的最好執行策略。
徐宏民(Winston Hsu)現任富智捷(MobileDrive)技術長暨副總經理以及台大資訊工程學系教授。哥倫比亞大學電機博士,專精於機器學習、大規模影像視訊搜尋與辨識。為訊連科技研發團隊創始成員,慧景科技(thingnario)共同創辦人,NVIDIA AI Lab計畫主持人;曾任IBM華生研究中心客座研究員、美國微軟研究院客座研究員。習慣從學術及產業界的角度檢驗技術發展的機會;十餘年產學合作及新創經驗。曾獲2018 IBM Research Pat Goldberg Memorial Best Paper Award 、2018偽裝人臉辨識冠軍、傑出資訊人才獎、吳大猷先生紀念獎等國內外研究獎項。