早期(1950年左右)的人工智慧研究因為技術及環境碰到瓶頸,一直未能落地。直到這幾年「深度學習技術」突破之後,「人工智慧」又再火紅回來。目前大眾媒體將電腦做智能分析(或決策)的相關服務都統稱為「人工智慧」(AI),這是一個偏行銷的用詞。而其中的關鍵技術,一般稱為「機器學習」(Machine Learning),有數種不同的子領域,在1980年代開始已陸續實現在一些預測、推薦、分類的應用。因為資料(e-mail、網頁、產品、文件、資料庫、等)逐漸增多之後,自然需要更聰明的功能。根據需求以及可得的資料,電腦科學家嘗試去「逼近」某些「智能方程式」。
早期在應用場域使用的機器學習算法,大都是應用在結構性的資料上,像是關鍵字、病例資料、購買紀錄等。所以過去二十幾年大家享受到的文字搜尋、購物推薦、(或是不喜歡的)線上廣告等,大概屬於這個範疇。其中的關鍵是如何定義出最好的「特徵值」,接著使用適合的分類器來實現這個智能方程式。其實過去二十年來,最多人使用的是稱為SVM(支持向量機),其中全世界最多工程、研究人員使用的套件,是台大林智仁教授所開發出來LIBSVM開源軟體,這是來自於台灣巨大的貢獻。
目前令人矚目的深度學習演算法幫助最大的領域在於複雜、非結構性的資料;因為網路當中有著以百(千)萬為單位的龐大變數,透過層級網路的型態,可以「逼近」複雜的資料型態跟智能方程式。這就是為什麼在影像、視訊、語音的研究上看到這種跳躍式的進步。因為最佳的特徵值、分類器等都可以在深度學習網路訓練中一氣呵成,自動取得最佳的設定。技術落地為嶄新產品的機會,不僅在從使用者端崛起,更在醫院、交通工具、工業應用、機器人中逐漸成為重要的感知回饋。
順應這場智能技術的典範轉移,如何在產品、新問題上設計適合的網路,需要大量的訓練資料與數量龐大的運算設備(也是NVIDIA會如此火紅的原因),如何將這些耗電、運算量大的智能引擎順利擺上各種硬體或是企業產品,都是亟待解決的問題,以及機會所在!
徐宏民(Winston Hsu)現任富智捷(MobileDrive)技術長暨副總經理以及台大資訊工程學系教授。哥倫比亞大學電機博士,專精於機器學習、大規模影像視訊搜尋與辨識。為訊連科技研發團隊創始成員,慧景科技(thingnario)共同創辦人,NVIDIA AI Lab計畫主持人;曾任IBM華生研究中心客座研究員、美國微軟研究院客座研究員。習慣從學術及產業界的角度檢驗技術發展的機會;十餘年產學合作及新創經驗。曾獲2018 IBM Research Pat Goldberg Memorial Best Paper Award 、2018偽裝人臉辨識冠軍、傑出資訊人才獎、吳大猷先生紀念獎等國內外研究獎項。