泛人工智慧的技術領域

徐宏民
2018-03-20
分享
Line

目前深度學習演算法幫助最大的地方在於複雜、非結構性的資料，應用於醫院、交通工具、工業應用、機器人等領域。(圖片來源：Pixabay)

早期（1950年左右）的人工智慧研究因為技術及環境碰到瓶頸，一直未能落地。直到這幾年「深度學習技術」突破之後，「人工智慧」又再火紅回來。目前大眾媒體將電腦做智能分析（或決策）的相關服務都統稱為「人工智慧」（AI），這是一個偏行銷的用詞。而其中的關鍵技術，一般稱為「機器學習」(Machine Learning)，有數種不同的子領域，在1980年代開始已陸續實現在一些預測、推薦、分類的應用。因為資料（e-mail、網頁、產品、文件、資料庫、等）逐漸增多之後，自然需要更聰明的功能。根據需求以及可得的資料，電腦科學家嘗試去「逼近」某些「智能方程式」。

早期在應用場域使用的機器學習算法，大都是應用在結構性的資料上，像是關鍵字、病例資料、購買紀錄等。所以過去二十幾年大家享受到的文字搜尋、購物推薦、（或是不喜歡的）線上廣告等，大概屬於這個範疇。其中的關鍵是如何定義出最好的「特徵值」，接著使用適合的分類器來實現這個智能方程式。其實過去二十年來，最多人使用的是稱為SVM（支持向量機），其中全世界最多工程、研究人員使用的套件，是台大林智仁教授所開發出來LIBSVM開源軟體，這是來自於台灣巨大的貢獻。

目前令人矚目的深度學習演算法幫助最大的領域在於複雜、非結構性的資料；因為網路當中有著以百（千）萬為單位的龐大變數，透過層級網路的型態，可以「逼近」複雜的資料型態跟智能方程式。這就是為什麼在影像、視訊、語音的研究上看到這種跳躍式的進步。因為最佳的特徵值、分類器等都可以在深度學習網路訓練中一氣呵成，自動取得最佳的設定。技術落地為嶄新產品的機會，不僅在從使用者端崛起，更在醫院、交通工具、工業應用、機器人中逐漸成為重要的感知回饋。

順應這場智能技術的典範轉移，如何在產品、新問題上設計適合的網路，需要大量的訓練資料與數量龐大的運算設備（也是NVIDIA會如此火紅的原因），如何將這些耗電、運算量大的智能引擎順利擺上各種硬體或是企業產品，都是亟待解決的問題，以及機會所在！

徐宏民
台大資工系教授

徐宏民(Winston Hsu)現任富智捷(MobileDrive)技術長暨副總經理以及台大資訊工程學系教授。哥倫比亞大學電機博士，專精於機器學習、大規模影像視訊搜尋與辨識。為訊連科技研發團隊創始成員，慧景科技(thingnario)共同創辦人，NVIDIA AI Lab計畫主持人；曾任IBM華生研究中心客座研究員、美國微軟研究院客座研究員。習慣從學術及產業界的角度檢驗技術發展的機會；十餘年產學合作及新創經驗。曾獲2018 IBM Research Pat Goldberg Memorial Best Paper Award 、2018偽裝人臉辨識冠軍、傑出資訊人才獎、吳大猷先生紀念獎等國內外研究獎項。