上星期在南港參觀智慧機械展,第一次看了台灣諸多「隱形冠軍」們,智能化成為業界目前努力的方向,大家朗朗上口,不過落實的部份非常少。
倒是聽到業者很多有趣的需求。有位產品佈局相對領先的業者提到,對岸的機械業以低價策略切入市場,他們只能以領先的技術、完整的解決方案來保衛市場。這就是為什麼得提早投入機械製造智能方案。
不過他擔心製造業中的樣本少,生產線更換頻繁,似乎沒有足夠的資料訓練演算法。我樂觀地回答,其實學界也看到了這樣的問題,所以這兩三年也在頂尖國際會議中,不少人提出使用cross-domain(跨領域)或是few-shot learning(僅有少量樣本)等學習法來解決這樣的問題。經解釋之後,他興奮地要我推薦幾篇論文。
這幾年深度學習技術大突破,絕大部分關鍵性的論文、甚至產業界時常採用的技術,大都發表在頂尖會議上。例如:AlexNet (NIPS'12)、ZFNet (ECCV'14)、NIN (ICLR'14)、VGG (ICLR'15)、GoogleNet (CVPR'15)、ResNet (CVPR'16)、RCNN (CVPR'14)、DQN (NIPS'13)、GAN (NIPS'14)、Memory Network (ICLR'15)、 Word2Vec (ICML'14)、Seq2Seq (NIPS'14)等,不勝枚舉。
我觀察,這幾年越有競爭力的企業,越在乎某些電資領域的頂尖會議—發表、贊助、或是派員參加。國內的MediaTek、HTC、TSMC也算是這些領域的常客,因為他們得利用頂尖技術來維持獲利或是與競爭者拉開距離。
這幾年頂尖會議也成為產業界獵才、技術展示、探察核心技術的重要地點。例如,過去一年NVIDIA在全球贊助了16個AI Lab,首度召開的跨研究中心會議,也選擇在去年7月的CVPR召開。有次在跟NVIDIA黃仁勳創辦人開會時,他提到自己也會看這些會議論文,以掌握前瞻技術的走向。
2007年回台大時,受惠於前瞻思維的資深教授們,我蠻驚訝電資學院內竟然也有配套的多元指標,鼓勵頂尖會議論文。這也是為什麼台大電資學院這幾年在國際學術的某些領域中還具有話語權的原因。
參與頂尖國際會議也是泛機器學習領域的慣例,在評估學生(入學、就業)或是研究人員時,時常會參考頂尖國際會議的著作、Google 論文引用、產業經驗、或是新興的github紀錄。
發表學術論文跟產業脫節?至少在我熟悉的領域正好相反。相信前瞻技術研究,銜接產業未來需求,才更能抓住下個產業浪潮!
徐宏民(Winston Hsu)現任富智捷(MobileDrive)技術長暨副總經理以及台大資訊工程學系教授。哥倫比亞大學電機博士,專精於機器學習、大規模影像視訊搜尋與辨識。為訊連科技研發團隊創始成員,慧景科技(thingnario)共同創辦人,NVIDIA AI Lab計畫主持人;曾任IBM華生研究中心客座研究員、美國微軟研究院客座研究員。習慣從學術及產業界的角度檢驗技術發展的機會;十餘年產學合作及新創經驗。曾獲2018 IBM Research Pat Goldberg Memorial Best Paper Award 、2018偽裝人臉辨識冠軍、傑出資訊人才獎、吳大猷先生紀念獎等國內外研究獎項。