藉助深度學習 大幅推升大數據應用成效

  • 魏淑芳
透過深度學習的人工智慧技術,可望協助病理學家迅速辨識癌細胞,乃至挖掘出可能導致疾病的遺傳因子。來源:The Verge

DIGITIMES企劃

毋庸置疑,包括大數據(Big Data)、人工智慧(AI)、機器學習(Machine Learning;ML),乃至深度學習(Deep Learning;DL),都是當今熱明顯學,伴隨這些議題相繼引領風騷,不僅造就了許多顛覆市場的獨角獸企業,也可望為百年企業注入新的DNA,徹底改善競爭體質。

換句話說,無論新創公司或老牌企業,只要真正進入數據分析之堂奧,都可望從中挖掘致勝線索,洞見未來趨勢浪潮,獲取源源不斷的創新養分;因此包括Big Data、AI、ML或DL等泛資料科學的技術項目,不管問世時間長或短,亦不管先前發展態勢是快或慢,至少在此時此刻,甚至是今後5年、10年,它們皆將持續成為深具票房潛力的題材。

值得一提的,拜Google DeepMind的AlphaGo技驚四座所賜,當前「深度學習」展現的發展勁道之強,讓人不敢小覷,被喻為是在泛Big Data陣營當中,極具爆發性的一環。

ML與DL崛起  引爆人工智慧風潮

事實上,深度學習算是機器學習的一個分支,源自於類神經網路模型,而機器學習也隸屬於人工智慧領域;因此若說AI是一個偌大同心圓,機器學習則是包覆在大圓圈裡頭的中圓圈,而中圓之內還有小圓、即是深度學習,儘管彼此看似系出同門,但各有各的巧妙之處。

以機器學習、深度學習最大的聯集AI而論,並非一門特別新穎的技術,但其走勢與現今同樣火紅的虛擬實境(VR),頗有異曲同工之妙,早期發展步調都算緩慢,但近年隨著硬體運算能力大幅增強,輔以GPU平行運算、雲端運算等關鍵技術愈趨成熟,才由冷轉熱,不僅躍為語音辨識、影像辨識、自然語言處理的主流技術,甚至非常適用於生物特徵辨識、環境辨識、推薦系統等等諸多領域。

也就是說,只要懂得AI、機器學習、深度學習等運用訣竅,要想開創驚天動地的創新應用,機會相當大,此乃其備受關注的原因所在。

至於機器學習、深度學習,基本上都是實踐人工智慧的技術項目。所謂機器學習,是透過演算法來推動數據分析,藉由學習來培養能預測判斷某些事物的能力,訓練愈多、愈久,預測與判斷能力就愈強。

即使機器學習立意甚佳,但多年來包括決策樹學習、貝葉斯網路等等一干相關演算法,都未能真正達到「廣義人工智慧(General AI)」目標,即是沒能打造出相當於人類智力特徵、懂得思考且擁有感覺的複雜機器,充其量僅實現了「狹義人工智慧(Narrow AI)」進程,最顯著的應用型態便是電腦視覺,可惜此項應用並未完全符合「不倚靠手動編寫帶有特定指令的軟體程式」的機器學習初衷,仍需採用大量人工編碼,然後藉由人工編碼分類器而衍生能夠解析影像的演算法。

單就電腦視覺來看,似乎無法有效擺脫環境的遮蔽或干擾因素,導致影像判斷精準度受到影響,亟待提升的空間著實不小。幸而後來神經網路技術出現,可望彌補過往種種機器學習技術之不完美。

AlphaGo神來一筆  炒熱深度學習

神經網路的概念取材於人類大腦結構,箇中蘊含許多層次,每一層各有神經元,假使有諸如圖像等內容輸入,這些神經元將基於預先被賦予的權重,各自執行不同任務,例如檢查某圖像的形狀或特徵,然後再將所有權重數值予以加總,便產生出最終結果。

值得一提,只要訓練的歷程愈扎實,這個被電腦系所預測的最終結果,接近事實真相的機率就會愈大,此即為深度學習的奧妙之處,而深度學習也讓人工智慧出現爆炸性發展。

有人也許好奇,人工神經網路的概念由來已久,至少不是現在才橫空出世的新穎技術,那麼為何深度學習為何遲至今日還未發光發熱?原因很簡單,要做好深度學習,就得訓練網路、調整網路,以影像辨識為例,過程中便可能需要輸入成千上萬,甚至數以百萬、千萬或上傳張圖像,不斷優化調整神經元的輸入權重,提高辨析圖像的精準度。

但那怕是最簡單基本的神經網路,亦需採用大量運算資源,過往如果以CPU加上顯卡來推動此事,顯然力有未逮,當然顯現不出好成果,直至近年來GPU平行運算技術益發成熟精進,才使深度學習豁然開朗。

換言之,即使深度學習基本上算是機器學習的次分類,但兩者確實有所不同。持平而論,機器學習已稱得上是AI領域中的突破性成果,其透過監督式學習經驗,促使電腦系統之中的資料集,學習到一個新的模式,可用以推測新的實例,或者萃取更多知識,但既然談到「監督」,就必須仰賴人類的創造力,好讓機器知道應該怎麼進行學習;反觀深度學習,則大幅度擺脫了監督二字,透過大規模的神經網路,即使不經過人為干預,也能讓電腦自行動腦思考。

迄至今日,舉凡谷歌(Google)、微軟、蘋果、亞馬遜、臉書、Tesla等備受矚目的科技巨擘,都積極投入AI與深度學習。以Google為例,在2014年初即砸下了4億美元的高額代價,快速出手購併DeepMind這家公司,而DeepMind創始於2012年,係由神經科學家、天才棋手Demis Hassabis偕同兩個夥伴共同創立,旨在藉由機器學習與神經科學系統的結合,產生最佳技術,據以建立強大而通用的學習演算法。

到了2016年,經由DeepMind催生的AlphaGo,以4:1擊敗了世界大師級圍棋冠軍李世乭,自此一炮而紅,才讓人驚覺深度學習的威力確實強大。

事實上,DeepMind借助深度學習所締造出的發展成就,並不僅止於AlphaGo,比方說在2016年底,與美國國家醫療服務體系(NHS)轄下的基金會Royal Free London,簽定5年期的合約,目標在於處理172萬個病患的醫療記錄。

與此同時,DeepMind獲得來自倫敦醫院的兩個資料庫,包括100 萬張視網膜掃描報告,以及頭頸部癌症圖像,前者有助於讓DeepMind透過AI技術而確定退化性眼疾的早期徵兆,後者則可訓練AI軟體如何辨識頭頸部的健康組織、癌變組織。

綜觀各界推動深度學習的應用方向,最饒富價值與商機的一塊,無疑便是健康管理,例如未來人們只要在浴室洗澡,透過衛浴鏡,即可量測其生理狀態訊息,並持續將相關資料上傳雲端平台,接著由專業醫護單位負責解析數據,期望爭取時效在第一時間察覺到人體的病變徵兆,即時給予投藥與診療,避免人們的健康與生命。

而車用電子則是另一個顯著的應用方向,藉由車內影像辨識裝置,可持續監測駕駛人的臉部表情,進而推估其脈搏與呼吸頻率,據此研判此人的健康或精神狀態是否出問題,以便於後台管理中心適時妥善處理,防止車禍事件產生。

更多關鍵字報導: 機器學習 大數據 大數據分析