智慧應用 影音
AIEXPO2024
Event
林一平
  • 國立陽明交通大學資工系終身講座教授暨華邦電子講座
現為國立陽明交通大學資工系終身講座教授暨華邦電子講座,曾任科技部次長,為ACM Fellow、IEEE Fellow、AAAS Fellow及IET Fellow。研究興趣為物聯網、行動計算及系統模擬,發展出一套物聯網系統IoTtalk,廣泛應用於智慧農業、智慧教育、智慧校園等領域/場域。興趣多元,喜好藝術、繪畫、寫作,遨遊於科技與人文間自得其樂,著有<閃文集>、<大橋驟雨>。
Jony Ive的設計思維
我曾經以iPhone為載具,發明一種具有位置感測功能的萬用無線遙控器。當你在房間中指向任何家電(如冷氣機)時,iPhone會自動成為該家電的遙控器。這一類的創意是基於智慧型手機的發展而來。智慧型手機已成為一個重要的硬體平台,可以發揮創意,特別是在拍照攝影功能方面,可以開發出許多創意應用,甚至改變人們的行為方式,被《生活》(Life)雜誌譽為Cameraphone Revolution(攝影手機革命)。而iPhone的成功,其中的一位功臣是艾夫(Jonathan Ive,習稱Jony Ive)。他是當時蘋果的首席設計師,在推動行動創意方面有關鍵性的影響力。艾夫的創新作品包括iPod、iMac、MacBook Air、iPhone和iPad。他對細節的狂熱關注超越表面的外觀。這些作品的關鍵特點在於使用的便利性和簡潔性。作為一個藝術設計師,艾夫與科技專家Steve Jobs密切合作,共同創造出具有藝術品味的科技產品。艾夫的標誌性設計象徵著當時處於低谷的蘋果(Apple)的復興和重返巔峰。在科技領域中,很少有設計具有如此大的影響力。艾夫的透明且豐富多彩、同時極簡潔的美學成為蘋果成功的關鍵所在。他為蘋果設計光滑且符合人體工學的產品,徹底改變科技設計,並為個人通訊設備建立新的美學標準。艾夫的設計方法受到Dieter Rams的影響。從美學和哲學的角度來看,Rams的設計原則貫穿艾夫的作品。艾夫於1992年加入蘋果,那時正是公司遭遇困難、幾乎面臨破產的時期。他對公司只專注於電腦科技感到擔憂,他說:「我曾擔心周旋於以電腦科技本位的事業部門,並涉足各種產品的廣泛領域會很困難。然而,出乎我的意料,這並未成為問題,因為我們設計的是包含許多不同組件的系統,包括耳機、遙控器、滑鼠、揚聲器和電腦。我喜歡在這些相對較新的產品類別中工作,專注於基礎的創新設計。即使只是參與一個產品的開發,也能立即改變整個產品類型和相關系統的歷史。」艾夫和蘋果的成功因素在於其設計工作室的運作方式,類似於一家外部設計公司,但只為蘋果這個單一客戶服務,並位於公司的核心位置。這個工作室的規模非常小而可控。儘管蘋果擁有數萬名員工,但艾夫的設計工作室只有約20名設計師和同樣數量的支援人員。最重要的是,艾夫的團隊有權將他們的設計實現為最終產品。艾夫的團隊主動參與產品的開發,而非僅僅被動設計。iMac和其他數十種產品並不是由蘋果的工程團隊主導,而是在艾夫的設計工作室中構思出來的。蘋果以前曾以工程為主導,但Jobs和艾夫改變這種思維,讓當時的蘋果非常重視設計。艾夫告訴《時代》(Times)雜誌:「物品和它們的製造是不可分割的。如果你了解一個產品是如何製造的,你就能在思考產品的外觀之前,了解它們的用途、工作原理以及應該使用什麼材料製造。這種工藝的概念正在復興。」艾夫與Jobs對此有著相同的看法,艾夫表示:「我清楚記得Jobs宣布,我們的目標不僅僅是賺錢,而是創造出偉大的產品。這種理念所做的決策與過去蘋果的決策截然不同。」Jobs和艾夫建立了一個強大的工作關係,這成為蘋果成功的核心,Jobs甚至稱艾夫為他在蘋果的「精神伴侶」。2012年,艾夫被英國皇室封爵。儘管獲得榮耀,艾夫強調:「我不喜歡獨自受到關注。設計、工程和製造這些產品需要大型團隊的努力。」台灣資通訊的學生往往搞不懂問題前就開始做專題。結果是浪費時間。我們應該牢記艾夫的話,在最初的設計下功夫: 「在設計過程的開始,一個小小的改變就能在最終產品中定義出完全不同的產品(A small change at the beginning of the design process defines an entirely different product at the end.)。」 
2024/4/17
智慧城鄉應用永續經營三關鍵
新竹縣政府主辦一場「智慧城鄉論壇」,我受邀擔任下半場綜合討論的與談人。題目為「以公私合作推動智慧城鄉發展」,由行政處長周秋堯及都市發展與環境教育基金會榮譽會長林建元共同擔任主持人,分享智慧城市發展前景與趨勢,及新竹縣面臨的機會與挑戰。會場聽眾詢問,新竹縣發展智慧城鄉的策略為何? 對於智慧城鄉應用的永續經營,我認為應該考慮3個問題:首先,要清楚區分必要與非必要(Must-have or Nice-to-have)。將智慧城市應用區分為「必備」或「可有可無」反映它們對日常生活產生影響的不同程度。在某些情況下,這些應用的存在或缺乏可能不會顯著改變城市居民的日常體驗。然而,必須承認這些應用的成功或失敗取決於它們的功能性以及它們是否能夠融入城市結構。以智慧家庭應用而言,電動窗簾大家都感新奇。但要花大錢建置,可能就無人問津。因此這是一個「可有可無」的應用,而非「必備」的應用。第二,需分析維運成本(CAPEX vs OPEX)。很多應用勉強建置,無力維護。智慧城市應用的失敗案例包括未能滿足期望或缺乏必要基礎設施的情況。此類缺陷可能包括使用者界面不足、數據處理效率低下或連接性不足。這些挫折強調在部署智慧城市解決方案之前,進行健全規劃和充分測試的重要性。台灣的失敗案例不勝枚舉,一個成功案例是YouBike,很務實地在許多台灣的城鎮提供服務。在中國大陸,很多類似YouBike的服務太過花俏,OPEX太高而失敗。第三,要能夠選擇有用數據(To data or not to data)。不知如何使用數據,就不會有智慧城鄉。我提出智慧農業的成功案例,是我們幫蘭花工廠進行非影像蘭花黑頭偵測的應用。城市最應該運用的數據是交通數據。而智慧路燈是最好的載具,應在現有的路燈掛上智慧平台,而非取代現有路燈系統。在台灣,許多智慧城市應用的存在與否並未對居民的日常生活產生顯著影響,他們的生活維持著往常的方式。而很多「必備」的智慧城市應用都是因為政府法規要求。在衛福部一個顯著而成功的案例是在醫療應用中推廣快速醫療互通資源(FHIR)。FHIR已成為醫療保健領域的一股變革力量,促進電子健康記錄的安全交流,並在各種醫療系統之間促進互操作性。其成功是對設計良好且有效實施的智慧城市應用在關鍵領域(尤其是醫療保健)中可能產生積極影響的明證。智慧城市應用失敗的主要原因是將簡單的問題複雜化,同時缺乏解決問題的實際行動力。很務實的解決上述3個問題,智慧城市有永續經營的機會。我給的答案,應該都適用於所有城市。
2024/4/2
羅夏克測試與大型語言模型
我一直嘗試將不同的工具和大型語言模型(LLM)結合,這是將傳統軟體工具進行數位轉型最快的方式。例如曾將魚骨圖管理加上ChatGPT,效果甚佳。接下來我想嘗試將LLM和羅夏克墨漬圖結合,進行心理投射測試時。然而,我嘗試將ChatGPT和羅夏克墨漬圖」(Rorschach Inkblot Test)結合,進行心理投射測試時,ChatGPT的表現就有點荒腔走板,言不由衷。羅夏克測試使用10個墨漬圖案,每個墨漬圖案幾乎具有完美的對稱性。其中5個墨漬是黑墨,2個是黑墨和紅墨,另外3個是彩色的。這些墨漬圖並非隨機或偶然的設計,羅夏克(Hermann Rorschach, 1884~1922)精心設計每一個墨漬圖,使其儘可能具有模棱兩可和「矛盾」的特點。羅夏克將墨漬圖開發為診斷精神分裂症的工具。後繼者則擴大使用於一般的個性測試。無論是在心理學還是文化上,這個測試本身有著驚人的生命力。羅夏克測試不僅僅關於你看到什麼,更重要的是你如何看待它。大多數的墨水渲染看起來像無意義的形狀,但羅夏克墨漬圖確實可以看出不同的東西,給個人的創造力留下空間,但這些墨水渲染也有一種真實的結構,可以客觀地檢查你所看到的東西是否符合標準或超出範疇。羅夏克是一位瑞士精神科醫生,曾師從榮格(Carl Gustav Jung)。相較於羅夏克,弗洛伊德是一位文字型的人,他的心理學完全關乎言語療法,因此早期如ChatGPT的LLM較容易插入(plug in)弗洛伊德的測試。羅夏克認為,看見比說話更深刻,我們如何看待事物更能展示出我們是誰。最近,多模式學習模型(Multimodal LLM)就更能適應羅夏克的測試。羅夏克在發明測試後不久就去世了,此測試在他無法控制的情況下朝著各種不同的方向發展。在美國,神祕的內在風格、個人魅力,是什麼讓你在人群中脫穎而出等特性,皆以不同羅夏克測試的變形版進行測驗。第二次世界大戰爆發,羅夏克測試被大量運用於臨床心理學領域。它被用於紐倫堡的納粹審判,也被用於越戰期間叢林中的農民。專家對於不同被測者的反應會有奇妙的解讀。例如,您如果在10張卡片中有4個以上的性(Sexual)回應,可能暗示存在精神分裂症;如果被測試者的性回應過少,可能暗示性挫折。羅夏克在墨點卡片濕潤的狀態下將它們沿中心軸對摺,使它們都具有對稱性,被測者很容易將它們旋轉90度,解讀它們像是水中的倒影。若被測者是罪犯,則鏡像回應被用來區分精神病患者和非精神病患者。對圖形細節的關注可以解釋為衝動或警覺性,亦即能夠看到他人忽視的事物。然而,如果過於關注細節,則可能表示對平凡事物的著迷,僵化的強迫性思維,有時還可能涉及偏執狂。之後有大量論文發表對各種對象的測試,有些光怪陸離,有些還頗為搞笑。羅夏克測試引發許多爭議,一些嚴謹的學者開始展開研究。一項於2013年進行的重要研究,回顧所有與該測試所聲稱測量的方面相關的研究,剔除不夠嚴謹的部分後,證實當前的羅夏克測試的可行性。這些墨水測試具有客觀的視覺特性,測試本身有著具體的歷史和用途,只要按照特定的方式運作,其結果就有意義。羅夏克測試顯然不是容易駕馭的工具,若能巧妙地以微調模型或檢索增強生成(RAG)融入LLM,其威力必然大增。
2024/3/20
香儂的智慧
香儂(Claude Shannon, 1916~2001)被譽為資訊理論之父。圖靈(Alan Turing, 1912~1954)則被稱為計算機科學之父。1943年,香儂和圖靈相遇於紐約市的貝爾實驗室。儘管他們的研究題目不同,他們討論彼此的工作,其中包括有關圖靈的「通用機器」。圖靈相當驚訝,香儂在一片程式碼和計算機的海洋中,將藝術和文化視為數字革命不可或缺的部分,將之稱為「數字DNA」。香儂在1943年告知圖靈夢幻般的想法,如今已經成為現實,因為所有媒體都以數位化呈現,涵蓋數百萬的「文化事物」和龐大的音樂收藏。香儂在藝術、訊息和計算之間建立的早期聯繫,直觀地描繪我們今天正在經歷的未來。圖靈在1950年發表論文〈計算機與智慧〉(Computing machine and Intelligence),首次談到人工智慧(AI),並提出「圖靈測試」,為資訊研究領域創建智慧設計的標竿。圖靈測試說,如果一台計算機能夠欺騙人類相信它是人類,那麼它就應該被稱為智慧計算機。香儂則直接訂出機器學習的目標: 「創造出擊敗世界冠軍的象棋程式;撰寫出能夠被知名文學期刊選用的優美詩歌;編寫能夠證明或反駁黎曼猜想(Riemann hypothesis)的數學程式;設計一款收益超過50%的股票選擇軟體。」今日,香儂的第一個目標已在2017年由AlphaGo達成。機器學習常見的做法,是將隨機事件相關聯的預期資訊量(expected amount of information)加以量化,並衡量概率分布之間的相似度。今日則被用作衡量概率分布訊息內容的指標,則是香儂提出的資訊熵(Shannon entropy)。香儂熵背後的基本概念是所謂事件的自資訊(self-information),有時也稱為驚奇性(surprisal)。自資訊的直覺是這樣的。當觀察到一個不太可能發生的隨機事件時,我們將其與大量訊息相關聯(這代表當不太可能發生的事件發生時,我們獲得極大的資訊量)。相反,當觀察到一個很有可能的結果時,我們將其與較小的資訊量相關聯。將自資訊視為「事件發生會造成我們多大的驚奇」非常有幫助。例如,考慮一個始終會落在正面的硬幣。任何硬幣投擲的結果都是完全可預測的,我們永遠不會對結果感到驚訝,這意味著我們從這樣的實驗中獲得的資訊為零。換句話說,其自資訊為零。如果硬幣的落地面的隨機性增加,則每次投擲硬幣時都會有一些驚奇,儘管超過50%的時間我們仍然會看到正面。因此,自資訊大於零。最大的驚奇量是在硬幣是公平不偏的情況下獲得的,即落在正面或反面的機會都是50%,因為這是硬幣投擲結果最不可預測的情況。基於上述非正式的需求,我們可以找到一個合適的函數來描述自資訊。對於一個具有可能值 x1, . . . , xn 和概率質量函數 P(X) 的離散隨機變量 X,任何介於0和1之間的正單調遞減函數都可以用作衡量資訊的指標。還有一個額外且重要的性質,那就是獨立事件的可加性;兩次相繼的硬幣投擲的自資訊應該是單次硬幣投擲的兩倍。對於獨立變量來說,這是有意義的,因為在這種情況下,驚奇或不可預測性的數量變為兩倍。藉由上述特性,香儂熵被應用於測量與一組概率相關的不確定性或資訊內容。香儂熵通常用於決策樹(decision tree)和其他AI模型,以量化數據集的不純度或混亂度。例如在決策樹算法中,香儂熵用作在每個節點上對數據進行分割的依據。目標是最小化熵,熵較低的節點被認為更「純粹」或更具資訊。為每種可能的分割計算熵,選擇導致熵最大程度減小的分割。這個過程在決策樹不斷增長的情況下進行遞歸性地重複,得到我們想要的答案。香儂在1948年提出資訊熵的概念,影響到80年後的今日機器學習的發展,真奇人也。 
2024/3/5
第一位程式工程師—愛達・勒弗雷斯
愛達・勒弗雷斯(Ada Lovelace)是19世紀英國一位成就卓著的數學家,浪漫詩人拜倫(George Gordon Byron)的女兒。她是史上第一位程式設計師。用現代的說法,她是開先河的「程式媛」、技壓理工男的女學霸。愛達出生不久父母離異,與母親相依為命。她的母親Annabella Milbanke熱愛數學,堅持讓女兒從小開始學習邏輯、科學和數學。在19世紀男性沙文社會,這些學科幾乎是女性的禁區,對這些學問感興趣並願意鑽研的女性是極為罕見的機會。愛達從小對機器著迷,19歲時嫁給了一位名叫金(William King)的貴族青年。他曾經教過她數學。 丈夫被冊封勒弗雷斯伯爵後,愛達・金夫人成為勒弗雷斯伯爵夫人。1833年,她遇到機械工程師巴貝奇(Charles Babbage),十分投緣,成為好友。巴貝奇提出了差分機與分析機的設計概念,其設計具有現代電腦的所有基本要素,分析機被認為是早期電腦的雛型,巴貝奇因此被視為電腦先驅。愛達對這個分析機極感興趣,悉心研究,1842年為這部機器編寫第一個程式,1843年在英國科學期刊上發表。後人視之為最早的電腦程式。愛達在論文中介紹如何為巴貝奇分析機創建代碼,用來處理字母、符號和數字。她還為這部機器創建一種重覆一系列指令的方法,這個過程被稱為「循環」(for loop),至今電腦程式還在使用。她建立循環和子程式概念,為計算程式擬定算法,寫出人類歷史上第一份「程式設計流程圖」。分析機從模型變成現實,經過100多年的時間。1940年代,英國科技奇人圖靈(Alan Turing)受愛達的論述和設想的啟發,開始建立現代電腦的理論。愛達於因治療子宮頸癌失血過多而去世,享年36歲,被安葬在諾丁漢父親拜倫的墓旁。她對電腦科學的貢獻當時無人關注,直到她去世後才被人發現。如今,愛達是成為科技界傑出女性的象徵。美國國防部紀念這位伯爵夫人在電腦領域開先河的貢獻,於 1980年將歷時20年研製成功的高級程式語言命名為Ada語言。那是公認第四代電腦語言的主要代表。為了鼓勵更多女生把科技事業作為人生追求,英國女權活動人士2009年發起倡議,每年規定一天作為主題日,舉行各種活動慶祝自然科學和工程技術領域中愈來愈多優秀的「理工女」跟「理工男」齊頭並進。這一天被命名為「愛達・勒弗雷斯日」,簡稱ALD,定在每年10月第二個星期二。愛達欣賞數學之美的能力是許多人,包括一些自認為是知識分子的人,所不具備的天賦。她意識到數學是一種美麗的語言,一種描述宇宙和具有詩意的語言。愛達擁有一種詩意的感性,使她能夠將方程式看作描繪自然物理壯麗的筆觸,就像她能夠想像「紅酒色的海」或「走在美麗中,像夜晚一樣的女人」一樣。但數學的吸引力更深;它是一種精神的表徵。數學「構成我們能夠充分表達自然界巨大事實的唯一語言」,她說,它允許我們描繪在創造中展開的「相互關係的變化」。這個工具的運用讓「弱小的人類思維,能最有效地讀懂造物主的作品」。 
2024/2/5
知識的傳播
知識傳播的機制隨著時間,持續演進。在實體書數位化後的今日,提到大量快速散布知識的機制,大家都公認是網際網路(Internet)。網際網路大量資訊的交替下,產生ChatGPT這種極端智慧的生成式人工智慧(generative AI),更對人類的知識演進有巨大影響。如果問起大量複製知識的始祖是誰,西方人都會說是古騰堡(Johannes Gutenberg, 1398~1468)。古騰堡最早印行的聖經甚至成為很多圖書館的鎮館之寶。我每次訪問耶魯大學,一定會到拜內克古籍善本圖書館(Beinecke Rare Book and Manuscript Library)朝拜其收藏的紙本古騰堡聖經,百看不厭。全書以拉丁文印行,每頁2欄,各42行,因此被稱為「四十二行聖經」(42-line Bible)。每當我來到美國加州洛杉磯,也會到杭庭頓圖書館(The Huntington Library)朝拜其收藏的另一本古騰堡聖經,這是羊皮版,字跡清晰,油墨沒有褪色或暈開。每次觀賞,都是不同的驚喜。杭庭頓圖書館也收藏英國第一本印刷書籍《特洛伊歷史故事集》(Recuyell of the Historyes of Troye),這作品原本是法國作家Raoul Lefèvre 創作於1464年的浪漫史詩,內容講述希臘神話中行俠仗義的英雄故事,具備中世紀騎士文學的色彩。英國之前都是靠手抄本流傳,直到William Caxton從歐洲大陸引進第一代印刷機。杭庭頓圖書館的主人Henry Huntington(1850~1927)有許多中國文物的收藏,但我找不到杭庭頓圖書館收藏最早的中國印刷書籍。現存世界上最古老的金屬活字本,是1377年高麗佛經《白雲和尙抄錄佛祖直指心體要節》一書。高麗的印刷術是學中國的。中國活字印刷術的發明早於古騰堡,但最早的中國印刷書籍卻已失傳。法國著名作家Rene Etiemble(1909~2002)稱「所謂古騰堡可能是印刷術的發明人」是歐洲本位主義的欺騙行為。根據沈括(1031~1059)的《夢溪筆談》,最早的活字印刷起源於1040年(宋朝),畢昇發明膠泥活字印刷術,替代雕版印刷術,包括制字、貯字、排版、拆板和刷印等一整套活字印刷術工序,與後世鉛字排版的原理完全相同。其後歷代出現各種活字鑄造技術,所使用的材料包括木頭、陶土、陶瓷、銅等。然而活字印刷在中國並未流行,仍然以雕版印刷為主。畢昇只是一位工匠,歷史文獻上甚至未曾保存他的完整生平事蹟及肖像。若非當官的沈括幫他記上一筆,後世可能根本不知道畢昇是何許人也。儘管中國比歐洲早400年發明活字印刷術,成就卻被漠視。近代的活字印刷術發明仍然歸功於古騰堡。在網際網路推動出巨大數據的AI時代,我期待「現代畢昇」的出現,為華人爭光。(國立陽明交通大學資工系終身講座教授暨華邦電子講座) 
2024/1/17
教育型機器人的作中學
科幻小說作家Isaac Asimov創造「機器人學」(Robotics)這個詞彙。他創作9篇短篇小說,收錄於《我,機器人》(I, Robot),描繪「正電子」(positronic)的發展,並探討這項技術的道德含義。正電子類似人類,是擁有人工智慧(AI)形式的機器人。機器人要模擬人類行為,很自然地會與AI結合,接下來又會衍伸出許多人文的議題。我演講時會問聽眾: 「人類和機器人結婚有意義嗎?」Asimov「機器人學」的框架極為宏大,包括機械工程學、資通訊電機學、心理學、社會學,甚至人類學。因此機器人相關的教育專題會成為STEM教育的很好實踐方式。STEM是一項跨領域、科目整合的教學方式,核心著重於科學(Science)、 科技(Technology)、工程(Engineering)及數學(Math),後續也延伸包含藝術(Art)。2023年12月,台灣教育界人士對108課綱的做法有許多爭議。我認為,解決方案是融合式的減法教育,其實就是STEM的精神。我更強調「作中學」的重要性,其中的實踐方式是讓學生進行融合不同學科的實作專題。很多人要我舉出實例,當中一例是我發展的EduTalk平台。另一個例子則是在新竹縣亞太美國學校舉行亞太區的教育型機器人競賽(VEX robotics signature events)。該賽事由機器人教育與競賽基金會(The Robotics Education & Competition Foundation) 主辦。這是全球最大的初中和高中機器人計畫,每年會以一場遊戲的形式呈現一個激動人心的工程挑戰。在老師和導師的指導下,學生們全年參與構建創新機器人並進行競爭。VEX機器人競賽可以在多個方面實踐STEM教育。首先, VEX這一類的機器人競賽透過提供親身參與的機會,激發年輕學生參與設計、建造和程式設計機器人的經驗。這種參與方式能從小引起對STEM領域的興趣,鼓勵他們進一步深入研究。參與競賽的學員將應用科學和工程原理,獲得實際的經驗。這種實踐式的學習方法,有助於彌合理論知識和實際應用之間的差距。這些競賽也同時強調團隊合作,分享看法,並善用多樣的技能解決複雜問題。這些合作經驗增進跨學科團隊共同參與創新項目。參與機器人競賽的學生可輪流在團隊中擔任領導角色,有助於培養領導能力、專案管理技巧和責任感。參與機器人競爭需要參與者以有創造性的方式應對挑戰並解決問題,從中培養批判性思維、適應性和韌性。參與學生會與來自產業的專業人士、導師和評審互動。這種接觸使他們瞭解當前產業實踐、標準和技術進步,為學生應對專業STEM領域的期望做好準備。在這次比賽戰況激烈。冠亞軍一直平手。在閉幕典禮時,朱家明校長邀請我頒獎。頒獎時,我講5分鐘鼓勵學生的話。我放了3部影片,是我的研究團隊及夥伴進行整合AI及機器手臂的成果,希望藉此擴大學生們的視野。最後我給學生一句話: 「享受進行專案的樂趣,快樂的玩耍吧。」學生不只要「作中學」,更要「學中樂」。(現為國立陽明交通大學資工系終身講座教授暨華邦電子講座)     
2023/12/28
深度偽造技術
Nikola Tesla(1856~1943)在1890年代預言「21世紀時,機器人將取代古代文明中奴隸勞動所佔據的位置。」這項預言在當今的人工智慧(AI)技術的發展下似乎正在實現。早期的AI技術已經能夠大致準確地分辨狗和貓的圖片,隨著生成式人工智慧(generative AI)的突破性發展,它逐漸深入我們的生活並引領著社會變革。當AI技術進入深度偽造(DeepFake)的層次,將會加速我們進入元宇宙世界,實現Tesla的預言。深度偽造是一種透過電腦生成的影片技術,用於創造看似真實的虛假影像。它使用AI技術將一個人的臉替換為另一個人的臉,同時匹配微小的面部表情,從說話到皺眉都能保持一致。這項技術利用深度學習算法和大量訓練數據生成逼真的影片,使觀眾難以區分真實和偽造的影像。製作一個臉部交換的視頻通常需要以下步驟:首先,使用編碼器處理2個人數百萬張的照片。編碼器是一個AI系統,用於尋找並學習2個臉部之間的相似之處,並將這些相似之處簡化為共同的特徵,並壓縮圖像。然後,使用一個名為解碼器的第二個AI系統,從壓縮的照片中恢復出臉部。你訓練一個解碼器來恢復第一個人的臉部,另一個解碼器來恢復第二個人的臉部,因為這兩張臉是不同的。當需要進行臉部交換時,只需將編碼的照片輸入「另一個」解碼器。例如,將某甲的臉部壓縮圖像輸入已經訓練過某乙的解碼器。然後,解碼器使用某甲的表情和面部定位來重建某乙的臉部。為了製作逼真的影片,這個步驟必須處理每一幀畫面。現今,訓練某甲與某乙臉部的模型,以及在影片中合併臉部的過程,幾乎可以即時完成。早期有名的深度偽造例子包括2個假影片:美國前總統Barack Obama稱呼川普(Donald Trump)為「完全蠢貨」和Mark Zuckerberg吹噓對數十億人的被盜數據擁有絕對控制。我們在烏克蘭的戰爭中也見證假影片的應用,以及使用知名人物臉孔的成人內容。然而,深度偽造技術也可能被用於音頻和圖像,大部分國家禁止未經同意且具有邪惡目的的深度偽造使用。不過,除了潛在危險性,深度偽造技術在一些有趣且輕鬆的應用中也顯示出潛力。例如,將深度偽造應用於教育領域,可以使課堂更有趣。想像一下,在英文課堂上,可以邀請虛構的名人來講解課程,例如劉德華。雖然使用真實人物的深度偽造可能會被視為非法,但是使用不存在的人物則可以避免法律問題。企業也開發並銷售深度偽造服務,以實現自動化新聞播報,甚至減少演員的參與,節省成本。例如,TikTok 上就有一個深度偽造的阿諾史瓦辛格(Arnold Schwarzenegger),使用俄語講話,省去了他學習俄文的功夫。深度偽造技術的應用範圍廣泛且多樣,但我們必須謹慎使用,以避免濫用和潛在的負面影響。只有在合法、道德且有創意的方式下,才能充分發揮深度偽造技術的潛力。(作者為國立陽明交通大學資工系終身講座教授暨華邦電子講座) 
2023/12/15
智慧農業與品茶之道
英國友人找我談智慧農業,詢問能否檢驗茶的品質,此難度雖高,但有機會以我們發展的物聯網技術AgriTalk完成其願望。AgriTalk已有能力完成水質品評,因為我們曾經建置智慧漁塭養殖,已經有分析水的基本知識與經驗,知道如何利用水底感測器來量測水的硬度與酸鹼值計算方式,可以進行茶水的分類品評。茶葉的分類也辦得到,在茶葉發酵與烘焙過程,AgriTalk能以感測器(溫溼度等)監測,再利用基因定序,可以品評6種不同發酵程度和不同烘焙程度的茶。真正的挑戰是茶的風味,仍然依靠專家的感官來品評,包括氣味、味道以及口感。現今電子鼻的感測準確度遠遜於常人,遑論專家。味覺感測器發展仍在初階,而口感更難定義。我們仍有很大努力空間。英國友人說他們愛喝茶已到了上癮程度。在冷戰時期,英國怕被蘇聯丟原子彈,蓋了避難室。接下來絞盡腦汁地想,如何將大量的茶葉擠進避難室,供應英國佬喝下午茶。在英國的國家檔案館內有一份1955年英國食品部的極機密文件,當中寫著,核戰後茶的供應將非常吃緊,每個人平均每周吃不到一盎司,嚴重影響英國人「身心健康」。為了反諷英國人的愛喝茶,弗萊明(Ian Lancaster Fleming,1908~1964)將筆下的007龐德形容成不愛喝茶的人。傳聞英國女王喜歡中國的綠茶。我曾為文提到英國女王與北埔「東方美人」茶的故事。發表之後,峨眉鄉林文秀先生特地告知我,最頂級的東方美人茶主要生產地是在北埔旁邊的峨眉鄉。北埔是茶葉集散地,峨眉的茶都送到北埔來販售,兩地陪襯,相得益彰。林先生有雄心壯志,希望在峨眉鄉塑造一個「東方美人街」,形成峨眉文化商圈,帶動地方建設。他帶我到峨眉鄉的幾個茶廠見識。其中徐耀良茶園及楊隆茶園的產品曾多次在全台灣的競賽中贏得冠軍。我品嘗2個茶園的東方美人茶之後,果然花香、果香、茶香滿溢,東方美人茶的茶樹在小綠葉蟬的叮咬下,防禦機制產生自然反應,散發出花果蜜香,成就了特殊風味,遠勝於過去我喝過的茶。我詢問其種植方式,他們都毫不藏私地與我分享。我綜合其說法,種茶之道無他,細心及耐心是重點。當中有些需要耐心的工作可以利用物聯網、大數據及人工智慧(AI)技術進行,我相信科技化後的東方美人茶必大有可觀。
2023/12/4
AI時代企業的關鍵機會和思維
隨著人工智慧(AI)技術發展,人工智慧已深入人類生活。為了讓產業、政府和學術界能夠理解AI、GPT等科技的重要性及未來趨勢,中華政大企業管理協會特別舉辦年度企業論壇,邀請國內專家探討AI時代的產業策略,期許台灣把握人工智慧的機會,引領世界經濟向前。我被邀請給一個主題演講(Keynote Speech),在論壇分享「AI時代企業的關鍵機會和思維」, 以智慧城市的發展前景引導出台灣在AI時代的優勢和發展策略,並探討企業在這個時代所需具備的關鍵能力和思維,以及AI對人類所帶來的挑戰和影響。為了因應AI所帶來的挑戰,我呼籲大家學習電腦語言(如Python),因為在未來,電腦語言將成為不可或缺的技能,並能夠增強個人的競爭力。今日電腦語言已愈來愈人性化,形同學習英文或日文,大家不應害怕排斥。同時,我也提到在AI時代,數據的重要性變得非常突出,但我們必須注意數據的正確性和可靠性,因為數據的錯誤可能導致AI錯誤預測的結果。因此,我們應該重視有效管理和處理大量乾淨的數據,同時也要關注隱私和法規問題,確保數據的合法使用,避免引發法律爭議。我以白草莓病害偵測為例,經由生成對抗網路(GANs)生成圖片訓練演算法,我能將病變偵測的準確率由87.50%提升到 96.88%。另一個例子,梅約診所(Mayo Clinic)和NVIDIA、MGH&BWH臨床數據科學中心合作,使用GANs創建「假」腦部核磁共振掃描。他們發現,通過訓練算法於這些「假」醫學圖像和10%真實圖像,可以成功識別腫瘤,避免昂貴且艱鉅的真實圖像收集。關於企業在AI時代應該如何把握關鍵機會,我以公司部門改造為例,提出了以下步驟。首先,工作人員應該將年度目標與關鍵成果OKR(Objectives and Key Results)置於一旁,優先找出日常工作中的瓶頸。接著,尋找適合的AI工具,或者藉由詢問ChatGPT等技術來撰寫能夠串連API的程式,進行自動化。完成後,進行測試,一旦成功,便可將自動化流程固定下來。我最後強調,AI在現代社會中已變得不可或缺,我們不應忽視數據集中和計算力的重要性,也應更深入地思考和探討如何應對AI的發展和應用,因應未來AI所帶來的變革和挑戰。同時,我們也應更積極地應用AI來解決社會問題,改善人們的生活,期待AI能在未來帶來更多的驚喜,為社會創造更多的福祉和進步。
2023/11/20