重新去中心化數位科技強化國人隱私保護

行政院政務委員唐鳳。(國網中心)
人工智慧(AI)技術所發展的多樣化智慧型應用驅動科技產業快速發展,AI技術是由資料定義的程式碼來運作,因此資料蒐集成為AI應用發展的關鍵,對於健康醫療大數據分析、精準醫療等重要的先進醫療與創新應用,皆需仰賴高數量資料做為開發基礎,但隱私保護的疑慮讓資料提供者產生擔憂,而降低資料品質或提供意願,進而產生一連串惡性循環,所以強化隱私技術的重要性,除了關係著個人隱私保護外,對於國內AI技術能否順利發展有重大的意義。
現今的數位架構是將資料儲存與傳輸集中在關鍵的伺服器端點上,個人資料保護法在2012年制定,政府也在法規監理上透過數位科技做出更大的保護,針對具爭議未去識別化處理的資料內容,因為缺乏獨立專責監管機構,恐有洩露之虞,礙於立法與凝聚共識的不確定時間,於是期盼透過數位科技先行,轉而尋求藉由隱私強化技術(Privacy Enhancing Technologies;簡稱 PETs)的協助,建立技術上的防線,以駕馭數位時代的資訊安全需求。
行政院政務委員唐鳳表示,看到PETs科技上的潛力對隱私保護取得重要進展,他提出「重新去中心化(Re-decentralization)」的概念,提供政府做為施政時的重要輔助技術。這種能保護民眾隱私權的先決條件下,協助公共政策的執行,對保護個人數位資訊上有重要的貢獻。考慮到民眾通常不會感受到技術隱身其中所扮演的角色,唐鳳以最近的簡訊實聯制範例進一步說明這個技術的實用性。

簡訊實聯制採用重新去中心化概念 成為隱私保障典範

COVID-19將隱私保護技術推上防疫第一線,藉由數據串聯輔助疫調,一舉讓科技防疫介入公衛醫療系統。2021年COVID-19的疫調工作,政府推動簡訊實聯制防疫管制措施。民眾進入商店時,無需另外下載APP,只需使用手機掃描QRCode、傳送簡訊至「1922」,即可將個人行動足跡紀錄,提供給指揮中心防疫使用。
簡訊實聯制將民眾足跡的個資轉換成代碼,透過簡訊資料在電信業者的雲端機房存放28天,簡訊資料放在不同電信商的不同平台中。這個概念類似於安全多方計算(Secure Multi-Party Computation,簡稱SMPC)協議,只有當疫調人員需要查核足跡時,才將散落在不同平台上的加密資料組合起來,像拼圖一樣拼貼個別資訊片段,再經過編譯才能解出完整資料與地點的訊息。
流程中的任何一方,都只能看到無意義的片段:店家無法取得民眾的手機號碼,電信業者也無法解鎖商家的場所代碼,因此無法洩漏民眾個資。目前超過20億筆的實聯制簡訊,僅有約1100萬筆資料,因為疫調之需而被解譯出來使用,其他都已經永久刪除。
PETs技術就像一個工具箱,羅列多種先進技術,以解決使用在不同領域的資料保護,以差分隱私(Differential Privacy)技術為例,資料透過差分處理,將資料內容拆分不同部分,可避免資料集透過逆向工程的技術而還原,或是利用統計特徵反推單一記錄的原始內容,這些特性都將做到個資隱私的保護。
唐鳳在入閣前,曾經協助國際大廠進行語音助理在地化的工作。當時針對不洩露語音樣本內容的爭議,就是利用差分隱私的技術,擷取許多樣本中的零星特徵資料進行學習,因此無虞資料會被還原而被識別。當數據規模夠大時,還可收斂到呈現當地的口音特色,做為機器學習的重要資料集,進而提升或調教語音助理的辨識能力,不用擔心真人語音被洩露出去。

國網中心為PETs技術提供開放式創新的發展環境

上述這些,無論是安全多方計算、差分隱私或同態加密(Homomorphic Encryption, 簡稱HE)等新興的PETs技術,都需要大量的高效能運算資源,唐鳳期待具備國家超級電腦與基礎設施的國研院國網中心,除了匯聚運算資源以支持產、學、研機構的PETs技術之外,還希望透過科普,介紹給大眾了解隱私保護技術的重要性,對於隱私權的保護能夠起教育民眾的效果。
國網中心提供一個可預測、高信賴且費用合理的高速運算服務,其扮演國內研究PETs技術的主要啟動者角色,可協助降低新科技發展前期的高額研發成本,一旦科技普及後,就可成為開放式創新的方式提供使用與驗證,讓產業界與其他科研單位共同分享成果,無形中PETs技術成果得以全民共享,也促成科技民主化的進程,每一個人都可以將成果用在符合公眾利益的應用上,並從中受益。
未來當PETs技術普及後,重要的個人隱私與個資可以用來發展智慧型應用,成為增進國家治理能力的得力幫手,例如從針對個人的精準醫療,進而到一般健康民眾的精準健康、智慧照護的應用,協助臺灣朝數位國家的方向邁進。
文章來源:本文擷取自DIGITIMES。