同態加密結合ASIC、GPU 深度學習可望兼顧安全與速度
長期投入前瞻科技的國研院國網中心,不光在多個領域都有相當豐富的研發成果,也積極參與國際組織的合作與競賽,除希望藉此掌握最新國際趨勢,也希望讓台灣的技術能量被世界看見。如由美國國家衛生院舉辦的iDASH隱私與安全研討會,主要是推動隱私安全在人體的基因研究上,特別是隨著基因研究範圍日廣,在資料量大幅增加下,須借重雲端運算資源,才能縮短資料分析的時間。
iDASH 2020年的競賽主題為安全的多標籤腫瘤分類。國網中心參與2021年關於COVDI-19病毒株的分析活動。在符合隱私、安全的前提下,國網中心建立一個使用同態加密的 1D CNN環境,該環境是在4核心處理器搭配32GB記憶體,以8,000筆資料進行AI模組訓練。這是類似2014年CryptoNets 的圖像分類概念,能縮短判別COVID-19病毒種類,如英國變種、非洲變種、巴西變種、美國變種等。
國網中心研究員林俊鈺說,問世多年的同態加密技術,最大特色在於能夠進行端到端之間的全程加密,包含資料傳輸、計算、儲存等階段,都能透過密文進行,且無需進行解密動作,在現今盛行的雲端計算趨勢下,無異是對隱私保護相當有潛在吸引力的技術。我們開始投入同態加密技術應用於深度學習領域一段時間,開始掌握相關技術特性,並透過參與iDASH 2021 競賽,學習國際上其他團隊的進展,也探索這個前瞻加密技術在全球疫情下的應用。
發展多時的同態加密技術,在2009年有很大突破, Gentry 提出全新的策略,即是同態重加密(Homomorphic re-encryption),透過刷新密文方式解決了過去難以完成的同態加密計算,使同態加密與可應用的距離又近了一步。而它背後所使用的加密方法,也是後量子加密法的候選者之一,目前尚未有量子演算法能輕易攻擊,可減少被未來量子電腦破解的機率。
擴大開放政府效益 開啟專案研究契機
國網中心會投入同態加密技術應用領域,起源於2020年拜訪行政院政務委員唐鳳時,討論到對於開放政府資料應用模式,以及後續衍生的資料安全問題。在迎合開放政府資料的國際趨勢下,台灣在政府施政透明、提升民眾參與公共政策議題是世界各國政府推動的趨勢,行政院推動第四階段電子化政府發展時,透過成立開放政府資料平台,亟盼善用民間無限創意,整合運用政府開放資料,發展各項跨機關便民服務。根據2017年開放知識基金會(Open Knowledge International)公布最新的全球開放資料指標(Global Open Data Index)評比結果,台灣榮獲全球第一名的肯定。
林俊鈺表示,雖然公務機關提供的政府開放資料,都是透過去識別化後的資料,不過有些單位仍擔心有違反個資法的疑慮,因而對開放資料採取相對保守的態度,所以當時討論將同態加密技術應用於深度學習領域的可能性,以減少公務機關的疑慮。不可否認,在現今通用電腦的環境中,採用同態加密技術確實會影響資料處理速度,甚至可能高達數十倍或千倍以上。但對於非急迫性的應用環境,在考量資安與速度下,即便處理時間從1分鐘延伸到1小時,整體而言應仍然屬於可接受的範圍。
若要解決使用同態加密技術時,深度學習執行速度過慢的問題,也能藉由專屬的ASIC晶片、GPU,搭配重新優化過的RNS 和 NTT 等機制改善。如此一來,即可達到改善深度學習的速度,對於近來熱門的聯邦式學習也將是一大助力。