台灣杉資源加持台大ICD10自動編碼邁向商業化

在左側輸入病人病歷,送出後右邊將顯示ICD10代碼預測結果。(賴飛羆)

為讓各國病患能獲得持續性、完善的照護服務,多年前WHO開始制定一套國際疾病分類(International Statistical Classification of Diseases and Related Health Problems),作為全球衛生趨勢和統計數據的基礎,讓各地衛生專業人員,能夠通過共同語言來交換世界各地的衛生資訊。簡單來說,醫師在問診過程中,可根據病患的回答與實際檢查結果,以及後續進行的手術或處置,依照 國際疾病分類規範進行後續的病歷編碼工作。目前國際主流是國際疾病分類標準第十版(ICD-10,10th revision of the International Statistical Classification of Diseases and Related Health Problems) ,台灣健保署也依照此規範,作為後續醫療院所申請健保給付的分類表準。
隨著AI技術成熟,且被大量應用在醫療領域後,台灣大學資訊工程學系教授賴飛羆帶領團隊將此技術應用於病歷編碼。該團隊聚焦在「ICD10的自動編碼」與「基因變異與疾病關係判讀」等領域,其所開發的「台大醫神-精準醫療人工智慧輔助決策系統」,在診斷碼與處置碼的生成過程當中,準確率分別已接近83%與70%。
台大資工系教授賴飛羆指出,傳統病歷編碼工作必須由病歷編碼師檢視病患的看診、住院資料,並確認當次治療的疾病種類後,進而產出相對應的診斷、處置碼,藉此向健保署申請費用。而當病患本身有多種疾病時,如高血壓、糖尿病等,在治療過程中就必須耗費多時檢視病歷相關內容,並搭配過往的經驗,再從中找出與本次治療相關的項目後,才能產出合適的診斷、處置碼,進而向健保署申請當次治療費用。
由於醫療院所面臨人力嚴重不足的問題,病歷編碼師工作非常繁重,長期下來難保不會發生分類錯誤,導致申請健保費用損失的問題。如此一來,病歷編碼師勢必得再重新進行分類、申報費用等。因此在減少醫師、病歷編碼師工作時間,同時加快看診速度、減少臨床錯誤等前提下,賴飛羆團隊運用AI搭配技術,投入 ICD10的自動編碼專案,期盼能夠幫助醫療產業提升整體服務品質,以及提高健保申報正確率,目前整體成績非常亮眼。

GPU算力、大容量記憶體助陣 大幅縮短專案時程

若要提高 ICD10自動編碼專案的準確率,勢必得借重GPU運算資源進行AI模型訓練。過往賴飛羆團隊在科技部計畫補助下,已有購買具備GPU卡的AI伺服器,只是在有限的GPU運算力及記憶體數量下,每次只能進行一種資料分類的模擬訓練,且最多只能設定batch size為16,每次運算結果需等待24小時後才能得知。後來再度於科技部支援下,順利改用國研院國網中心TWCC臺灣AI雲資源後,讓ICD10自動編碼專案的AI模型訓練結果有很大進步。
賴飛羆團隊表示,以往AI模型的參數調整之後,在單一台AI伺服器上執行後,得花上1天才知道結果,團隊的整體思考模式很容易被打斷、也不容易連貫。現在改用國網中心的運算資源,受惠於GPU運算力大增、記憶體容量也變大,除batch size增加到32外,也可同時執行2-3個AI模型訓練,且只需一個小時就能得到結果。如此一來,不僅節省許多時間,團隊成員可當下可立即進行討論並修正方向,對於專案進度與成果的幫助非常明顯。
由於國網中心的TWCC臺灣AI雲平台支援平行運算架構,所以在賴飛羆團隊規劃中,未來不排除修改運算架構,以便能同時運用多個GPU晶片,搭配增加每次使用的資料量,儘速讓 ICD10自動編碼商業化,讓更多醫院都能享受到AI結合醫療帶來的效益。
文章來源:本文擷取自DIGITIMES。
台灣大學資訊工程學系教授賴飛羆帶領團隊,(左起)亞東醫院醫療事務處保險課邱琦皓組長、陳冠至醫師、醫療事務處林裕誠主任、賴飛羆教授、陳沛甫醫師、研究生廖偉智。 (台灣大學)