智慧應用 影音
EVmember
榮耀會員

數據取得、標準化難 醫療AI/ML模型現階段幫助有限

疫情加速數位化,也讓英美等國開始反思醫療AI/ML模型數據代表性的問題。法新社

英國The Alan Turing Institute日前發布《COVID-19(新冠肺炎)中的資料科學與人工智慧》(Data science and AI in the age of COVID-19)報告,指出在疫情之下,人們看似仰賴資料與AI/ML輔助醫療相關的決策,但在健康醫療領域當中,AI/ML的發展還是出現不少問題。

據Wired報導,疫情加速各領域的數位化。在醫療領域當中,疫苗開發和臨床試驗都突破時間紀錄。但是該報告卻指出,AI/ML並未在過程中扮演關鍵角色,甚至幾乎所有的COVID-19症狀AI/ML診斷工具都有缺失。

演算法與健康數據的結合並不容易。Wired比喻,Facebook等社群媒體可以透過成千上萬筆照片來提升演算法人臉辨識的正確性,但在醫療領域卻是另一回事。由於醫學影像、心電圖,或是自穿戴裝置取得的資料皆非常不同,這些資料更可能受到生活型態與其他雜訊影響,而未能反映實際健康狀況。

亞利桑那州立大學副教授Visar Berisha警告,AI/ML的長處是找到特定的模式,當科技公司以為找到「正確」答案時,往往是因為資料量有限的關係。這不但形成了盲點,助長AI狂熱,也無法套用在實際臨床情況。在一項阿茲海默症的研究當中,研究者發現相較於較少量的資料,大量的資料反而讓預測較「不準確」。也就是說,實際狀況遠比演算法取得的資料複雜許多。

要精進醫療AI/ML模型,必須要有大量且均衡的資料。然而2020年,一項史丹佛大學的研究發現,全美的醫療深度學習模型中,有71%的資料來自於加州、麻州與紐約州。不僅凸顯科技發展的不均衡的問題,也可能導致AI/ML模型的誤差,影響弱勢族群權益。

報告總結,目前醫療AI資料面臨三大困境,包括是否具有相關資料(availability)、是否能夠取得相關資料(access),以及資料的標準化(standardisation),同時也指出AI/ML模型的資料必須均衡代表各族群。

  •     按讚加入DIGITIMES智慧應用粉絲團
更多關鍵字報導: COVID-19 智慧醫療 AI