香港大學(xué)李嘉誠醫(yī)學(xué)院(港大醫(yī)學(xué)院)、InnoHK醫(yī)衞大數(shù)據(jù)深析實(shí)驗(yàn)室(InnoHK D24H)及倫敦衛(wèi)生與熱帶醫(yī)學(xué)院的跨學(xué)科研究團(tuán)隊(duì),成功開發(fā)全球首個(gè)能同時(shí)進(jìn)行甲狀腺癌分期及風(fēng)險(xiǎn)評級的人工智能(AI)模型,其準(zhǔn)確率更突破90%。這項(xiàng)創(chuàng)新的AI模型,預(yù)計(jì)可縮減前線醫(yī)護(hù)人員診前準(zhǔn)備約一半時(shí)間,亦能配合香港特別行政區(qū)政府推動(dòng)醫(yī)療AI應(yīng)用的政策。相關(guān)研究成果已發(fā)表於期刊《npj Digital Medicine》。
現(xiàn)時(shí)甲狀腺癌診斷標(biāo)準(zhǔn)主要採用以下兩大國際系統(tǒng)∶美國癌癥聯(lián)合委員會第八版(AJCC/TNM)分期系統(tǒng);美國甲狀腺協(xié)會(ATA)風(fēng)險(xiǎn)評級系統(tǒng)。然而,現(xiàn)行作業(yè)模式操作過程既耗時(shí)又欠缺效率,有可能延誤關(guān)鍵治療時(shí)機(jī)。
研究團(tuán)隊(duì)成功開發(fā)一款A(yù)I輔助工具,該系統(tǒng)運(yùn)用大型語言模型技術(shù)(如ChatGPT和DeepSeek),專為分析人類語言、解構(gòu)臨床文件而設(shè)計(jì),能顯著提升甲狀腺癌分期與風(fēng)險(xiǎn)評級的準(zhǔn)確性及效率。
此模型採用4種離線開源大型語言模型,包括 Mistral、Llama、Gemma以及 Qwen。團(tuán)隊(duì)通過整合4種大型語言模型的輸出結(jié)果,成功提升AI系統(tǒng)的整體表現(xiàn)。在ATA風(fēng)險(xiǎn)評級方面,準(zhǔn)確率介乎88.5%至100%;而在AJCC癌癥分期方面,準(zhǔn)確率亦達(dá)到92.9%至98.1%。相比傳統(tǒng)以人手審查文件方式,這項(xiàng)技術(shù)預(yù)計(jì)可以將醫(yī)護(hù)人員診前準(zhǔn)備工作時(shí)間縮減約一半。
港大醫(yī)學(xué)院臨床醫(yī)學(xué)學(xué)院家庭醫(yī)學(xué)及基層醫(yī)療學(xué)系名譽(yù)副教授黃競浩博士闡釋,政府大力推動(dòng)醫(yī)療AI的應(yīng)用,例如醫(yī)院管理局最近推出利用大語言模型建立的醫(yī)療報(bào)告撰寫系統(tǒng)便是有力證明。為配合政府的倡議,下一步將會用大量真實(shí)病人數(shù)據(jù)評估這個(gè)AI輔助工具的表現(xiàn)。一旦驗(yàn)證成功,這個(gè)AI模型可以迅速應(yīng)用於臨床和醫(yī)院環(huán)境,幫助醫(yī)護(hù)提升運(yùn)作和治療效率。
該項(xiàng)研究由港大醫(yī)學(xué)院的公共衛(wèi)生學(xué)院羅旭龢基金教授兼InnoHK D24H董事總經(jīng)理胡子祺教授、臨床醫(yī)學(xué)學(xué)院外科學(xué)系臨床助理教授兼內(nèi)分泌外科主任馮文謙醫(yī)生,以及臨床醫(yī)學(xué)學(xué)院家庭醫(yī)學(xué)及基層醫(yī)療學(xué)系名譽(yù)副教授兼InnoHK D24H高級研究項(xiàng)目總監(jiān)黃競浩博士領(lǐng)導(dǎo)。共同第一作者包括來自InnoHK D24H的鄧皓文博士和吳婷婷博士。
圖説:港大醫(yī)學(xué)院研究團(tuán)隊(duì)開發(fā)全球首個(gè)用於甲狀腺癌診斷的AI模型,準(zhǔn)確率超過90%,能大幅縮短診前準(zhǔn)備時(shí)間。該研究由胡子祺教授(中)及馮文謙醫(yī)生(右三)領(lǐng)導(dǎo)。