科研成果在權(quán)威期刊發(fā)表:AI系統(tǒng)能讀懂病歷,診斷準(zhǔn)確率超過(guò)年輕醫(yī)生
核心閱讀
最近,一項(xiàng)利用人工智能技術(shù)診斷兒科疾病的科研成果公布。用納入系統(tǒng)的55種常見(jiàn)兒科疾病和部分危急重癥作測(cè)試,該人工智能系統(tǒng)診斷準(zhǔn)確率超過(guò)了一般年輕醫(yī)生。目前,系統(tǒng)已經(jīng)在急診分診、門診中臨床應(yīng)用,對(duì)一些兇險(xiǎn)的、有可能威脅生命的重大疾病、罕見(jiàn)病,同樣可以輔助醫(yī)生診斷。
這次,真的有上規(guī)模研究實(shí)證,人工智能技術(shù)臨床診斷可以媲美人類醫(yī)生了。
北京時(shí)間2月12日零時(shí)14分,國(guó)際頂級(jí)醫(yī)學(xué)科研期刊《Nature Medicine》在線發(fā)布了題為《使用人工智能評(píng)估和準(zhǔn)確診斷兒科疾病》的文章。該文章由廣州市婦女兒童醫(yī)療中心與依圖醫(yī)療等企業(yè)和科研機(jī)構(gòu)共同完成。
這是全球首次在頂級(jí)醫(yī)學(xué)雜志發(fā)表有關(guān)自然語(yǔ)言處理(NLP)技術(shù)基于中文文本型電子病歷(EMR)做臨床智能診斷的研究成果。
該研究成果表明,以后,人工智能也能看病了,而且醫(yī)術(shù)不低,拿納入系統(tǒng)的55種常見(jiàn)兒科疾病和部分危急重癥作測(cè)試,診斷準(zhǔn)確率超過(guò)了一般年輕醫(yī)生。
讀懂病歷診斷準(zhǔn)確
已在醫(yī)院臨床使用
這個(gè)人工智能系統(tǒng)“醫(yī)術(shù)”不低。
它看病就像人類醫(yī)生一樣。醫(yī)生將患者主訴、癥狀、個(gè)人疾病史、體格檢查、實(shí)驗(yàn)室檢驗(yàn)結(jié)果、影像學(xué)檢查結(jié)果、用藥情況等信息輸入病歷文本,系統(tǒng)自動(dòng)將自由病歷文本轉(zhuǎn)換成規(guī)范化、標(biāo)準(zhǔn)化和結(jié)構(gòu)化的數(shù)據(jù)?!白x懂”病歷后,系統(tǒng)給出診斷結(jié)果。
診斷準(zhǔn)確率還挺高。以呼吸系統(tǒng)疾病為例,對(duì)上呼吸道疾病和下呼吸道疾病的診斷準(zhǔn)確率分別為89%和87%,而在上呼吸道疾病診斷中,急性喉炎和鼻竇炎的準(zhǔn)確率分別高達(dá)86%和96%,對(duì)不同類型哮喘的診斷準(zhǔn)確率從83%到97%。同時(shí)對(duì)普通系統(tǒng)性疾病以及危險(xiǎn)程度更高的疾病也有很高的診斷準(zhǔn)確率,例如傳染性單核細(xì)胞增多癥(90%)、水痘(93%)、玫瑰疹(93%)、流感(94%)、手足口?。?7%)、細(xì)菌性腦膜炎(93%)。
這好像有點(diǎn)超出我們的接受程度,但研究歸研究,實(shí)踐了嗎?別急,研究團(tuán)隊(duì)還真的進(jìn)行人機(jī)大戰(zhàn)檢驗(yàn),后來(lái)還在醫(yī)院真刀真槍臨床使用了。
研究人員隨機(jī)抽出12000份患兒病歷,一邊是人工智能,一邊是廣州市婦女兒童醫(yī)療中心的20位兒科醫(yī)生。20位“參賽”兒科醫(yī)生按年資和臨床經(jīng)驗(yàn)高低分成5組,結(jié)果顯示,人工智能診斷準(zhǔn)確率的平均得分高于前兩組低年資醫(yī)生,接近三組高年資醫(yī)生。
今年1月1日,該系統(tǒng)在廣州市婦兒中心進(jìn)入臨床應(yīng)用,1月1日至1月21日短短20天,該院醫(yī)生已實(shí)際調(diào)用它開(kāi)展輔助診斷30276次,診斷與臨床符合率達(dá)到87.4%。
廣州市婦兒中心醫(yī)務(wù)部主任孫新談了使用體會(huì),他說(shuō),這套系統(tǒng)會(huì)對(duì)疾病進(jìn)行分組分類細(xì)分。比如在最常見(jiàn)的呼吸系統(tǒng)疾病中,這個(gè)系統(tǒng)會(huì)先按上呼吸道和下呼吸道進(jìn)行區(qū)分,再按喉炎、氣管炎、支氣管炎、肺炎細(xì)分,比較科學(xué)。
會(huì)“看圖”能“識(shí)字”
深度學(xué)習(xí)醫(yī)學(xué)知識(shí)
機(jī)器會(huì)看病,在于機(jī)器深度學(xué)習(xí)“病歷”、醫(yī)學(xué)知識(shí),有了病種庫(kù)后,建立診斷模型。
與以往人工智能系統(tǒng)不一樣的是,該系統(tǒng)不僅會(huì)靜態(tài)看圖,還會(huì)“識(shí)字”,學(xué)習(xí)的數(shù)據(jù)量之大前所未有。依圖與廣州市婦兒中心進(jìn)行合作,收集了該中心在2016年1月至2017年7月間的56.7498萬(wàn)個(gè)門診病人的136.2559萬(wàn)次問(wèn)診電子病歷,抽取到覆蓋初始診斷包括兒科55種病例學(xué)中常見(jiàn)疾病的1.016億個(gè)數(shù)據(jù)點(diǎn)。
其次,突破病歷文本語(yǔ)言和計(jì)算機(jī)語(yǔ)言之間的障礙。這是研究人工智能病歷學(xué)習(xí)中突破的最大難點(diǎn)。
為此,研究團(tuán)隊(duì)利用依圖醫(yī)療的自然語(yǔ)言處理(NLP)技術(shù)建立一套病歷智能分析系統(tǒng),將病歷變得標(biāo)準(zhǔn)化。并由30余位高級(jí)兒科醫(yī)師和10余位信息學(xué)研究人員組成的專家團(tuán)隊(duì),手動(dòng)給電子病歷上的6183張圖表進(jìn)行注釋、持續(xù)檢驗(yàn)和迭代,保證了診斷的準(zhǔn)確性。
依圖醫(yī)療總裁倪浩說(shuō):“此次成果的核心技術(shù)部分,實(shí)際上是通過(guò)深度學(xué)習(xí)技術(shù)與醫(yī)學(xué)知識(shí)圖譜,對(duì)電子病歷數(shù)據(jù)進(jìn)行解構(gòu),從而構(gòu)建了高質(zhì)量的智能病種庫(kù),并在此基礎(chǔ)上建立各種診斷模型。”
兒童往往不會(huì)表達(dá)疾病癥狀,診斷流程費(fèi)時(shí)費(fèi)力,效率較低。倪浩說(shuō):“擁有可與經(jīng)驗(yàn)豐富兒科醫(yī)生相媲美的人工智能助手輔助診斷,能有效地縮短診斷時(shí)間,優(yōu)化服務(wù)流程?!?/p>
既能“看圖”,又能“識(shí)字”,這意味著人工智能系統(tǒng)繼續(xù)學(xué)習(xí)能力大大增強(qiáng)。“對(duì)被采納的結(jié)果會(huì)增強(qiáng)記憶,對(duì)于被采納的結(jié)果,在核實(shí)之后會(huì)通過(guò)繼續(xù)學(xué)習(xí)實(shí)現(xiàn)能力的提升?!闭撐牡谝蛔髡摺V州市婦兒中心數(shù)據(jù)中心主任梁會(huì)營(yíng)博士說(shuō)。
在此之前,該醫(yī)院已在3年中將數(shù)據(jù)標(biāo)準(zhǔn)化、結(jié)構(gòu)化處理,實(shí)現(xiàn)了50多個(gè)診斷數(shù)據(jù)子系統(tǒng)的相互交流和互聯(lián)互通,為該系統(tǒng)應(yīng)用打下基礎(chǔ)。
可輔助醫(yī)生診斷
能避免誤診漏診
該項(xiàng)研究成果將會(huì)帶來(lái)深遠(yuǎn)影響。按照廣州市婦兒中心主任、院長(zhǎng)夏慧敏所說(shuō),“人工智能輔助診斷既能在一定程度上解決醫(yī)療服務(wù)能力不足的問(wèn)題,又能提高服務(wù)的公平性和可及性。”未來(lái),這項(xiàng)技術(shù)還可以為基層和年輕兒科醫(yī)生提供輔診服務(wù),為患兒家長(zhǎng)提供智能自診服務(wù)和權(quán)威的第二診療意見(jiàn),能有效避免誤診、漏診。
目前,該人工智能輔診系統(tǒng)已經(jīng)在急診分診、門診中臨床應(yīng)用,對(duì)一些兇險(xiǎn)的、有可能威脅生命的重大疾病、罕見(jiàn)病,同樣可以輔助醫(yī)生診斷。
能不能推廣到別的地區(qū)?倪浩認(rèn)為,未來(lái)該系統(tǒng)具備應(yīng)用到更多醫(yī)療場(chǎng)景中的能力,系統(tǒng)依賴的病種庫(kù)、權(quán)威醫(yī)學(xué)指南、頂級(jí)專家的經(jīng)驗(yàn),通過(guò)不斷地深度學(xué)習(xí)原有數(shù)據(jù),可以給予人工智能系統(tǒng)標(biāo)準(zhǔn)和權(quán)威的診斷數(shù)據(jù)支持。
社科院人口與勞動(dòng)經(jīng)濟(jì)研究所社會(huì)保障研究室主任陳秋霖分析,考慮到疾病的復(fù)雜性和可能存在的地域特征,在其他地區(qū)使用時(shí),建議按更精準(zhǔn)的要求開(kāi)展適應(yīng)性檢驗(yàn)?!白鳛檩o助診斷系統(tǒng),達(dá)到一些基本要求后,不同地區(qū)可以在使用過(guò)程中進(jìn)行完善?!?/p>
如果輔診其他疾病,陳秋霖認(rèn)為,不同科室在人工智能應(yīng)用上的要求有所不同,不能簡(jiǎn)單套用。這一方面由疾病本身決定,比如疾病診斷的復(fù)雜性,也和學(xué)科是否具有數(shù)據(jù)基礎(chǔ)和標(biāo)準(zhǔn)等有關(guān)。
“基于病歷數(shù)據(jù)機(jī)器學(xué)習(xí)的智能醫(yī)學(xué),是信息化時(shí)代醫(yī)學(xué)發(fā)展的重要方向。從長(zhǎng)遠(yuǎn)來(lái)看,需要對(duì)數(shù)據(jù)產(chǎn)權(quán)進(jìn)行更清晰的界定,并形成一套創(chuàng)新的醫(yī)療數(shù)據(jù)產(chǎn)權(quán)制度,目的就是在保護(hù)個(gè)人隱私的前提下,激勵(lì)患者、醫(yī)生、醫(yī)院、第三方數(shù)據(jù)平臺(tái)企業(yè)都有積極性去創(chuàng)新智能醫(yī)學(xué)。”陳秋霖說(shuō),這些數(shù)據(jù)目前還缺乏互聯(lián)互通,一定程度上也影響著下一步的發(fā)展。記者 李紅梅 賀林平