人工智能是醫(yī)療行業(yè)革新的核心動力,科技巨頭和新興創(chuàng)業(yè)型公司紛紛布局AI醫(yī)療,這個領(lǐng)域的競爭日益激烈。
這是全球首次在頂級醫(yī)學(xué)雜志發(fā)表有關(guān)自然語言處理(NLP)技術(shù)基于電子健康記錄(EHR)做臨床智能診斷的研究成果,也是利用人工智能技術(shù)診斷兒科疾病的重磅科研成果。在以依圖科技為代表的人工智能企業(yè)驅(qū)動下,中國正逐步形成由勞動力輸出、技術(shù)輸出再到學(xué)術(shù)輸出的角色轉(zhuǎn)變,成為全球人工智能領(lǐng)域的重要力量。
成立于2012年的依圖科技,致力于人工智能創(chuàng)新性研究,將先進(jìn)人工智能技術(shù)與行業(yè)應(yīng)用相結(jié)合,服務(wù)于醫(yī)療健康、公共安全、金融等眾多領(lǐng)域,已經(jīng)發(fā)展為國內(nèi)不可或缺的人工智能領(lǐng)軍企業(yè)。作為國計(jì)民生相關(guān)的重要行業(yè),人工智能技術(shù)對醫(yī)療行業(yè)的巨大革新作用得到了社會的廣泛關(guān)注,去年的政府工作報告在談及加強(qiáng)新一代人工智能研發(fā)應(yīng)用時首先點(diǎn)名醫(yī)療領(lǐng)域,高度重視高新技術(shù)對于健康中國2030計(jì)劃的推進(jìn)作用。
依圖與廣州婦女兒童中心聯(lián)合研究的利用人工智能技術(shù)診斷兒科疾病的重磅科研成果,是通過深度學(xué)習(xí)與知識圖譜相結(jié)合,解構(gòu)臨床電子病歷數(shù)據(jù),形成一套智能病種庫,并在其基礎(chǔ)上構(gòu)建輔助診斷模型的技術(shù)。也就是說,有了這項(xiàng)技術(shù),計(jì)算機(jī)能夠“讀懂”兒科病歷,并進(jìn)行初步診斷。作為本文共同第一作者,依圖醫(yī)療CEO倪浩介紹,本次論文所述的是依圖在自然語言處理領(lǐng)域兩年多積累的成果,期間依圖進(jìn)行了大量的基礎(chǔ)性研究,如知識圖譜的構(gòu)建、算法的研發(fā)、標(biāo)注體系的設(shè)計(jì)等。
這次研究中,依圖提出并測試了一個專門對電子醫(yī)學(xué)病歷進(jìn)行數(shù)據(jù)挖掘的系統(tǒng)框架,將醫(yī)學(xué)知識和數(shù)據(jù)驅(qū)動模型結(jié)合在一起。該模型先通過自然語言處理技術(shù)對電子病歷進(jìn)行標(biāo)注,利用邏輯回歸來建立層次診斷,通過超過140萬的兒科病歷訓(xùn)練,在常見兒童疾病方面的綜合診斷準(zhǔn)確率優(yōu)于相對低年資兒科醫(yī)生(3年+8年臨床經(jīng)驗(yàn))。
此次研究中,依圖與廣州市婦女兒童醫(yī)療中心進(jìn)行合作,學(xué)習(xí)了該中心在2016年1月至2017年7月間的567498個門診病人的1362559次問診電子病歷,抽取到覆蓋初始診斷包括兒科55種病歷學(xué)中常見疾病的1.016億個數(shù)據(jù)點(diǎn),并將這些信息用于訓(xùn)練和驗(yàn)證系統(tǒng)框架。相比以往的模型,此次研究使用了超過140萬的龐大數(shù)據(jù),以完善診斷系統(tǒng)。此外,此次研究中使用數(shù)據(jù)在表達(dá)和描述上的一致性,極大地提高了數(shù)據(jù)質(zhì)量。
從該人工智能疾病診斷系統(tǒng)作出疾病判斷的準(zhǔn)確率來看,以呼吸系統(tǒng)疾病為例,對上呼吸道疾病和下呼吸道疾病的診斷準(zhǔn)確率分別為89%和87%,而在上呼吸道疾病診斷中,急性喉炎和鼻竇炎的準(zhǔn)確率分別高達(dá)86%和96%,對不同類型哮喘的診斷準(zhǔn)確率從83%到97%;同時對普通系統(tǒng)性疾病以及危險程度更高的疾病也有很高的診斷準(zhǔn)確率,例如傳染性單核細(xì)胞增多癥(90%)、水痘(93%)、玫瑰疹(93%)、流感(94%)、手足口?。?7%)和細(xì)菌性腦膜炎(93%)。也就是說,該系統(tǒng)可以根據(jù)NLP系統(tǒng)注釋的臨床數(shù)據(jù)信息對兒科疾病做出準(zhǔn)確的判斷。
此次模型的訓(xùn)練數(shù)據(jù)集中在兒科。倪浩表示,選擇兒科切入是本著一個非常樸素的想法——解決兒科醫(yī)生短缺的問題。另外,由于兒童沒有準(zhǔn)確表達(dá)病癥的能力,因此被稱為“啞科”,發(fā)病占比較高,面臨病歷信息不全、患兒發(fā)病速度快等棘手問題。通過人工智能技術(shù)還原兒科醫(yī)生能力,能服務(wù)三甲醫(yī)院和基層醫(yī)院,可以取得較好的臨床及社會效益。目前整個系統(tǒng)已應(yīng)用于廣州市婦女兒童醫(yī)療中心門診系統(tǒng)中,讀取醫(yī)生撰寫的門診病歷后,在填寫診斷的環(huán)節(jié)可以一鍵獲得輔助診斷結(jié)果。
由于醫(yī)療數(shù)據(jù)本身呈現(xiàn)多模態(tài)特征,自然語言處理技術(shù)的加入將為醫(yī)療領(lǐng)域帶來非常大的價值。與圖像識別、語音識別相比,自然語言處理是人工智能領(lǐng)域最為困難的問題之一,廣州市婦女兒童醫(yī)療中心主任夏慧敏教授表示:“這項(xiàng)研究,將會成為人工智能技術(shù)在醫(yī)療中實(shí)施應(yīng)用的重要里程碑。其最大的貢獻(xiàn)在于,機(jī)器不僅僅能夠‘看圖’,而且能夠‘識字’,能像人類一樣讀懂文本中蘊(yùn)藏的疾病信息。”
醫(yī)療人工智能企業(yè)的核心競爭力主要包括兩方面:技術(shù)實(shí)力和運(yùn)用這一強(qiáng)大的技術(shù)去解鎖臨床應(yīng)用場景的能力。此次研究得到Nature Medicine雜志的高度認(rèn)可,其原因還在于其具備極強(qiáng)的多場景應(yīng)用能力。例如在分診環(huán)節(jié),通過記錄基礎(chǔ)數(shù)據(jù)讓模型產(chǎn)生預(yù)測診療結(jié)果,并通過這個結(jié)果評估病人的優(yōu)先級,以確保醫(yī)生可以按需就診。
此外,基于AI的診斷模型還可以幫助醫(yī)生診斷復(fù)雜或罕見病癥,提示可能情況,避免由于醫(yī)生受限于自身專業(yè)或經(jīng)驗(yàn),在遇到復(fù)雜病癥時出現(xiàn)誤診。
在過去的幾年,市場對于人工智能能夠?qū)崿F(xiàn)的醫(yī)療價值已經(jīng)從不認(rèn)可到將信將疑,再到充滿信心,市場教育基本完成,未來三年預(yù)計(jì)會是一個快速增長的市場。十年內(nèi),中國醫(yī)療機(jī)構(gòu)將完成初步的智能化,廣泛采用各類人工智能應(yīng)用。