人工智能是如何助力CT影像識(shí)別的
新冠狀病毒蔓延之下,醫(yī)生需要尋求更加快捷的診斷方式。除了試劑檢測(cè)之外,胸部CT的影像識(shí)別也成為了篩查病人的主要手段。然而,一張張片子通過人眼檢測(cè)顯然是耗時(shí)又耗力,科技公司的人工智能技術(shù)就在這里體現(xiàn)了優(yōu)勢(shì)。
2月15日,阿里巴巴旗下達(dá)摩院和阿里云宣布研發(fā)出一套針對(duì)新冠狀病毒肺炎臨床人工智能診斷技術(shù),可以在20秒內(nèi)做出CT影像的判斷,分析結(jié)果正確率達(dá)到96%。16日,河南版“小湯山醫(yī)院”(鄭州岐伯山醫(yī)院)率先采用。五天后,阿里巴巴披露,使用范圍擴(kuò)大到湖北、上海、廣東、江蘇等16個(gè)省市26家醫(yī)院,并已對(duì)3萬個(gè)疑似病例進(jìn)行診斷。接下來,其將在百家醫(yī)院完成部署應(yīng)用。
阿里巴巴集團(tuán)副總裁、達(dá)摩院高級(jí)研究員華先勝接受新京報(bào)記者獨(dú)家專訪時(shí)表示,能夠快速應(yīng)用起來,主要是源于達(dá)摩院醫(yī)療人工智能團(tuán)隊(duì)在CT影像分析領(lǐng)域已經(jīng)有四年的研究基礎(chǔ),對(duì)肺部各種診斷都曾有過研究。這是一個(gè)擁有幾十名研究者的團(tuán)隊(duì)。
2017年7月,國(guó)際肺結(jié)節(jié)檢測(cè)大賽LUNA16上,華先勝當(dāng)時(shí)負(fù)責(zé)的iDST(達(dá)摩院前身)視覺計(jì)算團(tuán)隊(duì)創(chuàng)新地使用了單階段方法,機(jī)器全自動(dòng)讀取病人的CT序列,直接輸出檢測(cè)到的結(jié)果憑借89.7%的平均召回率打破紀(jì)錄,奪得冠軍。
這次疫情發(fā)生后,“團(tuán)隊(duì)成員就開始關(guān)注了”,華先勝告訴新京報(bào)記者,以往研究的技術(shù)模型具有比較強(qiáng)的普適性,所以就可以針對(duì)此次疫情的檢測(cè)要求做出調(diào)整。研發(fā)初期該團(tuán)隊(duì)利用小數(shù)據(jù)就可以懸鏈模型,隨后可通過引入更多的數(shù)據(jù)不斷優(yōu)化。最初的樣本中新冠狀病毒患者的比例是五分之一。
2月10日,達(dá)摩院團(tuán)隊(duì)從醫(yī)療影像行業(yè)合伙伙伴那里,拿到了樣本數(shù)據(jù),進(jìn)行AI模型的訓(xùn)練。通過兩天時(shí)間就研發(fā)出了第一版的算法模型,并且在云端的接口也都準(zhǔn)備好了。又經(jīng)過兩天的調(diào)試優(yōu)化后,便開始與醫(yī)院對(duì)接部署,并通過公共云輸出其能力。
由于鄭州岐伯山醫(yī)院原本就由阿里云參與IT系統(tǒng)建設(shè),在一線有很多阿里云的員工,對(duì)接更為方便,也因此首先開始使用這套系統(tǒng)幫助醫(yī)生快速篩查新冠肺炎病例。這套系統(tǒng)可以將原本醫(yī)生觀看CT片得出結(jié)論的時(shí)間(5到30分鐘)縮短至20秒,而且這還包含了數(shù)據(jù)上傳和結(jié)果回傳的時(shí)間。
對(duì)于如何進(jìn)一步提升準(zhǔn)確率,華先勝表示,一般深度學(xué)習(xí)的模型從一個(gè)問題過度到另一個(gè)問題的時(shí)候,并不需要大量樣本,就能拿到一個(gè)還不錯(cuò)的模型。當(dāng)然數(shù)據(jù)越多效果更好,這也是深度學(xué)習(xí)的優(yōu)勢(shì)。這次我們訓(xùn)練的樣本數(shù)據(jù)規(guī)模在業(yè)界已經(jīng)比較領(lǐng)先了。
不僅如此,達(dá)摩院的團(tuán)隊(duì)還將負(fù)例樣本用于模型訓(xùn)練,也就是非新冠病毒確診患者的CT影像片子,這樣也可以進(jìn)一步提升識(shí)別的準(zhǔn)確率,也就是告訴機(jī)器什么不是冠狀病毒患者的特征,以及和其他影像的區(qū)別。但目前這樣的標(biāo)注需要大量專家,復(fù)工前期約5000個(gè)樣本量時(shí),研究員們自己參與標(biāo)注,但量起來后,達(dá)摩院將在這方面選擇了產(chǎn)業(yè)鏈的協(xié)助。
與此同時(shí),除了準(zhǔn)確率,對(duì)于檢測(cè)結(jié)果判斷的指標(biāo)還包括敏感性、特異性等。如果對(duì)是否為新冠患者判斷對(duì)了,準(zhǔn)確率就會(huì)增加,這個(gè)數(shù)值越高越好,而敏感性是指在所有患者的樣本中的識(shí)別準(zhǔn)確率,這個(gè)指標(biāo)更為重要,而特異性是指負(fù)例樣本。
華先勝表示,今天人工智能的應(yīng)用還只是醫(yī)療的輔助診斷,因?yàn)槌思夹g(shù)問題,還有法律法規(guī)的問題。事實(shí)上,在技術(shù)層面,這個(gè)系統(tǒng)已經(jīng)可以幫助醫(yī)生提升效率,為經(jīng)驗(yàn)還不豐富的醫(yī)生提供有價(jià)值的參考,從而使得整個(gè)診斷速度加快。但機(jī)器也會(huì)出錯(cuò),這一方面要靠數(shù)據(jù)積累和技術(shù)進(jìn)一步提升,但更重要的是法律層面的定義,讓人工智能診斷可以被實(shí)踐。
不過,華先勝也倡導(dǎo)多種手段應(yīng)該綜合應(yīng)用,因?yàn)槊恳粋€(gè)都很難做到100%的準(zhǔn)確率,醫(yī)生的使用也應(yīng)有其一套邏輯。至于臨床應(yīng)用診斷時(shí),醫(yī)生也會(huì)根據(jù)癥狀、主要訴求和以往病史等因素綜合考慮。也就是說,屬于影像學(xué)診斷方法的CT影像和屬于病原學(xué)證據(jù)的核酸檢測(cè)是從兩個(gè)不同維度去觀察一個(gè)事物,并非取代關(guān)系。
人工智能目前是對(duì)已有的數(shù)據(jù)進(jìn)行學(xué)習(xí),而現(xiàn)實(shí)的情況非常復(fù)雜,臨床數(shù)據(jù)不斷發(fā)生變化,算法也就需要不斷演進(jìn)、更新。由于病毒發(fā)生變異對(duì)肺部影像的影響并沒有那么快,所以這種細(xì)微變化是可以通過在線學(xué)習(xí)不斷去更新,從而調(diào)整算法。但是如果要從簡(jiǎn)單的是否判斷,進(jìn)一步到詳細(xì)診斷,那么仍需要系統(tǒng)學(xué)習(xí)大量的數(shù)據(jù),才可不斷改進(jìn)增強(qiáng)。
除鄭州岐伯山醫(yī)院之外,華先勝表示,其他醫(yī)院落地會(huì)因?yàn)橄惹暗慕?jīng)驗(yàn)而加快。阿里云已經(jīng)準(zhǔn)備了多種的部署方式,除了通過合作伙伴的產(chǎn)品接入公共云服務(wù)外,也可以通過本地化一體機(jī)的方式部署,只不過當(dāng)前疫情之下,后者可能涉及設(shè)備搬運(yùn),部署起來速度會(huì)慢一些。截至2月23日,已有41家醫(yī)院應(yīng)用這一套系統(tǒng),還有100多家正在對(duì)接。
事實(shí)上,除了阿里巴巴,一些人工智能創(chuàng)業(yè)公司也在布局這一領(lǐng)域。依圖科技表示,其研發(fā)了胸部CT新冠肺炎智能評(píng)價(jià)系統(tǒng),并且已在華中科技大學(xué)同濟(jì)醫(yī)學(xué)院附屬協(xié)和醫(yī)院、武漢大學(xué)中南醫(yī)院等幾十家抗疫醫(yī)療機(jī)構(gòu)上線。商湯方面也推出了相應(yīng)的解決方案,其目前可以識(shí)別出非健康的影像,為醫(yī)生提供警示。
診斷過程中,CT影像已經(jīng)成為新型冠狀病毒性肺炎的重要診療決策依據(jù)。2月5日,國(guó)家衛(wèi)生健康委員會(huì)最新發(fā)布的《新型冠狀病毒感染的肺炎診療方案(試行第五版)》中明確指出:“疑似病例具有肺炎影像學(xué)特征者,為臨床診斷病例?!?/p>
華先勝表示,在這一領(lǐng)域存在著一定的技術(shù)門檻,目前大家都在各自能夠影響的范圍內(nèi)提供服務(wù),這是一件好事。每個(gè)團(tuán)隊(duì)都有自己獨(dú)特的技術(shù),算法的創(chuàng)新。達(dá)摩院的優(yōu)勢(shì)是利用了阿里云的云服務(wù),使得算法得以快速推進(jìn)落地應(yīng)用,讓更多的醫(yī)院享受到該技術(shù)。