吳恩達(dá)團(tuán)隊(duì)展示全新醫(yī)療影像識(shí)別技術(shù):肺炎診斷準(zhǔn)確率超過(guò)人類醫(yī)生
摘要:選自StanfordMLGroup作者:PranavRajpurkar等機(jī)器之心編譯參與:李澤南機(jī)器學(xué)習(xí)在醫(yī)療領(lǐng)域的應(yīng)用一直是AI的重要發(fā)展方向,深度學(xué)習(xí)著名學(xué)者吳恩達(dá)和他在斯坦福大學(xué)的團(tuán)隊(duì)一直在這一
選自Stanford ML Group
作者:Pranav Rajpurkar等
機(jī)器之心編譯
參與:李澤南
機(jī)器學(xué)習(xí)在醫(yī)療領(lǐng)域的應(yīng)用一直是 AI 的重要發(fā)展方向,深度學(xué)習(xí)著名學(xué)者吳恩達(dá)和他在斯坦福大學(xué)的團(tuán)隊(duì)一直在這一方面做著努力。近日,該團(tuán)隊(duì)提交的一篇新論文提出了名為 CheXNet 的新技術(shù)。研究人員在論文中表示:新的技術(shù)已經(jīng)在識(shí)別胸透照片中肺炎等疾病上的準(zhǔn)確率上超越了人類專業(yè)醫(yī)師。吳恩達(dá)表示,或許放射科醫(yī)生們需要開(kāi)始擔(dān)心他們的工作了。
僅在美國(guó),每年就有超過(guò) 100 萬(wàn)成年人因?yàn)榉窝鬃≡海? 萬(wàn)人因?yàn)樵摬《劳觯–DC, 2017)。目前,胸部 X 光檢查是診斷肺炎的最佳方法(WHO, 2001),這種方法在臨床護(hù)理和流行病學(xué)研究中發(fā)揮著重要作用。然而,通過(guò) X 光片診斷肺炎是一個(gè)具有挑戰(zhàn)性的任務(wù),需要放射科醫(yī)師專家級(jí)的判斷能力。在斯坦福大學(xué)發(fā)表的新論文中,計(jì)算機(jī)科學(xué)院和醫(yī)學(xué)院的研究人員共同提出了一種新的機(jī)器學(xué)習(xí)模型,可以讓計(jì)算機(jī)通過(guò)胸透照片自動(dòng)診斷肺炎,其診斷準(zhǔn)確率超過(guò)了放射科醫(yī)師。
圖 1. ChexNet 是一個(gè) 121 層的卷積神經(jīng)網(wǎng)絡(luò),以胸透圖片為輸入,輸出患病概率。在這個(gè)例子中,CheXnet 準(zhǔn)確地探測(cè)到了肺炎,同時(shí)定位了圖片中最有可能患病的位置。
CheXNet 可以輸出肺炎存在可能性的熱區(qū)圖。研究人員在最近發(fā)布的 ChestX-ray14 數(shù)據(jù)集(Wang et al., 2017)上訓(xùn)練了 CheXNet。該數(shù)據(jù)集包含 112,120 張各自標(biāo)注最多有 14 種不同胸部疾?。òǚ窝祝┑恼嫘赝笀D像。研究人員使用密集連接(Huang et al., 2016)與批歸一化(Ioffe & Szegedy, 2015)來(lái)優(yōu)化這一深度神經(jīng)網(wǎng)絡(luò)。
圖 2. CheXNet 在使用胸透圖像識(shí)別肺炎任務(wù)上的表現(xiàn)要超過(guò)放射科醫(yī)師的平均水平。在測(cè)試中,CheXNet 與四名人類放射科醫(yī)師在敏感度(衡量正確識(shí)別陽(yáng)性的能力)以及特異性(衡量正確識(shí)別陰性的能力)上進(jìn)行比較。放射科醫(yī)生的個(gè)人表現(xiàn)以橙色點(diǎn)標(biāo)記,平均值以綠色點(diǎn)標(biāo)記。CheXNet 輸出從胸透照片上檢測(cè)出的患肺炎概率,藍(lán)色曲線是分類閾值形成的。所有醫(yī)師的敏感度-特異性點(diǎn)均低于藍(lán)色曲線,這意味著 CheXNet 在肺炎上的診斷水平與放射科醫(yī)師相同,甚至更高。
從胸部 X 光檢查照片中檢測(cè)肺炎對(duì)于放射科醫(yī)師而言是一個(gè)困難的任務(wù)。因?yàn)榉窝自谡掌系谋憩F(xiàn)經(jīng)常難以識(shí)別——它可能會(huì)與其他病癥重疊,也可以與其他很多良性異常類似。這些原因?qū)е路派淇漆t(yī)師在診斷肺炎時(shí)表現(xiàn)差異很大(Neuman et al., 2012;Davies et al., 1996;Hopstaken et al., 2004)。為了評(píng)估放射科醫(yī)師的表現(xiàn),斯坦福大學(xué)的研究人員找來(lái)了四名專業(yè)放射科醫(yī)師,使用 ChestX-ray14 子集的 420 張圖片對(duì)他們進(jìn)行了測(cè)試。在這 420 張圖片里,診斷正確與否的標(biāo)準(zhǔn)為其他大多數(shù)放射科醫(yī)生的投票結(jié)果,與此同時(shí),CheXNet 模型也以同樣的標(biāo)準(zhǔn)進(jìn)行了測(cè)試。
研究人員發(fā)現(xiàn),CheXNet 在敏感度與特異性兩個(gè)方面均超過(guò)了放射科醫(yī)師的平均水平。為了對(duì)比 CheXNet 與此前使用 ChestX-ray14 的模型的能力,研究人員橫向?qū)Ρ攘诵履P团c其他模型在 ChestX-ray14 上對(duì)于十四種疾病的診斷準(zhǔn)確率,結(jié)果發(fā)現(xiàn)新模型的表現(xiàn)在所有方面均超過(guò)了前人的結(jié)果。以超過(guò)專業(yè)放射科醫(yī)師的水平自動(dòng)對(duì)胸透照片進(jìn)行分析診斷疾病不僅在臨床上可以為我們帶來(lái)更多方便,也可以在醫(yī)療影像專業(yè)人士數(shù)量不足的情況下為病人帶來(lái)幫助。
表 1. CheXNet 在 ChestX-ray14 數(shù)據(jù)集中 14 種病變的檢測(cè)結(jié)果與另外兩種模型的對(duì)比。在檢測(cè)腫塊、結(jié)節(jié)、肺炎、氣胸和肺氣腫時(shí),CheXNet 的表現(xiàn)超越了此前業(yè)內(nèi)最佳水平至少 0.05。
圖 3. 使用 Class Activation Maps,ChexNet 定位了它識(shí)別出的病變,高亮區(qū)域是分析病癥需要重點(diǎn)觀察的位置。
論文:CheXNet: Radiologist-Level Pneumonia Detection on Chest X-Rays with Deep Learning
摘要:?我們開(kāi)發(fā)了一種全新算法,能夠從胸透照片里檢測(cè)肺炎,且水平超越專業(yè)放射科醫(yī)生。我們的算法被稱為 CheXNet,它是一個(gè) 121 層的卷積神經(jīng)網(wǎng)絡(luò)。該網(wǎng)絡(luò)在目前最大的開(kāi)放式胸透照片數(shù)據(jù)集「ChestX-ray14」上進(jìn)行訓(xùn)練。ChestX-ray14 數(shù)據(jù)集包含 14 種疾病的 10 萬(wàn)張前視圖 X-ray 圖像。在實(shí)驗(yàn)中,4 名專業(yè)的放射科學(xué)者在測(cè)試數(shù)據(jù)集上進(jìn)行手動(dòng)注釋,并與 CheXNet 的表現(xiàn)進(jìn)行對(duì)比。我們發(fā)現(xiàn),在肺炎檢測(cè)的敏感性與特異性上,CheXNet 的準(zhǔn)確率超越了普通的放射科醫(yī)生。我們把 CheXNet 應(yīng)用到對(duì) ChestX-ray14 數(shù)據(jù)集中 14 種疾病的檢測(cè)上,也取得了頂尖的結(jié)果。