人工智能戰(zhàn)勝42名醫(yī)療專家 專家將面臨失業(yè)?
人工智能在專業(yè)醫(yī)學(xué)領(lǐng)域全面戰(zhàn)勝人類醫(yī)生的例子還很少見。最近一項(xiàng)深層神經(jīng)網(wǎng)絡(luò)算法在診斷灰指甲方面,成功擊敗了42位皮膚科專家。灰指甲是一種常見的真菌感染,它會(huì)讓指甲脫色和脆化,這種疾病每年困擾著大約3500萬美國人。
這項(xiàng)成功很大程度依賴于一個(gè)韓國研究團(tuán)隊(duì)的努力,他們收集了大約5萬張指甲/趾甲的圖片。大量的訓(xùn)練數(shù)據(jù),是深層神經(jīng)網(wǎng)絡(luò)成功識(shí)別灰指甲,戰(zhàn)勝人類醫(yī)學(xué)專家的關(guān)鍵所在。
韓國首爾的皮膚科醫(yī)生、臨床醫(yī)生Seung Seog Han表示,“迄今為止,在很多研究——比如識(shí)別糖網(wǎng)、皮膚癌和閱讀胸片等項(xiàng)目中,人工智能已經(jīng)接近了人類專家的水平。但這項(xiàng)研究首次表明,人工智能已經(jīng)超越了人類專家。”
過去人工智能和皮膚科醫(yī)生之間的較量通常勢均力敵。但在這項(xiàng)研究中,在一個(gè)特定場景下的三次實(shí)驗(yàn)里,只有一名皮膚科醫(yī)生的表現(xiàn)全部略優(yōu)于深度神經(jīng)網(wǎng)絡(luò)。而且,值得注意的是,對于簡單病例,深層神經(jīng)網(wǎng)絡(luò)的優(yōu)勢更加明顯。
這項(xiàng)研究成果發(fā)表在了2018年1月19日的PLOS ONE 雜志網(wǎng)絡(luò)版上。參與這項(xiàng)研究的除了Seung Seog Han,還有韓國翰林大學(xué)的皮膚病學(xué)教授 Gyeong Hun Park,以及韓國蔚山大學(xué)的皮膚病學(xué)教授 Sung Eun Chang。
作為一名醫(yī)生,Han在日常工作中接觸到了各種各樣的皮膚病。同時(shí),他也學(xué)習(xí)了不少計(jì)算機(jī)編程語言方面的知識(shí),比如C++和Python。后來,AlphaGo擊敗世界圍棋冠軍李世乭,又激發(fā)了Han探索深度學(xué)習(xí)的興趣。
人類往往難以把握大數(shù)據(jù)的規(guī)律,但深度學(xué)習(xí)算法在大數(shù)據(jù)的模式檢測方面有著獨(dú)到的優(yōu)勢。在這個(gè)案例中,韓國的研究人員發(fā)現(xiàn)可以用微軟研究院開發(fā)的深度學(xué)習(xí)算法幫助醫(yī)生從數(shù)字照片中識(shí)別可能的灰指甲感染病例。
但任何深度學(xué)習(xí)模型都需要基于大量的數(shù)據(jù)進(jìn)行訓(xùn)練。收集灰指甲病例的圖片給研究人員提出了巨大的挑戰(zhàn),因?yàn)檫@些圖片通常沒有標(biāo)準(zhǔn)和統(tǒng)一的格式。很多圖片是從不同角度拍攝的,里面既有健康的指甲/趾甲,也有受到感染的指甲趾甲。此外,受深度學(xué)習(xí)算法的技術(shù)限制,所有圖像都要調(diào)整到224 x 224像素大小,這樣一來很多圖片就無法識(shí)別了。
韓和他的同事們訓(xùn)練了一種名為Faster R-CNN的目標(biāo)檢測算法,對圖像進(jìn)行識(shí)別和裁剪,使圖片中只包含受感染的指甲/趾甲,然后再將圖片放大,這樣就得到了一個(gè)可以用于訓(xùn)練深層神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)集。數(shù)據(jù)集中的大部分圖片都來自于一個(gè)Han 在 2007 年開發(fā)的、名為MedicalPhoto的皮膚病臨床照片管理程序。
即便如此,Han還是要手動(dòng)讀取Faster R-CNN裁剪出來的10萬張照片,并對每張照片進(jìn)行兩次標(biāo)記,將不準(zhǔn)確或不合適的指甲/趾甲照片剔除,以保證訓(xùn)練數(shù)據(jù)的準(zhǔn)確性。即使Han平均每10秒鐘能處理一張照片,且每天工作數(shù)小時(shí),這項(xiàng)工作也需要耗費(fèi)他大約550個(gè)小時(shí),合計(jì)超過70天。
該數(shù)據(jù)集幫助訓(xùn)練了用于識(shí)別病癥的卷積神經(jīng)網(wǎng)絡(luò)——微軟的 ResNet-152 和牛津大學(xué)的 VGG-19 模型,以執(zhí)行識(shí)別指甲真菌感染可能病例的工作。這種深度學(xué)習(xí)方法表現(xiàn)優(yōu)于 42 位皮膚科專家組成的小組——其中包括 16 名教授、18 名臨床醫(yī)生和 8 名住院醫(yī)師。
研究人員表示,在額外的測試中,深度學(xué)習(xí)算法的表現(xiàn)也通常優(yōu)于5名最好的皮膚科醫(yī)生。他們還發(fā)現(xiàn),人工智能的診斷評(píng)估也比一般內(nèi)科醫(yī)生、醫(yī)學(xué)生、護(hù)士和非醫(yī)務(wù)人員的診斷結(jié)果要好。
該研究團(tuán)隊(duì)發(fā)布了他們深度學(xué)習(xí)算法的早期演示版本,任何人都可以通過網(wǎng)站或下載Android智能手機(jī)應(yīng)用程序進(jìn)行嘗試。通過在網(wǎng)站和應(yīng)用程序中收集數(shù)據(jù),研究人員希望發(fā)現(xiàn)該人工智能算法在實(shí)際醫(yī)療實(shí)踐中使用時(shí)可能會(huì)出現(xiàn)哪些問題。
Han和他的同事們也在嘗試用深度學(xué)習(xí)診斷皮膚癌等其他皮膚疾病。相關(guān)的研究論文發(fā)表在了2018年2月8日的《Journal of InvesTIgaTIve Dermatology》網(wǎng)絡(luò)版上。
這類研究表明,人工智能依賴于臨床影像來診斷疾病,因此在遠(yuǎn)程醫(yī)療領(lǐng)域更有用武之地。人類皮膚科醫(yī)生在做診斷時(shí)還是要結(jié)合病人的病史和其他臨床信息,因?yàn)閷τ诖蠖鄶?shù)人來說,僅憑影像就下診斷還是顯得太過草率了。
Han和他的同事們認(rèn)為,他們的研究對于全科醫(yī)生尤其有用,因?yàn)椴∪藗兘?jīng)常會(huì)向全科醫(yī)生反饋?zhàn)约旱闹讣缀推つw問題。Han說道:“人工智能的診斷要比普通臨床診斷更為準(zhǔn)確,我認(rèn)為它對全科醫(yī)生確定灰指甲的治療方向有所幫助。”