使用視網(wǎng)膜掃描發(fā)現(xiàn)心臟病風(fēng)險可行嗎
谷歌及其子公司Verily的科學(xué)家們發(fā)現(xiàn)了一種利用機(jī)器學(xué)習(xí)來評估一個人患心臟病風(fēng)險的新方法。通過分析病人眼睛后部的掃描結(jié)果,該公司的軟件能夠準(zhǔn)確地推斷出數(shù)據(jù),包括個人的年齡、血壓,以及他們是否吸煙。這些信息可以用來預(yù)測他們患心臟病的風(fēng)險,比如心臟病發(fā)作,與目前的主要方法大致相同。
使用神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像識別的優(yōu)勢是,你不必告訴它在圖像中尋找什么,你甚至不需要關(guān)心它尋找什么。有了足夠的訓(xùn)練,神經(jīng)網(wǎng)絡(luò)應(yīng)該能夠找出使其做出準(zhǔn)確識別的細(xì)節(jié)。
就像要弄清楚圖像中是否有貓一樣,神經(jīng)網(wǎng)絡(luò)并不能提供比我們視覺系統(tǒng)中的實際神經(jīng)元更多(如果有的話)的優(yōu)勢。但它們的優(yōu)勢能在我們不知道應(yīng)該尋找什么的情況下得以發(fā)揮。在某些情況下,圖像可能會提供人類無法理解的細(xì)微信息,但是神經(jīng)網(wǎng)絡(luò)可以通過適當(dāng)?shù)挠?xùn)練來獲取這種信息。
現(xiàn)在,研究人員已經(jīng)做到了這一點,即利用病人視網(wǎng)膜的圖像訓(xùn)練出一種深度學(xué)習(xí)算法來識別心臟病的風(fēng)險。視網(wǎng)膜中有著豐富的血管,因此可以檢測出整個循環(huán)系統(tǒng)中所存在的問題;例如高膽固醇或高血壓等疾病都會在眼睛里留下痕跡。因此,一個由谷歌和Verily生命科學(xué)公司研究人員組成的研究團(tuán)隊決定看看一個深度學(xué)習(xí)網(wǎng)絡(luò)如何能夠從視網(wǎng)膜圖像中找到這些痕跡。
為了訓(xùn)練這個網(wǎng)絡(luò),他們使用了將近30萬張帶有心臟病相關(guān)信息(比如年齡、吸煙狀況、血壓和體重指數(shù))的網(wǎng)膜圖像。該系統(tǒng)經(jīng)過訓(xùn)練后,又在另外1萬3千張圖像上進(jìn)行應(yīng)用,以了解它是如何運作的。
僅通過觀察視網(wǎng)膜圖像,該算法給出的患者年齡與其真實年齡的差距一般在3.5年內(nèi)。它在估計病人的血壓和體重指數(shù)方面也做得很好。考慮到這些成功,該團(tuán)隊隨后訓(xùn)練了一個類似的網(wǎng)絡(luò),利用這些圖像來估計未來五年內(nèi)發(fā)生重大心臟問題的風(fēng)險。結(jié)果顯示,其性能與根據(jù)上述多種因素得到的心臟病風(fēng)險評估計算結(jié)果類似,但該算法是通過圖像完成估計的,而不是通過一些測試和詳細(xì)的問卷調(diào)查。
這項工作的精妙之處在于該算法已經(jīng)建立,因此它可以告訴人們它是根據(jù)哪些重點依據(jù)做出診斷的。對于年齡、吸煙狀況和血壓等問題,該軟件重點關(guān)注血管的特征。訓(xùn)練它來預(yù)測性別最終導(dǎo)致它專注于分散在眼睛周圍的特定特征,而體重指數(shù)最終沒有任何明顯的焦點,這表明體重指數(shù)信號會被傳播到整個視網(wǎng)膜中。
研究人員表示,即使是30萬張圖像的訓(xùn)練集對于深度學(xué)習(xí)算法來說也很小,所以他們認(rèn)為如果有更多的數(shù)據(jù)可供使用,他們可以做得更好。由于計算具有很大的不確定性,他們注意到類似于診斷計算的性能并不是很好,所以算法還需要改進(jìn)。隨著一些改進(jìn)措施的推出,該算法可能成為一種有用的診斷工具,因為視網(wǎng)膜圖像常被用來篩查與糖尿病相關(guān)的眼睛問題,而糖尿病通常與心臟病有關(guān)。