深度學(xué)習(xí)對于生物學(xué)有什么影響
人們常說眼睛是心靈的窗戶,但是谷歌的研究人員把它們視作人們健康的指示器。谷歌正借助深度學(xué)習(xí)技術(shù),通過分析人們的視網(wǎng)膜圖像預(yù)測一個人的血壓、年齡和吸煙狀態(tài)。谷歌的計算機能夠從血管的排布中獲取線索,而且之前的一項研究表明計算機能夠借助這種信息預(yù)測一個人近期是否會有心臟病發(fā)作的風(fēng)險。
這些研究依靠的是一種卷積神經(jīng)網(wǎng)絡(luò),這是一種能夠改變生物學(xué)家分析圖像方式的深度學(xué)習(xí)算法。科學(xué)家們正借助這種方法尋找基因中的突變,并且預(yù)測單細胞排列的變化。谷歌帶來了新一輪的深度學(xué)習(xí)應(yīng)用,能夠讓圖像處理變得更簡單而且更通用,甚至能夠識別以前被忽視的生物學(xué)現(xiàn)象。
美國加州山景城谷歌研究所的工程學(xué)負責(zé)人Philip Nelson稱:“以前將機器學(xué)習(xí)應(yīng)用到生物學(xué)的許多領(lǐng)域是不切實際的想法?,F(xiàn)在你就能夠做到,而且更加令人激動的是,計算機現(xiàn)在能夠觀察到許多人類或許從未見過的細節(jié)?!?/p>
卷積神經(jīng)網(wǎng)絡(luò)能夠讓計算機高效而且完整的處理圖像,而且不需要再對圖像進行分解。這種方法最早是在2012年出現(xiàn)在技術(shù)領(lǐng)域,比如說Facebook借助這種深度學(xué)習(xí)技術(shù)識別照片上的面孔。但是科學(xué)家們一直難以把這種方法應(yīng)用到生物學(xué)領(lǐng)域,部分原因源于兩個領(lǐng)域之間的文化差異。
舊金山生物學(xué)公司Calico的首席計算機官員Daphne Koller稱:“這就像你把一群生物學(xué)家送入到一個計算機科學(xué)家團隊所在的房間,他們將彼此用不同的語言談?wù)?,而且會產(chǎn)生不同的思維方式?!?/p>
科學(xué)家們也必須確定借助卷積神經(jīng)網(wǎng)絡(luò)能夠進行哪種類型的研究。當(dāng)谷歌想要用深度學(xué)習(xí)尋找基因中的突變時,谷歌科學(xué)家必須將DNA字母鏈轉(zhuǎn)變成計算機能夠識別的圖像。隨后他們需要借助參照基因?qū)ι窠?jīng)網(wǎng)絡(luò)進行訓(xùn)練,這樣才能發(fā)現(xiàn)突變。12月問世的DeepVariant工具就能夠在DNA序列中發(fā)現(xiàn)微小的變化。在測試中,DeepVariant的表現(xiàn)至少趕得上傳統(tǒng)的工具。
西雅圖艾倫細胞科學(xué)研究所的細胞生物學(xué)家正使用卷積神經(jīng)網(wǎng)絡(luò),將光學(xué)顯微鏡拍攝的單調(diào)灰白照片轉(zhuǎn)換成3D圖像,而且讓部分細胞器擁有了色彩標簽。這種方法消除了細胞染色的流程,細胞染色耗時較多且需要在精密實驗室中進行,而且會給細胞帶來損傷。上個月,該團隊公布了一項先進技術(shù),只借助部分數(shù)據(jù)就能夠預(yù)測細胞其他部分的形狀和位置。
麻省理工學(xué)院布羅德研究所和哈佛大學(xué)影像平臺的負責(zé)人Anne Carpenter稱:“你現(xiàn)在所看是一種史無前例的變化,機器學(xué)習(xí)能夠借助圖像完成生物學(xué)任務(wù)。”在2015年她的跨學(xué)科團隊開始借助卷積神經(jīng)網(wǎng)絡(luò)處理細胞圖像?,F(xiàn)在Carpenter稱,在她的研究中心大約有15%的圖像數(shù)據(jù)借助了卷積神經(jīng)網(wǎng)絡(luò)。她預(yù)測,幾年后這種方法將成為研究中心主要的圖像處理方法。
更加令人激動的是,借助卷積神經(jīng)網(wǎng)絡(luò)分析圖像能夠在無意中揭開微妙的生物學(xué)現(xiàn)象,讓生物學(xué)家開始思考之前忽視的問題。艾力研究所的執(zhí)行董事Rick Horwitz稱,這樣的偶然發(fā)現(xiàn)能夠幫助醫(yī)學(xué)研究不斷進步。如果深度學(xué)習(xí)能夠揭開癌癥在單體細胞中的微妙標識,那么它就可能幫助研究人員提前識別腫瘤。
其他生物學(xué)中的機器學(xué)習(xí)專家已經(jīng)目標放在更前沿的領(lǐng)域,現(xiàn)在卷積神經(jīng)網(wǎng)絡(luò)已經(jīng)開始廣泛應(yīng)用于圖像處理。德國環(huán)境健康研究中心的計算機生物學(xué)家Alex Wolf稱:“圖像是非常重要的,但是化學(xué)和分子數(shù)據(jù)同樣重要。我認為未來數(shù)年內(nèi)將實現(xiàn)一項重大的突破,讓生物學(xué)家更廣泛的應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)?!?/p>