DeepMind建立了一個(gè)人工智能系統(tǒng) 以應(yīng)對(duì)當(dāng)今生物學(xué)中最大挑戰(zhàn)之一
Alphabet Inc.的DeepMind人工智能部門已經(jīng)取得了另一項(xiàng)科學(xué)成就。
該組織透露,它已經(jīng)建立了一個(gè)人工智能系統(tǒng),能夠應(yīng)對(duì)當(dāng)今生物學(xué)中最大的挑戰(zhàn)之一:模擬蛋白質(zhì)的形狀。
該系統(tǒng)被稱為AlphaFold,開發(fā)時(shí)間不少于兩年。在美國(guó)國(guó)家綜合醫(yī)學(xué)科學(xué)院(U.S. National InsTItute of General Medical Sciences)舉辦的CASP模擬競(jìng)賽中,該軟件輕松擊敗其他97種算法,隨后DeepMind決定宣布該項(xiàng)目。
幾乎在每個(gè)生物過(guò)程中都會(huì)發(fā)揮作用的蛋白質(zhì)是扭曲和折疊成各種形式的氨基酸鏈。蛋白質(zhì)的形狀是決定其行為的主要因素之一。更好地了解這些特性可以讓科學(xué)家獲得對(duì)某些疾病的新見解——這些疾病被認(rèn)為是由錯(cuò)誤折疊的蛋白質(zhì)引起的,而且還會(huì)發(fā)現(xiàn)可能對(duì)藥物開發(fā)有用的分子。
DeepMind表示,AlphaFold代表了朝著實(shí)現(xiàn)這一目標(biāo)前進(jìn)的“重大進(jìn)展”。該系統(tǒng)可以根據(jù)所包含的氨基酸計(jì)算預(yù)測(cè)蛋白質(zhì)的結(jié)構(gòu),這家Alphabet的子公司表示其準(zhǔn)確程度遠(yuǎn)遠(yuǎn)高于現(xiàn)有方法。如果是手動(dòng)模擬平均大小的蛋白質(zhì)的每一種可能的結(jié)構(gòu),要花的時(shí)間比宇宙的年齡更長(zhǎng),考慮到這一事實(shí),這種算法取得的成就就不是一件小事了。
AlphaFold將任務(wù)分解為兩部分。首先,系統(tǒng)使用有關(guān)蛋白質(zhì)的氨基酸組成的信息來(lái)生成其默認(rèn)(即展開)結(jié)構(gòu)的三維模型。
DeepMind解釋說(shuō):“我們網(wǎng)絡(luò)預(yù)測(cè)的屬性是:(a)氨基酸對(duì)之間的距離和(b)連接這些氨基酸的化學(xué)鍵之間的角度?!彼麄儽硎荆骸拔覀冇?xùn)練了一個(gè)神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)蛋白質(zhì)中每對(duì)殘基之間距離的單獨(dú)分布。然后將這些概率組合成一個(gè)分?jǐn)?shù),評(píng)估該蛋白質(zhì)結(jié)構(gòu)的準(zhǔn)確程度?!?/p>
三維模型準(zhǔn)備就緒之后,AlphaFold就會(huì)計(jì)算出該蛋白質(zhì)最有可能的形狀。所有蛋白質(zhì)傾向于折疊成盡可能最節(jié)能形式,該系統(tǒng)利用這一事實(shí)來(lái)完成這一步工作,這有助于縮小可能性。 人工智能會(huì)嘗試不同的三維模型變體,以生成更高效的版本,直至找到最佳形式。
DeepMind表示:“我們的第一種方法建立在結(jié)構(gòu)生物學(xué)中常用的技術(shù)基礎(chǔ)之上,并用新的蛋白質(zhì)片段反復(fù)替換蛋白質(zhì)結(jié)構(gòu)片段?!彼麄儽硎荆骸暗诙N方法通過(guò)梯度下降優(yōu)化得分——一種常用于機(jī)器學(xué)習(xí)的數(shù)學(xué)技術(shù),用于進(jìn)行小的、漸進(jìn)式的改進(jìn)——以產(chǎn)生高度精確的結(jié)構(gòu)。”
據(jù)英國(guó)(The Guardian)報(bào)道,AlphaFold最初需要兩周時(shí)間才能產(chǎn)生預(yù)測(cè),但現(xiàn)在可以在幾個(gè)小時(shí)內(nèi)完成任務(wù)。它在CASP模擬競(jìng)賽提供的43種蛋白質(zhì)中,準(zhǔn)確預(yù)測(cè)了25種,成功擊敗參與測(cè)試的其他97種算法。其中亞軍只正確預(yù)測(cè)了三個(gè)。