希望科學(xué)界最大限度的發(fā)揮,IBM 將治愈癌癥三個(gè) AI 項(xiàng)目發(fā)布在開(kāi)源社區(qū)
如果我們?cè)诜肿訉用嫔细钊氲亓私獍┌Y,就能學(xué)會(huì)更有效地治療癌癥。
IBM已向開(kāi)源社區(qū)發(fā)布了旨在克服治愈癌癥這個(gè)挑戰(zhàn)的三個(gè)AI項(xiàng)目。
在本月晚些時(shí)候?qū)⒃谌鹗颗e行的第18屆歐洲計(jì)算生物學(xué)大會(huì)(ECCB)和第27屆分子生物學(xué)智能系統(tǒng)大會(huì)(ISMB)上,這個(gè)技術(shù)巨頭將深入探討每一個(gè)項(xiàng)目如何促進(jìn)我們對(duì)于癌癥及治療方法的了解。
據(jù)估計(jì),單單癌癥在2018年就奪去了960萬(wàn)條生命,同年報(bào)告的新病例估計(jì)多達(dá)1800萬(wàn)例。
遺傳傾向性以及環(huán)境因素(包括污染、吸煙和飲食)都被認(rèn)為是加大人們患癌癥的可能性的因素;雖然我們可以治療多種癌癥,但還有很多地方有待研究。
位于蘇黎世的IBM計(jì)算系統(tǒng)生物學(xué)小組的研究人員致力于研究AI和機(jī)器學(xué)習(xí)方法,以“幫助我們加快了解這些復(fù)雜疾病的主要誘因和分子機(jī)制”,并研究提高我們對(duì)腫瘤構(gòu)成的認(rèn)識(shí)的方法。
IBM稱:“我們的目標(biāo)是加深對(duì)癌癥的了解,讓諸多行業(yè)和學(xué)術(shù)界掌握可能有一天有助于推動(dòng)新治療和新療法的知識(shí)。”
第一個(gè)項(xiàng)目名為PaccMann(切勿與流行的Pac-Man計(jì)算機(jī)游戲混為一談),聲稱可以“利用基于注意力的多模式神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)抗癌化合物的敏感性。”
單單研制一種抗癌藥可能就要耗資數(shù)百萬(wàn)美元,財(cái)力上的這種限制會(huì)使我們研發(fā)新藥物和新療法的項(xiàng)目推遲或泡湯。
IBM正致力于開(kāi)發(fā)PaccMann算法,以自動(dòng)分析化合物,并預(yù)測(cè)哪些化合物最有可能對(duì)抗癌癥菌株,這可能有望簡(jiǎn)化這個(gè)過(guò)程。
機(jī)器學(xué)習(xí)算法利用基因表達(dá)方面的數(shù)據(jù)和化合物的分子結(jié)構(gòu)。IBM稱,通過(guò)更早地識(shí)別潛在的抗癌化合物,這可以降低與藥物開(kāi)發(fā)有關(guān)的成本。
第二個(gè)項(xiàng)目名為“Interaction Network infErence from vectoR representATions of words”(簡(jiǎn)稱INtERAcT)。這個(gè)工具特別值得關(guān)注,因?yàn)樗梢詮呐c我們對(duì)癌癥的了解有關(guān)的有價(jià)值的科學(xué)文獻(xiàn)中自動(dòng)提取數(shù)據(jù)。
每年癌癥研究領(lǐng)域發(fā)表的論文大約有17000篇,就算并非沒(méi)有可能,研究人員至少很難跟得上我們?cè)诶斫饽芰ι线~出的每一小步。
INtERAcT旨在通過(guò)自動(dòng)從這些論文中提取信息,為研究的學(xué)術(shù)方面減輕負(fù)擔(dān)。目前,該工具正接在受測(cè)試,用來(lái)提取與蛋白質(zhì)-蛋白質(zhì)相互作用有關(guān)的數(shù)據(jù)——蛋白質(zhì)-蛋白質(zhì)的相互作用已被認(rèn)為是包括癌癥在內(nèi)的多種疾病中生物過(guò)程受到擾亂的潛在原因。
IBM稱:“INtERAcT的一個(gè)特殊的優(yōu)勢(shì)在于,它能夠結(jié)合某種疾病的環(huán)境來(lái)推斷相互作用。通過(guò)與健康組織中的正常相互作用進(jìn)行一番比較,可能有助于深入了解疾病機(jī)制。”
第三個(gè)也是最后一個(gè)項(xiàng)目是“路徑誘導(dǎo)的多核學(xué)習(xí)”(即PIMKL)。該算法利用描述我們目前在分子相互作用方面所知道的情況的數(shù)據(jù)集,以便預(yù)測(cè)癌癥的進(jìn)展和患者的潛在復(fù)發(fā)。
PIMKL使用所謂的多核學(xué)習(xí)來(lái)識(shí)別對(duì)于患者分門別類而言至關(guān)重要的分子路徑,從而為醫(yī)療保健專業(yè)人員提供個(gè)性化和定制治療方案的機(jī)會(huì)。
PaccMann和INtERAcT的代碼已經(jīng)發(fā)布,可以在這兩個(gè)項(xiàng)目的官網(wǎng)上找到。PIMKL已部署在IBM云上,源代碼也已發(fā)布。
每個(gè)項(xiàng)目都是開(kāi)源的,現(xiàn)已開(kāi)放供公眾使用。IBM希望通過(guò)向其他研究人員和學(xué)者提供源代碼,科學(xué)界可以最大限度地發(fā)揮其潛在的影響。