北大團(tuán)隊(duì)研發(fā)!全球首個(gè)基因挖掘大模型問世
4月13日消息,北京大學(xué)定量生物學(xué)中心錢瓏團(tuán)隊(duì)研發(fā)、構(gòu)建了全球首個(gè)針對(duì)功能基因挖掘任務(wù)的大語言模型SYMPLEX。
該模型能夠自動(dòng)高效地從海量生物文獻(xiàn)中發(fā)現(xiàn)具有目標(biāo)功能的關(guān)鍵基因,并進(jìn)行精準(zhǔn)篩選和功能驗(yàn)證,為后續(xù)的蛋白質(zhì)功能設(shè)計(jì)、生物制劑開發(fā)以及生物制造的應(yīng)用提供科學(xué)依據(jù)。
團(tuán)隊(duì)與中科院深圳先進(jìn)技術(shù)研究院婁春波研究員合作,將SYMPLEX應(yīng)用于mRNA加帽酶基因的挖掘,獲得的新加帽酶活性顯著優(yōu)于mRNA疫苗生產(chǎn)中采用的商業(yè)化酶,展示了大語言模型賦能生物制造的巨大潛力。
“本項(xiàng)研究開創(chuàng)了功能基因挖掘的新范式,為mRNA疫苗規(guī)?;a(chǎn)提供了關(guān)鍵酶資源庫(kù)。”錢瓏表示,研究團(tuán)隊(duì)正在利用這一大模型進(jìn)行更多可用于合成生物學(xué)的關(guān)鍵酶元件挖掘,并將該平臺(tái)拓展至合成通路設(shè)計(jì)等領(lǐng)域,有望推動(dòng)生物制造進(jìn)入“人工智能驅(qū)動(dòng)的科學(xué)研究”的新階段。