北京大學(xué)定量生物學(xué)中心錢瓏團隊研發(fā)、構(gòu)建了全球首個針對功能基因挖掘任務(wù)的大語言模型SYMPLEX。
該模型能夠自動高效地從海量生物文獻中發(fā)現(xiàn)具有目標功能的關(guān)鍵基因,并進行精準篩選和功能驗證,為后續(xù)的蛋白質(zhì)功能設(shè)計、生物制劑開發(fā)以及生物制造的應(yīng)用提供科學(xué)依據(jù)。
團隊與中科院深圳先進技術(shù)研究院婁春波研究員合作,將SYMPLEX應(yīng)用于mRNA加帽酶基因的挖掘,獲得的新加帽酶活性顯著優(yōu)于mRNA疫苗生產(chǎn)中采用的商業(yè)化酶,展示了大語言模型賦能生物制造的巨大潛力。
“本項研究開創(chuàng)了功能基因挖掘的新范式,為mRNA疫苗規(guī);a(chǎn)提供了關(guān)鍵酶資源庫。”錢瓏表示,研究團隊正在利用這一大模型進行更多可用于合成生物學(xué)的關(guān)鍵酶元件挖掘,并將該平臺拓展至合成通路設(shè)計等領(lǐng)域,有望推動生物制造進入“人工智能驅(qū)動的科學(xué)研究”的新階段。