科技日?qǐng)?bào)記者 劉霞
英國(guó)《自然》網(wǎng)站近日?qǐng)?bào)道了迄今最大的生物學(xué)人工智能(AI)模型Evo 2。該模型基于12.8萬(wàn)個(gè)基因組的數(shù)據(jù)進(jìn)行訓(xùn)練,具備從頭編寫(xiě)整個(gè)染色體和小基因組的能力,為設(shè)計(jì)全新基因組開(kāi)辟了一條新路。
在前一代模型Evo 1的基礎(chǔ)上,來(lái)自美國(guó)弧形研究所、斯坦福大學(xué)和英偉達(dá)公司的科學(xué)家攜手開(kāi)發(fā)出Evo 2。相較于Evo 1在8萬(wàn)個(gè)細(xì)菌、古細(xì)菌及病毒的基因組數(shù)據(jù)上進(jìn)行的訓(xùn)練,Evo 2的訓(xùn)練數(shù)據(jù)量大幅提升,涵蓋了12.8萬(wàn)個(gè)基因組。這些基因組廣泛涉及人類(lèi)、動(dòng)植物及真核生物,囊括了9.3萬(wàn)億個(gè)核苷酸。
團(tuán)隊(duì)表示,鑒于解析這些數(shù)據(jù)及其他特征所需的龐大算力,Evo 2是迄今發(fā)布最大的生物學(xué)AI模型。Evo 1和Evo 2模型作為“生成式生物學(xué)”這一新興領(lǐng)域的重要成果,將進(jìn)一步加強(qiáng)對(duì)生命基本組成部分的了解。
在醫(yī)療保健和新藥研發(fā)領(lǐng)域,Evo 2模型可幫助了解與特定疾病有關(guān)的基因變體。在針對(duì)與乳腺癌相關(guān)的BRCA1基因變體測(cè)試中,Evo 2在預(yù)測(cè)良性突變和潛在致病突變方面的準(zhǔn)確率達(dá)90%以上。這將有助于節(jié)省大量時(shí)間,精確設(shè)計(jì)出靶向這些變體的新型分子。
此外,在農(nóng)業(yè)方面,Evo 2模型可提供有關(guān)植物生物學(xué)的新見(jiàn)解,助力開(kāi)發(fā)出更具氣候適應(yīng)性或營(yíng)養(yǎng)更豐富的作物品種,為解決全球糧食短缺問(wèn)題貢獻(xiàn)力量。在材料科學(xué)領(lǐng)域,Evo 2模型可用于設(shè)計(jì)生物燃料或分解石油、塑料的蛋白質(zhì)。
團(tuán)隊(duì)表示,Evo 2已向全球科研人員開(kāi)放,他們可通過(guò)網(wǎng)頁(yè)便捷使用該模型,或免費(fèi)下載該模型的源代碼、訓(xùn)練數(shù)據(jù)及參數(shù),共同探索生物學(xué)的奧秘。