日韩区一区二区三区四|交换国产精品视频一区|国产口爆吞精在线观视频|午夜无码大尺度福利视频|二区亚洲国产精品一区久久|精品国产一级二级三级在线|欧美日韩精品久久久免费观看|亚洲高清一区二区三区高清不卡

AI翻開生命“密碼全書”  全新大模型可預(yù)測和設(shè)計基因序列

2024-11-16 07:50:21 來源: 科技日報 點擊數(shù):

科技日報記者 張夢然

《科學(xué)》雜志15日發(fā)布了一項突破性研究成果:美國斯坦福大學(xué)Arc研究所團隊利用人工智能(AI),開發(fā)出一種大規(guī)模基因組基礎(chǔ)模型“Evo”,翻開了生命的“密碼全書”。該模型采用先進架構(gòu),能夠以前所未有的精度,解析和設(shè)計從分子層面到整個基因組級別的DNA、RNA及蛋白質(zhì)序列。其不僅能夠預(yù)測突變對細胞內(nèi)部各個調(diào)控層級的影響,還能設(shè)計出用于操控細胞功能的DNA序列,這或?qū)氐赘淖兒铣缮飳W(xué)的發(fā)展路徑。

科學(xué)家一直試圖借鑒大型語言模型的成功經(jīng)驗,讓AI技術(shù)將DNA視為一種“語言”來建模,但現(xiàn)有模型捕捉廣泛基因組交互作用的能力有限。

此次,研究團隊開發(fā)了具備70億參數(shù)的Evo模型,能夠生成覆蓋整個基因組的DNA序列。該模型利用270萬來自進化多樣性微生物的基因組數(shù)據(jù)集進行了訓(xùn)練,并首次報告了DNA領(lǐng)域的縮放定律,這項發(fā)現(xiàn)與語言和視覺領(lǐng)域已知的現(xiàn)象相呼應(yīng)。實驗結(jié)果顯示,Evo在預(yù)測性和生成性的生物學(xué)任務(wù)中均表現(xiàn)優(yōu)異,無論是預(yù)測突變對細菌蛋白質(zhì)和RNA的影響,還是在模擬基因調(diào)控機制方面,都展現(xiàn)出了極高的準確性。

此外,Evo還能夠處理編碼序列與非編碼序列之間的復(fù)雜共進化關(guān)系,支持設(shè)計包括功能性CRISPR-Cas復(fù)合體和轉(zhuǎn)座子在內(nèi)的復(fù)雜生物體系。這是首次實現(xiàn)蛋白質(zhì)-RNA和蛋白質(zhì)-DNA結(jié)構(gòu)與語言模型協(xié)同設(shè)計的例子。在全基因組尺度上,Evo能夠生成超過100萬堿基對的序列,其預(yù)測和生成能力涵蓋了從分子到基因組的多層次復(fù)雜度,極大推進了人們對生物學(xué)本質(zhì)的認識和操控能力。

團隊認為,后續(xù)模型將進一步擴展至人類及其他真核生物的基因組數(shù)據(jù)學(xué)習(xí),通過增加上下文長度來更好地捕捉大基因組間的遠程相互作用。這將為生物學(xué)研究開辟新的視野,推動生命科學(xué)領(lǐng)域的持續(xù)發(fā)展。

基因組序列的變化,其實有助于生物體適應(yīng)不斷改變的環(huán)境條件,進而驅(qū)動物種進化。隨著DNA測序技術(shù)的飛躍進步,科學(xué)家已能夠在全基因組范圍內(nèi)繪制出基因組變異圖譜。再結(jié)合創(chuàng)新的AI算法,使得構(gòu)建一個能深入理解DNA、RNA和蛋白質(zhì)功能及其相互作用的綜合模型成為可能。換句話說,現(xiàn)在,人們擁有了一個解碼生命指令的基因組基礎(chǔ)模型。

責(zé)任編輯:李夢一

抱歉,您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式,這會影響您正常瀏覽本網(wǎng)頁

您可以進行以下操作:

1.將瀏覽器切換回極速模式

2.點擊下面圖標升級或更換您的瀏覽器

3.暫不升級,繼續(xù)瀏覽

繼續(xù)瀏覽