2021年7月16日,谷歌旗下的DeepMind團(tuán)隊在 Nature 發(fā)表論文,發(fā)布了開源了基于人工智能(AI)的蛋白質(zhì)結(jié)構(gòu)預(yù)測工具——AlphaFold2,AlphaFold2僅通過氨基酸序列就能以前所未有的準(zhǔn)確度預(yù)測蛋白質(zhì)三維結(jié)構(gòu)。 近期,巴塞爾大學(xué)和SIB瑞士生物信息學(xué)研究所的一個研究小組發(fā)現(xiàn)了一個未知蛋白質(zhì)的寶庫。利用這種AI,他們發(fā)現(xiàn)了數(shù)百個新的蛋白質(zhì)家族,甚至是一個新的預(yù)測蛋白質(zhì)折疊。這項研究現(xiàn)已發(fā)表在Nature.
在過去的幾年里,AlphaFold已經(jīng)徹底改變了蛋白質(zhì)科學(xué)。這種人工智能(AI)工具經(jīng)過了50多年來生命科學(xué)家收集的蛋白質(zhì)數(shù)據(jù)的訓(xùn)練,能夠高精度地預(yù)測蛋白質(zhì)的3D形狀。去年,它的成功促成了驚人的2.15億個蛋白質(zhì)的建模,提供了對幾乎任何蛋白質(zhì)形狀的深入了解。這對于沒有經(jīng)過實驗研究的蛋白質(zhì)來說尤其有趣,這是一個復(fù)雜而耗時的過程。
“現(xiàn)在有許多蛋白質(zhì)信息來源,包含了蛋白質(zhì)如何進(jìn)化和工作的寶貴見解,”該研究的負(fù)責(zé)人Joana Pereira說。然而,長期以來,研究一直面臨著data jungle的問題。由巴塞爾大學(xué)生物中心和瑞士生物信息學(xué)研究所(SIB)組長Torsten Schwede教授領(lǐng)導(dǎo)的研究小組現(xiàn)在成功地解密了一些隱藏的信息。
新的蛋白質(zhì)家族和折疊
研究人員構(gòu)建了一個由5300萬個具有高質(zhì)量AlphaFold結(jié)構(gòu)的蛋白質(zhì)組成的互動網(wǎng)絡(luò)。第一作者Janani Durairaj博士強調(diào)說:“這個網(wǎng)絡(luò)是理論上預(yù)測未知蛋白質(zhì)家族及其大規(guī)模功能的寶貴來源。”該團(tuán)隊能夠識別290個新的蛋白質(zhì)家族和一個類似花朵形狀的新蛋白質(zhì)折疊。
基于Schwede集團(tuán)在開發(fā)和維護(hù)領(lǐng)先軟件SWISS-MODEL方面的專業(yè)知識,他們將該網(wǎng)絡(luò)作為交互式網(wǎng)絡(luò)資源提供,稱為“Protein Universe Atlas”。
人工智能在研究中是一個有價值的工具
該團(tuán)隊使用基于深度學(xué)習(xí)的工具在這個網(wǎng)絡(luò)中尋找新奇之處,為生命科學(xué)的創(chuàng)新鋪平了道路,從基礎(chǔ)研究到應(yīng)用研究。Pereira說:“了解蛋白質(zhì)的結(jié)構(gòu)和功能通常是開發(fā)新藥或通過蛋白質(zhì)工程修改其功能的第一步。”這項工作得到了SIB的“kickstarter”資助,鼓勵在生命科學(xué)資源中采用人工智能。它強調(diào)了深度學(xué)習(xí)和智能算法在研究中的變革潛力。
有了蛋白質(zhì)宇宙圖譜,科學(xué)家們現(xiàn)在可以了解更多與他們的研究相關(guān)的蛋白質(zhì)。Janani Durairaj說:“我們希望這個資源不僅可以幫助研究人員和生物管理員,還可以為學(xué)生和教師提供一個學(xué)習(xí)蛋白質(zhì)多樣性的新平臺,從結(jié)構(gòu)、功能到進(jìn)化。”
蛋白質(zhì)宇宙圖譜:https://uniprot3d.org/atlas/AFDB90v4
(文章來源:www.ebiotrade.com/newsf/2023-9) |