基因療法有可能治愈遺傳性疾病,但如何安全有效地將新基因打包并輸送到特定細胞中仍然是一個挑戰(zhàn)。腺相關(guān)病毒(AAV)是最常用的基因傳遞載體之一,現(xiàn)有的工程方法往往是緩慢和低效的。
現(xiàn)在,麻省理工學院博德研究所和哈佛大學的研究人員已經(jīng)開發(fā)出一種機器學習方法,有望加快基因治療的AAV工程。該工具可以幫助研究人員設(shè)計aav的蛋白質(zhì)外殼,稱為衣殼,使其具有多種理想的特性,例如能夠?qū)⒇浳镞\送到特定的器官而不是其他器官,或者在多個物種中工作。其他方法一次只尋找具有一種特征的衣殼。
研究小組利用他們的方法為一種常用的AAV設(shè)計了衣殼,這種AAV9更有效地靶向肝臟,而且很容易制造。他們發(fā)現(xiàn),他們的機器學習模型預(yù)測的大約90%的衣殼成功地將貨物運送到人類肝細胞中,并符合其他五個關(guān)鍵標準。他們還發(fā)現(xiàn),他們的機器學習模型正確地預(yù)測了獼猴體內(nèi)蛋白質(zhì)的行為,即使它只接受了小鼠和人類細胞數(shù)據(jù)的訓練。這一發(fā)現(xiàn)表明,新方法可以幫助科學家更快地設(shè)計跨物種的aav,這對于將基因療法轉(zhuǎn)化為人類至關(guān)重要。
最近發(fā)表在《自然通訊》上的研究結(jié)果來自Ben Deverman的實驗室,他是布羅德研究所斯坦利精神病學研究中心的研究所科學家和載體工程主任。Deverman小組的高級機器學習科學家Fatma-Elzahraa Eid是這項研究的第一作者。
“這是一種非常獨特的方法,”德弗曼說。“它強調(diào)了濕實驗室生物學家與機器學習科學家早期合作設(shè)計實驗產(chǎn)生機器學習數(shù)據(jù)的重要性,而不是作為事后的想法。”
研究組組長Ken Chan、研究生Albert Chen、研究助理Isabelle Tobey和科學顧問Alina Chan都在Deverman的實驗室,他們也為這項研究做出了重要貢獻。
為機器讓路
設(shè)計aav的傳統(tǒng)方法包括生成包含數(shù)百萬衣殼蛋白變體的大型文庫,然后在細胞和動物中進行幾輪選擇測試。這一過程既昂貴又耗時,而且通常導(dǎo)致研究人員只能識別出少數(shù)具有特定特征的衣殼。這使得尋找滿足多個標準的衣殼變得非常困難。
其他研究小組已經(jīng)使用機器學習來加速大規(guī)模分析,但大多數(shù)方法都是以犧牲另一種功能為代價來優(yōu)化蛋白質(zhì)的。
Deverman和Eid意識到,基于現(xiàn)有大型AAV庫的數(shù)據(jù)集不太適合訓練機器學習模型。“我們不是簡單地把數(shù)據(jù)交給機器學習科學家,而是想,‘我們需要什么來更好地訓練機器學習模型?’弄清楚這一點真的很有幫助。”
他們首先使用第一輪機器學習建模來生成一個新的中等大小的庫,稱為Fit4Function,其中包含被預(yù)測可以很好地包裝基因貨物的衣殼。研究小組在人類細胞和小鼠中篩選了這些文庫,以找到對每個物種的基因治療具有重要特定功能的衣殼。然后,他們利用這些數(shù)據(jù)建立了多個機器學習模型,每個模型都可以從衣殼的氨基酸序列中預(yù)測某種功能。最后,他們結(jié)合使用這些模型創(chuàng)建了針對多個特征同時優(yōu)化的“多功能”aav庫。
蛋白質(zhì)設(shè)計的未來
為了證明這一概念,Eid和Deverman實驗室的其他研究人員結(jié)合了六個模型來設(shè)計一個衣殼庫,該衣殼庫具有多種期望的功能,包括可制造性和跨越人類細胞和小鼠靶向肝臟的能力。幾乎90%的這些蛋白質(zhì)同時顯示出所有所需的功能。
研究人員還發(fā)現(xiàn),該模型——僅用來自小鼠和人類細胞的數(shù)據(jù)進行訓練——正確地預(yù)測了aav如何分布到獼猴的不同器官,這表明這些aav是通過一種跨物種翻譯的機制來實現(xiàn)的。這可能意味著在未來,基因治療研究人員可以更快地識別出具有多種理想特性的衣殼,供人類使用。
將來,Eid和Deverman說,他們的模型可以幫助其他團體創(chuàng)造針對肝臟或?qū)iT避免肝臟的基因療法。他們還希望其他實驗室將使用他們的方法來生成自己的模型和庫,這些模型和庫可以共同形成一個機器學習圖譜:一個可以預(yù)測AAV衣殼在數(shù)十個特征上的表現(xiàn),以加速基因治療發(fā)展的資源。
(文章來源:www.ebiotrade.com/newsf/2024-8/20240809054443732.htm) |