根據(jù)密歇根大學(xué)研究人員的一項新研究,一種使用簡單、成本效益高的實驗和機器學(xué)習(xí)模型的蛋白質(zhì)工程方法可以預(yù)測哪些蛋白質(zhì)對特定目的有效。
該方法在組裝蛋白質(zhì)和多肽方面具有深遠(yuǎn)的潛力,可用于從工業(yè)工具到治療方法的應(yīng)用。例如,這項技術(shù)可以幫助加速穩(wěn)定肽的開發(fā),以目前的藥物無法做到的方式治療疾病,包括改善免疫治療中抗體與靶標(biāo)的排他性結(jié)合。
“控制蛋白質(zhì)如何工作的規(guī)則,從序列到結(jié)構(gòu)再到功能,是如此復(fù)雜。為蛋白質(zhì)工程的可解釋性做出貢獻尤其令人興奮,”這項研究的第一作者馬歇爾·凱斯說。
目前,大多數(shù)蛋白質(zhì)工程實驗使用復(fù)雜的、勞動密集型的方法和昂貴的儀器來獲得非常精確的數(shù)據(jù)。漫長的過程限制了可以獲得的數(shù)據(jù)量,而復(fù)雜的方法對學(xué)習(xí)和執(zhí)行來說是具有挑戰(zhàn)性的——這是精度的權(quán)衡。
“我們的方法表明,在許多應(yīng)用中,你可以避免這些復(fù)雜的方法,”凱斯說。
更新的方法首先將細(xì)胞分為兩組,稱為二元分選,基于它們是否表達所需的特征-如與熒光分子的結(jié)合-或不。然后,對細(xì)胞進行測序,以獲得感興趣的蛋白質(zhì)的潛在DNA代碼。然后,機器學(xué)習(xí)算法會減少測序數(shù)據(jù)中的噪音,從而識別出最好的蛋白質(zhì)。
密歇根大學(xué)化學(xué)工程副教授、論文通訊作者格雷格·瑟伯(Greg Thurber)說:“與其從圖書館中選擇‘最好的書’,不如讀很多書,然后把不同故事的不同頁面拼湊在一起,盡可能找到最好的書,即使它不在你原來的圖書館里。”“我很驚訝地看到,使用簡單的二進制排序數(shù)據(jù),這種技術(shù)的穩(wěn)健性。”
該方法使用線性機器學(xué)習(xí)模型進一步增強了其可訪問性,與具有數(shù)十個參數(shù)的模型相比,線性機器學(xué)習(xí)模型更容易解釋。
凱斯說:“因為我們可以了解蛋白質(zhì)實際工作的物理規(guī)則,我們可以使用線性方程來模擬非線性蛋白質(zhì)行為,從而制造出更好的藥物。”
這項研究是在高級基因組學(xué)核心、結(jié)構(gòu)生物學(xué)中心、生物質(zhì)譜設(shè)備和蛋白質(zhì)組學(xué)與肽合成核心進行的。
(文章來源:www.ebiotrade.com/newsf/2024-3) |