引言
随着AI辅助的生物技术不断进步,我公司创始人兼CTO,上海交通大学生命科学技术学院的杨广宇教授团队,联合上海交通大学自然科学研究院的洪亮教授团队,采用Pro-PRIME蛋白语言大模型和高效的模型优化方法,在短短两轮设计中,显著提高了蛋白质的稳定性,并成功实现100%的复合突变增益。这项技术基于蛋白质大模型,利用有限的酶蛋白的(突变-活性-稳定性)标注数据集,通过模型的精细调校,能够准确预测复合突变对目标酶蛋白的稳定性影响,从而优化酶的稳定性改造过程。

概述
优化酶的热稳定性对于生物医疗科学及相关工业应用至关重要。当前,利用(半)理性设计和随机诱变方法可以精确识别多个增强酶热稳定性的单点突变。然而,组合多个突变时,复杂的上位效应常常会导致组合突变体失活。为了优化酶,通常需要多轮设计以逐步引入各单个突变位点,这一过程非常耗时。最近,杨广宇教授团队的研究论文《优化酶热稳定性通过结合多个突变使用蛋白质语言模型》在《mLife》期刊正式发布。该研究团队提出了一种AI辅助的酶热稳定性工程策略,能够高效组合多个有益单点突变。在肌酸酶的研究案例中,经过仅一次设计,他们便成功获得了50个具有卓越热稳定性的组合突变体,设计成功率达到100%。
研究方法
本研究运用AI辅助的策略,通过少量实验数据精细调校Pro-PRIME模型,预测组合突变体的稳定性和活性。Pro-PRIME模型是基于9600万个宿主细菌菌株的最佳生长温度数据训练的,在高温酶的设计和优化方面表现突出。微调使用的初始数据集包含来自肌酸酶的73个低阶突变体的序列-热稳定性和活性数据,通过这一模型,能够有效捕捉组合突变体的特性。
研究发现
研究显示,最佳突变体13M4包含13个突变位点,相比于野生型,其活性保持基本不变,且在Tm上提高了1019°C,58°C下半衰期则增加了约655倍。该项研究揭示,长距离突变之间在动态学上存在相关性,影响了突变体的稳定性,提供了未来研究上位效应的有效工具。
主要亮点
ag尊龙凯时所提出的AI辅助酶热稳定性工程策略高效组合了多个单点突变,仅用两轮设计便获得了50个组合突变体,成功率高达100%。最佳突变体13M4在提高热稳定性的同时,催化活性仍旧保持不变。通过高质量实验数据微调模型,使其能准确捕捉复杂的上位效应,这对后续的高阶组合突变体的预测极为关键。借助动态相关矩阵分析,进一步阐明了长程上位效应的机制。
此外,采用这种策略的研究团队,在两轮设计中全面探索了超过26万种可能的突变体组合,显著缩短了传统方法所需的进化轮次,提高了蛋白质工程的效率。研究指出,将来自蛋白质工程的数据与先进的AI模型相结合,能够进一步提升模型的预测能力,从而推动蛋白质工程的效率,适用于多种关键酶分子的进化任务。