机器学习方法根据数据建立模型,然后基于模型进行预测。与定向进化相比,机器学习具备明显优势。在蛋白质定向进化中,那些没有改善效果的突变体信息会被遗弃,而这些信息却可以用来训练优化机器学习的模型。另外,应用机器学习在蛋白质工程中,有望能够更准确的探索更大蛋白质序列空间。机器学习首先根据已有的突变体序列及功能数据作为训练数据构建模型,然后利用模型预测具有提高效果的新突变体。这一过程中,可靠的训练数据是获得准确模型的前提。然而,由于生物系统的复杂性,利用传统方法获得大量的酶分子序列及功能数据是充满挑战的。课题组利用高通量、自动化设备获取可靠的酶分子序列及功能数据,并标准化统一管理,构建可靠的训练数据集,获得可用于准确指导酶分子改造的模型。
创建: Nov 25, 2020 | 20:58
自然界中绝大多数蛋白质都是由 20 种天然氨基酸组成的。然而,天然氨基酸的功能是有限的。 只有不足一半的天然氨基酸含有酸性、碱性以及亲核性的集团,没有任何一个天然氨基酸侧链可以作为反应中的亲电试剂,而这些带电的集团在催化循环中是非常必要的。非天然氨基酸具有与天然 氨基酸不同的化学特性,因此在酶中引入具有新的化学特性的非天然氨基酸将是开发具有新功能的酶分子的潜在策略,将在新型药物中间体合成及其他高价值化学品制造等领域具有重大前景。然而,此方法面临两个挑战:(1)与传统引入突变的方法相比,在蛋白质内引入非天然氨基酸的操作太过复杂; (2)利用化学合成获取非天然氨基酸的成本太过高昂。针对这些问题,课题组从简化酶分子内引入非天然氨基酸的操作流程以及利用合成生物学方法高效合成非天然氨基酸这两个角度开展研究。
创建: Nov 25, 2020 | 20:56
1、系统开发了用于提高蛋白质稳定性的“刚化”柔性位点策略,成功地提高了荧光素酶、肠激酶、转酮酶、Fab、胰蛋白酶的热稳定性。该策略不需要构建大规模的突变文库,不依赖高通量筛选手段,只需定点突变操作即可显著提高酶分子的稳定性。同时这一方法具有普适性,可广泛应用于多种酶的稳定性改造。
2、首次揭示了蛋白质中长距离点突变之间的相互作用机制,阐明了动力学相关性在其中的重要贡献,解决了分子改造过程中酶活性与稳定性“鱼与熊掌不可兼得”的困境。这一成果首次展现了在酶工程中考虑长距离动力学相关性的重要性。
3、首次实现了同时改造转酮酶的供体底物与受体底物特异性。酶的可接受底物范围有限,是其在化学合成应用中的一个主要限制因素。这一成果为迅速扩展双底物酶分子的可接受底物范围提供了重要策略。
创建: Nov 25, 2020 | 21:41