Data-Driven Parametrized Molecular Mechanics Force Field for Expansive Chemical Space Coverage
题目:Data-Driven Parametrized Molecular Mechanics Force Field for Expansive Chemical Space Coverage
报告人:郑天泽,字节跳动
主持人:徐军
时间:2024年10月22日(周二)15:00
地点:英士楼204
欢迎各位老师和同学参加!
报告人简介:郑天泽,先后于2017年、2022年在清华大学化学工程系获得学士学位与博士学位。博士期间,在化工系高分子所郭宝华教授课题组工作,主要研究方向为开发粗粒化力场模型,并应用于高分子材料介观尺度结构与性能的研究。曾以一作身份在Macromolecules、Materials Horizons、Molecular Simulation等期刊发表学术论文。目前,在字节跳动科学计算团队担任计算化学研究科学家,主要负责小分子力场开发的工作。
报告摘要:
分子动力学(MD)模拟是药物发现中重要的计算工具,而模拟中使用的力场决定了计算结果的准确性。随着有机合成和高通量实验技术的快速发展,潜在药物分子的化学结构愈发多样,对力场化学空间覆盖能力提出了新的要求。目前业界主流的传统力场使用简单的函数形式和配套的力场参数预测势能面。尽管其计算速度快且稳定性强,但精度较差。优化力场参数,提高力场的精度和化学空间覆盖是行业的关键需求。
为解决上述问题,我们开发了ByteFF,使用先进的图神经网络模型预测传统力场参数。与传统的查表获取参数不同,ByteFF神经网络将分子结构映射到连续的参数空间,具有更强的泛化能力,并适合大规模训练。为了训练ByteFF,我们构建了百万量级的高精度量化数据集,设计了匹配的训练方法,在多个GPU上采用自动微分的方式进行大规模并行训练。
测试结果表明,ByteFF在二面角势能面预测、平衡态构象预测以及非平衡态能量和力预测等方面都达到了行业先进水平。我们期待ByteFF能在药物虚拟筛选、分子对接及结合自由能预测等方面发挥重要作用。
参考文献:https://arxiv.org/abs/2408.12817