塑料污染已成为全球关注的可持续发展问题。塑料全生命周期涉及原料开采、聚合生产、产品使用以及回收处置等多个环节,相关环境影响证据分散在大量文献与数据来源中,难以高效整合与结构化利用。同时,塑料相关化学品(助剂、单体、非有意添加物质等)的化学组成、毒性与功能属性信息仍存在显著缺口,制约了对化学风险与环境影响的系统认识。清华大学化工系胡山鹰课题组和王笑楠课题组将人工智能技术引入塑料生命周期信息结构化、塑料相关化学品信息补全与可持续化学数据体系建设,探索构建科学-政策界面的机制,为塑料污染治理提供科学信息支撑。
数据和知识是政策决策的重要基础,但现有科学与政策界面仍缺乏能够高效汇聚分散科学信息的可复用机制。围绕“分散的塑料全生命周期环境影响证据如何实现系统汇聚及可比分析”这一问题,研究团队构建了人工智能驱动的科学—政策界面(science–policy interface)框架。该框架融合领域知识、提示词工程与大语言模型支持的的自动化信息提取流程,对分散在海量文献中的信息进行结构化转换与跨研究集成,形成塑料全生命周期环境影响(PLCEI)结构化数据库。该数据库由1,423篇高质量相关研究论文支撑,并按研究对象进一步拆分扩展为3,017条记录、覆盖94个信息维度,包含塑料类型、系统边界、时空范围、数据来源、影响指标、不确定性分析与耦合模型等要素。数据库分析揭示了塑料助剂、工程塑料和化学回收技术等方向的环境影响信息存在关键缺口,也显示全球研究信息在地区间分布不均衡。针对数据本身,团队进一步引入可解释机器学习,对导致不同研究结论差异的因素进行量化归因,指出数据来源选择与是否开展不确定性分析等方法学要素是影响结果差异的重要间接因素,为后续开展数据质量控制与统一报告规范提供了可操作的分析依据。相关成果以“面向全球塑料全生命周期环境影响的人工智能驱动科学-政策界面框架”(Artificial intelligence-driven framework for science–policy interface on global plastic life-cycle environmental impacts)为题,于2025年12月26日发表于细胞(Cell)出版社交叉学科期刊《联结》(Nexus)。

图1. 人工智能驱动科学-政策界面框架的技术路线
在上述工作基础上,团队进一步聚焦塑料相关化学品信息缺口,提出了一套面向塑料相关化学品的知识集成人工智能框架,旨在补齐化学品数据库信息缺口并支撑科学-政策界面建设。该研究从三条主线推进数据补全与知识结构化:首先基于大语言模型构建化学品数据解析工作流,建立包含20,618条高粒度条目的塑料相关化学品数据库;开发轻量化机器学习模型,高效补全了七项关键毒性指标的缺失标签;并开发模糊检索与精确检索的策略,实现对塑料添加剂功能标签的自下而上识别与归类。通过对功能属性与毒性关系的系统性分析,研究揭示了功能属性是识别“受关注化学品”的必要视角,为塑料添加剂的绿色替代与上游决策提供了科学依据。相关成果以“迈向塑料相关化学品全面科学信息体系的人工智能方法”(Toward comprehensive scientific information on plastic-related chemicals powered by artificial intelligence)为题,于2025年12月19日发表于《绿色化学》(Green Chemistry),并入选为当期封面文章。

图2. 塑料相关化学品数据库全景图与基于大语言模型的化学组分解析工作流
通过深入全面地研究复杂塑料化学系统,团队明确了“可持续化学中环境影响评价如何更高效”的共性需求。针对此问题,系统总结梳理分子结构驱动的机器学习模型在化学品生命周期环境影响快速预测方面的研究进展,归纳训练数据、特征工程与模型架构等关键要素,并讨论数据稀缺等挑战。研究建议建立更大规模、开放透明的化学品LCA数据库,以及面向高质量数据的外部规范与共享机制,将是推动该领域进一步发展的基础。相关成果以“快速预测化学品全生命周期环境影响的机器学习模型:现状、挑战与未来方向”(Machine learning models for rapid prediction of chemicals’ life-cycle environmental impacts: Current status, challenges, and future directions)为题,于2025年8月20日发表于中国科技期刊卓越行动计划高起点新刊《绿碳》(Green Carbon)。

图3. 用于预测化学品生命周期环境影响的机器学习模型的核心发展方向
以上三项工作面向塑料污染治理与可持续化学研究中的关键数据与方法学瓶颈,形成了可行的端到端人工智能驱动研究框架,覆盖塑料全生命周期环境影响证据汇聚、塑料相关化学品组成毒性与功能信息补全以及化学品环境影响快速预测等环节,推动相关研究从依赖人工梳理与零散证据的传统模式,向可规模化集成、可计算分析与可迭代更新的智能化研究范式转变,为塑料生命周期科学评估与化学风险识别提供方法支撑与路径参考。
清华大学化工系王笑楠副教授和胡山鹰教授为以上系列论文共同通讯作者,化工系2022级博士生赵凯为以上系列论文的第一作者,其他共同第一作者包括化工系2022级博士生彭茜婷、2025级工程博士生陶然和探微书院2022级本科生李奕均。研究参与作者包括2022级探微书院本科生王驰、2023级化工系硕士生张义晟、电子科技大学计算机科学与工程学院(网络空间安全学院)2023级博士生苏宇辰、2024级博士生黄诗玥,以及南昌大学博士后研究员(化工系2018级博士毕业生)付航。本系列工作致谢上海易碳数字科技有限公司和上海海科智慧数据科技有限公司(HiQLCD)的执行董事兼总经理桂志军对研究结果的专业验证。
上述研究得到了 “碳中和与能源智联”(CNEST)国际大科学计划培育项目、中央高校青年教师科研创新能力支持项目(U40)以及清华大学自主科研计划等的资助支持。
论文链接:
https://doi.org/10.1016/j.ynexs.2025.100116
https://doi.org/10.1039/D5GC04822B
https://doi.org/10.1016/j.greenca.2025.05.004