- A+
山东大学微生物技术国家重点实验室典龙阳教授课题组论述了计算机辅助合成规划与机器学习促进的化学反应条件优化方法(图1)。重点是在利用机器学习对条件优化中数据的来源、描述符选择、反应模型以及结果评估指标等方面进行了介绍,旨在阐明该方向的研究进展和发展趋势,助力化学反应条件的人工智能精准预测。
图1. 计算机辅助合成规划与机器学习:化学反应条件的优化 在传统实验化学方面,反应条件的优化构思往往依托于有机合成人员的知识储备和实验经验。后来,合成化学家们在大数据库的基础上进行相似性搜索以此获得条件优化的灵感。随着机器学习模型的广泛应用,使用机器学习方法来构建反应物、产物和反应条件之间的关系,从而提高合成效率和精准度。重点讨论介绍了常用的机器学习模型并概述了它们在化学条件预测方面的研究进展,具体模型包括:回归算法、降维算法、聚类算法、贝叶斯方法、基于核的算法、树算法、集成算法、深度学习。 但是反应条件的优化预测往往需要涉及到试剂条件(例如催化剂、添加剂和溶剂)和工艺条件(例如温度、压力和反应时间)等诸多实验参数,涉及的参数因素太多,而且反应条件为多种参数的集合,数据输入也其他领域的预测更为复杂,因此利用机器学习进行化学反应条件的预测和规划目前还有很多的问题要解决,涉及到多标签数据处理、参数空间的限制与压缩、描述符的改进、多种机器学习模型组合等方法来提高反应条件预测的准确度。 该论文综述了在条件预测方面诸多模型的研究现状。与传统实验室的经验筛选优化技术相比,计算机辅助合成规划与机器学习可以显著减少优化时间、成本和材料消耗。随着机器学习模型的进一步发展,从反应中提取到的信息越来越全面,对模型自身黑盒特性导致的预测结果缺乏可解释性的问题也正在被逐步解决。可以预见的是,随着越来越多的科学家投入到该研究领域,机器学习模型将能够更好地预测和设计反应条件,从而促进合成化学领域的智能化发展。 该论文第一作者为硕士毕业生韩喻,硕士研究生邓明静、刘珂等同学也参与了该论文工作,典龙阳教授为唯一通讯作者。该论文受到了国家重点研发计划、国家自然科学基金青年基金、山东省泰山学者青年专家、山东省海外优秀青年基金、山东大学环境与社会考古国际合作联合实验室开放课题等项目的资助。 论文信息 Computer-Aided Synthesis Planning (CASP) and Machine Learning: Optimizing Chemical Reaction Conditions Yu Han, Mingjing Deng, Ke Liu, Jia Chen, Yuting Wang, Yu-Ning Xu, Longyang Dian Chemistry – A European Journal

目前评论:0