基本信息
文件名称:基于机器学习的离子液体中气体溶解度定量构效关系研究.pdf
文件大小:7.94 MB
总页数:87 页
更新时间:2025-06-30
总字数:约12.02万字
文档摘要

基于机器学习的离子液体中气体溶解度

定量构效关系研究

摘要

工业生产过程排放的CO和HS等污染气体对环境的影响日益受到人们的

22

关注,因此寻求高效捕集污染气体且再生成本低的方法已经成为了当今社会的重

要话题。离子液体作为新型绿色溶在吸收捕获气体上具有优势,然而由于时间和

材料限制,采用实验方法筛选优异性能的离子液体难以满足现实的需要。为了加

速离子液体的有效筛选和设计,基于机器学习开发离子液体中气体溶解度的定量

构效关系模型具有重要意义。

完成离子液体的分子结构特征工程是构建定量构效关系模型的关键步骤,本

文提出了3种量化离子液体结构特征的方法,用于耦合机器学习以实现气体溶解

度的准确预测。其一是通过特征编码和one-hot编码将离子液体的分子结构转换

为二维矩阵,并使用卷积自编码器进行降维从而获得分子结构矩阵(MSM)。分

别将MSM和分子描述符(MD)作为深度神经网络(DNN)、随机森林(RF)和

支持向量回归(SVR)三种模型的输入进行预测CO2在离子液体中的溶解度。通

2

过模型比较和验证显示MSM-DNN具有最高准确性(R=0.9873,MSE=0.0007),

进一步与文献报道的模型对比,在训练数据量少的情况下还展示了精度和平均误

差值上的优势。

其二是利用真实溶剂似导体屏蔽模型(COSMO-RS)计算离子液体的屏蔽电

荷密度信息,根据曲线分布的疏密划分得到COSMO衍生描述符,再构建DNN

模型来预测CO2在离子液体中的溶解度,同时COSMO-RS也为气体溶解度提供

了预测值。统计指标显示DNN模型具有更高的预测准确性,两个模型的R2分别

为0.9911和0.6185。进一步通过应用域分析显示测试集中只有2.56%的数据点被

认为是结构异常值,并且所有数据点均在合理范围内。

最后是基于特征提取策略提取离子液体的分子结构特征,将特征的类型及出

现频次作为分子特征标识(MFI),分别以MD、MFI以及两者的组合(MD-MFI)

共三种结构量化特征作为DNN和RF模型的输入,用于预测HS在离子液体中

2

的溶解度。结果表明,不同离子液体结构量化方式对模型预测性能依次为

MFIMD-MFIMD。利用SHAP方法分析了特征对模型预测的贡献,并通过计算

与离子液体的静电势能,发现烷基链的增长能提高HS溶解度。这项研究不

2

仅为离子液体中气体溶解度数据的丰富和相平衡问题的解决提供了新的工具,还

能够为设计性能优异的离子液体提供指导。

关键词:离子液体;机器学习;定量构效关系;分子结构量化;气体溶解度

QUANTITATIVESTRUCTURE-

ACTIVITYRELATIONSHIPSTUDYOF

GASSOLUBILITYINIONICLIQUIDS

BASEDONMACHINELEARNING

ABSTRACT

TheimpactofpollutinggasessuchasCOandHSemittedfromindustrial

22

productionprocessesontheenvironmenthasattractedincreasingattention.Therefore,

ithasbecomeanim