摘要
在材料的发现中,探索材料的结构、组分和性能的关系是非常关键的,机器学
习可以作为一种有效的工具。然而,传统机器学习的复杂性和模型可解释性的缺乏,
使得很难推导出简单的描述性公式。钙钛矿材料因其在燃料电池和电催化方面具
有很多出色的性能而受到许多研究学家的关注。热力学稳定性是一个关键参数,它
广泛地决定了材料是否有望合成,以及在一定的操作条件下是否会分解。热稳定性
和化学稳定性,在很大程度上取决于材料的形成能。带隙是决定钙钛矿材料光学性
能的一个重要参数,它控制各种光电器件的性能。在高温燃料电池技术中,氧空位
形成能是实现氧快速扩散和氧催化的重要指标。基于第一性原理的高通量计算
(DFT)得到较高精确度的形成能、稳定性、带隙和氧空位形成能,需要花费大量
的时间和精力,效率很低,而且通过实验来获取大量钙钛矿材料体系的形成能、稳
定性、带隙和氧空位形成能也不现实。所以基于人工智能的机器学习预测方法就成
了一种高效的替代方法。本文的主要内容包括以下方面:
第一部分,本文提出了一种新方法,将暴力特征工程和线性回归相结合来探索
钙钛矿材料的结构、组分和性能关系。探讨了钙钛矿的热力学稳定性、晶格常数与
其他特征的关系。利用暴力特征工程构造大量新的描述符,通过特征选择得到重要
的描述符子集,然后通过线性回归算法找到了最优描述符,得到了热力学稳定性和
晶格常数的新表达式。
第二部分,对特征进行了比较,选取有效特征作为描述符,建立了基于随机森
林(RF)、梯度提升回归树(GBR)、自适应增强算法(AdaBoost)、分类梯度提
升树(CatBoost)和极端梯度提升树(XGBoost)等不同机器学习算法的预测模型。
研究其与ABO3钙钛矿化合物的形成能、稳定性、带隙和氧空位形成能之间的关系,
并得到具有较高准确性的模型,对这四种关键性能进行预测。借助训练好的机器学
习模型,找到了影响钙钛矿性能的关键特征。
结果表明,这种将暴力特征工程和线性回归相结的方法可以在没有先验知识
的情况下探索材料的结构、组分和性能关系,加速了材料的发展,为材料的探索和
研究提供了一种新方法。在对钙钛矿性质预测的研究中,该模型具有非常高的准确
率,可以广泛应用于需要进行大批量性能预测的钙钛矿材料研究中。
关键词:钙钛矿,机器学习,描述符,结构-组分-性能关系,性能预测
ABSTRACT
Inmaterialsdiscovery,itiskeytoexplorethestructure-composition-property
relationships,andmachinelearningcanbeusedasaneffectivetool.However,the
complexityofconventionalmachine-learningandthelackofmodelinterpretabilitymake
itdifficulttoderivesimpledescriptiveformulas.Perovskitematerialshavereceivedmuch
attentionduetotheirexceedinglygoodperformanceinfuelcellsandelectrocatalysis.
Thermodynamicstabilityisakeyparameterthatbroadlydetermineswhetherthematerial
isexpectedtobesynthesizedandwhetheritwilldecomposeundercertainoperating
conditions.Thethermalandchemicalstability,toalargeextent,dependsontheformation
energy.Bandgapisanimportantparameterthatdeterminestheopticalpropertiesof
perovskitematerialsand