作为钙钛矿太阳能电池(PSCs)的光吸收层材料,有机无机杂化钙钛矿(HOIPs)因具有优异的光学性能、低的制造成本和可大范围调控带隙等优势而受到巨大关注。HOIPs的带隙是影响钙钛矿太阳能电池(PSCs)光吸收能力的关键因素。根据Shockley-Queisser
(SQ)理论,当带隙值在1.3~1.4范围内时,单结钙钛矿电池具有理论最高光电转换效率,此时的带隙被称为理想带隙。同时,>1.7 eV的宽带隙杂化钙钛矿还能被应用于叠层钙钛矿太阳能电池。尽管已经可以通过第一性原理计算方法对杂化钙钛矿的带隙值进行理论预测,但对于多组元微量掺杂的杂化钙钛矿,其较高的计算成本和计算时间限制了大规模的带隙筛选。如何利用大量的杂化钙钛矿带隙实验数据进行理想带隙组分的大规模筛选成为带隙快速调控的关键。尽管已有部分研究使用杂化钙钛矿的组分原子比作为输入实现了带隙预测机器学习模型的构建,但这类模型普遍存在物理可解释能力差,实验人员使用不方便的问题。
昆明理工大学种晓宇教授等人为实现杂化钙钛矿材料的带隙快速调控、带隙主要影响规律的定量探索,提出了可解释性的机器学习策略。通过三步可解释机器学习策略,在已有的超过600条杂化钙钛矿带隙实验数据基础上,成功实现了杂化钙钛矿带隙的高精度预测模型构建,同时,使用具有完全可解释能力的符号回归算法构建了带隙与物理参量间的定量关系式,方便实验人员实现带隙的快速调控。最后,通过在大规模虚拟组分中进行层层筛选,成功预测并验证了具有理想带隙的杂化钙钛矿新组分。该研究为进一步理解杂化钙钛矿带隙影响规律以及相关领域的可解释机器学习模型构建提供了指导。相关研究成果以“Accelerating the Discovery of Hybrid Perovskites with Targeted Bandgaps Via Interpretable Machine Learning”为题发表于ACS Applied Materials & Interfaces。
论文链接:
https://pubs.acs.org/doi/full/10.1021/acsami.3c06392
图1. 利用可解释机器学习策略预测杂化钙钛矿带隙流程图。
图2 以物理参量作为特征输入时,不同机器学习算法下的测试集误差(a)GBRT(梯度提升回归树)算法(b)ANN(人工神经网络)算法(c)SVM(支持向量机)算法(d)KNN(K近邻算法)算法
图3 (a)特征重要性排序 (b)使用不同特征子集时训练集和测试集的均方根(RMSE)误差,误差棒来自十次不同参数的GBRT-P模型预测结果(c)使用原子比作为输入时的GBRT-C模型对MAxFAyCs1-xPbI3的带隙预测分布图(d)GBRT-C对MAPbBrxClyI1-x-y.带隙预测分布图
表2:通过符号回归算法挖掘的带隙与物理参量间定量表达式、测试集误差和公式复杂度
图4 (a)三种验证组分和训练集测试集中的数据特征空间分布,A: MA0.23FA0.02Cs0.75Pb0.59Sn0.41Br0.24I2.76,
B: MA0.02FA0.08Cs0.9Pb0.5Sn0.5Br0.9I2.1,C: MA0.2FA0.32Cs0.48Pb0.82Sn0.18Br1.83I1.17(b)三种验证组分薄膜样品的XRD衍射图谱(d)三种验证组分的预测和实验带隙值(d)通过GBRT-P预测的10万条虚拟组分的带隙概率密度分布
文章通过使用物理参量作为输入特征,结合具有定性解释能力的梯度提升回归树算法以及具有定量解释能力的符号回归算法构建了应用于材料科学研究的可解释机器学习策略。成功实现杂化钙钛矿带隙的高精度预测及定性和定量的解释。研究发现,B位与X位的电负性差是影响带隙的关键因素。最后,结合模型筛选和实验成功合成了具有理想带隙的新钙钛矿组分。该可解释性的机器学习策略同样可以应用于其它材料领域,具有普适性。近年来,材料科学相关机器学习研究日益增长,在关注模型精度的同时保持模型在材料机理上的解释能力对于数据驱动的材料发现至关重要,如何进一步平衡模型精度和物理可解释性还有待进一步的深入研究。
*感谢论文作者团队对本文的大力支持
联系客服