近日,南方科技大学材料科学与工程系讲席教授项晓东课题组在超导临界转变温度(Tc)和析氧电催化剂性能(OER)的人工智能预测上取得重要进展,相关成果以“Predicting superconducting temperatures with new hierarchical neural network AI model”和“Developing new electrocatalysts for oxygen evolution reaction via high throughput experiments and artificial intelligence“为题分别发表在科学期刊Frontiers of Physics 和npj Computational Materials上。
材料科学是一门研究“成分-结构-加工参数-性能”四者之间相互关联的科学。材料性能往往受到复杂机制的支配,因此也促进了材料、物理和人工智能等学科的交叉融合。近年来,机器学习技术特别是神经网络在材料领域的应用日益增多。神经网络在材料科学中取得的成功在很大程度上取决于实验数据的质量、描述符的选择以及所使用的人工智能算法。然而,现有的神经网络算法对小数据集和高维描述符的表现不佳,主要原因是较少的数据量很难有效训练大量的超参数。为了克服这个问题,项晓东团队提出了一种新颖的层级神经网络模型(NNH):首先通过遗传算法确定最佳的输入维度及相应的关键描述符,再对数百万个神经网络子模型进行具有AI学习要素的“神经网络统计集成”。该方法对给定数据集最佳维度上的每个子模型都保留了描述符和目标属性之间的唯一相关性,并且可以由有限数据集并行训练,解决了小数据集与高维描述符之间的矛盾。在此基础上,他们对超导和催化材料进行了研究。
首先,团队对实验数据相对丰富的超导临界温度(Tc)数据进行了详细的清洗以确保数据的高质量。发现以文献中已有的145个通用材料元素描述符作为输入时,即使NNH模型在测试集上的R2从0.830提高至0.913,但对于Tc高于25K的数据出现了严重的欠拟合现象。为此,将通用材料元素描述符的数量扩展至五倍以上(达到909个)。通过遗传算法发现五个权重最高的关键描述符中有三个是新构建的描述符。结合NNH模型,测试集R2从0.913提高至0.956,有效解决了欠拟合的问题。此外,还成功预测了数据集外的45个高熵合金超导体的Tc,其与实验测量值的偏差低于6%。相关工作发表在Frontiers of Physics杂志。
团队还将上述方法应用于小数据集的铁基OER催化剂研究。为了确保数据质量,使用了测量条件一致的高通量实验数据。研究表明,识别出的十大关键描述符全是新扩展的。经过预测与实验迭代,测试集的R2从0.7增加到0.98。最终成功预测了与实验结果高度一致的Fe-Co-Ni、Fe-Co-Ce和Fe-Co-La三元体系的完整塔菲尔斜率-相图及15种新的OER催化剂。相关工作近期发表在npj Computational Materials杂志。
南方科技大学与哈尔滨工业大学联合培养博士生许绍孟为两篇论文的第一作者,项晓东教授为通讯作者,前沿与交叉科学研究院徐晨博士和材料系秦明阳博士为共同通讯作者。论文的主要合作者还包括中科院物理所金魁研究员、南科大材料系陈主阳博士和李伟轩博士等。该研究工作得到国家重点研发项目、国家自然科学基金、深圳市基础研究项目、深圳市材料基因组大科学装置平台重大科技基础设施项目的支持。
论文链接:https://doi.org/10.15302/frontphys.2025.014205
https://www.nature.com/articles/s41524-024-01386-4
供稿单位:材料科学与工程系
通讯员:邓雅丽
主图:丘妍
编辑:周易霖