中国科学院物理研究所刘淼,领衔打造国内最大无机材料数据库

爱迪生通过上千次实验,发明竹炭灯丝白织灯泡。然而,爱迪生并未发现最佳的灯丝材料。后来,人类发现钨丝寿命远优于爱迪生的发明。这一项材料发现,人类用了 60 年。

图丨发光材料发现历程(来源:刘淼)

1972 年,英国科学家斯坦利·惠廷厄姆( )发明了靠前款锂离子二次电池正极材料硫化钛。这一事件启发了约翰·古迪纳夫(John ),8 年后,钴酸锂正极材料诞生,一举改变了人类的能源使用行为。

中国科学院物理研究所刘淼,领衔打造国内最大无机材料数据库

图丨层状电池正极材料 LiTiS 2 , LiVSe 2 , LiCoO 2 , LiNiO 2 , and LiNiyMnyCo 1 -2yO 2 的原子结构[1](来源: Chem. Rev.

新材料是社会发展的底层推动因素。如何高效地找到具有应用价值的新材料,是一个重要的话题。近期,韩国学者发布的 LK-99 常温超导体,引发了广泛的关注和热议。虽然已被证明是个“乌龙事件”,但足以看到人类对新材料的渴望。

中国科学院物理研究所/松山湖材料实验室的刘淼博士从事“AI+ 材料科学”研究,通过高通量计算和数据,解决材料科学问题。其团队自 2018 年以来,自主研发了一个名为“Atomly”的材料库,通过该素材库可快速检索海量材料科学数据。

中国科学院物理研究所刘淼,领衔打造国内最大无机材料数据库

图丨 “Atomly”的材料库界面及简介(来源:刘淼)

以核验 LK-99 的母体材料,Pb 10 (PO 4 ) 6 O 为例,打开这个材料库进行检索,即可发现这是一个绝缘体(能带结构有带隙)。通过 Cu 掺杂,虽然可以增加载流子,但是和常见超导材料的行为相去甚远。

截至目前,Atomly 材料库包含约 35 万个无机化合物、原子结构、电子结构、热力学稳定性、X射线衍射图样等信息。提升了新材料研发效率,推进行业的数字化变革。

中国科学院物理研究所刘淼,领衔打造国内最大无机材料数据库

图丨刘淼(来源:刘淼)

那么,这个数据库背后的原理是什么?它能够为领域带来哪些作用呢?随着“AI for Science”的关注度越来越高,未来“AI+ 材料科学”将呈现怎样的可能性和商业价值?


已有 34 万个晶体结构数据

回顾历史,不难看出人类的活动都是以某种材料来定义的,因此新材料在一定程度上是人类文明的代表。例如石器时代、青铜时代。周朝以其青铜铸造工艺闻名,青兵器助力周朝建立;而秦朝的冶炼铁技术非常高超,铁器助秦灭六国。

近代的中国和西方科学体系差别大的原因之一在于,中国专注于制作陶瓷,而西方则聚焦于制造玻璃,进而应用于望远镜及显微镜,对天文学和生物科学产生了重要的影响。这些历史发展背后的逻辑是新材料带来的底层推动力,最终实现了技术或社会形态的进步。

中国科学院物理研究所刘淼,领衔打造国内最大无机材料数据库

图丨材料传统研发需要漫长过程(来源:刘淼)

但是,新材料的探索和发现往往需要经历漫长的过程。用传统的方式做科学实验往往过程漫长、速度慢,不仅缺乏系统性和标准型,实验中可变因素较多,还依赖科研人员的经验和猜测,无法实现大量的穷举试错。“我们为领域提供了一个高效率、高质量、海量数量的数据库工具。在研发某种新材料的早期阶段,通过该数据库的热力学稳定性等性质判断,来确定是否与预期相符,让材料发现过车更加‘有的放矢’。”刘淼说。

1998 年,诺贝尔化学奖颁发给密度泛函理论( ,DFT)的提出者——着名理论物理学家、理论化学家沃尔特·科恩( Kohn)。

刘淼团队构建的 Atomly 材料数据库正是利用 DFT,能够跳过实验的过程,用高性能计算机来计算每种材料的性质、求解电子在化合物中的运动方程,并能实现高度的准确性。

中国科学院物理研究所刘淼,领衔打造国内最大无机材料数据库

图丨密度泛函理论预测化合物(来源:刘淼)

2021 年,凝聚态物理领域中出现了一种新型准二维笼目晶格超导体 CsV 3 Sb 5 [2],由于其特殊的结构,可能会引发拓扑量子计算底层的研究方式上的变革。

那么这种晶体结构中,还会有哪些未知材料呢?带着这样的问题,刘淼团队将新材料结构中的化合物元素进行了元素替换。利用 Atomly 材料库,研究人员生成 1300 多种化合物,然后通过高通量计算的快速筛选,最终确认了 20 多种可能稳定的化合物[3]。

“我们将结果反馈给学术界后,经过半年领域学者们的实验验证,最终实验合成了其中的两种。”刘淼说。

图丨加速新材料发现(来源:刘淼)

该数据的底层原理是用高性能计算机,进行数据的生产和积累。这相当于把从前人类做的实验,转变为在高性能计算机上进行,用数据化、信息化、自动化的方式,以高通量计算的方式累积数据库。

在材料科学领域通用的无机晶体结构数据库(The Inorganic Crystal Structure Database,ICSD)中,通过实验累积的晶体结构不超过 6 万个;而截至目前,Atomly 数据库已有 34 万个晶体结构数据,是中国体量最大的无机材料数据库,并且相关数据每天还在不断地扩充。据悉,Atomly 数据库已为中国 4000+ 科研人员提供数据查询,每个月的浏览量在 2 万次以上。

刘淼表示:“通过我们的材料库,可以实现在材料实验中无法探测到的性质或精度,这是对人类未知的知识边界的快速探索。”

以数据为驱动的方式可以让科研的效率更高、可预测性更强。当科学的推理能力变强时,科学发现就会变得更快。因此,从根本上来看,用“AI for Science”的方式能够让人类有更强的预知和预测能力。

它为科研方式带来变革是,为确认某种材料是否能被合成,从前研究人员以做实验为主、计算为辅,进而积累非常基础的数据资源。而现在可通过材料库以计算模拟的方式为主导,通过计算筛选和发现新材料,再去进行实验来验证材料是否能够被合成,以及相关材料是否符合应用与需求的预期,省下大量时间和资源。

刘淼表示:“我们的数据库具有高度标准化的特点,通过选取一致化的计算参数,让数据之间具有很好的可比性,这是其他做数据库和同类的机构做类似数据库时所不具备的。”

随着技术的进步和 AI 与各学科的深入融合,人们意识到“AI for ”可成为一种通用的、底层的工具。“它蕴含着一个很重要的逻辑,我们在高维的参数空间里,可以把一些影响不重要的维度降低,然后通过数学变量去预测在低维的性质或解决两个量之间的某种关联。”他说。

中国科学院物理研究所刘淼,领衔打造国内最大无机材料数据库

图丨人工智能模型预测快速预测化合物键能等性质(来源:刘淼)

与算法相比,其背后的数据同样重要,甚至是更底层、更基础的资源或资产。刘淼认为,研究人员可以在数据的基础上,构建各自的某种人工智能的方式或工具。数据是一件更有门槛的事情,未来人们需要构筑数据的生态,用技术推进的方式,让数据的某种商业价值或使用某种共享数据的方式发生强烈的变化。

“当我们有了数据之后,所有现在人工智能的基础模型,包括图模型、语言模型等都具有很好的通用性。这些基础模型都可用于材料科学,为行业开发细分领域的大模型。所以,这是未来会有很大发展空间的领域。”刘淼说道。


为学术界到工业界架好桥梁

刘淼本科和硕士毕业于中国科学技术大学物理系,随后,他在美国犹他大学物理系和料科学工程系分别获得硕士和博士学位,从事材料科学计算方向的研究。

在美国劳伦斯伯克利国家实验室,刘淼进行了为期 5 年的博士后研究,通过材料数据进行材料发现。在博后期间,他作为早期开发成员之一,参与了该实验室的 Materials Project。2011 年,美国白宫发布“材料基因工程计划”,Materials Project 是支撑该计划的核心数据库。

据刘淼介绍,在博后期间通过量子力学的方式计算材料,这让他意识到通过该方式对材料的某种性质的探测能力可能比实验更准、更快,是一件非常颠覆性的事。

他于 2018 年加入中国科学院物理研究所/松山湖材料实验室,并从那时起开始筹备和建设 材料数据库。“我们如果没有生产数据的能力,而一直用别人的数据做科研,是没办法追赶和超越别人的。”他说。

中国科学院物理研究所刘淼,领衔打造国内最大无机材料数据库

图丨松山湖材料实验室坐落于东莞,是广东省靠前批省实验室之一(来源:刘淼)

怀着这样的愿景,他与团队开始了数据库建设,实际上,数据库的建立是一个从无到有的过程,研究团队在技术累积的过程中逐渐坚定了研究方向。2018 年年底,团队在松山湖材料实验室建设超级计算机。在 2019 年 5 月左右,该计算机完成采购、安装、调试,研究人员在开发软件架构、进行原型测试后,其变成了一个真正跑通高通量计算的计算机。“那时候终于觉得我们做的事情十有八九能够实现了。2021 年 3 月,我们的数据量已超越美国的同类数据库 Materials Project。”他说。

近期,刘淼与团队正在利用海量数据,做一个参数量比较大的人工智能通用模型,并在短期内为业界提供,有可能会引起底层计算方法的改变。

与此同时,该团队还在建设隐私计算平台进行数据发布,在隐私计算平台上,用户通过海量数据训练各自的模型,并保证数据是“可用不可见”的。此外,他们还在建设材料科学的机器人实验室,通过该实验室可以进行材料的自动的合成以及基础的、简单的测试,来进行材料发现的实验进行验证和优化。

做材料技术数据库虽然困难重重,但是意义重大。因为它可能通过信息化、互联网的方式,变成所有领域的底层支撑。刘淼坦言道:“这个课题非常创新,现在看起来非常小,但是再往下成长时,它有可能是一个覆盖全领域的、具有基础支撑作用的方向。在建设好基础设施后,未来我们将切入到更多应用的课题创造更多的价值,为学术界到工业界架好桥梁。”

参考资料:

1.M. , and . Chem. Rev. 2004, 104, 4271. https://doi.org/10.1021/

2.Chen, H., Yang, H., Hu, B. et al. Roton pair wave in a . 599, 222–228 (2021). https://doi.org/10.1038/

3.Y Jiang, Z Yu, Y Wang, T Lu, S Meng, K Jiang,Miao Liu, from . 39(4), 047402 (2022). https://doi.org/10.1088/0256-307X/39/4/047402


声明:本文仅供科研分享,助力科学传播,不做盈利使用,如有侵权,请联系后台删除。

#In We Trust#

小程序/APP:络绎科学

官网:https://www..com

声明:本站所有作品(图文、音视频)均由用户自行上传分享,本文由"夏沫洛kay"自行发布,本站仅供存储和学习交流。若您的权利被侵害,请联系我们删除。如若转载,请注明出处:https://www.flipbrief.com/tech/8Wg176B7.html