聚焦大湾区:MatChat中国首秀无机材料领域大模型创新发布-紫荆网

聚焦大湾区:MatChat中国首秀无机材料领域大模型创新发布

日期:2025-02-20 来源:紫荆 浏览量: 字号:
分享到
用微信扫描二维码

紫荆杂志(记者彭彦)2月20日东莞报道:在2月15日这个宁静的周六,当大多数人还沉浸在周末的闲暇之中,东莞松山湖材料实验室的一隅,却正悄然上演着科技与创新的交响曲。

MatChat问世:实现高效而精准的体验

在这间灯火通明的办公室里,松山湖材料实验室与中国科学院物理研究所的杰出研究员、博士生导师刘淼,正全神贯注地探索着无机材料的奥秘。他的指尖轻触键盘,点开MatChat这一革命性的智能平台,输入一个困扰学界已久的无机材料问题。随着鼠标的轻轻一点,屏幕上瞬间绽放出一系列精准无误、逻辑严密的化学反应方程式,它们不仅准确无误,更具备“无幻觉”的特质——即所有推导均可追溯至其原始学术论文,确保信息的权威性与可靠性。

图说:MatChat AI首页

“落地东莞松山湖以来,经过7年的研发,2023年下半年开始,我们全力投入这一无机材料AI助手的研发,今年2月9日上线首周,即吸引超5000名用户注册,26万次专业提问。”刘淼在接受记者采访时表示,这一大模型的成功上线和松山湖材料实验室体制机制创新,以及东莞和松山湖大力支持密不可分。它不仅是一个工具,更是一个潜力无限的科研助手,预示着在人工智能与材料科学深度融合的新时代,科研范式即将迎来一场前所未有的颠覆性变革。

MatChat的出现,不仅极大地提高无机材料研究的效率与准确性,更是为科研人员开辟一条通往未知领域的全新路径。在这个信息爆炸的时代,它如同一座灯塔,照亮科研工作者在浩瀚知识海洋中航行的方向,让探索未知的过程变得更加高效而精准。

28万篇论文:打破AI幻觉

“2018年我刚来到松山湖材料实验室从事科研工作时,就喜欢上东莞的气候环境。”2月15日,在松山湖材料实验室的办公室里,刘淼告诉记者。

2018年松山湖实验室成立之初,便前瞻性地意识到数据和人工智能的重要性,成立材料计算与数据库平台。2023年初,ChatGPT3.5火起来后,刘淼敏锐地发现这一大模型解析文字的强大功能。

2023年6月,国外科学家利用一种叫做“自然语言处理(NLP,natural language processing)”的人工智能技术,从400万篇论文提取了3万条材料合成方案数据;与此同时,美国的meta公司发布一款开源大语言模型。刘淼团队看到机会,将二者结合,研发专注于无机材料合成路径预测的初代AI工具—MatChat。“当时团队在这类模型基础上进行再训练后发现,模型可以帮科研人员配好化学反应方程式,大大提升工作效率。”

这些初步的尝试展现出大语言模型在材料领域的创新潜力和应用空间,为材料研究和创新带来新的启发和思路。初代MatChat论文,发表在《中国物理B》,是目前最受欢迎的论文之一。

初代MatChat模型并不完美。科研工作对于准确性的要求极高,但是大语言模型普遍存在的“幻觉”问题,给出的答案存在“臆想”。在业界,幻觉是指大型语言模型(LLM)在缺乏事实依据时,自发生成看似合理实则错误的内容。这种现象如同人类做梦时的无意识创造,被形象地称为“幻觉”。

另外一个问题是如何增加信息量,让模型掌握更多“知识”。“‘投喂’给大模型的数据越多、越准确,模型会变得越‘聪明’,这是人工智能的规模化法则(scaling law)。”刘淼表示。

随着技术的发展,两个问题都有解决方案。利用“检索增强生成(RAG)”技术,可以避免“幻觉”问题。为解决“数据问题”,刘淼团队把目光投向预印本(Preprint)。

预印本是指科研工作者的研究成果在尚未经过正式出版物发表之前,出于与同行交流的目的,自愿先在学术会议上或通过互联网发布的科研论文、科技报告等文章。相当于为研究成果打上“时间戳”,确立科研发现的优先权。

“预印本论文通常具有高质量、高准确性,以及创新性的特点。”刘淼表示,“同时,它们也都是开源论文,规避文献数据的版权争议。”扫清障碍后,MatChat模型开始再次进化。2024年底,MatChat完成所有准备工作,并在2025年2月9日正式上线。

新版MatChat AI基于大语言模型(LLM)与检索增强生成(RAG),提取超过28万篇材料科学、物理、化学论文中的知识,形成无机材料领域的庞大知识库。

“作为一款专注于材料科学领域的智能问答引擎,上线以来,MatChat AI总用户数已经超过5000人,42%的用户超过10次对话,获得广泛关注和应用。”刘淼表示。

创新科研范式:引领行业变革

2025年春节,DeepSeek大模型问世,瞬间爆火全球。

与DeepSeek等其他通用大模型不同的是,MatChat AI是一款完全侧重于无机材料领域的垂类模型。

用户可以通过对话形式,获取知识库中的材料科学内容。例如:“热电应用中有哪些不错的材料体系?”“高温超导体有哪些材料体系?”“Bloch波方法中,是否可以通过电子束衍射强度求解结构因子?”MatChat AI均可给出可靠的答案。

“挺好的,在我查的电子衍射方面的东西,内容不比通用模型差,而且更简洁,文献基本都准确。通用模型的文献有一半左右是假的。”中国科学院研究员姚湲此前评价道,“我问一些专业问题,竟然还给出公式推导,很强。”

中国科学院赣江创新研究院研究员王路告诉记者,作为材料科学领域的智能“智囊团”,它助力研究人员快速获取高质量学术信息,让科研更精准、高效,推动自然科学迈入智能新时代,“作为学术研究工作者,我更倾向于用MatChat,答案都是基于科技论文的结果,而不是乱说的。”

MatChat:科研新范式起点

DeepSeek同样为MatChat的进化带来帮助。在刘淼看来,DeepSeek-R1上线之后,其强大的语言理解能力和逻辑思维能力同样被团队采用,推动MatChat AI进化升级。“同时,MatChat大模型还运用ChatGPT和通义千问等优秀大模型的功能,取其优势,自成一体。”

成功推出MatChat大模型的背后,是一支勇于打破学科壁垒的“非主流”团队。

在这个10人的小团队里,材料学家与IT极客并肩作战,物联网专家为机器人车间注入灵魂,这种“混血基因”催生出独特的创新生态,同步孵化出机器人车间、Atomly大模型等协同平台,初步形成“迸发灵感-利用平台找材料-实验验证-得出数据”的全链条研发生态,打破传统科研工作的范式。

“可以说,这个大模型是跨界碰撞出的火花。”刘淼揭秘团队建设哲学,这种柔性人才机制,恰是松山湖实验室创新平台与创新主体实力的一个缩影——跨界才能破界,重构才能催生新的物种。

“这一大模型的成功上线和松山湖材料实验室体制机制创新,以及东莞和松山湖大力支持密不可分。正是有这一宽松的科研环境,才让MatChat顺利问世。”刘淼坦言,MatChat不是终点,是科研新范式发展的起点。

与此同时,中国科学院院士、松山湖材料实验室主任汪卫华向记者表示,“我深信人工智能还将为科学插上翅膀,让科学飞得更快。我们团队一直在这个领域探索,MatChat还只是一个前奏,未来还将会有一系列激动人心的进展。”

未来,MatChat将拓展多语言交互与跨材料预测能力,而它的真正价值,则为当前高水平科技自立自强提供了可复制的范式:通过机制破壁释放人才活力,依托垂直深耕在人工智能时代先行一步。

在AI重构科研范式的浪潮中,这场始于松山湖的“材料革命”,正悄然推动行业向人工智能时代跃迁。刘淼希望,这一大模型能够给无机材料的从业者带来帮助,助力行业发展,同时能够在AI时代,给科学界AI赋能发展提供一个有益的借鉴和参考,共同助力我国科技高水平自立自强。

未来,随着MatChat的不断完善与推广,我们有理由相信,它将引领无机材料乃至更广泛科研领域进入一个全新的智能时代,开启一个科研创新的新纪元。

来源:紫荆

扫描二维码分享到手机

编辑:刘可熠 校对:叶青 监制:苏艺
五一假期开启返程模式 全国铁路、公路进入返程高峰
投资界春晚来袭!2025巴菲特股东大会五大焦点全梳理
陈茂波:致力打造新海滨 推动无处不旅游
外籍游客、外语导游、外国博主……多视角讲述“China travel”独特记忆
紫荆杂志
影响有影响力的人