看见·灯塔 | 钢铁是怎样“算”成的?

全文5844字,阅读约需17分钟,帮我划重点

划重点

01中国金属材料研发进入AI for Science时代,钢铁是“算”出来的,中国钢研利用AI与经典材料计算相结合进行创新研发。

02联想助力中国钢研建设数字化研发的算力中心和仿真平台,提升原创研发能力、缩短研发周期、提升研发效率。

03除此之外,联想与中国钢研共同打造了名为“材小链”的“数+算+链”一体化平台,实现数据产权确权、数据发现,进行数据共享共治。

04目前,材料研发领域中的大模型应用成为一个新的想象空间,但需要结合小模型,控制大模型的“幻觉”,并利用高质量数据进行模型微调。

以上内容由腾讯混元大模型生成,仅供参考

图片


AI for Science(科学智能)带来了新的研究范式,中国金属材料研发越发自如踩在算力巨人的肩膀上


文 | 吴俊宇
编辑 | 谢丽容

联想,外界常把它视为一家PC(个人电脑)厂商。实际上,它早已在用算力服务政企、金融、科研等行业,是诸多行业背后的“算力运营商”。
全球一批企业和科研机构的HPC(高性能计算)集群都是联想搭建的。一个重要的指标是,国际TOP500组织(发布全球已安装的超级计算机系统排名的权威机构)每年会对全球已知性能最强的HPC排名,2024年11月的TOP500,联想入围162套科学计算集群,全球市占率32.4%,连续第十三年位居全球首位。其中在今年发布的Green 500排名中,联想有3套科学计算集群入围前十。
企业和科研机构为什么需要算力?因为AI for Science(科学智能)带来了新的研究范式——今年10月,诺贝尔化学奖就被授予了德米斯·哈萨比斯(Demis Hassabis)等三位利用AI进行蛋白质设计和预测的科学家。AI强大的数据分析能力被用于学习科学原理得出数据模型,进而辅助科学家假设、验证和试错。这个计算过程会消耗大量算力,因此很多企业和科研机构都在建设HPC集群。
事实上,中国的材料研发同样在进入AI for Science时代——钢铁是“算”出来的。中国钢研科技集团(下称“中国钢研”)就在利用AI与经典材料计算相结合进行金属材料的创新研发。
在工业制造中,没有质量过硬、性能先进的材料,很多构想将难以从图纸变成现实。早年间,中国材料研发走的是“研仿”路径。“研仿”的做法是,查阅国外已有文献,按“配方”试错“炒菜”。它的问题是,强调经验积累、缺乏自主研发,研发周期长、经常掉入“研仿-落后-再研仿-再落后”的循环。
2020年开始,中国钢研在联想工程师的支持下建成了数字化研发的算力中心和仿真平台。联想中国政企业务制造行业总经理宋涛和中国钢研数字化研发首席科学家苏航在2024年11月底接受了《财经》专访。
宋涛认为,和中国钢研的合作,不是简单的供货交付关系,联想在服务于中国钢研的过程中再一次深入研究了这个行业,和中国钢研历时多年共创了材料行业的产品解决方案。
苏航则表示,近年来中国材料研发逐渐探索出了独立自主的原创路径。从“研仿”到自主创新,背后有两个重要原因:一是中国制造业在迅速崛起;另一个重要原因是数字化和AI带来了新的研发模式。
制造业崛起是中国金属材料研发变强的基础。2022年中国工业增加值4.98万亿美元,全球占比30.8%。庞大的制造规模让各工业门类的材料原创研发需求涌现——这造就了一个万亿规模的市场。头豹研究院(沙利文中国)2024年数据显示,2023年1月至9月,中国新材料产业总产值超过5万亿元,金属材料占据近20%的市场份额。材料数字化研发市场也在随之高速增长。
图片
AI为中国的金属材料研发提供了换道超车的机会。中国的算力产业并不弱,在此背景下,中国钢研逐步探索出“算力+算法+数据+场景”的材料数字化研发路径。这可以大幅提升原创研发能力、缩短研发周期、提升研发效率,让中国材料研发“换道超车”。

图片

“算”出来的钢铁

中国钢研是中国冶金行业的综合性研究开发和高新技术产业化机构。它承担了中国60%的金属新材料的研制开发任务。中国钢研研制的材料被广泛用于海洋船舶、能源石化、交通建筑、航空航天、核技术等国民经济支柱领域。
过去在金属材料研发设计中,使用独立的工作站(专用计算机)进行计算和仿真,这对工程师来说就是一种奢侈。这种研发模式的问题是,算力资源容易闲置,数据容易流失,能够处理的计算体系不够大,模型和场景难以继承,计算工程师与场景工程师难以沟通。
高端制造业有一套自己的“新摩尔定律”—— 一代材料、一代装备。它指的是,核心材料性能10%-15%的提升就可以促成装备的升级换代。一款新的材料,要走过概念设计、实验研究、工程落地等一系列过程,整个周期可能长达数年。传统的研发模式越来越难满足现代工业对材料迭代速度的要求。
苏航认为,原创性的新材料研发可以通过“HPC高性能计算+HTE高通量自主试验+AI自主建模优化”形成全新的机制(HTE指的是高通量实验,总体思路是一次性合成多种材料,以并行的方式进行快速实验研究)。这个过程大概分成三步。
第一步,材料专家根据场景需求、采用相应尺度的软件工具建立模型,预测目标材料的性能以及所需要的成分、工艺或结构参数,形成批量(10^2~10^3量级)试验方案。
第二步,通过高通量化的AI自主实验室制备并表征目标材料的性能,形成满足同源性、离散性、规模性、可信性的高质量数据集。
第三步,针对该数据集进行AI自动建模,形成批量优化的新试验方案,并重复以上过程进行迭代改进。
这个计算过程,不仅需要高性能的算力中心作支撑,还需要大量试验数据和算法应用。在过去,已有的高性能计算中心由于用户场景不明、软件版权限制等问题,大都只有算力、没有算法,更没有数据和场景。这需要用户自己准备计算软件和所需数据,苏航形容,“这就像去餐厅吃饭只有桌子和灶台,需要自带锅碗瓢盆和食材。”
理想的做法是,建立行业级或企业级高性能计算平台,聚焦算法和软件范围,以“云计算+APP+AI”来解决国产化软件的生态问题、体验问题。这可以让材料和工艺工程师随时随地处理计算任务。因此,中国钢研在联想的协助下,建设了一个具备“超算+智算”能力的算力中心,搭建了一套名为CISRI-DLab的研发平台。中国钢研的研发平台被部署在云端,还集成管理了原子尺度(nm纳米)、微观尺度(um微米)、宏观尺度(mm毫米)的20多款全球知名的计算、仿真软件,以及10余款国产或自研的材料计算、材料机器学习软件。
借助CISRI-DLab数字化研发平台,材料工程师、工艺工程师可以过手机、平板、电脑等设备,在云端随时随地进行计算,处理材料计算、工艺模拟、服役模拟等一系列问题。

图片

图片
(CISRI-DLab研发平台的金属材料研发场景,图源:中国钢研)
苏航回忆,早些年中国钢研利用计算做研发设计不到20人,一年计算量只有几百次。但如今计算平台注册人员数量超过2000人,每年计算次数高达数万次。这对传统研发模式带来了巨大的冲击。他打了个比方,过去是用“捡来的小米加步枪”做材料研发,现在则是拥有了“北斗导航+无人机群”的高效“新武器”。
在“新武器”的帮助下,中国钢研发明了全球首个“元素粉末SLM(激光选区熔化)原位合金化高通量制备”系统。它可实现一次数百种不同成分块状合金的高效制备,大幅度提升材料研发、优化迭代效率。在此基础上,中国钢研设计了新一代抗氢合金、高反射光伏材料、低膨胀稀土合金、增材永磁合金等一系列全新材料产品。

“新武器”让中国钢研科研能力大幅提升。三年来,中国钢研在石化能源、航空航天、舰船海工、增材制造、钢铁冶金、新能源汽车等高端装备用材料领域取得了重要成果。中国钢研借此争取到的研发合同额达到了十多亿元。中国钢研的数字化研发理念还在逐步对外专业输出,被钢铁、石化、有色、船舶、航空、核电行业的多个企业所采纳和借鉴。

图片

两个不同行业的联手摸索

搭建中国钢研这套算力中心和研发平台并不容易。金属材料研发是一个专业的业务场景,它需要“懂行”且“肯干”的服务商才能做好。
过去三五年,中国的行业智能化转型中,甲乙双方之间始终存在一个矛盾:懂IT技术的乙方不够了解产业,懂行业的甲方不够了解IT新技术。甲乙双方立场不同、利益不同,导致对服务边界的理解也不同。
科技公司和产业企业之间时常互相不理解——科技公司希望给产业客户都提供标准产品,少驻场、少交付、少定制,以此确保项目利润率。产业企业希望科技公司尽量满足自身个性化需求,最好有专人驻场定制化服务。但这种需求太重了,多数时候无法得到充分满足。上面这些问题一直被很多行业人士视为中国数智化转型的一道鸿沟。
但是,联想找到了一个中间路线,有节奏地为标杆客户设计解决方案。
联想的策略是这样的——把解决方案分成两部分:一部分是水平的通用型解决方案,为不同行业提供数字化底座,也提供轻量化定制化开发;一部分是垂直的行业解决方案,这需要和联想控股、联想创投和垂直行业的生态伙伴深度共创。有所为有所不为,和生态分工作战。这让联想的服务边界变得相对清晰,可以专注自己擅长的工作。
在AI基础设施领域,联想还形成了“一横五纵”战略。“一横”指万全异构智算平台,通过一套“智算中心的操作系统”帮助企业客户统一纳管不同硬件上的算力资源。“五纵”指,服务器、存储、数据网络、软件及超融合、支持及运维服务。
在这套思路下,中国钢研和联想的合作逐渐变得深入。中国钢研和联想共同在“无人区”探索出了一套可复制的行业解决方案。
苏航形容,中国钢研和联想的合作,这是“两个完全不同的行业之间的碰撞”。过去也有不少ICT(信息及通信技术,包括硬件、软件科技公司)大厂向中国钢研推销现成的产品方案。不过,这些产品往往太理想化,ICT大厂不愿意花费人力、物力深入修改完善。但中国钢研和联想最终打造的产品解决方案,是两个行业共同成长结果。
宋涛认为,中国钢研和联想的合作难点是,跨学科、跨领域的人才非常少。材料研发领域是“博士对博士的对话”。但联想和中国钢研的合作不是一个普通意义上的项目。联想将其视为标杆案例,希望借着这个机会深入一个行业,跟甲方共创产品解决方案。对联想来说这很有价值,因为联想希望在更多“新质生产力”行业打磨更具竞争力的数智化产品。
中国钢研并不只需要算力硬件,而是需要联想和它共同针对专业场景反复打磨业务产品。
这意味着服务商需要投入人力驻厂提供贴身服务。对大部分ICT企业来说,这需要付出高昂的成本,会导致项目利润率变低。因此,愿意做这些工作的企业并不多。但在苏航看来,制造行业真正的智能化转型是个蓝海,里面有太多需求找不到人来做。这个市场还在培育阶段。但大部分ICT大厂普遍只愿抢已经验证过的市场,不愿意承担风险做尝试。
联想愿意尝试这件事的一个重要原因是,联想本身就是一家制造企业。宋涛解释,制造业追求的并不是“速胜”,而是长期主义。即使如此,这个项目对联想仍有巨大挑战。联想对离散制造业、电子制造业有一定了解,但钢铁属于流程制造业,尤其是金属材料研发更是陌生领域。这种“专精尖”产业需要“扎起裤腿、深入土地”。
中国钢研和联想在合作早期同样有一段磨合期——当时联想希望向中国钢研销售一套现成的算力系统。但深入了解中国钢研的需求后,发现这不仅需要前期进行顾问咨询,还需要对4A架构(业务架构、应用架构、技术架构、数据架构)进行设计。联想从2020年至今与中国钢研保持着常态化的交流机制,双方不断打磨改进产品,最终双方共同打造了一套定制化的数字底座解决方案。
在金属材料研发过程中,算力、算法、数据三者缺一不可。联想和中国钢研打造的这套研发平台,包含云计算平台、无人数据工厂、数据共享平台三大部分。它能够解决中国钢研几个重要业务问题。
其一,形成统一的研发平台和计算平台,解决研发工具缺乏集成部署管控的问题,也可以缓解算力不足的挑战。科研人员可随时随地登录个人账户,远程启动建模设计软件,提交计算任务、获取计算数据。
其二,让科研人员的研究数据集中、沉淀、共享。在过去,原始数据大多分散在科研人员手中。联想与中国钢研旗下钢研新材团队建立了战略合作,共同打造了名为“材小链”的“数+算+链”一体化平台。它借助区块链和隐私计算技术实现了数据产权确权、数据发现,还能够进行团队内部、团队之间、企业之间的数据共享共治。这为未来工业领域数据空间的构建提供了超前的连接器(Conector)解决方案。
其三,降低科研人员使用门槛,解决材料工程师、工艺工程师、计算工程师的知识衔接难题。因为其中上线了1100多个材料设计、工艺仿真、服役模拟、机器学习的微应用案例。这还能够满足材料原创性研发所必需的计算、数据、场景迭代升级需求。
这次项目合作也为联想沉淀了更多行业经验。联想在服务中国钢研之前,就已经拥有成熟的仿真设计一体化解决方案,并已在多个行业成功应用。联想为中国钢研打造的这套解决方案,未来还有机会继续复用在战略新兴产业,如高端装备制造、新能源汽车、动力电池、芯片、光刻机等领域。比如,动力电池的正负极、电解液、隔膜等关键材料决定了新能源汽车的续航。

联想借助中国钢研这个标杆项目,逐渐发现了新机会。近两年,“算力即国力”这一说法越来越被行业广泛接受。宋涛解释,高端装备制造、新能源汽车、动力电池、芯片、光刻机等战略新兴产业未来需要优化关键材料,会大量使用算力资源,联想可以在这里找到大量市场空间。

图片

钢铁与大模型的想象

拥有算力中心、研发平台后,中国钢研做金属材料研发的“武器库”变得更丰富了,这套“武器库”也在随着技术发展不断迭代。
2023年之后,大模型成为新的AI技术潮流。它是材料研发的潜在“新武器”,它带来了新的想象空间。
目前材料研发过程中,主要是用小模型或者传统的判定式AI实现的。大模型参数更大、性能更强。它能够快速检索分析文献并构建知识图谱,还具备材料合成领域知识的生成和推理能力,甚至具备三维微观结构分析功能——简而言之,它的分析能力更强、分析速度更快。
大模型很强大,但大模型并不是万能的。尤其是近一年大模型落地过程中,很多企业出现了“拿着锤子,看什么都是钉子”的误区—— 一些ICT厂商总希望任何产业问题都靠大模型去解决。然而,制造业不是试验田,大模型在这里不是万能的。
其一,大模型始终无法克服的一个挑战是,它存在幻觉(模型生成了不符合事实或毫无根据的信息)。“幻觉”意味着,它有出现低概率但致命错误的可能。因此,在涉及生产、制造、安全的工业核心流程中,大模型的直接应用十分慎重,更多地被用于营销、客服等非核心流程之中。
其二,大模型的成本依然很高。大模型需要堆参数、堆算力。高算力的背后是高成本。制造业的利润相对较薄,采用新技术通常慎之又慎,必须精确衡量部署大模型的投入产出比。
宋涛对这个问题有清晰认知。整个2024年,他拜访了大量制造领域的企业客户。一方面他很欣喜,联想抓住了这轮机会,成了人工智能和算力产业的受益者。但另一方面他也在担忧,很多制造企业仍在困惑大模型要如何落地。这个行业想要健康理性发展,需要甲乙方合作探索出真正有价值的业务场景。
过去一年,大模型正在逐渐“祛魅”。那么,在材料研发、生产、应用等制造场景中,要如何理性使用大模型?
一个重要的思路是,“驯服”大模型,控制大模型的“幻觉”。另一方面也要结合小模型,对大模型不擅长的复杂推理和深度分析能力进行补足——数据在其中起到了关键作用。
苏航认为,高质量的数据才是大模型的灵魂。至少在材料研发中,应该建立大语言模型之上的专业大数据模型。如果能够在封闭领域建立完备可信的计算数据集、实验数据集、行业数据集,大模型在细分领域将会像打开了“上帝视角”。因为专业数据集接近完备时,大数据的幻觉会逐渐减少,而且会逐渐具备涌现能力(AI模型在达到某个临界点后,开始出现超越其原有设计能力的智能水平)。
在材料研发领域,不同领域专家间有知识壁垒。苏航说,“搞钢的看不懂铜的金相,搞铜的看不懂硅的组织。”但是,材料大模型会成为“通才”,它可以同时理解铝、铜、钢、硅等不同的材料知识。数据全、看得多、算法迭代好,材料大模型会比绝大部分材料专家知识面更宽、更广。
目前在材料研发中,大模型一个首选应用方向是,由AI代理去集成计算设计、仿真优化、加工制造、检测评估、智能交付等复杂软件或试验系统。比如,中国钢研正在探索基于自然语言自动生成代码,驱动OC软件(OpenCalphad,是一种开源的材料热力学计算软件)绘制相态图(表示相平衡系统的组成与参数关系的一种图)。
为了“驯服”大模型,联想也在与一些行业客户尝试进行数据治理及数据平台建设,共同使用高质量数据进行模型微调。宋涛认为,不能迷信大模型。制造业绝对不是为技术而技术,而是要解决生存、发展等实际问题。基础大模型在制造业落地,最终还是要经过不断剪裁,变成70亿、130亿等小参数的版本。
“要根据企业实际需求,通过大模型、小模型等不同工具技术组合,最终逐渐找到最优解。”宋涛说。

图片