ChatGPT诞生两年,“通专融合”大模型未来怎么走?

全文1040字,阅读约需3分钟,帮我划重点

划重点

01上海人工智能实验室青年科学家陈恺表示,通用大模型和专用模型在各自领域具有优势,但通用模型在多任务处理上面临挑战。

02该实验室发布了强推理模型书生InternThinker和多模态大模型书生万象2.5,具备代码、数学等多场景泛化能力。

03除此之外,实验室与商飞C919团队合作进行飞机设计,利用AI生成的翼型供专家选择,提高设计效率。

04欧阳万里透露,实验室还在化学领域与科学家合作,开发能读谱的模型,已达到专家水平。

05上海人工智能实验室主任周伯文表示,实验室将支持优秀的研究者与团队,推动技术快速落地,产生实际的经济和社会效益。

以上内容由腾讯混元大模型生成,仅供参考

图片

“如果让GPT-4去下围棋,目前肯定下不过人类选手。还有像AlphaFold,它只会解析蛋白质结构。但是这样一些专用模型,在对应的领域里面能够发挥很大的作用。”

12月13-14举行的2024浦江AI学术年会期间,上海人工智能实验室青年科学家陈恺谈到通用大模型和专用模型的差异时对第一财经表示,AlphaGo虽然只会下围棋模型,但是它能在下围棋任务里达到人类的顶尖水平,或者超越人类的水平,这对于通用模型来说却是非常困难的。

图片

就在上个月,上海人工智能实验室按照通专融合AGI路径,在第一阶段构建并发布了强推理模型书生InternThinker,自主构造大规模高智力密度数据生成,具备代码、数学等多场景泛化能力。最近发布的书生万象2.5在多模态cot上取得突破,成为首个MMMU突破70%的开源多模态大模型。

上海人工智能实验室领军科学家欧阳万里教授介绍,“通专融合”是实验室正在做的,两种大模型是融合的,就像大学的知识慢慢会融通到高中教学中去。

而上海人工智能实验室也正和产业界合作,开发了全球首个翼型AI生成式系统“书生·翼飞”。“我们和商飞C919团队合作进行飞机设计,设计出来一个翼型是不难的,但是要让这个翼型达到工业需求并且比工业需求高,让升力提高,减小阻力,就要用到很多空气动力学知识。原来一个设计师设计一个翼型时间是以周来计,但是当AI学习了专家数据库,一分钟就能生成好几十个翼型供专家选择。”欧阳万里说。

除了航空航天,他还透露正在化学领域和科学家合作。“读谱是帮助化学家了解到底发生了什么化学反应的重要手段,我们最近和这些专家合作,开发了第一个能读谱的模型,现在已经达到专家水平,数秒钟可以得到专业结果。”

在欧阳万里看来,“通专融合”是建立在过去一段时间大模型研发基础上的思考和总结,是更适合未来大模型的发展路径。

陈恺也称,通用模型是希望一个模型能够完成所有的任务,与之相对的是一些专用模型,比如说像过去也非常火的AlphaGo。目前他们实验室采用的路线是通专融合,希望在保持一定的泛化能力的情况下,能够去提升模型的一个专业领域的水平,比如说达到人的专家水平,这样能够达到一个通专融合的引爆点,或者说它的一个能力点,其实就能够去为很多的一些实际的场景来服务。

上海人工智能实验室主任、首席科学家周伯文教授在13日举行的浦江AI学术年会开幕式上表示,人工智能的进步不仅依赖于个体的努力,更需要集体力量的汇聚。上海人工智能实验室也会发挥好连接器、放大器、加速器的作用。“所谓加速器,实验室将支持优秀的研究者与团队,快速实现技术的产业价值和发展潜力;通过加速技术成果的验证和应用,推动技术在产业中的快速落地,助力技术产生实际的经济和社会效益。”

(本文来自第一财经)