1.2024年,人工智能在日常生活中的应用越来越普及,AI电脑、手机、软件等广泛渗透。
2.模型厂商开始关注小模型,更注重AI算法的调优,以提高性价比和效率。
3.与此同时,大模型变得更“勤快”,能跳出对话框,帮人类做实际任务。
4.人工智能的未来发展方向是“有灵且美”的类生命体,需增强感知能力、交互能力。
5.然而,如何让人工智能的“能”追上“智”的发育,仍需开拓新的路径。
以上内容由腾讯混元大模型生成,仅供参考
“AI革命”的进度条,走到哪儿了?
半月谈记者 张漫子
ChatGPT刚诞生的2022年底,就算我们把AI当回事,AI却没我们什么事——大厂之间的角力、大国之间的博弈,离大众还很远。但时间来到2024年,日常生活已被AI占据:AI电脑、AI手机、AI软件、AI游戏、AI陪伴,我们真真实实触摸到了AI之躯,它的应用比它的名字还要普及。
一个更为强烈的感受是,AI变了。它的“智”和“能”不断进化、迭代,不断引我们到未曾想象的新世界。回望人工智能风起云涌的一年,“AI革命”的进度条,走到哪儿了?
瘦身
大模型,“瘦身”了。今年的大模型“武林”依然精彩,只是简单粗暴的追参数、比大小已成明日黄花。“小了,但要强”,成为国产大模型厂商的追求。
有研究者测算,如果大模型保持现在的发展势头,到2028年左右,现有的数据储量就将全部用完。还有3年,就要撞上南墙了吗?大模型向何处去?也许,我们需要新的参照系。
面壁智能首席科学家、清华大学副教授刘知远拿出一把新标尺:能力密度。“大模型并不是参数越大越好。同样的模型能力可以放入一个更小的参数规模,这表明模型的能力密度不断增强。达到同等性能模型所需参数数量越小,意味着模型性价比越高,效率越高,能力越强。”刘知远说。
新的认知,发散出新的思路:炼大模型,不如炼优模型。不是大模型不给力,而是小模型更具性价比。这一年,越来越多的模型厂商将目光聚焦在小模型身上,更注重AI算法的调优。一边降参数、一边提性能,以最小的资源释放最大的能量,大模型、小模型不再因训练数据量的差异而出现性能代差。
AI处理的重心也不再依赖云端智能算力,开始向端侧转移。这催生了设备单元大模型的新需求。借助一系列优化措施,单元大模型在特定任务上的表现,甚至优于预训练大模型。它可以广泛适配不同类型终端,并通过合理连接,激发群体智能。
“我们在手机和PC端体验到的端侧AI,大部分是通过适配器、分类器挑选的微调小模型,以及经过自定义开发的智能体,操作中无需调用全部模型参数,无疑更具性价比、更具效率。”面壁智能联合创始人、CEO李大海说。
破壁
第二个强烈感受,大模型变“勤快”了。除了越来越瘦、越来越轻盈之外,它越来越实干,不再是那个只说不干的“口嗨派”。
2024年11月底,智谱AI开放日上最新亮相的AI智能体已经化“chat”为“act”,身体力行替人类点外卖。更惊喜的是,这款国产AI智能体已初步实现跨App、多步骤解决真实任务。
安装AutoGLM、点击“绿色手机”图标,对着智能体说出“帮我查询一顿火锅需要的食材,然后下单送到家里”的指令,AI就会自动打开小红书App页面、搜索火锅食谱,找到需要的食材,然后关闭小红书App,打开美团App进入超市频道,勾选食材下单——在无需人工干预的条件下,一口气完成54个步骤。
尽管目前刚刚满月的它并不比人类的操作要敏捷多少,但这至少意味着AI终于能跳出“对话框”,帮人类做点什么了。“今年,AI实现从技术驱动到需求驱动的转变。从业者深入思考如何让大模型进入真实的物理世界,真正行动起来。”智谱CEO张鹏说。
规模效应时代的AI,值得关注的就3件事:算力、算法、数据。而今,在“致用”大方向上寻找价值的AI亟须打通3件事:感知、思维、行为。
物理空间与认知空间的交互,激发了人类的想象力与创造力,是抽象思维的起点,对于进化中的AI而言,也就分外重要。
当然,现在的AI“感知”到的可能仅仅是事物不完整的、甚至碎片化的特征,如何在这样的基础上让AI“灵光乍现”,有所领悟,甚至产生思维的萌芽?正如2024世界人工智能大会上诸多专家所言,“AI智能体才是未来的真正挑战”。由“知”到“行”,跨越非易。
“智能体改变的是人与机器的互动方式,基于理解需求、规划与决策、执行行动和自我反思,它将带来符合直觉的人机交互——从人适应机器,到让机器适应人。”张鹏说。
生长
进入“青春期”的大模型,还在蓬勃“发育”之中。它将长成什么样子?我们不妨回到人工智能的本质:模仿人类智能,完成复杂任务。这意味着它不仅仅是一名吸收人类已有知识库的学生、一个可以与人交谈的智能设备,更不是被动回答人类问题的反馈机器。人工智能的未来,应该是“有灵且美”的类生命体。AI的感知能力、交互能力,必将不断丰富和拓展。
拓展,要从哪几方面展开?
一是行动。过去24个月,大模型主要增强的是人工智能“智”的维度,也就是作为一位参谋,读懂问题、搜索答案、形成回复。对于人工智能“能”的维度,也就是在拆解目标、做出决策、执行任务的层面,它的增益并不显著,远没有赶上“智”的进化。
二是自主。也就是变被动响应为主动思考,根据感知到的具体情境做出灵活的有针对性的决定和行动,主动规划、主动推理、主动在现实世界采取行动。
三是预测。收到“把水杯放在桌上”的指令后,为什么人类能把装着水的水杯正面朝上,平放在桌面而不是有起伏的书堆之上,是因为人类能够预测当水杯放在“斜坡”上会失去平衡而滑落到地上。机器“拟”人,就需要掌握预测能力。这就要求AI不仅可以理解物理世界的规律,还能对这些规律产生记忆,在合适的时候调出这些记忆。
可以预见,当主动行动、快速预测的AI智能体“炼”成后,我们的手机、电脑、软件、机器人,就可以自己“跑”了。而如何能让人工智能的“能”追上“智”的发育,如何能获得行动、自主、预测这三种能力,尚无现成方案可依,不仅需要新的范式,也需要开拓新的路径。