智谱发布AutoGLM:AI的「Phone Use」来临,智谱AI概念股持续走强

图片
理论上,AutoGLM 可以完成人类在电子设备上可以做的任何事。
本文为IPO早知道原创
作者|Stone Jin
据IPO早知道消息,智谱技术团队日前推出了一个基于GLM技术团队研究成果的新产品——AutoGLM,这是一个智能体(Agent),能够模拟人类操作手机,执行各种任务。
某种程度上而言,AutoGLM的推出标志着人工智能在“Phone Use”领域的进步,使得AI的应用更加贴近人们的日常生活。理论上,AutoGLM 可以完成人类在电子设备上可以做的任何事,它不受限于简单的任务场景或 API 调用,也不需要用户手动搭建复杂繁琐的工作流,操作逻辑与人类类似
值得注意的是,今日开盘后,智谱AI概念股持续走强——传智教育涨停,豆神教育、电广传媒、思美传媒此前涨停,凌云光、华策影视、创业黑马、首都在线等涨超5%。
图片
具体来讲:AutoGLM 基于智谱自研的「基础智能体解耦合中间界面」和「自进化在线课程强化学习框架」。其中的核心技术WebRL,克服了大模型智能体任务规划和动作执行存在的能力拮抗、训练任务和数据稀缺、反馈信号稀少和策略分布漂移等智能体研究和应用难题,加之自适应学习策略,能够在迭代过程中不断改进、持续稳定地提高自身性能。就像一个人,在成长过程中,不断获取新技能。
AutoGLM 在 Phone Use 和 Web Browser Use 上都取得了大幅的性能提升。例如,在 AndroidLab 评测基准上,AutoGLM 显著超越了 GPT-4o 和 Claude-3.5-Sonnet 的表现。在 WebArena-Lite 评测基准中,AutoGLM 更是相对 GPT-4o 取得了约 200% 的性能提升,大大缩小了人类和大模型智能体在 GUI 操控上的成功率差距
目前,AutoGLM Web已经通过「智谱清言」插件对外发布,可以根据用户指令在网站上自动完成高级检索、总结与内容生成。
图片
此外,智谱还提出了其对AGI的思考——在智谱看来,面向 AGI 的分级,L1 语言能力,L2 逻辑与思维能力,L3 工具能力大家是比较有共识的。智谱认为 L4 级人工智能意味着 AI 可以实现自我学习、自我反思和自我改进。L5 则意味着人工智能全面超越人类,具备探究科学规律、世界起源等终极问题的能力
图片
人工智能多大程度上能够做到像人脑一样,甚至超越它?成为许多人所说的超级人工智能?从这个终极答案上看,智谱大致也将在未来相当长的一段时间处于42%这个阶段。(42 这个百分比灵感来自《银河系漫游指南》,是关于生命、宇宙以及任何事情的终极答案。)
具体到智谱而言,有些能力今天的GLM大模型已经解锁,比如文本,视觉,声音,比如一定的逻辑和使用工具的能力,有些模态的能力树还没有点亮,这些也是智谱未来会一直为之努力的方向。
图片
事实上,智谱面向 AGI 的技术升级曲线,实际上就是围绕大脑的能力维度展开的。从2021年以来,特别是最近一年多来的升级,大模型在L1 语言能力的方面完成的已经很好了(大概80%-90%)。
从语言能力再往上,事情就变得复杂。智谱希望在不远的未来实现各种模态混合训练的原生多模态模型,它不仅在认知能力上比肩人类,同时能在价值观层面和人类对齐,确保 AI 的安全可控。智谱已经在这方面做了大量工作,将在适当的时候给大家及时公布进展。
图片
AutoGLM 可以看作是智谱在 L3 工具能力方面的探索和尝试,智谱希望自己的努力能够推动人机交互范式实现新转变,为构建 GLM-OS ,即以大模型为中心的通用计算系统打好基础。智谱认为,大模型的工具能力最终应该像人类一样,感知环境、规划任务、执行动作(如使用工具/软件),最终完成特定任务。