智谱发布AutoGLM：AI的「Phone Use」来临，智谱AI概念股持续走强

IPO早知道

2024-10-28 12:13发布于上海财经领域创作者

理论上，AutoGLM 可以完成人类在电子设备上可以做的任何事。

本文为IPO早知道原创

作者｜Stone Jin

据IPO早知道消息，智谱技术团队日前推出了一个基于GLM技术团队研究成果的新产品——AutoGLM，这是一个智能体（Agent），能够模拟人类操作手机，执行各种任务。

某种程度上而言，AutoGLM的推出标志着人工智能在“Phone Use”领域的进步，使得AI的应用更加贴近人们的日常生活。理论上，AutoGLM 可以完成人类在电子设备上可以做的任何事，它不受限于简单的任务场景或 API 调用，也不需要用户手动搭建复杂繁琐的工作流，操作逻辑与人类类似。

值得注意的是，今日开盘后，智谱AI概念股持续走强——传智教育涨停，豆神教育、电广传媒、思美传媒此前涨停，凌云光、华策影视、创业黑马、首都在线等涨超5%。

具体来讲：AutoGLM 基于智谱自研的「基础智能体解耦合中间界面」和「自进化在线课程强化学习框架」。其中的核心技术WebRL，克服了大模型智能体任务规划和动作执行存在的能力拮抗、训练任务和数据稀缺、反馈信号稀少和策略分布漂移等智能体研究和应用难题，加之自适应学习策略，能够在迭代过程中不断改进、持续稳定地提高自身性能。就像一个人，在成长过程中，不断获取新技能。

AutoGLM 在 Phone Use 和 Web Browser Use 上都取得了大幅的性能提升。例如，在 AndroidLab 评测基准上，AutoGLM 显著超越了 GPT-4o 和 Claude-3.5-Sonnet 的表现。在 WebArena-Lite 评测基准中，AutoGLM 更是相对 GPT-4o 取得了约 200% 的性能提升，大大缩小了人类和大模型智能体在 GUI 操控上的成功率差距。

目前，AutoGLM Web已经通过「智谱清言」插件对外发布，可以根据用户指令在网站上自动完成高级检索、总结与内容生成。

此外，智谱还提出了其对AGI的思考——在智谱看来，面向 AGI 的分级，L1 语言能力，L2 逻辑与思维能力，L3 工具能力大家是比较有共识的。智谱认为 L4 级人工智能意味着 AI 可以实现自我学习、自我反思和自我改进。L5 则意味着人工智能全面超越人类，具备探究科学规律、世界起源等终极问题的能力。

人工智能多大程度上能够做到像人脑一样，甚至超越它？成为许多人所说的超级人工智能？从这个终极答案上看，智谱大致也将在未来相当长的一段时间处于42%这个阶段。（42 这个百分比灵感来自《银河系漫游指南》，是关于生命、宇宙以及任何事情的终极答案。）

具体到智谱而言，有些能力今天的GLM大模型已经解锁，比如文本，视觉，声音，比如一定的逻辑和使用工具的能力，有些模态的能力树还没有点亮，这些也是智谱未来会一直为之努力的方向。

事实上，智谱面向 AGI 的技术升级曲线，实际上就是围绕大脑的能力维度展开的。从2021年以来，特别是最近一年多来的升级，大模型在L1 语言能力的方面完成的已经很好了（大概80%-90%）。

从语言能力再往上，事情就变得复杂。智谱希望在不远的未来实现各种模态混合训练的原生多模态模型，它不仅在认知能力上比肩人类，同时能在价值观层面和人类对齐，确保 AI 的安全可控。智谱已经在这方面做了大量工作，将在适当的时候给大家及时公布进展。

AutoGLM 可以看作是智谱在 L3 工具能力方面的探索和尝试，智谱希望自己的努力能够推动人机交互范式实现新转变，为构建 GLM-OS ，即以大模型为中心的通用计算系统打好基础。智谱认为，大模型的工具能力最终应该像人类一样，感知环境、规划任务、执行动作（如使用工具/软件），最终完成特定任务。

查看原图 32K