智谱发布基于手机、pc和浏览器的自主Agent

【环球网科技综合报道】11月29日消息,智谱发布基于手机、pc和浏览器的自主Agent。其中,AutoGLM,可以自主执行超过 50 步的长步骤操作,也可以跨 app 执行任务;AutoGLM可开启“全自动”上网新体验,支持等数十个网站的无人驾驶;GLM-PC 启动内测,基于视觉多模态模型实现通用Agent的技术探索。

图片

在 Agent OpenDay 现场,智谱CEO张鹏运用AutoGLM 给在场数百位嘉宾发送了“一个来自 AI 的微信红包”,并且手机远程指挥电脑自动发送文件。

据介绍,新升级的 AutoGLM可以挑战完成复杂任务:首先是超长任务,它可以理解超长指令,执行超长任务。其次,AutoGLM支持跨 App 来执行任务。用户将习惯于 AI 自动处理,而不是在多个 APP 间来回切换。再次,AutoGLM;能够支持长任务的自定义短语。最后,AutoGLM可以主动帮用户做出决策,随便模式下所有步骤都让AI来决策。

同时 AutoGLM 启动大规模内测,并将尽快上线成为面向 C 端用户的产品。 AutoGLM 同时宣布启动“10个亿级 APP 免费 Auto 升级”的计划,邀请 App 伙伴联合探索自己的 Auto 新场景。而支持核心场景和核心应用的 AutoGLM 标品 API,会在两周内上线到智谱maas开放平台试用。

此外,智谱还带来基于 PC 的自主Agent。GLM-PC 是 GLM 团队面向“无人驾驶”PC的一次技术探索,基于智谱的多模态模型 CogAgent。目前,已开放第一阶段的内测场景。

在张鹏看来,Agent 可以看作是大模型通用操作系统 LLM-OS 的雏形。“现阶段,AutoGLM 相当于在人与应用之间添加一个执行的调度层,很大程度上改变人机的交互形式。更重要的是,我们看到了 LLM-OS 的可能,基于大模型智能能力(从 L1 到 L4 乃至更高),未来有机会实现原生的人机交互。将人机交互范式带向新的阶段。”

智谱 COO 张帆表示,智能设备在大模型的加持下,将会焕发出新的机会。手机+AI 会变成随身个人智能助理,PC+AI 将会成为全新生产力工具,汽车+AI 将会让车成为人们的智能第三生活空间。当然,大模型不仅仅会为手机、PC 和汽车带来机会,而是会惠及各种各样的智能设备。大模型的不断进化已经为 Agent 变革人车交互体验奠定了基础。