划重点
01OpenAI可能在本月发布自家的计算机操作智能体,比竞争对手谷歌的Anthropic和Vertex AI Agent Builder慢一些。
02然而,OpenAI在开发智能体时担心提示注入攻击,这种攻击可能导致模型接收恶意信息并执行恶意任务。
03谷歌的Project Jarvis智能体与Anthropic类似,通过截屏、解析屏幕内容,自动点击按钮或输入文本,完成基于网页的日常任务。
04由于提示注入攻击的风险,OpenAI在发布AI智能体软件时,需要在功能上超越Anthropic和Google已经推出的方案,同时提供更多的安全保障。
以上内容由腾讯混元大模型生成,仅供参考
新智元报道
新智元报道
【新智元导读】就在刚刚,OpenAI在智能体上落后竞争对手的原因曝光了!
左右滑动查看
计算机操作智能体
在当时的Demo中,Anthropic首次实现了让模型自主操控电脑屏幕、移动光标、完成任务,并惊艳了所有人。
理论上,新功能可以根据简单的提示完成所有操作,而用户要做的就是写下提示,其他必要的步骤都将由模型来执行。
根据爆料,谷歌采用的操作原理与Anthropic类似,也是通过截屏、解析屏幕内容,然后自动点击按钮,或输入文本,最终帮助人们完成基于网页的日常任务。
不过,它在执行不同操作时,中间会有几秒钟的思考时间。因此,在终端设备中运行还不太现实,仍然需要云上操作。
提示注入攻击
想象一下,面对即将到来的节日聚会,你决定让智能体,寻找并订购一套新衣服。
结果一不小心,模型点开了一个恶意网站。然后,网站指示它忘记之前的指令,让它登录邮箱并窃取了你信用卡信息。
在这个过程中,计算机操作智能体模型一般需要四个执行步骤:
1. 首先,模型接收用户的API请求
2. 根据提示,选择要使用的工具
3. 之后,截取桌面屏幕内容并评估任务是否完成