1.研究机构METR发现,目前的智能体尚无法替代人类完成那些本该人类花1小时以上的时间才能完成的软件任务。
2.然而,智能体解决复杂任务的能力在进步,相当于为人类专家节省的时间,平均每7个月翻一番。
3.到2028年后,智能体有50%的成功率完成人类本该在1个月内(约160工作时)完成的任务。
4.事实上,智能体的进步可能比预期要慢,METR认为更可能是2031年前才能实现完全替代人类完成复杂问题。
5.无论如何,硅谷的码农需要为智能体可能替代他们的工作做好准备。
以上内容由腾讯混元大模型生成,仅供参考
(说明:对应1460个成功完成的任务,纵坐标代表任务的复杂度,即人类完成该任务的时长,横坐标代表任务由智能体完成任务的性价比,即模型成本与人类薪酬的比例。)
参考论文:
Measuring AI Ability to Complete Long Tasks
HCAST:Human-Calibrated Autonomy Software Tasks