ChatGPT新增视频处理功能

图片

OpenAI的ChatGPT如今已具备处理用户提供的视频提示的能力。这一新功能已率先向付费的ChatGPT Plus和Pro订阅用户开放,预计企业和教育领域的客户将在下个月也能获得访问权限。

自2022年推出以来,这款人工智能聊天机器人一直在不断拓展其功能范围。去年,其开发者宣布,GPT-4大型语言模型在SAT考试(美国大学录取时广泛参考的标准化考试)中的表现超过了90%的人类考生。

在周四的直播活动中,OpenAI展示了其最新功能:ChatGPT现在能够基于它通过智能手机摄像头捕捉到的内容或当前屏幕上显示的内容与用户进行互动。例如,用户可以让聊天机器人帮忙为打开的应用程序中的消息撰写恰当的回复,或者提供在现实世界中执行任务的实时建议。

今年2月,研究人员推出了一款名为“Sora”的工具,该工具能够“根据用户的提示,生成包含多个角色、特定动作类型以及精确的主题和背景细节的复杂场景”。当时,该公司表示,Sora可以用新材料扩展给定的图像或视频,并在其社交媒体账号上分享了一些AI生成的视频示例。

7月,路透社报道称,OpenAI正在研究一种旨在显著提升AI模型推理能力的方法。据一位匿名消息人士透露,这些功能尚处于“研发阶段”,将使ChatGPT不仅能够生成查询的答案,还能进行“深度挖掘”并主动浏览互联网。

“草莓”(注:此处“草莓”可能是对某个特定技术或功能的误译或占位符,在原文中未明确其含义,故保留原样)预计将增强AI聊天机器人寻找对人类来说通常很直观的常识性解决方案的能力——这是迄今为止ChatGPT和类似模型的一个短板。

大约在同一时间,来自T-Bank人工智能研究实验室和莫斯科人工智能研究所(AIRI)的一组俄罗斯科学家表示,他们开发了一种新的人工智能模型,该模型能够自我适应新的任务和环境,而无需人类的额外输入。

据被称为“Headless-AD”的模型的开发人员介绍,该模型已经能够执行比最初教授的五倍多的任务。

在朋友圈分享这个故事;关注『跟着大事跑的人』,每天了解全球热点!