谷歌多模态智能代理Project Astra升级,即将进行眼镜原型测试

谷歌近日宣布,其内部代号为“Astra”的多模态智能代理计划已升级至 Gemini 2.0 版本,并即将通过眼镜原型设备进行新一轮测试。这一消息引起了美国科技媒体的广泛关注,包括 The Verge、TechCrunch 等在内的多家媒体对此进行了报道。

图片

Project Astra 最初在今年 5 月的谷歌 I/O 开发者大会上亮相,展示了响应式人工智能在可穿戴眼镜设备上的应用前景。用户可以通过语音与 Astra 互动,Astra 不仅能回答问题,还能从视觉感知环境中提取信息,并进行上下文理解。

据最新消息,Gemini 2.0 版本的 Astra 在多语言和混合语言处理方面取得了显著进步,能够更准确地识别用户口音、掌握不常用词汇,并在对话中灵活切换。此外,Astra 的长程记忆能力也得到了提升,可将用户的上下文对话记忆延长至 10 分钟左右,从而在多轮交互中展现出更连贯的理解与应答。

图片

在功能层面,Gemini 2.0 使 Astra 得以与谷歌核心服务更紧密集成。现在,Astra 可以直接调用 Google 搜索、Lens 以及地图等工具,为用户提供从生活常识查询到视觉识别、路线规划等多元化服务。同时,谷歌在处理延迟问题上的改进也颇为引人关注。全新的流媒体功能与本机音频理解优化,使得 Astra 的响应速度更接近人与人之间的自然对话延迟,这将大幅提升用户的实时互动体验。

图片

综合美国科技媒体的分析,Project Astra 的多模态能力使其在可穿戴领域具有巨大潜力。通过眼镜原型设备进行测试,谷歌将能够收集宝贵的实测数据与用户反馈,为下一代 AR/MR 平台的探索提供有力支持。然而,谷歌方面尚未透露 Astra 的商业化时间表或发行计划。目前,这一项目仍处于概念验证与技术打磨阶段,短期内不太可能向一般消费者推出最终成品。