📝 北京新增23款生成式人工智能服务备案
🌟 字节开源首个多语言代码修复基准
👏🏻 商汤发布“日日新V6”多模态融合大模型
🎯 ChatGPT记忆功能全新升级:可参考所有聊天记录,提供个性化回复
🎬 Pika推出精准视频编辑功能“PikaTwists”
🚀 OpenAI下周或发布多款新模型
🛠️ 谷歌推出AI编程工具Firebase Studio,一站式构建全栈应用
💡 xAI推出Grok 3 API:百万词元输入3美元,输出15美元
国内资讯
4月10日,据“网信北京”微信公众号消息,截至2025年4月10日,该市已成功备案了23款新增的生成式人工智能服务。目前,北京市累计备案的生成式人工智能服务数量已达到128款。
4月10日,字节跳动豆包大模型团队宣布开源首个多语言类SWE数据集:Multi-SWE-bench,可用于评估和提升大模型“自动修Bug”能力。
据介绍,这一数据集在现有的SWE-bench基础上进行了重大扩展,首次覆盖了除Python之外的7种主流编程语言,包括Java、TypeScript、JavaScript、Go、Rust、C和C++。
同时,该数据集包含1632个真实修复任务,并经过统一的测试标准和专业开发者的审核筛选,确保每个样本具备清晰的问题描述、正确的修复补丁以及可复现的运行测试环境。
论文链接:
https://arxiv.org/abs/2504.02605
代码链接:
https://github.com/multi-swe-bench/multi-swe-bench
数据链接:
https://huggingface.co/datasets/ByteDance-Seed/Multi-SWE-bench
3. 傅利叶发布首款开源人形机器人Fourier N1:高1.3米、重38公斤、续航2小时
4月11日,通用机器人公司傅利叶正式发布首款开源人形机器人Fourier N1,并同步开放涵盖物料清单、设计图纸、装配指南、基础操作软件在内的完整本体资源包。
官方表示,作为傅利叶“Nexus开源生态矩阵”的首个落地项目,N1将为全球机器人和具身智能开发者提供一个开放创新的技术基座,加速前沿研究开发工作的验证落地。
据悉,N1首批开源材料覆盖从硬件到基础控制系统的核心构建要素。BOM清单、整机STEP、整机图纸(SolidWorks)、装机SOP可通过以下途径下载。
百度网盘:
https://pan.baidu.com/s/1tMbhTLfY-tFFIe2poseqLA?pwd=cedk
GitHub:
https://fourier-grx-n1.github.io/
4. 商汤发布“日日新V6”多模态融合大模型
4月10日,商汤科技正式推出全新升级的“日日新SenseNova V6”多模态融合大模型。官方称,该模型具备最长64K思维链、数理分析、多模态深度推理和全局记忆等能力,支持10分钟视频的深度解析,其多模态推理能力国内第一,对标OpenAI的o1。同时,该模型的多模态训练效率和推理成本均达到业内最低。
据悉,日日新(SenseNova)是商汤科技宣布推出的大模型体系,包括自然语言处理模型“商量”(SenseChat)、文生图模型“秒画”和数字人视频生成平台“如影”(SenseAvatar)等。
产品地址:
https://chat.sensetime.com/wb/chat
海外资讯
4月11日,OpenAI宣布为ChatGPT Plus和Pro用户推出全新的记忆功能升级。此次更新后,ChatGPT能够参考与用户的所有历史对话,从而提供更加精准和个性化的回复。
据介绍,用户可以在设置中随时选择是否引用过去的聊天记录,甚至可以完全关闭记忆功能,以确保隐私安全。这一改进将使ChatGPT在写作、获取建议、学习等方面更加贴合用户的个人需求。
OpenAI推理领域大佬Noam Brown表示,这不只是一个产品新功能,更标志了LLM交互范式的一种转变:从偶发性互动到持续性互动,类似于AI从“问答客服”向“朋友同事”转变。
此外,OpenAI还在今天凌晨开源了一个新的浏览能力测试基准:BrowseComp,主要用于评估AI Agent在浏览互联网、寻找难以定位的信息方面的能力,共有1266个问题。
官方博客:
https://openai.com/index/browsecomp/
4月11日,PikaLabs推出了PikaTwists功能,这一功能允许用户通过简单的文本提示精准操控视频中的特定角色或物体,同时保持画面其他部分不变。例如,用户可以让视频中的猫咪站起来喝咖啡,或让汽车悬浮在空中。
目前,该功能已上线,可通过Pika.art官网及iOS应用免费体验。
4月10日消息,OpenAI计划于下周推出多款AI模型,包括GPT-4.1系列和o3系列。GPT-4.1作为GPT-4o的升级版,将进一步强化多模态推理能力,支持更高效的语音交互和图像处理等功能。
同时,OpenAI还计划推出更轻量级的GPT-4.1mini和nano版本,以满足不同应用场景的需求。
除了GPT-4.1系列,OpenAI还在开发满血版o3推理模型和o4mini模型。AI工程师TiborBlaho近日在ChatGPT网页版代码中发现了o3、o4mini和o4minihigh的引用,表明这些模型的发布已进入最后阶段。(来源:TheVerge)
8. 谷歌推出AI编程工具Firebase Studio,一站式构建全栈应用
谷歌近日正式发布了一款基于云端且由人工智能驱动的集成开发环境(IDE):Firebase Studio。该工具允许用户通过输入简单的提示词,利用AI技术快速生成完整的应用程序,涵盖从后端到前端、移动应用的全栈开发。
据悉,FirebaseStudio支持多种编程语言和框架,包括React、Next.js、Angular、Vue.js、Flutter、Android、Node.js、Java和PythonFlask等。
此外,Firebase Studio还具备AI辅助代码生成、自然语言原型设计等功能,用户无需深入编程,即可在浏览器中完成应用的构建、修改和部署。
产品地址:https://firebase.studio/
9. xAI推出Grok3 API:百万词元输入3美元,输出15美元
4月10日,马斯克旗下人工智能公司xAI正式推出Grok3系列AI模型的API接口,以及精简版模型Grok3 Mini。Grok3 API支持多种应用场景,具备强大的推理能力和多模态处理功能,可处理文本、图像等多种数据类型。
此次发布的Grok3 API定价策略引人注目:标准版Grok3每百万词元输入定价3美元,输出15美元;加速版输入5美元,输出25美元。
而Grok3 Mini则更为亲民,输入0.3美元,输出0.5美元,加速版输入0.6美元,输出4美元。
值得注意的是,Grok3 API目前支持的最大上下文窗口(指AI模型单次所能处理的数据上限)为131,072词元(约9.75万字词),与xAI今年2月所宣称的百万词元处理能力存在显著差距。(来源:IT之家)
(整理:石濑)