奥特曼向马斯克服软:AGI更重要/曝英伟达将在中国推出阉割版H20芯片/扎克伯格点赞DeepSeek|Hunt Good周报

欢迎收看最新一期的 Hunt Good 周报!
在本期内容你会看到:
7 条新鲜资讯
3 个有用工具
1 个有趣案例
4 个鲜明观点
Hunt for News|先进头条
🤯 奥特曼向马斯克服软,称 AGI 更重要
在长期不和之后,OpenAI CEO Sam Altman(山姆·奥特曼)近日向马斯克伸出橄榄枝,呼吁双方搁置争议,共同推进 AGI 发展。
事件始于马斯克引用了奥特曼近十年前发布的一些批评现任美国总统唐纳德·特朗普的言论。
5 月 10 日,马斯克转发了 Y Combinator 联合创始人 Paul Graham 的一则推文,内容为「很少有人比山姆·奥特曼做得更多来击败特朗普」,奥特曼当时回复道:「谢谢你,保罗」。
作为回应,奥特曼随后发布了马斯克 2022 年曾说过的一句话:「我不讨厌这个人(特朗普),但现在是特朗普挂上帽子并驶向日落的时候了。」
图片
图片
并且,奥特曼承认:「我们俩都错了,或者至少我肯定是错的,但那是 2016 年,这是 2022 年的事情。」
值得注意的是,奥特曼在同一条推文中表示:「总之,下周见,让我们成为朋友吧。通用人工智能(AGI)太重要了,不能让小小的恩怨成为阻碍。
🔗 https://x.com/sama/status/1921046473384341512
👀 英伟达计划推出降级版 H20 芯片
据路透社引述三位知情人士消息,英伟达计划在两个月内向中国市场推出 H20 AI 芯片的降级版本,预计 7 月发布。这是英伟达为应对美国最新出口限制、维持中国市场份额的策略。
原版 H20 曾是获准在华销售的最强大 AI 芯片,但上个月被美国要求申请出口许可证,实际阻断了市场准入。
图片
新版芯片将大幅降低性能规格,包括显著减少内存容量,但下游客户可能通过模块配置调整性能。报道指出,中国市场对英伟达至关重要,去年贡献 170 亿美元收入,占总销售额 13%。
在美国宣布新限制后,英伟达 CEO 黄仁勋迅速访华,强调中国市场重要性。截至发稿前,英伟达拒绝置评。
🔗 https://www.reuters.com/world/china/nvidia-modifies-h20-chip-china-overcome-us-export-controls-sources-say-2025-05-09/
🔨 OpenAI 宣布调整公司结构,史上最大收购敲定
Sam Altman 在公开信中强调,公司坚持「确保 AGI 造福全人类」的使命不变,将继续推动 AI 民主化,并计划开源强大模型。
此外,OpenAI 将放弃原有的「利润上限结构」,改为常规股权架构。
值得一提的是,OpenAI 还宣布一项关键人事任命:Fidji Simo 将出任 OpenAI 应用业务的 CEO,并直接向现任 CEO Sam Altman 汇报。
图片
外媒 The Information 指出,Simo 在电商与广告业务的丰富经验,将被视为推动 OpenAI 商业化的关键补充。
与结构调整同步进行的是,OpenAI 据报道已同意以约 30 亿美元收购 AI 编程工具 Windsurf,该笔交易也将是 OpenAI 迄今为止最大的一笔收购。
在此之前,OpenAI 曾试图与 Windsurf 竞争对手 Cursor 的母公司 Anysphere 洽谈合作但未成功,而后者近期获得了 Thrive Capital 领投的 9 亿美元融资,同时吸引了 a16z 等著名风险投资机构加入。
🔗 https://openai.com/index/evolving-our-structure/
🐧 DeepSeek 致谢腾讯技术团队
图片
日前,腾讯技术团队针对 DeepSeek 开源的 DeepEP 通信框架进行深度优化,使其在多种网络环境下均实现显著性能提升。
经测试,优化后的通信框架性能在 RoCE 网络环境提升 100%,IB 网络环境提升 30%,为企业开展 AI 大模型训练提供更高效的解决方案。
该技术方案获得了 DeepSeek 公开致谢,称这是一次「huge speedup」代码贡献。
🔗 https://mp.weixin.qq.com/s/2MmSrPOCWLwPHo8kJLbUyg
💰 OpenAI 计划重组后削减微软的收入分成
据 The Information 消息,为安抚投资者和监管机构,OpenAI 正加速推进于上年 12 月提出的公司重组方案,但方案须获得其最大股东兼合作伙伴——微软的同意。
据悉,OpenAI 方案计划中,其中一项为大幅下调微软所获的收入分成。
根据 OpenAI 向投资者披露的财务测算,目前与微软签订的「2030 年前共享 20% 收入」协议,将在 10 年后减半,最终或仅剩 10% 左右。
对此,OpenAI 拟说服微软放弃未来利润分成权,改由传统股票形式持有,届时微软将在 OpenAI 重组计划的「公共利益公司」中持有股权,而非直接获取利润。但据知情人士透露,微软目前尚未允许 OpenAI 对上述内容进行变动。
图片
去年 12 月底,OpenAI 宣布重组公司结构,计划将从营利性公司转变为特拉华州公共利益公司。报道中提到,OpenAI 原计划将营利业务独立,但因多州慈善监管机构反对,已于 5 月 5 日暂时搁置。
据了解,OpenAI 与微软从 2019 年开始建立合作关系。微软先后对 OpenAI 投资超 130 亿美元并获取后者的技术授权和技术服务,而 OpenAI 也每年以数十亿美元的价格租用微软的 Azure 服务器。
目前,OpenAI 现有投资将获得传统股票,并且不再受制于「未来利润分成」的条款。但报道指出,现有投资者之一的软银似乎对此条件较为满意,并且在 5 月 5 日重申了其承诺向 OpenAI 投资的 300 亿美元。
尽管投资金额更多,但微软目前仍掌握实质的否决权,因此 OpenAI 是否能对当前公司结构做出改变,依然需要微软的同意。
另外,OpenAI 与微软的拉锯不只有上述的收入分成问题,双方知识产权使用期限、未来新产品是否纳入分成等关键问题仍在持续磋商。
🔗 https://www.theinformation.com/articles/openai-plans-slash-revenue-share-microsoft-restructuring?rc=qmzset
🏃🏻 世界人形机器人运动会将于 8 月北京举行
据央视新闻和新京报消息,首届世界人形机器人运动会将于今年 8 月 15 日至 17 日,在北京国家体育场(鸟巢)和国家速滑馆(冰丝带)举办。
本次世界人形机器人运动会由北京市人民政府、中央广播电视总台、世界机器人合作组织、亚太机器人世界杯国际理事会联合主办,中央广播电视总台北京总站参与联合承办。
据悉,这是全球首个以人形机器人为参赛主体的综合性运动会,通过体育竞赛形式展示人形机器人标志性应用成果,推动产业加速发展。本届人形机器人运动会比赛项目总体设计为主体赛事+外围赛事:

主体赛事包括竞技赛(参考人类传统体育项目)、表演赛(单机舞蹈、群体舞蹈)和场景赛,共 19 个项目,展示机器人应用技术的多样性、创新性与实用性。

外围赛事共 3 个项目,包括非人形机器人参与的羽毛球、篮球和乒乓球,侧重表演及与观众互动。
图片
对于参加本次人形机器人运动会的机器人,则需满足以下条件:

参赛机器人是参赛队自研或采购的机器人。

机器人是一个独立整体,不得分离为多个子单元,或是用软缆连接的子单元,不得在比赛场地内设置标记物。

机器人应具有躯干、上肢、双足。其中,场景赛比赛项目机器人的下肢可采用轮式或双足式。

机器人控制方式可以选择手动遥控(含半自动,需无线遥控,且操作人员只能在指定区域操作)或完全自主控制(计时阶段不允许任何人工介入)。
上个月,全球首届人形机器人半程马拉松在京开跑。其中北京人形机器人创新中心研发的「天工 Ultra」凭借 2 时 40 分 42 秒的成绩获得冠军。
🔗 https://mp.weixin.qq.com/s/aA4pz8-3aC0lUL6ny8naBA
🍎 苹果多款芯片遭曝光
据彭博社消息,苹果目前正在开发多款芯片,涵盖智能眼镜、新款 Mac 和 AI 服务器,具体来看:
智能眼镜芯片:
苹果正在为其智能眼镜研发专用芯片,目前取得一定进展。据悉,该款产品与 Meta 的 Ray-Ban Meta 智能眼镜类似,并直接成为竞争对手。
智能眼镜芯片将基于 Apple Watch 的 S 系列芯片打造,为了功耗表现优秀,苹果还将部分芯片单元进行移除。另外,该芯片将支持智能眼镜实现多摄像头调用。报道透露,该芯片由台积电代工,预计 2026 年底或 2027 年实现大规模量产,因此推测苹果的智能眼镜也将要在近两年内推出。
报道还指出,苹果 CEO 库克目前决心要在智能眼镜市场击败目前的巨头 Meta,而带摄像头的智能眼镜也被苹果视为下一个 AI 入口。为了分担眼镜产品线的风险,苹果还计划在 Apple Watch 中添加摄像头,并且专门为带摄像头版本的 Apple Watch 开发名为「Nevis」的芯片,而带摄像头的 AirPods 则拥有名为「Glennie」的配件。
图片
M 系列芯片:
苹果 Mac 芯片—M 系列处理器也有了新的进展,目前 M6(Komodo)和 M7(Borneo)两款处理器或已在开发。还有另一款更先进的 Mac 芯片也在同步开发中,名为「Sotra」。
另外,苹果计划在今年年底之前将 M5 处理器带到 iPad Pro 和 MacBook Pro 上。
AI 服务器芯片:
报道提到,这是苹果首次专门为 AI 服务器设计处理器,此类处理器将用作 Apple Intelligence(苹果智能)的云端计算。据悉,苹果目前使用的是 M 系列的高端型号处理器进行上述云端运算。
苹果首款 AI 服务器芯片代号为「Baltra」,计划于 2027 年完成。同时,该芯片还将拥有多个版本,性能或将是目前苹果最强芯片 M3 Ultra 的两倍、四倍,甚至是八倍。
🔗 https://www.bloomberg.com/news/articles/2025-05-08/apple-is-developing-specialized-chips-for-glasses-new-macs-and-ai-servers?srnd=phx-technology
Hunt for Tools|先进工具
👏 OpenAI 为 ChatGPT 深度研究工具添加 GitHub 连接器
OpenAI 于 5 月 8 日宣布为 ChatGPT「深度研究」功能推出首个外部连接器,使 ChatGPT 能够分析 GitHub 上的代码库。
据介绍,这一新功能将允许开发者针对代码库和工程文档提出问题,获取相关分析和解答。
OpenAI 业务产品负责人 Nate Gonzalez 在 LinkedIn 上表示:「我经常听到用户反馈,他们发现 ChatGPT 的深度研究功能非常有价值,希望它能连接到他们的内部资源,而不仅仅是网络。这就是我们今天推出首个连接器的原因。
图片
除了回答关于代码库的问题外,新连接器还能将产品规格分解为技术任务和依赖项、总结代码结构和模式,并帮助用户理解如何使用真实代码示例实现新的 API。
同日,OpenAI 还为开发者推出了模型强化微调(Reinforcement Fine-Tuning),允许开发者根据特定应用微调其 o4-mini 推理模型,该技术使用特定任务评分来提高模型性能。GPT-4.1 nano 模型的微调功能也已推出。
🔗 https://techcrunch.com/2025/05/08/chatgpts-deep-research-tool-gets-a-github-connector-to-answer-questions-about-code/
👍 Mistral Medium 3 正式发布
Mistral AI 本周推出了最新语言模型 Mistral Medium 3。
该模型在维持高性能的同时,将成本降至同类产品八分之一,并简化了企业部署流程。
它在性能测试中达到 Claude Sonnet 3.7 的 90% 表现水平,价格却更优惠,每百万 token 输入成本仅 0.4 美元,输出成本 2 美元。
图片
与市场上其他模型相比,Mistral Medium 3 超越了 Llama 4 Maverick 等开源模型和 Cohere Command 等企业模型,在价格上也击败了 DeepSeek v3。
据悉,该模型可部署在任何云平台或四个以上 GPU 的自托管环境中,适应各种企业部署需求,在编码和 STEM 领域表现尤其出色,提供了持续预训练、完全微调和知识库整合等企业级解决方案。
目前该 API 已在 Mistral 平台和 Amazon Sagemaker 可用,即将登陆其他主流云服务。此外,Mistral AI 还暗示将在未来几周内推出一款更大型的开源模型。
🔗 https://mistral.ai/news/mistral-medium-3
🧑‍💻 Google 发布 Gemini 2.5 Pro(I/O 预览版)
本周,Google 发布了旗下 Gemini 2.5 Pro 模型的 I/O 预览版。
据官方介绍,该版本专为即将到来的 Google I/O 大会准备,重点提升了编码能力,专注于前端开发、UI 构建、代码转换/编辑、函数调用等方面。
图片
具体来看:

前端与 UI 开发能力升级:Gemini 2.5 Pro 在网页基准测试 WebDev Arena 排行榜上排名第一,超越 Anthropic 的 Claude 3.7 Sonnet;支持设计样式自动匹配,保持风格一致;

视频理解能力提升,在 VideoMME 基准测试中得分 84.8%;支持通过视频内容(如 YouTube 视频)生成交互式应用;

应用构建落地速度加快:通过简单的提示,即可快速生成具有美观 UI 和动效的可用 App。

价格方面,Gemini 2.5 Pro I/O 预览版与此前 3 月发布的版本价格一致。
使用方面,用户现在即可通过 Google AI Studio 中的 Gemini API 选择上述版本的 Gemini 2.5 Pro 进行使用,系统默认将接口接入最新版本,用户无需额外迁移。
🔗 https://developers.googleblog.com/en/gemini-2-5-pro-io-improved-coding-performance/
Hunt for Fun | 先玩
😄 乐高也有大模型了?
卡内基梅隆大学朱俊彦助理教授团队最近开发了 LegoGPT。
LegoGPT 是全球首个能根据文本提示词生成物理稳定乐高结构的 AI 系统。该模型不仅能设计出符合描述的乐高作品(如日式书柜、赛博朋克沙发和吉他),还确保这些设计在现实世界中可稳定搭建。
LegoGPT 通过精确计算每块积木位置,确保无碰撞且适合搭建空间,再用数学模型验证物理稳定性。
图片
若发现不稳定,系统会重新调整设计,将稳定比例从 24% 提升至 98.8%。研究团队使用机器人手臂和人工测试验证了这些设计的可行性。
该项目基于团队构建的 StableText2Lego 数据集(包含 47000 多个乐高结构)和经微调的 LLaMA-3.2-1BInstruct 模型。除基本结构外,系统还能添加纹理和颜色。虽然目前仅支持 21 个类别和常用积木。
目前,该团队已公开发布全部代码和数据。
🔗 https://arxiv.org/pdf/2505.05469
Hunt for Insight|先知
🕶️ 扎克伯格:AR 眼镜会是未来的手机,VR 则是未来的电视
Meta 创始人兼 CEO 马克·扎克伯格近日接受 Stratechery 记者本·汤普森专访,详细阐述了公司以开源大语言模型 Llama 为核心的 AI 战略,以及未来在多个业务领域的布局规划。
在访谈中,扎克伯格预测,社交媒体将进入 AI 生成内容大爆发的第三阶段——在朋友分享和创作者内容基础上,AI 将根据用户喜好生成大量个性化内容。第三个方向是将消息类应用打造成商业平台。第四个方向则是开发专门由 AI 驱动的新业务,如 Meta AI 独立应用和元宇宙内容生成服务。
谈及开源战略,扎克伯格批评了苹果公司对开发者的限制:「苹果公司直接表态不允许在一个已有的平台上再构建一个具有独立平台功能的生态系统,这种限制性政策导致了我们两家公司之间的深层矛盾。」
图片
扎克伯格还特别点赞了 DeepSeek 的发展:「现在这个领域已经不光是 Llama 一家独大,像 DeepSeek 这些 AI 模型也做得风生水起。」他预测到 2025 年,开发者主要都会使用开源模型。
在谈到 AI 与人际关系的结合时,扎克伯格表示,AI 未来将在朋友关系维护中发挥重要作用,如帮助用户记忆社交细节和规划活动。
扎克伯格认为 AR 眼镜会是未来的手机,VR 则是未来的电视,两者将共同发展。扎克伯格透露,Meta 正在开发的先进 AR 眼镜 Orion 计划在未来几年内推出,这将是 AI 助手与用户全天候互动的理想载体。
🔗 https://stratechery.com/2025/an-interview-with-meta-ceo-mark-zuckerberg-about-ai-and-the-evolution-of-social-media/
🚗 理想 CEO:开源自家 OS 是为了感谢 DeepSeek
本周,理想 CEO 李想现身最新一期《理想 AI Talk》,并透露了部分自己对于 AI 领域的想法。
主持人谈及「从 DeepSeek 身上学到什么」时,李想回答:「第一步一定要先搞研究」。李想进一步分析,研究跑通了以后研发效率会变得非常的高。
对于 DeepSeek 创始人梁文锋,李想则认为自己从前者身上学到了自律,并且能够坚守自己相信的东西、最佳实践。李想还透露,因为理想的 AI 团队拥抱 DeepSeek 速度很快,同时 DeepSeek 的开源加快了理想自研模型的步伐,DeepSeek 的出现给理想带来了巨大的收益和帮助。
图片
对于 DeepSeek 的帮助,李想也公布了理想自研汽车操作系统「星环 OS」的开源想法:通过 DeepSeek 的帮助,理想的团队也想为社会做出贡献,并且感谢 DeepSeek。
🔗 https://mp.weixin.qq.com/s/6oeabjZQDXC\_9EismmhWqQ?scene=1
📱 Figma CEO:软件创作将因 AI 迎来爆发
在旧金山举行的 Config 设计大会上,Figma CEO Dylan Field 宣布了公司历史上最重大的产品扩张计划,并在会后接受了 The Verge 记者 Alex Heath 的专访,详细阐述了 Figma 如何重新定位 AI 战略以及公司的未来发展方向。
四款新产品包括:类似 ChatGPT 的原型设计工具、网站构建和托管平台、AI 品牌广告工具以及一款与 Adobe Illustrator 竞争的矢量设计软件。
Field 表示 Figma 现在采用了全新的模型驱动方法。
「我们使用了Claude Sonnet 3.7模型。显然它是模块化的,未来我们可以使用其他模型。在模型开发方面,唯一不变的就是变化,你无法必然预测这些模型会输出什么。」
图片
当被问及这种「即插即用」的模型方法是否将责任从 Figma 转移到了模型提供商时,Field 回应道:
「我们尽可能做好归因工作。例如,如果你使用来自社区的设计,我们能够检测到它来自社区,我们会在代码中放置归因链接。但同时,我们无法判断模型何时可能『记住』了某些内容。」
对于 AI 模型提供商是否会蚕食 Figma 的业务,Field 显得信心十足:「回顾 Figma 过去十年,令我不断惊叹的是,我们确实处于软件创造的指数增长曲线上。因为 AI,我们将看到比以往任何时候都更多的软件被创造出来。
「我坚信设计和工艺是让产品和品牌脱颖而出的关键因素。你能通过代码或黑客方式创造出赚钱的产品吗?当然可以。但这会是一个持久的产品吗?如果有任何程度的竞争,你需要真正出色的设计、观点、用户体验和品牌。考虑到大语言模型不具备的所有人类背景,我不认为模型能完全替代人类。」
关于 AI 是否会取代当今的数字广告,Field 持谨慎态度:「我认为 AI 在生成营销资产方面有一席之地。在 Buzz 中,你可以生成图像和文本。但我还没有看到模型能生成品牌团队真正引以为豪的内容。也许这一天会到来,但似乎比你预期的要远。」
🔗 https://www.theverge.com/command-line-newsletter/664444/figma-ceo-ai-config-interview
🤯 Jim Fan:物理 API 将直接操作现实世界的物质
英伟达机器人部门主管 Jim Fan 在红杉资本 AI Ascent 大会上提出了「物理图灵测试」概念,指人类无法区分是人还是机器人完成的家务整理工作。Fan 指出,当前机器人技术仍存在明显差距,如机器狗遇香蕉皮会摔倒,机器人做早餐显得笨拙。
机器人领域面临的最大挑战是数据匮乏。
Fan 形象地比喻,大语言模型研究人员抱怨数据耗尽,而机器人研究者「连化石燃料都没有」。目前英伟达通过 VR 遥操作收集数据,但这一过程被形容为「拿人力当燃料」,难以扩展。
图片
为突破瓶颈,Fan 介绍了两代模拟解决方案:模拟 1.0 采用数字孪生方法,以超过实时 10000 倍的速度进行多样化环境模拟;模拟 2.0 则利用生成式AI创建模拟场景,通过 RoboCasa 框架生成家居环境和机器人操作视频。
Fan提出「具身Scaling Law」理论,认为神经世界模型中的物理智能将随计算规模指数增长。基于这些技术,英伟达已训练出 GR00T N1 模型,能在实际机器人上实现倒香槟等任务。
类似于大语言模型 API 处理数字信息,Fan 认为物理 API 将直接操作现实世界的物质。「过去 5000 年,尽管人类文明有了巨大进步,但处理物质世界的方式基本没变。未来的物理 API 将彻底改变这一点。
🔗 https://www.youtube.com/watch?v=\_2NijXqBESI
彩蛋时间
图片
图片

作者:@Artedeingenio
工具:Midjourney v7
Prompt:science fiction storyboard frame, hand-drawn in pencil and marker, cinematic composition, annotations in the margins, old-school animation prep --ar 7:3 --raw --p --v 7
链接:https://x.com/Artedeingenio/status/1920759331814834565
图片