AI周报|OpenAI计划重组公司结构;报告称字节今年AI投入接近 BAT三家总和

全文2620字,阅读约需8分钟,帮我划重点

划重点

01OpenAI计划重组公司结构,将营利性组织转变为特拉华州公益企业,以平衡股东利益、利益相关者和公共利益。

02字节跳动今年AI投入接近BAT三家总和,2024年资本开支达到800亿元,2025年有望达到1600亿元。

03小米正搭建自己的GPU万卡集群,以加速AI大模型研发,创始人雷军亲自监督大模型团队。

04由于GPT-5开发陷入困境,OpenAI正在寻求新的战略,目前没有对此进行回应。

05此外,国产开源模型DeepSeek-V3在海外社交媒体平台X刷屏,其训练成本仅为近600万美元。

以上内容由腾讯混元大模型生成,仅供参考

图片

OpenAI计划重组公司结构

当地时间12月26日,OpenAI发文称,公司计划将现有的营利性组织转变为特拉华州公益企业(PBC),PBC要求公司在决策中平衡股东利益、利益相关者和公共层面的利益。OpenAI表示,非营利部门将继续存在,成为“历史上资源最丰富的非营利组织之一”,作为新结构的一部分,非营利部门将持有重组后公益企业的股份。根据声明,若重组完成,公益企业将负责OpenAI的运营和业务,而该非营利部门将聘请领导团队和员工,在医疗保健、教育和科学等领域开展慈善性项目。OpenAI还表示,现在公司需要筹集比原本想象的更多的资金,投资者也希望支持,但在这种资本规模下他们需要传统的股权而不是结构性的资产。

点评:OpenAI在10月刚进行一轮融资,筹集了66亿美元,融资后估值达1570亿美元。由于做AI十分烧钱且需要更长时间才能盈利,OpenAI后续预计还有继续融资的需求,而原本OpenAI的架构对于公司继续融资不是特别有利。原本OpenAI非营利母公司主体下有一个限制性营利实体,设计有利润上限,非营利组织董事会有权控制和治理营利性子公司。目前OpenAI的竞争对手Anthropic也采用PBC结构。

报告称字节跳动今年 AI 投入接近 BAT 三家总和

浙商证券 12 月 25 日发布报告指出,字节跳动在 AI 上加大流量投放、扩大资本开支、大力扩张团队,研发投入显著领先同行。报告称,在资金上,字节跳动在 AI 上投入巨大,2024 年资本开支达到 800 亿元,接近百度、阿里、腾讯三家的总和(约 1000 亿元)。2025 年,字节跳动资本开支有望达到 1600 亿元,旨在打造自主可控的大规模数据中心集群,其中约 900 亿元将用于 AI 算力的采购,700 亿元用于 IDC 基建以及网络设备。

点评:此前有字节跳动内部人士称,字节跳动创始人张一鸣虽然已卸任 CEO 一职,但他一直积极参与该集团的 AI 战略。张一鸣亲自监督了从竞争对手公司招聘 AI 工程师和研究人员的工作,并在内部谈到了他的“通用人工智能”目标,即具有类似人类智能的系统。

小米正搭建 GPU 万卡集群:加速 AI 大模型研发

12月26日,有报道称,小米正在着手搭建自己的 GPU 万卡集群,将对 AI 大模型大力投入,小米大模型团队在成立时已有 6500 张 GPU 资源。知情人士称,该计划已施行数月之久,雷军在其中扮演了重要的领导角色。目前小米就此并未对外发声。

点评:小米对 AI 大模型的重视度提升此前已有信号。此前雷军发文谈论对大模型和AIGC的看法时表示,小米在AI领域已经耕耘多年,有AI实验室、小爱同学、自动驾驶等团队。“对于大模型,我们当然会全力以赴,坚决拥抱。我们正在研发一些有趣的技术和产品,等我们打磨好了,再给大家展示。”

GPT-5被曝开发陷入困境

据外媒近日报道,OpenAI内部代号为“猎户座”(Orion)的GPT-5项目的开发已持续超过18个月,目前面临严峻挑战。按原计划,该项目应在2024年年中完成,但现在进度严重滞后。更早些时候,海外科技媒体也报道称,由于 GPT-5 可能不像以前的模型那样代表着巨大的飞跃,OpenAI 正在寻求新的战略。

据报道,OpenAI 已经完成了至少两次大型训练运行,最初的训练运行比预期的要慢,这暗示着更大规模的运行既费时又费钱。虽然 GPT-5 的性能比前代产品更好,但它的进步还不足以证明维持模型运行的成本是合理的。

点评:目前OpenAI 没有对此进行回应,此前公司曾表示今年不会发布代号为 Orion 的模型。今年OpenAI明显转向了推理和多模态方向的模型,包括GPT-4o、o1和o3等,以及AI视频生成模型Sora。

国产开源模型DeepSeek-V3火到海外

12月27日,海外社交媒体平台X被来自中国的大模型DeepSeek-V3刷屏了,科技圈惊叹的点在于,这一模型能力对标头部模型,但训练的预算却非常低,“2048个GPU、2个月、近600万美元”,相比之下,GPT-4o等模型的训练成本约为1亿美元,至少在万个GPU量级的计算集群上训练。 这一模型由幻方量化旗下AI公司深度求索(DeepSeek)最新发布,具体来说,DeepSeek-V3是一个具有6710亿总参数的MoE(混合专家)模型,在14.8万亿token上进行了预训练。官方数据显示,DeepSeek-V3 多项评测成绩超越了头部开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o不分伯仲。

点评:此前DeepSeek一直被冠以“AI界拼多多”的名头,也是年中引发中国大模型价格战的源头。今年5月,DeepSeek发布的V2开源模型,将推理成本降到每百万token仅 1块钱,随后,字节、腾讯、百度、阿里等大厂纷纷降价,大模型价格战由此一触即发。

OpenAI拟自研人形机器人

12月25日,有知情人士对媒体称,OpenAI正考虑打造自己的人形机器人。过去的一年里,OpenAI多次暗示对机器人项目重燃热情。OpenAI投资了开发机器人硬件和软件的初创公司,如Figure和Physical Intelligence,并重启了四年前解散的内部机器人软件团队。最近,OpenAI还在考虑开发一种人形机器人,但关于这一潜在项目的细节仍然很少。

点评:人形机器人被认为是AI落地应用的一大场景,OpenAI此前也与人形机器人公司Figure AI合作了。不过,OpenAI是否自己做人形机器人整机这种硬件项目,仍存在不确定性。有消息称OpenAI当前的业务重点仍在于高级推理模型、AI助理,做机器人不是OpenAI的首要任务。

台积电周二盘中股价创历史新高

台股台积电12月24日股价在盘中创下历史新高,一度上涨1.4%至1095台币/股,当日收盘1080台币/股。12月27日,台股台积电收1090台币/股,年内股价已经上涨超80%。美股台积电12月27日收201.63美元/股,年内股价接近翻倍。

点评:作为先进制程领域的芯片代工霸主,台积电受益于AI需求增长。今年第三季度,台积电净利润超100亿美元,同比增长54.2%。以美元计算,台积电还预计今年销售额将增长近30%。

研究称越来越多公司有兴趣使用开源AI工具

IBM委托进行的最新研究发现,受访企业正在对人工智能进行长期投资,并越来越有兴趣使用开源工具来推动投资回报率提升和企业创新。该研究由Morning Consult公司与洛佩兹研究公司合作进行,研究对2400多名IT决策者进行了调研,结果显示,近一半(47%)的受访者已经从人工智能投资中看到了积极的投资回报。在目前使用开源人工智能工具的受访公司中,51% 的公司表示看到了积极的投资回报率,而在未使用开源工具的受访公司中,这一比例仅为 41%。

点评:开源AI和闭源AI某种程度上是竞争关系,一些大模型公司的闭源大模型以API接口的形式提供给企业客户使用并收费,企业也可以选择使用开源大模型并自行部署算力。有业内人士认为,闭源大模型的性能要比Meta的开源模型Llama更好,才会有竞争力。

(本文来自第一财经)