任泓宇(左)本科毕业于北大,后在斯坦福获得博士学位,负责o3-mini的训练
12月20日,OpenAI发布o3、o3-mini模型, 重新获得大模型能力测评领先:
数学竞赛评测:在AIME 2024数据集上, o3取得了96.7%的准确率,提高了13.4%;
博士级科学问答:在基准GPQA Diamond上,o3准确率为87.7%,相较于o1提升9.7%。
编码能力:在 SWE-bench Verified 基准上,o3 的准确率约为 71.7%,比 o1 模型高出 20% 以上。
2024年12月,大模型应用爆发:OpenAI与谷歌的创新竞赛
OpenAI的12天发布会
自12月5日起,OpenAI开启了连续12个工作日的直播活动,陆续推出新产品和功能。已发布功能包括:
完整的o1模型 强化微调技术 视频生成工具Sora 交互式界面Canvas 高级语音视觉功能 在iPhone或Mac上的Siri中集成ChatGPT的多种方式 Projects In ChatGPT ChatGPT 的搜索功能向所有免费用户开放 o3模型发布
尽管业内对发布会的创新性有所质疑,但OpenAI的这一系列动作无疑为AI行业的发展方向提供了指引, o3也再次证明:Scaling Law未死, 多少算力多少智能还将继续。
谷歌Gemini 2.0 Flash:速度与能力的双重提升
12月12日,谷歌发布了新一代大模型Gemini 2.0 Flash,该模型在速度和能力上都有显著提升,更关键是Gemini 2.0定位是面向智能体时代的AI模型。
支持原生图像生成和音频输出的多模态输出,并集成搜索、地图等功能。
推出新的多模态实时API,支持实时音频、视频流输入等工具。
多个AIAgent发布:Project Astra、Project Mariner和Jules。
谷歌算是王者归来,也重新回到了产品、模型、智能体、系统这所有领域的一线领先者位置。随着两大科技巨头的激烈竞争,我们有理由期待,大模型应用已到来。
千亿美元以上算力投入的互联网巨头们
前几日,金融时代文章《相对于竞争对手, 微软购买了两倍英伟达GPU芯片》报道了互联网巨头们在AI领域疯狂竞争. 根据科技咨询公司Omdia的估计, 包括字节跳动在内的互联网巨头, 在算力&数据中心投入最多的前五名总规模就达千亿美元. 据报道摩根士丹利的分析师估算,亚马逊、谷歌、Meta和微软这四大科技巨头在2024年的资本支出将达到约3000亿美元,其中大部分资金流向了AI领域。
由下图可知,2024年虽然微软以300多亿美元的投入领先,但与亚马逊和谷歌的差距并不大. 国内大厂还是字节和腾讯上榜. 微软大约购买了 48.5 万张,字节跳动 23万张, 腾讯 23万张(国内大厂受美国监管限制, 购买的为低性能版H20). 亚马逊虽然只买了英伟达19.6万张GPU,但其有自家Trainium和 Inferentia芯片130万张,算力&数据中心支出260亿美元. 谷歌买了英伟达16.9万张,但同样有自家TPU芯片150万张.
光看营收, AI泡沫
ChatGPT发布至今大模型对资产增值影响
2022年11月30日OpenAI发布ChatGPT, OpenAI的估值从22年300亿美元左右到24年10月1500亿美元, 翻了五倍. 而同期英伟达从3400亿美元增长到32900亿美元. 谷歌的资产增值为10000亿美元左右. 虽然英伟达、谷歌的资产增值不能完全归于大模型创新带来的影响,但应该也占了大部分. 以下是当前全球单一资产排名.
数据来源:companiesmarketcap.com
如分析前十单一资产过去2年的增值, 苹果、英伟达、微软、亚马逊、谷歌、Meta很大一部分都是来自于OpenAI发布ChatGPT带来的影响. 虽然从2022年11月底到2024年10月黄金资产增值大约为70000亿美元. 但ChatGPT带来的资产增值影响是大于美元衰退影响的. 从资本增值角度, 大模型算力&数据投入回报太高了, 难怪互联网巨头们疯狂投入.
从范式革命角度, 不是泡沫
OpenAI声称,在某些条件下, o3模型可以接近实现通用人工智能AGI(Artificial General Intelligence). AGI泛指能完成人类所能完成的任何任务的人工智能。金融市场重要作用之一资源配置, 因为被金融市场奖励, 互联网巨头们将千亿美元投入到算力&数据中心, 对人类来说通用人工智能不是最应该做的事吗?
机器学习三大顶会之一ICML2024,录取2600篇论文,600关于大模型,10篇Best Paper 大部分都是关于大模型。另一个顶会NeurIPS2024论文4500多篇, 4篇获奖论文中,有3篇为华人一作,也是大模型为主。遥想当初2022年OpenAI的论文都被拒。短短两年时间, 大量研究资源被投入到大模型的研究中.
托马斯·库恩的著作《科学革命的结构》描述为接受一个新的范式的科学家会以以前不一样的方式看世界, 大量的科学家将会投入到新的方式中.历史上科学范式革命, 往往是老一代科学家去世, 新的科学范式才被科学界接受. 现在大模型带来的范式革命被极大加速了。
范式:是指一些得到公认的科学成就,它们在一段时间内为某个研究者共同体提供了典型的问题和解答。
一系列有待解决的种种问题。
一批坚定的拥护者。
一套体系化的方法论。