撰文 | 新皮层小组
编辑 | 王杰夫
OpenAI遥遥领先的无敌神话或许该破灭了。
自美国时间12月5日OpenAI首席执行官Sam Altman宣布开启连续12个工作日的新品发布计划伊始,就有业内人士判断这不过是Altman又一次挥洒他的营销天赋以掩盖OpenAI要「没活了」的事实。
结果看来确实没有什么亮点,所谓连续12天的发布,其实不过是每天定点放出一条一刻钟左右的短视频,要么是宣布某一个功能推出了强化版本,要么就是另一个功能终于开放给更多用户。当然,其中最值得一提的是年初火遍全球,被称作下一个ChatGPT的Sora终于上线了。
不过,这场距离首次亮相足足299天的正式登场着实有点拉跨,当被短暂挤爆的服务器逐步恢复后,众多实测对比视频纷至杳来,对比来看Sora不仅没能很好地实现生成视频中所谓的3D连续性、长距离关联性和物体永存性,甚至有些视频的连贯性和可控性都不如国产的可灵、即梦、海螺这些视频生成产品。
拿掉对Sora的「视频模型开拓者」的滤镜后,OpenAI如今还处在绝对领先地位的或许只有GPT-4o与o1这两款语言模型了,而在图像模型、3D模型、音乐模型等领域,其实都有各自不同的领先模型。
本周Google发布了旗舰模型Gemini的2.0版本,据称在编码和图像理解领域进步明显,并且还一并发布了包括可以操控浏览器在内的多款智能体产品——而传言OpenAI的类似智能体发布计划将放在明年初。国内这边,今年AI浪潮中最活跃的字节跳动,在近期提升了即梦产品的优先级,据称公司内部判断AI对话类产品(如ChatGPT和豆包)可能只是AI产品的「中间态」。
在2025年的AI故事里,OpenAI还会是当仁不让的主角吗?
以下内容由「新皮层」团队制作,欢迎关注。
Key Points
新模型与产品
OpenAI Sora终于上线;
Google发布Gemini 2.0系列人工智能模型;
苹果可能推出蜂窝版Mac;
苹果新版本iOS系统正式集成ChatGPT;
三星计划2025年1月发布AR眼镜,之后还将推出VR设备;
OpenAI宣布Canvas功能全面开放至所有ChatGPT用户;
科技公司动向
字节提升剪映即梦业务优先级;
小米第二款车YU7将于明年六七月上市;
Google发布突破性量子计算芯片Willow;
英伟达面临中国反垄断调查;
通用汽车计划关闭自动驾驶项目Cruise;
新模型与产品
OpenAI Sora终于上线
12月9日,OpenAI在12天系列发布会的第三场,发布了视频模型Sora Turbo和对应的产品Sora(单独的网站:sora.com)。OpenAI在今年2月发布了Sora的demo版本,Sora Turbo是升级后的高端加速版。模型部分训练数据来自美国影音素材公司Shutterstock和Pond5(已被Shutterstock收购)。
Sora支持文生视频、图生视频、视频生视频,生成视频的分辨率包括480p、720p、1080p,视频时长5秒至20秒。值得一提的是,2月时OpenAI宣称Sora生成的视频时长可达1分钟。另外,Sora提供视频编辑功能,例如精确指定任意帧的输入,针对任意帧前后延伸剧情,将两个视频场景合并成一个新的场景等。
目前,20美元/月的ChatGPT Plus会员和200美元/月的ChatGPT Pro会员可以直接使用Sora。Plus会员每月可生成50个视频(最大分辨率720p,最长5秒),Pro会员每月可生成500个视频(快速生成,最大分辨率1080p,最长20秒)。
Google发布Gemini 2.0系列人工智能模型
12月11日,Google正式发布Gemini 2.0的首个版本——Gemini 2.0 Flash。这款新模型不仅在全球范围内以聊天机器人的形式向用户开放,还面向开发者推出了具有试验性质的多模态版本,具备文本转语音和图像生成功能。
Google CEO桑达尔·皮查伊(Sundar Pichai)在声明中表示:「如果说Gemini 1.0的重点在于组织和理解信息,那么Gemini 2.0的目标就是让信息更加实用化。」相比前代模型,Gemini 2.0在大多数用户需求领域的表现均有显著提升,包括代码生成和提供事实性正确回答的能力。不过在处理更长上下文的情况下,其性能略逊于Gemini 1.5 Pro。
用户可以通过桌面端和移动网页的模型下拉菜单选择聊天优化版本的Gemini 2.0 Flash。Google表示,这一版本将在不久后通过Gemini移动应用上线。而多模态版本将通过Google AI Studio和Vertex AI开发平台提供,计划于2025年1月实现全面推广,届时还会推出更多尺寸的Gemini 2.0模型。
苹果自研5G芯片有望明年初亮相,后续可能推出蜂窝版Mac
12月7日有消息称,苹果正在探索首次为其Mac电脑和耳机引入蜂窝网络连接功能。
报道称苹果计划于2025年春季首次亮相其开发的5G通信芯片,首发将搭载于入门级手机产品iPhone SE以及低配版的iPhone和iPad上。该芯片预计于2026年推出高端版本,到2027年则会推出性能更优的第三代版本。目前苹果使用的5G芯片由高通公司供应,预计明年推出的苹果初代5G芯片的性能仍不如高通,但苹果计划到第三代时在性能上超越高通。而搭载新5G芯片的Mac电脑则可能最早在2028年面世。
早在2008年时苹果就考虑过在笔记本电脑MacBook Air上搭载蜂窝网络通信芯片,但因该芯片当时较占体积而作罢。
苹果新版本iOS系统正式集成ChatGPT
12月11日,苹果公司推出新版本系统iOS 18.2更新,新版本系统中,苹果旗下语音助理Siri正式集成OpenAI旗下ChatGPT,底层模型使用的是OpenAI旗下的GPT-4o模型。用户可以通过Siri集成的ChatGPT处理更复杂的任务,包括生成文本、创建图像和提供摘要等。
新版系统中Siri集成的ChatGPT默认不开启,用户需要在设置中启用。随后,当用户向Siri提出Siri本身无法回答的问题,或者主动要求Siri调用ChatGPT回答问题时,Siri才会提议使用集成的ChatGPT。当Siri集成的ChatGPT回答问题时,屏幕也会显示ChatGPT的图标。免费用户存在使用量的限制,付费用户可以通过登录ChatGPT账号获取更多使用量。
中国市场的iPhone用户暂时还无法在新版本iOS 18.2体验到集成ChatGPT的新版Siri。未来,苹果在中国市场可能把百度文心一言集成到Siri中,但苹果和百度的合作目前进展受阻。目前,苹果和百度工程师们正在共同改进文心大模型,使其更适合iPhone用户,但该模型在理解提示词和常见场景的响应准确性上仍然存在困难。
三星计划2025年1月发布AR眼镜,之后还将推出VR设备
近日有消息称,三星计划在明年1月的Galaxy S25活动上发布其AR眼镜。据悉这款眼镜外观与普通眼镜类似,重量约为50g。功能方面,具备支付、手势识别及面部识别能力。这款眼镜由三星和Google、高通共同开发,预计将配备高通的芯片和Google的操作系统。
同样在今天,Google也宣布推出全新操作系统Android XR,而首款搭载该系统的设备是三星Project Moohan头显,这是一款搭载了Gemini模型的VR设备,用户可以通过手势和Gemini语音命令操控。在发布会上,Google放出了用户使用这款设备观看YouTube以及在Google地图中探索城市等用例。
OpenAI宣布Canvas功能全面开放至所有ChatGPT用户
12月13日,OpenAI宣布将其Canvas画布功能开放给所有ChatGPT用户,此次更新将Canvas集成至GPT-4o,用户无需切换模型即可使用。这是其「OpenAI 12天」直播活动中的第四项发布。
Canvas最初于今年10月推出,仅面向ChatGPT Plus、Teams、Edu和Enterprise订阅用户。该功能将ChatGPT对话界面分为左右两边,左侧边栏负责与ChatGPT对话,右侧则展示实时的结果。例如你需要ChatGPT写一段小说后,右侧就会像「画布」一样展示这篇创作出来的小说,同时,你还可以选取小说的每个词、每句话,让ChatGPT为你修改表达。当然一个更适合Canvas的应用场景是编程,其内置了Python模拟器,用户可以直接在Canvas中运行代码,查看输出结果,并与ChatGPT协作调试。
科技公司动向
字节提升剪映即梦业务优先级
12月11日有消息称,字节已经提升了剪映即梦业务的产品优先级,计划后续把更多资源向更多模态的产品形态转移到该业务中。字节内部判断,AI对话类产品(如ChatGPT和豆包)可能只是AI产品的「中间态」,而非更长期更理想的产品形式。
从月活数据来看,剪映在2024年10月的全球AI产品月活榜月活达1.7亿,仅次于ChatGPT的2.5亿。而豆包虽然在过去几个月内用户规模有所增长,但目前对话轮次、时长等关键指标仍然不够理想。具体来看,用户每周仅活跃2到3天,轮次仅为5到6轮,用户的人均使用市场仅为10分钟左右。
即梦是抖音集团原CEO张楠在剪映任职后推出的AI创作工具和社区,其作为视频创作工具,在图片、视频编辑等功能上已经落地了大量AI技术,例如图片生成、视频生成和图片理解等。
小米第二款车YU7将于明年六七月上市
12月9日,小米公布了继SU7之后的第二款车YU7,这将是一款纯电SUV,定价预计与已发布的小米SU7相当,在20万至25万元区间。在SU7对标特斯拉Model 3之后,这次小米又准备与Model Y竞争。
工信部官网信息显示,该车型为纯电动多用途乘用车,外形尺寸为长5米,宽2米,高1.6米。最高车速253km/h。该车电池为三元锂离子电池,电池单体生产企业是江苏时代新能源科技有限公司,总成生产企业是中州时代新能源科技有限公司。
此外,小米第三款车型也流出了更多信息,区别于小米汽车前两款纯电动产品,将是一款增程式SUV,预计2026年上市销售。该产品目前被称为「N3」,项目代号「昆仑」,价格定位在15万元左右,将由武汉东风汽车工厂代工(小米可能收购并改造东风现有工厂)。
Google发布量子计算芯片Willow,错误率显著降低
2024年12月9日,Google量子计算实验室宣布推出全新量子计算芯片「Willow」。据Google介绍,Willow能够在不到5分钟内完成一项传统超级计算机需要耗时10泽年(1泽年等于10²¹年)的任务,这一时间远超宇宙的年龄。
与2019年Google首次展示量子芯片时相比,Willow的性能实现了飞跃,同时在降低量子计算错误率上也取得了显著进展。量子计算采用量子位(qubit)代替传统的二进制位,能够同时存在于多个状态,但容易受环境干扰产生错误。Google通过引入更多量子位并实时纠正错误,成功降低误差,其研究成果已经发表在《Nature》杂志上。
英伟达面临中国反垄断调查
12月9日,国家市场监督管理总局发布消息称,因英伟达公司涉嫌违反《中华人民共和国反垄断法》及《市场监管总局关于附加限制性条件批准英伟达公司收购迈络思科技有限公司股权案反垄断审查决定的公告》(市场监管总局公告〔2020〕第16号),市场监管总局依法对英伟达公司开展立案调查。
据称,本次调查主要针对的是英伟达对于以色列芯片厂商迈络思(Mellanox)的收购事项。2019年3月,英伟达宣布完成了迈络思的收购,成交价为69亿美元。该交易是英伟达历史以来最大的一笔收购,也是美国半导体公司截至目前最大一笔的收购案。在随后的一年里,这笔交易先后经过了美国、欧盟、墨西哥等地监管机构的批准,并在2020年得到了中国国家市场监督管理总局的批准。
报道称,英伟达没有在收购完成后履行批准的附加条件,是本次立案调查的主要原因。批准要求,英伟达在向中国市场销售GPU加速器与迈络思高速网络互联设备时,不得强制搭售、不得限制或阻碍购买,也不得在产品上歧视单独购买上述产品的客户。
此外,12月5日,英伟达CEO黄仁勋访问越南,并在越南总理范明政的共同见证下,英伟达同越南政府签署协议,将在该国建设AI研发中心和AI数据中心。黄仁勋表示,英伟达已经在越南投资了超过2.5亿美元。
通用汽车计划关闭自动驾驶项目Cruise
12月10日,通用汽车宣布,计划暂停向自动驾驶子公司Cruise提供资金,同时合并Cruise团队和通用旗下技术团队,优先开发驾驶员辅助系统。通用汽车预计,重组Cruise业务计划预计2025年上半年完成。通用汽车预计,重组Cruise业务可以帮助公司每年减少支出超过10亿美元。目前,通用汽车拥有子公司Cruise大约90%的股份,计划通过收购其他股东股份,把持股比例提升至97%以上。
这意味着,通用汽车彻底搁置了对于自动驾驶车队项目的长期投资。2021年,通用汽车提出新的营收目标规划,预计通用汽车投资的Cruise自动驾驶叫车服务能够在2030年实现500亿美元的营收,同时实现业务盈利。但Cruise的业务发展不如预期,盈利遥遥无期。自通用汽车2016年收购Cruise以来,Cruise项目每年都造成巨额亏损,2023年亏损就达到了34.8亿美元。今年以来,通用汽车继续注资的同时,也通过大幅裁员、暂停扩张等方式削减Cruise业务的成本。