如果用一句话来形容本周的 AI 行业,那就是这么一句诗了:仙之人兮列如麻。
英伟达又发模型又发卡,OpenAI 深夜接连放大招,Google 也不落人下。国内更是各种开源各种卷,从百度的大模型到腾讯的“手办自由”再到豆包的“开发三件套”,AI 竞赛比甄嬛传还精彩,速来围观,一起解锁 AI 的全新可能。
本周AI大事件
英伟达推出新一代Blackwell Ultra GPU
百度推出“文心4.5+X1”
OpenAI 推出多款语音模型及史上最贵 o1-pro API
腾讯开源 5 款 3D 生成模型
国内动态:卷出新高度!
本周一开市,百度就甩出了王炸组合“文心4.5+X1”模型,不仅以 79.6 分屠榜吊打国际大模型,更直接开启价格战——API 价格砍到友商 1%。让 AI 的应用成本进入“9 块 9 包邮”时代。
隔壁腾讯也不含糊,突然开源 5 个 3D 生成模型,30 秒建模技术直接甩给了所有用户。
只需要上传多视图,就可以轻松生成 3D 模型,让建模走向平民化,个人用户也能手办自由,作为二次元的我直接狂喜,终于不用吃土等手办厂开模,自己在家就能打印老婆(小声)。
而豆包则对 AI 编程能力进行了重要升级,HTML 实时预览+Python 代码秒纠错+完整项目生成的“开发三件套”可谓王炸,现在小白也可以用 AI 直接生成简单的网页游戏了,或许 GitHub 会成最大输家。
国际前沿:硅谷大乱斗
本周的最大 AI 时间,一定是老黄的 GTC,老黄推出了新产品“Blackwell Ultra”,并预告了公司的下一代芯片“Rubin”。GB300 NVL72集成了72个Blackwell Ultra GPU和36个基于Arm Neoverse架构的NVIDIA Grace CPU,形成一个庞大的单体GPU,专为测试时的扩展推理而打造。
演示中,NVL72 集群在运行 DeepSeek-R1 671B 交互式副本时,只需 10 秒就可以给出答案,而 H100 则需要 1 分半。
在发布会快结束时,老黄还公布了全新的 Isaac GR00T N1 机器人基础模型,开源可定制,专门用来加速类人机器人(人形机器人)的开发和应用能力,必将成为未来通用机器人的重要框架。
当然,震撼的不仅是老黄,还有 OpenAI 高昂的 o1-pro API 价格,0.12 美元/千token 的售价,让开发者集体心梗,这是钞能力和生产力的终极对决了。
另外,OpenAI 还在本周推出了 3 个全新的语音模型,在语音识别、语音合成等方面取得了显著进展。想想隔壁 Siri 刚炒了负责人,Apple Intelligence 的 Siri 也跳票了,不知道能不能来一波梦幻联动。
Google 也在本周为打工人提供了“续命神器”,Canvas 让跨国会议不再社死。它允许用户轻松编辑和分享写作与编程项目,支持跨国团队多语言协同,效率提升300%,并新增音频智能摘要功能,可自动生成会议记录与课程重点。通过 Canvas,用户可以实时更新草稿,并生成代码预览。
划水开会都能生成会议纪要。
AI 有趣:AI 取代程序员!?别慌,用 AI 打 AI
相信大家都有去水印的需求,也都在开 AI 去水印的玩笑。嘿嘿,现在 AI 真的可以去水印了。
谷歌扩大了对 Gemini 2.0 Flash 模型图像生成功能的访问权限。允许模型原生生成和编辑图像内容,能力十分强大。但功能似乎缺乏必要的限制。Gemini 2.0 Flash 模型不仅会生成包含名人和受版权保护角色的图像,还会去除现有照片中的水印。
而且不只是普通的去掉水印,还会尝试填补因为水印删除而产生的空白区域,虽然别的 AI 工具也能做到,但 Gemini 2.0 Flash 是最完美且免费的一个。
一边是用 AI 工具自动打码,一边是用 AI 工具一键去水印,我有一个大胆的想法,但感觉不太好意思说。
另一边可能就没有这么有趣了,在最近的播客中,OpenAI 的首席产品官凯文・维尔表示,人工智能预计将在 2025 年底之前超越人类程序员,尤其是在编码基准测试中。
他强调了 AI 编码模型的快速进步,并提到 Anthropic 及 OpenAI 的先进模型正在推动编码的自动化。随着推理能力的提升,AI 在编程领域的表现也在不断改善,未来几乎所有代码可能由 AI 生成。
加油吧,人类程序员们。
当百度把 AI 做成白菜价,当 Google 让划水变得高大上,或许未来所属的,正是会用 AI 摸鱼的人。至少在现阶段,我们并不用担心 AI 会让你失业,但会用 AI 的同事会。