OpenAI要算力,“AI教母”站台,客户十倍下单……AMD苏姿丰CES的这场演讲,直接封神!

问AI · AMD开放生态为何吸引客户十倍扩单?

图片

作为全球科技产业年度晴雨表CES(国际消费电子展的重磅开幕演讲历来是洞察技术趋势预判产业走向的核心窗口如今在AI浪潮席卷全球重构产业底层逻辑的当下CES核心舞台之上昔日家电车企等已悄然让位于算力厂商

今年闪耀CES的是在AI领域风头正劲的AMD和苏姿丰凭借其覆盖云边缘的全栈AI能力全域布局与开放生态AMD在AI领域构建起独特竞争优势

这场开幕演讲如同一场宏大叙事AMD在宣布多款重磅新品的同时也将其广阔的生态图景展现在世人面前携手合作伙伴释放出其在AI时代的壮志雄心苏姿丰以及邀请登台的众多嘉宾对于AI发展的分享和洞见也极具启发意义

“AI无界惠及人人”(AI Everywherefor Everyone)。随着AI进一步走进人们的生活深度赋能千行百业算力作为基础设施的重要基石做用也愈发凸显

AI你之所见不过冰山一角

当前AI的创新发展速度屡屡超出业界预期苏姿丰开篇便指出了AI创新的迅猛之势但她更强调的是“如今人们对于AI的所见不过冰山一角真正的变革与突破仍在前方”

用户增长数据印证了AI的快速普及:ChatGPT仅用数年便实现了从100万到10亿活跃用户的增长互联网实现这一目标却经历数十年苏姿丰预测未来五年AI活跃用户规模将超过50亿届时AI将像如今的手机和互联网一样成为生活中不可或缺的一部分

图片

算力作为AI发展的基石在过去几年也经历了飞跃式增长苏姿丰公布了一组震撼的算力增长数据:AI基础设施的算力从2022年的1 Zettaflops将增长到2025年的100 Zettaflops;未来数年全球计算能力将再提高100倍并在未来五年达到10 Yottaflops而这一数值是将2022年的一万倍

图片

而AMD作为唯一一家具备覆盖云PC边缘全场景算力供给能力的企业能够通过CPUGPUNPU及定制化芯片的协同针对不同应用场景精准调整提供性能与成本兼具的解决方案

图片

“AI是过去50年最重要的技术也是AMD的首要任务未来的AI将无处不在并服务所有人”苏姿丰说而她的演讲也围绕云端PC和边缘三大方面展开

Helios:性能猛兽 为Yotta算力时代筑基

图片

图片

强大的大模型需依托云端算力运行如今AMD已成为云端算力的核心支撑力量目前所有主要云服务商均采用AMD EPYC CPU排名前10的AI公司中有8家使用Instinct加速器驱动最先进的模型而算力需求仍在持续飙升:过去十年训练领先AI模型所需的计算能力每年增长4倍;过去两年随着AI用户激增推理能力呈现爆发式增长Token数量实现了百倍的增长

图片

苏姿丰指出满足如此庞大的算力需求需要整个生态系统协同发力核心挑战是将AI基础设施拓展到Yotta算力时代需要的规模这不仅需要出色的性能更需要CPUGPU和网络融合的计算领导力以及开放式的模块化机架设计和易于部署的交钥匙解决方案为此AMD打造了面向Yotta时代的下一代机架平台——Helios该平台在硬件软件和系统等各个层面实现全面创新

图片

作为Helios平台的核心算力单元Instinct MI455加速器实现了迄今为止最大的代际性能提升该加速器采用领先的2nm和3nm制程工艺与EPYC CPUPensando网络芯片协同每个托架通过高速加速器连接数千个Helios机架可借助行业标准超以太网卡和可编程DPU构建强大AI集群通过从GPU卸载部分任务进一步提升AI性能

图片

苏姿丰详细介绍了Helios平台的硬核参数:基于Meta合作开发的OCP开放式机架宽标准双宽设计重量达7000磅每个托架包含4个MI455 GPU搭配下一代EPYC Venice CPU和Pensando网络芯片均采用液冷方式最大化性能其中MI455X拥有3200亿个晶体管(比MI355多70%),包含12个2nm和3nm的计算与IO芯片配备432GB超高速HBM4内存通过下一代3D堆叠技术连接

图片

新一代EPYC Venice CPU也首次亮相采用2nm工艺配备256个最新高性能Zen 6核心是性能能效和性价比兼具的顶级AI CPU内存和GPU带宽较上一代产品翻倍;搭配800G以太网Pensando Vulcano和Salina网络芯片可实现超高带宽和超低延迟支撑数万个Helios机架在数据中心内扩展

正如苏姿丰所言Helios是一个“性能猛兽”每个Helios机架拥有超过18000个CDNA5 GPU计算单元和4600个Zen 6 CPU核心可提供高达2.9 Exaflops的性能31TB的HBM4内存每秒258TB的纵向扩展带宽和每秒43TB的横向扩展带宽从而支持数据快速传输

图片

苏姿丰确认Helios将于今年晚些时候推出半年以前AMD推出MI355时吞吐量较上一代提高3倍而此次发布的MI455性能提升高达10倍

“这将改变游戏规则让开发者能够构建更强大的模型智能体和应用”苏姿丰说

OpenAI:算力就是GDP 苦其久矣

去年十月AMD与OpenAI达成了一份多年战略合作协议涉及总计6吉瓦(GW的AMD GPU算力采购OpenAI将率先部署1GW的AMD instinct MI450系列GPU预计于2026年下半年启动

图片

作为重要合作伙伴OpenAI总裁Greg Brockman也亲临现场分享了对于AI发展的看法以及介绍了同AMD的合作情况

Greg Brockman表示如今人们对于生成式AI的需求已经从简单的文本处理转变为真正用来处理生活中的事情比如寻医问药教育咨询等在于企业领域比如引入Codex等模型并变革软件工程今年在企业科研等领域将真正看到智能体的爆发

Greg Brockman称大约十年前大模型的能力有限如果想训练一个模型只能非常狭窄的范围内发挥作用如今随着模型实现指数级进步实用性显著增长深度融入人们的生活和工作

“未来智能体可能不会仅局限于一个工作而是会融合多个模型形成一个智能体团队相当于10个工程师团队为你工作而这样需要对应的算力支持将远远超过如今的水平这可能需要数十亿个GPU”Greg Brockman说

Greg Brockman表示在OpenAI看来因为AI交互能力变得更加重要所以未来人们的注意力和意图将成为宝贵资源而这样的交互依赖于系统的超低延迟和超高吞吐量这为底层硬件带来了挑战

“过去几年OpenAI的算力每年实现三倍增长收入也增长了两倍但我们内部每次想要开发新的模型和功能都会为计算资源而发生激烈争论因为大家想推出和制作的东西太多由于计算能力有限根本无法实现”Greg Brockman说

对于算力的重要性Greg更进一步指出未来迈向的世界GDP的增长本身将取决于特定国家和地区可用的算力目前已经有这种趋势的最初迹象而未来数据中心扮演的角色将更加重要

打造数据中心产品组合独有竞争优势

图片

基于MI400系列和Helios平台AMD构建起一套完整的覆盖云企业级AI/超算等领域的数据中心解决方案

一是面向云端的Helios平台专为尖端性能超大规模训练和机架级分布式推理打造包含72个GPU搭配Venice CPUMI400系列加速器和Vulcano网络芯片;

二是面向企业级AI部署的方案采用Instinct MI440X GPU+Venice CPU8个GPU组成紧凑型服务器提供训练和推理能力适配现有数据中心基础设施;

三是面向主权AI+HPC的方案采用Venice-X CPU+MI430X系列加速器为高精度科学和AI数据类型提供领先的混合计算能力

苏姿丰强调“这是AMD独有的组合依托不同芯片组技术精准匹配不同场景的计算需求

生态赋能开箱即用 客户十倍下单

图片

过去几年在加速硬件领域创新的同时AMD也在着力打造其软件和开放生态ROCm便是其面向AI领域的关键战略举措核心目标是打破 NVIDIA CUDA 的封闭生态垄断为开发者提供开放可移植的 GPU 计算平台同时巩固自身在数据中心与超算市场的竞争力

苏姿丰强调硬件只是AI的一部分开放生态对AI未来至关重要“历史经验证明只有行业团结起来围绕开放的基础设施和共享的技术标准达成一致创新速度才能加快AMD是唯一一家在整个技术栈上实现开放的公司涵盖软硬件及更广泛的解决方案生态系统”

图片

苏姿丰介绍AMD的软件战略以ROCm为核心这一业界性能最高的开源AI软件栈为最常用的框架工具和模型提供Day0支持同时原生支持PyTorchVLLMSGLangHugging Face等顶级开源项目(每月下载量超1亿次),且可在Instinct加速器上开箱即用大幅降低开发者在AMD平台构建部署和扩展AI能力的门槛

Luma AI是AMD生态的重要合作伙伴专注于视频生成和多模态模型研发致力于构建“多模态通用智能”Luma AICEO兼联合创始人Amit Jain受邀登台分享了于行业的看法以及AMD的合作成果

Amit Jain表示当前多数AI视频和图像模型仍处于早期阶段而Luma AI的目标是打造融合模型图像视频语言的更智能模型用于模拟物理现象因果关系并将结果渲染为多媒体形式

图片

Amit Jain展示了世界上第一个推理视频模型Ray3也是首款支持4K和HDR视频生成的模型他介绍目前Luma AI正与企业及个人创作者合作应用于广告娱乐媒体等领域2025年客户将开始部署模型并验证后续将大规模推广包括利用该模型制作90分钟长篇电影等

在此基础上Luma AI还开发了Ray3 Modify模型具备“世界编辑功能”可处理真实或AI拍摄的素材根据创作需求任意修改开启人机混合制作新时代——创作者通过动作时机和方向作为提示模型即可完成相应创作让电影制作人无需复杂布景就能创造完整电影宇宙并灵活编辑特别将为那些具有创新的小型团队而言将极具价值

Amit Jain预测2026年将是智能体元年AI将实现端到端任务处理而非零散工作他还透露2024年曾与苏姿丰电话沟通寻求算力支持目前双方合作深入当前快速增长的推理工作负载中有60%运行在AMD显卡上通过与AMD ROCm软件团队和深入合作让模型可实现开箱即用

Amit Jain介绍由于多模态工作负载复杂消耗的Tokens数量是文本模型的成百上千倍(10秒钟视频消耗10万个tokens相对于大语言模型LLM仅需200-300个),因此整体拥有成本TCO和推理经济性至关重要通过与AMD合作Luma AI实现了技术栈的最优TCO成本效率显著提升因此2026年决定将合作规模扩大十倍采购MI455机架级解决方案从而构建支撑世界模拟模型的内存和基础设施

图片

图片

苏姿丰也透露为持续满足增长的算力需求AMD不会止步于MI400系列目前MI500系列研发顺利将实现AI性能4年提升1000倍的飞跃该系列采用下一代CDNA6架构基于2nm工艺制造搭载速度更快的HBM4e内存将于2027年推出

全球最小AI开发系统本地跑2000亿大模型

图片

作为AI在端侧落地的代表AI PC经过过去两年的发展正步入规模普及的新阶段

图片

苏姿丰指出伴随着更多算力和智能的注入PC的定位已从工具升级为“伙伴”——能够学习用户工作方式适应习惯即使离线也能快速处理任务在内容创作生产力提升智能体应用等场景发挥核心价值

图片

而AMD很早便看到了AI PC的趋势浪潮并进行大力的投入2023年在Ryzen 700系列中集成专用AI引擎推出首个X86 NPU;2024年率先推出CoPilot Plus X86 PCRyzen AI 300系列成为首个支持CoPilot+的X86处理器;2025年推出Ryzen AI Max处理器打造首个可在本地运行2000亿参数模型的单芯片X86平台

图片

演讲现场苏姿丰宣布推出全新Ryzen AI 400系列处理器该处理器配备12个高性能Zen5 CPU核心16个RDNA 3.5 GPU核心和最新XDNA2 NPU可提供60 TOPS的AI算力

图片

与竞争对手相比旗舰级Ryzen AI移动处理器在内容创作和多任务处理方面表现显著提升首批搭载该系列的PC将于本月晚些时候发货今年各大OEM厂商将推出超过120款超薄游戏本和商用PC覆盖所有AI PC外形尺寸

苏姿丰强调AI PC不仅需要硬件支撑更需要更智能的软件——模型更轻巧速度更快且能直接在设备上运行

图片

Liquid AI与AMD去年宣布基于Ryzen AI 400系列的合作AMD也在2024年Liquid AI A轮融资中作为领投方参与Liquid AI联合创始人CEO Ramin Hasani受邀分享了双方合作成果

Liquid AI团队源于麻省理工学院专注于构建高效生成式AI模型与传统Transform模型不同其模型具备强大高速处理器优化的特性目标是在不牺牲质量的前提下从根本上降低智能计算成本让前沿模型质量的AI能力可直接在笔电手机机器人咖啡机飞机等各类端侧设备上实现

Ramin Hasani指出无处不在的计算具备三大价值:隐私速度和连续性可实现在线与离线工作的无缝切换他介绍了此次CES期间Liquid AI发布的两款新品:

图片

一是Liquid Foundation Models 2.5(LFM2.5),这是业界最小的模型(仅12亿参数),但性能优异甚至优于同类参数更多的模型其设备端指令跟踪功能优于DeepSeekGemini Pro及Gemini 2.5 Pro等模型;

二是五款实例模型包括聊天模型指令模型日语增强型语言模型视觉大语言模型轻量级音频模型和音频语言模型均针对AMD Ryzen AICPUGPUNPU高度优化可以在Hugging Face平台下载通过堆叠这些实例模型可构建智能体工作流

图片

此外即将于今年晚些时候推出的LFM3采用原生多模态设计可处理文本视觉音频输入并以十种语言提供音频和文本输出音视频数据延迟低于100毫秒

Ramin Hasani表示当前多数AI PC汽车中的智能体是被动响应的而当AI在设备上快速运行且始终开启时可主动处理任务并在后台运行Ramin Hasani现场演示了AI分析邮件回复自动连接参与视频会议的场景并透露正与Zoom合作将该功能引入Zoom平台他强调今年将是智能体大放异彩的一年

图片

在苏姿丰看来AI PC不仅能运行AI程序还能构建程序这正是AMD打造Ryzen AI Max的初衷——该处理器面向内容创作者游戏玩家和AI开发人员配备16个高性能Zen 5 CPU核心40个RDNA 3.5 GPU计算单元和1个XDNA2 NPU具备50 TOPS AI性能通过统一内存架构连接支持CPU和GPU共享128GB内存

测试数据显示在高端笔记本电脑中Ryzen AI Max在AI和内容创作应用中的速度明显快于最新MacBook Pro;在小型工作站中性能与NVIDIA DGX Spark相当但更具成本优势;运行最新GPT OSS模型时每美元每秒的Tokens生成速度是竞品的1.7倍

图片

苏姿丰介绍目前市场上已有超过30款搭载Ryzen AI Max的笔记本在售一体机和紧凑型工作站产品将在CES发布并于今年陆续上市

图片

为满足AI开发者随时开发的需求苏姿丰海宣布AMD推出Ryzen AI Halo参考平台——这是世界上最小的AI开发系统可在本地运行参数高达2000亿的模型无需连接任何外部设备该平台搭载最高端Ryzen AI Max处理器配备128GB高速统一内存(CPUGPU和NPU共享),在提升性能的同时能够实现大型AI模型在紧凑型台式电脑上的高效运行;原生支持多种操作系统与最新ROCm软件栈同步预装领先开源开发者工具开箱即可运行数百个模型为开发者提供在PC上直接构建测试和部署本地代理及AI应用程序的全套能力将于今年第二季度发布

内容游戏创作:“AI教母”站台点赞

图片

作为近年来AI领域最受关注之一的华裔女科学家被称为“AI教母”的World Labs联合创始人兼CEO李飞飞也受邀来到现场分享了AI在助力游戏内容创作和空间智能方面的创新实践

李飞飞表示过去几年语言大模型席卷全球但智力不止于语言智能当前新的生成式AI技术浪潮已涵盖具身智能等领域可赋予机器接近人类水平的空间智能——不仅能感知还能创建3D甚至4D世界对物体和人进行推理想象遵循物理和动力学规律的全新环境为此她创办了World Labs致力于将空间智能变为现实

李飞飞介绍传统3D场景构建需激光扫描仪校准相机或复杂软件手工制作而World Labs的新一代模型可通过推理生成式AI技术学习世界的3D4D结构——仅需几张甚至一张照片模型就能填补缺失细节预测内容生成丰富一致可导航的3D世界

图片

图片

李飞飞在现场展示了两个实例:一是利用少量图像数据借助Marble模型创建的霍比特人小屋3D场景可浏览俯视并规划导航线路;二是通过录入AMD总部的几段视频Marble模型(基于AMD MI325X芯片和ROCm软件栈创建出包含窗户家具及准确大小深度比例的3D环境并可设计不同风格这种技术可大幅提升效率将以往数月的工作缩短至几分钟广泛应用于机器人模拟游戏开发和设计等领域

李飞飞强调空间智能与一般智能不同的是要教会AI理解导航3D结构移动物理定律需要巨大的内存大规模的并行处理和非常快的推理速度因此空间智能的实现离不开强大算力支撑——模型速度越快世界反映越即时从而保障镜头移动剪辑及导航探索时的场景连贯性她期待MI450加速器能助力训练更大的世界模型并以更快速度运行让这些环境更生动响应更迅速她指出AI系统正从被动理解文字和图像转向主动帮助人类与世界互动而实时转化少量图像和照片为连贯可探索世界的技术正是这一转变的重要突破

垂直领域深耕:医疗航天与科学创新

如今AI正在实现在各个行业中的深度赋能此次演讲的最后部分AMD邀请了来自医疗工业航天与科研创新等领域的合作伙伴共同探讨所面临的机遇和挑战

图片

Absci CEO Sean McClain介绍通过AMD提供的算力支持正在助力实现一天内筛选超过百万种药物高效提升研发效率从而提高在预测疾病预防疾病和个性化治疗方面的能力

Illumina CEO Jacob Thaysen分享了AMD FPGA和EPYC处理器用于DNA测序领域的应用的案例

阿斯利康AI负责人Ola分享了在同AMD合作的基础上企业通过整合数十年实验室数据训练生成式AI模型可在计算机上模拟评估候选药物将小分子药物研发的候选药物交付速度提高50%同时提升临床成功率

图片

图片

Generative Bionics CEO兼联合创始人Daniele Pucci分享了物理AI在仿生学领域的应用该公司拥有20多年物理AI和生物力学研究经验专注于生成式仿生学需要快速确定性和本地化的计算支撑触觉平衡等功能无法依赖云端——这正是与AMD合作的核心原因AMD提供了从嵌入式边缘平台(Ryzen AI EmbeddedVersal AI Edge到CPUGPU的全栈解决方案:嵌入式平台可在机器人上运行物理AICPU和GPU则为仿真训练和大规模开发提供算力

图片

Generative Bionics研发的Gene01人形机器人具备压力感知接触感知和意图识别能力首款商用产品将于今年上半年推出并已与全球领先钢铁厂商达成合作

图片

在航天领域AMD技术正为关键太空任务提供动力——从卫星互联网连接偏远社区到火星木星等天体的自主探索苏姿丰介绍AMD自适应计算技术支撑“毅力号”(Perseverance火星车自主运行同时为美国宇航局喷气推进实验室欧洲和印度航天机构的机器人系统提供可靠算力适配太空极端恶劣环境

图片

蓝色起源(Blue Origin是由杰夫·贝佐斯创立的美国商业航天公司专注于太空探索和可重复使用火箭技术高级副总裁John Couluris受邀出席并发言

John Couluris表示当前人类已实现常驻太空25周年下一步目标是月球永居这需要可靠可重复低成本的运营及设备支撑飞行计算机是飞行器的核心而太空作为终极边缘环境对计算堆栈的可靠性确定性和弹性提出极高要求同时需兼顾质量功率和辐射防护AMD嵌入式架构可减轻飞行器质量节省电力并承受深空严苛辐射环境双方合作在飞行计算机堆栈中采用Versal 2芯片目前该飞行计算机已在车辆测试平台上运行最终将为Mark2着陆器提供动力最早于2028年将宇航员送上月球目前团队已完成模拟月球着陆测试节省了数月工期

John Couluris认为AI将成为宇航员的“副驾驶”助力识别着陆点规避危险而实时计算能力是实现这一功能的关键;若Mark1探索器降落在月球背面(绝佳的无线电频率接收场所),边缘AI将支撑外太空的深度探索将避免了传统的中继通信延迟问题

在科学研究领域AMD为全球最快的两台超级计算机以及50个最节能系统中的一半以上提供动力包括芬兰Lumi超算橡树岭国家实验室和劳伦斯国家实验室的超算系统这些超算正用于模拟病毒变异和进化等前沿研究

图片

苏姿丰宣布AMD与美国能源部及国家实验室密切合作参与Genesis计划——该计划是美国几十年来规模最大的联邦科学资源调动堪比阿波罗计划和曼哈顿计划目标是十年内使美国科学生产力和影响力翻一番计划将整合国家实验室的超算和数据集构建闭环AI平台通过AI实现实验设计自动化加速模拟生成预测模型提升联邦研发效率覆盖生物技术关键矿物核能太空探索量子半导体微电子等领域几周前Genesis计划刚刚公布了首批合作伙伴AMD位列其中。