客户端
游戏
无障碍

8

评论

9

12

手机看

微信扫一扫,随时随地看

谁将主宰未来?DeepSeek R1横空出世,震撼中美AI争霸战!




导言

在这个AI迭代速度堪比火箭升空的时代,中国AI实验室DeepSeek再度引爆全球视线:其最新发布的“R1”模型不仅在性能上逼近国际顶尖水平,更以低成本训练颠覆了外界对行业“高投入、高壁垒”的传统印象。深究此事,我们会发现它所带来的冲击远不止于一次技术升级,更是对美国现行对华出口管制策略、全球AI产业发展路径以及大国技术博弈格局的一次强力“应答”。一方面,美国希望通过限制高端芯片与尖端技术出口来维持自身优势,并遏制中国的跃进;但另一方面,DeepSeek在“硬件受限”与“低成本挖潜”这两大不利因素下依然实现了快速迭代,充分证明软件优化与本土创新潜力的重要性,也折射出当下中美之间“卡脖子”式制裁的成效正面临新一轮质疑。


值得注意的是,中国政府多年来在AI领域扮演的角色并不总是“慷慨出资”,而更多是从产业规划、监管框架到标准制定的“政策设计师”。相较于在半导体、电动车、光伏等领域的直接投资,大量中国AI企业更多依靠市场拉动与潜在的国家金融工具(如国有银行的融资与信贷支持),在商业化落地与研发创新上“野蛮生长”。如今,以DeepSeek为代表的实验室或初创企业,频繁在国际舞台上“亮剑”,向全球展示中国AI生态强大的执行力与迭代速度。


然而,在为DeepSeek鼓掌的同时,也需对当前AI竞赛局势保持理性思考。美国出台的出口管制政策的确让中国厂商在高端硬件方面面临诸多技术鸿沟,但也在一定程度上倒逼中国企业在算法创新、模型架构与硬件替代方案上探索全新路径。由此衍生出的低成本与“擦边球”采购方式更是让整个中国AI行业在外部压力下产生了激烈的“化学反应”。这一局面不仅可能动摇美国对全球半导体供应链的绝对掌控,也令部分美国政商界人士重新思考:一味地“封堵”是否会带来负面反弹,甚至加速竞争对手创新的可能性?


同时,我们也要看到,这场竞赛背后并非仅仅是一场单纯的技术追逐,更是两国在下一代产业形态、生产要素重构以及全球话语权上的“综合竞争”。AI将如何重塑劳动市场、产业链安全和世界秩序?中国在AI体量、创新速度方面的突进会不会再次撼动美方在人工智能领域的战略自信?美国是否应当在限制对手的同时更多聚焦自身研发能力与人才机制的优化?这些问题,都值得我们在兴奋与观望之余深度思考。



图片




DeepSeek 正在重塑中国的 AI 版图


2024年1月20日,中国人工智能实验室 DeepSeek 发布了其最新产品 “R1”,以较低的训练成本达到了与全球顶级 AI 模型相当的性能,震惊了业界。


前英特尔(Intel)首席执行官帕特·基辛格(Pat Gelsinger)在 LinkedIn 上称 DeepSeek R1 为“世界级的解决方案”。根据人工智能分析公司 Artificial Analysis 的 AI 模型质量指数(AI Model Quality Index),DeepSeek 目前已有两款模型跻身全球前十,其中 R1 仅次于 OpenAI 的 o1 模型,排名第二。


这并非 DeepSeek 首次引起行业轰动。这家总部位于杭州的 AI 实验室由曾是中国四大量化对冲基金之一的 High-Flyer 资助,在开源 AI 领域不断突破创新。2024年5月,DeepSeek 推出的 V2 模型在中国 AI 业界掀起波澜,其不仅在性能上表现出色,更以极具竞争力的价格打破市场格局。


V2 模型的开源发布在市场上引发冲击,其 API 价格仅为每百万 tokens 2 元人民币(约 25 美分),约为 ChatGPT-4 Turbo 价格的 1%,远远低于几乎所有中国竞争对手。API 定价指的是企业向用户收取 AI 服务访问费用的标准,费用取决于 AI 处理的文本量(即“tokens”)。一个 token 可以是一个单词,甚至是一个单词的一部分。


2024年12月,DeepSeek 再次引起全球 AI 业界关注,推出了 V3 模型。V3 的综合性能已超越 Meta 最新的开源模型 Llama 3.3-70B,在推理(reasoning)、编程(coding)和数理推理(quantitative reasoning)等评估指标上全面领先,并与 Anthropic 的 Claude 3.5 Sonnet 旗鼓相当。更令人惊讶的是,这款模型发布仅比 Anthropic 最新版本晚两个月,并与 Meta 发布 Llama 3.3 的时间相同。而 DeepSeek 最新的 R1 模型距离 OpenAI 在 2024 年 9 月推出 o1 预览版仅四个月,再次显示了其迅猛的发展速度。


中美 AI 竞争加剧

自 2022 年底 OpenAI 发布 GPT-3 并引爆全球 AI 热潮以来,中国 AI 实验室与美国竞争对手之间的差距迅速缩小,行业发展节奏惊人。此前,包括前谷歌(Google)CEO 埃里克·施密特(Eric Schmidt)在内的许多美国政策制定者和商业领袖普遍认为,美国在 AI 领域领先中国数年,但这一认知如今显然站不住脚。


目前,中美 AI 竞争正日益升温,政府层面也高度关注。DeepSeek 创始人兼 CEO 梁文峰最近被媒体报道到与政府高层会面,他是会议中唯一的 AI 行业代表。而在 DeepSeek R1 发布的次周,中国银行(Bank of China)宣布了“AI 产业发展行动计划”(AI Industry Development Action Plan),计划在未来五年内提供至少 1 万亿元人民币(约 1370 亿美元)支持 AI 基础设施建设,并推动机器人、低轨卫星经济等 AI 相关应用的发展。


中国银行的这一 AI 计划只是北京近年来推动该行业众多项目之一。早在 2017 年,中国国务院就发布了《新一代人工智能发展规划》(New Generation AI Development Plan),提出到 2030 年使中国成为全球 AI 领导者的战略目标,并设定 2025 年为提升 AI 基础设施、研究能力及行业融合的中期节点。自 2017 年以来,中国政府已出台 40 余项 AI 相关政策与监管举措,涵盖 AI 基础设施建设、AI 安全治理等多个方面。


其中包括 2024 年 7 月发布的《人工智能产业标准体系指南》(AI Industry Standards System Guidance),以及 2024 年 9 月出台的《人工智能能力建设行动计划》(AI Capacity-Building Action Plan)和《人工智能安全与治理框架 1.0》(AI Safety and Governance Framework 1.0)。


尽管政府的政策支持显示出一定承诺,但迄今为止,中国政府在 AI 产业中的角色更倾向于引导和监管,而非直接投资主导。这与半导体、电动汽车(EVs)、太阳能电池板等行业有所不同,在这些领域,政府发挥着更核心的推动作用。


与此同时,中国企业正在自主推动 AI 项目,虽然有时能获得国家银行的融资支持,但主要还是基于市场机会进行投入。特别是在 ChatGPT-3 展示出 AI 技术突破后,中国科技巨头如百度(Baidu)、阿里巴巴(Alibaba)、腾讯(Tencent)和字节跳动(ByteDance)纷纷投入大模型(LLM)研发,加剧了市场竞争。


在 ChatGPT-3 发布仅四个月后,中国科技巨头百度(Baidu)便于 2023 年 3 月推出了其首款大语言模型(LLM)——文心一言(Ernie Bot)。据一位中国 LLM 研究员在 GitHub 上的数据,自 ChatGPT-3 发布以来的两年多时间里,中国已开发出至少 240 款 LLM,涵盖了从科技巨头(如百度、阿里巴巴、腾讯、字节跳动)到初创公司(如 MiniMax、智谱 AI、月之暗面 AI、01.AI)以及顶尖高校(如北京大学、清华大学)的广泛阵营。


这一快速发展凸显了中国 AI 产业的巨大进步和高度关注,如今业内人士普遍认为,如果一家企业没有自主研发的 AI 模型,反而会显得奇怪。


一个典型的例子是小米(Xiaomi)。这家原本专注于消费电子和电动汽车(EV)行业的企业,如今也积极进入 AI 领域,开发自己的 LLM,这反映出 AI 技术正广泛融入中国各个行业。另一个例子是美团(Meituan),这家主要从事外卖及本地生活服务的公司也已开发自己的 LLM,并在其平台上部署了 AI 助手。


DeepSeek 的成功与中国 AI 行业的变革

DeepSeek 的成功将深刻影响中国 AI 产业的发展。其开源模型不仅为本土科技巨头提供了技术参考,使它们能够利用自身庞大的资源快速采用和优化最前沿的方法,同时也为中小型 LLM 开发者提供了一条可行的竞争路线,使其在有限资源的情况下依然能够挑战行业巨头。


中国的 LLM 开发者很可能迅速优化 DeepSeek 的创新成果,并以惊人的速度部署它们,从而对美国 AI 公司的竞争力构成严峻挑战。DeepSeek 的推理模型(reasoning model)已成为中国 AI 产业的一部分,这种模型能够“在回答问题之前进行深度思考,产生一系列内部推理链”,类似于 OpenAI 对其模型的描述。而且,字节跳动(ByteDance)、科大讯飞(iFlytek)和月之暗面 AI(MoonShot AI)等公司也在同一个月推出了自己的推理模型。


此外,DeepSeek 的成功可能会增强投资者和政策制定者对 AI 产业的信心,从而加大对该领域的支持力度。过去两年,由于监管环境快速变化及宏观经济形势不佳,中国的私募股权和风险投资行业经历了资金低谷。但 DeepSeek 的突破性进展或将促使资本市场重拾对 AI 领域的兴趣。


DeepSeek 对全球 AI 产业的影响

DeepSeek 的影响力并不局限于中国 AI 产业,它的 V2 和 V3 模型已在硅谷引起关注。据《The Information》2025 年 1 月底的一份报告,美国最大的开源 AI 企业 Meta 正在“紧急追赶” DeepSeek V3 和 R1 模型所体现的技术“诀窍”。此外,DeepSeek R1 采用 MIT 许可证(MIT License),允许全球范围内的商业使用。在最近接受 CNBC 采访时,Perplexity CEO 阿拉温德·斯里尼瓦斯(Aravind Srinivas)也表达了类似观点。


与此同时,华盛顿的政策制定者正激烈讨论是否需要调整以出口管制为核心的 AI 遏制战略。


包括保罗·特里奥洛(Paul Triolo)、伦纳特·海姆(Lennart Heim)、黄思昊(Sihao Huang)、经济学家李子琪(Lizzi C. Lee)、乔丹·施耐德(Jordan Schneider)、迈尔斯·布伦达奇(Miles Brundage)和张安琪(Angela Zhang)等分析人士已对 DeepSeek 的成功进行了政策解读。他们普遍达成两点共识:第一,DeepSeek 的模型是真正的技术突破;第二,中国 AI 产业正在迅速缩小与美国的差距。


美中 AI 竞争与出口管制的影响

尽管如此,2022 年 10 月和 2023 年 10 月分批实施的美国 AI 芯片与半导体出口管制,并非完全无效。中国企业(如中芯国际,SMIC)在制造 7 纳米(7 nm)及更先进芯片方面面临挑战,例如良品率较低,且在 7 nm 之上的技术进展有限。华为最新的 7 nm 智能手机处理器和 Ascend 910B 图形处理单元(GPU)均由中芯国际 7 nm 制程制造,显示出中国在高端 AI 加速器和智能手机芯片领域确实受到出口管制的影响。


然而,在 2023 年 10 月美国实施更严格限制之前,中国 AI 企业已大量囤积 GPU,并通过第三方国家或灰色市场获取高端芯片。虽然拜登政府近期推出的 AI 扩散规则(AI Diffusion Rule)试图堵住这些漏洞,但该法规仍处于 120 天的公众意见征询阶段,并且执行复杂,短期内难以全面生效。


这批囤积的芯片使得中国 AI 企业仍然可以利用英伟达(Nvidia)H100、H800 和 A100 GPU 训练模型,并推动本土替代方案(如华为 Ascend 910B 及即将推出的 910C GPU)。


尽管如此,出口管制确实限制了中国企业获取下一代 AI 芯片。例如,英伟达的最新 Blackwell GPU 在 2024 年第四季度开始全球出货,但中国无法获得。此外,下一代 Rubin 系列 GPU 也可能受到进一步限制。这些最新一代 GPU 拥有更强的计算能力和更低的延迟,使美国 AI 实验室在硬件方面继续保持优势。然而,DeepSeek 的成功表明,硬件并不是决定 AI 竞争胜负的唯一因素——至少目前来看是这样。


美国 AI 竞争战略的缺陷

毫无疑问,过去两年的出口管制措施已成为中国 AI 和半导体领域创新和投资的强大推动力。面对限制,中国政府加大了对关键行业的支持力度,并将其视为国家竞争力的核心领域。此外,随着 AI 市场潜力的增长,以及美国公司在中国市场的缺位,中国企业正加速进入 AI 赛道。例如,华为、壁仞(Biren)、摩尔线程(Moore Threads)等公司在 GPU 领域发力,而中芯国际(SMIC)、中微公司(AMEC)、北方华创(Naura)等半导体企业则希望借助政策支持扩展市场。


与此同时,硬件限制也迫使中国工程师在软件优化方面更加创新,例如 DeepSeek 采用的模型优化方法。这些挑战反而加速了中国 AI 生态系统上下游企业之间的合作,进一步强化了本土供应链,并削弱了外国企业进入中国市场的能力。


这一系列发展使人们对美国的出口管制战略提出质疑——这一策略是否真的能限制中国 AI 技术的进步,还是反而在无意中推动了中国的自主创新?


目前,美国的 AI 竞争战略主要依赖于限制中国获取先进硬件,而非积极推动国内 AI 产业的技术领先。然而,如果美国希望在 AI 竞赛中真正领先,仅仅依靠遏制对手是不够的,还需要加速本土创新和产业发展。


未来数周或数月,美中 AI 竞争可能进一步升温。预计美国将对中国 AI 公司的活动加强审查。特朗普政府可能会推出更详细的 AI 竞争计划,以支持国内 AI 产业,并放宽部分监管限制,以促进创新。


正如特朗普在 2025 年 1 月 27 日所言:“中国公司 DeepSeek AI 的发布应该成为我们行业的警钟,我们必须全力以赴,确保在竞争中获胜。”然而,即便有 Stargate 计划,美国在 AI 竞赛中的道路仍然漫长。


https://foreignpolicy.com/2025/01/29/deepseek-china-ai-chatgpt-stocks/



文章略有删改,仅代表作者观点,供读者参考,与本平台立场无关。如有侵权,请联系删除。

免责声明:本内容来自腾讯平台创作者,不代表腾讯新闻或腾讯网的观点和立场。
举报
评论 0文明上网理性发言,请遵守《新闻评论服务协议》
请先登录后发表评论~
查看全部0条评论
首页
刷新
反馈
顶部