“大空头”开始凝视半导体,有哪些值得注意的地方

问AI · 迈克尔·伯里为何选择2027年作为期权到期日?
资本市场的单边情绪极值,往往是产业结构性拐点的前置信号。
2026年4月下旬,美国费城半导体指数(SOX)创下了自1994年有记录以来的最长连涨纪录,连续18个交易日收涨,单月涨幅突破40%,同比涨幅高达150%。在市场沉浸于“AI超级周期”的线性外推时,Scion Asset Management创始人迈克尔·伯里(Michael Burry)通过向美国证券交易委员会(SEC)提交的监管文件披露,其已动用4740万美元名义价值,买入了追踪费城半导体指数的iShares Semiconductor ETF (SOXX) 的看跌期权,行权价定于330美元,到期日为2027年1月。
图片
迈克尔·伯里是电影《大空头》的原型,曾在2008年次贷危机中一战封神,因而他开始做空半导体ETF不容小觑。但剥离媒体对“大空头”标签的过度炒作,我们需要从这一反向交易信号切入,进行客观的基本面审视:当前半导体板块的飙升已在很大程度上脱离了底层财务数据的支撑。
 该图片疑似使用了AI生成技术,请谨慎甄别图片
在2026年第一季度,全球半导体产业正处于“传统产能撕裂”、“2nm先进制程良率爬坡”与“底层算法压缩硬件需求”的三重复杂博弈之中。本文将从估值水位、技术架构演进、晶圆厂产能周期以及地缘政治映射四个维度,对当前的产业异动进行深度穿透。

一、 估值中枢的失重与科技巨头的资本开支博弈

在做空者的视角里,二级市场对半导体设备与算力芯片的定价,已经进入了透支未来三年业绩预期的完美定价(Perfect Pricing Scenario)阶段。
截至2026年4月,费城半导体指数(SOX)的动态市盈率(PE)已逼近60倍的高危水位。以伯里做空的标的SOXX为例,根据GuruFocus的内在价值评估系统(GF Value)测算,该ETF的公允价值中枢应在279.00美元附近,而其当前交易价格高达461.60美元,溢价率触及65.4%的极端水平,且其追踪市盈率维持在39.85倍。
在这种极端估值下,市场逻辑的脆弱性在于对超级云服务商资本开支永续增长的盲目确信。然而,宏观财务数据正在传递截然相反的收敛信号。为了维持庞大的AI基础设施采购,北美科技巨头正在进行残酷的内部成本重构。2026年一季度,微软通过买断计划削减了约8750名美国本土员工(约占其国内员工总数的7%),Meta亦同步裁撤约8000个岗位。这种通过削减核心业务人力成本来“输血”AI硬件采购的财务模式,其边际效应递减的拐点正在逼近。

指标维度

2021年半导体周期顶部特征

2026年4月当前市场特征

产业逻辑穿透

核心驱动力

疫情红利驱动的PC/消费电子短缺

大语言模型(LLM)驱动的云端算力基建

需求高度集中于前五大CSP(云服务提供商),客户集中度风险极高

SOX指数连涨纪录

普遍在9至11个交易日见顶回落

创历史纪录的连续18个交易日上涨

动能指标(RSI)进入史无前例的超买区间,技术面均值回归压力巨大

板块市盈率极值

动态PE触及45倍后泡沫破裂

动态PE突破40x-60x区间

已完全计入2027年业绩预期,任何资本开支的微调都将引发戴维斯双杀

巨头人力成本调节

科技企业全线扩招扩张

微软裁员8750人,Meta裁员8000人

侧面印证AI算力投资回报率(ROI)尚未形成正向商业闭环,资金腾挪压力加剧

伯里买入2027年到期的看跌期权,其交易逻辑的核心锚点在于:一旦AI大模型的商业化变现斜率无法覆盖昂贵GPU集群的折旧与电力成本,云服务商势必在2026年下半年至2027年初大幅下调资本开支指引。届时,缺乏真实终端应用支撑的算力硬件供应链将面临剧烈的砍单反噬。

二、 算法对硬件的降维修正:TurboQuant与杰文斯悖论

资本市场对硬件需求的线性外推,正在被底层软件算法的跃迁所打破。Google在2026年一季度发布的TurboQuant压缩算法,是理解算力硬件需求长效演进的一个变量。
在大语言模型的推理阶段,最核心的物理瓶颈并非计算能力,而是Key-Value Cache(键值缓存)对GPU显存(VRAM)的吞噬。随着上下文窗口的拉长,KV Cache的体积呈线性膨胀,导致内存墙死死卡住模型的吞吐量。传统向量量化技术在压缩数据时,通常需要为每个数据块计算并存储全精度的量化常数,这不仅增加了1到2 bit的额外内存开销,还容易导致模型精度的不可逆失真。
Google TurboQuant算法通过引入“随机旋转(Random Rotation)”的数学模型与PolarQuant技术,在零精度损耗的前提下,成功将KV Cache的内存需求强行缩减至原先的1/6,并将注意力Logits的计算速度最高提升了8倍。

核心物理瓶颈

传统架构与常规量化方案

Google TurboQuant 算法优化机制

对半导体硬件产业链的实质影响

显存消耗 (VRAM)

随序列长度呈线性爆炸,导致系统频繁触发内存溢出 (OOM)

内存需求结构性缩减至原先的 1/6

降低单卡HBM容量要求,使消费级GPU具备运行千亿参数模型的能力

推理延迟 (Latency)

严重受限于高带宽内存 (HBM) 的物理带宽上限

注意力 Logits 计算速度最高提升 8 倍

单次Token生成成本暴降50%以上,重塑AI服务的单位经济模型

精度损耗 (Accuracy)

额外 1-2 bit 显存开销,极端压缩下模型出现“幻觉”

引入“随机旋转”实现高维向量的均匀分布

解决量化失真痛点,打通端侧模型商业化落地的最后阻碍

消息发布初期,SK Hynix与三星的股价出现剧烈波动,市场错误地将其解读为“HBM需求即将毁灭”。然而,深入产业技术逻辑,这一算法突破将触发经济学中的“杰文斯悖论(Jevons Paradox)”:当大模型的单次推理成本因算法优化而出现断崖式下跌时,原本受制于成本的边缘AI、自动驾驶以及具身智能机器人的部署门槛将被抹平。
这意味着,单节点硬件对超大容量HBM的需求强度可能会被削弱,但AI终端节点的部署基数将呈指数级爆炸。最终,全社会的总体内存消耗量不仅不会萎缩,反而会在更广泛的应用场景中被成倍放大。

三、 传统产能撕裂与“RAMageddon”:利润率的结构性倒挂

在远期算法博弈落地之前,2026年第一季度的全球半导体制造业正经历一场由人为资源错配引发的极端供需失衡,业界将其称为“RAMageddon(存储末日)”。
为了追逐AI数据中心对高带宽内存HBM的无底洞需求,三星、SK Hynix与美光三大原厂进行了激进的产能腾挪。由于HBM采用复杂的TSV(硅通孔)与多层堆叠技术,其晶圆消耗量极大。据产业测算,生产一颗HBM芯片通常需要挤占两到三颗常规DRAM的产能空间。这种“抽血效应”导致三大原厂将原本用于生产成熟DDR4/DDR5的晶圆产线大规模转产至HBM产线,甚至预计2026年AI数据中心将吞噬掉全球高达70%的高端内存产能。
产能的极端倾斜直接导致了传统存储市场的供给断层。TrendForce发布的2026一季度数据显示,存储市场的合约价出现了脱离宏观消费基本面的暴涨:

存储细分赛道

2026年一季度合约价环比涨幅

底层驱动逻辑与产业现状洞察

数据来源

PC DRAM (常规)

+105% - 110%

产能向HBM极度倾斜导致供给真空,PC OEM厂商被迫接受翻倍涨价

TrendForce

Server DRAM

+88% - 93%

全球CSP与服务器OEM抢夺有限的通用产能,引发供应链恐慌性囤货

TrendForce

NAND Flash

+55% - 60%

原厂主动将部分NAND产线改造转产DRAM以追逐暴利,导致NAND供给意外收缩

TrendForce

Enterprise SSD

+53% - 58%

AI推理端数据吞吐量激增,北美云服务商长单锁定剩余产能

TrendForce

在这种极端的供需失衡下,产业内出现了一个违背直觉的财务异象:由于常规DDR5供不应求,其毛利率在2026年初已经反超了被视为利润引擎的HBM。SK集团董事长崔泰源近期证实,标准内存芯片的利润率已飙升至约80%,而HBM的利润率仅维持在60%左右。美光高管亦坦言其“非HBM业务毛利率当前高于HBM”。
Omdia在2026年4月将全球半导体营收增速预期大幅上调至62.7%,总规模预计突破7000亿美元。但必须警惕的是,这种建立在人为制造稀缺基础上的超额暴利极度脆弱。一旦2026年底或2027年新增存储产能集中释放,叠加下游整机厂因BOM(物料清单)成本过高而砍单,存储价格的周期性踩踏将不可避免。

四、 先进制程的极限绞杀:2nm产能争夺与ASML的光源突破

在逻辑芯片代工领域,针对2nm及以下节点的资本军备竞赛同样进入了白热化。2026年的竞争焦点已从单纯的线宽微缩,转向了晶体管架构与背面供电技术的系统级整合。
当前,台积电的3nm(N3)及即将在年底量产的2nm(N2)产能已被苹果、英伟达和AMD等核心客户瓜分殆尽,产能排期已锁定至2028年,其2nm晶圆的报价甚至高达30,000美元/片。为了打破这种绝对垄断,三星与英特尔正在祭出底牌:
  1. 三星的价格战与良率跃升: 孤注一掷押注GAA(全环绕栅极)架构的三星,在2026年一季度终于迎来了拐点。其2nm(SF2)工艺良率在半年内实现超三倍跨越,突破60%的商业化底线。依托良率提升,三星发动了猛烈的价格战,将其2nm代工报价下调33%至20,000美元/片,并借此成功斩获Tesla价值16.5亿美元的下一代自动驾驶芯片订单。
  2. 英特尔18A 的背面供电与 Terafab 同盟: 英特尔不再谋求单点突破,而是选择与马斯克旗下的Tesla、SpaceX和xAI在得克萨斯州组建“Terafab”超级代工园区。英特尔18A节点的核心壁垒在于PowerVia背面供电网络(BSPDN)。通过将供电网络转移至晶圆背面,彻底解决了晶体管密度飙升带来的IR Drop(电压压降)及前端布线拥堵问题,使标准单元利用率提升5-10%,同等功耗下性能提升最高可达4%。英特尔首席财务官David Zinsner在4月的摩根士丹利会议上明确指引,代工业务有望在2027年底前实现营业利润率的盈亏平衡。

晶圆代工厂 (Foundry)

核心节点与晶体管架构

背面供电技术 (BSPDN)

2026年核心动态与产能战略映射

台积电

N2 (Nanosheet GAA)

否 (待A16节点引入)

产能全面售罄,掌握绝对议价权,单片晶圆报价维持 30,000 美元高位

三星

SF2 (MBCFET GAA)

良率突破 60%,单片报价暴降 33% 至 20,000 美元以抢夺 AI 芯片客户

英特尔

18A (RibbonFET)

是 (PowerVia)

深度绑定 SpaceX 与 Tesla (Terafab 计划),CFO重申 2027 年实现盈亏平衡目标

支撑这些亚纳米级工艺的底层基建,是包括光刻技术在内的各种半导体设备工程物理的极限延展。2026年4月13日,ASML宣布其极紫外EUV光刻机的光源功率从600瓦拉升至1000瓦。这项技术要求在真空腔体内,每秒用二氧化碳双脉冲激光精准轰击10万个极微小的熔融锡滴以激发等离子体。功率的提升将直接缩短硅片的曝光时间,使得单台EUV的每小时晶圆吞吐量有望在2030年从目前的220片提升50%至330片。这是半导体设备商试图通过极致的物理工程,来对冲先进制程高昂设备折旧成本的努力。

五、 地缘政治的系统性风险与A股硬核资产映射

在技术与产能的博弈之外,最大的宏观系统性风险依然来自地缘政治的非理性干预。全球高度分工的半导体供应链,正在被行政指令强行物理隔离。
美国联邦采购法规(FAR)理事会发布的拟议规则(FAR Case 2023-008)明确规定,自2027年12月23日起,全面禁止美国行政机构采购任何包含中芯国际、长鑫存储和长江存储等实体设计或生产的半导体产品的电子设备。与此同时,TechInsights在2026年发布的关税影响模型发出严厉警告:若美国对华关税全面提升至10%并引发对等反制,全球半导体市场不仅无法实现Omdia预测的高增长,反而可能在极端情境下萎缩34%。一旦全球供应链的摩擦成本超过了摩尔定律带来的效率提升,高度依赖中国市场的海外设备商将面临营收断崖。
然而,海外政策的收紧反向加速了中国本土半导体产业链的结构性重塑与产能增长。SEMI数据显示,2025年全球半导体制造设备销售额达1351亿美元,其中中国大陆设备支出逆势达到493亿美元,占全球总额的36.5%,牢牢占据全球最大设备采购市场宝座。这种逆周期的天量资本开支,为A股本土设备与材料标的铺就了极度深厚的业绩护城河。

A股/国内核心标的

2026年4月 产业异动与资本运作

底层技术穿透与产业格局演进

中微公司 

拟 15.76亿元 控股杭州众硅 64.69% 股权,获科创板简易重组首单受理

整合 12英寸 CMP 湿法设备,实现从等离子体“干法刻蚀”向“干法+湿法”全栈工艺的跨越,直击海外巨头腹地

摩尔线程 

Q1 营收 7.376亿元 (YoY +155%),单季净利 2936万元,历史性扭亏为盈

成功交付 6.6亿元 KUAE 智算集群,摆脱单一 GPU 销售,确立系统级 AI 算力底座的大规模商业化交付能力

胜科纳米 

拟定增不超过 12.06亿元,加码青岛、苏州、新加坡多地产能

顺应 3D 封装与 HBM 对晶圆级无损检测与极微小缺陷良率分析的苛刻需求,抢占半导体检测大模型制高点

中芯国际

披露2026行动方案,2025年月产能增至 106 万片,资本开支维持在 81 亿美元规模

深耕 BCD、模拟、MCU 及中高端 DDIC 平台,在成熟制程领域构建极具韧性的本土供应链防线

从A股市场的交易视角来看,中微公司对杭州众硅的并购整合,标志着国产设备商正式进入了通过外延式并购补齐先进制程全链条能力的2.0阶段;而摩尔线程在Q1实现155%的营收暴增与实质性盈利,似乎说明了国产GPU的“可用性”已经正式跨越了盈亏平衡点,迈入“好用且盈利”的商业化正循环。

终局论断:没有永远上涨的周期

芯片股的叙事离不开当前AI大跃迁的背景,也很容易让人联想起2000年初互联网泡沫期间的芯片股表现。虽然舆论视这次“超级周期”不同以往,但我们也应该看到,这一轮的半导体景气周期,本质是AI基建大发展带来的实质性需求的历史性提升,是HBM等高利润产品对低利润产能的挤占,但也如以往周期一样,掺杂了害怕错失(FOMO)情绪带来的超出实际需求的“多余”订单。
迈克尔·伯里的看跌期权,就是对华尔街在半导体板块60倍市盈率下“永恒短缺”观点预期的一次批判,是用真金白银来验证自己观点的批判。依据历史经验来看,第一次做空一般多是失败,所以伯里极其谨慎的将兑现日期设置在2027年,有足够的时间来印证判断是否正确。
当然,如果美股半导体板块真的往下走,以大A跟跌不跟涨的特性,A股相关板块估计很难独善其身。