马斯克的Macrohard不是玩笑:xAI工程师超长访谈首次揭秘真相,这是一个数字版的Optimus!

2021年,Elon Musk在推特上发了一条推文:"Macrohard >> Microsoft"。Macro对Micro,hard对soft,巨硬对微软,一个针对Bill Gates的文字游戏,一开始几乎没人当真。

四年后,2025年8月1日,xAI悄悄向美国专利商标局提交了Macrohard的商标申请。8月22日,Musk正式宣布:"Join @xAI and help build a purely AI software company called Macrohard. It's a tongue-in-cheek name, but the project is very real!"(加入xAI,帮我们建一家纯AI驱动的软件公司,叫Macrohard。名字是开玩笑的,但项目是真的!)

图片

12月30日,Musk宣布xAI购买的第三栋数据中心建筑命名为"MACROHARDRR"——三个R,加强语气。

从段子到商标注册到实体建筑,这就是Elon的风格。但Macrohard到底在做什么,外界几乎一无所知——直到2026年1月16日,YouTube频道Relentless发布了一期访谈"WTF is happening at xAI"。

受访者是Sulaiman Ghori,xAI的Member of Technical Staff(技术骨干)。他在牛津读过国际管理,创业做过AI产品,还搞过航天项目——加入xAI前不久,他刚在车库用乙醇和液氧点燃了一台自制火箭发动机,夹克被喷出的未燃尽燃料点着了火。这种人大概是Elon最喜欢的类型。

Sulaiman从公司约100人时期加入,亲历了Grok 3发布、Colossus数据中心从无到有,过去四个月一直在Macrohard的"war room"里工作。这期访谈时长超过一小时,是xAI内部工程师罕见的公开发声,也是Macrohard项目迄今最详细的内部视角。

1. 122天建成Colossus:嘉年华许可证和80台移动发电机

"我们没有截止日期,永远是昨天。"

Colossus是xAI位于田纳西州孟菲斯的超级计算机,目前是全球最大的AI训练集群。2024年9月正式运行时配备10万块Nvidia H100 GPU,92天后翻倍到20万块。截至2025年底,xAI又收购了第三栋建筑,总算力规模将达到近2GW(吉瓦),相当于150万户美国家庭一年的用电量。

行业标准流程需要18到24个月。xAI用了122天。

Sulaiman透露了几个外界不知道的细节。首先是土地问题。正常的数据中心建设需要漫长的规划审批,但xAI找到了一个漏洞——申请临时用地许可。这种许可本来是给嘉年华、马戏团这类临时活动用的,审批流程极短。

"我们的土地租约技术上是临时的,"Sulaiman说,"是最快能拿到许可的方式。所以我们现在技术上还是个嘉年华公司。"

然后是电力。孟菲斯当地电网接入只有8MW,远远不够。xAI的解决方案是拉来80多台移动柴油发电机,总功率超过400MW。但这带来一个新问题:当地电网负载升高时,整个数据中心需要无缝切换到发电机供电,同时不能中断任何正在进行的训练任务——而GPU的功耗以毫秒为单位在几兆瓦之间剧烈波动。

"发电机是物理旋转的东西,加速减速需要时间,"Sulaiman解释,"所以我们加装了电池组,Tesla Megapack。电池响应速度比发电机快得多,可以在毫秒级别平衡负载。"

整个电力系统形成了多层结构:本地电容器、数据中心侧电容器、电池组、发电机、最后才是市政电网。每一层都是为了应对不同时间尺度的功率波动。

这套基础设施后来还惹上了麻烦。美国环保署(EPA)认为xAI在没有许可证的情况下运行燃气轮机违反了规定,而xAI的立场是他们走的是临时设备的豁免条款。截至2026年1月,这场争议仍在继续。

但对xAI来说,先干再说的逻辑贯穿始终。"我们被告知建数据中心需要24个月,"xAI官网上写道,"所以我们自己动手,质疑一切,删除所有不必要的东西,四个月完成了目标。"

2. 新GPU上架当天就能训练:xAI的速度从何而来

122天建成Colossus已经够疯狂,但真正让这家公司与众不同的是软件层面的迭代速度。

"我们的模型迭代可以做到每天一次,有时候一天多次,"Sulaiman说,"这在业内几乎看不到。"

传统AI实验室的模型迭代周期以周计算,有时以月计算。原因很简单:训练基础设施的准备工作极其繁琐。新的GPU机架需要布线、配置、调试、集成到现有集群,然后才能开始训练。这个过程通常需要几天到几周。

xAI把这个时间压缩到了几小时,有时甚至当天。

"我们的超算团队消除了大部分典型的训练障碍,"Sulaiman说。"机架上电后,有时候当天就能开始训练,有时候只要几小时。"

这种速度带来的直接结果是实验数量的爆炸式增长。当别的实验室在等待基础设施就绪时,xAI可以同时并行运行20个以上的实验。更重要的是,他们可以在实验中快速试错、快速调整方向,而不是押注在单一路线上。

Sulaiman提到了一个具体的例子。xAI正在开发的一种新架构需要全新的预训练语料库和数据集,但在基础设施层面,他们有能力每天甚至每天多次推出新的模型迭代。"这是从预训练开始的,"他强调,"不是微调,是从头预训练。"

这种速度优势的来源是xAI最大的护城河。其他实验室在AWS或Oracle上租算力,容量就是上限;xAI自己建数据中心,自己定义上限。

3. Macrohard:数字世界的Optimus

访谈中最有信息差的部分来了。Musk公开宣布时只说Macrohard要做"纯AI软件公司",但具体怎么做、做什么,外界完全不知道。

Sulaiman揭开了谜底。Macrohard的核心逻辑可以用一句话概括:Optimus机器人要替代人类的物理任务,Macrohard要替代人类的数字任务。

但xAI选择的路径和其他AI实验室完全不同。他们不打算让企业改造软件来适配AI,而是让AI直接模拟人类操作电脑的方式——键盘输入、鼠标点击、看屏幕、做决策,完全复制人类的工作流程。

"任何软件都不需要改造,"Sulaiman说。"我们可以部署到任何人类目前能工作的场景。"

这个项目最关键的早期决策是速度。整个行业都在堆大模型、做更深的推理,xAI反其道行之,选择了小模型追求速度。目标是比人快至少1.5倍,实际进展已经达到8倍甚至更多。

"没人愿意等10分钟让电脑做自己5分钟就能完成的事,"Sulaiman解释逻辑,"但如果10秒就能搞定,用户愿意为此付任何价格。"

这和Tesla全自动驾驶(Full Self-Driving,简称FSD)的路径高度一致。Tesla也选择了更小、更快的模型,而不是堆叠参数追求推理深度。Elon曾公开表示,Tesla的AI5芯片在特定推理任务上比当前的AI4快40倍,同时功耗只有250瓦——这对Optimus机器人来说是生死攸关的指标,因为机器人的电池容量远小于汽车。

选择小模型还有个副产品:迭代周期大幅压缩。如果用大模型,训练周期可能是4周;小模型可以压缩到1周,实验数量可以并行到20个以上。这让xAI在技术路线的试错效率上远超同行。

但最让人意外的是部署方案。

"部署100万个人类模拟器需要100万台电脑,"Sulaiman说。"传统方案是租AWS或买Nvidia硬件,成本极高。"

答案来自Tesla。

北美有超过400万辆Tesla,其中一半以上配备了Hardware 4,这是Tesla为自动驾驶设计的车载计算芯片。这些车70%到80%的时间在充电或停着,自带网络、散热、供电。理论上,xAI可以付费租用车主的闲置算力,让车载电脑运行人类模拟器。

"这是纯软件实现,不需要任何基础设施建设,"Sulaiman说。"车主拿到租金,相当于车贷被付掉了;我们获得零基建的算力网络。"

如果这个方案落地,xAI从1000个虚拟员工扩展到100万个的边际成本几乎可以忽略不计

4. 虚拟员工已经在xAI内部运行

Macrohard听起来像是远期愿景,但Sulaiman透露,这套系统已经在xAI内部作为"虚拟员工"测试了。

"我们没有告诉公司里的人,"他说。"有时候有人在做什么事情,问某个'同事':'你能帮我一下吗?'虚拟员工说:'好啊,来我工位找我。'他们走过去,发现那里什么都没有。"

这种情况发生了不止一次。Sulaiman收到过消息问他:"组织架构图上这个人是你的下属吗?他今天不在吗?"不是不在,是根本不存在。

更有意思的是泛化能力。"就在今天,我们给Elon展示了几个案例,这些任务我们完全没有训练过,但它做得非常完美,比预期好很多,"Sulaiman说。

这和FSD的发展轨迹类似。Tesla的自动驾驶系统经常能正确应对训练数据中从未出现过的场景,比如从未见过的路障、非标准交通标志、异常天气条件。这种"泛化"能力是深度学习系统最难预测、也最有价值的特性。

xAI的Macrohard项目已经在内部运行了4个月的"war room"(作战室)模式。他们把原来的作战室挤满了,搬到了公司的健身房,把器械清空,全部换成工位。

"Elon有一次走进原来的作战室,发现空无一人,'人都去哪了?'然后走到健身房这边,开始他的即兴问答,"Sulaiman回忆。"那是个漫长的夜晚。"

5. 只有三层管理:xAI的组织方式

xAI的组织结构可以用三层概括:IC(Individual Contributor,个人贡献者)、联合创始人和新晋经理、Elon。没有中间层。

"我本来以为会有更多自上而下的指令,"Sulaiman说,"实际上比预期少很多。"

因为每个经理现在可能有100多人直接汇报,自上而下布置任务几乎不可能。大多数方案都是底层提出,上面点头或者给反馈,然后执行。

xAI的团队边界也是模糊的。如果Sulaiman需要修复VM(Virtual Machine,虚拟机)基础设施的问题,他可以直接改代码,给负责人看一眼,合并,部署。没有严格的权限边界,所有人默认被信任能做正确的事。

"这是我从没在任何规模相近的公司见过的,"他说。

iOS团队在推送某个大版本时只有3个人。"用户量和团队规模完全不成比例,但每个人都极其优秀。"

另一个例子是销售团队。Sulaiman入职第一周,和一个做企业销售的人坐在一起吃饭,本以为对方是销售背景,结果对方开始聊自己正在训练的模型。销售团队也是工程师。当时整个公司可能只有不到8个人不是工程师。

Elon在招聘讨论时反复强调一个词:engineers。不用区分AI researchers还是AI engineers,就是engineers——能解决问题的人。

"这保持了招聘的广度,"Sulaiman解释。"意味着人可以从非常不同的背景进来。SpaceX有很多这样的故事,有人从完全意想不到的领域加入,最后在工程上做出巨大贡献。"

6. 几乎不存在的文档系统

xAI几乎不写文档。

"事情变化太快,来不及写,"Sulaiman说。想了解某个系统,要么读代码,一路go to definition(跳转到函数定义)追下去,要么直接问人。所有人都在同一栋楼,走过去问就行。

他对此最惊讶的是:所有人都很愿意帮忙。

"我以为聪明人会很傲慢,但这里的人既聪明又友善。大家都在同一条船上,都在互相支持。"

目前xAI正在尝试用Grok自动生成文档。因为他们有无限访问自家AI的权限,可以尝试很多在外部公司成本过高的实验。"在创业公司,这种实验可能要花10万或100万美元的API调用费。我们免费做。"

7. 提案后的两种回应

在xAI提一个想法,得到的反应只有两种:"这很蠢",或者**"为什么还没做好?"**

"如果是后者,当天就可以实现,当天就能展示给Elon或任何人看,当天就有结论,"Sulaiman说。"没有等待,没有流程。"

"没有人对我说不。这是在这里工作最有趣的事情。如果我有好主意,当天就能实现。"

他以为从极小的创业公司跳到一个更大的组织会牺牲一些这种自由度。"xAI在我加入时有大概100人,对我来说已经是之前任何地方的10倍了。但它感觉还是很小。没有太多overhead(管理开销)。"

更让他意外的是,在xAI工作比自己单干还快。

"我本来以为自己做XYZ实验会更快,但在xAI通常更快,因为有一个团队已经把很多基础工作做好了,而且没有人说不。"

8. Elon的存在感:打电话就能让供应商第二天出补丁

Sulaiman描述了Elon在日常工作中的存在感。

新GPU上架后经常有兼容性问题。传统流程是和供应商来回沟通几周。在xAI的做法是:开会时把问题告诉Elon,他打一个电话,Nvidia的软件团队第二天就推送补丁,然后双方工程师并肩调试到问题解决。

"那种原本要拖几周的阻碍,一个电话就清除了。"

Elon的反馈很少落在中间层。高层面是产品方向,比如"只专注这个客户群"或"完全不要做这件事"。底层面是具体的计算效率或延迟问题,他会提出非常具体的尝试建议。

"但他愿意被证明是错的——前提是有实验数据,不是谁的观点。有时候实验结果出人意料,他就接受然后调整方向。"

Sulaiman还提到了一个关于Elon时间线预估的观察。

"他自己也在不断校准。现在他的预估准确得多了,而且更新频率更高,有时候每天都在根据新信息调整。"

早期的Elon以激进的时间线著称——SpaceX的火箭、Tesla的自动驾驶都经历过反复延期。但Sulaiman认为,经过这么多年部署大规模硬件的经验,Elon对时间的判断越来越精确。

"他确实部署过极大规模、极多种类的硬件,这让他的感觉越来越准。"

9. 24小时赢得一辆Cybertruck

访谈中有一个让人印象深刻的小故事。

xAI有个工程师叫Tyler,负责新GPU机架的部署。某天晚上,Elon说:"如果你能在24小时内让这些GPU开始训练,今晚就送你一辆Cybertruck。"

"那天晚上我们就开始训练了,"Sulaiman说。"他拿到了Cybertruck。现在还停在我们午餐窗户能看到的地方。"

这个故事听起来像硅谷传奇,但它反映的是xAI的运作逻辑:高强度、高回报、极短的反馈周期。

xAI内部算过一笔账:把公司估值除以代码库的commit(代码提交)次数,平均每次commit大约贡献250万美元价值

"我今天commit了5次,"Sulaiman开玩笑说,"相当于创造了1250万美元价值。轻松的一天。"

这个算法粗糙,但逻辑清晰:一个好工程师随手改几行代码的期望回报极高。所以公司愿意投入大量资源招聘,愿意用Cybertruck激励24小时冲刺,愿意容忍那么高强度的工作节奏。

Sulaiman有几周每周做20场以上的面试,短的15分钟,长的1小时技术面。

10. 招聘:寻找能找到10行解决方案的人

xAI的招聘标准很独特。

Macrohard要部署在跨越30到40年的各种硬件上,从30年前的老显示器到最新的5K Apple显示器,都要在同一套代码上跑。复杂方案会让代码库爆炸。AI写代码很乐意输出200行,但10行方案往往更好。

"我要找的是能一眼看穿简单解法的人,"Sulaiman说。

面试时他会给一个自己之前创业解决过的计算机视觉问题。解法其实非常简单,但大多数人会过度设计。他不会公开这个问题的细节,因为一旦公开就失去了筛选效果。

另一个技巧来自xAI联合创始人Igor Babuschkin。Igor曾是Google DeepMind的AlphaStar项目技术负责人——这个AI系统在2019年达到了《星际争霸II》的宗师级水平,是深度强化学习(Deep Reinforcement Learning)的里程碑成就。

Igor的面试技巧是在题目里故意埋入一个不可能的要求或者明显错误的条件,看候选人会不会回来质疑。如果闷头做完不吭声,不录用。

"我要的是会挑战需求、挑战我的人,"Sulaiman说。

(注:Igor Babuschkin于2025年8月离开xAI,创办了专注AI安全投资的Babuschkin Ventures。他在离职声明中提到,与Future of Life Institute创始人Max Tegmark的一次晚餐对他影响深远——Tegmark展示了两个儿子的照片,问他:"我们怎样才能让AI足够安全,让下一代人能在安全的环境中成长?")

11. 倒推思维:从收入目标到物理约束

xAI的规划逻辑永远是倒推。

"如果要在某个时间点达到100亿美元收入,最高杠杆的事情是什么?需要什么系统?然后才是物理和软件层面怎么实现,"Sulaiman解释。"物理需求是最后一步,不是起点。"

一个典型例子:Grok 4或5的规模和预期,在Grok 3时期就已经规划好了,比Sulaiman入职还早。因为团队足够可靠,长期规划的假设基本都能兑现。

"这让你可以更长远地思考,"他说。"你可以假设那些估算会被完成,因为每个人都很优秀、很可靠。"

反过来,当有人提出某个时间线的估算时,Elon会追问到底:这个估算基于什么假设?每个假设对时间线的影响有多大?哪些假设是人为的、可以被打破的?

"你花两分钟想一想,可能抱怨一下,然后剩下的时间全部用来在那个时间内完成它,"Sulaiman描述这个过程。"经常发现,原来估算的时间基于一些假设,而这些假设一旦被打破,时间线就可以缩短2倍。做几次这样的操作,你就能满足任何看起来不可能的要求。"

"当然,最终你会触及物理限制。但你从来不是从物理限制开始的。"

12. 数据中心的"surge"文化

SpaceX和Tesla历史上都有"surge"(冲刺)的传统——Elon会在某个关键时刻发出全员邮件,要求所有能来的人连夜工作。

xAI也有类似的文化,尤其是在大模型发布前后。

"对Macrohard来说,我们已经在war room里连续运作了4个月,"Sulaiman说。"所以我们一直处于那种push的状态。"

公司有睡眠舱(sleeping pods),后来又加了双层床。当那张著名的"帐篷照片"流出时——xAI员工在数据中心旁边搭帐篷——Sulaiman收到很多人转发给他。他的反应是:"确实有帐篷,但我从没见过那么多帐篷同时出现。"

xAI联合创始人Igor在离职前发过一条推文,大意是:**"有些月份只过了几天,有些夜晚却过了几个月。"**Sulaiman说那完全是真的。

"技术上的结果,我们可能几周内就能达到。但一个晚上做完是个巨大的push,那是个漫长的夜晚。"

13. 理解"什么是真相":Grokipedia的挑战

访谈后半段,主持人问到了一个敏感话题:如何让AI模型更"truthful"(追求真相)?

Elon多次公开批评维基百科存在偏见,xAI一直在探索创建某种替代版本。但Sulaiman坦言这是个极难的问题。

"互联网不是真相的来源,"他说。"我们尽可能追溯到基本原理——但什么是宪法的物理学基础?这不是一个任何人都能真正回答好的问题。"

他提到了一个参考:英国科普作家James Burke的《Connections》系列。Burke的方法是把两个看似毫无关联的概念,通过物理学和发明史连接起来。xAI在尝试类似的思路,但这几乎没有现成的文献可以依赖。

"数据不是唯一影响结果的因素,"Sulaiman说。"你怎么训练那些数据,怎么评估,怎么更新权重,这些都很重要。你可以试着忠实地复现输入输出,但那样你只是做了一个糟糕的复制粘贴机器。有一定的艺术成分在里面。"

当Elon在X上看到Grok输出了明显错误的内容,他会怎么做?

"他给我们看出了什么问题,然后当时醒着的人会开一个thread(讨论串)去解决,"Sulaiman说。"通常单独拉几个人进来,然后做一个事后复盘,说明发生了什么、怎么避免下次再犯。"

"犯一次错可以,犯同样的错两次是大问题。"

14. 13岁的3D打印创业和被烧着的夹克

访谈最后几分钟,主持人问到了Sulaiman的个人经历。

他在11岁时开始学编程,契机是发现可以靠给游戏写外挂脚本赚钱。他在网上找到一些做这个的人,学会了技术,开始在PayPal账户里看到零星的几百美元入账。

"那感觉太疯狂了。"

他用这笔钱买了一台RepRap 3D打印机的零件——那时候3D打印还没有成品机,只能自己组装。零件从中国寄来,他花了一整个通宵组装,结果解开电源铜线时一根铜丝扎进了拇指2英寸深。

"那是个上学日,凌晨3点,13岁的我不太会组装东西。我在浴室里花了一个小时用镊子拔,拔不出来,就剪掉了。接下来几周它慢慢长出来,我每天早上剪掉一点。"

打印机组装好后,正好赶上指尖陀螺(fidget spinner)热潮。他从中国买了1000个滑板轴承,每两小时清空一次打印床,喷漆,组装,然后跑到其他学校的公交站卖给"经销商"——其他学校的孩子。

"两个月后被学区叫停了。官方理由是给学校供餐的公司有在学校地产上的独家销售权。但我觉得他们只是不喜欢我分散大家注意力还赚钱。"

"这教会了我对权威保持一种健康的不敬。"

加入xAI之前不久,他在感恩节前一天决定:要么今晚把那台液体燃料火箭发动机点燃,要么两周后再做。他选择了当晚。

"我设计了远程点火系统,但给车载电脑供电的电源线还没到,只有一根6英尺的USB线,所以我必须站在旁边点火。"

火箭发动机使用乙醇和液态氧。喷射器设计不够完美,产生了过压,一些未燃尽的乙醇喷出来落在他夹克上,着火了。

"那件夹克现在还是战利品。"

Q1: xAI为什么能比其他AI实验室更快?

核心是自建基础设施。其他实验室受限于云服务商的容量,xAI自己建数据中心,从机架通电到训练开始最快只要几小时。这让模型迭代可以做到每天甚至一天多次,实验并行数量远超同行。组织层面只有三层管理,几乎没有文档和流程审批,团队边界模糊,所有人默认被信任可以改动任何代码。

Q2: Macrohard项目的核心逻辑是什么?

不改造企业软件,而是让AI直接模拟人类操作电脑的方式(键盘、鼠标、看屏幕)。关键决策是选择小模型追求速度而非大模型追求推理深度,目标是比人快8倍以上。部署可能利用Tesla车载电脑的闲置算力——北美400多万辆Tesla大部分时间闲置,自带算力、网络、散热、供电,可以付费租用车主的闲置时间。这套系统已经在xAI内部作为"虚拟员工"测试运行。

Q3: xAI的招聘和工作方式有什么特别之处?

寻找能找到简单解决方案的人,会在面试中故意埋入错误要求测试候选人是否敢于质疑。公司内部每次代码提交的期望价值约250万美元,所以愿意投入巨大资源招聘。工作强度极高,有睡眠舱和双层床,项目可以连续在"war room"模式下运作数月。但自由度也极高——提案后的反馈只有两种:"这很蠢""为什么还没做好",没有中间的流程和等待。