马斯克开源了!X 平台(原 Twitter)核心推荐算法全开源!AI 说了算,零人工规则!

马斯克麾下的 X 平台(就是以前的 Twitter),真把自家吃饭的家伙给公开了:核心推荐算法的完整生产系统代码,直接挂在了 GitHub 上

图片

不是什么 demo 版,是跟 X 服务器现在跑的版本能对上的真东西,这在主流社交平台里,头一遭。

“流量分发逻辑”全部开源

这次开源的不是零散代码,是整套 “为你推荐”(For You)信息流的核心系统 —— 从内容哪里来、怎么筛、怎么打分排序,全给你看明白

而且有个关键背景:这套算法跟 xAI 的 Grok 模型用的是同个 Transformer 架构,相当于把 AI 驱动推荐的 “底层逻辑” 直接摊在阳光下。

图片

马斯克之前放话 “7 天内开源”,这次不仅没跳票,还补了个狠承诺:以后每 4 周更新一次代码,保证跟 X 服务器上跑的版本同步

换句话说,用户、开发者想盯着算法怎么变,直接看 GitHub 就行,不用再猜 “为啥我刷到的全是同类内容”。

更有意思的是马斯克自己的态度,平时桀骜不驯的主儿,这次罕见认了 “我们知道这算法很笨拙,还得大幅改”—— 但至少把 “怎么改、改了啥” 的过程透明化,这点比藏着掖着的 “算法黑箱” 实在多了。

100% AI 驱动,没有人工规则的 “端到端” 逻辑

以前很多平台的推荐,还得靠产品经理写一堆规则:比如 “关注的人发的内容优先”“点赞多的排前面”,但 X 这次直接把这些全砍了 

零人工设计特征,零主要人为规则,全靠 AI 自己学

咱用大白话拆拆它的工作流程,核心就靠四个组件协同,最后靠 Grok 系模型定生死:

  1. Home Mixer,总指挥相当于算法的 “中枢”,负责把所有环节串起来 —— 先拿用户的 “互动历史”(点赞、回复、转发过啥)和 “用户特征”(关注列表、偏好),再去拉内容、筛内容、算分数,最后出结果。

  2. 内容从哪来?两个池子

    • 「Thunder」:管 “熟人内容”,就是你关注的账号发的帖子,存在内存里,查起来比数据库快,毫秒级就能拿到;
    • 「Phoenix」:管 “陌生内容”,从全球帖子库里靠 AI 捞 —— 用 “双塔模型” 把用户和帖子都转成 embedding(向量),靠 dot product 算相似度,挑出你可能感兴趣的 “非关注内容”。
  3. 怎么打分?

  4. AI 预测你会不会 “动手指”核心是 Phoenix 的 Transformer 模型,不搞虚的 “relevance 分”,直接预测你对每个帖子的 14 种行为概率:比如点不点赞(P (favorite))、回不回复(P (reply))、会不会拉黑(P (block_author))。

  5. 最后算 “加权分”:正面行为(点赞、转发)加权重,负面行为(拉黑、举报)减权重,分数越高,排得越前。还加了个 “作者多样性” 规则 —— 同一个人的帖子不会连续刷,避免被单一账号 “霸屏”。

  6. 最后筛一遍,剔除垃圾和违规先在打分前删一遍:重复内容、太旧的帖子、你自己发的、被你拉黑的作者内容,全清掉;

  7. 排完序再筛一遍:删 spam、暴力血腥这些违规内容,确保最后推给你的是 “安全且高分” 的内容。

这事儿的行业意义:捅破了 “算法黑箱” 的窗户纸

以前主流社交平台的推荐算法,都是 “黑箱”—— 用户不知道为啥刷到某条内容,开发者想优化也没头绪,甚至监管都难下手。

X 这次直接把 “核心流量分发逻辑” 开源,相当于做了个 “标杆”:

  • 对用户:终于能看懂 “我的 feed 是怎么来的”,不用再猜 “算法是不是针对我”;
  • 对行业:倒逼其他平台提升算法透明度 —— 比如之前抖音、小红书搞的 “茧房评估”,但跟 X 这种 “全开源核心代码” 比,还是差了个量级。

当然,马斯克也不是纯 “公益”—— 开源能拉开发者帮着优化算法,还能绑定 xAI 的 Grok 生态,顺便化解监管对 “算法不透明” 的压力。但不管怎么说,这步棋确实把 “社交平台推荐算法” 的透明度往前推了一大步。

图片

最后说句实在的:这算法现在还 “笨拙”,马斯克自己也认了,但至少它把 “怎么工作” 的底牌亮了出来。

以后每 4 周更新一次,咱能看着它怎么改 —— 这种 “透明化迭代”,比藏着掖着的 “完美黑箱”,靠谱多了。感兴趣的朋友,直接去 GitHub 扒代码看,真能摸清社交平台 “喂你内容” 的底层逻辑。

项目地址:

https://github.com/xai-org/x-algorithm