扎克伯格143亿豪赌“数据炼油厂”,但也给大家提了个醒
前哨王煜全
2025-06-17 06:40
发布于北京
海银资本创始合伙人 科技领域创作者
本期要点:为什么值300亿?
你好,我是王煜全,这里是王煜全要闻评论。
6月11日,Meta宣布将斥资约143亿美元现金,收购Scale AI公司49%的股权。年仅28岁的Scale AI创始人兼CEO亚历山大·王(Alexandr Wang)也同时加入Meta,领导一个新成立的“超级智能实验室(Super Intelligence Lab)”。
Scale AI创始人兼CEO亚历山大·王
这笔交易金额之高,引发行业震动。
要知道,Scale AI去年估值仅为138亿美元,营收约8.7亿美元,尚未盈利,销售和利润增速也低于预期,而如今收购后估值已跃升至约300亿美元。
而且,Scale AI并不进行AI大模型开发,而是为AI模型提供高质量训练数据。不过,客户几乎囊括了所有顶级AI玩家,包括OpenAI、Google以及各大自动驾驶公司。这家公司虽然低调,但在AI产业链中扮演着关键角色。
创始人亚历山大·王的背景同样值得一提。2016年,19岁的他从麻省理工学院辍学创立Scale AI,并成为了美国最年轻的白手起家亿万富翁之一。
当然,他真正被大家所知,是因为2025年初
Deepseek
横空出世时,他曾公开呼吁美国政府加强对中国的芯片限制,一石激起千层浪。
回到此次事件本身,我们认为,Meta对Scale AI的巨额投资,反映出AI领域竞争的重点可能已经转移到了对于高质量数据的掌控上。
在AI的发展过程中,掌握数据生成和标注的能力,等同于拥有了AI时代的“炼油厂”,掌握了训练顶尖AI模型的关键资源。
不只是“劳务外包”
首先,大家要注意的是,此次交易,Meta买的是数据的生产线。
通常认为数据标注是一项缺乏技术含量的工作。但自2016年以来,Scale AI在数据合成、人工标注到模型反馈优化等方面积累了丰富的技术经验,使其成为AI产业链中不可或缺的一部分。市面上大部分的AI模型训练都与Scale AI有关联。
过去几年AI大模型领域的竞争似乎是算力和参数规模的比拼。但OpenAI的GPT模型之所以领先,是因为它依赖于大量经过人工精心标注的数据进行微调,并通过人类反馈强化学习来调整模型输出。
目前,数据枯竭已成为所有大型AI模型公司面临的主要挑战之一。AI的进步不能再单纯依靠互联网上的既有数据,而是需要开拓新的细分市场,甚至利用合成数据。
如今,AI大模型已经有趋同的趋势,数据质量与反馈能力更加成为了新的决胜点。因此,Scale AI的价值确实就进一步得到了体现。
它们所提供的不仅是“劳动外包”, 还建立了一套完整的数据处理和质量保证体系。最近,他们推出的名为“Generative AI Data Engine”的数据引擎,实现了文本、图像、视频、音频乃至3D点云数据高精度标注的自动化,也使Scale AI更加成为了重要的基础设施。
重要的是“炼油厂”
同时,更重要的是,我认为,Meta收购Scale AI反映了一个趋势:在AI领域,“炼油厂”的作用正变得越发关键。
三个月前,马斯克通过xAI收购了X平台。表面上看是左手倒右手的操作,但这也表明,在AI时代谁才是主导者。
众所周知,Meta拥有Facebook、Instagram和WhatsApp等多个社交媒体平台,用户量全球领先。每天,这些平台会产生数亿条图片和视频内容,以及数千亿条文本交互数据,成为了Meta的巨大“数据油田”。
可是,Meta的开源大模型Llama,表现却一直不如OpenAI和Anthropic的闭源大模型。
最近几个月,就在大家在推理大模型上你追我赶时,Meta却像个没啥存在感的“小透明”,不仅新的Llama 4没能掀起什么水花,开源生态还被后起之秀DeepSeek给引领了。
其中一个很关键的原因就在于,Meta没能有效利用自己的数据。他们所拥有的大量数据是非结构化的,而他们缺乏低成本的数据标注手段,难以释放这些数据的价值。
要知道,专业数据的标注价格还很高,若Meta对自己的万亿级数据进行高质量标注,或将至少需要百亿美元级投入。
此时,收购了Scale AI,Meta就拥有了属于自己的“炼油厂”。他们原始的、非结构化的数据,就像是“原油”,现在可以提炼成“高标号汽油”,也就是转化为高质量的训练集,供AI模型训练使用。
最后,我还想强调,Meta愿意拿出143亿美元收购Scale AI的股份,还体现了一个科技巨头的收购逻辑——对于战略基础设施的高度重视。
今年3月,谷歌的母公司Alphabet以创纪录的320亿美元收购云安全初创公司
Wiz
,令所有人咋舌。
Wiz作为一家以色列云安全独角兽,确实具有一定的技术领先性。据悉,该公司可在72小时内完成对全网多云环境的漏洞扫描,而传统方式需要2到3周时间。
可是,320亿美元的价格仍然让人疑惑——一家成立仅5年的公司,真的值这么多钱吗?
但也许在谷歌的角度看,收购Wiz有助于补齐其在云安全方面的短板。考虑到云安全可能是客户选择云服务商时的一票否决项,谷歌也自然愿意支付高价。
同样道理,Meta投资Scale AI也是对战略基础设施的重要布局。通过掌控数据标注和训练资源,提升自身的AI竞争力。
未来,我们或许会看到Meta在AI大模型方面的提升。此外,Meta还可以将用户行为数据与内容结合,优化广告推荐系统,从而提高广告点击率,切实提升Meta的收入利润。那么,他们当然愿意付出远超市场预期的代价,与Scale AI深度绑定。
Meta的这笔交易也在提醒所有企业,重新审视自身的数据资产。也许那些看似不起眼的非结构化数据,经过“精炼”处理,也能成为训练专业模型、提升原有业务的重要资源。
所以,你不妨也思考一下,你所在行业的“油田”在哪?可以怎么挖掘和提炼这些“原油”?欢迎在评论区分享你的看法。