月暗杨植麟,并没有回应一切

全文1817字,阅读约需6分钟,帮我划重点

划重点

01月之暗面创始人杨植麟表示,希望AI具备思考能力,以数学为基础。

02他宣布发布Kimi新一代数学推理模型k0-math,基准测试中,k0-math的数学能力可对标全球领先的OpenAI o1系列模型。

03然而,Kimi数学模型在简单问题上的表现仍有待提升,同时在生物、化学、物理等学科的泛化性上仍有不足。

04杨植麟表示,月之暗面将继续聚焦模型的思考能力,适当投放,平衡好思考和交互。

05他表示,不关注竞争本身,而是关注做正确的事情,给用户更大的价值。

以上内容由腾讯混元大模型生成,仅供参考

图片

出品|虎嗅商业消费组

作者|苗正卿、王欣

题图|虎嗅拍摄

1993年出生的杨植麟穿着一件黑色的月之暗面工装T恤、米白色工裤、带着黑色半框眼镜走进了月之暗面北京海淀知春路总部大楼的会议室。他面带微笑,但略显腼腆,笑的时候甚至会不经意地用手捂嘴。

此时是11月16日下午,距离Kimi Chat开放恰好一周年。在过去一周,月之暗面被复杂的舆论与情绪包裹环绕,但从杨植麟的神情上看,似乎外界的情绪对他影响并不大。

在稍坐几分钟后,杨植麟放下手中的咖啡,站了起来。相比于一年多前,他变得更幽默也“社牛”了许多,他跟大家寒暄了几句,还开了几个小玩笑。但很快,他恢复了原本那个“杨植麟”的样子:滔滔不绝地讲起技术和数学公式,眼神尽量躲避着与人接触,而是兴奋地盯着屏幕上的代码与数字。

“我们希望AI去探索,接下来最重要的方向是让AI具备思考的能力。什么能让模型锻炼模型的思考能力呢?我觉得是数学。”杨植麟说。

紧接着,他讲到了伽利略,谈到了伽利略的观点“宇宙的底层语言是数学”,然后亮出他今天第一张牌:他宣布发布Kimi新一代数学推理模型 k0-math。在基准测试中,k0-math 的数学能力可对标全球领先的 OpenAI o1 系列可公开使用的两个模型:o1-mini和o1-preview。

在接下来大约20分钟的时间里,31岁的杨植麟几乎化身为一个“高中老师”,他在现场用大量高考数学题目演示kimi数学模型的“思考能力”。他是那样兴奋,以至于一度在近十分钟的时间里杨植麟目不转睛盯着桌面电脑、不看众人、沉迷讲题——像是北大数学天才韦神附体。

“目前,IMO题目和高考难题,有一定的概率会做错。但模型成长很快,去年这些题目正确率20%多,今年已经有90%多。这个最新的数学模型,估计未来一两周就会上线。”杨植麟说。值得注意的是,局限依然存在,kimi数学模型也会因为过度思考,而在简单问题上花费多余的步骤,同时在生物、化学、物理等学科的泛化性上仍然有待提升。

终于,在沉浸式体验30多分钟的“数学老师角色”后,杨植麟从中抽离,然后他回顾了过去一年:“我们去年也是这一天发布的产品,当时从1个用户开始,现在总用户数超过3600万。”在说完这些后,杨植麟如释重负,狠喝了一口水。

不过人们对于杨植麟的好奇,并不局限于他最新的模型。只是他在这次与媒体的交流中,并没有回应一切。

以下是11月16日下午在月之暗面总部,杨植麟交流实录:

今年什么时候决定聚焦Kimi,去缩减其他产品的?是什么原因做出这个决定?

杨植麟 :今年2~3月份,我做了这个决定。一个是基于美国市场的判断,一个是基于我们自己的观察。我们决定必须要做减法,而不是做加法。我会选择聚焦。以及,我会观察海外的情况,然后去判断哪些业务上限最高,接下来思考哪些业务最匹配我们的能力,基于此做聚焦,去把核心的创新能力做好。(虎嗅注:据虎嗅了解,此前月之暗面发力的ToC类出海产品 Ohai 和 Noisee,都已经出现了业务调整,或缩减合并到kimi本身,或进行项目裁撤

最近你们有人才流失吗?如何看待行业内AI创业公司被收购、人才回流大厂?

杨植麟:我们没有遇到人才流失,月暗也没有出现人才回流大厂的情况。在几个大模型公司里,其实我们做的还好,我们一直保持人数最少,保持人和卡的比例保持健康。我们的规模保持在一个合理的状态,不希望公司人数涨得很猛。对AI行业而言,堆规模在一开始或许管用,但从长远看应该意义不大。所以应该聚焦,不要活生生做成大厂模式。比如说,如果我现在依然三个业务一起做,那我就活生生把自己做成了一个大厂,那我肯定没有任何优势。

今年最核心的任务是什么?

杨植麟: 用户留存。这是最关键的任务指标,它和你的技术成熟度有正相关,我们还有提升空间。现在模型的思考能力还不够强,这些能力提高后,用户留存会继续上升。

留存提高到多少,符合你的预期?

杨植麟:永无止境。

今年Kimi好像投放动作比较大?你们的投流策略是什么?

杨植麟:对我们而言最核心的是把留存做好,适当的投放是需要的,但平衡需要做好。

思考和交互哪个最重要?多模态是必要的么?

杨植麟:思考比交互更重要,思考是必要条件,之后才是交互。我觉得思考是当下大模型需要解决的第一要务。我们的多模态在内测,但多模态的前提是模型的思考能力

你怎么看待超级应用?

杨植麟:已经出现了。ChatGPT其实已经是了,它有5亿用户。就算说它不是一个超级应用,起码可以算半个吧?起码说明ChatGPT这个模式是被验证可以做成的。但相比之下,character.ai这种产品,一开始用户量很多,但最后发现是很难破圈的。这些海外发生的事情,都是我们的关键参照。

如何看待豆包今年猛烈的增长

杨植麟:我们不关注竞争本身,竞争本身并不产生价值。我们聚焦模型的思考能力、推理能力,去解决怎么给用户更大的价值。我觉得关键是去做正确的事情,而不是去思考做差异或者为了竞争单独做什么。

正在改变与想要改变世界的人,都在 虎嗅APP