慢思考会是AI搜索的理想形态么?我们评测了下Kimi探索版和智谱AI搜索

作者袁博

来源AI先锋官


前几周,在OpenAI发布o1和o1 mini模型后,让大家都了解到了思维链和模型推理能力的价值。

这些技术在事实核查和复杂问题解决方面展现出巨大潜力。而在众多应用场景中,搜索无疑是离普通用户最近的需求之一。

这不,智谱和月之暗面都分别推出了自家可以基于模拟人类推理的AI搜索功能。
我们先来分别了解一下它们的功能,最后再来进行一些测试。

首先是月之暗面正式发布的可自主海量搜索解决复杂问题的Kimi探索版。

据Kimi介绍,Kimi 探索版的搜索量是普通版的10倍,一次搜索即可精读超过500个页面。

并且它还具备AI自主搜索能力,可以模拟人类的推理思考过程,多级分解复杂问题,执行深度搜索,并即时反思改进结果,提供更全面和准确的答案,帮助用户更高效地完成分析调研等复杂任务。

Kimi 探索版产品负责人表示,“如果 Kimi 搜不到的信息,那大概率用户也很难自己通过传统搜索引擎找到。未来搜索引擎会成为AI更擅长调用的工具,人只需要专注于提出好的问题,AI就可以结合模型本身的能力在庞大的互联网中自主海量搜索,不断反思迭代,更精准地定位所需答案。”

Kimi 探索版目前已逐步分批上线PC端,预计下周一前至全量用户。

已经获得资格的用户可以打开对话框左下角的“探索版”开关,或在对话框中输入“ / ”,即可以唤醒 Kimi 探索版。

图片


Kimi探索版目前每人每天可以使用5次。

除了网页版之外,Kimi智能助手的手机APP后续也将上线该功能。

接下来是智谱的AI搜索,它是以智能体的形式体现。

图片


他们新的AI搜索智能体,不仅可以一次性搜索和总结大量网页,更能像人类思考那样,进行多次搜索、推理与验证,努力把判断和整理的复杂过程贯穿其中,从而得出正确答案。

支持单次阅读超过100多个网页,这意味着,它可以在数秒内同时阅读并总结超过100个网页。

并且它还支持多级推理的思维链和联动智谱其他的AI工具,比如在联网搜索和多级推理中,能够调python等工具,综合解决问题。

是不是感觉很牛呢?

接下来小编就来一起测试一下他们俩。

第一个要搜索的问题:“今年诺贝尔物理学奖获得者,出生的那年世界发生了什么重大事件”。

Kimi探索版

图片

图片


先抛开答案对错,这里可以明显的看出Kimi探索版的变化,它首先将问题拆分为三步,它先搜索了2024年诺贝尔物理学奖获得者,再搜索了出生年份,最后是重大事件。

值得注意的是,它还会自我反思,重新阅读回答进行补充。

现在来看一看它的回答,它虽然回答对了获得者,但是它只回答了Geoffrey E. Hinton的出生年和事件。

在后来的反思补充中,它又将去年的诺贝尔物理学奖获得者提了出来,并只回答了其中一位的出生年和事件。

智谱AI搜索

图片

图片


可以看到它与Kimi探索版的步骤大差不差,同样是将问题拆分后逐步搜索回答,只不过在这个问题上它回答的要比Kimi探索版准确。

它找出了约翰·霍普菲尔德(John J. Hopfield)和杰弗里·辛顿(Geoffrey E. Hinton)两位的出生年份,并分别回答了这两个年份发生的事件。

第二个问题:“2024年《财富》中国科技50强企业中,哪些企业或集团的总部设在北京。”

Kimi探索版

图片


智谱AI搜索

图片


它们同样是分步搜索并解答,只不过Kimi探索版列出来6家,智谱AI搜索列出了5家,但实际上有10家。

值得注意的是,智谱AI搜索还列出了这5家公司的具体地址,好评!

最后一个问题:“东北雨姐塌房事件始末”。

Kimi探索版

图片


智谱AI搜索

图片


可以看到,智谱AI搜索要比Kimi探索版更具体,它将事情的完整过程全部罗列了出来,包括虚假宣传、打人事件、道歉与回应和现状与影响,而Kimi探索版只讲了虚假宣传方面问题。

它俩在搜索的同时还能阅读搜索到的内容,然后将答案直接呈现出来。

但它们又与其他传统模型如:海螺AI、文小言等有很大区别(详细内容:这个AI应用在我手机主屏上装了个悬浮球)。

它们不会快速给出答案,它们会像o1一样,先对问题进行逐步分析、搜索问题,像人一样思考后再给出答案,甚至会提出反思,重新阅读并进行补充。

当然,我们可能还是需要更长时间、更多提问才能发现Kimi探索版和智谱AI搜索的真正能力。

但不论如何,这些问题的解答,都需要建立在庞大数据检索量的前提上。

以前我们只能手动搜索或AI直接生成答案,但现在有了Kimi 探索版和智谱AI搜索就可以实现自主地海量搜索。

 .END.

往期文章回顾