OpenAI 发布了备受期待的搜索产品,ChatGPT 搜索,以挑战谷歌。业界已经为这一时刻准备了几个月,这促使谷歌在今年早些时候将 AI 生成的答案注入其核心产品,并在此过程中产生了一些尴尬的幻觉。这一失误让许多人相信 OpenAI 的搜索引擎将真正成为“谷歌大杀器”。
但在将 ChatGPT Search 作为我的默认搜索引擎(你也可以通过OpenAI 的扩展来实现)使用大约一天后,我很快又切换回了 Google。OpenAI 的搜索产品在某些方面令人印象深刻,并提供了对未来 AI 搜索界面可能样子的一个瞥见。但就目前而言,它仍然太不实用了,无法作为我日常使用的工具。
ChatGPT 搜索偶尔对实时问题的答案很有帮助,否则我需要通过许多广告和 SEO 优化的文章来寻找答案。与 Perplexity 和 You.com 等其他 AI 搜索工具一样,它以良好的格式呈现简洁的答案:你可以在右侧找到信息来源的链接;标题和简短的摘要让你快速核实 AI 生成文本的真实性。
这是 OpenAI 对谷歌搜索的回答。图片来源:Maxwell Zeff/OpenAI
然而,它在日常使用中常常感觉不切实际。
在目前的形式下,ChatGPT 搜索在用户最常使用 Google 的方面不可靠:短小的导航查询。少于四个单词的查询占据了 Google 搜索的大部分;这些通常只是几个关键词,可以让你找到正确的网页,通常是用户知道但不想麻烦输入的网页。这些是大多数人几乎没有意识到自己整天在进行的搜索,而这正是 Google 通常做得非常好的地方。
我说的是“凯尔特人得分”、“棉袜”、“图书馆开放时间”、“旧金山天气”、“我附近的咖啡馆”等其他查询,这些使谷歌成为数十亿人上网的前门。
我与 ChatGPT 搜索的测试运行有时相当令人沮丧,这让我意识到我一天中进行多少次关键词搜索。我无法通过简短的查询可靠地找到信息,几年以来,我第一次真的渴望使用谷歌搜索。
别误解我的意思:在过去十年左右,谷歌的质量下降了,主要是因为它被广告、搜索引擎优化和可疑的人工智能摘要淹没了。尽管如此,在我的测试中,我仍然在一个单独的窗口中打开谷歌,因为 ChatGPT 搜索无法给我正确的答案或网页。
谁会赢:ChatGPT 搜索还是短查询?
我输入了“Nuggets score”来查看丹佛掘金队和明尼苏达森林狼队之间的 NBA 直播比赛进展。ChatGPT 告诉我掘金队在领先,尽管他们实际上在落后,并且显示的森林狼得分比实际低了 10 分,按照当时的谷歌结果。
ChatGPT 搜索(左)和 Google 搜索(右)对实时 NBA 比分的比较。图片来源:Maxwell Zeff/OpenAI
另一个时候,我尝试了“今天的收益”,以查看可能影响周五股价的公司季度业绩报告。ChatGPT 告诉我,苹果和亚马逊将在周五发布业绩,尽管这两家公司实际上已经在前一天报告了业绩。换句话说,它产生了幻觉并编造了信息。
在另一个测试中,我输入了一位科技高管的名字以查找他们的联系信息。ChatGPT 给我展示了该人的 Facebook 个人资料摘要,并虚构了一个指向他们 LinkedIn 页面的链接,点击后出现了错误信息。
另一次,我输入了“宽松牛仔裤”,希望购物。ChatGPT 搜索首先向我描述了什么是宽松牛仔裤(我并不需要的定义),并推荐我去 Amazon.com 找一条好裤子。
ChatGPT 搜索“宽松牛仔裤”。图片来源:Maxwell Zeff/OpenAI
我可以继续,但你明白我的意思。断开的链接、幻觉和随机的答案定义了我使用 ChatGPT 搜索的第一天。
也许有一天会成为“谷歌大杀器”,但今天还不是
这对 OpenAI 来说并不是一次微不足道的发布。萨姆·阿尔特曼称赞这个功能“真的很好,”尽管他以低估自己创业公司 AI 能力而闻名。这次之所以不同,可能与搜索是互联网最大业务之一有关,而 OpenAI 的版本可能对其最大竞争对手谷歌构成真正威胁。
公平地说,Google 搜索是一个已有 25 年历史的产品,而 ChatGPT 搜索则是全新的。在一篇 博客文章 中,OpenAI 表示计划在未来几个月根据用户反馈改进该功能,这似乎很可能成为这家初创公司的一个重要投资领域。
ChatGPT 搜索对于较长的问题效果很好。图片来源:Maxwell Zeff/OpenAI
值得称赞的是,ChatGPT Search 在回答长篇书面研究问题方面相当出色。像“哪个美国职业体育联盟的多样性最高?”这样的问题,你不容易用谷歌回答,但 ChatGPT Search 在抓取多个网站并在短短几秒钟内给出一个不错的答案方面表现得相当不错。(Perplexity 在这些问题上也相当出色,其搜索产品已经存在超过一年。)
与已经可以访问网络的传统版本的 ChatGPT 相比,搜索功能感觉更像是浏览网络的更好界面。现在,ChatGPT 获取信息的来源有了更清晰的链接——对于新闻故事,ChatGPT 将利用它与达成所有这些许可协议的媒体公司。
问题是,大多数人在谷歌上的搜索并不是这样长的问题。要真正取代谷歌,OpenAI 需要改善人们在日常生活中已经进行的这些更实用的短搜索。
OpenAI 并不掩饰 ChatGPT 搜索在短查询方面的困难。
“通过 ChatGPT 搜索,我们观察到用户倾向于以比过去使用其他搜索工具时更自然的方式提问,”OpenAI 发言人尼科·费利克斯在发给 TechCrunch 的声明中表示。“与此同时,网络导航查询——通常较短,十分常见。我们计划随着时间的推移改善这些类型查询的体验。”
话虽如此,这些简短的关键词查询使谷歌变得不可或缺,直到 OpenAI 能够正确处理这些查询,谷歌仍将是许多人的主要选择。
有几个原因解释了为什么 OpenAI 可能在处理这些短查询时遇到困难。首先,ChatGPT 依赖于微软的必应搜索,而必应被广泛认为是一个不如谷歌的搜索引擎。
第二个原因是大型语言模型通常可能不太适合这些简短的提示。LLMs 通常需要完整写出的提问才能产生有效的答案,因为这有助于为它们创建强大的统计模式来完成:它并不知道搜索“棉袜”的人几乎都是在尝试购买,而不是了解这种服装的起源。也许需要进行一些重新提示——将简短查询通过LLM 作为更长的问题运行——才能让 ChatGPT 搜索能够很好地进行这样的搜索。
尽管 OpenAI 现在才发布其搜索产品,但 Perplexity 自己的 AI 搜索工具已经每周处理 1 亿个搜索查询。Perplexity 也被誉为“谷歌大杀器”,但它在短查询方面遇到了同样的问题。
阿拉文·斯里尼瓦斯,Perplexity 的首席执行官,在 TechCrunch Disrupt 上讨论了人们如何与 他的产品使用方式与 Google 搜索不同:“Google 查询的中位词数大约在两个到三个之间。而在 Perplexity 中,大约是 10 到 11 个词。因此,显然,Perplexity 的使用更多的是人们直接能够提出问题。另一方面,在 Google 上,你输入几个关键词以快速找到某个链接。”
我认为人们不使用这些产品进行网页导航这一事实比 OpenAI 或 Perplexity 所暗示的更为严重。这意味着 ChatGPT 搜索和 Perplexity 并没有取代 Google 搜索在其最擅长的任务上:网页导航。
相反,这些人工智能产品正在填补一个新的细分市场,揭示在传统搜索中被埋没的信息。别误解我的意思,这本身就是有价值的。