+关注

手机看

微信扫一扫，随时随地看

对话Perplexity CEO：用AI重做搜索，我们学到了什么

AI深度研究员

2025-02-24 07:30发布于上海

+关注

AI划重点 · 全文约7992字，阅读需23分钟

1.Perplexity公司，一家成立仅三年的估值超过90亿美元的人工智能公司，正在用AI重新思考搜索的本质。

2.该公司联合创始人兼CEO Aravind Srinivas表示，他们的目标是重新定义整个搜索体验，从用户需求出发。

3.Perplexity的产品迭代和用户反馈成为公司发展的关键，同时注重技术开发和商业模式。

4.除此之外，Srinivas认为，与谷歌等竞争对手的竞争将推动公司不断进步。

5.未来，Perplexity将继续关注用户和产品细节，力求成为下一代谷歌式的搜索平台。

以上内容由腾讯混元大模型生成，仅供参考

（关注公众号设为🌟标，获取AI深度洞察）

00:00

倍速

3.0X

2.0X

1.5X

1.25X

1.0X

0.75X

0.5X

语言

多音轨

静音播放中，点击恢复音量

你可以刷新试试

视频信息

1.33.6

播放信息上传日志

视频ID

VID

播放流水

Flowid

播放内核

Kernel

显示器信息

Res

帧数

缓冲健康度

网络活动

net

视频分辨率

编码

Codec

mystery

按住画面移动小窗

搜索，这个看似再普通不过的需求，却深深嵌入了我们的日常生活。无论是查资料、买东西，还是了解新闻，搜索引擎早已成为我们获取信息的第一入口。

但在 AI 时代，我们不禁要问：搜索真的只能是输入关键词、翻找链接这样吗？ Perplexity 给出了他们的答案。这家成立仅三年就估值超过 90 亿美元的公司，正在用 AI 重新思考搜索的本质。不是简单地给搜索结果加个聊天机器人，而是从用户需求出发，重新定义整个搜索体验。

在这次对话中，Perplexity 的联合创始人兼 CEO Aravind Srinivas 分享了他们在这个过程中的思考和发现。从产品迭代到用户反馈，从技术选择到商业模式，让我们一起来看看，当 AI 遇上搜索，到底能激发出什么样的火花。

文稿整理

主持人David Lieb： 欢迎回到《如何构建未来》的另一集！今天我们很高兴邀请到 Perplexity 的联合创始人兼首席执行官 Aravind Srinivas。Perplexity 在不到三年的时间里，估值已超过 90 亿美元。感谢你加入我们！

嘉宾Aravind Srinivas: 谢谢你邀请我，David，很高兴来到这里。

AI 领域的经历

主持人: Aravind，在我们深入讨论之前，你能简单介绍一下你是如何进入 AI 世界的吗？你的早期经历是怎样的？

Aravind Srinivas: 当然。我一直对 AI 和深度学习研究很感兴趣。这其实是我来到美国的原因。我在印度读本科，后来到美国加州大学伯克利分校攻读博士学位。我的生活真正发生变化是在 OpenAI 实习的时候，当时 Ilya Sutskever 也在那里。我还记得第一次见到他的那天，我准备得很充分，带了很多自认为很有趣的想法。他听了五分钟后说：“这些研究都没用。”听到这话感觉真的很糟。不过我逐渐习惯了接受真实的反馈，哪怕这些反馈让人不舒服。后来他告诉我，唯一重要的东西是，他画了两个圆圈：一个大圆圈，他称之为“无监督学习”，里面还有一个小圆圈，他称之为“强化学习”。他说：“这就是 AGI（通用人工智能），其他研究都不重要。”那时候他们正在研发 GPT-1，不过当时还没叫它 GPT-1。我看到这些研究后回到伯克利，当时我一直在研究强化学习，因为 AlphaGo 和 DeepMind 的成功，那时候强化学习很火。但这有点像在追逐潮流。所以我回去找我的教授说：“嘿，我们得研究无监督学习和生成模型，研究生成式 AI。”于是我就进入了这个领域，后来还在谷歌做过更多实习。在谷歌实习期间，我偶然发现了一本书，叫《In the Plex》。白天我会启动训练任务，晚上就去图书馆读这些书，因为实习生没什么别的事可做，对吧？读到这些家伙曾经和我一样是研究生，现在我在他们的办公室里实习，还读着这本书，感觉很棒。我就想，将来要是能创立一家这样的公司就太好了，既有大量研究，又有很多 AI，同时还非常注重产品开发。这很难做到，我花了很多时间思考这个问题，甚至和 Ilya 聊过。我们谈到，可能只有两个问题能让你既研究 AI 又开发产品：一个是搜索，另一个是自动驾驶。因为你的产品每次推出都会变成改进底层 AI 的数据点，这会让产品变得更好，吸引更多用户，更多使用就会带来更多数据，形成一个飞轮效应。而且这还应该是在“AI 完整性”的路径上，这是个时髦词，意思是更好的 AI 应该不断让你的产品变得更好。这样你就可以一直致力于你的公司，直到 AI 问题被解决。一旦解决了，好的，我们再去担心那些重要的东西。但你的公司会随着 AI 的进步而变得更好，而不是被别人碾压。搜索就是这样的很好例子之一。

主持人: 所以你到了这样一个时刻，你意识到自己想创业。是什么让你下定决心放弃 OpenAI 的好工作去创业的？你是怎么找到你的联合创始人的？

Aravind Srinivas: 我读到了一篇博客，是前 YC 合伙人 Daniel Gross 写的，主题是如何打造下一个谷歌。核心观点是，通过更好的查询重构，你可以做很多事情。比如，你可以拿一个查询，添加一些后缀。如果有人想找电影评论，就加个“site:rottentomatoes.com”；如果有人想找新设备的评论，就加个对应的 subreddit 地址。你可以用这些后缀和特殊字符串来过滤结果，即便用现有的谷歌排名，也能让谷歌变得更好。我甚至还没说到广告的问题，只是单纯的排名。然后你可以做更复杂的事情，比如对查询进行分类。他提到大模型可以自动生成这些后缀，我对此很感兴趣。我觉得生成式 AI，或者说我当时叫它大模型，可能是一种更好的构建搜索引擎的方式。我还对开发类似智能体（agent）的东西很感兴趣。当时 DeepMind 开发了一个 Android 环境，想用智能体来原型化一个手机应用，让它知道什么时候用哪个应用并控制这些应用。那时我和我现在的联合创始人兼首席技术官 Dennis 聊过。他和我一天之差写了同一篇论文，所以我们认识。他当时是我们实验室的访问学生，我们经常讨论如何用智能体控制 Android 环境，头脑风暴了很多想法。虽然我们聊了很多，但从没具体谈到要创办公司或开发产品。别人会问的第一件事是：“为什么要做这个？谷歌肯定会做这个吧？”这不像去打造一个更好的 Google Docs，谷歌最终会去做，因为对他们来说这是次要的事情。所以像 Notion 这样的公司还能拿到投资，这是他们的核心竞争力。那你为什么要尝试呢？我觉得这有意义的原因，其实是我们推出产品后才意识到的，不是之前。所以无知有时候是福气。我们发现，如果人们不再点击链接，广告经济就会崩溃。当然这里有很多细节，但这个核心洞察是我们推出产品后才意识到的。所以当我们意识到这一点时，我就觉得我们找到了一些东西，这推动了我们过去两年的发展。

早期产品迭代

主持人: 带我们回顾一下你的第一次实验吧。我知道你做过很多演示，和现在的 Perplexity 很不一样。

Aravind Srinivas: 是的，所以我当时觉得这些就足够去向我们的第一位种子投资人 Elad Gil 推销了。我说：“嘿，我想颠覆谷歌，但我想从眼镜（硬件）开始。”我觉得那样你就不会直接和人们在搜索栏里输入的方式竞争，他们只是看到信息。那时你就知道自己想挑战谷歌吗？其实不是“我要干掉谷歌”那种动机，而是“什么样的想法有这样的规模和野心”。那时候多模态模型刚开始有点起色，所以我想如果技术继续进步，你可以打造出很棒的东西。我的投资人很正确地建议我一开始不要做这个，所以我们先专注于特定垂直领域、数据集或数据库表格的搜索。我们最初是面向企业的，但没人愿意给我们数据。我记得我费尽心思去联系 Bitbucket 或者 Crunchbase，想先做一个能让投资人觉得有意义的演示，这样我们就能继续融点资，雇些好人才，然后去做真正的事情。Crunchbase 有很多数据，但他们就是不愿意给我们。接下来最好的选择是 Twitter。那是马斯克接管前的 Twitter，学术访问是合法的。所以我们建了一个 Twitter 数据库，把它整理成表格形式，用 OpenAI 的 Codex 模型来做这件事。那时候还没有 GPT-3.5。我们写了很多模板，比如“这种查询对应这样的 SQL 示例”，然后模型会根据模板生成实际的 SQL。那是唯一能让它可靠工作的办法。如果出错，我们还有很多回调机制来自动纠正，然后去查询数据库并检索记录。效果很好，而且是个聊天界面，你可以对话，可以绘图。这是我们第一个真正的产品或演示。当时就我们三个人，只用了一个月就做出来了，因为初期的能量真的很惊人。我们展示给很多人看，他们都很喜欢。主要有两个原因：一是以前从没有这样的东西，到今天也是独一无二；二是人们很喜欢挖掘社交搜索，比如谁关注了谁，谁点了谁的赞，谁没点赞，谁这周取消关注了谁，这些差异都很有趣。

主持人: 所以你推出了这个 Twitter 搜索工具，后来是怎么过渡到我们现在熟知的 Perplexity 的？

Aravind Srinivas: 我们有了这个东西后，想对其他数据库做类似的事情，比如 GitHub，让程序员能搜索代码仓库；或者 LinkedIn，让你像招聘人员一样搜索，比如找出所有当过创始人且在初创公司工作过的人，因为他们知道如何脚踏实地。但用 LinkedIn 的界面做这个很难，出于各种原因，人们不愿意分享数据，或者有付费墙。如果这种技术存在，会创造更多价值，但因为很多原因它不存在。2022 年，GPT-3.5 turbo 出来之前，我们开始看到当时模型的能力已经很可靠，人们会用它并找到价值。我读到 Paul Graham 的一条推文，说当你试图解决一个更难的问题时，有时会找到一个更简单、更通用、更可扩展的解决方案。我们意识到，可以有两种方式：一种是针对每个领域构建索引，把数据整理成特定格式，比如表格，然后让大模型用结构化语言像 SQL 读取；另一种是保持数据非结构化，期待大模型在查询时做大部分工作，而不是在索引时做太多预处理。我们知道，如果第二种方式是未来的方向，随着模型越来越聪明，这种方式会有优势，因为它更通用。而且你还有机会对抗谷歌建立的传统系统，那更像是第一种方式。所以我们想试试构建一个更通用的解决方案。那周末我们就做了个原型。其实 OpenAI 的 John Schulman 团队已经发布了一个叫 Web GPT 的东西，我很了解。我在 OpenAI 时甚至有个叫“Truth Bot”的机器人，是 John 和他的团队一起做的。你可以问它问题，它会去网上搜索然后给你答案，还带一些来源。但它很慢，用的是 1750 亿参数的 GPT-3 模型，非常慢且效率低，更像是个强化学习智能体，会决定是否点击链接、浏览、滚动，太慢了。我们试了一个很简单但快得多的启发式版本：总是从搜索 API 取前 K 个链接，只用索引里已缓存的摘要片段，不滚动、不点击，把所有链接塞进提示词里，要求按照学术格式写摘要和来源，就这样。随着模型发展到 GPT-3.5 turbo 这种级别，指令遵循能力提升，这个方法开始效果好很多。你不用特别严格地操作也能行。

主持人: 所以你用了这种“笨办法”，赌的是 AI 会变得足够好，时机对了。一年前 John 和他的团队试的时候，模型还差很多，这种笨办法行不通，所以他们觉得需要更聪明的方法。但当模型变得更好，指令遵循能力提升后，笨办法反而管用了。这解决了产品用户体验中的一个核心问题：延迟。你习惯了传统搜索里链接瞬间出现。对了，即便如此，我们推出的第一个版本，也就是答案版，还是要 7 秒左右，因为我们还没引入流式答案的概念。我们得等到整个答案生成完，也没法控制答案的冗长，有时答案会很长。我们甚至在提示词里硬编码了“只写五句话”或“80 字以内”来保持速度。你是什么时候第一次觉得“哦，我找到了一些东西”的？

Aravind Srinivas: 我们发了个推文。我一边写推文一边想，人们可能会嘲笑它，会出错什么的。第一次病毒式传播是因为一个恼火的学术界人士搜索了自己，结果给出的传记是用过去时写的，她说：“我还活着，怎么回事？”其实是有个同名同姓的人去世了，模型以为是她，写了过去时。我觉得这个推理其实挺聪明的，就是没分辨出是不同的人。这件事让我们获得了很多关注，人们开始觉得“来源功能不错，但答案可信吗？”然后就有了个趋势，人们开始搜索自己。这种现象在消费品里经常发生。我后来跟 Mike Krieger 聊过，他也说同样的事：尽管你可以点击自己的头像去看照片，但人们总爱在 Instagram 的搜索栏里输入用户名去看自己的主页，这是人的习惯。所以很多人开始输入他们的 Twitter 账号或其他社交用户名，Perplexity 会整合他们在网上的所有活动，包括小时候的事，然后生成有趣的总结，他们会截图分享。我觉得这里面有东西，有什么在驱动它，但我还不确定。后来我们加了提问后续问题的功能，网站上的参与时间翻倍，每天的问题数和用户数呈指数增长。我就想：“好吧，这里有东西，不值得放弃去转向企业市场。”

主持人: 你提到过，直到事后回想，你才意识到“哦，我们其实有机会跟谷歌这样的对手竞争”。这个认识是在旅程的什么时候发生的？是怎么发生的？

Aravind Srinivas: 老实说，我从没认真想过跟谷歌竞争。因为我知道，他们不可能在谷歌首页做出完全一样的产品。很难判断一个查询是否纯粹是信息性的，谷歌搜索页面已经很杂乱了，有答案框、知识面板、广告、链接、社交视角卡片，太多了。感觉就像快餐和健康餐的区别，用谷歌和 Perplexity 做信息查询完全不同。一开始我更担心微软，因为他们推出了 Bing Chat。就在我们与一家风投机构达成投资协议的那天，经历了一周痛苦的融资路演后，我们正喝着咖啡放松，结果《Verge》（科技媒体）突然泄露了必应聊天机器人的截图。我想：“好吧，有 30 天的尽职调查期。”另一位向我提供投资协议的投资人把期限从30天延长到了45天，手段相当老练。我知道原因，他还发短信问我：“你觉得这个怎么样？”我就明白他的意思。另一位握手的投资人晚上给我发短信说：“明天有空聊吗？”我跟我联合创始人说：“他们可能会退出或让我们转向。”我甚至想也许该卖掉公司，觉得这不会有结果。但那位握手的投资人说：“我不会让你转向，也不会让你改做什么，你们继续干，承诺就是承诺。”我心想：“哇，真厉害。”下一周，谷歌也发了篇 Sundar 的博客，说他们要发布一个叫 Bard 的东西，还带截图。我们知道这会变得很大很激烈，但我们觉得，微软很久以来都不擅长消费品，他们浪费了机会。谷歌显然也有自己的问题。所以我觉得这里有空间给别人。

主持人: 我在谷歌待了快十年，看到谷歌早期的文化，比如 Larry 和 Sergey 的做事方式，在你打造产品的方式里也有很多影子。很注重细节，感觉你自己就是产品的首要用户。这是你故意为之的吗？

Aravind Srinivas: 是的，我确实有意这么做。Larry 说过一句话，我一直提醒公司里的每个人：“用户永远不会错。”比如今天测试新功能时，它没工作，但查询有点模糊。我跟工程师说：“这不好，他们还能做什么？”其实它应该主动澄清：“我不确定你想要这个还是那个，你想要哪个？”我再澄清，它再去做，而不是说“我不知道”。这就是“用户永远不会错”的原则。另一种设计产品的方式是让用户变成更好的提示工程师，责怪用户，教他们按产品想要的方式去做。企业软件更像第二种，但神奇的消费品更像第一种。谷歌为什么要处理拼写错误？他们自己需要。Larry 说自己拼写不好，真正的故事是 YC 合伙人 Paul Buchheit 很讨厌拼写问题，说：“得有人解决这个。”拼写检查、自动建议、缓存结果都在那儿。Larry 甚至想让首页模拟你家外面的天气，这样你都不用输入天气查询。我很受这种设计风格的影响，比如 Chrome 的搜索栏，你去过的网站只要输入前两个字母按回车就行。所以我确保我们的搜索栏光标随时就位，不用拿鼠标点。我看你最关心的指标是每天查询数，这跟谷歌早期一样吧？

团队管理文化

主持人: 是的，长期增长离不开留存。你不能光靠花钱买用户，装个应用自动提交一次查询。重复查询得自然发生。唯一的反例是产品没满足需求，用户得发一堆查询才能得到想要的，这跟 Larry 在谷歌的理念相反——你应该在谷歌上停留尽量短的时间，因为它要把你带到别处解决问题。我们不是这样。大多数后续查询跟第一个无关，用户只是想继续会话，或者问一些他们之前没想过的问题。所以我猜你的团队已经壮大很多，融了很多资。你怎么管理团队？每周或每个周期怎么运作？

Aravind Srinivas: 每天查询数是我们的首要指标，所以每次全员会议都从这个数字开始。我不信那种放个电视每天显示指标，太分散注意力。但每周看一下增长率、月增长率很有意义。如果下降了，就讨论原因，找出解决办法；如果增长了，就分析为什么，来自哪里。我们很数据驱动，全公司共享数据，我也试着跟用户分享，让他们觉得这是眼前的真实变化，想参与进来。没有层级，如果有 Bug，我知道谁在负责，就直接找那个人谈，没人会觉得被威胁。因为我一天能提 50 个 Bug，大家知道这对产品感觉好很重要。如果我们自己用着不好，用户也不会觉得好。我们更有动力用自己的产品，但用户的标准得更高，要一直把自己当用户。这种文化在公司里很强。

主持人: 我很喜欢这个。你招聘时是故意选这种关注产品细节的人吗？

Aravind Srinivas: 我没明确把这当标准，但我想找在意做好工作的人。如果只是当一份工作，很难对事情兴奋。我觉得很多是受创始人和公司文化影响，我是那种纠结细节的人，自然会想雇有同样特质的人。我确实会因为答案错了或者 Twitter 上有人说“Perplexity 变差了”而生气。有些不是真的，但我会抛开怀疑，哪怕是批评者，如果有真东西，我也想知道。

主持人: 我很喜欢看你在 Twitter 上跟用户互动。这是你跟用户交流的主要方式吗？还是有很多其他方式？

Aravind Srinivas: 我主要用 Twitter（X），那儿的人超级坦率。邮件里大家礼貌很多，我两种都喜欢，但那种直率的诚实能揪出最严重的 Bug 和不敢说的事。面对面最糟，你给人展示东西，他们只会说好话，哪怕讨厌。我不太喜欢问“你觉得怎样”，他们总会说好话。

主持人: 你公司会继续成长，可能得雇更多人。怎么避免变成一个大而慢的公司？

Aravind Srinivas: 其实已经有点开始了，我们没以前快。有些不是人的问题，而是生产中出问题，用户对产品失去信任。比如今天部署了个更新，有人报告前端有 Bug，其实是后端问题，但大家会随便猜。加载速度这些都很重要，不是每个新工程师都能完全了解代码库，早期的还能应付。快速行动和打破东西跟面向大众市场有点冲突，这是减慢我们的主要原因。我们还没找到最好的快速方法。我们有 staging、部署测试、AB 测试，这些自然会减慢推向生产的速度。另外，世界上那种极度注重细节的人就那么多，第 250 个工程师显然不可能都这样。但我尽力去给负责新功能的人提 Bug，哪怕公司到这规模，我还试着知道谁在做什么。我们联合创始人很棒，他们建团队时也在推这个原则。我们尽力对抗熵，这是唯一能做的，虽然是场硬仗，但得坚持。

AI搜索的未来

主持人: 好，我们聊聊未来吧。我看你最近的发布有些不同的方向，更垂直化或具体化，比如购物之类。你想把 Perplexity 带向哪里？现在我觉得它是个更聪明的谷歌搜索，在某些场景很有用。三年四年后，你希望我怎么看它？

Aravind Srinivas: 如果你研究买哪件毛衣最好，或哪个酒店最好，Perplexity 能给很棒的答案。但你去哪儿满足需求？去谷歌。谁拿钱上的功劳？谷歌。我们啥也没捞着，也许你买个高级订阅，但有人会用更便宜的模型免费提供，把我们挤掉，他们现金储备更多。挑战在于，你想成为一个端到端体验的地方，用户带着问题来，你给答案，还帮他们完成行动。这很难。如果答案是“贝索斯戴什么表？”——他好像戴欧米伽——我个人觉得要是不仅给答案，还带个具体欧米伽表的产品卡，点“买”就完事，太棒了。但有人会觉得这是广告，甚至觉得公司付钱让我们推。这就是早期喜欢无广告信息体验的用户，和大众市场日常实用性需求之间的矛盾。还有很多事，比如查比赛比分、快速打开网站、拿个 API 文档链接、订联合航空的机票，答案可以只是个链接，或明天天气、某人年龄。谷歌上输入“马斯克净资产”，不到一秒就有答案。Perplexity 可能会拉更准确的来源，但人们不关心小细节。你得建一个奇妙的组合：小模型、知识图谱、小部件、LLM 流式答案、多步推理答案。但用户不在乎什么时候用什么，你得用 AI 决定，没人讨论这个“路由器”或“编排者”。这可能是最难建的，谁能建好并服务十亿用户，还知道怎么很好地赚钱，就会是下一个谷歌。他们会有搜索栏，知道该干什么，会问澄清问题，真正理解用户，帮你做事，还让你按传统方式浏览网页，全合一体验。有人会说这太难，没人能建好。但谷歌现在的东西是最接近的，所以下一代肯定能建出来，你得坚持一二十年。

主持人: 如果我跟谷歌的人聊，他们会说：“对，我们就在建这个。”OpenAI 和 Anthropic 可能也一样。在未来十年你可能会遇到的竞争对手中，你觉得什么会给你优势？

Aravind Srinivas: 对用户的执着和优秀的产品品味。这些需要很多领域知识。你提到的名单里，谷歌是唯一有产品品味的公司，还有全球分发能力等等，除了困境。谷歌是搜索公司，但也是广告公司，搜索几乎是为广告服务的。你可以说广告之外还有每季近 2000 亿的收入，YouTube 和云服务有 1000 多亿，但利润都来自搜索。云服务最近才盈利，YouTube 利润不高，因为订阅用户没广告，还得付创作者和媒体伙伴。所以他们的股价会是负担，如果搜索收入下降，董事会会慌。在一个人们直接跟 AI 对话、智能体做事的世界，搜索收入得下降。他们也在建 Gemini 和新应用，但很难直接放进有十亿用户的谷歌首页。所以长远看，赢家得想出新赚钱模式、新商业模式。还有很多问题，比如购物、旅行用哪个商家，酒店怎么接进来，谁当中间人，谁处理预订和取消。谷歌也解决过这些，不只是 PageRank、MapReduce、深度学习或 Transformer，他们还做了 Google 金融、购物、航班这些“无聊”的工作。我觉得 Perplexity 比 OpenAI 和 Anthropic 更有优势，因为我们 DNA 里关心用户和产品，不只谈推理和模型。我们很熟悉最新开源模型，能自己服务、微调、后训练、评估。我们不会把带宽全花在建数据中心、芯片或刷推理、编码、数学benchmark。那些有价值，但跟建下一代信息体验有点脱节。

主持人: Aravind，非常感谢你加入我们，很高兴跟你聊。

Aravind Srinivas: 谢谢再次邀请我。

【往期回顾】

参考资料：https://www.youtube.com/watch?v=SP7Ua8FKZN4&t=38s

来源：官方媒体/网络新闻

编辑：深思

主编: 图灵

免责声明：本内容来自腾讯平台创作者，不代表腾讯新闻或腾讯网的观点和立场。