客户端
游戏
无障碍

1

评论

7

8

手机看

微信扫一扫,随时随地看

对话Perplexity CEO:用AI重做搜索,我们学到了什么

AI划重点 · 全文约7992字,阅读需23分钟

1.Perplexity公司,一家成立仅三年的估值超过90亿美元的人工智能公司,正在用AI重新思考搜索的本质。

2.该公司联合创始人兼CEO Aravind Srinivas表示,他们的目标是重新定义整个搜索体验,从用户需求出发。

3.Perplexity的产品迭代和用户反馈成为公司发展的关键,同时注重技术开发和商业模式。

4.除此之外,Srinivas认为,与谷歌等竞争对手的竞争将推动公司不断进步。

5.未来,Perplexity将继续关注用户和产品细节,力求成为下一代谷歌式的搜索平台。

以上内容由腾讯混元大模型生成,仅供参考

(关注公众号设为🌟标,获取AI深度洞察)

Thumbplayer Poster Plugin Image
播放
下一个
打开循环播放
00:00
/
00:00
倍速
3.0X
2.0X
1.5X
1.25X
1.0X
0.75X
0.5X
语言
多音轨
AirPlay
0
静音播放中,点击 恢复音量
画中画
网页全屏
全屏
error-background
你可以 刷新 试试
视频信息
1.33.6
播放信息 上传日志
视频ID
VID
-
播放流水
Flowid
-
播放内核
Kernel
-
显示器信息
Res
-
帧数
-
缓冲健康度
-
网络活动
net
-
视频分辨率
-
编码
Codec
-
mystery
mystery
-

按住画面移动小窗

X
搜索,这个看似再普通不过的需求,却深深嵌入了我们的日常生活。无论是查资料、买东西,还是了解新闻,搜索引擎早已成为我们获取信息的第一入口。

但在 AI 时代,我们不禁要问:搜索真的只能是输入关键词、翻找链接这样吗? Perplexity 给出了他们的答案。这家成立仅三年就估值超过 90 亿美元的公司,正在用 AI 重新思考搜索的本质。不是简单地给搜索结果加个聊天机器人,而是从用户需求出发,重新定义整个搜索体验。

在这次对话中,Perplexity 的联合创始人兼 CEO Aravind Srinivas 分享了他们在这个过程中的思考和发现。从产品迭代到用户反馈,从技术选择到商业模式,让我们一起来看看,当 AI 遇上搜索,到底能激发出什么样的火花。


文稿整理

主持人David Lieb:  欢迎回到《如何构建未来》的另一集!今天我们很高兴邀请到 Perplexity 的联合创始人兼首席执行官 Aravind Srinivas。Perplexity 在不到三年的时间里,估值已超过 90 亿美元。感谢你加入我们!

嘉宾Aravind Srinivas: 谢谢你邀请我,David,很高兴来到这里。


AI 领域的经历

主持人: Aravind,在我们深入讨论之前,你能简单介绍一下你是如何进入 AI 世界的吗?你的早期经历是怎样的?

Aravind Srinivas: 当然。我一直对 AI 和深度学习研究很感兴趣。这其实是我来到美国的原因。我在印度读本科,后来到美国加州大学伯克利分校攻读博士学位。我的生活真正发生变化是在 OpenAI 实习的时候,当时 Ilya Sutskever 也在那里。我还记得第一次见到他的那天,我准备得很充分,带了很多自认为很有趣的想法。他听了五分钟后说:“这些研究都没用。”听到这话感觉真的很糟。不过我逐渐习惯了接受真实的反馈,哪怕这些反馈让人不舒服。后来他告诉我,唯一重要的东西是,他画了两个圆圈:一个大圆圈,他称之为“无监督学习”,里面还有一个小圆圈,他称之为“强化学习”。他说:“这就是 AGI(通用人工智能),其他研究都不重要。”那时候他们正在研发 GPT-1,不过当时还没叫它 GPT-1。我看到这些研究后回到伯克利,当时我一直在研究强化学习,因为 AlphaGo 和 DeepMind 的成功,那时候强化学习很火。但这有点像在追逐潮流。所以我回去找我的教授说:“嘿,我们得研究无监督学习和生成模型,研究生成式 AI。”于是我就进入了这个领域,后来还在谷歌做过更多实习。在谷歌实习期间,我偶然发现了一本书,叫《In the Plex》。白天我会启动训练任务,晚上就去图书馆读这些书,因为实习生没什么别的事可做,对吧?读到这些家伙曾经和我一样是研究生,现在我在他们的办公室里实习,还读着这本书,感觉很棒。我就想,将来要是能创立一家这样的公司就太好了,既有大量研究,又有很多 AI,同时还非常注重产品开发。这很难做到,我花了很多时间思考这个问题,甚至和 Ilya 聊过。我们谈到,可能只有两个问题能让你既研究 AI 又开发产品:一个是搜索,另一个是自动驾驶。因为你的产品每次推出都会变成改进底层 AI 的数据点,这会让产品变得更好,吸引更多用户,更多使用就会带来更多数据,形成一个飞轮效应。而且这还应该是在“AI 完整性”的路径上,这是个时髦词,意思是更好的 AI 应该不断让你的产品变得更好。这样你就可以一直致力于你的公司,直到 AI 问题被解决。一旦解决了,好的,我们再去担心那些重要的东西。但你的公司会随着 AI 的进步而变得更好,而不是被别人碾压。搜索就是这样的很好例子之一。

主持人: 所以你到了这样一个时刻,你意识到自己想创业。是什么让你下定决心放弃 OpenAI 的好工作去创业的?你是怎么找到你的联合创始人的?

Aravind Srinivas:  我读到了一篇博客,是前 YC 合伙人 Daniel Gross 写的,主题是如何打造下一个谷歌。核心观点是,通过更好的查询重构,你可以做很多事情。比如,你可以拿一个查询,添加一些后缀。如果有人想找电影评论,就加个“site:rottentomatoes.com”;如果有人想找新设备的评论,就加个对应的 subreddit 地址。你可以用这些后缀和特殊字符串来过滤结果,即便用现有的谷歌排名,也能让谷歌变得更好。我甚至还没说到广告的问题,只是单纯的排名。然后你可以做更复杂的事情,比如对查询进行分类。他提到大模型可以自动生成这些后缀,我对此很感兴趣。我觉得生成式 AI,或者说我当时叫它大模型,可能是一种更好的构建搜索引擎的方式。我还对开发类似智能体(agent)的东西很感兴趣。当时 DeepMind 开发了一个 Android 环境,想用智能体来原型化一个手机应用,让它知道什么时候用哪个应用并控制这些应用。那时我和我现在的联合创始人兼首席技术官 Dennis 聊过。他和我一天之差写了同一篇论文,所以我们认识。他当时是我们实验室的访问学生,我们经常讨论如何用智能体控制 Android 环境,头脑风暴了很多想法。虽然我们聊了很多,但从没具体谈到要创办公司或开发产品。别人会问的第一件事是:“为什么要做这个?谷歌肯定会做这个吧?”这不像去打造一个更好的 Google Docs,谷歌最终会去做,因为对他们来说这是次要的事情。所以像 Notion 这样的公司还能拿到投资,这是他们的核心竞争力。那你为什么要尝试呢?我觉得这有意义的原因,其实是我们推出产品后才意识到的,不是之前。所以无知有时候是福气。我们发现,如果人们不再点击链接,广告经济就会崩溃。当然这里有很多细节,但这个核心洞察是我们推出产品后才意识到的。所以当我们意识到这一点时,我就觉得我们找到了一些东西,这推动了我们过去两年的发展。


早期产品迭代

主持人:  带我们回顾一下你的第一次实验吧。我知道你做过很多演示,和现在的 Perplexity 很不一样。

Aravind Srinivas:  是的,所以我当时觉得这些就足够去向我们的第一位种子投资人 Elad Gil 推销了。我说:“嘿,我想颠覆谷歌,但我想从眼镜(硬件)开始。”我觉得那样你就不会直接和人们在搜索栏里输入的方式竞争,他们只是看到信息。那时你就知道自己想挑战谷歌吗?其实不是“我要干掉谷歌”那种动机,而是“什么样的想法有这样的规模和野心”。那时候多模态模型刚开始有点起色,所以我想如果技术继续进步,你可以打造出很棒的东西。我的投资人很正确地建议我一开始不要做这个,所以我们先专注于特定垂直领域、数据集或数据库表格的搜索。我们最初是面向企业的,但没人愿意给我们数据。我记得我费尽心思去联系 Bitbucket 或者 Crunchbase,想先做一个能让投资人觉得有意义的演示,这样我们就能继续融点资,雇些好人才,然后去做真正的事情。Crunchbase 有很多数据,但他们就是不愿意给我们。接下来最好的选择是 Twitter。那是马斯克接管前的 Twitter,学术访问是合法的。所以我们建了一个 Twitter 数据库,把它整理成表格形式,用 OpenAI 的 Codex 模型来做这件事。那时候还没有 GPT-3.5。我们写了很多模板,比如“这种查询对应这样的 SQL 示例”,然后模型会根据模板生成实际的 SQL。那是唯一能让它可靠工作的办法。如果出错,我们还有很多回调机制来自动纠正,然后去查询数据库并检索记录。效果很好,而且是个聊天界面,你可以对话,可以绘图。这是我们第一个真正的产品或演示。当时就我们三个人,只用了一个月就做出来了,因为初期的能量真的很惊人。我们展示给很多人看,他们都很喜欢。主要有两个原因:一是以前从没有这样的东西,到今天也是独一无二;二是人们很喜欢挖掘社交搜索,比如谁关注了谁,谁点了谁的赞,谁没点赞,谁这周取消关注了谁,这些差异都很有趣。

主持人:  所以你推出了这个 Twitter 搜索工具,后来是怎么过渡到我们现在熟知的 Perplexity 的?

Aravind Srinivas:  我们有了这个东西后,想对其他数据库做类似的事情,比如 GitHub,让程序员能搜索代码仓库;或者 LinkedIn,让你像招聘人员一样搜索,比如找出所有当过创始人且在初创公司工作过的人,因为他们知道如何脚踏实地。但用 LinkedIn 的界面做这个很难,出于各种原因,人们不愿意分享数据,或者有付费墙。如果这种技术存在,会创造更多价值,但因为很多原因它不存在。2022 年,GPT-3.5 turbo 出来之前,我们开始看到当时模型的能力已经很可靠,人们会用它并找到价值。我读到 Paul Graham 的一条推文,说当你试图解决一个更难的问题时,有时会找到一个更简单、更通用、更可扩展的解决方案。我们意识到,可以有两种方式:一种是针对每个领域构建索引,把数据整理成特定格式,比如表格,然后让大模型用结构化语言像 SQL 读取;另一种是保持数据非结构化,期待大模型在查询时做大部分工作,而不是在索引时做太多预处理。我们知道,如果第二种方式是未来的方向,随着模型越来越聪明,这种方式会有优势,因为它更通用。而且你还有机会对抗谷歌建立的传统系统,那更像是第一种方式。所以我们想试试构建一个更通用的解决方案。那周末我们就做了个原型。其实 OpenAI 的 John Schulman 团队已经发布了一个叫 Web GPT 的东西,我很了解。我在 OpenAI 时甚至有个叫“Truth Bot”的机器人,是 John 和他的团队一起做的。你可以问它问题,它会去网上搜索然后给你答案,还带一些来源。但它很慢,用的是 1750 亿参数的 GPT-3 模型,非常慢且效率低,更像是个强化学习智能体,会决定是否点击链接、浏览、滚动,太慢了。我们试了一个很简单但快得多的启发式版本:总是从搜索 API 取前 K 个链接,只用索引里已缓存的摘要片段,不滚动、不点击,把所有链接塞进提示词里,要求按照学术格式写摘要和来源,就这样。随着模型发展到 GPT-3.5 turbo 这种级别,指令遵循能力提升,这个方法开始效果好很多。你不用特别严格地操作也能行。

主持人: 所以你用了这种“笨办法”,赌的是 AI 会变得足够好,时机对了。一年前 John 和他的团队试的时候,模型还差很多,这种笨办法行不通,所以他们觉得需要更聪明的方法。但当模型变得更好,指令遵循能力提升后,笨办法反而管用了。这解决了产品用户体验中的一个核心问题:延迟。你习惯了传统搜索里链接瞬间出现。对了,即便如此,我们推出的第一个版本,也就是答案版,还是要 7 秒左右,因为我们还没引入流式答案的概念。我们得等到整个答案生成完,也没法控制答案的冗长,有时答案会很长。我们甚至在提示词里硬编码了“只写五句话”或“80 字以内”来保持速度。你是什么时候第一次觉得“哦,我找到了一些东西”的?

Aravind Srinivas:  我们发了个推文。我一边写推文一边想,人们可能会嘲笑它,会出错什么的。第一次病毒式传播是因为一个恼火的学术界人士搜索了自己,结果给出的传记是用过去时写的,她说:“我还活着,怎么回事?”其实是有个同名同姓的人去世了,模型以为是她,写了过去时。我觉得这个推理其实挺聪明的,就是没分辨出是不同的人。这件事让我们获得了很多关注,人们开始觉得“来源功能不错,但答案可信吗?”然后就有了个趋势,人们开始搜索自己。这种现象在消费品里经常发生。我后来跟 Mike Krieger 聊过,他也说同样的事:尽管你可以点击自己的头像去看照片,但人们总爱在 Instagram 的搜索栏里输入用户名去看自己的主页,这是人的习惯。所以很多人开始输入他们的 Twitter 账号或其他社交用户名,Perplexity 会整合他们在网上的所有活动,包括小时候的事,然后生成有趣的总结,他们会截图分享。我觉得这里面有东西,有什么在驱动它,但我还不确定。后来我们加了提问后续问题的功能,网站上的参与时间翻倍,每天的问题数和用户数呈指数增长。我就想:“好吧,这里有东西,不值得放弃去转向企业市场。”

主持人:  你提到过,直到事后回想,你才意识到“哦,我们其实有机会跟谷歌这样的对手竞争”。这个认识是在旅程的什么时候发生的?是怎么发生的?

Aravind Srinivas: 老实说,我从没认真想过跟谷歌竞争。因为我知道,他们不可能在谷歌首页做出完全一样的产品。很难判断一个查询是否纯粹是信息性的,谷歌搜索页面已经很杂乱了,有答案框、知识面板、广告、链接、社交视角卡片,太多了。感觉就像快餐和健康餐的区别,用谷歌和 Perplexity 做信息查询完全不同。一开始我更担心微软,因为他们推出了 Bing Chat。就在我们与一家风投机构达成投资协议的那天,经历了一周痛苦的融资路演后,我们正喝着咖啡放松,结果《Verge》(科技媒体)突然泄露了必应聊天机器人的截图。我想:“好吧,有 30 天的尽职调查期。”另一位向我提供投资协议的投资人把期限从30天延长到了45天,手段相当老练。我知道原因,他还发短信问我:“你觉得这个怎么样?”我就明白他的意思。另一位握手的投资人晚上给我发短信说:“明天有空聊吗?”我跟我联合创始人说:“他们可能会退出或让我们转向。”我甚至想也许该卖掉公司,觉得这不会有结果。但那位握手的投资人说:“我不会让你转向,也不会让你改做什么,你们继续干,承诺就是承诺。”我心想:“哇,真厉害。”下一周,谷歌也发了篇 Sundar 的博客,说他们要发布一个叫 Bard 的东西,还带截图。我们知道这会变得很大很激烈,但我们觉得,微软很久以来都不擅长消费品,他们浪费了机会。谷歌显然也有自己的问题。所以我觉得这里有空间给别人。

主持人: 我在谷歌待了快十年,看到谷歌早期的文化,比如 Larry 和 Sergey 的做事方式,在你打造产品的方式里也有很多影子。很注重细节,感觉你自己就是产品的首要用户。这是你故意为之的吗?

Aravind Srinivas: 是的,我确实有意这么做。Larry 说过一句话,我一直提醒公司里的每个人:“用户永远不会错。”比如今天测试新功能时,它没工作,但查询有点模糊。我跟工程师说:“这不好,他们还能做什么?”其实它应该主动澄清:“我不确定你想要这个还是那个,你想要哪个?”我再澄清,它再去做,而不是说“我不知道”。这就是“用户永远不会错”的原则。另一种设计产品的方式是让用户变成更好的提示工程师,责怪用户,教他们按产品想要的方式去做。企业软件更像第二种,但神奇的消费品更像第一种。谷歌为什么要处理拼写错误?他们自己需要。Larry 说自己拼写不好,真正的故事是 YC 合伙人 Paul Buchheit 很讨厌拼写问题,说:“得有人解决这个。”拼写检查、自动建议、缓存结果都在那儿。Larry 甚至想让首页模拟你家外面的天气,这样你都不用输入天气查询。我很受这种设计风格的影响,比如 Chrome 的搜索栏,你去过的网站只要输入前两个字母按回车就行。所以我确保我们的搜索栏光标随时就位,不用拿鼠标点。我看你最关心的指标是每天查询数,这跟谷歌早期一样吧?


团队管理文化

主持人: 是的,长期增长离不开留存。你不能光靠花钱买用户,装个应用自动提交一次查询。重复查询得自然发生。唯一的反例是产品没满足需求,用户得发一堆查询才能得到想要的,这跟 Larry 在谷歌的理念相反——你应该在谷歌上停留尽量短的时间,因为它要把你带到别处解决问题。我们不是这样。大多数后续查询跟第一个无关,用户只是想继续会话,或者问一些他们之前没想过的问题。所以我猜你的团队已经壮大很多,融了很多资。你怎么管理团队?每周或每个周期怎么运作?

Aravind Srinivas:  每天查询数是我们的首要指标,所以每次全员会议都从这个数字开始。我不信那种放个电视每天显示指标,太分散注意力。但每周看一下增长率、月增长率很有意义。如果下降了,就讨论原因,找出解决办法;如果增长了,就分析为什么,来自哪里。我们很数据驱动,全公司共享数据,我也试着跟用户分享,让他们觉得这是眼前的真实变化,想参与进来。没有层级,如果有 Bug,我知道谁在负责,就直接找那个人谈,没人会觉得被威胁。因为我一天能提 50 个 Bug,大家知道这对产品感觉好很重要。如果我们自己用着不好,用户也不会觉得好。我们更有动力用自己的产品,但用户的标准得更高,要一直把自己当用户。这种文化在公司里很强。

主持人: 我很喜欢这个。你招聘时是故意选这种关注产品细节的人吗?

Aravind Srinivas:  我没明确把这当标准,但我想找在意做好工作的人。如果只是当一份工作,很难对事情兴奋。我觉得很多是受创始人和公司文化影响,我是那种纠结细节的人,自然会想雇有同样特质的人。我确实会因为答案错了或者 Twitter 上有人说“Perplexity 变差了”而生气。有些不是真的,但我会抛开怀疑,哪怕是批评者,如果有真东西,我也想知道。

主持人: 我很喜欢看你在 Twitter 上跟用户互动。这是你跟用户交流的主要方式吗?还是有很多其他方式?

Aravind Srinivas: 我主要用 Twitter(X),那儿的人超级坦率。邮件里大家礼貌很多,我两种都喜欢,但那种直率的诚实能揪出最严重的 Bug 和不敢说的事。面对面最糟,你给人展示东西,他们只会说好话,哪怕讨厌。我不太喜欢问“你觉得怎样”,他们总会说好话。

主持人:  你公司会继续成长,可能得雇更多人。怎么避免变成一个大而慢的公司?

Aravind Srinivas: 其实已经有点开始了,我们没以前快。有些不是人的问题,而是生产中出问题,用户对产品失去信任。比如今天部署了个更新,有人报告前端有 Bug,其实是后端问题,但大家会随便猜。加载速度这些都很重要,不是每个新工程师都能完全了解代码库,早期的还能应付。快速行动和打破东西跟面向大众市场有点冲突,这是减慢我们的主要原因。我们还没找到最好的快速方法。我们有 staging、部署测试、AB 测试,这些自然会减慢推向生产的速度。另外,世界上那种极度注重细节的人就那么多,第 250 个工程师显然不可能都这样。但我尽力去给负责新功能的人提 Bug,哪怕公司到这规模,我还试着知道谁在做什么。我们联合创始人很棒,他们建团队时也在推这个原则。我们尽力对抗熵,这是唯一能做的,虽然是场硬仗,但得坚持。


AI搜索的未来

主持人: 好,我们聊聊未来吧。我看你最近的发布有些不同的方向,更垂直化或具体化,比如购物之类。你想把 Perplexity 带向哪里?现在我觉得它是个更聪明的谷歌搜索,在某些场景很有用。三年四年后,你希望我怎么看它?

Aravind Srinivas: 如果你研究买哪件毛衣最好,或哪个酒店最好,Perplexity 能给很棒的答案。但你去哪儿满足需求?去谷歌。谁拿钱上的功劳?谷歌。我们啥也没捞着,也许你买个高级订阅,但有人会用更便宜的模型免费提供,把我们挤掉,他们现金储备更多。挑战在于,你想成为一个端到端体验的地方,用户带着问题来,你给答案,还帮他们完成行动。这很难。如果答案是“贝索斯戴什么表?”——他好像戴欧米伽——我个人觉得要是不仅给答案,还带个具体欧米伽表的产品卡,点“买”就完事,太棒了。但有人会觉得这是广告,甚至觉得公司付钱让我们推。这就是早期喜欢无广告信息体验的用户,和大众市场日常实用性需求之间的矛盾。还有很多事,比如查比赛比分、快速打开网站、拿个 API 文档链接、订联合航空的机票,答案可以只是个链接,或明天天气、某人年龄。谷歌上输入“马斯克净资产”,不到一秒就有答案。Perplexity 可能会拉更准确的来源,但人们不关心小细节。你得建一个奇妙的组合:小模型、知识图谱、小部件、LLM 流式答案、多步推理答案。但用户不在乎什么时候用什么,你得用 AI 决定,没人讨论这个“路由器”或“编排者”。这可能是最难建的,谁能建好并服务十亿用户,还知道怎么很好地赚钱,就会是下一个谷歌。他们会有搜索栏,知道该干什么,会问澄清问题,真正理解用户,帮你做事,还让你按传统方式浏览网页,全合一体验。有人会说这太难,没人能建好。但谷歌现在的东西是最接近的,所以下一代肯定能建出来,你得坚持一二十年。

主持人: 如果我跟谷歌的人聊,他们会说:“对,我们就在建这个。”OpenAI 和 Anthropic 可能也一样。在未来十年你可能会遇到的竞争对手中,你觉得什么会给你优势?

Aravind Srinivas: 对用户的执着和优秀的产品品味。这些需要很多领域知识。你提到的名单里,谷歌是唯一有产品品味的公司,还有全球分发能力等等,除了困境。谷歌是搜索公司,但也是广告公司,搜索几乎是为广告服务的。你可以说广告之外还有每季近 2000 亿的收入,YouTube 和云服务有 1000 多亿,但利润都来自搜索。云服务最近才盈利,YouTube 利润不高,因为订阅用户没广告,还得付创作者和媒体伙伴。所以他们的股价会是负担,如果搜索收入下降,董事会会慌。在一个人们直接跟 AI 对话、智能体做事的世界,搜索收入得下降。他们也在建 Gemini 和新应用,但很难直接放进有十亿用户的谷歌首页。所以长远看,赢家得想出新赚钱模式、新商业模式。还有很多问题,比如购物、旅行用哪个商家,酒店怎么接进来,谁当中间人,谁处理预订和取消。谷歌也解决过这些,不只是 PageRank、MapReduce、深度学习或 Transformer,他们还做了 Google 金融、购物、航班这些“无聊”的工作。我觉得 Perplexity 比 OpenAI 和 Anthropic 更有优势,因为我们 DNA 里关心用户和产品,不只谈推理和模型。我们很熟悉最新开源模型,能自己服务、微调、后训练、评估。我们不会把带宽全花在建数据中心、芯片或刷推理、编码、数学benchmark。那些有价值,但跟建下一代信息体验有点脱节。

主持人: Aravind,非常感谢你加入我们,很高兴跟你聊。

Aravind Srinivas:  谢谢再次邀请我。


【往期回顾】

参考资料:https://www.youtube.com/watch?v=SP7Ua8FKZN4&t=38s

来源:官方媒体/网络新闻

编辑:深思

主编: 图灵

免责声明:本内容来自腾讯平台创作者,不代表腾讯新闻或腾讯网的观点和立场。
举报
评论 0文明上网理性发言,请遵守《新闻评论服务协议》
请先登录后发表评论~
查看全部0条评论
首页
刷新
反馈
顶部