人工智能会取代浏览器吗?

图片

作者 | Om Malik
译者 | 王强
策划 | Tina

我对苹果的 Vision Pro 上瘾了。它是一款近乎完美的娱乐设备,是我理想的电视。当然,我希望它能更轻一些,也非常希望它的电池续航时间能更长。我希望它的 Siri 能更好用,这样当我问它我正在看什么时(比如,胡安·索托在道奇体育场打了多少个本垒打?),它应该能和洋基队比赛的视频源一起显示答案。单独去 Safari 查找这些信息真的很麻烦。

如果 Vision Pro 教会了我什么,那就是在专为沉浸式体验而设计的设备上,Safari 浏览器感觉格格不入。在 AR、VR 和语音控制系统越来越多地融入日常生活的世界里,浏览器的局限性变得非常明显。目前,Vision Pro 不可能离开我的生活,但如果浏览器离开了,我一点也不会介意。

对我们大多数人来说,很难想象没有互联网浏览器的生活。但随着人工智能将信息从文本、视频和音乐分解并组合成一条条人工智能聊天机器人的答案,我很清楚,在未来十年,浏览器将需要适应新的世界,否则就会消亡。

我用的第一个真正的互联网浏览器是 Lynx。我早在 1993 年就用它了,当时我刚刚注册了纽约的服务提供商 The Pipeline。它先于 Mosaic 推出,后者最终将浏览器的概念推广给了大众,并成为了互联网的垫脚石。从那时起,各种浏览器——Netscape、微软的 Internet Explorer、谷歌的 Chrome 和苹果的 Safari——都曾一度成为我生活的一部分。它们是互联网的主要门户,是访问和与开放互联网上的信息交互的通用工具。它们帮助塑造了我们消费信息的方式,并改变了多个行业。

回顾过去我们会发现,无论是 1994 年的 Mosaic 还是 2024 年的 Chrome,这些互联网浏览器的界面基本是一样的,几十年来大体保持不变,这多少有些不可思议。你可以输入网址(或快速搜索)来调出网页。你可以保存书签。你可以前进和后退。但正如“人工智能”的到来迫使技术栈中的一切(设备、操作系统、应用程序、云平台、网络甚至芯片)快速适应和发展一样,浏览器也必须重塑自我。它必须蜕皮、脱去旧皮,并为这个新世界脱胎换骨。

要了解浏览器为何正处于一个巨大转变的门槛上,就必须回到互联网的起源。如果你了解浏览器是为什么创建出来的,那么你就能理解它的发展轨迹和变革的必要性。1989 年,Time Berners-Lee 爵士在欧洲核子研究中心工作期间创建了万维网(WWW),以满足科学家、大学和其他机构之间对共享信息的简单平台的需求。互联网浏览器应运而生,让这一过程变得更加容易。因此,互联网浏览器最初是围绕文档设计的,这一前提至今未变。

大多数美国人第一次了解浏览器是从 John Markoff 的一篇文章中了解到的,当时他是《纽约时报》的一名技术作家。他的文章反映了一种对互联网力量充满希望、乐观和乌托邦式的想法,鼓励读者将浏览器视为“信息时代的宝藏地图”。

“我写这篇文章是因为 DEC 的 Brian Reid 告诉我,互联网的重要性在于,处于职业中期的计算机科学家将从中受益匪浅,因为他们可以快速与同事分享学术论文,”Markoff 在一封电子邮件中说道。“它与最初的想法相比并没有太大变化,尽管如今这些页面不再那么学术化,有了图片,并且经常用于流式传输视频。”

自从我看到 Humane 的 AIPin 的早期版本、Snap 的 AR 眼镜,以及听到苹果的 Vision Pro 的消息后,我就一直在怀疑浏览器的未来。就在两年多前,随着对用户友好的 ChatGPT 的问世,一切都水到渠成了。

我并不指望这些设备明年或后年就能称霸世界,但旅程已经开始了。而且已经很明显,许多新兴设备和我们迄今为止使用的这些计算机并不相像。首先,其中一些甚至没有屏幕或键盘。

其次,随着生成式人工智能的兴起,我们开始看到网页本身的原子化。这本身就破坏了互联网的原始前提以及迄今为止互联网的构建方式。如果没有文档可以连接,浏览器如何完成目前它做的那些工作?(比尔·格罗斯在今年早些时候与弗雷德的对话中也表达了类似的观点。)

更重要的是,在“AI”和“AGI”的炒作中被掩盖的一个事实是,这些创新带来的真正突破是大型语言模型和相关技术能够获取数据并创建逻辑流,生成文本、视频或音频内容。这是从“信息”角度来看的根本进步。即使是早期(和最近开发的)工具,如 NotebookLM(可以从文本创建音频),也为我们提供了未来的方向性视角。

例如,十年后(或更早),AppleNews 的客户可以要求它创建一个精选的早间新闻节目,其中包含来自预选来源和主题的信息,并让 AI 生成的播报员读给他们听,或者让他们在未来版本的 Vision Pro 或类似版本上观看内容。

这些都不是科幻小说——你现在就可以做几乎所有这些事情,尽管做得没那么好。随着时间的推移,这样的未来不仅会是一种可能性,它将成为我们的第二天性。因此,这将是互联网上信息生态系统迄今为止的运作方式会遭遇的重大变化。这些新技术使我们有机会对信息进行更加个性化、以对话为中心的控制。

当前的应用程序需要频繁的用户参与。我们必须有意识地跟踪一切。我们总是在拍照、记录信息和手动追踪卡路里、检查配料表,还有在购物时研究营养成分。未来的技术挑战不止是建立一个更好的食品数据库。新的技术应该做到无缝监控和干预,而无需用户不断输入。

在不久的将来,你可以想象一个非人类实体——我们称之为 DietBot——充当你的私人营养师和膳食计划员,而你几乎不需要付出任何努力。这个流行的 DietBot 可以实时分析你的饮食模式、健康目标和饮食限制,从而匹配餐馆或杂货店。它可以根据你的特定需求预先筛选选项,自动标记过敏原,建议更健康的替代品,并根据你当天的活动调整份量建议。

虽然浏览器无处不在,大家现在很难想象没有浏览器的生活,但事实是,我们人类过去不得不适应以文档为中心的互联网体验。我们被迫适应各种技术局限,而不是技术真正适应人类的需求。

整个互联网生态系统都是为了被大型平台货币化而存在的,而且——正如 Flipboard 创始人兼首席执行官 Mike McCue(曾在 Netscape 鼎盛时期工作)等人所说,它很好地实现了这一目的。

“自 90 年代中期以来,互联网和互联网浏览器一直专注于使用 HTML 和 HTTP 等开放标准连接和呈现内容,”他说。“几十年来,这种做法一直行之有效,并推动了亚马逊、Airbnb 等有着超级价值的互联网企业的崛起。”

McCue 认为,通过 ActivityPub 等协议与人工智能相结合,我们可以创造更加个性化、中介化的信息体验。虽然他认为 Claude 和 ChatGPT 等 AI 界面是一次重大转变,但他认为“你总是需要一些技术载体”。改变的是载体的使用方式。正如浏览器将自身委身为应用程序来适应移动优先的世界一样,个性化、交互式、以对话为中心的 AI 系统将迫使浏览器再次进化。

那么,这种进化会是什么样子呢?

The Browser Company 联合创始人 Josh Miller 正在开发“Arc”,这是一款面向 AI 优先时代的浏览器。他认为,过去浏览器的用户界面已经不再那么必要,但浏览器的内部结构将对我们的未来至关重要。“虽然大多数人认为我们正在构建的是浏览器,”Miller 在一次谈话中说,“但我们正在构建的是一个基于浏览器的系统。”

他希望将浏览器从单纯的查看器转变为类似操作系统的实体,在系统级别维护个人偏好和行为,让我们可以在不同设备中使用“AI”,而无需在应用程序级别重复我们的选择。他的新浏览器操作系统将从根本上理解用户的背景和偏好,从而更轻松地创建个性化体验。我们的使用模式和偏好将决定信息和服务呈现给我们的方式,而不是让应用程序来决定我们如何与信息交互。

Miller 认为,互联网浏览器的核心技术,尤其是那些开放且被广泛采用的标准技术,使浏览器能够快速发展,并适应未来我们将与多种设备交互的现实——不仅仅是台式机、笔记本电脑或手机。毕竟,可穿戴设备和无屏幕设备都需要浏览、检索和与信息交互,用的肯定不是我们熟悉的那种浏览器。

Miller 说,正如 iPhone 将自己定位为手机的再造一样,浏览器也将经历类似的转变。然而,转变“将是渐进的”,而浏览器的当前形式“实际上将成为这一转变的重要组成部分”,“几乎是将人们与未来联系起来并‘放松警惕’的一种方式”。

Miller 的乐观源于浏览器能够为手机变身的事实。我们的移动应用本质上都是带有包装器的浏览器,用于执行特定任务,使互联网更容易管理和个性化。下一次演进可能需要更多的扭曲。

随着 VR、AR、音频界面和聊天越来越成为我们——不仅仅是像我这样的 Vision Pro 爱好者,而是所有人——日常生活的核心,互联网浏览器的局限性会变得越来越明显。我毫不怀疑,浏览器的功能和工作方式的这种巨大变化将产生深远的影响。

声明:本文为 InfoQ 翻译,未经许可禁止转载。