深度丨AI 原生应用的定义、生态图谱,与五维评估框架

全文11876字,阅读约需34分钟,帮我划重点

划重点

01AI原生应用市场呈现出强劲的增长势头,目前已有47个应用产生2500万美元以上的年度经常性收入。

02设计、数据、领域专业知识、动态个性化和分发是评估AI原生应用的关键维度。

03企业软件在用户体验方面仍有改进空间,AI原生应用有望改善当前状况。

04与此同时,AI原生应用的分发模式尚未建立,未来可能会包括应用和Agent的混合。

以上内容由腾讯混元大模型生成,仅供参考

图片

在过去的两年里,风险投资圈,以及广泛的技术生态中,关于 AI 原生应用的发展前景展开了深入讨论。我们目睹了技术价值从底层基础设施,逐步向平台和应用层转移的趋势,看到了对 AI Agent 演进的强烈关注,以及关于各个垂直领域 AI 应用发展的众多深入研究。
然而,如何定义 AI 原生公司的?以及企业软件格局将如何演变?这类问题探索得还比较少。换句话说,什么是真正的“AI 原生”应用?以及在未来几年,这类公司会面临哪些竞争影响呢?🤔
这是我们直接解决这些问题的尝试,融合了来自实地调查以及基于新兴市场趋势的前瞻性见解。我们的结论来自广泛的研究、实际的产品测试和演示、与初创企业创始人的直接合作,以及最重要的是,与积极使用生成式人工智能进行构建的各种规模公司的产品和技术领导者进行的大量深度讨论。
尽管当前对 GenAI 的浪潮和投资始于 2022 年 11 月的一个应用,即ChatGPT,但应用层总体上落后于整个技术栈的其他部分。许多对生成式人工智能持批判的人指出,缺乏杀手级应用(Killer App,行业黑话,简而言之就是很牛逼的消费者都愿意买单的产品),以此来证明这项技术被过度炒作了。然而,越来越多的证据表明,应用层正在开始迎头赶上。
图片
2024 年对生成式 AI 原生应用的资金投入大幅增加,到 10 月底达到 85 亿美元,与过去两年相比,在生成式 AI 总体投资中占据了更大份额。在过去几个月里,我们看到了 Perplexity(5 亿美元)、Poolside(5 亿美元)、Magic(3.2 亿美元)、Sierra(1.75 亿美元)、Abridge(2.5 亿美元)、Glean(2.6 亿美元)、Writer(2 亿美元)和 EvenUp(1.35 亿美元)等宣布的重大融资轮次。
尽管投资规模能够反映市场的热情,但真正的证据在于其市场欢迎程度(traction)——而在这一点上,势头明显不容置疑。在过去几个月里,越来越多的 AI 原生应用开始显示出显著的营收增长势头。
据我们统计,目前市场上至少有 47 个 AI 原生应用产生了 2500 万美元以上的 ARR(年度经常性收入),而年初只有 34 个。我们相信,到明年这个时候,我们可能会看到同等数量的应用产生超过 5000 万美元的 ARR。在代码辅助、客户支持和市场营销等领域的早期成功,正在扩展到新的功能和垂直场景。初创企业和现有企业都在继续发布振奋人心的 AI 原生产品。简而言之,在我们看来,如今的 AI 原生应用生态比一年前甚至一个季度前要强大得多。
图片
图片

定义 AI 原生应用

在我们的经验中,“AI 原生应用”意味着 AI 是应用体验的核心,而不仅仅是一个辅助功能。虽然这个术语被广泛使用,但它的定义——就像 AI 领域的很多概念一样,是模糊且不断发展的。通过我们广泛的研究以及与 Canva、Glean、Meta、Runway、Figma、Abridge 等公司的开发者交流,我们得出了一个我们认为更具描述性和细微差别的定义。

⚡️ AI 原生应用建立在基础的 AI 能力之上,例如从大型数据集中学习、理解上下文或生成新颖的输出。

⚡️ AI 原生应用产生的结果打破了速度、规模和成本的传统限制,开启了全新的可能性。

⚡️ AI 原生应用旨在通过利用底层模型的进步,以及通过使用真实世界数据改进性能的反馈循环机制来不断改进。

⚡️ AI 原生应用涉及一些专有的 AI 技术部分,而不是完全的现成的能力(例如,对开源模型进行微调以改进特定功能、模型编排等)。

图片
图片
AI-Native 并不意味着应用必须从生成式 AI 能力开始。就像本地部署的一些软件成功过渡到其产品的云原生版本(例如,Adobe Photoshop、Microsoft Office)一样,我们相信许多公司随着时间的推移会从云原生演变为 AI 原生。

AI 原生:一个不断演变的格局的临时标签

在我们进入本文的核心之前,还有最后一点。
“AI 原生”一词,在今天而言是一个大家都在讲的分类标签,但它将是一个暂时的概念。就像我们现在很少再说“互联网原生”“云原生”或“移动原生”一样,随着 AI 成为市场上几乎每一种产品和服务的核心组成部分,“AI”这个标签也将逐渐消失。在早期阶段,我们使用这个词来区分某些公司。时光流转,无论是 AI 原生还是转型 AI 的公司,这种界限终将模糊,真正决定胜负的,是企业将 AI 根植于产品与组织构建之中的深度。
即使在一个更加 AI 原生的世界里,价值创造的根本驱动因素也不会改变。公司必须深入了解客户的痛点,并打造满足甚至超越客户需求的产品和服务。强大的企业家必须组建优秀的团队并坚持不懈地执行落地。AI,无论它变得多么先进,都只是服务于这些目标的工具,而不是像那句谚语中那样,手握锤子四处寻钉般,为了用 AI 而用 AI 一般做应用("if all you have is a hammer, everything looks like a nail",如果你手里只有一把锤子,看什么都像钉子,用来形容人容易用单一的方法去解决所有问题)

Everything we do must be anchored very heavily on the top jobs to be done, the top personas and the top pain points that we need to solve for our customers. Our customers are our main source of innovation.

一切工作的基石,必须是客户最重要的需求、最关键的角色定位,以及最迫切的痛点。我们的客户,就是我们创新的源泉。

——Glean 产品主管 Emrecan Dogan

图片

AI 原生应用评估框架

现在是时候讨论,未来事物可能会有哪些新的不同了。从今年年初开始,我们在 Sapphire 就使用了一个五维框架来具体评估那些用 AI 构建应用的公司。
图片
我们认为,鉴于企业软件内部的竞争强度已经在不断增加,再加上在 AI 辅助开发团队的时代,功能差异化的半衰期正在迅速缩短,企业将需要在这些维度中的几个方面使他们的应用程序有所区分,以建立持久的品类领导地位。
考虑到企业内部软件的竞争强度已经日益增强,再加上在 AI 辅助开发时代下,带来的功能差异化半衰期迅速缩短,公司需要让其应用在其中几个维度上有突出表现,以建立持久的该类目下领导地位。
让我们依次讨论每个方面✍️

1. 设计

企业软件已经发展成为一个价值数万亿美元的市场,每年有大量资金花费在能够提高运营效率和规模的解决方案上。然而,尽管有这样的增长,以用户为中心的设计长期以来一直被忽视,常常会为了功能而牺牲交互设计。经典的是,软件体验充斥着无尽的设置、复杂的菜单和频繁的通知——功能丰富,但体验极差。我们相信这种情况即将改变,设计将成为下一代企业软件的关键差异化因素。生成式 AI 已经在开拓设计空间,我们正在密切关注这项技术将如何使开发者能够:

创建新的交互模式

在过去的两年中,聊天和搜索界面一直是生成式 AI 用户交互的主要形式,但当下提供了新机会——通过基于文本的 AI 伙伴进行提问、总结和脑暴等其他场景。生成式 AI 原生应用,将允许用户更自然地与其应用交互,同时还提供对以前仅限于高级用户的高级功能的访问。
许多企业工具充满了强大的功能,但大多数用户很少使用这些功能,原因要么是他们不知道这些功能的存在,要么是不知道如何有效地使用它们。通过使用自然语言来表达他们的需求,用户可以解锁更多这些现有的产品功能。
多模态生成式 AI 模型最近正在追赶基于文本的同类模型,这为开发者重新思考用户如何使用软件创造了更多机会。性能更高的语音和视频模型提供了新的方式来创建、捕获和转换输入和输出,与点击和打字输入形成互补。OpenAI 最近发布的 Canvas 版本以及 Anthropic 带有 Compute Use 的版本,尽管还非常初级,但都指向了从聊天机器人到共同创作的画布,以及从 co-pilots 到 auto-pilots 潜在的演变方向。

Multi-modality is extremely important, not only for delivering rich and varied outputs, but because the inputs and how we interact with these tools will continue to evolve. Models and tools that are flexible, expressive and have the ability to understand and generate across a variety of modalities are going to be incredibly important as we look to the future and as the technology continues to improve.

多模态极其重要,不仅是为了提供丰富的输出,而且因为输入,以及我们与这些工具交互的方式将不断发展。当我们展望未来和技术不断改进时,灵活、富有表现力并能够理解和生成各种模态的模型和工具将变得非常重要。

——Runway

加速反馈循环

生成式 AI 的非确定性输出,为其在生产环境中的部署带来了挑战。在模型层面,RLHF基于人类反馈的强化学习在更好地将 AI 与人类意图对齐,以及加速迭代改进方面起到了关键作用。正在构建生成式 AI 应用的公司,既在借鉴这些训练技术,又在探索收集用户反馈的新方法,以更好地调优性能并加速产品功能开发。
在与产品负责人的交流中,我们听到了多种反馈方式的例子:从传统的“赞/踩”和星级评分,到人工审核,更有趣的是,还包括许多创新的用户参与度监测方法,用于收集用户意图的数据信息。这些方法包括:内容分享次数、用户悬停时间,用户互动频率,以及复制和粘贴的行为。
我们相信,能够以无干扰的方式,智能地将用户反馈集成到用户体验中的产品,将更快地迭代并改进其性能,以便随着时间的推移更好地满足用户需求。

开发原生 AI 系统

我们与原生 AI 应用公司交流后得到的最重要收获之一,是他们在应用设计中具有复杂的系统级思维。这包括,在现成的商用 AI 组件与构建针对特定场景优化性能的专有能力之间取得平衡。还涉及在模型层使用多种基础技术(例如微调、RAG、提示工程)的组合以及相关集成技术方法,以实现最佳的性价比。许多原生 AI 应用在用户界面层的设计优雅性掩盖了大量的后端复杂性。

The acumen associated with building an AI system is not which model you use, it’s breaking down the task, going deep into the application, taking it to its constituent parts and asking which parts do we not have to build because an open-source model can do it, which are we uniquely positioned to fine-tune, which are more subjective…you have to earn the right to be proprietary.
构建AI系统的智慧不在于选用哪个模型,而在于如何分解任务,深入应用场景,将其拆解为基础组件,并思考:哪些部分可以直接用开源模型解决而无需自建,哪些部分我们具有独特优势可以进行微调,哪些部分可以更加主观... 专有技术的权利,需要靠实力赢得。

——CTO at Abridge  Abridge

在设计原生 AI 系统时,另一个关键是将可解释性整合到流程的多个步骤中。随着我们从一个专注于行动和协助的时代,过渡到一个以答案和 Agent 为重点的时代,解释 AI 如何代表用户工作以建立信任并确保一致性变得至关重要。AI 原生应用必须明确地将输入与输出联系起来,引用特定的内容片段,在适当的时候置信区间(一个统计学概念,相当于提供了一个范围能更真实地表达预测的不确定性),并为需要询问系统性能的用户提供更深入的解释。
我们所看到的一些更有趣的 AI 原生应用设计,其中包括:
⚡️ Perplexity.ai 和 OpenAI 的 ChatGPT Search 通过整合相关网页链接和引用,增强了生成的响应内容质量。
⚡️ Hebbia 和Reliant AI 采用表格式交互界面,让用户能够在更精确、细致的与输出内容交互,从而与模型建立强大的反馈循环。
⚡️ Cognition 提供了一个原生代码编辑器,用户可以在生成的输出旁边直接使用,根据的生成的代码来优化模型。
⚡️ Rilla 和 Bland.ai 使用多模态 AI 来重塑销售流程。Rilla 分析客户对话以改进训练(语音转文本),而 Bland.ai 使用易于训练的 Agent(文本转语音)来实现销售和支持电话的自动化。

2. 数据

我们都清楚数据对于训练基础模型有多重要,这些基础模型是过去两年来所有 AI 产品和服务的核心。我们认为,在应用层,数据的重要性可能更高,因为它能帮助将各种模态下的基础功能转化为针对性的、具有竞争优势的产品,从而满足客户需求。当我们审视企业在 AI 原生应用中如何利用数据时,我们关注到他们已经找到切实可行的方法:

提高端到端的数据管理的严谨性

“没有数据战略就没有AI战略”这话听来老套,却是真知灼见。AI 原生应用固然能从基础模型公司的全球数据整合中受益,也能借力于客户数据资产的现代化升级,但通过出色的数据管理实践,依然能够打造独特优势。
这包括数据采集和管理、数据质量、数据治理和数据安全。此外,随着多模态模型能力的进步,跨结构化和非结构化数据的处理能力将成为充分发挥生成式 AI 潜力的关键。我们相信,那些能够更智能、更快速地以安全方式收集、清洗和整合数据的公司将会胜出。

利用潜在数据

许多公司多年来一直知道他们的数据具有价值;然而,将这种认知付诸行动对大多数组织来说仍然是一个挑战。在我们与生成式 AI 公司领导者的交谈中,一个一致的议题是,他们的产品在多大程度上解锁了一直处于休眠状态(例如,在 Box/谷歌云盘/SharePoint 上)或者根本没有被系统捕获到(例如,客户通话、患者讨论、会议记录)的客户数据。其好处是显著的,使用户能够:
⚡️ 更无缝地与现有数据进行交互
⚡️ 更快速地获取与其角色和特定需求相匹配的最佳内容
⚡️ 为数据资产带来更多结构和明确的分类体系
这些都有助于更好地理解如何利用公司数据创造商业价值,同时也强有力地推动了:1)优化数据架构以支持更多 AI 投资;2)向那些已经展现出早期投资回报的,可信赖的 AI 原生应用合作伙伴提供更多数据。

We translate unwritten knowledge—like standard operating procedures that may be living in employee’s heads but not written down and insights from customer conversations—into structured data that teams can actually use and scale.
我们将不成文的知识(例如可能存在于员工头脑中但未写下来的 SOP 以及来自客户对话的 insights)转化为团队可以实际使用和扩展的结构化数据。

——Co-founder & CTO at EliseAI

创建新的专有数据集

超越现有数据,生成式 AI 有望获取全新的数据集,这些数据集可以成为相对于现有应用的竞争性差异化基础。这将呈现多种形式,包括但不限于:多模态交互数据、AI 生成内容的创作和消费数据,以及微观和宏观层面的数据模式识别。贯穿其中的一致性在于:这些数据在现有系统中并不存在。因此,这为 AI 原生公司提供了一个机会——获取这些数据,围绕它构建整合点,并构建能够延伸其价值的差异化工作流。
新的数据以及对用户工作流的理解可以被转化为训练数据,以迭代地提高基础模型的性能,从而扩大 AI 原生创业者的竞争优势。这种转变强调了,现在不再仅仅是数据的数量的优势。

Gone are the days where having “the most data” as an incumbent platform drove the greatest technical moat. There’s a clear shift in prioritization now, going from data quantity to its quality, privacy, and application.

拥有“最多数据”作为现有平台驱动技术护城河的日子已经一去不复返了。现在优先级发生了明显的转变,从数据的数量转向数据质量、隐私和应用。
——Founder & CTO at Moveworks
展示强大数据管理和利用能力的 AI 原生应用案例包括:
⚡️ Glean 通过实时反馈来训练定制的大语言模型并构建组织专属知识图谱,为每位用户提供个性化、符合上下文的搜索结果。
⚡️ Writer 利用专业的大语言模型深入理解企业数据中的语义关系,为任何搜索或应用查询提供相关的、具有上下文感知的结果。
⚡️ Jeeva.ai 整合多个来源的销售潜在客户数据,让用户能够精确定义其理想客户画像,快速建立准确的潜在客户名单,并生成高度个性化的信息内容,实现自动化互动。

3. 领域专业知识

正如我们之前提到的,过去一年里,围绕垂直领域 AI 应用的讨论和期待的热度很高。这种热度是有充分理由的,因为行业垂直特定的 AI 原生应用一直是扩张最快的,在法律、医疗、房地产和金融服务等领域都有明显的代表性案例。
我们认为,生成式 AI 展现了深度领域理解的能力——不仅体现在特定产品交互中,还体现在端到端的工作流上——这是一个令人兴奋的发展趋势,将对垂直和水平软件类别产生重大影响。在评估这一维度时,我们关注应用的能力是否能够:

特定领域的活动转化为 AI 加速的工作流

垂直 AI 迅速走红,很大程度上源于生成式 AI 展现出惊人的本领:能够为特定领域的用户活动构建更加精准的数字化想象一下这些令人兴奋的场景:在医院里,AI 能够比人更准确地记录医生和患者的每一句对话;在律师事务所,AI 能够梳理海量法律文件,提炼最关键的研究洞察;在金融机构,AI 能够比分析师更快速地理解复杂的市场信息;在企业内部,AI 能够比传统搜索系统更精准地梳理人与人、人与组织之间的关系。这些 AI 模型就像资深领域专家,它们不仅能听懂专业术语,还能准确把握特定场景下的细微语境。通过深度学习,这些 AI 已经能够自动化流程,帮助用户又快又好地完成工作。简单说,它们正在用智能重新定义各个行业的工作方式。
领域专业知识并不总是局限于特定行业。我们与多位产品和工程负责人交谈时发现,他们致力于研究客户组织中的高级用户和领导者,以归纳他们的使用模式。通过将这些模式转化为 Prompt 和结构化输出,他们的目标是让这些洞察对组织内的各个层级都触手可及。以 Supio 的产品负责人 Pamela Wickersham 的话说,这就像是“观察平台中最资深的用户正在做什么,然后让这些做法可以在公司不同岗位和角色中复制”。通过这种方式,建立在经过公司特定数据微调的基础模型之上的生成式 AI 应用,能够实现一种跨越整个员工群体的知识传递。

大规模快速合成

AI 原生应用的另一个优势,是能够近乎实时地从海量数据集中获取洞察。这些新兴应用正在各个领域涌现,它们将获取经过验证的行业特定文档和数据(例如美国证券交易委员会的 EDGAR 数据库)、经过微调的模型和对话式交互界面相结合,极大地加速了客户识别和处理与特定目标相关信息的速度。目前,这一趋势在法律领域表现得最为明显,像 Harvey、EvenUp、Robin AI 和 Supio 这样的公司都在推动这一变革。不过,我们同样看到这种模式正在医疗、公共部门、保险、金融服务和教育等领域快速展开。
AI 原生应用为用户带来了特定领域的超常能力,这种提升体现在多个维度上。毫不夸张地说,过去需要大批初级员工或外部顾问投入数天乃至数周才能完成的分析,如今借助这些新服务,往往几分钟就能给出初步答案。

融合全球与本地知识

AI 原生应用程序独特地结合了三类知识:通过海量训练数据嵌入基础模型中的全球性知识、存在于行业相关数据库中的领域专业知识,以及来自组织自身资料的企业特定见解。关于最后一点,领域专业知识可以体现在高质量的 PPT、备忘录、会议记录、专有研究、培训材料和历史文档中,这些都用于优化 AI 原生应用的输出,使其符合个人用户对“优质内容”的期望。
这不仅仅是上文提到的更好地获取专有数据那么简单。关键在于理解这些数据如何在特定环境下反映出员工、团队或组织的相关知识。这种结合使用户不只是优化单个任务,还能实现整个工作流程的自动化,同时更专注于具体成果。
通过垂直 AI 应用展现深度领域理解的最佳实践包括:
⚡️ Abridge 通过在大量医疗对话数据集上训练的多语言模型架构,将实时的患者音频转换为精确的临床记录。
⚡️ EliseAI 利用大语言模型从物业管理系统、客户关系管理系统、知识库以及直接从租赁专业人员那里获取住宅楼的相关信息,并自动回答潜在和现有租户的问题。
⚡️ Supio 拥有一个专有模型,该模型经过大量人身伤害案例数据的训练,能够高度准确地分析和生成法律文件。
⚡️ Magic School 提供 80 多种专门针对教育工作者的人工智能工具,帮助他们改进和自动化备课、测评写作、生成和管理教学内容等工作。

4. 动态个性化(Dynamism)

Ben Thompson 在他最近一篇题为 Meta’s AI Abundance 的文章中,深入分析了 Meta 在生成式 AI 领域的巨大机遇。他特别指出,Meta 可以借助生成式 AI 来加速多模态动态广告的创建和测试,同时通过公司最新推出的 "Imagine Yourself" 模型来打造下一代个性化内容。这些技术突破对数字营销和电商行业的影响显而易见,而且这些改变很可能会在不久的将来就显现出来。
Meta’s AI Abundance:https://stratechery.com/2024/metas-ai-abundance/
这些变化还反映了一个我们认为更大的趋势:生成式 AI 将重塑用户对各类企业软件的期待。虽然这种转变的影响力可能不及我们之前讨论的三个维度那么普遍(比如说,在处理总账这样的工作时,过于灵活反而不是好事),但我们预计应用的体验将从静态走向更加动态。我们正在密切关注那些能够实现这一转变的企业:

优化“幕后”行动 / 实时优化价格与性能的权衡

我们所交流的大多数公司已经超越了使用单一模型测试概念的阶段,转而协调一系列模型的交互作用,以便为特定场景优化输出。从输入到输出的过程变得更加动态。公司在开发基础设施时考虑到了灵活性,允许他们轻松地更换模块化组件,以实现性能提升和/或成本效益。这种动态性导致了由像 Martian 这样的公司构建的模型路由的兴起,它作为 AI 应用的基础设施技术栈中的关键新组件。随着时间的推移,我们期望目前以用户选择形式呈现的更高级的 AI 功能(例如,在 ChatGPT 或 Perplexity 中选择基础模型、输出的语气、给输出打分)会变得隐藏起来,因为底层系统能够适应并代表用户做出决策。

创建生成式客户旅程

在设计部分我们曾提到,企业软件在用户体验方面常常未能达到预期。虽然我们并不期望这种情况在一夜之间改变,但我们对 GenAI 改善当前状况的潜力感到兴奋。我们设想这种改善的一种方式是通过创造更具动态性和适应性的内容体验,以展示对终端用户和客户的更深入理解。想象一下,销售和营销资料能够根据每个潜在客户的偏好进行定制——从邮件发送到推送材料,从落地页到合同拟定。再想象一下,电商平台让购物者能在自己实体空间的数字孪生环境中,或是在自己的数字分身上,预览商品效果。
我们如今在市场上已经看到了很多这样的例子;然而,我们可以想象在近期的未来,正如 Jeeva 的 CEO 高拉夫·巴塔查里亚告诉我们的那样,应用“会成为实时的、持续学习的系统,在这个系统中,AI 根据客户的交互自主适应”。更长远来看,我们可能会看到功能发展到这样一个地步,即整个用户界面都是实时生成的,根据用户意图的表达,按需展示和隐藏底层功能和内容。

在多个层面实现超个性化

最后,我们看到企业软件在个性化体验方面有更大的机遇。随着 AI 不断学习相关偏好、互动模式和关系,这种个性化将在企业内部的终端用户、团队、部门和整个组织层面上实现。例如,Outreach 为组织中的每个团队和销售人员建立了一个定制模型,并在交易进展过程中实时更新。此外,销售沟通和相关材料也越来越精准地针对个别客户进行调整。长远来看,我们认为具有共享记忆的 Agent 将成为这一任务最充分的体现。
我们认为很好地展示了动态个性化的一些例子,包括:
⚡️ HeyGen 提供了一个 AI 视频创作平台,使市场营销(Go-to-Market,GTM)和学习与发展(Learning and Development,L&D)团队能够快速生成超个性化的视频内容,并在销售、支持和培训等领域部署完全自主的对话式视频体验。
⚡️ Mercor 开发了一款 AI 面试官,它能够实时评估候选人,在分析预先处理的简历和个人资料的同时,还可以根据实时对话进行调整。
⚡️ Evolv AI 通过 AI 持续实时调整用户体验,根据用户的实时行为优化客户旅程。

5. 分发

最后,我们需要讨论如何对这种新的 AI 价值进行打包和定价。这就引发了一个问题:生成式 AI 是否会给云时代应用软件公司所青睐的传统基于席位的 SaaS 模式带来灭顶之灾?
正如我们在 2024 年 8 月的 August 2024 market memo 中所写,我们认为有关软件即将消亡的说法被严重夸大了。虽然现在判断是否会出现一个颠覆现状的主导模式还为时过早,但显而易见的是,各公司在平衡新价值和成本的同时,也在积极应对潜在的新竞争威胁,正在拥抱各种实验性尝试。我们正在密切研究 AI 原生应用将会如何发展:
August 2024 market memo:https://view.sapphireventures.com/viewer/8bfbaa7011a21cbe90df96be6b9e2792

增加定价和打包售卖的灵活性以实现价值最大化

我们已经进入了一个更加多样化的定价环境。具体表现为:我们看到企业有以下几种行为:
⚡️ 一是将通用人工智能功能嵌入到现有的服务中,且不收取额外费用(例如 Workday);
⚡️ 二是创建现有产品的高端版本以提供生成式人工智能功能;
⚡️ 三是推出全新的独立通用 AI 应用程序;
⚡️ 四是在基础平台承诺之上尝试一些基于消费和成果的产品。
GenAI 处于主导地位的分发模式尚未建立。它可能因类别而有很大差异;然而,我们将 GenAI 视为一种技术,它扩展了公司提供价值以满足客户需求的方式。未来可能会包括应用和 Agent 的混合,以及协助处理和自动执行。
我们认为将会看到基于席位数量、基于实际消费以及更有选择性的基于结果的定价的混合,而不是围绕定价进行非此即彼的争论。能够平衡不同模式以确保客户覆盖范围广度,同时更透明地使定价与所提供的价值相一致的应用开发者将处于最佳位置以在未来取得成功。

启用新的商业模式

近期已有大量文章讨论软件驱动服务的增长,以及以实现特定商业成果为定价基础的主动系统的潜在崛起,因此我们不会在这些话题上过多着墨。我们只想指出,真正的颠覆从来不仅仅取决于产品的技术能力,还往往包括商业模式的转变(比如从许可证模式转向订阅制软件)。
许多公司已经引入了新的定价方式,包含了基于消费和基于结果的定价要素。以下是一些典型案例:
⚡️ 像 Salesforce 这样的行业巨头已宣布其 Agentforce 产品套件的定价为每次对话 2 美元,而 Zendesk 现在对每次自动解决方案收取 1.5-2 美元。
⚡️ 像 Sierra、MavenAGI、Decagon 和 Crescendo 这样的客服 AI. Agent 根据结果(例如已解决的工单)来定价。
⚡️ Reserv 提供基于人工智能的理赔处理服务,价格根据已开立和已执行的理赔数量来确定。
⚡️ 像 Synthesia 这样的内容生成应用按生成视频的分钟数收费,而像 Imagen 和 Aftershoot 这样的编辑工具则按编辑次数收费。
图片

未来之路

我们认为这个框架为开发者和投资者提供了一个非常好的视角,帮助他们思考 AI 在应用层面带来的差异化优势。然而,真正的突破将来自那些能够以创新方式融合这些维度的企业家,他们将从根本上重新定义工作方式。
为现有产品升级更先进的功能固然必要,也能创造可观的价值,但要在长期内打造出能够追平或超越当今企业软件领导者的公司,就必须进行彻底的革新。设想一下:统一的用户界面、“永远在线”的多模态应用,将分散的服务功能整合到单一体验中,并采用计量收费模式...(这些都需要被革新)
从现在走向那个潜在的未来,需要对技术栈的每一层进行重大改进,并且隐含地基于这样一个假设:Scaling Law 在一定程度上是成立的,从而在未来几年中持续提升前沿模型的能力。此外,还有一项艰难但不那么引人注目的工作,那就是以提高性能、减少幻觉、确保一致性、保持合规性、提高安全性和管理成本的方式来处理现有的模型。
振奋人心的是,这些都是已知的挑战。我们投资的几家公司的领导向我们表示,只要成本持续下降,仅基于当前一代模型的能力,就还有多年的创新有待实现。
图片
So how do we get there?
GPT-5 类模型无论何时出现,都将改变人们对 AI 发展轨迹的看法,无论这些模型是否在炒作中表现出色。破碎的基准和新出现的能力将释放无限的乐观情绪,而缓慢渐进式的改进可能会在短期内压低预期和估值。
无论哪种方式,我们都会更清楚地了解未来几年什么会起作用、什么不会起作用,以及代价是什么。构建和购买 GenAI 技术的公司将能够做出相应的规划。虽然他们肯定是在“自说自话”,但我们同意 Sam Altman 和 Greg Brockman 表达的观点,即模型能力将继续进步,构建 AI 产品的公司应该在这一假设下运营。
然而,正如我们最近几个月所看到的那样,我们不一定需要看到模型名称后面有更高的数字才能激发人们对 AI 未来的兴奋。当我们询问产品负责人在接下来的几年里他们最兴奋的是什么时,他们谈到了推理研究的方向以及这如何加速从核心理解到更深入的思考再到真正的 Agent 系统的进展。

Right now, people are focused on the “fast food” version of AI and want an answer immediately. One of our big bets is spinning up systems that, if given enough time, can come up with novel answers to complex questions.
目前,人们关注的是“快餐”版式的 AI,并希望立即得到答案。我们的一大赌注是建立一个系统,如果有足够的时间,它可以为复杂的问题提供新颖的答案。

——Co-Founder and Chief Science Officer at ReliantReliant

模型主动执行操作、模型花更多时间思考,以及其他模态追赶文本领域的进步,都将进一步拓展应用层差异化的机会,这几乎可以肯定会带来新的研究领域。所有的这些,正在引领应用层进入一个全新的“实验时代”,这令我们深感兴奋。开发者的创作工具正以近乎每周的速度不断扩张,他们现在可以以前所未有的方式组合产品架构、模型、用户界面、公共和私有数据源以及交付机制。这种变化的节奏势不可挡。
尽管如此,这条路并非一帆风顺。在许多领域,广泛部署的进程可能比预期更为缓慢。大多数的情况下,甚至几乎所有重塑工作流的尝试都可能以失败告终。与其颠覆现有玩家,AI 更可能会在诸多软件类别中强化当前的领先者。然而,那些通过快速整合和展现新能力来实现组合式创新的应用和 Agent 公司,将有望成为定义即将到来的 AI 软件新纪元的重要企业。
声明:本文为「宇宙编辑部」翻译,未经许可禁止转载。