【万字解析】究竟什么才算是 AI Native 应用:下一代企业级软件的五维评估框架

在过去两年中,投资人和科技生态对即将到来的 AI Native 应用时代展开了大量讨论。我们观察到许多分析框架概述了价值获取的进程,这一进程涵盖了从基础设施到平台,再到应用层。业界对 AI Agent 演进的兴趣激增,同时对各种垂直领域 AI 的深入探讨也在不断增加。
然而,关于 AI Native 公司的定义,以及企业软件格局的将如何演变,目前还缺乏深入探讨。换句话说,AI Native 应用究竟有什么构成,以及这些公司在未来几年将面临什么样的竞争影响?
这篇来自 Sapphire Ventures 的专栏尝试直接解答这些问题,结合了实地调研和基于新兴市场的趋势研究。
研究建立在多个维度之上:实践中的产品测试、与创业公司创始人的深入合作以及大量的市场调研。其中最具价值的是与各类企业的产品和技术负责人进行的深度交流,这些企业正在积极利用生成式 AI 来开发新产品。
尽管当前对生成式 AI 的热潮可以追溯到 2022 年 11 月 ChatGPT 的推出,但在技术栈的不同层面中,应用层通常会滞后于底层技术的进步。
许多生成式 AI 的批评者以 AI 领域一直没有出现“Killer App”作为对该技术被过度炒作的证据,然而,越来越多的迹象显示,应用层正在迅速发展,值得关注。
图片

2024 年,生成式 AI Native 应用的融资出现了激增,截至 10 月底,相关融资总额已达到 85 亿美元,占过去两年生成式 AI 总投资比例的更大份额。过去几个月,我们见证了多个 AI 产品的重大融资,包括 Perplexity(5 亿美元)、Poolside(5 亿美元)、Magic(3.2 亿美元)、Sierra(1.75 亿美元)、Abridge(2.5 亿美元)、Glean(2.6 亿美元)、Writer(2 亿美元)和 EvenUp(1.35 亿美元)。
高水平的投资预示着市场的繁荣,但真正有力的证据在于发展势头——在这方面,这一领域的增长无疑势不可挡。过去几个月,越来越多的 AI Native 应用开始展现出显著的收入增长。据我们统计,目前市场上至少有 47 个 AI Native 应用的 ARR 超过 2,500 万美元,而在年初时这一数字仅为 34 个。
我们预计,到明年这个时候,可能会有同等数量的应用 ARR 将突破 5000 万美元。早期在代码辅助、客户支持和营销等领域的成功,正在扩展到更多功能和垂直应用场景。
无论是初创公司还是现有企业,都在不断推出雄心勃勃的 AI Native 产品。简而言之,我们认为,当前的 AI Native 应用生态系统比一年前,甚至比一个季度前,都要强大得多。

图片


如何定义 AI Native 应用

AI Native 应用意味着 AI 是应用程序体验的核心,而不仅仅是辅助功能。虽然这个术语被广泛使用,但其定义——就像 AI 领域的许多概念一样——仍然模糊且在不断发展。
通过我们广泛的研究以及与 Canva、Glean、Meta、Runway、Figma、Abridge 等公司的开发者的对话,我们制定了一个我们认为更具描述性和细致入微的定义:
  • AI Native 应用程序建立在基础 AI 能力之上,如从大型数据集中学习、理解上下文或生成新的输出。
  • AI Native应用程序突破了传统的种种限制(如速度、规模和成本)来交付成果,从而实现全新的可能性。
  • AI Native 应用程序被设计为拥有智能飞轮,即当底层模型性能提升时,产品会更好用;从真实世界获得更多数据后,产品会更好用。
  • AI Native 应用包含一些专有 AI 技术,而不是 100% 使用现成的功能(例如,微调开源模型以改进特定功能、工作流编排等)。
AI Native 并不意味着应用必须从一开始就具备生成式 AI 功能。正如一些定义类别的软件产品从本地部署时代成功过渡到云原生版本(例如 Adobe Photoshop、Microsoft Office),我们相信许多公司可以随着时间推移从云原生应用演变为 AI Native 应用。

图片

AI Native :一个暂时的分类方式

“AI Native”这个术语,就目前而言是一个有用的分类方式,但它只是一个暂时性的概念,就像我们现在很少说互联网原生、云原生或移动原生一样,随着 AI 成为市场上几乎每个产品和服务的基本组成部分,AI 这个标签也会逐渐淡化。
我们在早期采用阶段使用它,是为了区分那些快速行动“用 AI 增强和扩展现有产品的公司”,与那些“从零开始基于 AI 的全新能力构建的公司”之间的差异。随着时间推移,这些界限将变得模糊,将不如公司在构建产品和组织方式上对“ AI 优先”的深度重要。
即使在一个 AI 化程度更高的世界里,价值创造的基本驱动因素也不会改变。企业必须深入理解用户的需求,打造能够满足并超越用户需求的产品。
无论 AI 发展到多么先进的程度,它始终只是服务于这些目标的工具,而不是一个寻找下一个钉子的锤子。

图片

AI Native 应用的评估框架

既然我们已经明确了不太可能改变的事物,现在是时候讨论未来可能出现的新变化了。自今年年初以来,我们 一直使用一个包含五个维度的框架来评估构建 AI 应用的公司。

图片

考虑到企业软件领域竞争强度已经在增加,再加上 AI 极大地帮助开发团队能够提高效率,从而导致产品间功能差异化半衰期快速缩短,我们认为企业需要在这些维度上实现应用程序的差异化,以建立持久的品类领导地位。

产品设计

企业级软件市场已发展成为一个规模达数万亿美元的庞大产业,每年在提升运营效率和扩展性解决方案上投入巨额资金。然而,尽管市场规模持续增长,以用户为中心的设计理念却长期被忽视,产品开发往往为了功能性而牺牲了用户体验。
如今典型的企业软件用户界面仍充斥着繁琐的设置选项、错综复杂的菜单层级和过度频繁的通知提醒——虽然功能齐全,却鲜少能带来愉悦的使用体验。
我们认为,这种状况正在迎来转折点:产品设计正逐渐成为新一代企业软件的核心竞争优势。随着生成式 AI 开始不断拓展设计的可能性边界,我们正密切关注这项技术将如何赋能开发者。

创造新的交互方式

在过去两年中,聊天和搜索界面一直主导着生成式 AI 的用户交互形式,为用户开创了与数据交互的全新范式——通过基于文本的 AI 助手,用户可以进行提问、内容综合、信息总结和头脑风暴等多样化的操作。
AI Native 的用户界面正在革新用户与应用程序的交互方式,同时将那些曾经只有高级用户才能掌握的进阶功能变得触手可及。
当前的企业工具往往蕴含着强大的功能,但大多数用户却很少充分利用这些特性,原因不是不了解这些功能的存在,就是不知道如何有效地运用它们。
通过自然语言交互(无论是文本还是语音),用户得以轻松解锁这些原本就存在但未被充分利用的产品功能。
近期,多模态生成式 AI 模型在追赶基于文本的模型方面取得了显著进展,这为开发者重新构想软件使用方式提供了广阔空间。
性能日益提升的语音和视频模型开辟了创建、捕捉和转换输入输出的新途径,有效补充了传统的点击和键入操作。
尽管仍处于初期阶段,OpenAI 最近推出的 Canvas 和 Anthropic 的 Computer Use 功能,已经展示了从简单的聊天机器人到协作创意画布,从辅助驾驶到自动驾驶的潜在演进路径。
多模态技术的重要性不仅体现在其提供丰富多样的输出形式上,更在于它将持续改变我们的输入方式和与这些工具的交互模式。展望未来,随着技术不断演进,那些具备灵活性、表现力,并能够跨模态理解和生成内容的模型与工具,将变得愈发重要。

加速反馈回路
生成式 AI 输出的不确定性为其在生产环境中的部署带来了挑战。
在模型层面,RLHF(基于人类反馈的强化学习)在两个方面发挥了关键作用:一是更好地让 AI 输出与人类意图保持一致,二是加速模型的迭代优化。
目前,那些构建生成式 AI 应用的公司不仅借鉴了这些训练技术,还在积极探索创新的用户反馈收集方式。这些方法帮助他们更有效地优化性能,并加快功能开发的节奏。通过与产品负责人的深入交流,我们了解到了多种反馈收集机制:
最基础的是传统的"点赞/点踩"评价、星级评分系统,以及依托人工审核团队把关的方式。而比较创新的方式是通过智能监测用户的参与度来获取意图信号,包括追踪内容的分享行为、分析用户的停留时间、评估内容的时效性、记录互动频率,以及观察用户的复制粘贴等具体操作。
这种智能化的反馈收集方式既不会打扰用户的正常使用流程,又能帮助产品快速迭代优化,持续提升性能,从而更精准地满足用户不断演变的需求。

构建 AI 驱动的原生系统

在与 AI Native 应用公司的深入交流中,我们获得了一个重要启示:成熟的系统级思维在应用设计中很重要。
一方面是在现成的通用  AI  组件与专有功能开发之间找到最佳平衡点,以此优化特定场景下的性能表现;另一方面是结合多种基础技术,包括微调、RAG 和提示词工程等,同时采用多模型编排的方法,从而在每次查询中实现最优的性价比。
许多 AI Native 应用呈现给用户的简洁优雅界面下,实际蕴含着复杂精密的后端架构。在构建 AI Native 系统的过程中,将可解释性融入各个环节同样重要。当前,AI 应用正从注重行动和辅助的阶段,逐步过渡到以答案和智能代理为核心的新纪元。
在这个转变中,让用户清晰理解 AI 是如何交付工作结果变得尤为重要,这不仅有助于建立信任关系,更能确保系统表现的一致性。
为此,AI Native 应用需要做到准确展示输入与输出之间的关联性,明确引用信息来源,为那些需要深入了解系统运作机制的用户提供更详实的解释说明。

我们看到的一些较为有趣的AI Native 应用设计表现包括:
  • Perplexity.ai 和 OpenAI 的 ChatGPT 搜索通过整合相关网络链接和引用来增强生成的回应。
  • Hebbia 和 Reliant AI 采用了创新的表格式界面设计,让用户能够在更精细的层面上与数据输出进行互动。这种设计不仅提升了用户体验,更构建了一个高效的模型优化反馈闭环,持续提升系统性能。
  • Cognition 提供了一个原生代码编辑器,允许用户在生成的代码输出旁即时进行开发工作。这种设计不仅提高了开发效率,还能基于用户的编码习惯和最佳实践持续优化模型输出。
  • Rilla 和 Bland.ai 正在用多模态 AI 技术重塑传统销售流程。Rilla 通过深度分析客户对话数据来优化销售培训体系,而 Bland.ai 则运用易于定制的 AI Agent,结合文本转语音技术,实现了销售和客户支持通话的智能自动化。

图片


数据飞轮

数据是训练底层大模型的核心要素,这些大模型是近两年 AI 产品的基础。然而,我们认为数据在应用层具有同等甚至更高的价值——它是将通用的跨模态基础能力,转化为满足特定用户需求、具有竞争壁垒的产品的关键因素。在研究企业如何在 AI Native 应用中运用数据时,我们特别关注以下两个关键维度:

提升数据管理能力

AI Native 应用虽受益于基础模型的全局数据整合及用户的数据资产现代化,但其核心差异化优势在于端到端数据管理能力的建设。这涵盖了数据采集、治理、质量控制及安全保障等关键维度。
随着多模态模型的演进,跨结构化数据处理能力将成为释放生成式 AI 潜力的关键要素。在这个维度上,数据管理效率与安全性的平衡将决定企业的竞争力。

有效激活数据资产

尽管企业普遍认知数据价值,但如何有效转化这种认知仍是大多数组织面临的挑战。通过与生成式 AI 企业领导者的深入交流,我们发现一个显著趋势:其产品成功盘活了静态数据(存储于 Box/Drive/SharePoint 等平台)以及未被系统化采集的动态数据(客户通话、现场讨论、会议记录等)。
这种数据激活为用户带来多重价值:提升现有数据利用效率,实现角色导向的精准内容获取,并优化数据资产的结构化分类。这种价值创造形成良性循环,推动企业优化数据架构以支持深层 AI 投资,同时深化与具有良好投资回报的 AI Native 应用合作伙伴的数据协作。

图片

创建新的专有数据集

超越现有数据,生成式人工智能有望捕获全新的数据集,这些数据集可以成为相对于现有应用程序的竞争差异化基础。这将以多种形式呈现,包括多模态交互数据、AI 生成内容创作和消费的元数据、微观和宏观层面的数据模式识别等等。这里的一致主线是这些数据在现有系统中并不存在。因此,这为 AI Native 公司提供了捕获数据、围绕数据创建整合点以及构建差异化工作流程来扩展其价值的机会。
然后,这些新数据和对用户工作流程的理解可以转化为训练数据,从而迭代改进底层模型的性能,进一步扩大AI Native 挑战者的竞争优势。这种转变强调,不再仅仅是数据量能带来优势。

构建新的数据维度

生成式 AI 正在开辟数据采集的新方式,这超越了对现有数据的简单利用。
通过多模态交互数据、AI 内容创作的元数据分析、以及跨层级的数据模式识别,企业得以构建全新的专有数据资产。这些在传统系统中不存在的数据维度,为 AI Native 企业提供了独特的价值整合点和差异化工作流构建机会。
这些新型数据资产与用户交互模式的深度洞察可转化为高质量训练数据,持续优化底层模型性能,从而形成良性循环。这种趋势表明,竞争优势已从单纯的数据规模转向数据质量与场景深度的综合竞争。

图片

展示出强大数据管理和利用能力的 AI Native 应用包括:
  • Glean 通过训练专属大语言模型并构建组织级知识图谱,实现了基于实时反馈的个性化语境搜索。
  • Writer 基于专业大语言模型深度解析企业数据语义关联,为各类检索需求提供具有情境感知的精准结果。
  • Jeeva.ai 实现了销售线索数据的多源整合,支持企业精确刻画目标客户画像,快速构建高质量潜客清单,并驱动个性化自动交互。

领域知识

生成式AI在垂直领域的蓬勃发展印证了其独特价值。特别在法律、医疗、房地产和金融服务等专业领域,AI Native应用展现出显著成效。这种深度领域理解不仅体现在具体产品交互中,更延伸至端到端工作流程,为垂直与水平软件领域带来革新性影响。
所以评估 AI Native 应用时,我们主要关注应用的以下能力:

将特定领域业务转化为 AI 工作流

生成式 AI 优异地将专业领域活动数字化,这推动了垂直 AI 的迅速发展。从医患对话的精准转录,到法律研究与金融分析的全面归纳,再到企业搜索中对关系网络的细致理解,AI 模型深入把握专业场景,自动化助力用户提升效能。这种专业知识并非仅限于特定行业,通过研究组织内资深用户的行为模式,AI应用可将其转化为结构化输出,实现组织内的知识流转。

规模化的高速知识组合

AI Native 应用能够实时从海量数据中萃取洞见,新兴应用通过整合行业专有数据库、定制模型与对话式界面,显著提升了信息处理效率。这种能力使得过去需要团队数周完成的任务,现可在数分钟内获得解决方案,极大提高效率。

三类知识的有机融合

AI Native应用独特地融合了三个层面的知识体系:基础模型蕴含的普适知识、行业数据库中的专业知识,以及组织自身积累的特定洞见。这种多维度知识的有机结合,使应用不仅能优化单项任务,更能实现完整工作流程的自动化提升。
  • Abridge 通过在大量医疗对话数据集上训练的多LLM架构,将实时患者音频转换为精确的临床记录。
  • EliseAI  从物业管理系统(PMSs)、CRM、知识库以及直接从租赁专业人员那里获取有关住宅建筑的相关信息,并利用LLM自动回答潜在租户和现有租户的问题。
  • Supio  拥有一个用大量人身伤害案例数据集上训练过的专有模型,使其能够高精度地分析和生成法律文件。
  • Magic School 提供 80 多种专门用于帮助教育工作者改进和自动生成课程计划、写作评估、学术内容生成和管理等的 AI 小工具。

动态优化

在最近一篇题为《Meta 的 AI 丰富性》的文章中,Ben Thompson 对 Meta 在生成式 AI 领域的潜力进行了深入分析。他特别强调了 Meta 利用生成式 AI 加速多模态动态广告的生成与测试的能力,以及通过其全新的 Imagine Yourself 模型实现下一代个性化内容的潜力。这些技术对数字营销和商业领域的潜在影响不容小觑,而且可能会很快显现。
文章还提到了一个更大的趋势:生成式 AI 正在推动多个企业软件类别的用户期望发生演变。尽管这一趋势不像我们之前讨论的三个维度那样广泛,但我们预计会看到应用体验从静态向更动态的转变。我们正在关注那些能够实现以下目标的公司:

“幕后”优化:实时平衡价格与性能之间的权衡。

目前,我们接触的大多数公司已经超越了单一模型测试概念的阶段,转而通过协调多个模型的交互来优化特定用例的输出。
从输入到输出的整个过程正变得更加动态化。这种特性促使公司在开发基础设施时更加注重灵活性,使其能够轻松替换模块化组件,以实现性能提升和/或成本优化。例如,像 Martian 这样的公司开发的“模型路由器”,已经成为支撑 AI Native 应用基础技术栈中的关键组件之一。
随着时间的推移,我们预计许多当前以用户选择形式呈现的高级 AI 功能(例如在 ChatGPT 或 Perplexity 中选择底层模型、调整输出语气、为输出效果评分等)将逐渐从用户界面中消失,因为底层系统将能够自适应地代表用户做出最优决策。

实时生成个性化的用户旅程

正如我们在“产品设计”部分提到的,企业级软件在用户体验方面往往表现欠佳。虽然这一现状不可能在短时间内彻底改变,但生成式 AI 改善现状的潜力很大,我们设想的一种改进方式是,通过创建更具动态性和适应性的内容体验,展现对终端用户和客户更深层次的理解。
试想一下,销售和营销材料可以根据每位潜在客户的偏好进行个性化调整——从陌拜邮件、产品演示、落地页到合同生成,均可实现高度定制化;电商平台能够让购物者在其实际空间的数字孪生环境中,或通过其数字分身,预览商品的效果。
目前,市场上已经出现了许多类似的应用案例;然而,我们可以预见,在不久的将来,正如 Jeeva 的 CEO Gaurav Bhattacharya 所描述的那样,应用程序将演变为“实时学习、持续学习的系统,AI 能够根据客户的互动自主适应”。
从更长远的视角来看,这些能力可能会进一步发展,直至整个用户界面都能实时生成,根据用户的意图动态显示或隐藏底层功能和内容,为用户提供按需而生的体验。

实现多层次的个性化

此外,我们看到企业软件在提供更加个性化体验方面存在巨大的潜力。随着 AI 对用户偏好、参与模式和关系的学习深入,这种个性化将体现在公司内部的多个层面——包括终端用户、团队、部门乃至整个组织。例如,Outreach 已经能够为组织中的每个团队和销售人员构建定制的模型,并在交易推进过程中实时更新。此外,销售沟通和相关材料也正在变得更加精准地适配于个别客户的需求。
展望未来,我们相信,具备共享记忆的 AI Agent 将成为这一趋势的最佳体现。这些 Agent 不仅能够持续学习,还能在不同层面上实现协同优化,为用户提供真正个性化且高效的体验。

我们认为以下一些例子很好地展示了动态优化能力:
  • HeyGen 提供一个 AI 视频创作平台,使 GTM 和 L&D 团队能够快速生成高度个性化的视频内容,并在销售、支持和培训领域部署完全自主的对话式视频体验。
  • Mercor 构建了一个 AI 面试官,能够与候选人进行面试并评估其能力,并利用预处理的简历和档案数据,实现实时对话。
  • Evolv AI 通过 AI 驱动的产品交互实验实时调整用户体验,基于实时用户的行为优化客户旅程。

定价模式

关于如何对生成式 AI 所创造的新价值进行打包和定价的讨论正变得愈发重要,这引发了一个关键问题:生成式 AI 是否会颠覆基于席位的 SaaS 订阅模式?我们认为,关于“软件即将消亡”的报道被大大夸大了。
尽管目前判断是否会出现一个主导性的颠覆模式还为时尚早,但显而易见的是,各企业正在积极探索如何在平衡新价值与成本的同时,降低潜在竞争威胁的影响。
我们正在密切关注 AI 原生应用如何通过以下方式推动行业变革:

提高定价和打包的灵活性以最大化价值

我们正进入一个更加多样化的定价环境,许多公司已经在尝试不同的策略来实现价值最大化,包括:
  1. 将生成式 AI 功能免费嵌入现有服务(如 Workday)。
  2. 推出现有产品的高级版本,以提供生成式 AI 特性。
  3. 开发全新的独立生成式 AI 应用
  4. 在基础平台服务基础上,测试基于消费和结果的定价模型
目前,生成式 AI 的“主导”模式尚未形成,这种模式可能会因行业类别的不同而广泛变化。然而,我们更倾向于将生成式 AI 视为一种扩展企业满足客户需求方式的技术,而非单一的解决方案。未来可能会包括应用程序与智能代理的结合,以及“副驾驶”与“自动驾驶”模式的灵活切换。
在定价模式上,与其争论“基于席位”还是“基于用量”的优劣,我们更可能会看到多种模式的混合:基于席位、基于消费以及更有针对性的基于结果的定价模式
能够在这些模式之间找到平衡点的应用开发者,将不仅能覆盖更广泛的客户群体,还能通过更透明的方式将定价与实际提供的价值相匹配,从而在未来竞争中占据优势。

新商业模式的可能性

关于“软件驱动服务”和“以实现特定商业成果为定价基础的智能系统”等话题已经被广泛讨论,我们在此不再赘述。需要强调的是,真正的行业颠覆从来不仅仅是产品技术能力的体现,更往往伴随着商业模式的革新。例如,从传统软件许可证模式向订阅制软件的过渡就是一个典型案例。
展望未来,生成式 AI 的崛起或将带来更多商业模式的创新,而那些能够灵活适应并快速调整的企业,将在这场变革中脱颖而出。
许多公司已经引入了包含基于用量和基于成果的创新定价方式,以下是一些案例:
  • Salesforce 已宣布其 Agentforce 套件以每次对话 2 美元的价格定价,而 Zendesk 现在对每次 AI 自主解决客户问题收取 1.5-2 美元。
  • 像 Sierra、MavenAGI、Decagon 和 Crescendo 这样的客户服务 Agent 已经开始基于成果(如已解决的工单)定价。
  • Reserv 提供 AI 驱动的理赔处理服务,已经开始根据已开启和执行完毕的理赔数量定价。
  • Synthesia 这样的内容生成应用按生成的视频时长收费,而像 Imagen 和 Aftershoot 这样的编辑工具则按编辑次数收费。

未来发展方向

我们相信,本文所概述的框架为创业者和投资人提供了一个强有力的视角,用以思考如何在应用层面实现 AI 驱动的差异化优势。然而,真正的突破将来自那些能够以全新方式融合这些维度的企业家——他们从根本上重新构想工作方式。
尽管为现有产品改造并加入更先进的功能仍然是必要的,这一过程也将创造显著的价值,但如果想要孕育出能长期超越当今企业软件领导者的公司,则需要彻底的重新创新。比如,一个基于计量收费的单一画布应用,“永远在线”的多模态体验,将目前分散的服务功能整合到一个无缝的统一界面中。
这种颠覆性的愿景不仅需要在产品设计上具备突破性的思维,还要求对技术栈的每一层进行重大改进。要实现这样的未来,需要基于 Scaling Law 的假设成立,以推动前沿模型能力在未来几年内持续提升。
同时,还有一些艰巨但不那么引人注目的任务需要解决,例如提升现有模型的性能、减少幻觉、确保模型的对齐与合规、改进安全性、降低推理成本等等。尽管这些挑战看似复杂,但令人鼓舞的是,它们都是已知的问题。
我们投资组合中的几家公司领导者向我们保证,随着成本的持续下降,即便仅基于当前一代模型的能力,也仍然有数年的创新空间可以挖掘。尽管生成式 AI 的具体发展轨迹仍充满不确定性,但可以合理预期,其能力不会停滞不前。
如果我们以“可能会有什么好的发展”的视角来展望未来,企业软件的形态可能会发生深刻的转变:
  1. 未来的软件体验将更加无缝,用户能够通过单一界面完成多种任务,而无需在多个工具之间切换;
  2. 多模态交互将成为主流,文本、语音、图像和视频将被自然地结合起来,使用户能够以更加直观的方式与应用互动;
  3. 工作流编排将变得更加动态和智能化,软件能够根据用户的需求实时生成个性化的解决方案,而不再局限于固定的功能模块;
  4. AI  Agent 也将从辅助工具转变为深度协作的伙伴,能够主动参与决策和执行。
  5. 商业模式也将更加灵活,基于席位、消费和成果的混合定价模式将进一步优化,以确保价值与成本的透明匹配。
生成式 AI 的未来充满潜力,但要实现这些愿景,需要技术与商业模式的双重创新。从提升模型能力到优化用户体验,再到重塑定价体系,每一步都至关重要。那些能够驾驭这些挑战并大胆重新定义企业软件的企业家,将有机会推动行业迈向一个全新的时代。

图片


那么我们如何实现这个目标?无论何时出现,GPT-5 级别的模型都将改变人们对 AI 发展轨迹的看法,不论这些模型是超出还是低于预期。打破基准和新出现的能力将释放无限乐观情绪,而渐进式的改进可能会在短期内抑制预期和估值。
无论如何,在未来几年内,我们将更清楚地了解什么可行、什么不可行,以及成本如何。自研和购买大模型相关技术的公司将能够相应地制定计划。虽然他们确实在“不停地在为自己说好话”,但我们同意 Sam Altman 和 Greg Brockman 表达的观点,即模型能力将持续提升,开发 AI 应用的公司应该基于这个假设来经营自己的业务。
然而,正如我们近几个月所见,我们不一定需要在模型名称后面看到更高的数字才对未来感到兴奋。当我们询问产品负责人他们对未来几年最期待什么时,他们谈到了推理研究的方向,以及这可能如何加速从语义理解到更深层次思考再到真正的自主性的进展。

图片


模型的行动能力、延长思考时间的需求,以及其他模态在追赶文本领域进展过程中所带来的突破,都为应用层在框架的各个维度上实现差异化提供了更多机会。
这些变化肯定会催生新的研究领域,开启应用层面的实验新时代,这无疑是令人振奋的。开发者的工具库正在以惊人的速度扩展,几乎每周都会涌现出新的可能性,他们如今能够以前所未有的方式融合产品架构、模型、用户界面、公共与私有数据源以及交付机制,技术变革的速度之快让人目不暇接。
然而,在许多领域,广泛应用的进展可能比预期更为缓慢。许多试图重塑工作流程的努力注定会失败,AI 并不会颠覆现有企业,反而可能进一步巩固当前软件类别中领导者的地位。
然而,那些能够快速整合技术并展现创新功能的应用程序和 AI Agent 公司,将通过组合式创新脱颖而出,成为定义即将到来的 AI 应用时代的重要力量。