2024年10月21日,伦敦迎来了备受瞩目的微软AI Keynote大会。作为科技界的风向标,这场盛会吸引了全球目光。微软CEO萨提亚·纳德拉(Satya Nadella)登台发表了激动人心的关于AI的未来发展和AI代理的革命性应用演讲。
纳德拉开篇便抛出了一个振奋人心的消息:微软推出了全新的自主AI代理,旨在全面提升销售、服务、财务和供应链团队的能力。这一举措无疑将为企业管理带来质的飞跃。紧接着,纳德拉引入了一个引人深思的概念——"缩放定律"。他将其比作AI领域的"摩尔定律",虽然不是严格的物理定律,但其影响力却是实实在在的。根据这一定律,我们的计算能力每六个月就会翻倍。纳德拉特别强调,这种指数级增长不仅源于硬件的进步,更得益于数据利用和算法优化方面的突破性发展。
纳德拉指出,这场技术革命主要体现在三个方面:
计算界面的根本性变革:自然语言处理和多模态技术的出现,使得包括图像、语音、文本和视频在内的各种输入输出方式成为可能,彻底改变了人机交互的方式。 推理能力的显著提升:以最新的o1模型为例,它为AI带来了前所未有的规划和推理能力。这意味着AI不再仅仅是数据处理工具,而是能够理解和分析复杂信息的智能系统。 上下文理解和记忆能力的增强:AI系统now能够处理更丰富的上下文信息,并具备长期记忆能力,这为处理复杂任务和长期规划奠定了基础。
未来一个由智能代理组成的丰富AI生态系统,这些代理有的服务于个人,有的则在团队、组织甚至跨组织的环境中发挥作用。他相信,这个充满活力的AI代理网络将极大地增强我们现有的数字基础设施和工具,为人类社会带来前所未有的变革和机遇。
演讲文稿
早上好,回到伦敦和英国的感觉真棒。尤其是在这样一个时刻,当新的技术平台正在诞生时,能够谈论它并看到它在英国的影响真是令人兴奋。事实上,我今天早上还在回忆,微软在英国已经有四十年的历史了。我自己在过去的三十年里也一直来到英国。我记得我第一次来到这里是在90年代早期,虽然当时我并没有做主题演讲,只是在一个分会场上讲解Excel,真是让人感慨万千。
新技术转折点—AI
我第一次来时,正值PC客户端服务器的诞生,之后经历了网络、互联网,再到云计算和移动技术。而现在,我们处在一个新的技术转折点——人工智能的开端。我觉得在这样的时刻,回归技术背后的核心驱动力是非常重要的。我还记得1992年加入微软时,我对技术发展的理解几乎完全基于摩尔定律。当时,我参加了1991年的PDC大会,感慨万分,我清楚地知道接下来会发生什么:x86架构不仅会征服PC领域,还会赢得服务器市场。事实也确实如此,到90年代末,它几乎统治了市场。
现在,类似的情况也在发生,不过这次的驱动力是我们称之为“缩放定律”的新法则。这是一条经验法则,就像摩尔定律,它也不是物理定律,而是基于观察的经验法则。但是它的效应是真实的。同样的,扩展定律显示出每六个月,我们的计算能力翻倍。事实上,我经常思考性能,比如每美元每瓦特能处理的“token”数量,这几乎成为了新的衡量标准。我们可以看到,每六个月性能翻倍,而这不仅仅是因为计算能力的提升,更重要的是我们在如何使用数据和算法方面的技术进步。
这个技术变革在三个方面体现得尤为明显。首先,计算界面正在发生根本性的变化。当你拥有自然语言处理技术,甚至是多模态技术时——包括图像、语音、文本、视频等输入输出——这意味着每一个计算界面都将发生变化。其次,我们的推理能力也在不断增强。以最近推出的o1模型为例,它为我们带来了规划和推理能力。在过去的七十年里,计算的历史就是数字化人、地点和事物,并从中找到规律。而现在,我们拥有了全新的推理引擎,能够帮助我们理解这些数据。最后,我们可以为这些引擎提供更多的上下文和记忆。所以,将这些因素结合在一起,我们正在构建一个非常丰富的人工智能世界——一个充满智能代理的世界。这些智能代理有些是个人代理,有些则在团队、组织或业务流程的背景下工作,甚至是跨组织合作的代理。这种丰富的AI代理网络将增强我们今天拥有的所有数字基础设施和工具。
当然,有了这些技术,最关键的问题是我们将如何利用它们。最重要的是,我们如何将它们转化为我们的使命,无论是作为公司、个人还是组织,都需要借助这些技术来赋能人们,让他们能够完成以前技术时代无法完成的任务。对我来说,这就是最终的考验——我们能否用这些技术让生活变得更加美好,无论是科学发现还是生产力提升。正是在这个国家,工业时代和工业革命的一些最重要的技术都被发明出来。现在的问题是,我们能否通过技术再次实现那种深远的影响,无论是在科学发现、生产力提升,还是其他领域。我们的目标是赋能每个人和每个组织,特别是在英国的企业,让他们能够实现更多——无论是提高小企业的生产力,还是帮助大型跨国企业在全球竞争中变得更具竞争力,或者是公共部门变得更加高效,提升健康和教育成果。这才是我们的使命所在。
为了实现这一目标,我们正在构建三个平台。第一个是Copilot。在我们看来,Copilot是人工智能的用户界面,这是我能想到的最简单的描述方式。然后是Copilot和AI技术栈。通过这些技术栈,您可以构建自己的AI、智能代理和Copilot,我们提供了完整的技术栈支持。最后,我们要讨论的是一系列新的设备,也就是这些Copilot设备。
AI产品Copilot
我想从每个平台开始谈起,首先是Copilot。正如我所说的,Copilot和Pages,如果你从这个想法开始,即这个丰富的智能代理世界最终需要与我们接触,而我们也需要与它接触,那么这就意味着你需要一个用户界面。就像PC或手机曾经是数字技术的用户界面,或者是PC和手机上的应用程序是我们与数字技术互动的界面一样,Copilot就是所有这些人工智能的用户界面。
即使在一个有很多自主工作的智能代理的世界中,它们也需要向我们报告异常情况,或者获得我们的许可。问题是,这如何发生?这通过一个新的组织层次实现,特别是在工作方式上的变化。事实上,工作流程和工作成果都会发生变化。一个很好的例子是我们上个月推出的“Pages”。就像90年代我们推出的Excel或Word一样,这些工具基本上是创建新成果的编辑器。而“Pages”则是第一个以人工智能为核心的用户体验,我可以通过搜索网络或我的工作内容来检索信息,然后将其放入Pages中,生成一个可以在整个组织中共享的文档,并且我可以与人工智能和人类一起合作。
我通常用的比喻是,我用人工智能来思考,并与同事一起完成工作。这就是新的工作流程。那么以前的工作流程是什么呢?以前,我是独自思考,创建工作成果,然后在整个组织中分享并进行合作。而现在,我不仅有了人工智能作为认知放大器来帮助我完成工作,我还能创建成果并与同事合作,以完成任务。所以这就是Copilot时代的开始,它不仅仅是一个聊天界面,它展示了聊天只是获取信息的一种方式,并且它会引导我们进入更加复杂的工作流程和合作模式。此外,Copilot + 智能代理和Copilot Studio的组合,不仅仅是创建某个特定的工作成果、编辑或工作流程,你还可以通过创建的任何智能代理扩展Copilot。实际上,Copilot Studio是一个低代码、无代码的平台,让你可以轻松地创建智能代理。这些智能代理基于丰富的数据源构建,实际上,大多数组织中最重要的数据库就是包含你所有办公信息的数据库。谁为谁工作?我的项目团队有哪些同事?有哪些与特定团队或项目相关的文档?这些文档、人员和项目之间的关系是什么?所有这些信息以及你所有的电子邮件、Teams聊天记录,实际上都存储在一个名为Graph的数据库中,或者说是通过Graph公开的M365中的数据基础。你可以将这些数据与Dataverse结合使用,这其中包含了所有业务流程数据,以及可能通过Fabric收集的数据,所有这些都可以用于智能代理。
一个简单的例子就是,假设你想要创建一个与Copilot集成的现场服务智能代理。你只需要给它一个系统提示,告诉它“我希望你成为一个现场服务智能代理”,然后将其指向一个SharePoint站点,该站点中有与现场服务相关的一些文档,再添加一些额外的数据源,例如Dynamics作为现场服务的记录系统。这样你就可以输出一个现场服务智能代理,你可以像与其他Copilot对话一样与它对话。这种简便性,就像过去我们创建Excel表格一样,并没有什么神秘之处。就像你可以创建一个Excel表格来进行预测一样,现在你可以使用像Copilot Studio这样的低代码、无代码工具创建人工智能代理,并将其集成到Copilot中。你甚至可以将这些看作是新的应用程序形式,而且我们每个人都可以创建这些应用程序。因此,你不需要等待其他人为你创建这个应用程序,你自己就可以使用它。所以,这就是我们正在构建的Copilot和Copilot + 智能代理的生态系统。
Copilot应用场景
这些技术的影响是巨大的。事实上,在微软内部,如果我来看一下Copilot的影响,尤其是在不同的职能部门上,比如销售和市场营销,我们现在已经有了量化的结果,显示出生产率有两位数的提升。这意味着在业务层面上带来了巨大的影响。再比如客户服务、IT帮助台、HR帮助台,这些领域中,我们的员工参与度、员工满意度和客户服务代表的满意度都在提升,而成本浪费则在下降。同样的情况也发生在法律部门和财务部门。因此,现在我们有了大规模的证据表明,这些工具正在从根本上改变工作方式,既提高了价值,也减少了浪费。
可以说,过去工业公司通过精益生产实现的变革,现在终于在认知工作领域大规模实现了。而且,这种变革也在英国发生。事实上,我有机会见到了许多已经在广泛使用这些技术的客户,看到这些本地Copilot的案例,真的很振奋人心。我有机会见到了Clifford Chance,一家法律公司,他们解释了并购交易流程中如何使用Copilot和Copilot Studio来创建智能代理,从而简化整个过程。我还见到了联合利华(Unilever)。我之前并不知道,像联合利华这样拥有全球超过30亿用户、销售众多产品的公司,他们的一个重要工作是撰写创意简报。创意简报的精确性对他们的市场营销影响至关重要。然而,撰写创意简报的繁琐工作、效率和准确性正是他们致力改进的地方,他们创建了一个极其出色的工具,极大地改变了创意简报的准备工作和质量。这些只是我们客户中的两个例子,他们已经在利用这些AI代理和Copilot,推动企业内部的高影响力生产力。
当然,今天对我们来说更令人兴奋的是,我们正与英国政府合作,确保这项技术不仅在私营部门得到推广,也将在公共部门广泛应用。因为我认为,我们可能对服务政府的影响是最重大的,无论是在医疗、教育、能源,还是其他任何政府部门,都将通过这项技术实现转型。而这一切的开始就是将这些技术交到公务员手中,让他们在自己的工作中使用它们。因为当我谈论减少繁琐工作、提高生产力,这直接关系到我们的公民所能获得的服务,这就是产生影响的地方。因此,我们对这个宣布感到非常激动。
实际上,谈到技能提升,英国在人工智能领域的技能提升——这是来自LinkedIn的数据——我昨晚看到了这些数据,发现我们现在掌握人工智能技能的人数呈现单调递增,自2019年以来增长了88%,这正如Clare在开场致辞中提到的那样,反映了这个经济体的结构性优势。因为英国的人力资本和正在建设的基础设施,能够帮助英国在人工智能时代中实现腾飞。看到这一点,真是令人振奋。当然,我们不会止步于此。接下来让我们感到无比兴奋的是Copilot Studio的自主代理。今天我非常高兴地首次宣布,我们在人工智能平台上迈出了下一大步,推出了自主代理的相关公告。事实上,今天你们将看到我们不仅发布了帮助创建这些自主代理的工具,更重要的是,我们还在为像Dynamics 365这样的产品构建自主代理。这些代理可以在需要人机交互时与Copilot对接,成为一个用户界面,但也可以独立运行。
AI代理技术栈
现在,我想转到下一个平台,也就是Copilot加智能代理的技术栈,或者说AI平台。最终,我们希望每一层技术栈都能在Copilot、Copilot Studio和刚刚展示的智能代理之下,完全开放给每一个软件开发者,让他们能够构建自己的AI系统。而这一切始于提供最广泛、最全面的基础设施。
当我们谈到Azure时,我们把它视为全球的计算机。我们正在60多个地区扩展它,在英国就有UK West和UK South。事实上,去年我们宣布了25亿多美元的投资以扩大这些基础设施,而且这将是一个持续的过程。我们会把最好的基础设施带到英国,包括传统计算和AI计算,以确保你们能够获得最优的基础设施。
我们正在做很多工作来确保这些基础设施为AI工作负载进行了优化,从最底层的芯片开始,比如我们与NVIDIA的合作。实际上,我刚刚还在看即将推出的GP-200,这些芯片已经在试点阶段,配有液冷技术。事实上,我们借鉴了一些液冷技术,因为我们在自有芯片Maia的开发中也使用了液冷,现在这些技术跨越了不同的芯片供应商。我们还与AMD合作,在芯片层有着非常棒的合作伙伴关系。接着,我们会进一步优化,无论是训练还是推理,确保你们能够构建出自己的Copilot。大量的基础设施建设工作正在进行中。对于任何开发AI应用程序的开发者来说,另一个非常重要的考虑因素就是数据。无论是用于训练还是推理,或是检索增强生成,你都需要处理好自己的数据。这意味着你需要能够将所有数据迁移到云端,并与AI相结合。实际上,AI计算在哪里,数据就会在哪里。因此,我们正在确保无论你是使用Oracle、Snowflake还是其他数据源,你都能将它们带到云端。
在此基础上,我们还在构建一流的云原生数据基础设施,涵盖了从OLTP(在线事务处理)到分析的所有内容,比如Cosmos DB、SQL、Postgres,或者为AI时代打造的Fabric数据分析系统。我们的数据基础设施已经成为AI发展的关键所在。实际上,考虑到AI与数据的结合,没有任何AI应用是无状态的,尽管AI API是无状态的,但一旦它们与实际应用和工作负载结合,就变得非常有状态。以ChatGPT为例,它是Cosmos DB和Azure Search的最大用户之一。正如你所看到的,一旦你构建了像Copilot或ChatGPT这样的应用程序,你就需要一个强大的数据基础设施来支撑。我们还在构建一个应用服务器。如果你已经有了基础设施和数据,接下来你需要一个应用服务器。事实上,我记得以前来这里时曾讨论过.net技术,我想Scott稍后会谈到AI。他曾经参与了许多我们的.net工作。而现在,我们再次迎来了一个新的应用服务器时代。这次,我们为云原生应用构建的应用服务器,支持容器、应用服务等,AKS和函数仍然是不可或缺的部分。事实上,回顾ChatGPT的底层架构,每个GPU背后都有一套与AKS配合的常规计算资源。因此,应用服务器是起点。
接着是一个新的AI应用服务器,它从广泛的模型选择开始。我们对与OpenAI的合作感到非常兴奋,他们的创新令人瞩目,无论是o1模型还是GPT-4o,都是最新的前沿模型。此外,还有开源模型,例如Llama和Mistral,或者Cohere等闭源供应商。你将拥有最广泛的模型选择。而在拥有了最广泛的模型之后,AI应用服务器的下一步就是支持监督微调(SFT)。我们甚至提供了微调即服务,帮助你在所有这些模型之上进行微调,以便你将其集成到你的应用程序中。同时,我们还提供了用于检索增强生成(RAG)的工具,像Azure Search这样的工具帮助你将应用程序与数据结合起来,确保在使用大语言模型时,数据能够很好地支撑这些应用。此外,我们还提供了确保你的应用程序有适当防护措施的服务。我们非常兴奋地看到在整个应用服务器领域的创新。你有传统的应用服务器,AI应用服务器,还有最好的工具链。让我最自豪的是,自从1975年到今天,微软一直最兴奋的就是我们为软件开发者构建的工具。这是我们的核心所在。通过VS Code、GitHub和GitHub Copilot,软件开发者的工具链已经进入了一个全新的前沿领域。
事实上,我最近看到的一件最酷的事情是,随着o1模型的加入和GPT-4o的到来,GitHub Copilot可以利用AI进行下一层的优化。你在屏幕上看到的,是我们为GitHub Copilot使用的自动编码器正在被o1优化。想象一下这个递归过程——我们正在用AI来构建AI工具,从而构建更好的AI。这真的是一个全新的前沿领域。实际上,GitHub——我记得下周或者再下一周就是GitHub Universe大会了。我迫不及待地想看到在GitHub Copilot Workspace上我们会展示什么。事实上,在英国,我们现在有370万GitHub开发者,增长速度非常快。英国是全球第五大GitHub开发者社区,增长率为22%,真是令人欣喜。我觉得我们即将迎来一个真正的转折点。我总是开玩笑说,现在每个周末我都可以回去编程,感谢GitHub Copilot,现在任何人都可以获取代码库,克隆它,然后在有限的时间内完成一个项目。这真是令人振奋的事情。
企业布局AI
今天早上,我有机会见到了许多我们的合作伙伴。首先是英国心脏基金会,他们长期以来一直在使用机器学习和人工智能,成果非常出色。他们甚至还使用了Azure语音服务来模拟紧急电话的情况,我以前没有意识到这对于帮助人们适应拨打紧急电话有多么重要。这是一个很好的例子,展示了如何在关键时刻赋能人们。
汇丰银行展示了很多客户案例,其中一个案例展示了他们的客户经理在信用审批过程中如何使用他们开发的AI工具。这些AI工具不仅集成了他们的移动应用程序,还与客户经理使用的应用程序相结合,大大简化了整个流程。
我还有机会见到了Mondra的开发者,他们正在做一些令人难以置信的事情。他们正在为英国及其他地区的每一家零售商构建一个食物安全和供应链的数字孪生系统,以改善可持续性。这个产品在现实世界中将产生巨大的影响,令人振奋。
还有一个我很久以来一直关注的初创公司Wayve,他们采用了一种AI优先的方式来开发ADAS(高级驾驶辅助系统)。他们从第一性原理出发,使用全新的AI驱动方法来思考自动化。你会看到,技术扩散的速度非常快,现在已经不再是“这些技术即将到来”,而是“它们已经在广泛应用”。一些非常复杂的应用和平台的使用已经在这里得到了展示。
现在,我想转到最后一个平台,也就是Copilot+PC。这是我们推出的Copilot设备和Copilot+PC平台。大约半年前我们刚刚推出了这个平台,我们对此非常激动。这标志着一个全新时代的到来,CPU、GPU和NPU都可以在边缘设备上使用。如果你回顾到目前为止,扩展法则在云端非常有效,但我认为未来,AI时代不仅仅会由云端定义,边缘设备的作用也会越来越大。实际上,在一些模型架构中,我们将看到突破性的进展,允许这种混合使用的分布式架构展开。我们不再将其视为传统的客户端-服务器模式,这种思维已经不再适用。我们必须将其看作一个连续的分布式结构,这也是我们的架构方式。我们不会将Copilot PC看作一个孤立的设备。当然,你可以将其用于隐私保护,但更重要的是,你可以将它与云端的所有操作结合使用,这才是这些设备即将引领的新时代。对于喜欢游戏的朋友来说,未来会非常令人兴奋。当你的GPU全速运转时,你还可以使用NPU处理所有的向量运算。这种应用开发方式正在成为现实,它将成为一个全新的平台。就像当初人们为PC开发新应用一样,现在我们将进入一个NPU+GPU+CPU的世界,这将是一个非常有趣的世界。
AI隐私和安全
我想最后谈一谈贯穿这三个平台的一个核心主题,我认为这非常关键,那就是可信赖的AI,以及可信赖的隐私和安全。技术的信任度将是所有创新推广的核心,如果你不信任它,你就不会使用它,而这对任何人都没有好处。所以我们在做的事情非常明确。首先,我们有一套核心原则,无论是在安全、隐私还是AI安全方面,都有一套具体的原则。但比这些承诺更重要的是,我们正在构建什么样的实际能力来实现这些承诺。
事实上,当你考虑到——比如安全问题,部署一个新的AI模型时,首先要做的就是进行对抗性攻击的测试。这不仅仅是寻找漏洞,而是更多地关注诸如提示注入(prompt injection)这样的攻击方式,这对模型有什么影响?所以,能够模拟对抗性攻击是一个重要的考虑因素。另外,我们还在隐私方面做了许多工作,比如机密计算,这是与最新最先进的模型一起开展的工作。同样地,我们也知道LLM(大型语言模型)有时会产生幻觉,所以在讨论AI安全时,其中一个重要的事情是使用AI来测量输出的真实性。这些都是我们在平台上构建的具体能力,随着我们的进步,软件开发者会对所开发的AI产品充满信任,用户也会对他们使用的产品充满信任。
这对我们来说是核心所在。所有这些都回到了我最初提到的主题,那就是技术最终必须转化为现实世界的影响——一人一企,一步一步地,在英国推动经济增长,真正改善经济体中的成果。因此,我对你们和你们的合作伙伴将利用这些创新所能做出的贡献感到非常兴奋。我也期待在未来的几年中,回到这里看到这些创新的成果。
非常感谢大家!谢谢!
素材来源官方媒体/网络新闻