转自 | 微信公众号“安筱鹏”
2025年3月27日,在由浙江大学人工智能研究所主办,信雅达科技股份有限公司、金科览智科技(北京)有限公司协办的2025 DeepSeek Moment金融行业AI未来科技峰会上,阿里云集团副总裁、科技研究中心主任安筱鹏带来主题分享。以下为分享实录。
所有智能硬件被AI驱动,所有软件被AI重构,只有这两件事情完成了才真正意味着AI的繁荣。 AI的这一轮竞争,考验的不是局部的爆发力,也不是短期的爆发力,考验的是企业的超级耐力和创造力。换句话说你应当以跑百米冲刺的速度跑马拉松,这才是竞争的基本特征。 今天所有的软件企业,无论是AI原生的软件企业,还是传统的SaaS企业、软件企业都面临一个重大的课题,就是如何基于AI重构自己的软件产品。
当我们今天讨论AI的时候,我们经常说它不是一个技术,而是一个时代,它是一次技术产业的革命。什么革命呢?我们认为是三场革命。
第一,计算范式革命。所谓的计算范式革命就是从以CPU为核心,切换到以GPU为核心,当基本的芯片单位切换以后,存储、网络、架构、数据库、调度系统上面的应用全部换了,所以它是一个技术范式从A系统切换到了B系统。
第二,认知协作。互联网的本质是淘宝、天猫、滴滴、谷歌,所有互联网企业都在做一件事,基于信息的精准匹配,构造千行百业新的商业模式。AI大模型的本质是为问题找到答案,给出最短的路径。经常有人会把移动互联网跟AI、大模型放到一个坐标系里去讲,今天有一个APP,日活多少、月活多少,这个很重要。但是我个人觉得这个坐标系找错了,如果我们要从历史上去找一个技术跟今天的AI大模型对比,这个技术应当是集成电路,而不是移动互联网。今天的AI大模型以水源泄地般的方式进到千行百业。
第三,人机交互革命。40年前、50年前的时候只有那些懂汇编语言的人才会跟机器交互,后来有了C语言、高级语言,今天的自然语言就是软件代码,可以去控制和优化机器。今天看到很多的模型,需要从一个全局观的角度去看,有5个大模型的赛道:一是语言大模型,比如说Open AI Gpt4o、Qwen 2.5-Max、DeepSeek V3,语言基础模型你可以理解它是一个文科生;第二叫推理大模型,比如Open AI o1、DeepSeek R1、QWQ 32B,可以理解是一个理科生;第三是图片的理解、视频的理解、视频生成各种各样的多模态;第四叫Physics AI,就是自动驾驶、人形机器人;第五是科学大模型。
今天的AI,在过去的十年里能力在持续迭代和演进,2015年图像分类、2017年基础阅读、2020年视觉推理都接似人类专家素养水平。
但是我们看到哪一个AI是比较弱的呢?最右边这条绿线是数学的奥数比赛,为什么它是比较难呢,因为今天衡量一个模型最重要的指标不是你跟他对话能给你提供多大的情绪价值。写一首诗很好,但这不重要,重要的是一个模型的复杂推理能力,这才是它的最重要的北极星指标。刚才讲到语言大模型是一个文科生,去年高考结束以后上海人工智能实验室拉了6个大模型参加了中国高考,结论是勉强能考到中国211的文科院校,大概是这个水平,表现最好的是阿里的通义千问,我们看语文满分150分它考124,英语120分考109,数学满分120分才考70分,GPT4o是73分,是一个文科生。但是架不住学习的速度比较快,三个月之后OpenAI发布了o1,就把一个高中生只有六七十分的水平拉到一个博士生的水平,从一个文科生变成了理科生。
如果说把大模型分成五个赛道,我们看前三个赛道中美的差距有多大呢?我们可以看到,在过去语言模型GPT4发布之后一年时间里大家可以赶上它的水平,现在赶上一个美国最新的模型需要三四个月;在推理模型里面像DeepSeek大概四个月、阿里五个月时间就可以达到这个水平;而阿里的QWQ 32B大概320亿参数,相当于DeepSeek R1的1/20,但性能跟它差不多。还有一个赛道叫多模态,多模态有一组对图片的理解、图片的生成、视频的理解、视频的生成,在这个领域事实上中国已经领先美国,无论是快手的可灵,还是通义千问的图片理解。
这个榜单展示了今天全球最重要的企业的模型性能,可以看到主要就是中美两个国家,在推理模型里面表现最好的是R1,这是在2月份的时候。在语言大模型里面,DeepSeek是第九,通义千问是第七。事实上之前耿总也提到了,我们讲开源大模型的时候,杭州已经成为全球开源大模型的一个领导者。我们看Hugging Face上开源模型的排行榜,前十名的模型都是蒸馏模型,蒸馏模型百分之百都是基于通义做的蒸馏。DeepSeek有六个蒸馏模型,四个是通义,两个是Llama的系列。另外一个指标是很多开发者基于开源的模型,开发了很多衍生模型,今天的衍生模型通义已经超过十万个,超过了Llama,是全球衍生模型开源最多,在过去的两年时间里面,通义千问也开源了两百多个大小不同的尺寸,开源不是一个AI技术的选择,而是一个国家AI发展道路的选择。开源的意义是什么呢,开源的意义就像你去爬珠穆朗玛峰,有一个人派了一架直升机从里面送到5200米珠峰大本营,剩下3000米要自己爬,开源就是那架直升机。美国有一个非常庞大的生态系统,叫Hugging Face,140万个模型,30万个数据集,200多种语言,海量的开发者,而国内开源社区里面最好的就是魔搭社区,开源对中国的普惠普及有非常重要的意义。
我们再看看另外一个话题,如何来看未来大模型的应用?有三个断言、三个判断。如果把时间尺度拉到十年:第一,一切智能硬件会被AI大模型所驱动;第二,一切软件会被AI大模型所重构;第三,一切数据会被AI大模型所激活。我们经常在讲中国大模型、全球大模型的繁荣,我经常问一个问题,你通过什么指标判断大模型的应用是不是繁荣呢?如何来评估和判断AI应用的繁荣?我有一个非常重要的观点,大模型今天在应用的时候赋能千行百业相当于一场足球比赛,需要把AI应用落地,把球踢到对方的球门里面,今天的大模型是后卫,中场是智能硬件,软件才是前锋。所以今天衡量AI大模型应用的标志是软件产业是否足够繁荣,这才是判断中国及全球AI产业应用落地的标志,而不是AI的应用模型本身。AI大模型是一个后卫,偶尔能够通过中场跑到前场把球射进去,但是更重要的是今天的软件,包括今天信雅达外部展台上展示的各种各样的应用系统,本质上在做一件事,就是刚才说的“所有智能硬件被AI驱动,所有软件被AI重构”,只有这两件事情完成了才真正意味着AI的繁荣。
软件的繁荣是AI大模型应用崛起的风向标,我们看到中美的差距是什么呢?模型的能力在缩小,但是应用的差距可能在扩大。今天全球AI的竞争不是模型性能的排行榜,说今天我排第一,明天排第二,这个很重要。但更重要的是市场才是检验技术价值和产品竞争力的终极标准。AI的这一轮竞争,考验的不是局部的爆发力,也不是短期的爆发力,考验的是企业的超级耐力和创造力。换句话说你应当以跑百米冲刺的速度跑马拉松,这才是竞争的基本特征。
我们看看2024年美国AI应用是什么情况呢,2024年OpenAI在40亿、50亿美元,这里面的构成70%是订阅,30%是API的toten调用量,所有美国AI独角兽公司的收入加起来大概在70亿美元。我们问一个问题,国内的独角兽公司的收入是多少?美国相当于我们50倍到100倍。另外一方面我们看到在AI的编程、AI的法律、AI的客服、销售、搜索引擎,细分赛道里面美国已经涌现出一批独角兽公司,为什么会有这么多独角兽呢?因为市场足够繁荣,你才能涌现这么多的独角兽。
前一段时间我看美国硅谷旧金山的大街小巷里面放了一个广告,广告词很吓人,叫“停止雇佣人类,请面试AI销售助理”。目前国内就业形势这么紧张,它还说停止雇佣人类。但是这个销售助理可以完成销售基本工作的95%,它的成本相当于雇佣一个人类的1/2到1/30,它可以连续不断地24小时持续工作,它也不给你闹情绪,你用还是不用呢?你来做选择吧。这是今天带来的新的变化。
还有刚才我提到了在软件编程领域,美国已经有6-8家独角兽公司,工程师们面临很多挑战。美国有一家软件的大V说过一句话,你们这些软件工程师们90%的技能已经变得一文不值,但是你10%的技能应当提升1000倍。我的问题是,仅仅是那些软件工程师吗?可能未来所有的行业都要思考自己员工的能力模型长成什么样子。今天阿里云软件代码的生成30%已经是基于通义灵码的Agent。
刚才我说了软件的繁荣才是今天AI应用的风向标。今天所有的软件企业,无论是AI原生的软件企业,还是传统的SaaS企业,都面临一个重大的课题,就是如何基于AI重构自己的软件产品。我们看到他们也走了两个不同的道路,从产品的开发模式,从交付的流程,从客户的价值、收入的模型、核心的能力都有很大的变化,因为时间关系只讲一点。过去SaaS是怎么收费呢?我们把一个软件安装到一个企业身上,根据用户的数量、用户的时长以租赁的方式收费。今天当Agent来的时候,它的收费模式变了,你完成了某一个具体的任务,我按照完成任务的数量和质量给你计费。举个例子,这里有十万份简历,需要从这些简历里面找出一千份有用的简历,过去人用两三周,现在你找出一千份简历之后,一份简历一块钱,改变了整个业务的模式。
最后我们需要思考一个问题,过去的十年是中国SaaS失去的十年,投资人都头破血流。面向未来的十年,AI到来的时候,我们能否将过去失去的十年找回来呢?当AI跟所有的软件进行重构的时候,数据价值、协作价值、体验价值也会被重构,在某种程度上给我们提供了一次新的重新审视中国软件产业发展的机会。
谢谢。