撰文 | 李信马
题图 | 百度世界2024
11月12日,在上海的世博中心,百度创始人、董事长兼首席执行官李彦宏带着他对人工智能最新的见解,还有两项 AI 重磅技术亮相「百度世界2024」。
自2022年11月30日 OpenAI 发布 ChatGPT 以来,大模型的风已经在全球刮了两年,衍生出了不同的发展方向和路径。长期呼吁关注和投入人工智能的李彦宏,在去年9月7日,曾被《时代》周刊与特斯拉CEO埃隆·马斯克、英伟达创始人兼CEO黄仁勋、Open AI CEO萨姆·奥特曼等一并评为全球AI领袖。在中国,百度也是这一轮 AI 浪潮当之无愧的领头羊。
全球AI全景图 资料来源:Frost&Sullivan
但近一年来,李彦宏却成为大模型领域的“异议者”,在赛道“百模大战”正火爆的时候,他密集的喊话行业:
“没有构建于基础模型之上的、丰富的AI原生应用生态,大模型就一文不值。”
“不断地重复开发各种各样的基础大模型,是对社会资源的一个极大浪费。”
“大模型对于ToB业务的改造,比互联网对于ToB的影响力要大一个数量级。”
对从业者和投资人来说,这像是先上车的人要焊死车门,而在不断地泼冷水。不过,随着时间的推移,他的“异议”却逐渐被验证。许多人期待已久的大模型“超级应用”并没有出现,反倒是行业开始挤泡沫,复制上一轮移动互联网成功的路径越来越不现实,而他曾反复强调的,比如AI要注重应用、关注智能体等,正逐渐成为行业的共识。
24个月过去,已经有人开始怀疑,这场全球性的大模型狂热,究竟是一场新的技术革命,还是新一轮泡沫?李彦宏却在现场给出了文心大模型的日均调用量变化曲线图——这个数字已经超过了15亿,陡峭的峰线足以证明,百度走在了正确的路上。
那么在百度的主场,李彦宏又带来了怎样的新技术和新见解呢?
01. 两大“超级有用”AI技术
“过去24个月,AI行业的最大变化是什么?是大模型基本消除了幻觉。”
去年3月文心一言发布时,百度曾表示其特色是知识增强、检索增强(RAG,Retrieval-augmented Generation),后者逐渐成为了行业的共识,并让大模型大大减少“一本正经的胡说八道”。
不过,文字生成有所改善,图片生成却依旧一言难尽,经常会是“一眼假”。而这次,李彦宏带来了检索增强的文生图技术(iRAG,image based RAG),用于解决大模型在图片生成上的幻觉问题。通过将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片,“整体效果远远超过文生图原生系统,去除了机器味儿”。
在现场,李彦宏展示了一幅由文心大模型生成的图片。(提示词:“画一张大众揽巡汽车飞越长城的图片,写实风格。”)通过文心iRAG技术,无论是车的车型车标,还是作为背景的长城均未出现错误或变形的幻觉问题。
这样的图片稍经调整就可以用在品牌宣传上,以前拍一组海报动辄要大几十万,现在的成本接近于零。凭借“无幻觉、超真实、没成本,立等可取”等优势,文心 iRAG 在影视作品、漫画作品、连续画本、海报制作等应用场景中都有广泛的潜在价值。
随着基础模型能力就绪,人类将迎来AI应用的群星闪耀时刻,李彦宏认为,“智能体是AI应用的最主流形态,即将迎来它的爆发点”,就像PC时代的网站、移动时代的自媒体账号,在AI原生时代,智能体将成为内容、服务和信息的新载体,百度也是少有的把智能体作为最重要战略方向的顶级科技公司。
以公司类智能体为例,可以根据顾客的需求推荐相应产品,在服务方面,也能更直接、快速地响应需求,大幅地提升互动营销的效率,比亚迪的官方智能体上线后,销售转化率提升了119%。
此外,李彦宏还展示了角色、工具和行业等多类智能体的特色功能及使用场景。例如与真人主播几乎没有区别的直播数字人,百度文库和百度网盘联合打造的工具类智能体“自由画布”,还有法律智能体“法行宝”等。
另一项重磅发布的AI技术,就是无代码工具“秒哒”。这是一个不需要写代码就能够实现任意想法、由大模型和智能体组成的全新的软件,李彦宏称之为“迄今为止人类历史上最复杂的多智能体协作工具”,包括无代码编程、多智能体协作以及规模化地调用各种的工具等能力。
无代码编程,是指由大模型直接生成代码,不需要人写一行代码;多智能体协作,是基于文心大模型的思考和规划能力,实现对不同智能体的调度和编排;多工具调用,是通过文心大模型的工具调用能力,可调用网页检索、iRAG、地图API等各类型工具。
李彦宏现场通过“秒哒”搭建了一个活动报名系统,开发过程中,小组长、策划、小编、程序员和质检员五个智能体互相协作,协同完成策划、内容和开发等各种工作,还能自动识别bug、调用各种工具。
“只要有想法,你就可以心想事成,我们将迎来一个前所未有的,只靠想法就能赚钱的时代。”
这显然将极大提升人类的工作效率,也显示了百度对 AI 的态度:“我们不是要推出一个‘超级应用’,而是要不断地帮助更多人、更多企业打造出数百万‘超级有用’的应用。”
这样的 AI ,才能真正带来生产力的无限扩张,称得上是产业革命级的机会。
02. AI:百度的过去和世界的未来
在多本有关人工智能的书籍中,笔者都曾看过一个相同的故事——
“深度学习之父” Geoffrey Hinton 和两名学生的公司,曾被几家顶级科技公司秘密竞标,其中百度是最早接触 Geoffrey Hinton 的公司,但 Geoffrey Hinton 由于种种原因,最终选择了Google(坊间传闻因其身体状况不适合远洋航班)。
后来 Geoffrey Hinton 在2018年获得了图灵奖,在2024年又获得了诺贝尔物理学奖,而他的学生之一,就是 OpenAI 的联合创始人兼首席科学家 Ilya Sutskever。
在当天下午,又一次有记者和李彦宏聊起了这个话题,李彦宏回忆道:“Geoffrey Hinton后来选择加入Google,不是因为我们不愿意出更多的钱,而是他自己更愿意在美国呆着。但是他没有来,我们还是想要真正的大咖能够加入百度,所以后来就找了吴恩达,吴恩达来的理由其实也比较简单,他当时在Google,做谷歌大脑,想买更多的GPU,Google说不行,太贵了。我们说你来,随便买,他就来了。”
在科技上有远见,尊重人才而且舍得花钱投入,这就是百度。
2013年1月,在百度年会上,李彦宏宣布成立深度学习研究院并自任院长,并在次年邀请吴恩达加入任研究院首席科学家。百度对人工智能超过10年的投资和布局里,无数的AI人才进入百度被培养,最终流动起来,推动了AI行业的发展。
全球人工智能大佬杨立坤曾在著作《科学之路》中赞扬“百度是最早部署商业化深度学习系统的大型公司之一,领先于谷歌和微软”。
长期的技术积累,让百度在大模型领域具备先发优势。文心大模型自发布以来不断迭代和快速增长,上文提到了日调用量超过15亿,文心智能体平台也有15万家企业和80万开发者入驻,百度新搜索成为智能体分发最大入口,日均分发已超1000万。
在人工智能领域,我们总是听到李彦宏的声音,有统计,作为全国政协委员的李彦宏,在连续八年“两会”中提出了13份AI相关提案,还有海量涉及AI的公开演讲和发声。在上午聚焦技术和应用的演讲之后,面对记者们的问题,李彦宏表示:“其实讲模型能力,我也可以讲一个小时甚至更长,我也不认可自己就是‘纯AI现实主义者’。”
事实上,百度同样将很多研发资源投入到基础能力等理想主义者看重的领域,只是李彦宏觉得“没有必要讲只有极少数人才能够听懂的东西”,他需要讲能让更多的人——几千万甚至几亿人——用到和受益的东西。比如“秒哒”这样,能够让普通人也能拥有原本金字塔尖上的人的能力,这是他最期待的产品,也是他更长期的技术理想。
2024年快结束了,对2025年,李彦宏预计,在AI的各个层面,比如芯片、框架、模型、应用上,都会有渐进式的进展,汇聚到更清晰的方向上。在采访最后李彦宏总结:“人工智能很像是一次新的工业革命,这意味着它不是三五年就结束,不是一两年就出现‘超级应用’,它更像是(花)三五十年对于整个社会的方方面面(进行)一个非常彻底的重构。在这个过程当中,我们既需要耐心,又需要大的投入,同时需要不断的传播这种火种,让越来越多的人,越来越多的组织和公司,能够理解这件事情对他们的意义,并且很好的利用这些新的技术能力,给自己的组织、自己的公司创造出来更多的价值。”