应用来了！李彦宏发布两大“超级有用”AI技术！

DoNews

2024-11-13 19:18发布于北京DoNews官方账号

撰文 | 李信马

题图 | 百度世界2024

11月12日，在上海的世博中心，百度创始人、董事长兼首席执行官李彦宏带着他对人工智能最新的见解，还有两项 AI 重磅技术亮相「百度世界2024」。

自2022年11月30日 OpenAI 发布 ChatGPT 以来，大模型的风已经在全球刮了两年，衍生出了不同的发展方向和路径。长期呼吁关注和投入人工智能的李彦宏，在去年9月7日，曾被《时代》周刊与特斯拉CEO埃隆·马斯克、英伟达创始人兼CEO黄仁勋、Open AI CEO萨姆·奥特曼等一并评为全球AI领袖。在中国，百度也是这一轮 AI 浪潮当之无愧的领头羊。

全球AI全景图资料来源：Frost&Sullivan

但近一年来，李彦宏却成为大模型领域的“异议者”，在赛道“百模大战”正火爆的时候，他密集的喊话行业：

“没有构建于基础模型之上的、丰富的AI原生应用生态，大模型就一文不值。”

“不断地重复开发各种各样的基础大模型，是对社会资源的一个极大浪费。”

“大模型对于ToB业务的改造，比互联网对于ToB的影响力要大一个数量级。”

对从业者和投资人来说，这像是先上车的人要焊死车门，而在不断地泼冷水。不过，随着时间的推移，他的“异议”却逐渐被验证。许多人期待已久的大模型“超级应用”并没有出现，反倒是行业开始挤泡沫，复制上一轮移动互联网成功的路径越来越不现实，而他曾反复强调的，比如AI要注重应用、关注智能体等，正逐渐成为行业的共识。

24个月过去，已经有人开始怀疑，这场全球性的大模型狂热，究竟是一场新的技术革命，还是新一轮泡沫？李彦宏却在现场给出了文心大模型的日均调用量变化曲线图——这个数字已经超过了15亿，陡峭的峰线足以证明，百度走在了正确的路上。

那么在百度的主场，李彦宏又带来了怎样的新技术和新见解呢？

01. 两大“超级有用”AI技术

“过去24个月，AI行业的最大变化是什么？是大模型基本消除了幻觉。”

去年3月文心一言发布时，百度曾表示其特色是知识增强、检索增强（RAG，Retrieval-augmented Generation），后者逐渐成为了行业的共识，并让大模型大大减少“一本正经的胡说八道”。

不过，文字生成有所改善，图片生成却依旧一言难尽，经常会是“一眼假”。而这次，李彦宏带来了检索增强的文生图技术（iRAG，image based RAG），用于解决大模型在图片生成上的幻觉问题。通过将百度搜索的亿级图片资源跟强大的基础模型能力相结合，可以生成各种超真实的图片，“整体效果远远超过文生图原生系统，去除了机器味儿”。

在现场，李彦宏展示了一幅由文心大模型生成的图片。（提示词：“画一张大众揽巡汽车飞越长城的图片，写实风格。”）通过文心iRAG技术，无论是车的车型车标，还是作为背景的长城均未出现错误或变形的幻觉问题。

这样的图片稍经调整就可以用在品牌宣传上，以前拍一组海报动辄要大几十万，现在的成本接近于零。凭借“无幻觉、超真实、没成本，立等可取”等优势，文心 iRAG 在影视作品、漫画作品、连续画本、海报制作等应用场景中都有广泛的潜在价值。

随着基础模型能力就绪，人类将迎来AI应用的群星闪耀时刻，李彦宏认为，“智能体是AI应用的最主流形态，即将迎来它的爆发点”，就像PC时代的网站、移动时代的自媒体账号，在AI原生时代，智能体将成为内容、服务和信息的新载体，百度也是少有的把智能体作为最重要战略方向的顶级科技公司。

以公司类智能体为例，可以根据顾客的需求推荐相应产品，在服务方面，也能更直接、快速地响应需求，大幅地提升互动营销的效率，比亚迪的官方智能体上线后，销售转化率提升了119%。

此外，李彦宏还展示了角色、工具和行业等多类智能体的特色功能及使用场景。例如与真人主播几乎没有区别的直播数字人，百度文库和百度网盘联合打造的工具类智能体“自由画布”，还有法律智能体“法行宝”等。

另一项重磅发布的AI技术，就是无代码工具“秒哒”。这是一个不需要写代码就能够实现任意想法、由大模型和智能体组成的全新的软件，李彦宏称之为“迄今为止人类历史上最复杂的多智能体协作工具”，包括无代码编程、多智能体协作以及规模化地调用各种的工具等能力。

无代码编程，是指由大模型直接生成代码，不需要人写一行代码；多智能体协作，是基于文心大模型的思考和规划能力，实现对不同智能体的调度和编排；多工具调用，是通过文心大模型的工具调用能力，可调用网页检索、iRAG、地图API等各类型工具。

李彦宏现场通过“秒哒”搭建了一个活动报名系统，开发过程中，小组长、策划、小编、程序员和质检员五个智能体互相协作，协同完成策划、内容和开发等各种工作，还能自动识别bug、调用各种工具。

“只要有想法，你就可以心想事成，我们将迎来一个前所未有的，只靠想法就能赚钱的时代。”

这显然将极大提升人类的工作效率，也显示了百度对 AI 的态度：“我们不是要推出一个‘超级应用’，而是要不断地帮助更多人、更多企业打造出数百万‘超级有用’的应用。”

这样的 AI ，才能真正带来生产力的无限扩张，称得上是产业革命级的机会。

02. AI：百度的过去和世界的未来

在多本有关人工智能的书籍中，笔者都曾看过一个相同的故事——

“深度学习之父” Geoffrey Hinton 和两名学生的公司，曾被几家顶级科技公司秘密竞标，其中百度是最早接触 Geoffrey Hinton 的公司，但 Geoffrey Hinton 由于种种原因，最终选择了Google（坊间传闻因其身体状况不适合远洋航班）。

后来 Geoffrey Hinton 在2018年获得了图灵奖，在2024年又获得了诺贝尔物理学奖，而他的学生之一，就是 OpenAI 的联合创始人兼首席科学家 Ilya Sutskever。

在当天下午，又一次有记者和李彦宏聊起了这个话题，李彦宏回忆道：“Geoffrey Hinton后来选择加入Google，不是因为我们不愿意出更多的钱，而是他自己更愿意在美国呆着。但是他没有来，我们还是想要真正的大咖能够加入百度，所以后来就找了吴恩达，吴恩达来的理由其实也比较简单，他当时在Google，做谷歌大脑，想买更多的GPU，Google说不行，太贵了。我们说你来，随便买，他就来了。”

在科技上有远见，尊重人才而且舍得花钱投入，这就是百度。

2013年1月，在百度年会上，李彦宏宣布成立深度学习研究院并自任院长，并在次年邀请吴恩达加入任研究院首席科学家。百度对人工智能超过10年的投资和布局里，无数的AI人才进入百度被培养，最终流动起来，推动了AI行业的发展。

全球人工智能大佬杨立坤曾在著作《科学之路》中赞扬“百度是最早部署商业化深度学习系统的大型公司之一，领先于谷歌和微软”。

长期的技术积累，让百度在大模型领域具备先发优势。文心大模型自发布以来不断迭代和快速增长，上文提到了日调用量超过15亿，文心智能体平台也有15万家企业和80万开发者入驻，百度新搜索成为智能体分发最大入口，日均分发已超1000万。

在人工智能领域，我们总是听到李彦宏的声音，有统计，作为全国政协委员的李彦宏，在连续八年“两会”中提出了13份AI相关提案，还有海量涉及AI的公开演讲和发声。在上午聚焦技术和应用的演讲之后，面对记者们的问题，李彦宏表示：“其实讲模型能力，我也可以讲一个小时甚至更长，我也不认可自己就是‘纯AI现实主义者’。”

事实上，百度同样将很多研发资源投入到基础能力等理想主义者看重的领域，只是李彦宏觉得“没有必要讲只有极少数人才能够听懂的东西”，他需要讲能让更多的人——几千万甚至几亿人——用到和受益的东西。比如“秒哒”这样，能够让普通人也能拥有原本金字塔尖上的人的能力，这是他最期待的产品，也是他更长期的技术理想。

2024年快结束了，对2025年，李彦宏预计，在AI的各个层面，比如芯片、框架、模型、应用上，都会有渐进式的进展，汇聚到更清晰的方向上。在采访最后李彦宏总结：“人工智能很像是一次新的工业革命，这意味着它不是三五年就结束，不是一两年就出现‘超级应用’，它更像是（花）三五十年对于整个社会的方方面面（进行）一个非常彻底的重构。在这个过程当中，我们既需要耐心，又需要大的投入，同时需要不断的传播这种火种，让越来越多的人，越来越多的组织和公司，能够理解这件事情对他们的意义，并且很好的利用这些新的技术能力，给自己的组织、自己的公司创造出来更多的价值。”

查看原图 412K