百度甩出了AI应用全家桶,成色到底如何?

全文3067字,阅读约需9分钟,帮我划重点

划重点

01百度在世界2024大会上发布了检索增强的文生图技术iRAG和无代码工具“秒哒”,旨在提高AI生成图片的可用性和降低使用门槛。

02李彦宏表示,大模型是一次颠覆式的技术革命,他对它的长期前景非常乐观。

03目前,百度智能云已拥有中国最大的大模型产业落地规模,覆盖数十个行业、几百个场景。

04除此之外,百度还发布了首款眼镜——小度AI眼镜,具备第一视角拍摄、边走边问等功能,以文心大模型为技术底座。

05文心智能体平台上,已吸引15万家企业和80万名开发者参与,覆盖的应用场景非常广泛。

以上内容由腾讯混元大模型生成,仅供参考

图片

作者 | 龚岩

编辑 | G3007

在AI大模型应用的元年,百度甩出了一波“王炸全家桶”。

11月12日,在百度世界2024大会上,百度创始人李彦宏在会上发表了一系列重要观点,不仅分享了百度AI大模型相关的最新数据以及行业变化,还发布了检索增强的文生图技术(iRAG)和无代码工具“秒哒”这两项重要AI技术,推出AI眼镜,同时在AI应用方面,也展示了文心智能体平台TOP100智能体和TOP100产业应用,未来智能体会是AI应用的最主流形态,即将迎来它的爆发点。

“没有构建于基础模型之上的、丰富的AI原生应用生态,大模型就一文不值。”李彦宏还提到,大模型是一次颠覆式的技术革命,我对它的长期前景非常乐观。面对新的技术周期,坚持长期主义的创业者必将脱颖而出。

01

晒成绩,百度文心大模型日调用量达15亿

过去这24个月,这种全球性的大模型狂热,究竟是一场新的技术革命,还是新一轮泡沫?

对于这个问题,在百度世界大会上,李彦宏用一张图回答了这个问题。在他身后的屏幕上,显示出一张文心大模型的日均调用量变化曲线图,数据显示,百度文心大模型日调用量达15亿,半年增长率达7.5倍,呈现出一条非常陡峭的增长曲线。

图片

“在过去18个月当中,中国的大模型应用爆发可以用这张图或者这个曲线来代表,说明AI是真需求。”李彦宏说,在6个月前日调用量数据还是2亿时,自己曾在和百度高管讨论大模型的未来时说:“如果我们大模型日均API调用量一年之内涨10倍,我认为就成了。现在仅仅半年过去,我们就比较接近这个数字了。”

围绕大模型的产业应用,李彦宏提到,过去一年半左右,大模型与金融、能源、教育、招聘、公共服务等多个领域的场景结合后,在降本增效方面取得成果。以和百胜合作为例,目前AI的客服应用和解决方案,已经覆盖了百胜全线业务,大模型每天调用量的峰值达到数百万,客服机器人的“问题解决率”提升90%。

图片

今年来,大模型产业落地显著提速,在行业场景覆盖广度、落地深度等方面都有显著提升。目前,百度智能云已经拥有中国最大的大模型产业落地规模,在能源、电力、制造、金融、交通、政务、互联网、教育、电商等数十个行业、几百个场景中落地大模型应用,已有超过六成的央企和大量的民营企业,正在联合百度智能云进行AI创新,其中的千帆大模型平台,已累计帮助用户精调了3.4万个大模型,开发出了77万个企业级应用。

02

推技术,瞄准行业痛点、降低使用门槛

“过去24个月,对行业而言最大的变化是大模型基本消除了幻觉,大模型回答问题的准确性大大提升,这让AI从一本正经地胡说八道’变得可用、可被信赖。这是李彦宏在百度世界大会上提出的第二个重要观点。

众所周知,大模型是一个概率模型,生成的内容具有不确定性,幻觉问题也是大模型广泛应用的最大限制之一,特别是基于大语言模型的文生图还有比较严重的幻觉,比如针对长城、东方明珠、金字塔、爱因斯坦、贝多芬等特定地点、物品和人物,常常会出现张冠李戴的幻觉问题,让生成的图片“一眼假”,极大地影响了AI的实用性。

而解决文本生成幻觉问题背后的技术就是RAG,即检索增强,大模型会利用检索到的信息来指导文本或答案的生成,从而极大地提高了内容的质量和准确性。

基于此,百度当天正式发布了检索增强的文生图技术iRAG(image based RAG),将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片,“整体效果远远超过文生图原生系统,去除了机器味儿”。

从应用效果来看,iRAG技术极大地提高了AI生成图片的可用性。比如在品牌宣传上,以前拍一组海报动辄大几十万,但现在的创作成本接近于0。简单而言,文心iRAG的商业价值体现在:无幻觉、超真实、没成本,立等可取。此外,在影视作品、漫画作品、连续画本、海报制作等应用场景中,iRAG都可以大幅降低创作成本。

除了iRAG,李彦宏当天还发布了另一款重磅产品——无代码工具“秒哒”,一款不需要写代码就能实现任意想法的软件,涵盖无代码编程、多智能体协作以及多工具调用等特点,只需说说话,就能构建出各种应用。

据了解,“秒哒”无代码编程,由大模型直接生成代码,不需要人写一行代码。它门槛很低,人人可上手;多智能体协作,是基于文心大模型的思考和规划能力,实现对不同智能体的调度和编排;多工具调用,是通过文心大模型的工具调用能力,可调用网页检索、iRAG、地图API等各类型工具,极大提升了人类的工作效率。

本次大会上,百度智能云千帆大模型平台也正式发布“工作流Agent”功能,旨在帮助企业快速开发出面向复杂对话场景的AI应用,快速拥有专业水平的“数字员工”。通过学习各种企业流程与规范,工作流Agent能够适应不同岗位职责,快速规模化复制,大幅提升企业运转效率。以保险行业为例,目前百度智能云正在联合太平洋保险,基于工作流Agent探索、落地车险续保售前数字员工。

图片

“我们在实践中发现,行业应用要达到更专业的效果,需要深入模型层面进行定制开发或精调。精调模型的数量一定程度上反映了大模型与产业结合的深度。这个数量今年增长地特别快,在千帆大模型平台上,每天有超过一半的调用量是来自精调后的模型。”百度集团执行副总裁、百度智能云事业群总裁沈抖说。

针对数据积累不足,难以承担人工精标数据成本的企业,千帆平台全新推出模型蒸馏解决方案,帮助企业利用文心旗舰级大模型生成专业数据,完成全流程的数据准备工作,加速启动模型精调工作。

值得注意的是,百度此次还发布了首款眼镜——小度AI眼镜,称该产品为“全球首款搭载中文大模型的原生AI眼镜”,具备第一视角拍摄、边走边问、识物百科、视听翻译、智能备忘等功能。据介绍,该眼镜以文心大模型为技术底座。得益于今年初基于百度文心大模型全面重构的DuerOS AI原生操作系统,小度在模型使用效果和效率上实现了显著提升。以AI对话聊天为例,随着大模型能力的应用,小度设备与用户的多轮交互次数提升了7倍。

百度集团副总裁、小度科技CEO李莹表示,小度AI眼镜将于明年上半年正式上市。李莹称,AI眼镜作为人类的第一视角设备,其捕捉视觉、声音、位置等信息的能力,将给人们带来前所未有的感官延伸,也一定会成为更高效、便捷的人机交互入口。

03

望趋势,智能体即将迎来AI应用的爆发点

此次百度世界大会上,业内也非常关注未来AI应用的发展趋势。

在李彦宏看来,“基础模型能力就绪,我们即将迎来AI应用的群星闪耀时刻。每一个应用都是一颗星,每一个应用都将成为改变世界的力量。那么AI应用从哪里来?到哪里去?有两大AI应用方向:一个是智能体,另一个是产业应用。”

为何如此坚定看好智能体?李彦宏解释道,一方面,做智能体的门槛足够低,在百度文心智能体平台上,甚至可以看到11岁的小学生在创造智能体。另一方面,智能体的天花板足够高,可以做出功能非常强大的应用,通过多个智能体的协作,可以解决更加复杂的问题。

李彦宏随后还依次讲解了公司、角色、工具和行业四大类智能体,将做智能体类比为PC时代做网站、或是移动时代做自媒体账号,“不同之处是智能体更像人、更智能,更像你的销售、客服和助理。智能体可能会变成AI原生时代,内容、信息和服务的新载体。”

比如公司类智能体,在传统的PC官网模式下,企业只能静态地展示公司介绍、产品参数,但缺失主动推荐、及时响应和一对一服务能力;而公司智能体则可以根据顾客的需求推荐相应产品,在服务方面,也能更直接、快速地响应需求,能大幅地提升互动营销的效率。比亚迪的官方智能体上线后,销售转化率提升119%,联想AIPC智能体的9月互动率提升89%。

在大会现场,李彦宏还展示了全新的工具类智能体——自由画布。这是由百度文库和百度网盘联合开发的一款创新产品,让用户可以在一块类似“画布”的界面上自由拖拽文档、音视频等富媒体素材,迅速生成多模态内容。再比如,法律智能体“法行宝”,已回答用户1660万个法律问题,不仅能像专业律师一样给出解答,还能计算法律赔偿金额、撰写法律文书,并推荐适配律师。

图片

目前,文心智能体平台上,已经吸引了15万家企业和80万名开发者参与,覆盖的应用场景非常非常多,其中文心智能体平台的TOP100智能体是百度基于智能体的分发量、平均对话轮次、用户喜爱度等指标综合遴选出来的。正如李彦宏所说,“百度不是要推出一个‘超级应用’,是要帮助更多人、更多企业打造出数百万‘超级有用’的应用”。

个人观点,仅供参考