探展「百度世界大会」,我们看到一些AI应用真的来了

一年一度,李彦宏又出现在舞台中央。


就在24小时之前,这位百度掌门人带着「百度世界 2024」中新发布的多个产品,和5000平米的AI应用小镇出现在上海世博中心。


图片


这次大会的主题是「应用来了」。


"应用是不是真的来了"一直是全民焦点——过去一年,除却AI拍照、AI助手、AI办公工具,全世界都期待看到更多AI应用。


这次大会中,李彦宏带来了属于百度的AI应用进展。


首先是文心iRAG——检索增强文生图技术的亮相。


在李彦宏眼中,过去这24个月,AI行业的最大变化是大模型基本消除了幻觉。文心iRAG技术则将百度搜索的亿级图片资源与基础模型能力相结合,让AI生成的图片更真实。


下面就是一个“爱因斯坦环游世界”的图片生成展示。能看到,爱因斯坦在悉尼歌剧院、在长城、在鸟巢的合影都十分接近“游客照”的质感。


图片


“智能体(Agent)”也成为这次“应用来了”的重头戏。


李彦宏认为,智能体是AI应用的最主流形态。目前百度与业界合作的智能体大概有四类,包括公司类智能体、角色类智能体、工具类智能体和行业类智能体。


图片

文心智能体平台上线的星座大师小玲智能体


智能体的理念同样落地在百度的其他应用中。


这次,百度还发布了应用创作工具「秒哒」和创作者的AI利器「自由画布」。


前者能调用多个智能体进行协作实现无代码的应用的开发,后者能让创作者在一块类似“画布”的界面上,自由拖拽来自百度文库,储存在百度网盘中的各种文档、音视频等媒体素材,AI可以根据这些素材迅速生成多模态内容。


图片

李彦宏用秒哒展示一场发布会的报名系统搭建过程


市场期待度极高的小度AI眼镜,也终于亮相。


这款基于文心大模型和DuerOS AI原生操作系统的AI眼镜,能够实现第一视角拍摄、边走边问、识物百科、视听翻译、智能备忘、歌单等功能,预计在2025年上半年上市。


图片


图片


和大会在同一时间地点展示的,还有5000平米的AI应用小镇。


在这个小镇里,还隐藏着更多不同类型的AI应用。



应用来了!智能体先开路














一走进小镇,“智能体工坊”牢牢占据中心位。

图片

智能体,这一AI圈的当红炸子鸡,不仅疯狂吸引一波投资,还让一些开发者通过流量分润的机制赚到了钱。

在展馆现场「四木相对论」发现,实用性和趣味性是智能体的两个特点。

一入场,我就看到一个手机里的AI智能体,正在帮用户点餐。

输入“点一百份香辣鸡一百杯可乐”,智能体开始执行任务。最后,它帮助下单了100对鸡翅和100杯可乐。

只要一句话并付款,炸鸡可乐就会到家。

图片

往前走,“文化新体验区”排满了人——这里能够创作在抖音和朋友圈爆火的"非遗簪花照"。

这个产品的操作也很简单,用户打开智能体上传一张自拍照,等上5秒,一张在古建巷子里,头簪红花,手持绢扇的写真照片就水灵灵地出现了。

图片

穿过小镇核心装置,到达另一个To B的AI应用展示区。

先来看看数字人是怎么产生的。

以前做一个数字人,不论是绘画还是3D建模都要耗费不少时间精力。但现在,AI技术让这个流程发生了变化。

在展台上,我体验了百度云曦灵文生 3D 数字人技术。 

在对话栏写上“生成一位酷帅女生”,接着一个短发,身着皮衣、短裙的女生形象出现在屏幕中。这个数字人不仅可以完成伸手、叉腰等多个动作,还能接受用户提出的首饰、发型等意见进行微调。

图片


另一个生产力工具是视频生成。


走到「生数科技」的展台,我用它的产品体验一把导演生活。


图片


这家公司来头不小。今年 9 月,清华系基因浓厚的「生数科技」,正式开放了自家视频大模型 Vidu 的API,还同步接入了百度智能云千帆大模型平台,是平台接入的第一个视频大模型。


AI与机器共舞













掐着表演时间表,我溜达到了机器人世界大舞台。

转圈、倒立、后空翻,没想到展馆内部居然有一只边牧,拉着机器狗登场。一真一假两只狗在舞台中央转圈圈,旁边另一只机器狗表演后空翻。

图片


作为具身智能的代表,机器狗这种产品,最早用于军用场景,体型巨大。到了2024年,它们终于能走入家庭场景,和真狗子一起玩耍,让我真的感受到AI的价值。

近年来,具身智能在医疗、教育、制造业等多个领域都展现出巨大潜力,随着各种投资的引入,预计未来几年还会出现更多令人兴奋的创新应用。

图片

再来到百度技术展区,远远看到一个机械臂正在和观众象棋对弈。这位被象棋届网友称为"神"的大爷,叱诧棋坛30年,没想到却在AI这里翻了车。

图片

8年前,Alpha go战胜围棋高手还是爆炸性新闻。现在,下棋机器人已经非常成熟,像元萝卜这类产品,也开始销售获利。

这场机械臂之间对弈,展示了AI和硬件结合的四个链路:感知—决策—控制—生成。

图片

在感知环节,机械臂用飞桨目标检测技术对象棋与棋盘进行检测。到了决策环节,机械臂之间采用文心大模型,做出对弈决策与落子目标坐标。接着落子时的控制,机械臂会根据坐标进行轨迹解算, 最终抵达落点位置。

最后还有生成,一直观战的文心大模型会对棋局进行解读,把解读内容二次创作成一部剧情小说。

不远处,还有一个十分"扎眼"的仿生人。

这张"脸"绝对是个显眼包。它不仅能快速识别面前人的表情,还能直接对照模仿。我面前小哥朝它比了个“wink”,它立马回了一个同款。

图片


AI为健康













在百度健康空间,我还体验到用眼底检查一体机进行眼底筛查。

几秒钟后,一份详细的检查报告就出现在手机上。这种便捷、高效的服务让我第一次感受到AI技术在医疗领域的巨大潜力。

图片


在百度健康助手展区,我还看到了 AI精准找医生、AI睡眠助手和AI心灵陪伴等功能,AI对生活带来的便利似乎无处不在。

这次百度世界大会,整个AI应用小镇被各种各样的软、硬智能产品占据,涵盖了AI在医疗、教育、娱乐、商业等多个领域的应用,每一个都让人眼前一亮。

这5000平米中的上百个应用证明,2024年AI应用是真的来了。

2025年,一定还有更多AI应用在路上。