百度发布文心 iRAG 文生图技术“去除 AI 味”

IT之家 11 月 12 日消息,在今日的 2024 百度世界大会上,百度创始人李彦宏发布了两项新的 AI 技术 —— 检索增强的文生图技术(iRAG)和无代码工具“秒哒”

李彦宏表示,文心大模型最新的日均调用量已经来到 15 亿,较半年前(2 亿调用量)增长至 7.5 倍。

幻觉问题是大模型广泛应用的最大限制之一,而解决文本生成幻觉问题背后的技术就是 RAG,即检索增强。李彦宏表示,过去 24 个月对于大模型行业而言,最大的变化是“大模型基本上消除了幻觉”,回答问题的准确性大大地提升了。“让 AI 从一本正经的胡说八道变得可用,可被信赖”,他说。

不过,目前基于大语言模型的文生图还有比较严重的幻觉,尤其是针对长城、东方明珠、金字塔、爱因斯坦、贝多芬等特定地点、物品和人物,常常会出现张冠李戴的幻觉问题,让生成的图片“一眼假”,极大地影响了 AI 的实用性。

图片

针对上述问题,百度开发了检索增强的文生图技术 iRAG(image based RAG),将百度搜索的亿级图片资源跟基础模型能力相结合,“整体效果远远超过文生图原生系统,去除了机器味儿”。

李彦宏现场展示了一幅由文心大模型生成的大众揽巡汽车飞跃长城的图片。通过文心 iRAG 技术,无论是这款特定型号汽车的车型车标、还是作为背景的长城,均未出现错误或变形的幻觉问题。

图片

李彦宏还在大会上发布了无代码工具“秒哒”。该工具支持无代码编程、多智能体协作和多工具调用三大特性,号称用自然语言就能搭建一整套系统。

图片

演讲现场,李彦宏以萝卜快跑新技术发布会为例,展示了活动报名系统的搭建过程:只要在“秒哒”上用中文描述需求,并补充一份带有大会时间地点主题的文档,就可以指挥多个智能体协作,完成报名系统的开发。IT之家附演示内容如下:

告诉“秒哒”需求

图片

需求:“我要为萝卜快跑的新技术发布会做个嘉宾邀请和管理系统,并且能收集他们的猜测和想法。”

0 号智能体(小组长智能体)

图片

作为小组长进行规划调度,会将任务拆解并召唤各智能体来完成任务。

1 号智能体(策划智能体)

图片

将策划设计解决方案拆分成:核心需求、内容结构、开发需求、数据收集四个子任务。

2 号智能体(小编智能体)

图片

编辑邀请函中的所有文字和媒体内容,包括发布展望、时间地点信息、封面图等。

3 号智能体(程序员智能体)

图片

写代码来制作和部署网页。

4 号智能体(质检员智能体)

图片

检查代码 bug 并修复、进行代码测试。

“秒哒”生成邀请函

图片

“秒哒”生成了邀请函,还可以根据需求更换画风。

后台查看报名信息

图片

查看后台,报名信息已经在后台统计表格中。