深耕场景智能化升级实践 联通元景RAG技术获最高级认证

当下,企业内部积累了海量且结构多样的知识数据,包括业务手册、技术文档、政策法规、标准流程以及内部培训资料等,而传统的人工数据整理和查询过程费时费力,愈发低效。如何在海量信息中又快又准地查询到所需内容,为业务发展提供即时、可信的信息服务,成为企业数字化转型及智能化升级亟待解决的问题。

我们人类查询动态信息要借助搜索而无法事先背诵记忆,遇到记不住的生僻字要查字典,在严肃场景发言时要依赖讲稿。大模型也类似,事先训练时用的数据集里缺少最新动态信息、个人或企业私有数据等,有时会一本正经地“胡说八道”,而通过外挂即时数据库、私有知识库、参考文档等可以有效缓解。基于此,大模型的RAG(Retrieval-Augmented Generation,检索增强生成)技术迅速崛起,成为有效破解这一难题的主流解决方案。

图片

然而用户的实际需求和数据是多样的,导致通用RAG在实践中仍面临多重挑战,如检索信息缺失、复杂PDF解析困难、无法提取特定内容、格式处理不佳、统计类问答能力缺失等。这些问题削弱了RAG在实际场景中的精度与可信度,亟需通过技术创新与优化进行解决。中国联通发挥其丰富业务场景和广泛客户触点等优势,通过大量项目经验历练深耕与创新实践打造了元景RAG技术,首批通过了信通院检索增强生成评估,并获得当前最高评级4+,并在企业真实落地场景中,进行了多项自主创新突破,例如级联切分与自适应切分、多路检索融合、OCR精准解析、富文本知识问答、融合代码模型支持统计分析类问答、支持答案定位至出处等,显著提升了RAG技术在真实场景中的召回率、问答准确率、及答案可追溯性。目前,元景RAG已成功应用联通内外部企业的多个项目中,成为助力企业智能化升级的关键引擎。

图片

级联切分:增强长文本召回匹配度

元景RAG通过级联切分技术,可以将原描述较长的文本块逐级切分至与用户的问题长度相当、语义相似的短文本,以解决用户问题短,但文本块描述较长导致的匹配相似度差的问题,提升信息检索的召回率,确保每一次检索都更加精准高效。

图片

自适应切分:增强知识理解的完整性

在表格问答场景,传统RAG切分容易导致完整描述被切断,知识切片缺失表头、标题等问题,影响信息检索效果。元景RAG自适应切分可以做到自适应语料拆分与整合,为切片补全表头、标题等关键信息,大大提升了表格问答场景的召回率和问答准确率。

图片

多路检索融合:增强检索能力多样性

检索环节,联通元景RAG技术在语义检索的基础上,扩展了稀疏向量、关键词等多维检索方式,对用户查询词进行全方位、多角度的检索,实现信息的全面覆盖和精准定位,最终融合各路检索结果进行综合排序,这一突破,让信息检索更加全面精准。

图片

元景OCR解析:实现PDF内容精准查找

联通元景自研攻关融合多种视觉模型解决RAG应用中PDF类文档OCR识别(Optical Character Recognition,光学字符识别)、分栏顺序、表格解析等难点瓶颈,实现PDF内容“查得更准、答得更对”,且基于实际数据集评测,元景RAG性能领先业界一流竞品。

图片

富文本知识问答:图文并茂生成答案

除了解析、处理和回答文档中的文本内容,元景RAG创新性的增加了对文档中图片等富文本知识的解析、处理和回答,可以根据用户提问找出文档中的相关图片,图文并茂生成答案,使得答案更加直观易懂。

图片

融合代码模型:支持统计类问答

传统RAG问答主要以非结构化文本类知识问答为主,在结构化数据统计类问答方面能力不足。元景RAG通过融合代码模型,在统计类问题中,能够智能识别并检索相关代码和数据,利用代码模型进行深度分析和计算,生成准确可靠的答案,为用户来带统计类问答领域的智能体验。

图片

答案出处定位:追根溯源,有据可依

知识库问答中,获得答案固然重要,知道答案的来源也同样关键。元景RAG在生成答案时,创新性的根据答案的出处,精准定位到答案在原文中的位置,这一功能增强了RAG生成答案的可信度和可追溯性,在专业知识问答领域尤其重要,可以帮助用户清楚了解答案来源,从而更加信任系统的输出结果。

图片

基于以上检索、增强、生成等环节的多项突破性成果,联通元景RAG在多个行业项目评测集中,召回率达到90%以上,问答准确率达到85%以上达到业界领先水平。作为新质生产力的重要组成部分,元景RAG全方位赋能联通内外部企业,助力企业实现数字化转型和智能化升级,在医院问询、采购招投标、招生咨询、办公助手、党建、设备故障诊断、专利开发等场景中打造了数十个行业标杆案例,在智能问答领域为用户提供了前所未有的智能、高效的信息获取体验。

在中山三院,依托联通元景RAG技术打造的医疗智能问答助手,已经成为医护人员日常工作中不可或缺的智能助手。无论是最新医疗政策的解读,还是院内各类操作流程与规范的查询,医护人员都可以随时随地咨询,轻松获得准确、权威的答案,为工作提供强有力的支持。

图片

中山三院医疗智能问答助手

中国联通集团采购部基于联通元景RAG技术打造了“联通易达”应用,实现针对供应链领域近万份法律法规、规章制度的智能咨询服务,面向全国授权用户开放,为内部用户及合作伙伴查询国家招投标法规提供随身宝典,为了解联通采购规则提供专业指南,为挖掘潜在商机拓展业务合作提供合作锦囊。

图片

联通易达

为解决大学在招生阶段无法快速回复学生、家长咨询的需求,中国联通与宁夏各高校达成合作,依托联通元景RAG服务自研构建高校大模型智能问答助手,已在宁夏大学应用,可有效解决高校回复不及时、不准确的问题,缓解高校在高峰期的答疑压力。

图片

宁夏大学智能问答助手

未来,联通元景RAG将继续探索和创新,为企业提供更多、更好、更智能的信息服务,持续推动人工智能的普惠化发展

中国联通基于丰富落地实践,借鉴人类职业技能形成规律,突破大模型开发应用范式技术,打造“类人特色”的大模型开发应用工具集——一站式、零代码、低门槛、易定制的元景大模型MaaS平台,融合开源和生态模型,提供模型塑造、模型能力扩展、通用标准功能沉淀、模型安全防护等“接地气”工具,降低模型开发使用门槛,让更多行业专知自主高效打造具备“职业技能”的行业模型及应用。其中,元景RAG是元景大模型MaaS平台中模型能力扩展组件的重要组成部分,已正式对内外部开发者提供服务,欢迎大家踊跃申请使用。