应用DeepSeek重塑档案检索功能 昌平档案数智赋能再升级

近日,昌平区档案馆依托数字档案馆建设,在国内档案领域率先接入DeepSeek大模型进行本地化部署,实现了档案检索功能重塑,使得“查档”不再是冰冷的数据匹配,而是人与AI的智慧对话。

图片

在接入DeepSeek之前,昌平区档案馆已通过引入大语言模型、自然语言处理(NLP)、知识图谱等一系列科技创新举措,实现了档案管理的数智赋能,为后续技术升级奠定了坚实基础。例如,创新开发的档案整理自动著录功能模块,基于自然语言处理(NLP)和大语言模型技术,自动分析与提取档案文本结构、全文内容和著录项信息,实现了著录信息的智能判断、纠错和填报。这一功能不仅提高了档案整理效率,减少了30%的人力成本,还有效提升了档案管理的精准度。

此外,昌平区档案馆还构建了全域档案全文数据库,通过智能OCR文档引擎模块,将档案数字化副本自动进行OCR全文识别,生成双层PDF版式文件,形成了馆藏、室藏档案全文数据仓。这一举措为档案数据资源的深度开发利用和共享提供了坚实的数据底座。

昌平档案馆通过全文数据库的建设已实现了档案数据的智能“精准检索”,应用接入DeepSeek后,检索功能发生了本质性蜕变,从“精准检索”升级为“智慧问答”,工作人员只需通过自然语言提问,系统即可自动提取关键信息并关联相关档案,检索效率提升了数十倍以上,真正实现了“所想即所得”。

系统打破了精准关键词检索的局限,支持自然语言交互。工作人员可用口语化表达输入“昌平县档案科建于哪年”“昌平1999年组织机构沿革”等复杂检索,系统自动解析深层需求,秒级关联档案中的政策文件、会议纪要等,生成结构化对比分析报告。另因检索深度推理的数据支撑来源于档案数据,故在语义匹配准确率、内容真实性、用户针对性上都远高于通用大模型。

在应用原有大语言模型打通文本、图像、音频、视频的门类界限的基础上,应用DeepSeek后,检索系统通过全文识别、图像语义分割技术,可在10秒内完成匹配,调取查找问题所需的关联档案并形成问答结论,效率较人工提升数倍。

下一步,昌平区档案馆将深度应用新质信息技术,以“技术驱动、需求导向”为工作核心,创新开发政策溯源、历史推演、AI+档案写作等特色功能,进一步推动档案事业的数智变革,为政府决策、学术研究、文化传播提供深度档案知识服务。

通讯员 魏颖

摄影/刘军

文/北京青年报记者 蒋若静