华策影视申请超长文本摘要生成专利,解决摘要生成文本不通顺的问题

金融界 2024 年 10 月 18 日消息,国家知识产权局信息显示,杭州华策影视科技有限公司申请一项名为“超长文本摘要生成方法、装置、设备及介质”的专利,公开号 CN 118779445 A,申请日期为 2024 年 7 月。

专利摘要显示,本发明公开了超长文本摘要生成方法,方法包括:获取待摘要提炼的超长文本;基于文本切分模型和预设分割字数阈值对超长文本进行场景分割处理,得到若干场景段落文本,并基于自注意力机制的动态池化卷积神经网络模型和预设场景提示词对场景段落文本进行关键信息提取,得到若干场景段落提炼文本;基于场景文本相关性匹配策略对若干场景段落提炼文本进行上下文场景的相关性匹配分析,得到各场景段落提炼文本间的文本匹配结果,并基于文本匹配结果和文本拼接策略对提炼文本进行文本拼接处理,得到文本拼接结果;基于微调大语言模型对文本拼接结果进行摘要总结,得到摘要文本。解决摘要生成文本不通顺,以及无法对超长文本进行直接摘要提炼的问题。