【太平洋科技快讯】12月26日,腾讯研究院推出了一款新型AI模型——DRT-o1系列,该模型采用长思维链(CoT)技术,旨在提高文学作品的翻译质量,特别是在处理比喻和隐喻等修辞手法方面。
神经机器翻译(NMT)虽然在日常文本翻译上取得了显著成果,但在面对文学作品,尤其是含有丰富隐喻和明喻的文本时,仍存在翻译难题。腾讯DRT-o1系列模型的推出,为解决这一难题提供了新思路。
研究团队从古腾堡计划中筛选出400本英文公共领域书籍,提取了577600个句子,并从中挑选出63000个包含明喻和隐喻的句子,用于训练DRT-o1模型。
DRT-o1模型采用了一种创新的多智能体框架,包括翻译员、顾问和评估员三个角色。这一框架通过关键词翻译、初步翻译和翻译精炼循环三个步骤,不断提升翻译质量。
例如,英文句子“The mother, with her feet propped up on a stool, seemed to be trying to get to the bottom of that answer, whose feminine profundity had struck her all of a heap.”通过DRT-o1模型翻译后,更能准确传达原文的情感色彩和文化内涵。
最终的翻译结果由GPT-4o进行润色,确保流畅性和可读性。DRT-o1系列包括DRT-o1-7B和DRT-o1-14B两个版本,实验结果显示,这两个版本在翻译质量上均有显著提升。
查看原图 41K