一个非常简单的更改,就能提高 LLM 推理能力。
论文标题:Training Large Language Models to Reason in a Continuous Latent Space 论文地址:https://arxiv.org/pdf/2412.06769
在语言模式下,该模型作为标准语言模型运行,自回归生成下一个 token。 在潜在模式下,它直接利用最后一个隐藏状态作为下一个输入嵌入。这个最后的隐藏状态代表当前的推理状态,称为连续思维。
一个非常简单的更改,就能提高 LLM 推理能力。