划重点
01OpenAI研究员Jason Wei在宾夕法尼亚大学计算机与信息科学系课程中,探讨了大型语言模型的扩展范式从规模扩展到以思维链和强化学习为代表的推理扩展。
02他指出,扩展是AI进步的关键引擎,将继续主导这个领域的发展方向。
03其中,基于思维链的强化学习使语言模型能够在给出答案之前进行思考,提高了模型在复杂任务中的表现。
04此外,AI研究文化的变革,如对数据的重视、高度多任务模型的发展以及更大规模的团队合作,也将推动AI向更深远的方向发展。
05未来五年,AI在科学和医疗领域的应用、提高事实准确性、多模态AI能力以及工具使用能力等方面将继续发展。
以上内容由腾讯混元大模型生成,仅供参考
视频地址:https://www.youtube.com/watch?v=yhpjpNXJDco 幻灯片:https://llm-class.github.io/slides/Jason_Wei.pdf
扩展一般是指通过增加模型规模、数据量和 GPU 数量来持续改进 AI 能力。不过,Jason Wei 给出了一个更具体的定义:扩展就是你把自己放在一个可以沿着连续轴移动并期望获得持续改进的情况下。 虽然扩展需要克服技术和心理挑战,但它是 AI 进步的关键引擎,并将继续主导这个领域的发展方向。
下一词预测实际上是一个大规模多任务学习过程。 通过预测下一词,模型可以学习语法、世界知识、情感分析、翻译等多种能力。 你可以把下一词预测的准确率看作多个子任务的加权和,这样你就能理解为什么会有所谓的「涌现」现象。 仅仅通过下一词预测也许可以实现 AGI,但会非常困难,我们需要继续大量扩展。
纯粹的下一词预测在处理复杂任务时存在局限性。 思维链(CoT)让模型能够像人类一样展示推理过程。 OpenAI 通过强化学习优化了模型的思维链能力,使其能更好地解决复杂问题。
研究重点从改进算法转向改进数据质量。 基准测试被「饱和」的速度太快。 从单任务模型朝着高度多任务模型(highly multi-task models)的方向转变。 智能和用户体验是两个可以分别改进的维度。 需要更大的团队合作来推进 AI 发展。
AI 在科学和医疗健康方面的应用前景。 提高事实准确性,减少虚假信息。 发展多模态 AI 能力。 增强工具使用能力。 扩大 AI 应用范围。
查看原图 178K