新智元报道
新智元报道
【新智元导读】最近,一支来自UCSD和清华的研究团队提出了一种全新的微调方法。经过这种微调后,一个仅80亿参数的小模型,在科学问题上也能和GPT-4o一较高下!或许,单纯地卷AI计算能力并不是唯一的出路。
我们都知道,在科研界,LLM在解决简单科学问题时表现得游刃有余,但在应对复杂问题时往往会出现幻觉。于是,为了让模型更靠谱,研究人员尝试给模型装上科学工具,帮助它们解决高难度任务。
微调方法简介
微调方法由两部分组成:World Knowledge Distillation(WKD)和Tool Usage Adaptation(TUA)。
实验过程
研究人员使用Llama-3.1-8B-Instruct作为微调方案的基础模型。同时还对其他最先进的开源和闭源模型进行了广泛评估,包括GPT-4o、GPT-4o mini、Claude 3.5 Sonnet和Llama-3.1-70B-Instruct。
数据集
外部科学工具
评估指标
实验结果
答案准确率
作者介绍
Bohan Lyu
https://venturebeat.com/ai/uc-san-diego-tsinghua-university-researchers-just-made-ai-way-better-at-knowing-when-to-ask-for-help/
https://arxiv.org/abs/2411.00412