1.AI2研究机构推出完全开放模型OLMo 2,性能优于同参数规模模型,且公开训练数据和方法。
2.OLMo 2包含7B和13B两个型号,在10个基准上全面超越了Llama-2-13B和Llama-3.1-8B。
3.与Llama、Qwen等仅开源模型权重不同,AI2公开训练过程、代码、数据集等,为LLM研究提供宝贵资源。
4.通过开源所有组件,OLMo 2促进了语言模型研究和透明度,为未来研究所依赖的基础设施。
5.此外,OLMo 2训练过程低碳,相比训练同大小的Llama 3.1,能耗降低约10分之一。
以上内容由腾讯混元大模型生成,仅供参考
新智元报道
新智元报道
【新智元导读】非营利研究机构AI2近日推出的完全开放模型OLMo 2,在同等大小模型中取得了最优性能,且该模型不止开放权重,还十分大方地公开了训练数据和方法。
最近,非营利研究机构AI2上新了OLMo2系列模型,他们称之为「迄今为止最好的完全开源模型」。
不同大小开源模型的性能对比,OLMo 2的表现优于同参数规模模型
训练过程全公开
多管齐下造就「低碳」LLM
查看原图 55K