客户端
游戏
无障碍

41

评论

58

47

手机看

微信扫一扫,随时随地看

Mistral AI发布新模型:24B规模,性能比肩Meta Llama 70B模型

1月31日消息,当地时间周四,欧洲人工智能初创企业Mistral AI推出了一种新型语言模型Small 3。该公司宣称,这款模型在性能上可媲美规模为其三倍的模型,同时在计算成本上实现了大幅度降低,这一突破有望重塑先进AI应用的经济格局。

图片

Mistral是一家成立于2023年初的公司,由前谷歌DeepMind、Meta等科技巨头的研究人员创立。成立两年的时间里,这家公司推出了一系列开源AI模型。

此次推出的新模型拥有240亿参数,在标准基准测试中的准确率达81%,并且每秒能够处理150个Token。Mistral AI在发布该模型时采用了适用性更加广泛的Apache 2.0协议,该协议允许开发者自由地使用、修改和分发该模型框架,这也为企业提供了自由调试和部署的便利。

官方表示Small 3非常适合部署在“处理敏感或专有信息的个人设备上”,比如它可以在一台32GB RAM的MacBook上运行。

图片

官方的数据显示,只有24B的Mistral Small 3与Llama 3.3 70B-Instruct表现相当,但在相同硬件上速度提升了3倍以上。

图片

官方也公布了该模型的实际性能表现,指令优化模型在编程、数学、通用知识和指令执行等基准测试中,Mistral Small 3的表现与体积是其三倍的开源模型以及专有的GPT4o-mini模型不相上下。

Small 3与近期发布的DeepSeek等大型开源推理模型形成互补,并可以作为强大的基础模型,助力推理能力的进一步发展。在接下来的几周内,Mistral将推出更多具备增强推理能力的模型,大小规模的都有。 (腾讯科技特约编译/金鹿)

免责声明:本内容来自腾讯平台创作者,不代表腾讯新闻或腾讯网的观点和立场。
举报
评论 0文明上网理性发言,请遵守《新闻评论服务协议》
请先登录后发表评论~
查看全部0条评论
首页
刷新
反馈
顶部