Mistral AI发布新模型：24B规模，性能比肩Meta Llama 70B模型

腾讯科技

2025-01-31 15:42发布于北京腾讯新闻科技频道官方账号

+关注

1月31日消息，当地时间周四，欧洲人工智能初创企业Mistral AI推出了一种新型语言模型Small 3。该公司宣称，这款模型在性能上可媲美规模为其三倍的模型，同时在计算成本上实现了大幅度降低，这一突破有望重塑先进AI应用的经济格局。

Mistral是一家成立于2023年初的公司，由前谷歌DeepMind、Meta等科技巨头的研究人员创立。成立两年的时间里，这家公司推出了一系列开源AI模型。

此次推出的新模型拥有240亿参数，在标准基准测试中的准确率达81%，并且每秒能够处理150个Token。Mistral AI在发布该模型时采用了适用性更加广泛的Apache 2.0协议，该协议允许开发者自由地使用、修改和分发该模型框架，这也为企业提供了自由调试和部署的便利。

官方表示Small 3非常适合部署在“处理敏感或专有信息的个人设备上”，比如它可以在一台32GB RAM的MacBook上运行。

官方的数据显示，只有24B的Mistral Small 3与Llama 3.3 70B-Instruct表现相当，但在相同硬件上速度提升了3倍以上。

官方也公布了该模型的实际性能表现，指令优化模型在编程、数学、通用知识和指令执行等基准测试中，Mistral Small 3的表现与体积是其三倍的开源模型以及专有的GPT4o-mini模型不相上下。

Small 3与近期发布的DeepSeek等大型开源推理模型形成互补，并可以作为强大的基础模型，助力推理能力的进一步发展。在接下来的几周内，Mistral将推出更多具备增强推理能力的模型，大小规模的都有。（腾讯科技特约编译/金鹿）

免责声明：本内容来自腾讯平台创作者，不代表腾讯新闻或腾讯网的观点和立场。