幻方量化旗下DeepSeek发布开源模型，超越阿里Qwen、Meta Llama

蓝鲸财经

2024-12-27 10:54发布于北京蓝鲸财经官方账号

蓝鲸新闻12月27日讯 12月26日晚，AI公司深度求索（DeepSeek）正式上线全新系列模型DeepSeek-V3首个版本并同步开源。该模型在多项评测集上超越了阿里Qwen2.5-72B、Meta的Llama-3.1-405B等其他开源模型，并逼近GPT-4o、Claude-3.5-Sonnet等顶尖闭源模型。据官方技术论文披露，v3模型的总训练成本为557.6万美元，GPT-4o等模型的训练成本约为1亿美元。DeepSeek-V3定价为每百万输入tokens 0.5元（缓存命中）/2元（缓存未命中），每百万输出tokens 8元，并享有45天的优惠价格体验期。今年5月，DeepSeek是率先发起国内大模型价格战的公司之一。（蓝鲸新闻朱俊熹）