幻方量化旗下DeepSeek发布开源模型,超越阿里Qwen、Meta Llama

蓝鲸新闻12月27日讯 12月26日晚,AI公司深度求索(DeepSeek)正式上线全新系列模型DeepSeek-V3首个版本并同步开源。该模型在多项评测集上超越了阿里Qwen2.5-72B、Meta的Llama-3.1-405B等其他开源模型,并逼近GPT-4o、Claude-3.5-Sonnet等顶尖闭源模型。据官方技术论文披露,v3模型的总训练成本为557.6万美元,GPT-4o等模型的训练成本约为1亿美元。DeepSeek-V3定价为每百万输入tokens 0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens 8元,并享有45天的优惠价格体验期。今年5月,DeepSeek是率先发起国内大模型价格战的公司之一。(蓝鲸新闻 朱俊熹)