DeepSeek性能比肩海外领先大模型,有望加快AI应用场景落地,半导体产业ETF大涨超2%

据Wind数据,截至目前,沪深京三市成交额突破1.2万亿元,其中沪市成交额4826亿元,深市成交额7077亿元,北证50成交额97亿元。

ETF方面,半导体产业ETF(159582)盘中震荡,涨超2%,成交额超2500万,换手率9.83%,该ETF近五日获资金持续净流入2100万元,备受市场关注。

成分股中涨多跌少,海光信息华海诚科中芯国际涨超8%;康强电子涨超5%;韦尔股份中科飞测兴森科技涨超4%;联动科技涨超3%;芯源微、中巨芯、晶瑞电材等个股跟涨,涨幅均超2%。

消息面上,1月20日,DeepSeek发布一系列DeepSeek-R1模型,包括DeepSeek-R1、DeepSeek-R1-Zero和DeepSeek-R1-Distill系列。作为DeepSeek目前最先进的模型,R1系列模型推理能力优异,AME2024测试表现略高于OpenAII-o1-1217,MATH-500成绩表现与OpenAI-o1-1217相当,但API服务定价相比OpenAI同类产品具有明显优势,显示出明显的成本优势和商业化落地潜力。

东莞证券表示,DeepSeek实现大模型成本大幅优化,有望加快AI应用场景落地,长期有望增加算力总消耗量。我们认为,相比可比大模型,DeepSeek通过算法优化、模型压缩等技术大幅降低单位算力需求,该模式可能被其他企业借鉴,企业通过软件/架构优化而非硬件堆叠来满足需求,可能导致短期算力芯片采购节奏放缓;但从长期来看,DeepSeek引领大模型成本缩减,算力效率提升有望降低行业技术门槛,加快AI应用场景落地,而更广泛的用户与应用场景可能引发对更大参数与更复杂的大模型的迭代需求,如自动驾驶等场景对算力需求呈现指数级增长。

DeepSeek性能比肩海外领先大模型,且推理、训练成本实现大幅降低,展现出明显的商业化落地潜力,有望加快AI应用场景落地,长期有望增加算力总消耗量,并加快算力芯片的国产化。