三个月前的春节,DeepSeek R1 火爆出圈,让“东升西落”成为了随后一段时间的叙事和预期。
三个月后五一临近。DeepSeek R2 临近发布时间窗口(预期)。已有“小作文”称R2模型总参数再提升一倍,多模态性能媲美国际竞品。
周五下午,ZZJ时隔七年专门就人工智能再次集体学习。
政策定调+技术破局,这场AI盛宴,你是否准备好了“再次上车”?
周末消息面增量信息较多,美的机器人商业化再进一步、离境退税放宽等,进一步勾勒科技与消费螺旋上升的新图景。
DeepSeek R2 快要来了?
昨日晚间,有账号@deedydas 在社交媒体平台爆料了深度求索即将发布的下一代 AI 大模型 DeepSeek-R2 的参数信息。
根据爆料信息,DeepSeek-R2 大模型将会采用一种更先进的混合专家模型(MoE),结合了更加智能的门控网络层(Gating Network),以优化高负载推理任务的性能。在 MoE 架构的加持下,DeepSeek-R2 的模型总参数量预计将达到 1.2 万亿,较之 DeepSeek-R1(6710 亿参数)提升约 1 倍。
从规模上来看,DeepSeek-R2 与 ChatGPT 的 GPT-4 Turbo 以及谷歌的 Gemini 2.0 Pro 相当。
具体来看,DeepSeek R2的技术突破三大核心:
1.模型架构创新层面,采用自主研制的Hybrid MoE3.0架构,实现1.2万亿动态激活参数(实际计算消耗仅780亿参数),经阿里云实测验证,在处理长文本推理任务时,单位token成本较GPT-4Turbo下降97.3%(数据来源:IDC算力经济模型测算);
2.数据工程,构建覆盖金融、法律、专利等垂直领域的5.2PB高质量语料库,通过多阶段语义蒸馏技术,使指令遵循准确率提升至89.7%(对比测试集:C-Eval2.0);
3,硬件适配突破,其自研分布式训练框架实现昇腾910B芯片集群利用率达82%,在FP16精度下实测算力达512PetaFLOPS,达到同规模A100集群的91%效能(华为实验室验证数据)。
从应用层突破来看,DeepSeek R2在多模态领域实现三大技术迭代:
1)视觉理解模块采用ViT-Transformer混合架构,在COCO数据集物体分割任务中取得92.4 mAP精度,较CLIP模型提升11.6个百分点;
2)工业质检场景中,基于自适应特征融合算法,在光伏EL缺陷检测项目中将误检率压缩至7.2E-6(隆基股份产线实测数据);
3)医疗诊断模块通过知识图谱增强技术,在胸部X光片多病种识别任务中达到98.1%准确率,超越放射科主任医师专家组平均水平的96.3%(北京协和医院双盲测试结果)。
4月25日下午, ZZJ 就加强人工智能发展和监管进行集体学习,这是2018年10月31日政治局集体学习人工智能之后,ZZJ时隔七年专门就人工智能再次集体学习。
ZZJ 两次针对同一个战略科技方向进行集体学习极为罕见,足见人工智能在我国新一轮科技变革中的战略地位。
本次学习关键词“自立自强、应用导向、政策支持”。
1、基础理论和核心技术突破是重要目标
总书记在讲话中指出,我国在基础理论、关键核心技术方面还存在短板弱项,要持续加强基础研究,集中力量攻克高端芯片、基础软件等核心技术。构建自主可控、协同运行的人工智能基础软硬件系统。
简评:目前国内领先模型与海外的差距在可控范围,但工程创新多、基础理论突破较少,未来中国将更加注重模型架构等领域的创新。此外,国产AI芯片在性能上虽在追赶但仍有差距,而生态上的差距更大,算力中间层和软件层的空间较大、机会显著。
2、算力基建和数据资源是AI发展的重要支撑
总书记还指出,统筹推进算力基础设施建设,深化数据资源开发利用和开放共享。同时,推进人工智能全学段教育和全社会通识教育,源源不断培养高素质人才。从算力、数据与人才等要素层面更好支撑人工智能产业发展。
简评:算力基础设施的建设将更加强调集中化和大型化(向头部科技企业、五大城市和东数西算节点集中),其他城市建设智算中心需要具备较好的应用消纳和运营能力,否则会被约束,但这部分总体体量不大,因此算力行业的总量逻辑不受影响。此外,AI+教育有望全面铺开。
3、人工智能将积极“走出去”,开展更多国际合作
此外,总书记还指出,要广泛开展人工智能国际合作,帮助全球南方国家加强技术能力建设,弥合全球智能鸿沟并早日形成具有广泛共识的全球治理框架和标准规范。
简评:中国的模型公司将走出去拓展业务,为其他国家提供“第二选择”。
四月以来,以机器人、AI算力为主的科技题材股明显回落,而消费股,特别是一些新消费概念股明显走强。时间往前推,春节之后到3月中旬是科技股大涨的时间窗口。整体来看,今年科技与消费各自演绎了一波较大行情。
当前,高层时隔七年再次集体学习人工智能,DeepSeek R2基本也快要发布的时间窗口。政策和技术事件能否共振成为强烈催化剂,吸引资金回流科技板块?
有市场人士称,近期市场风格源于两大核心变量:一是科技股经历一季度快速拉升后估值进入压力区间,部分资金兑现收益转向防御性更强的消费板块;二是经济弱复苏背景下消费刺激政策频出(如以旧换新补贴),形成短期催化。但当前高层集体学习人工智能释放出强烈的政策升级信号,叠加DeepSeek R2等国产大模型迭代节点临近,科技板块有望在政策与技术的双重驱动下重获资金关注。
中金公司研报指出,此次定调较2018年"促进新一代人工智能健康发展"的表述更具实操性,预计后续部委及地方将加速推出场景开放、算力补贴、数据交易等配套政策。中信证券统计显示,2023年各省AI专项政策资金规模约280亿元,而今年在高层定调后,全年扶持资金或突破500亿元,重点向智能驾驶、工业质检等商业化清晰的场景倾斜。
尽管4月科技股遭遇回调,但资金流向显示机构正在逢低布局一些龙头:北向资金近两周逆势加仓中际旭创、沪电股份等算力龙头超15亿元;主动权益基金对TMT板块的配置比例仍低于历史均值约2个百分点,存在增配空间。
野村证券观察到,对冲基金在AI概念股上的空头头寸较3月高点下降27%,显示市场悲观情绪有所缓解。华泰证券认为,当前中证人工智能指数动态市盈率回落至45倍(3月高点为62倍),已进入配置性价比区间。
具体到R2的热门概念股,拓维信息、中科曙光、云赛智联周末关注度较高。
拓维信息:华为昇腾生态核心代工厂,承接Deepseck超算中心50%以上算力基建订单。
中科曙光:为Deepseek提供国产液冷服务器集群,单机柜功率密度达40kW。
云赛智联:为Deepseek搭建政务大模型专用云,已落地15个省级智慧城市项目。
还有三个交易日就是五一小长假,做多要注意控制过节仓位,做好风险管理。
1、美的公布人形机器人落地时间表:5月部署工厂,下半年进线下门店
距离上次披露不到40天,美的人形机器人即将进入商业化落地阶段。美的中央研究院智能技术与应用研究所所长、人形机器人创新中心负责人奚伟向透露,美的集团与库卡联合研发的类人形机器人将于今年5月进入工厂,用于机器运维、设备检测和搬运等场景。同时,预计今年下半年,美的人形机器人将陆续进入线下门店,主要用在展示、产品介绍、制作咖啡等场景。
他强调,这些商业化尝试主要体现一些人形机器人的基本能力,并不断通过产品迭代方式解决电池续航、关节轻量化、数据采集和仿真等挑战,他预期还需要至少3-5年的时间,人形机器人才能真正地产业化。
2、商务部:将离境退税起退点从500元下调至200元
商务部有关负责人介绍,这次出台的《关于进一步优化离境退税政策扩大入境消费的通知》将切实解决地方、企业和入境旅客反映的堵点卡点问题,突出针对性和可操作性。优化退税商店布局,鼓励各地在大型商圈、步行街、旅游景区、度假区等境外旅客聚集地增设退税商店。支持具备条件的地区打造一批离境退税特色街区,提升退税商店可及性。将离境退税起退点从500元下调至200元,不断丰富和优化商品供给,增加老字号产品、非遗产品、名优特产、“智能、健康、时尚”消费名品和国货潮品等中国特色优质产品供应。
优化退税办理流程,完善离境退税管理系统,提高商店开单效率,缩短旅客等待时间,将“即买即退”服务措施推广至全国。将现金退税限额由1万元大幅上调至2万元,鼓励相关机构通过移动支付、银行卡、现金等多种方式提供退税服务,更好满足境外旅客多样化支付服务需求。(中国中免)
3、2025年1—3月份全国规模以上工业企业利润增长0.8%
1—3月份,全国规模以上工业企业实现利润总额15093.6亿元,同比增长0.8%。1—3月份,规模以上工业企业中,国有控股企业实现利润总额5599.5亿元,同比下降1.4%;股份制企业实现利润总额11101.5亿元,增长0.1%;外商及港澳台投资企业实现利润总额3883.5亿元,增长2.8%;私营企业实现利润总额3709.7亿元,下降0.3%。
4、乘联分会崔东树:2025年1—3月进口汽车9.5万辆 同比下降39%
乘联分会秘书长崔东树发文称,中国进口车进口量从2017年的124万辆持续以年均8%左右下行,到2023年仅有80万辆。2024年汽车进口70万辆,同比下降12%。2025年1—3月进口汽车9.5万辆,同比下降39%,这是近期少见的1—3月巨大下滑。其中3月进口车3.9万辆,下滑27%,下滑稍有改善。