深水研究
Deep Research
深度影响决策
本周全球前沿科技动态
2025.5.30
本周全球科技热点,我们为您精选呈现。
1.DeepSeek更新模型,深度思考与推理能力显著增强。
2.马斯克星舰第九次试飞失败,返航途中燃烧解体。
3.阿里开源长文本思考模型,登Huggingface热榜。
1
Deepseek更新R1,思考推理更强
深度求索(DeepSeek)宣布其 DeepSeek-R1 模型已完成一次重要的小版本升级,最新版本号为 DeepSeek-R1-0528。据官方介绍,DeepSeek-R1-0528 依然基于2024年12月发布的 DeepSeek V3 Base 模型构建,在后训练阶段,团队投入了更多算力,使得模型在数学、编程及通用逻辑等方面的表现得到大幅优化。
更新后的 R1 模型在多项基准测评中表现优异,成绩在国内同类模型中名列前茅。官方信息指出,其整体表现已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。开源继续紧逼顶尖闭源模型。Analytics Vidhya 等分析机构也认为,R1-0528 作为开源模型,在数学(如AIME测试中接近OpenAI o3水平)、通用推理(GPQA Diamond)和编码能力上,已经成为 Gemini 2.5 Pro 的有力挑战者,并在性价比方面展现出显著优势,其性能表现接近 Claude 级别,而成本则低数倍。
目前,该模型目前已在魔搭社区和HuggingFace开源,沿用宽松的MIT License 许可,DeepSeek-R1系列(包括Base和Chat)都支持商业使用和蒸馏。
AI从业者表示,DeepSeek-R1-0528此次依然是基于原来的V3的基础模型进行训练,但性能提升明显,而且蒸馏的小模型还能打败更大模型,证明了后训练的无限潜力。
2
马斯克星舰第九次试飞失败
5月27日晚,美国太空探索技术公司(SpaceX)新一代重型运载火箭“星舰”实施第九次试飞,试飞任务未能成功。当天,“星舰”试飞开始时很顺利,但在部署卫星测试时舱门无法打开,随后“星舰”在轨道失控,火箭第一级助推器发生爆炸,火箭第二级飞船失控,最后在59.3千米高空彻底失联。
在2025年1月16日的第七次发射中,“星舰”因意外强烈的谐振反应引发推进剂泄漏并导致解体;在2025年3月6日的第八次发射中,“星舰”因一枚猛禽发动机硬件故障导致推进剂意外混合点燃而爆炸。第九次发射最关键的测试任务是在重返地球大气层阶段“评估新的热防护系统”。为测试极限,SpaceX拆除了飞船上约100块关键区域隔热瓦。
对于本次失败,马斯克称,比上一次飞行有了很大进步,滑行段与再入阶段因燃料泄漏导致主贮箱失压,已获取大量有效数据可供分析。
3
阿里开源长文本思考模型
阿里开源长文本深度思考模型QwenLong-L1,这是全球首个通过强化学习训练的长文本情境推理模型,采用GRPO和DAPO算法,大幅提升推理准确性与效率,在七个长文本情境文档问答基准测试(DocQA)中表现出色,处理复杂长文本任务能力领先。其32B参数版本超过OpenAI-o3-mini、Qwen3-235B-A22B等,取得与Claude-3.7-Sonnet-Thingking相当的性能。
据介绍,QwenLong-L1-32B的最大亮点在于其惊人的 13 万个 Token 上下文长度,能够处理超大规模的文本输入。相比传统模型,QwenLong-L1-32B 在长上下文处理上实现了从短上下文到长上下文推理能力的无缝迁移,适用于多文档综合分析、跨文档跳跃推理及金融、法律与科研等需要高精度推理的复杂场景。