DeepSeek 爆火
这一部分讨论的主题包括:
1. DeepSeek 为什么火了
2. 火的到底是什么
3. 一些核心的关键决策/节点/细节
4. 开源、低成本的意义
5. 那些谣言与误解
这一部分讨论的主题包括:
1. more money = better infra = better training = better Al
2. Capex-英伟达-数据中心-公有云
3. 特朗普-星际之门计划
4. 芯片与能源
5. 战略投资与并购
新叙事的可能
1. 基于现有数据的 Scaling law 失效
2. 预训练边际效应急速降低
3. 后训练与强化学习崛起
4. 推理类模型显现的能力提升
5. OpenAl 01/Claude 3.5 Sonnet/DeepSeek R1
1. L3 可能等于推理模型+场景实现
2. 肉眼可见的 aha moment = 搜索、代码
3. 没有共识的问题:模型连续 or 非连续;场景边界;组织结构的适配