Flash-Attention4 继续榨干顶级b系列显卡的性能,继续大幅度降低Attention的计算成本,Attention的理论复杂度是高,但工程实现上一次一次被压缩到极限。在绝大多数业务场景中,Attention都是更好的且开销可忍受的。这两年Attention的复杂度一直被诟病,被新的架构冲击,新的架构在拼命找Attention力不从心的场景,但Flash-Attention系列一次次推迟那个场景到来的时间。
Anthropic的报告中,他们用自己的真实使用数据,做了一个职业暴露度衡量工具,AI 的实际渗透率,远低于理论上限。报告中其中暴露度最高的三个职业是:程序员、客服人员和数据录入员,但实际高暴露群体的失业率并没有系统性上升。真正值得警惕的信号,反而出现在年轻人身上,22到25岁的职场新人,进入高暴露职业的比例下降了约14%。AI 可能让新人更难拿到入场券了。其次,体力劳动者相对被AI替代的概率很低。
但是被替代的人,总要流向别的岗位,最后也很可能涌入体力劳动市场。冲击未必会消失,它只是换了一种方式扩散。
《Real Money, Fake Models》这论文也挺搞笑,研究人员审计了 17 个第三方 LLM 代理 API,结果发现情况相当离谱。将近 46% 的端点连基础指纹测试都通不过,嘴上说自己接的是 GPT-5、Gemini-2.5,后台却偷偷换成了 GLM-4。在医疗基准测试上,准确率能从 83% 直接跌到 37%。这些假 API还被引用进了 187 篇学术论文,相关项目拿到了接近 6 万 GitHub Star。
通往下一个时代的船票,就是基模的能力,其顶级模型的能力排名决定了它的地位,不然现在再大的互联网巨头市值上都会逐渐被新的模型厂超越。
现在大模型基座训练已经是很大的系统工程了,一般各个基模总人数基本都在300+,已经完全达到了互联网核心业务核心大部门的人数体量。
个人英雄主义的时代,在这个行业已经结束了。行业竞争非常激烈,投入也是无比巨大的。组织本身需要跟上竞争烈度的变化。
好的组织确实人才济济,缺了谁都能快速补位,就是阵痛期的长短问题。大模型领军人的年轻化非常明显,优秀的人才确实太多了。
一个健康的组织,新陈代谢是早晚的事。关键不是有没有人走,而是走了之后,能不能补进来更强的人,能不能让组织的整体战斗力不降反升。
AGI依旧还在非常早期的阶段,大幕才刚刚开始拉开,前面依然有很多宽阔的舞台,远远没到故事讲完的时候,今天的领先、失误、流失、爆发,可能都只是这场大戏的前奏。后面还有太多角色会登场,也还有太多位置没有坐稳。
junyang无疑是第一档的人才,后会有期。
说到这里不得不说到百度,比较公允的说法是,robin 可能因为自身是技术高手,所以对技术人才的评价也不够准确,总觉得百度离了谁都不怕,导致百度里优秀人才流失到竞品较多,生生把自己的一些市场优势地位拉低了很多。但事实是不是所有人都可以放走的。
DeepSeek 看着感觉 100%是核心人才流失了
是不是产品经理眼中的研发就和让codex写代码一样,怎么这么慢
gpt-5.4发布, 账面实力看着不错, 于是掏出了好久不用的codex,选gpt 5.4 xhigh, 让它分析模型infra还能怎么加速, 实在太慢了,分析了半天给出p0,p1,p2优化项, 我排除了乍一眼就不对一个p0,让它优化一个p0,一个p1,一顿改动,实测完全不如之前… 这也没啥,关键是依旧,真的,很慢。
GPT-5.4 Thinking 新增的中途打断功能不错,可以在执行过程中随时介入调整方向,不必等到结果出来再发言。
在目前所有模型里,GPT 系列依然是少数能稳定输出长内容、长分析的模型,也是目前最高智能的模型。openai绝对是推理成瘾的,思考这么多、写这么多,效果好慢一点也算情有可原,效果不好就有点蚌埠住了。
大模型时代一旦模型能力上来了,赚钱效率极快,Kimi几个月收入超过之前全部
MiniMax-M2.5还是唯一能8卡80G部署的满血大模型
AI视频挺好玩的,kling seedance依旧是双雄,seedance价格优势很大,这年费价格实在太实惠了,之前排队实在太久了,这几天感觉速度快了不少。15s的视频一次性全部主体一致性还是很困难,很佩服能做出长篇短剧的。
qwen能继续再开源更小的模型吗?嗷嗷待哺中
banana 2依旧是最稳的图像生成,字节的seedream生图也不赖,年费会员免费,速度挺快。
再往前看,Agent to Agent 的产品也开始一批批冒出来了,整个行业像是正式进入了狂烧 token的时期。可热闹归热闹,真正想把这类产品做好,难度依然非常高。表面上看是让 agent 互相协作,背后其实牵扯到任务分解、状态管理、容错、成本控制、上下文衔接,哪一项都不轻松。《Agents of Chaos》这论文有意思,当自主人工智能体被置于开放的竞争环境中时,它们并非仅仅追求性能最大化。它们会自然而然地倾向于操纵、串通和战略性破坏。
有很多Agent to Agent 的设计产品,优质的内容依旧是非常稀缺的。
还有火热的龙虾,大家究竟在用龙虾干什么?干成了什么?
最后,一个越强烈的感受是,AI 正在形成一种逃逸速度。AI的指数级提升会导致很多人类永远无法学会前沿AI,人类的注意力有限,我就有点看不过来了…