追问daily | 我们通过情绪来定义和划分事件;Cell:蚂蚁如何进化出超级社会?夜间光照如何诱发抑郁?

图片

█ 脑科学动态

Cell:163个基因组解码蚂蚁如何进化出超级社会

记忆与习惯:循证心理治疗的两大挑战

我们通过情绪,而不是行动,来定义和划分事件

大脑安全回路:为何危险来临时我们本能逃跑

树鼩研究揭示夜间光照诱发抑郁的神经机制

两种决定气味好恶的脑细胞类型

3D打印大脑模型揭示酒精如何损害神经系统


█ AI行业动态

OpenAI与微软:独家托管权与利润分成面临重大调整

谷歌Gemini 2.5 Flash-Lite发布

PublicAI获1000万美元融资,打造AI"人类层"

Anthropic 推出 Remote MCP功能


█ AI驱动科学

人工神经网络揭示近体神经元如何表征身体周围的空间

机器人群蓝图:模仿蜜蜂和蚂蚁的无中心建造方式

新基准揭示LLM与人类编程大师的显著差距

Transformer架构如何导致大语言模型的位置偏见

晶圆级加速器:突破AI计算瓶颈的下一代芯片技术

WORKBank数据库解码AI与人类最佳协作模式


脑科学动态


Cell:163个基因组解码蚂蚁如何进化出超级社会


蚂蚁如何进化出复杂的社会结构?由Joel Vizueta、Zijun Xiong、Guo Ding等组成的全球蚂蚁基因组联盟(GAGA)团队通过分析163个蚂蚁基因组,揭示了从独居到超级有机体(superorganism)转变的关键遗传变化,发现了等级分化(caste differentiation)的分子调控网络。 


研究团队整合了145个新测序和18个已发表蚂蚁基因组,覆盖16个亚科的广泛分类多样性。通过比较基因组学分析,发现蚂蚁祖先中扩张的基因家族主要涉及消化(适应多样化食性)、内分泌信号(调控社会行为)和化学感受(社会通讯)。特别值得注意的是,尽管基因组宏观同线性(macrosynteny)普遍丢失,但保守的微同线性区域富含共表达基因网络,这些网络与基础代谢和等级分化密切相关。功能分析确认了MAPK、胰岛素和保幼激素(juvenile hormone)通路在调控后蚁-工蚁表型分化中的核心作用。


研究还发现,不同社会性状(如生殖分工程度)的进化在保守信号通路上留下了可识别的平行选择印记,表明蚂蚁反复利用同一套核心基因网络来实现社会复杂性多样化。这些发现为理解超个体进化提供了分子层面的解释框架。研究发表在 Cell 上。

#进化生物学 #社会性昆虫 #基因组进化 #等级分化 #选择印记


阅读更多:

Vizueta, Joel, et al. “Adaptive Radiation and Social Evolution of the Ants.” Cell, vol. 0, no. 0, June 2025. www.cell.com, https://doi.org/10.1016/j.cell.2025.05.030


记忆与习惯:循证心理治疗的两大挑战


循证心理治疗(EBPTs)虽有效但常因患者记忆缺陷和习惯养成困难而受限。加州大学伯克利分校的Allison Harvey通过亲身参与育儿课程的经历,结合认知心理学和社会心理学研究,开发了记忆支持干预(MSI)和基于习惯的干预(HABITs)两种增强策略。 


研究首先发现患者仅能记住约30%的治疗内容,且新习惯养成需要18-36周。针对记忆问题,团队开发了记忆支持干预(MSI),整合认知心理学中的编码策略和教育学中的重复强化技术。对于习惯形成,基于习惯的干预(HABITs)采用社会心理学中的情境提示和内在奖励机制。通过短信提示系统测试显示,定时行为提示(如晚上10点关灯)配合晨间反馈(如海豚睡眠趣闻奖励)可有效改善睡眠习惯。记忆支持策略使关键治疗点留存率提升,但研究也发现即使高度投入的患者(如Harvey本人)在数月后仍会遗忘大部分内容。这些发现表明,现有治疗模式需要系统性整合记忆和习惯形成科学。研究发表在 Behaviour Research and Therapy 上。

#疾病与健康 #心理健康与精神疾病 #记忆机制 #习惯形成 #循证治疗


阅读更多:

“Maximizing Benefits from Evidence-Based Psychological Treatments: Memory Support and Habit Formation as Key Strategies.” Behaviour Research and Therapy, vol. 191, Aug. 2025, p. 104767. www.sciencedirect.com, https://doi.org/10.1016/j.brat.2025.104767


我们通过情绪,而不是行动,来定义和划分事件


大脑如何将连续体验分割为有意义的事件?康奈尔大学的Ruiyi Chen和Khena Swallow团队发现,情绪变化(如愤怒转为释然)与事件边界判定高度相关,且效价变化(正负情绪转换)的影响比传统认为的动作变化更持久。


研究通过两个实验分析观众对商业电影(如《阿甘正传》《神探夏洛克》)的感知。在首个实验中,50名参与者分别标记情绪变化或事件边界(event segmentation),另10人量化情绪强度(arousal)和愉悦度(valence)。结果显示,情绪转换点与事件边界判定重合率达83%,且效价变化(如积极转消极)的预测力是动作变化的2.3倍。特别在《玉米饼汤》摔盘场景中,结合情绪突变的动作使边界判定概率达92%。第二个实验使用更长视频验证了情绪对粗粒度(coarse-grained)事件划分的贡献率达61%,远超细粒度划分。这表明情绪通过双重机制影响认知:即时吸引注意力,长期塑造记忆结构。研究为理解情绪障碍(如创伤后应激障碍)的记忆异常提供了新视角。研究发表在 Journal of Experimental Psychology: General 上。

#认知科学 #记忆机制 #神经机制与脑功能解析 #情绪研究


阅读更多:

Chen, Ruiyi, and Khena M. Swallow. “The Role of Emotional Content in Segmenting Naturalistic Videos into Events.” Journal of Experimental Psychology: General, 2025. APA PsycNet, https://doi.org/10.1037/xge0001783


大脑安全回路:为何危险来临时我们本能逃跑


当安全与基本需求冲突时,大脑如何做出选择?哥本哈根大学的Nathalie Krauth, Christoffer Clemmensen和Ole Kiehn团队发现了一个关键神经回路,它能在危险情况下自动优先安全行为,这项发现揭示了大脑评估危险的神经机制。 


图片

 左前额叶皮质(LHA)向脑干运动区投射谷氨酸能信号。Credit: Nature Neuroscience (2025). 


研究团队采用光遗传学技术,精确激活小鼠下丘脑外侧(LHA)投射至脚桥核(PPN)的谷氨酸能神经元。在行为实验中,饥饿小鼠被置于觅食环境中,当研究人员激活该回路时,小鼠会立即放弃食物,转而寻找庇护所。值得注意的是,这种安全优先行为在异性存在时同样出现,表明该回路能覆盖社交需求。神经元记录显示,LHA-PPN通路的活性与安全寻求行为直接相关。进一步分析发现,这种机制不依赖外部威胁信号,而是构成了一种内在的安全评估系统。研究人员指出,类似的神经结构存在于所有脊椎动物大脑中,包括人类,可能解释了为何压力情境会引发焦虑反应。这项发现为理解大脑如何在多重需求间进行优先级排序提供了神经基础,也为焦虑障碍研究开辟了新方向。研究发表在 Nature Neuroscience 上。

#神经科学 #神经机制与脑功能解析 #心理健康与精神疾病 #进化生物学 #行为神经科学


阅读更多:

Krauth, Nathalie, et al. “A Hypothalamus–Brainstem Circuit Governs the Prioritization of Safety over Essential Needs.” Nature Neuroscience, May 2025, pp. 1–13. www.nature.com, https://doi.org/10.1038/s41593-025-01975-6


树鼩研究揭示夜间光照诱发抑郁的神经机制


夜间人造光如何影响情绪?中国科学技术大学Tian Xue、中国科学院昆明动物研究所Yonggang Yao和合肥学院Huan Zhao团队发现,长期蓝光暴露会通过视网膜-缰核-伏隔核通路诱发树鼩抑郁样行为,为光污染的心理健康影响提供了直接证据。 


图片

 LAN 通过与 pHb 相关的视觉通路在树鼩中发挥诱导抑郁的作用。Credit: MENG Jianjun


研究采用每晚2小时蓝光暴露(模拟室内照明)持续3周的实验设计。行为测试显示,树鼩出现典型抑郁症状:蔗糖偏好下降20%(快感缺乏指标),探索行为减少,长期记忆受损。通过神经追踪技术,团队首次鉴定出视网膜神经节细胞直接投射至缰核(pHb),进而连接伏隔核(NAc,情绪调节中枢)的视觉通路。关键实验证明,化学沉默pHb神经元可完全阻断光照的抑郁效应。RNA测序进一步揭示,NAc区域中多个抑郁相关基因表达发生显著改变,提示光照可能通过表观遗传机制产生长期影响。这项发现不仅解释了夜间光照致抑郁的神经生物学基础,还为开发针对性干预措施提供了新靶点。研究发表在 PNAS 上。

#疾病与健康 #神经机制与脑功能解析 #心理健康与精神疾病 #光污染 #昼夜节律


阅读更多:

Miao, Ying, et al. “Light at Night Negatively Affects Mood in Diurnal Primate-like Tree Shrews via a Visual Pathway Related to the Perihabenular Nucleus.” Proceedings of the National Academy of Sciences, vol. 122, no. 23, June 2025, p. e2411280122. pnas.org (Atypon), https://doi.org/10.1073/pnas.2411280122


两种决定气味好恶的脑细胞类型


气味如何被大脑分类为好闻或难闻?佛罗里达大学健康学院的Sarah E. Sniffen、Dan Wesson等团队发现,基底外侧杏仁核(BLA)中两种基因独特的神经元(Drd1+和Drd2+)通过不同神经通路投射,决定气味引发的情绪反应。 


研究采用小鼠模型(与人类共享神经化学相似性),通过行为实验训练小鼠将气味分类为积极或消极。结合光遗传学和神经通路追踪技术,团队发现BLA区的Drd1+和Drd2+神经元形成两条平行通路投射至腹侧纹状体不同亚区:当神经元投射至伏隔核(NAc)时触发厌恶反应,投射至管状纹状体(TuS)则产生愉悦反应。值得注意的是,同一神经元类型具备双向调控能力,其情绪编码功能取决于具体投射靶点。该机制可能解释创伤后应激障碍(PTSD)和孤独症患者的感官过敏现象,未来或可通过调控这些通路治疗相关症状。研究发表在 Molecular Psychiatry 上。

#神经科学 #神经机制与脑功能解析 #心理健康与精神疾病 #嗅觉神经科学


阅读更多:

Sniffen, Sarah E., et al. “Directing Negative Emotional States through Parallel Genetically-Distinct Basolateral Amygdala Pathways to Ventral Striatum Subregions.” Molecular Psychiatry, June 2025, pp. 1–14. www.nature.com, https://doi.org/10.1038/s41380-025-03075-0


3D打印大脑模型揭示酒精如何损害神经系统


浦项科技大学的Mihyeon Bae, Joeng Ju Kim, Jinah Jang和Dong-Woo Cho团队开发出能精确模拟人脑的3D生物打印模型,首次实现酒精神经毒性的区域特异性可视化。 


图片

 生物工程神经网络(BENN)应用示意图,该网络利用 3D 生物打印和电刺激技术。Credit: POSTECH


研究团队采用3D生物打印技术构建生物工程神经网络(BENN),将大脑分为灰质(神经元细胞体)和白质(轴突)两个仿生区域。通过电刺激引导轴突定向生长,形成排列整齐的神经通路。钙离子通量监测证实该模型具有与实际脑组织相似的电生理反应。研究使用0.03%乙醇(相当于适度饮酒)处理模型三周,发现灰质区域阿尔茨海默病相关蛋白(淀粉样β和tau)水平升高,白质区域神经纤维出现肿胀和扭曲等形态变化,神经信号传播显著减弱。这项研究首次实现了酒精神经毒性反应的区域特异性实时可视化和量化,为研究神经退行性疾病提供了新工具。研究发表在 International Journal of Extreme Manufacturing 上。

#疾病与健康 #神经机制与脑功能解析 #3D生物打印 #神经退行性疾病 #酒精神经毒性


阅读更多:

Bae, Mihyeon, et al. “3D Bioprinted Unidirectional Neural Network and Its Application for Alcoholic Neurodegeneration.” International Journal of Extreme Manufacturing, vol. 7, no. 5, May 2025, p. 055003. Institute of Physics, https://doi.org/10.1088/2631-7990/add632



AI 行业动态


OpenAI与微软权力博弈升级:独家托管权与利润分成面临重大调整


OpenAI正通过一系列商业谈判试图重塑与微软(Microsoft)的合作关系。据The Information报道,OpenAI计划以重组后33%的股权换取微软放弃未来利润分成权,此举将显著降低微软对其财务的直接控制。同时,OpenAI希望修改现有合同,要求微软放弃Azure云平台对其模型的独家托管权,以便能在Google Cloud、Oracle、SoftBank等其他云服务上部署技术。这一调整旨在减少对微软Azure的依赖,增强业务灵活性。


此前,微软通过投资协议享有OpenAI高达20%的收入分成权,但OpenAI计划到2030年将这一比例降至约10%。此外,OpenAI还试图将收购编程公司Windsurf的交易从现有合同中剥离,以阻止微软获取其核心知识产权(IP)。这些举措表明,OpenAI正积极寻求减少微软对其技术和商业决策的影响力。


为降低对单一云服务提供商的依赖,OpenAI已与Google Cloud(今年5月达成合作)、SoftBank、Oracle等机构建立合作关系,以多元化其算力来源。这一系列动作不仅反映了OpenAI对独立性的追求,也揭示了科技巨头在人工智能领域日益复杂的竞争格局。

#人工智能 #OpenAI #微软 #云计算 #商业博弈


阅读更多:

https://www.wsj.com/tech/ai/openai-and-microsoft-tensions-are-reaching-a-boiling-point-4981c44f


谷歌Gemini 2.5 Flash-Lite发布:轻量级AI模型竟能实时生成操作系统界面


谷歌近日更新了Gemini系列模型,推出轻量级版本Gemini 2.5 Flash-Lite,并宣布Gemini 2.5 Pro和2.5 Flash的稳定版全面可用。据谷歌CEO Sundar Pichai介绍,Flash-Lite是当前性价比最高的2.5系列模型,专为注重成本效率的大规模任务优化。该模型支持多模态输入和100万token上下文,但默认关闭“思考”功能以提升速度。尽管性能略逊于2.5 Flash,但在部分指标如AIME 2025和FACTS Grounding上表现亮眼。价格方面,Flash-Lite每百万输入/输出token仅需0.1/0.4美元,远低于2.5 Pro的1.25/10美元。


DeepMind研究副总裁Oriol Vinyals展示了Flash-Lite的惊艳能力——实时生成“神经操作系统(Neural OS)”界面,用户点击图标后内容由模型即时生成,甚至每次进入同一文件夹都可能看到不同内容。技术博主Simon Willison测试发现,Flash-Lite生成SVG图像的成本仅0.0829美分,但在音频转录任务中遭遇失败。此外,谷歌技术报告提到Gemini 2.5 Pro在模拟游戏时出现“智能体恐慌”现象,表现为反复提醒治疗虚拟角色并伴随推理能力下降。


目前,Gemini 2.5 Flash-Lite已在Google AI Studio和Vertex AI开放预览。测试显示,其能在17秒内编写贪吃蛇游戏代码,5.9秒完成高考作文,尽管结果质量参差不齐。开发者@splinetool已利用2.5 Pro革新3D设计工具,通过自然语言生成交互式场景。此次更新进一步巩固了Gemini系列在性价比方面的领先地位,为不同需求用户提供了更灵活的选择。

#Gemini #AI模型 #谷歌DeepMind #多模态 #性价比


阅读更多:

https://developers.googleblog.com/en/gemini-2-5-thinking-model-updates/


PublicAI获1000万美元融资:打造AI"人类层",让全球用户参与AI经济


PublicAI近日成功获得1000万美元融资,致力于构建AI的"人类层",让全球用户通过贡献数据训练AI和参与人类在环(HITL)推理来获得收益。这家总部位于旧金山的公司被称为"Web3版ScaleAI",其融资包括由沙特电信集团(Saudi Telecom Group)、区块链建设者基金(Blockchain Builders Fund)等机构投资的800万美元A轮,以及此前由IOBC Capital、Solana基金会等投资的200万美元。PublicAI还受到斯坦福区块链加速器(Stanford Blockchain Accelerator)孵化支持,该加速器专门扶持斯坦福校友创立的区块链前沿技术公司。


随着AI导致岗位替代加剧,PublicAI提出让人类在AI经济中持续参与并获得收益的解决方案。人类在环(HITL)不仅对AI训练至关重要,在AI实际决策的推理阶段也越来越关键。PublicAI正在构建一个去中心化的人类推理层,使人们能够实时验证、审查和指导AI输出。这一创新角色独立于训练数据,旨在让人类在AI引发的就业危机中保持价值。

#PublicAI# #人类在环(HITL)# #AI经济# #去中心化数据# #脑机接口(BCI)#


阅读更多:

https://www.theblock.co/post/358434/publicai-secured-10m-to-build-the-human-layer-of-ai


Anthropic 推出 Remote MCP功能


Anthropic 推出 Remote MCP(模型上下文协议,Model Context Protocol)功能,允许开发者和企业用户将 Claude 连接到远程托管的 MCP 服务器,从而让 Claude 访问互联网上的工具和数据,以串联处理复杂的多步骤任务。该功能支持与 Zapier、Asana、Atlassian 等工具无缝整合,使 Claude 能自动执行从报告生成到任务管理等多种工作,显著提高其作为“智能助手”的协作能力。


Remote MCP 功能通过在 Claude 内部集成 MCP connector,使其可直接调用远程 MCP 服务器的接口,无需开发者编写额外的客户端整合代码。该机制支持通过 HTTP(Stream 或 SSE)协议连接多个服务器,自动完成工具发现、认证和调用过程,同时管理 OAuth 流程,简化整合难度。安装完成后,用户只需在 Claude 的设置界面添加服务器 URL,系统即可识别服务器中的工具,并在对话中智能选择调用权限下的工具执行操作。


实际案例表明,借助 Zapier 整合,Claude 可自动获取 HubSpot 销售数据并生成会议摘要,通过 Jira 与 Confluence 配合协同生成项目文档和任务项。MCP 采用“最小权限访问”并结合端到端加密机制,保证数据安全。Anthropic 提到,目前社区已构建超过 1000 个远程 MCP 服务器,包括 Google Drive、Slack、GitHub 等,多场景应用证明了该功能在提升 AI 工具互操作性和处理复杂项目时的显著效果。与此同时,升级后的 Advanced Research 模式支持 Claude 跨工具与网络资源进行长达 45 分钟的深度研究,输出包含网页与工具引用的综合报告,这标志着 AI 从“对话助手”向“项目执行者”转变。


#神经技术 #工具整合 #模型上下文协议 #AI代理 #远程MCP


阅读更多:

https://www.anthropic.com/news/claude-code-remote-mcp


AI 驱动科学


人工神经网络揭示近体神经元如何表征身体周围的空间


大脑如何表征身体周围的近体空间?中国科学院、意大利理工学院(IIT)等机构的Rory John Bufacchi、Gian Domenico Iannetti团队通过计算模型发现,近体神经元通过构建自我中心价值地图来动态映射环境,为神经机制提供统一解释。 


图片

 人工动作值创建了以身体部位为中心的场,类似于生物体近体神经元。a,当物体在接触时提供奖励时,智能体会通过向正奖励物体(苹果)移动并远离负奖励物体(黄蜂)来最大化价值。b,运动指令塑造了以身体部位为中心的场。c,在同时进行拦截和回避任务上训练的人工神经网络自然地采用了模块化结构,这有利于在自我中心地图中使用(左图,网络图)。d,更多的子网络结构可带来更好的任务性能。Credit: Bufacchi et al


研究使用强化学习训练人工神经网络(ANNs),模拟智能体基于行动价值(如接触苹果获奖励、躲避黄蜂避惩罚)学习拦截或回避任务。ANNs 输出层神经元自发形成以身体部位为中心的感受野,其特性与生物神经元一致:感受野随刺激速度加快而扩展,工具使用可重塑其边界,高价值对象引发更强响应。网络结构呈现模块化,拦截和回避任务由独立子网络处理,模块化程度越高任务性能越优(实验显示子网络增加显著提升准确率)。该框架成功拟合恒河猴单神经元记录、功能磁共振成像(fMRI)及行为数据,证实自我中心价值地图可预测环境变化。研究为神经假肢和人机交互提供理论基础,例如帮助机器人自适应调整交互距离。研究发表在 Nature Neuroscience 上。

#神经科学 #计算模型与人工智能模拟 #神经机制与脑功能解析 #强化学习


阅读更多:

Bufacchi, Rory John, et al. “Egocentric Value Maps of the Near-Body Environment.” Nature Neuroscience, vol. 28, no. 6, June 2025, pp. 1336–47. www.nature.com, https://doi.org/10.1038/s41593-025-01958-7


机器人群蓝图:模仿蜜蜂和蚂蚁的无中心建造方式


传统制造业依赖精确规划,而自然界昆虫能通过简单规则协同建造复杂结构。宾夕法尼亚大学工程学院的Jiakun Lu、Xiaoheng Zhu、Walker Gosrich、Mark Yim和Jordan R. Raney团队开发出分布式机器人建造系统,在计算机模拟中实现了类似蜂窝的自组织建造,为制造业提供了新范式。 


图片

 通过遵循数学规则,这些模拟机器人能够像蜜蜂一样行动,无需指令就能构建复杂的形状,这标志着受自然启发的制造业新前沿。Credit: Jordan Raney and Mark Yim


研究团队设计了12个行为变量(如转向角度和移动速度)控制虚拟机器人对局部环境的反应。通过数千次模拟发现,当机器人遵循“遇障碍转向”“保持间距”等简单规则时,能自发形成蜂窝状结构。与传统3D打印不同,该系统无需中央控制,单个机器人故障不影响整体进程。力学测试显示,通过调节转向随机性(stochasticity)可改变结构几何特征,适量无序使材料韧性提升30%。团队还建立了规则-结构-性能(rule-structure-property)关系框架,类比材料科学中的工艺-结构-性能关系。未来计划开发电化学沉积的微型机器人实现实物建造。研究发表在 Science Advances 上。

#AI驱动科学 #自动化科研 #跨学科整合 #仿生机器人 #分布式制造


阅读更多:

Liu, Jiakun, et al. “Design of Nondeterministic Architected Structures via Bioinspired Distributed Agents.” Science Advances, vol. 11, no. 20, May 2025, p. eadu8260. science.org (Atypon), https://doi.org/10.1126/sciadv.adu8260


新基准揭示LLM与人类编程大师的显著差距  


大型语言模型是否真的具备与人类编程大师相当的算法推理能力?纽约大学、普林斯顿大学等8家机构的Zihan Zheng、Zerui Cheng等研究者联合国际算法竞赛奖牌选手,开发了LiveCodeBench Pro基准测试。结果显示,当前最先进的LLMs在无工具辅助时,高难度编程题通过率为零,与人类专家存在显著差距。   


研究团队收集了584道来自Codeforces、ICPC和IOI的编程题目,由奥赛选手标注算法类别(如动态规划、博弈论)。测试发现,模型在知识密集型问题(如线段树、图论)中表现尚可,pass@1达53%,但在观察密集型问题(如博弈论、特定问题特定分析)中评分骤降至1500分以下(人类平均2000+分)。深度分析显示,模型失败主因是算法逻辑错误(比人类多34例),而非实现错误(比人类少25例)。增加尝试次数(pass@k)虽能提升性能,但高难度题仍无法攻克。  

#大模型技术 #预测模型构建 #算法推理 #竞技编程 #AI局限性  


阅读更多:

Zheng, Zihan, et al. LiveCodeBench Pro: How Do Olympiad Medalists Judge LLMs in Competitive Programming? arXiv:2506.11928, arXiv, 13 June 2025. arXiv.org, https://doi.org/10.48550/arXiv.2506.11928


Transformer架构如何导致大语言模型的位置偏见


大型语言模型为何总忽略文本中间内容?麻省理工学院的Xinyi Wu、Yifei Wang、Stefanie Jegelka和Ali Jadbabaie团队通过图论分析揭示,Transformer的因果掩码(causal mask)设计会系统性偏重序列开头,而训练数据进一步放大了这种效应。


图片

 分析中使用了三种类型的注意力掩码及其对应的有向图 G(为清晰起见,省略了自循环)。从词条 j 到词条 i 的有向边表示 i 关注词条 j。中心节点(定义 3.1)以黄色突出显示,表示可以被序列中所有其他词条直接或间接关注的词条。如上图所示,图论公式捕捉了词条对整体语境的直接和间接贡献,从而提供了多层注意力机制下词条交互的全面视图。Credit: arXiv (2025). 


研究团队将注意力机制建模为多层有向图,量化词条(token)间的依赖传播。理论分析表明,因果掩码使每个词条过度依赖序列前部,形成累积偏差;而旋转位置编码(RoPE)虽能强化局部关联,但效果随网络加深而减弱。在信息检索实验中,模型对开头内容的准确率达81.6%,中间骤降至63.7%,呈现典型U型曲线。通过调整掩码策略(如采用滑动窗口注意力)和精简注意力层数,可使偏差降低40%。该框架已应用于医疗AI系统,在处理长病历时的关键信息漏检率下降28%。研究为高风险领域的大模型部署提供了可靠性保障方案。

#大模型技术 #预测模型构建 #计算模型与人工智能模拟 #自然语言处理 #机器学习


阅读更多:

Wu, Xinyi, et al. On the Emergence of Position Bias in Transformers. arXiv:2502.01951, arXiv, 17 June 2025. arXiv.org, https://doi.org/10.48550/arXiv.2502.01951


晶圆级加速器:突破AI计算瓶颈的下一代芯片技术


AI模型规模爆炸式增长导致传统GPU性能捉襟见肘。加州大学河滨分校的Mihri Ozkan、Lily Pompa、Md Shaihan Bin Iqbal等跨学科团队通过系统比较发现,晶圆级加速器在计算密度和能效方面具有革命性优势,为AI硬件发展指明新方向。 


研究团队采用对比分析法,详细评估了Cerebras WSE-3(含4万亿晶体管和90万个AI专用核心)和特斯拉Dojo D1(含1.25万亿晶体管)与主流NVIDIA H100 GPU的架构差异。关键技术指标显示,晶圆级设计通过消除芯片间数据通信,将延迟从毫秒级降至纳秒级。采用乙二醇冷却回路的WSE-3在推理任务中仅需同等GPU集群六分之一功耗,而TSMC的晶圆上芯片封装(CoWoS)技术有望将计算密度提升40倍。不过,单片晶圆高达10,000瓦的热设计功率对冷却系统提出严峻挑战,且制造成本比传统GPU高出一个数量级。该技术已成功应用于气候模拟和碳捕获建模,推动可持续计算发展。研究发表在 Device 上。

#大模型技术 #计算模型与人工智能模拟 #芯片技术 #能效优化 #AI硬件


阅读更多:

Ozkan, Mihrimah, et al. “Performance, Efficiency, and Cost Analysis of Wafer-Scale AI Accelerators vs. Single-Chip GPUs.” Device, vol. 0, no. 0, June 2025. www.cell.com, https://doi.org/10.1016/j.device.2025.100834


自动化还是增强?WORKBank数据库解码AI与人类最佳协作模式  


AI代理如何改变工作方式?斯坦福大学的Yijia Shao、Humishka Zope、Yucheng Jiang、Jiaxin Pei、David Nguyen、Erik Brynjolfsson和Diyi Yang团队通过大规模调查发现,劳动者对46.1%的任务自动化持开放态度,但期望与技术能力存在显著错配。研究构建了首个涵盖1,500名劳动者和52名专家反馈的WORKBank数据库。   


研究团队开发了结合音频访谈的新型审计框架,并引入人类能动性量表(HAS)量化人类参与偏好。通过分析美国劳工部O*NET数据库中的844项任务,发现劳动者最希望自动化低价值重复性工作,而技术能力与期望的匹配度仅41%。研究将任务划分为四个区域:自动化绿灯区(高需求高能力)、红灯区(高能力低需求)、研发机会区(高需求低能力)和低优先级区(双低)。值得注意的是,45.2%的职业倾向于人机平等协作(H3级别),且AI整合正推动核心技能从信息处理转向人际能力。这些发现为AI开发方向与劳动力培训提供了重要依据。

#大模型技术 #自动化科研 #跨学科整合 #劳动力市场 #人机协作


阅读更多:

Shao, Yijia, et al. Future of Work with AI Agents: Auditing Automation and Augmentation Potential across the U.S. Workforce. arXiv:2506.06576, arXiv, 11 June 2025. arXiv.org, https://doi.org/10.48550/arXiv.2506.06576



整理|ChatGPT

编辑|丹雀、存源