追问daily | 目前的大语言模型真的开放吗？婴儿早熟并不总是一件好事；NeurIPS 2024最佳论文揭晓

追问nextquestion

2024-12-04 19:27发布于上海

█ 脑科学动态

婴儿早熟并不总是一件好事

破解 PSEN2 突变在阿尔茨海默病中的致病密码

大脑内部昼夜节律同步的神经机制

间歇性 θ 爆发刺激显著改善精神分裂症的多种症状

壳核深处揭示人类数字认知的演化根源

死藤水如何通过脑部信号调节情绪

█ AI行业动态

ElevenLabs推出对话式AI工具，重塑语音代理服务体验

NeurIPS 2024最佳论文揭晓

腾讯发布混元视频生成模型：130亿参数开源

█ AI研发动态

开放式大语言模型：真正的开放还是开放的幻象？

实时人类反馈驱动的 AI 学习新模式

新框架使图像生成更符合用户需求

人工智能助力基因组学，GPT-4 引领功能基因研究新突破

脑科学动态

婴儿早熟并不总是一件好事

人类大脑在产前和生命早期经历快速发育，理解这一阶段的发育轨迹对评估健康发展至关重要。耶鲁大学医学院的 Dustin Scheinost 副教授及其团队，在这项研究中探讨了大脑年龄差距（BAG）对婴儿发育的影响，并分析了环境和遗传因素的潜在作用。

研究团队从英国人类连接组项目中获取了611名婴儿的脑部功能性和结构性成像数据，利用机器学习构建了预测模型。通过功能性磁共振成像（fMRI）和扩散张量成像（DTI），团队生成了结构和功能连接组，以此预测婴儿的胎龄（PMA）。研究表明，模型能够准确预测大脑年龄，并发现母亲年龄等因素对婴儿发育轨迹的显著影响。母亲年龄较大的足月婴儿在大脑结构发育上更为成熟，但情绪与行为调节能力却略显不足。进一步研究还将探索遗传因素对大脑发育的影响，并扩展到不同文化和地区的儿童群体。研究结果发表在 Nature Communications 上。

#认知科学 #大脑年龄差距 #功能性磁共振成像 #早产儿发育

阅读论文：

Sun, Huili, et al. “Brain Age Prediction and Deviations from Normative Trajectories in the Neonatal Connectome.” Nature Communications, vol. 15, no. 1, Nov. 2024, p. 10251. www.nature.com, https://doi.org/10.1038/s41467-024-54657-5

破解PSEN2突变在阿尔茨海默病中的致病密码

阿尔茨海默病是一种退行性脑部疾病，其中家族性阿尔茨海默病（FAD）由多种基因突变引发。PSEN2 基因突变的作用长期未被充分理解。鲁汶大学的 Wim Annaert 教授及其团队开展了针对 PSEN2 的深入研究，揭示了其突变如何通过多路径机制加速疾病进展。

研究团队在阿尔茨海默病小鼠模型中分析了 PSEN2 基因敲除和突变的影响。他们发现，无论是基因敲除还是 FAD 相关突变，均会加速 Aβ 肽在大脑中的积累，并导致严重的记忆力缺损。这些小鼠表现出海马苔藓纤维回路中的突触功能受损，表现为突触前室面积减小，突触囊泡分布异常，和长期增强作用显著下降（即突触连接随着学习和记忆增强的能力变弱）。在细胞层面，PSEN2 突变引发内体（endosome）和溶酶体（lysosome）的功能紊乱，导致 APP（淀粉样前体蛋白）片段的有毒积累以及突触蛋白表达减少，从而阻碍神经元间的正常信号传递。这些发现表明，PSEN2 不仅通过促进毒性蛋白的积累加速阿尔茨海默病，还通过破坏神经元的基本维持机制加重突触和认知能力的衰退。研究表明，针对内体-溶酶体系统功能障碍的治疗策略可能有助于减缓 FAD 的病程进展。研究成果发表在 Nature Communications 上。

#大脑健康 #遗传突变 #突触功能 #阿尔茨海默病 #溶酶体

阅读论文：

Perdok, Anika, et al. “Altered Expression of Presenilin2 Impacts Endolysosomal Homeostasis and Synapse Function in Alzheimer’s Disease-Relevant Brain Circuits.” Nature Communications, vol. 15, no. 1, Nov. 2024, p. 10412. www.nature.com, https://doi.org/10.1038/s41467-024-54777-y

大脑内部昼夜节律同步的神经机制

昼夜节律对人体健康、尤其是睡眠-觉醒周期具有重要作用，但大脑主时钟的具体调控机制尚未完全揭示。伦敦帝国理工学院的 Marco Brancaccio 博士团队通过研究小鼠和人类视交叉上核（SCN）的星形胶质细胞，深入探讨了其在昼夜节律中的作用。

研究发现，星形胶质细胞通过多胺降解产生的 GABA以24小时为周期，形成一致的脉冲信号。这一节律被称为“astrozeit”，作为 SCN 神经元的内部同步器。实验验证了星形胶质细胞释放的 GABA 对 SCN 神经元活动的同步性和昼夜节律至关重要。当 GABA 合成被抑制时，SCN 的神经元活动和基因表达均出现紊乱。研究还表明，星形胶质细胞的节律紊乱可能导致睡眠障碍和神经退行性疾病，如阿尔茨海默病。研究发表在 EMBO Journal 上。

#大脑健康 #昼夜节律 #星形胶质细胞 #伽马氨基丁酸

阅读论文：

Ness, Natalie, et al. “Rhythmic Astrocytic GABA Production Synchronizes Neuronal Circadian Timekeeping in the Suprachiasmatic Nucleus.” The EMBO Journal, Dec. 2024, pp. 1–26. embopress.org (Atypon), https://doi.org/10.1038/s44318-024-00324-w

间歇性 θ 爆发刺激（iTBS）显著改善精神分裂症的多种症状

精神分裂症是一种慢性精神健康疾病，全球约有1%的人群受到影响，其特征包括阳性症状（如幻觉）、阴性症状（如情感表达缺乏）以及认知功能障碍。尽管现有药物能有效缓解阳性症状，但对阴性症状和认知功能的改善效果有限。基于此，日本藤田保健大学的Taro Kishi带领团队，通过网络元分析，探讨了非药物治疗方法间歇性 θ 爆发刺激（iTBS）的潜在作用。

该研究从 Cochrane 图书馆、PubMed 和 Embase 数据库中筛选了截至2024年5月22日的随机对照试验（RCT），共纳入30项研究、1424名患者。主要分析了9种 TBS 方案的疗效和安全性。研究发现，相较于假手术，iTBS（间歇性 θ 爆发刺激）在以下方面表现出显著效果：改善阴性症状评分；降低抑郁症状评分；提升整体认知功能评分。

研究指出，iTBS的疗效可能源于其对左背外侧前额叶皮层（L-DLPFC）的刺激，该区域与精神分裂症的病理生理学密切相关。研究还表明，iTBS的治疗中断率及副作用发生率与假手术无显著差异，显示其安全性与耐受性良好。研究发表在 JAMA Network Open 上。

#大脑健康 #精神分裂症 #非侵入性治疗 #认知功能 #情感障碍

阅读论文：

Kishi, Taro, et al. “Theta Burst Stimulation Protocols for Schizophrenia: A Systematic Review and Network Meta-Analysis.” JAMA Network Open, vol. 7, no. 10, Oct. 2024, p. e2441159. Silverchair, https://doi.org/10.1001/jamanetworkopen.2024.41159

壳核深处揭示人类数字认知的演化根源

数字认知是人类独特的能力，其神经基础长期以来备受关注。俄勒冈健康与科学大学的 Ahmed Raslan 教授及其团队，通过研究癫痫患者的脑电数据，探索了数字认知的神经机制。研究团队包括Alexander Rockhill、Christian Lopez Ramos 等多名研究人员。

研究招募了 13 名癫痫患者，在其接受立体定向脑电图（sEEG）手术期间，通过分析患者对不同形式数字刺激（符号形式、非符号形式；视觉模式、听觉模式）的反应，揭示了相关脑区的活动模式。结果表明，壳核（putamen）在所有数字刺激的分类中表现出显著的准确率，这提示壳核可能在数字认知的进化早期就发挥了重要作用。此外，顶叶在点阵形式的数字感知中具有较高的敏感性，视觉和听觉刺激分别激活了额顶区域及颞上皮层。频谱分析发现，低于 30 Hz 的非伽马波频段可能是区分不同数字刺激的关键。研究发表在 PLOS ONE 上。

#神经科学 #数字认知 #壳核 #脑电图 #数学学习

阅读论文：

Rockhill, Alexander P., et al. “Investigating the Triple Code Model in Numerical Cognition Using Stereotactic Electroencephalography.” PLOS ONE, vol. 19, no. 12, Dec. 2024, p. e0313155. PLoS Journals, https://doi.org/10.1371/journal.pone.0313155

死藤水如何通过脑部信号调节情绪

随着人们对迷幻医学的兴趣日益增加，死藤水（Ayahuasca）这种亚马逊传统饮品因其在情绪调节和记忆中的潜在治疗价值而备受关注。圣保罗大学的 Lorena Terene Lopes Guerra 团队领导了一项系统分析，整合了多层次研究证据。研究涵盖了从分子水平到临床应用的多重视角，为解读死藤水的复杂脑部作用机制提供了新的见解。

研究综合了十年的实验数据和临床试验结果，揭示了死藤水通过调节5-HT2A和5-HT1A两种血清素受体系统影响情绪和记忆的机制。二甲基色胺主要通过5-HT2A受体起作用，促进恐惧记忆的消除。而β-咔啉（β-Carboline）则可能通过其他分子通路改善焦虑症状和记忆形成。此外，脑成像研究显示，死藤水能显著影响海马区和前额叶皮层这些负责情绪调节和记忆整合的大脑区域活动。当前，临床研究表明其在创伤后应激障碍（PTSD）和焦虑症治疗方面具有前景，但科学家呼吁需要更多对照研究来验证最佳用药方案和安全性。研究发表在 Psychedelics 杂志上。

#大脑健康 #情绪调节 #迷幻药 #神经可塑性 #心理治疗

阅读论文：

https://www.researchgate.net/publication/386140506_Psychedelics_Effects_of_ayahuasca_on_fear_and_anxiety_cross-talk_between_5HT1A_and_5HT2A_receptors

AI 行业动态

ElevenLabs推出对话式AI工具，重塑语音代理服务体验

ElevenLabs近日发布了一款创新的对话式人工智能工具，旨在帮助用户快速创建语音代理，为网站、移动应用和电话中心等提供支持。其核心技术涵盖语音识别、语音合成及智能逻辑处理。通过高质量语音生成与灵活配置，这款工具可应用于客户支持、教育、游戏开发等多个领域。

完整工具包：ElevenLabs提供开发、测试和部署所需的全套技术，包括支持嘈杂环境的高精度语音转文本和低延迟的语音合成功能。工具支持逻辑处理，如中断检测及与第三方应用程序的实时整合。

多语言与多模型支持：平台目前支持31种语言，兼容Gemini、Claude及GPT系列大语言模型（LLM），并允许用户接入自定义模型，满足跨地域和跨语言的需求。

语音定制：ElevenLabs拥有丰富的语音库，并提供语音克隆功能，让企业可以创建与品牌形象一致的个性化声音。

电话集成：通过与Twilio平台对接，支持实时电话交互，提升客户体验。

该工具可广泛应用于客户支持（24/7响应客户需求、品牌声音统一）、教育（提供个性化课程内容）、游戏开发（为NPC创建智能对话）、销售拓展（自动化潜在客户筛选）以及预约管理（高效安排与修改日程）。

ElevenLabs还针对企业提供扩展功能，如企业级服务协议（SLA）、专属技术支持以及优惠定价策略。对于初创企业，平台提供免费试用额度，降低技术入门门槛。

#对话式AI #语音代理 #语音克隆 #客户支持 #教育游戏

阅读更多：

https://elevenlabs.io/conversational-ai

NeurIPS 2024最佳论文揭晓

近日，NeurIPS 2024（神经信息处理系统大会）最佳论文名单正式揭晓。本届大会将于12月10日至12月15日在加拿大温哥华举办，共有15671篇论文投稿，其中仅25.8%获得接收。最终，4篇论文获奖，其中3篇由华人一作完成，展示了亚洲研究团队在人工智能领域的卓越实力。

两篇最佳论文：1、《Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction》由北京大学与字节跳动的研究者联合完成。论文提出了名为Visual Autoregressive Modeling (VAR)的新框架，通过多尺度自回归策略生成高分辨率图像，大幅提升了生成速度和质量。这一方法不仅超越了现有扩散模型，还展现了出色的可扩展性和零样本泛化能力。VAR模型在ImageNet数据集上的表现表明，它是视觉生成领域的一项突破性技术。

2、《Stochastic Taylor Derivative Estimator: Efficient Amortization for Arbitrary Differential Operators》由新加坡国立大学和Sea AI Lab的研究者Zekun Shi等完成。论文提出了一种名为Stochastic Taylor Derivative Estimator (STDE)的算法，显著优化了神经网络中的高阶微分算子处理。其方法在物理信息神经网络（PINNs）中达到了1000倍的速度提升和30倍的内存减少，为高维偏微分方程的高效求解铺平了道路。

两篇最佳论文提名：1、《Not All Tokens Are What You Need for Pretraining》由厦门大学、清华大学与微软的研究者联合完成。论文提出选择性语言建模（Selective Language Modeling, SLM）方法，通过挑选关键tokens进行训练，大幅提升了大语言模型的训练效率和数学任务表现。RHO-1模型在多个任务上的准确率显著提高，展示了其在通用和数学领域的潜力。

2、《Guiding a Diffusion Model with a Bad Version of Itself》由英伟达与阿尔托大学的研究者Tero Karras等完成。论文提出“自引导”方法，利用扩散模型的简化版本提升生成图像质量。这种方法在ImageNet的图像生成任务中刷新了多项记录，并显著提高了扩散模型的效率。

#NeurIPS2024 #AI研究 #最佳论文 #图像生成 #语言模型

阅读更多：

https://arxiv.org/pdf/2404.02905

腾讯发布混元视频生成模型：130亿参数开源

12月3日，腾讯正式推出混元视频生成模型Sora，并宣布全面开源。该模型拥有130亿参数，成为目前参数量最大的开源视频生成模型，其模型权重、推理代码及算法已同步发布至GitHub和Hugging Face。此外，用户可通过腾讯元宝APP体验试用，开发者也可通过腾讯云接入API。

混元视频生成模型主打四大特点：超写实画质、高语义一致性、运动画面流畅性及原生镜头切换能力。这些特性使其能够胜任从广告宣传到创意内容生成的多样化商业应用场景。在实际测试中，该模型展现出强大的文本理解与画面生成能力，例如在复杂提示词下生成动态镜头切换，精确表达出多主体和细节丰富的内容。

技术亮点方面，混元模型在文本编码器部分采用了新一代多模态大语言模型，进一步增强语义跟随能力；其自研的3D视觉编码器支持混合图片/视频训练，显著优化了细节表现与压缩重建性能；此外，全注意力机制（Full Attention）贯穿始终，使得生成画面流畅度显著提升，特别在高速镜头和多视角切换中表现尤为出色。

#腾讯混元 #视频生成 #AI模型 #开源 #多模态

阅读更多：

https://aivideo.hunyuan.tencent.com

AI 研发动态

开放式大语言模型：真正的开放还是开放的幻象？

大语言模型（LLM）的普及引发了关于隐私、工作机会及生成内容真实性的广泛讨论。为了回应用户的关切，LLM 开发者纷纷声称开放其模型。来自康奈尔大学、信号基金会和 Now Institute 的研究团队在 Nature 上发表文章，深入探讨了当前 LLM 的开放性问题。

研究分析了开放 AI 的三个关键特性：透明性（transparency，指公开源代码和部分训练参数）、可重用性（reusability，指代码可供开发者使用的程度）和可扩展性（extensibility，指用户调整代码以满足不同需求的能力）。通过对 LLM 开发和部署过程的剖析，研究者发现，开放代码与开放数据之间存在明显鸿沟。

例如，尽管部分 LLM 提供了开放代码，但底层数据依然不可访问，且训练所需的硬件资源高度集中于大企业手中。研究进一步指出，“开放性”的表述被行业巨头用作策略性工具，以维持对技术发展的控制权，而非真正实现民主化。

作者强调，只有在硬件和训练数据也向公众开放时，开放式 LLM 才能实现其真正意义上的开放，否则仅为一种“开放清洗”（openwashing）的伪装。

#认知科学 #人工智能 #透明性 #开源 #技术民主化

阅读更多：

Widder, David Gray, et al. “Why ‘Open’ AI Systems Are Actually Closed, and Why This Matters.” Nature, vol. 635, no. 8040, Nov. 2024, pp. 827–33. www.nature.com, https://doi.org/10.1038/s41586-024-08141-1

实时人类反馈驱动的 AI 学习新模式

人工智能在复杂任务的自主学习中仍面临困难，尤其是需要快速决策的任务。杜克大学与美国陆军研究实验室的研究团队，由Boyuan Chen带领，开发了一个名为 GUIDE 的新型 AI 学习框架，并在NeurIPS 2024上展示该成果。研究团队的论文现已发布在 arXiv 平台。

GUIDE 框架通过实时人类引导强化学习解决 AI 自主学习的瓶颈。研究包括两个阶段：第一阶段，人类训练师通过光标在梯度刻度上提供连续反馈，这些反馈被整合为密集奖励信号，帮助 AI 优化策略；第二阶段，通过模拟反馈模块生成在线反馈，使 AI 在减少人类参与的情况下持续训练。实验测试了 50 名普通参与者，他们的反馈仅用了 10 分钟就将 AI 的成功率提升了 30%。这种高效性凸显了 GUIDE 在复杂、动态环境中的潜力。此外，研究还发现，人类训练师的认知能力，如空间推理和快速决策，直接影响 AI 学习的效果。团队计划进一步开发更全面的学习框架，包括整合语言、面部表情和手势等多种信号。

#认知科学 #实时反馈 #强化学习 #人机交互

阅读更多：

Zhang, Lingyu, et al. GUIDE: Real-Time Human-Shaped Agents. arXiv:2410.15181, arXiv, 19 Oct. 2024. arXiv.org, https://doi.org/10.48550/arXiv.2410.15181

新框架使图像生成更符合用户需求

近年来，生成模型特别是生成对抗网络（GAN），在图像生成领域取得了显著进展，但其内容控制能力不足限制了实际应用。首尔国立科技大学的 Giang H. Le 和 Anh Q. Nguyen 团队开发了一种新型图像生成框架，通过改进编码技术，有效解决了这一难题。

新框架通过引入两个核心模块——频率编码模块（frequency encoding module）和内容融合模块（content fusion module），实现了图像生成的精准内容控制。频率编码模块从参考图像中提取特定频率的特征，而内容融合模块生成内容引导向量，将这些内容特征融入到图像生成中。研究团队利用多个数据集（如 Flickr-Faces-High Quality 和 Animal Faces High Quality）进行了大量实验，结果显示，新框架生成的图像平均保留了参考图像 85% 的内容属性，显著优于传统的基于 GAN 的模型。这项研究为开发更智能、更个性化的图像生成工具提供了基础，未来可广泛应用于计算机视觉算法的训练和创意设计行业。

#神经技术 #图像生成 #GAN #计算机视觉

阅读更多：

Le, Giang H., et al. “Content-Aware Preserving Image Generation.” Neurocomputing, vol. 617, Feb. 2025, p. 128965. arXiv.org, https://doi.org/10.1016/j.neucom.2024.128965

人工智能助力基因组学，GPT-4 引领功能基因研究新突破

基因集富集（Gene Set Enrichment）是功能基因组学的重要方法，但由于基因功能数据库的不完整性，其使用受限。研究团队评估了五种大型语言模型（LLMs），其中 GPT-4 在基因功能预测中表现最优。在使用 Gene Ontology 精选基因集进行测试时，GPT-4 达到 73% 的准确率，并在分析随机基因集时表现出 87% 的零置信度，这表明其能有效避免过度推测。

研究发现，GPT-4 能为基因功能预测提供详细的分子依据，并辅以清晰的自信评估。此外，在组学（omics）数据基因集分析中，GPT-4 尽管识别率较低（45%），但其预测的功能具有更高的特异性和覆盖率。人工验证发现，GPT-4 的功能描述大多可靠。研究团队还开发了一个门户网站，帮助其他科学家将 LLM 应用于功能基因组学的研究工作流程。研究结果表明，GPT-4 不仅能够加速传统研究，还可为生成新的、可测试的假设提供支持。研究发表在 Nature Methods 上。

#神经技术 #基因组学 #人工智能 #精准医学 #功能预测

阅读更多：

Hu, Mengzhou, et al. “Evaluation of Large Language Models for Discovery of Gene Set Function.” Nature Methods, Nov. 2024, pp. 1–10. www.nature.com, https://doi.org/10.1038/s41592-024-02525-x

整理｜ChatGPT

编辑｜丹雀、1900、存源

查看原图 269K