NeurIPS 是当前全球最负盛名的 AI 学术会议之一,近年来受到的关注度也不断攀升。伴随着大模型浪潮的兴起,这一会议的规模达到了有史以来的巅峰。
NeurIPS 2024 将于 12 月 10 日星期二至 12 月 15 日星期日在温哥华举办。本届共收到 15671 篇有效论文投稿,比去年又增长了 27%,但最终接收率低于 2023 年,仅有 25.8%。由于这一届 NeurIPS 宣布采用随机抽签注册系统,有些小伙伴可能无缘去现场参会。
为了给国内 AI 社区成员搭建一个自由轻松的学术交流平台,机器之心联合独家学术活动合作伙伴黄大年茶思屋、社区合作伙伴智源社区将在 12 月 7 日共同举办 NeurIPS 2024 线下论文分享会。
这是一场专为国内 AI 人才打造的盛会,设置了 Keynote、论文分享、圆桌讨论、Poster 交流等丰富环节,邀请顶级专家、论文作者与现场参会观众共同交流。
今天,本次论文分享会的全日程、Keynote 分享嘉宾及演讲主题正式公布。
Keynote 嘉宾及演讲主题
上午 Keynote :冯洋 即时交互多模态大模型初探
分享人介绍:冯洋,中国科学院计算技术研究所研究员、博士生导师、“新百星人才计划” 入选者,长期从事自然语言处理方向的研究,在本领域重要期刊和会议发表论文 100 多篇。担任 ARR Permanent Senior Action Editor、Artificial Intelligence 等期刊编委以及 ACL/EMNLP 等国际会议 (高级) 领域主席。主导研发了百聆大模型和 LLaMA-Omni 即时交互语音大模型,获得 ACL2019 最佳长文奖、中国人工智能学会“杰出贡献奖”、CCF 自然言处理专委会 “青年新锐奖”、 中文信息学会 “钱伟长中文信息处理科学技术奖 - 汉王青年创新奖” 一等奖等。
分享摘要:大模型作为现在人工智能领域的主流范式,最初基于文本语料训练得到,由于人们获取信息的多样化,又融合了语音和视觉模态,然而文本仍然是大模型知识的主要来源,其他模态通常与文本模态进行对齐来共享知识。人类有借助于语音和视觉模态与大语言模型进行即时交互的需求,因此需要大模型能够处理流式输入并进行即时响应,发展出了即时交互多模态大模型。而即时交互多模态大模型需要解决以下挑战:首先,要针对用户指令进行快速响应,要求推理速度足够快;其次,针对流式输入,需要判断进行响应的合适时机;再次,需要将其他模态与文本模态对齐,进行跨模态理解和生成;最后,视觉模态信息处理资源消耗大,如何对其压缩保证能够读取更长历史,直接决定视觉模态交互的性能。本报告将围绕即时交互多模态大模型,介绍我们针对以上解码加速、流式输入、多模态对齐以及视觉压缩方面的探索。
下午 Keynote :魏忠钰 大模型驱动的社会智能体
分享人介绍:魏忠钰,复旦大学大数据学院副教授、智能复杂体系实验室双聘研究员、博士生导师、数据智能与社会计算实验室(Fudan DISC)负责人,香港中文大学博士,美国德州大学达拉斯分校博士后。担任 CIPS 情感计算专委会副秘书长,CCF 自然语言处理专委会副秘书长,曾任 CIPS 青工委执委会副主任。主要研究领域包括多模态大模型和社会智能体,发表论文 100 余篇,担任 ACL 2023,EMNLP 2024 和 NAACL 2025 高级领域主席(SAC)。代表成果包括多模态多步推理大模型 Volcano,DISC-X 系列垂域大模型(覆盖医疗、司法、金融、网络治理四个领域)和大规模选举模拟框架 ElectionSim。曾获得 CIPS 社会媒体处理专委会新锐奖,上海市启明星计划,CCF 自然语言处理专委会新锐学者奖。
分享摘要:传统的社会科学研究依赖于人类参与,通过问卷调查和心理实验等方法来研究社会现象。然而,这些方法在可扩展性、成本和伦理风险方面存在一定局限性。大模型的发展使得模拟复杂人类行为成为可能,引出了面向社会活动的智能体建构的课题。随着对个体建模的多样化和规模化逐渐增加,大模型驱动的社会智能体建构可以分为三个层级:(1)个体模拟:模拟特定个体或人口属性群体;(2)任务模拟:模拟多智能体在特定场景的交互和协作;(3)社会模拟:模拟复杂的社会动态和社会现象。本次报告将探讨大模型社会智能体在这三个层级模拟中的关键要素、挑战以及未来发展方向。
圆桌对话
这场分享会中,我们特别设置了一场「大模型技术拐点到了吗?」主题圆桌,邀请了四位业内专家学者现场探讨。
主持人:张群英 ICT 产业观察家,茶思屋科技网站总编
对话嘉宾:
贺笛,北京大学智能学院助理教授,前微软亚洲研究院主管研究员。主要从事机器学习模型、算法与理论方向的研究工作,已发表 ICML、NeurIPS、ICLR 等重要期刊 / 会议论文 50 余篇,谷歌引用数一万。所设计的模型如 Pre-Norm 结构的 Transformer、GraphTransformer 等多次被 DeepMind、OpenAl、微软、Meta 等国际顶尖研究机构使用。相关工作分别获得机器学习顶级国际会议 ICLR2024 杰出论文奖提名和 ICLR 2023 杰出论文奖。
刘勇,中国人民大学,长聘副教授,博士生导师,国家级高层次青年人才。长期从事机器学习基础理论研究,共发表论文 100 余篇,其中以第一作者 / 通讯作者发表顶级期刊和会议论文近 50 篇,涵盖机器学习领域顶级期刊 JMLR、IEEE TPAMI、Artificial Intelligence 和顶级会议 ICML、NeurIPS 等。获中国人民大学 “杰出学者”、中国科学院 “青年创新促进会” 成员、中国科学院信息工程研究所 “引进优青” 等称号。主持 / 参与国家自然科学面上 / 基金青年、北京市科技计划中央引导地方专项、北京市面上项目、中科院基础前沿科学研究计划等项目。
苏航,清华大学计算机系副研究员,入选国家 “万人计划” 青年拔尖人才,主要研究鲁棒机器学习和具身决策等相关领域,发表 CCF 推荐 A 类会议和期刊论文 100 余篇,谷歌学术论文引用 15000 余次,受邀担任人工智能领域顶级期刊 IEEE TPAMI 和 Artificial Intelligence 的编委,IEEE 生成式大模型安全工作组主席,获得吴文俊人工智能自然科学一等奖,ICME 铂金最佳论文、MICCAI 青年学者奖和 AVSS 最佳论文等多个学术奖项,曾率队在 NeurIPS2017 对抗攻防等多个国际学术比赛中获得冠军。现任中国图像图形学会青工委执委、曾任 VALSE 执行 AC 委员会主席,NeurIPS21 的领域主席(Area Chair)、AAAI22 Workshop Co-Chair 等。
徐军,茶思屋科技网站内容总监,在 ICT 从业的 30 多年期间,从事多种技术和市场工作,服务于包括华为和思科等多家国际著名科技企业,对 ICT 和科技行业有着全面而深刻的理解。
Poster
在本次论文分享会中,将会有一批论文作者进行论文分享与 Poster 展示,感兴趣的读者可以通过下图了解具体信息:
参与方式
线下报名
线上直播
智源社区直播间