AI模拟人格技术新突破，两小时对话即可创造“数字分身”

DeepTech深科技

2024-11-29 21:00发布于北京DeepTech深科技官方账号

全文2024字，阅读约需6分钟，帮我划重点

划重点

01美国斯坦福大学和谷歌DeepMind的研究显示，AI系统仅需两小时的对话，便能创建出一个人的“数字分身”，准确率可达85%。

02研究团队招募了超过1000名志愿者，通过深入对话创建了他们的AI模拟智能体。

03实验结果显示，AI智能体的回答与真实参与者的反应具有高达85%的相似度。

04该研究关注了AI系统可能存在的偏见问题，发现基于深度访谈的智能体能够有效降低预测偏差。

05尽管如此，这项技术尚不完美，尤其在复杂的道德判断和价值选择方面，AI模拟智能体仍有提升空间。

以上内容由腾讯混元大模型生成，仅供参考

在生成式 AI 不断进步的今天，技术的发展几乎每天都在突破人们的想象，不过如何让 AI 准确模拟人类行为，一直是一个极具挑战性的研究课题。

一项来自美国斯坦福大学和谷歌 DeepMind 的最新研究显示，通过仅两小时的对话，AI 系统就能创建出一个人的“数字分身”，并能以最高 85% 的准确率模拟其（一部分）性格特征和决策行为。

这项研究由斯坦福大学博士生朴俊成（Joon Sung Park）带领完成，团队成员还来自 DeepMind、美国西北大学和美国华盛顿大学。

日前，相关论文以《对 1000 人的生成式代理模拟》（Generative Agent Simulations of 1000 People）为题发表在预印本网站 arXiv[1] 上。

图丨相关论文（来源：arXiv）

在传统的人类行为模拟研究中，智能体的行为通常是通过人工指定的规则来定义的。

这种方法虽然具有较好的可解释性，但往往过度简化了真实人类行为的复杂性。而本研究采用的生成式智能体架构则采取了一种全新的路径。

该团队招募了超过 1000 名来自不同年龄、性别、种族、地域、教育背景和政治倾向的志愿者。

他们通过与参与者进行深入对话，创建了他们各自的 AI 模拟智能体（Simulation Agents）。

这些对话采用半结构化的方式进行，既包含预设的标准问题，也允许根据受访者的回答进行灵活的追问，涵盖了从个人生活故事到当代社会问题的广泛话题，以期获取完整而深入的个人信息，为 AI 系统提供丰富的个性化数据基础。

图 | 采访问题的一部分（来源：arXiv）

在实验中，研究人员设计了一套全面的测试方案。参与者需要完成性格测试（大五人格量表 44 条目版）、社会调查问卷和逻辑游戏等一系列评估，并在两周后重复相同的测试。

随后，他们让 AI 模拟智能体完成相同的测试项目。结果显示，AI 智能体的回答与真实参与者的反应具有高达 85% 的相似度。

这意味着，其预测准确度接近受访者自身在两周后重复作答时的一致性水平。在大五人格特征预测上，AI 智能体实现了 0.80 的相关性。

该研究还特别关注了 AI 系统可能存在的偏见问题。通过对政治倾向、种族和性别等敏感维度的分析发现，基于深度访谈的智能体能够有效降低预测偏差。

研究人员认为，相比仅使用人口统计信息或个人描述的基线方案，这种基于对话的 AI 智能体构建方案在各项指标上，都表现出显著的优势。

朴俊成在接受媒体采访时表示：“如果我们能让许多个‘迷你的你’在数字世界中运行，并做出与你相同的决策，这就是我认为的未来图景。”

他解释说，这种深度模拟的灵感部分来自于他在 2023 年发表关于生成式智能体的论文后，参加了大量播客访谈的经历。

“两个小时的深度对话可以产生意想不到的力量。通过这样的交谈，人们能够深入了解一个人的思维方式和价值观。”他补充道。

这项研究的主要目的，是为社会科学等领域提供更便捷的研究工具。因此，该课题组建立了包含 1000 个生成式智能体的智能体库。

通过创建行为逼真的 AI 模拟智能体，研究人员可以开展一些在现实中成本过高、难以实施或存在伦理争议的研究项目。

例如，可以利用真实人类来生成角色模型，然后以编程方式在模拟环境中使用这些模型，这是无法直接用人类直接实现的。

此外，还可以用来测试社交媒体上打击虚假信息的干预措施效果，或研究导致交通拥堵的行为模式等。这种方法不仅能够节省研究成本，还能突破传统研究方法的局限性。

图 | AI 模拟智能体的创造和评估过程（来源：arXiv）

特别值得注意的是，这项研究只需要两小时的访谈数据就能创建出相当准确的性格模拟，这比目前数字孪生技术需要的数据量要少得多，效率也提升了不少。

不过，这种方法尚不完美，尤其是智能体并不能完全捕捉构成个人独特性的所有细节。

例如，在测试个人价值观和公平性概念的“独裁者博弈”中，AI 的表现相对较差。这表明，在某些复杂的道德判断和价值选择方面，AI 模拟智能体仍有提升空间。

同时，这项技术也可能带来一定的滥用风险。目前，诈骗者已经开始使用音频和视频深度伪造技术，来欺骗受害者的家人、朋友和商业伙伴。如果他们能够获取个人性格的深度伪造技术，潜在危害将更加严重。

值得注意的是，这类模拟智能体与目前主流 AI 公司开发的工具型智能体有所不同。工具型智能体主要用于执行特定任务，如数据输入、信息检索或日程安排等。

包括美国客户关系管理软件服务公司 Salesforce、美国 AI 初创公司 Anthropic 等都已推出了各自的工具型 AI 产品，OpenAI 也计划于 2025 年 1 月发布相关产品。

这两类智能体虽然有所区别，但研究人员认为，对模拟智能体的研究将有助于提升 AI 智能体的整体性能，推动 AI 领域进一步发展。

而随着 AI 技术的发展，有望逐步接近更准确地模拟和理解人类行为的目标。

参考资料：

https://arxiv.org/pdf/2411.10109

https://www.biometricupdate.com/202411/ai-model-that-copies-human-personality-opens-questions-on-deepfakes

https://www.techradar.com/computing/artificial-intelligence/ai-can-now-clone-your-personality-in-only-two-hours-and-thats-a-dream-for-deepfake-scammers

运营/排版：何晨龙

查看原图 200K