Science:如何理解大模型的智能本质

图片

“欧米伽未来研究所”关注科技未来发展趋势,研究人类向欧米伽点演化过程中面临的重大机遇与挑战。将不定期推荐和发布世界范围重要科技研究进展和未来趋势研究。(->关于欧米伽理论)


    在ChatGPT发布几个月后,神经网络先驱特伦斯·塞诺夫斯基(Terrence Sejnowski)在文章中提到,他正在努力适应大语言模型(LLMs)所展现出的惊人能力。他写道:

    “某些过去几年都未曾预料到的事情开始发生了。一道门槛被突破了,就像某个外星生物突然出现,能以一种令人毛骨悚然的类似人类的方式与我们交流……它们的一些行为似乎显得很智能,但如果这不是人类的智能,那它们的智能本质究竟是什么?”

那么,LLMs及基于它们构建的人工智能(AI)系统的智能本质究竟是什么?对此仍然没有一致的答案。许多人将LLMs类比于一个单独的人类思维(或者像塞诺夫斯基认为的那样,像一个外星生物的思维)——一个能够思考、推理、自我解释,甚至可能拥有自身目标和意图的思维。

另一些人则提出了完全不同的方式来理解这些庞大的神经网络:比如将它们视为能够模仿多种角色的“角色扮演者”;将它们比作图书馆和百科全书等文化技术,使人类能够高效访问由其他人类创建的信息;将其看作“人类智能的镜子”,“并非自行思考,而是生成复杂的反映,由我们的记录思想投射而成”;将其描述为网络内容的模糊JPEG文件,是训练数据的近似压缩;或将其称为“随机鹦鹉”,通过“随机拼接语言形式序列”来运作,“但不参照任何意义”;最贬低的比喻则是将其描述为一种增强版的自动完成功能。

在AI领域,这些不同的隐喻暴露了对LLMs本质的看法分歧。鉴于对这些系统惊人能力及其不可预测错误的有限理解,有人认为“隐喻是目前我们能用来接近这个黑匣子的唯一工具”。

AI领域一直严重依赖隐喻。AI系统被称为具有“知识”和“目标”的“智能体”;LLMs通过获得“奖励”进行“训练”;以“自监督”的方式通过“阅读”大量人类生成的文本进行“学习”;并通过称为“思维链”的方法进行“推理”。不仅如此,甚至该领域最核心的术语——神经网络、机器学习和人工智能——本身也是对人类能力和特征的类比,而这些能力与机器的能力仍然有很大差别。早在1970年代,AI研究员德鲁·麦克德莫特(Drew McDermott)就将这种拟人化语言称为“美好的助记符”,其本质是希望这些隐喻最终成为现实。

人类当然倾向于拟人化非人类事物,包括动物、公司,甚至天气。但当面对能用流利语言与我们交流的AI系统时,这种倾向尤其显著。它们使用第一人称代词,并谈论自己的“感受”。我曾问Anthropic的聊天机器人Claude,它最热衷于什么。它回答说:“如果我考虑我最热衷的事情,那会是分析和发现的过程——将复杂的问题或想法分解开来,深入理解。我尤其喜欢帮助他人学习和发现新见解时的过程。我在从多个角度探索问题时感到非常满足。”我问ChatGPT同样的问题,它告诉我:“我特别热衷于帮助人们找到清晰的思路和新的视角,无论是深入探讨一个复杂的话题、探索创意想法,还是让日常任务更轻松一点。我喜欢看到某些事情在某人脑中‘豁然开朗’的时刻——那种顿悟或灵感的瞬间。”

尽管OpenAI的首席执行官山姆·阿尔特曼(Sam Altman)曾劝告公众不要拟人化AI,并将AI系统看作“工具”而非“生物”,但像Claude或ChatGPT这样的LLMs却被设计成了完全相反的效果:让人们将它们概念化为具有情感、欲望、信念和自我意识的个体思维。从上述的回答中可以看出,这些聊天机器人表述了个人的享受、满足感和热爱。虽然这使对话体验更自然,但让人感觉聊天另一端是一个“思维体”会影响用户对模型的期望,例如信任其输出的程度,是否认为它能够“理解”或“同情”用户,甚至是否认为它是一个可以与之形成浪漫关系的实体。

我们对LLMs的隐喻不仅会影响我们如何与这些系统交互、信任它们的程度,还会影响我们如何科学地看待它们,以及如何制定法律和政策来规范它们。

“将LLM视为个体思维”的隐喻推动了某些科学研究方向:如果你在这种隐喻下工作,给一个LLM进行智商测试或其他旨在评估人类的标准化测试似乎是很自然的做法。此外,你可能会认为给LLMs进行性格评估或在心理实验中将它们作为人类的替代品具有意义,甚至考虑是否应对这些系统给予“道德关注”。如果你将LLMs看作更像复杂的数据库或用户友好的图书馆,这些评估和研究就显得没什么意义。

“LLM作为思维”的隐喻也被用于法律辩论中。所有大型AI公司都在未经许可或补偿的情况下使用大量书籍、新闻文章和其他受版权保护的文本和图像来训练其模型;作家、新闻媒体、艺术家和其他创作者因此对这些公司提起了版权侵权诉讼。被告的主要辩护之一是,AI在受版权材料上进行训练属于“合理使用”,而这一论点基于LLMs类似人类思维的观点。微软首席执行官萨蒂亚·纳德拉(Satya Nadella)反驳这些诉讼时这样说:“如果我阅读了一系列教科书并创造了新的知识,这算是合理使用吗?……如果一切都被版权覆盖了,那我就不应该读教科书和学习,因为这会构成版权侵权。”

法律学者杰奎琳·查尔斯沃斯(Jacqueline Charlesworth)反驳道,这种隐喻依赖于人类对阅读、学习和创造的直观理解,使用拟人化语言来引导公众(误)认为AI机器的学习和创造像人类一样,即它们具有概念思维和从具体知识中进行概括的能力。语言学家艾米丽·本德(Emily Bender)进一步指出,纳德拉将LLMs对其训练文本的处理等同于人类从书籍中阅读和学习的行为,“低估了成为人类的意义”。

最后,“AI作为思维”的隐喻深刻影响了关于AI系统可能存在的“生存风险”的讨论,这种风险假定这些系统可能具有类似人类的追求权力的冲动,并可能威胁人类的生存。这种假设在AI政策讨论中被认真对待。

AI研究者仍在寻找正确的隐喻来理解我们这些神秘的创造物。然而,随着我们人类对这些系统的部署、使用方式的选择,以及我们研究它们、制定法律法规以确保其安全和伦理的方式,我们需要高度警惕那些潜移默化塑造我们对其智能本质的隐喻。

来源:
https://www.science.org/doi/10.1126/science.adt6140



阅读《2024年大模型技术报告》全文

请访问欧米伽研究所的“未来知识库”


图片


截止到10月25日 ”未来知识库”精选的100部前沿科技趋势报告



1. 牛津大学博士论文《深度具身智能体的空间推理与规划》230页

2. 2024低空经济场景白皮书v1.0(167页)

3. 战略与国际研究中心(CSIS)人类地月空间探索的总体状况研究报告(2024)

4. 人工智能与物理学相遇的综述(86页)

5. 麦肯锡:全球难题,应对能源转型的现实问题(196页)

6. 欧米伽理论,智能科学视野下的万物理论新探索(50页报告)

7. 《美国反无人机系统未来趋势报告(2024-2029 年)》

8. Gartner 2025 年主要战略技术趋势研究报告

9. 2024人工智能国外大模型使用手册+中文大模型使用手册

10. 详解光刻巨人ASML成功之奥妙-241015(94页)

11. CB Insights:未来变革者:2025年九大科技趋势研究报告

12. 国际电信联盟2023-2024年联合国人工智能AI活动报告388页

13. 《人工智能能力的人类系统集成测试和评估》最新51页,美国防部首席数字和人工智能办公室(CDAO)

14. 2024瑞典皇家科学院诺贝尔化学奖官方成果介绍报告

15. MHP:2024全球工业4.0晴雨表白皮书

16. 世界经济论坛白皮书《AI价值洞察:引导人工智能实现人类共同目标》

17. 瑞典皇家科学院诺贝尔物理学奖科学背景报告资料

18. AI智能体的崛起:整合人工智能、区块链技术与量子计算(研究报告,书)

19. OpenAI o1 评估:AGI 的机遇和挑战(280页)

20. 世界知识产权组织:2024 年全球创新指数(326页)

21. 美国白宫:国家近地天体防御策略与行动计划

22. 【CMU博士论文】持续改进机器人的探索,243页

23. 中国信通院:量子计算发展态势研究报告2024年58页

24. 2024年OpenAI最新大模型o1革新进展突出表现及领域推进作用分析报告

25. 【新书】通用人工智能,144页

26. 联合国:《未来契约》、《全球数字契约》和《子孙后代问题宣言》三合一

27. 世界气候组织:2024团结在科学中,守卫地球系统的未来

28. 世界经济论坛 《量子技术助力社会发展:实现可持续发展目标》研究报告

29. 人工智能科学家:迈向全自动开放式科学发现

30. 欧盟:石墨烯旗舰项目十年评估报告

31. 美国信息技术和创新基金会:美国的数字身份之路研究报告

32. 麦肯锡:2024能源转型挑战未来研究报告

33. 联合国贸易与发展会议:2024世界投资报告

34. 兰德:评估人工智能对国家安全和公共安全的影响

35. 兰德:2024评估人工智能基础模型市场的自然垄断条件

36. 经合组织:2015-2022 年生物多样性与发展融资

37. ITIF:中国半导体创新能力研究报告

38. 英国皇家学会:数学未来计划, 数学和数据教育的新方法研究报告

39. 欧盟:10年人类大脑计划创新评估报告

40. GLG格理集团:2024深度解读半导体行业关键趋势和专家洞见报告15页

41. 华为智能世界2030报告2024版741页

42. 联合国:2024为人类治理人工智能最终报告

43. 达信Marsh:2024全球科技产业风险研究报告英文版27页

44. 鼎帷咨询:2024英伟达人工智能发展战略研究报告149页

45. 【博士论文】大语言模型的测试与评价:准确性、无害性和公平性,223页pdf

46. 麦肯锡:2024世界能源产业展望

47. 世界经济论坛《太空:全球经济增长的 1.8 万亿美元机遇》

48. 世界经济论坛:世界“技术先锋”名单100家公司名单

49. 世界经济论坛:2024绘制地球观测的未来:气候情报技术创新

50. 核聚变技术作为清洁能源供应替代来源的全球发展和准备情况

51. 大模型生成的idea新颖性与人类对比研究报告(94页)

52. IQM :2024 年量子状况报告

53. 2024十大新兴技术研究报告

54. 2024地球观测 (EO) 洞察带来的全球价值(58页)

55. 2023-2024世界基础设施监测报告

56. 世界银行:2024世界发展报告,中等收入陷阱

57. 2024国际前沿人工智能安全科学报告132页

58. 斯坦福大学2024人工智能指数报告

59. 美国总统科学技术顾问委员会:《利用人工智能应对全球挑战》63页报告

60. 柳叶刀行星健康:2024地球系统安全与健康评估报告

61. 中国未来50年产业发展趋势白皮书III

62. OpenAI o1系列产品原理与安全最新研究报告(80页)

63. 国家互联网信息办公室:国家信息化发展报告2023年110页

64. 埃森哲:2024年风险研究报告-重大颠覆需要持续重塑英文版39页

65. 36氪研究院:2024年中国城市低空经济发展指数报告41页

66. 美国信息技术与创新基金会:《中国在量子领域的创新能力如何》研究报告

67. 理解深度学习500页报告

68. 鼎帷咨询:2024全球人工智能发展研究报告44页

69. 【伯克利博士论文】大型语言模型迈向能够学习和发现一切的机器

70. 《量子技术:前景、危险和可能性》45页报告

71. 英国皇家学会报告:人工智能在科学、技术、工程和数学领域的应用

72. 未来今日研究所:2024世界技趋势报告(980页)

73. 面向大规模脉冲神经网络:全面综述与未来方向

74. 大模型+知识库市场全景报告

75. 《太空力量的理论基础:从经济学到不对称战争》2024最新94页报告

76. CBInsights:2024年第二季度全球企业风险投资状况报告英文版124页

77. 英国科学院:数据管理和使用:21 世纪的治理(2024),99页

78. 兰德智库:展望2045 一项前瞻性研究探讨未来 20 年全球趋势的影响

79. 世界知识产权组织:2024年世界知识产权报告:让创新政策促进发展

80. 全球灾难风险研究所:评估大型语言模型接管灾难的风险

81. 牛津马丁学院:人工智能风险国际科学评估的未来

82. 联合国贸易和发展署:2024世界投资报告

83. 兰德公司:人工智能军事应用的新风险和机遇

84. 英国皇家学会:AI时代的科学发展趋势研究报告

85. 百页风电行业研究方法论:从中国到世界从陆地到海洋-240902,98页

86. 中国信通院发布《大模型落地路线图研究报告(2024年)》

87. 星河智源:2024年无人驾驶技术全景报告35页

88. 星河智源:2024年光刻机技术全景报告37页

89. 人形机器人行业研究方法论:特斯拉领衔人形机器人的从1到N

90. 兰德:展望2045一项关于未来20年全球趋势影响的前瞻性研究报告英文版45页

91. 《军事创新与气候挑战》2024最新152页报告

92. 麦肯锡:2024困难点:驾驭能源转型的物理现实(196页)

93. 《麻省理工科技评论》万字长文:什么是人工智能?

94. 软件与服务行业:从特斯拉智能驾驶看人形机器人发展路径

95. 中国信通院:中国数字经济发展研究报告2024年82页

96. CB Insights:2024年第二季度全球风险投资状况报告 244页

97. 脑启发的人工智能:全面综述

98. 二十年关键技术跟踪报告

99. 中国首部城市大脑系列建设标准(8项)汇编

100. 麦肯锡2024技术趋势展望报告100页




上下滑动查看更多