今年年初,DeepSeek在海内外爆火,随后另一款国产通用型人工智能(GAI)Manus也在网上刷屏。从前些年的ChatGPT,到如今的DeepSeek、Manus,通用型人工智能技术高速发展,并在越来越多的领域和场景得到应用。
在人工智能快速走进人类生活、学习和工作场景之时,人们也不禁要把它比作历史上其他众所周知的发明,比如火、电灯、内燃机。当然,这一比拟只是为了突出人工智能将产生的人类认知变革,并非在不同的事物之间画等号。
那么,人工智能究竟有何特点?我们首先想到的,或许是庞大的储存能力、高速的计算能力,以及已经展现出来的学习能力。对于这一问题,外交家基辛格也曾作过思考。基辛格博士被称为“中国人民的老朋友”,他为中美关系作出了重大贡献。在他临终(2023年11月29日去世)前,他仍然在思考国际社会的种种问题。此外人工智能也是他思考的话题之一,他一生撰写了22本书,其中最后一本书叫《人工智能时代与人类价值》,是谷歌前CEO埃里克·施密特、微软前首席研究和战略官克雷格·蒙迪与他合作完成,两位业界人士曾在基辛格人生的最后一年与他多次会面,围绕人工智能展开讨论。
下文经出版方授权节选自《人工智能时代与人类价值》一书。内容为关于人工智能特征的论述。摘编有删减,标题为摘编者所起。注释见原书。
纪录片《人工智能的乐趣》(The Joy Of AI,2018)画面。
原文作者| [美]亨利·基辛格 等
《人工智能时代与人类价值》, [美]亨利·基辛格等著,胡利平、风君译,中信出版社·方舟工作室,2025年3月。
1.对人工智能的类别
人们提出了许多类比,以便对人工智能的到来及其意义加以解释、澄清和情境化。人类学家将其比作火或电。将军和外交官则把人工智能比作原子能,或是像俾斯麦所体现的那种不可阻挡、不可征服的人类意志力。天文学家将其描述为类似于小行星的撞击——一种遥远且发生概率很低的预言,人类可能会围绕其组织行星防御——或者外星生命的发现。经济学家将人工智能比作官僚机构和市场,而国家和社会的领导人则将其与印刷机或公司的出现相提并论——后者甚至逐渐拥有了自己的意志,并在发展早期占领了南亚次大陆,当时世界还没有认识到它与现有权力结构的不相容性和对其潜在的支配力。
任何创新,无论多么深刻,都无法与我们在构建智能时追求的最初灵感和(我们所认为的)当前目标——创造比地球上任何人类都更为强大的智能——相提并论。
《我们需要谈谈》(AI We Need To Talk About A.I.2020)剧照。
对于我们目前的处境,有两种考量方式。第一种是对熟悉事物的类比。迄今为止,人类最具变革性的技术都增强或放大了人类的身体功能。轮子减轻了行动不便带来的疲惫,而各种类型的发动机则缓解了肌肉撕裂带来的痛苦。X射线、放大镜和灯泡拓展了可观察现实的极限,令我们超越了自然视力的局限,就像电话以我们的喉咙无法实现的方式增大了我们的声音一样。人类功能的所有方面都在某种程度上被我们创造的机器以无机方式增强、锐化或强化了。那么,人工智能只是人类能力的另一种延伸吗?
第二种思路则暗示,这次的情况有所不同——人工智能具有某些人类能力所无法涵盖的独特方面。通过在短短几十年内制造出等同于进化数千年来所产生的存在,也就是大脑,我们蓦然发现,这已是最后一个需要借助人类之手进行无机复制或再创造的器官。
2.第一特征是速度
机器智能的形成与人类大脑从青春期到成年期的生物学成熟过程类似。
学生在中学阶段学习核心科目的基础知识,建立起基本的世界观。这种世界观可能不是特别先进,也并非始终正确,机器也是这样。机器和人类一样,通过吸收信息并将其转化为理论以供后续实践的方式来进行学习。当机器学习时,算法会抓取大量数据(这些数据来自开放的互联网,或是由其他私人提供的更具体的数据),然后将结果整理成压缩精简的概念映射,以供未来使用。正如人类的生物机制将感官输入映射到连接大脑处理单元网络的神经“权重”上一样,机器同样需要逐步加强自身的计算权重。
神经网络就像某些高中生,可能很懒。在训练的早期阶段,人工智能将做最低限度的工作——只记住答案而非实际学习。面对“2+2等于几”这样的问题,模型一开始可能会在没有掌握加法基本原理的情况下,就将答案编码为“4”。但很快地,当越过了某个临界点,这种方法就会崩溃,并迫使机器像人类一样抽象升华出更普遍的知识公理。
这正是人工智能与普通计算机的主要区别:它对世界的映射不是通过编程得来的,而是学习出来的。在传统的软件编程中,人类创建的算法指导机器如何将一组输入转化为一组输出。相比之下,在机器学习中,人类创建的算法只告诉机器如何改进自己,并允许机器自己设计输入到输出转换的映射。当机器从之前无数次的尝试、失败和调整中“学习”时,它就会升级自己的算法,以迭代方式对其在数据中“洞察到”的模式和联系的内部映射进行重新设计。
人类训练师会定期向机器反馈其输出结果的准确性和质量。
机器通过“反向传播”的方式将他们的修正意见内化:这种技术能让训练师的修改效果通过机器已经创建的数学关系反向传播,从而改进整个模型。
然而,对于任何给定的模型,人类只能对一小部分可能的输入和输出提供反馈。当模型在大量的训练测试中达到一定水平后,其开发人员就会相信,模型所建立的映射关系将对所有输入(即使是意外输入)产生稳妥而准确的响应,而且成功的概率很高。
尽管人脑拥有高度的并行性,即同时处理不同类型刺激的能力,但受限于生物回路的工作速度,人脑的信息处理速度很慢。如果用与计算机相同的性能指标——“时钟频率”或处理速度——来分析人脑回路,那么人工智能超级计算机的平均处理速度已经是人脑处理速度的1.2亿倍。
诚然,速度并不是标称智力的有力指标;极其蠢笨之人也能快速思考。不过,比人脑更快的处理速度带来了两个好处:摄取更多的信息,同时处理更多的请求。人类大脑的大部分通常处于“自动驾驶状态”,即被动地满足人体内部的需求,引导我们的心脏跳动和四肢运动,只有在这种自动驾驶出现故障时才进行干预调整。相比之下,人工智能所能达到的速度使其能够以程序化的方式显现强大的能力,进而解出那些相比目前人脑所能解决问题而言更高级、更困难和更宏大的问题。
3.过程的不可知
我们是如何了解我们所知的宇宙运行规律的?我们又是如何知道我们所知的都是真实的?
在大多数知识领域,自从坚持以实验作为证明标准的科学方法问世以来,任何没有证据支持的信息都被视为不完整和不可信的。只有透明度、可重复性和逻辑验证才能赋予事实主张合法性。在这一框架的影响下,近几个世纪以来,人类的知识、理解力和生产力都得到了巨大的发展,而计算机和机器学习的发明则标志其发展达到了顶峰。
然而,在今天这个人工智能时代,我们面临着一个特别严峻的新挑战:信息无法提供相应解释。如上所述,人工智能的回应可以是对复杂概念的高度清晰和连贯的描述,而且这种描述是即时做出的。机器输出的信息是最基本的和未经修饰的,没有明显的偏见或动机,但也没有附上任何引用来源或其他理由。然而,尽管任何给定答案都缺乏相应理由,但早期的人工智能系统已经让人类对它那些只此一家、别无分店,如同神谕般的声明产生了令人难以置信的信任和依赖。随着它们的发展,这些新的“大脑”可能不仅看似权威,而且确实无懈可击。
《人工智能》(Artificial Intelligence,2001)剧照。
虽然人类的反馈有助于人工智能机器完善其内部算法,但负责检测训练数据中的模式并为其分配权重的主要还是机器。一旦一个模型训练完成,机器也不会公布其所炮制的内部数学模式。因此,机器所生成的现实表征在很大程度上仍是不透明的,甚至对其发明者来说也是如此。如今,人类主要试图通过单独检查输出结果来确保这些机器模型的完整性。但机器的内部运作在很大程度上仍然是不可捉摸的,因此,有些人工智能系统被称为“黑盒子”。尽管一些研究人员正试图将这些复杂模型的输出逆向工程化为人们熟悉的算法,但目前尚不清楚他们能否成功。
简而言之,通过机器学习训练出来的模型可以让人类认识到新事物(模型的输出结果),却无法让其理解这些发现是如何产生的(模型的内部过程)。这就将人类的“知识”与人类的“理解”分离开来,这种体验对人类的任何其他时代而言都是陌生的。现代意义上的人类统觉是从直觉和结果发展而来的,这些直觉和结果则来自有意识的主观经验、个人的逻辑检验以及重现结果的能力。这些知识方法反过来又源于一种典型的人文主义冲动:“如果我无法对某事身体力行,那么我就无法理解它;而如果我无法理解它,那么我就不能知道它是真的。”
在启蒙时代出现的这套框架中,这些核心要素——人类个体能力、主观理解力和客观事实——都是彼此协同的。相比之下,人工智能产生的事实却是通过人类无法复制的过程制造出来的。机器推理不是通过人类的方法进行的,它超越了人类的主观经验,也超出了人类的能力范围,人类甚至无法完全呈现机器的内部过程。
虽然人工智能模型不能“理解”人类意义上的世界——因为机器显然没有意识或主体性——但人工智能具备通过非人类手段精确认知我们 这个世界的客观能力。这不仅打破了我们对过去500年人类孜孜以求的科学方法的依赖,还挑战了人类声称只有自己才真正了解现实,或人类对现实的了解独一无二的说法。
4.它甚至包含了数百个世代
不同的实体以不同的尺度来衡量时间。在地质时间尺度上,整个人类的存在就像地球长达45亿年跨度末尾的一小段突进。如果人类的发展以地质学的速度进行,我们只会感到停滞不前。相反,作为一个缺乏耐心、自视甚高的物种,我们定义了自己的进化速度。地质上的“年龄”以数千年为单位,而人类的“年龄”则以区区一两个世纪为单位。
人工智能可能会基于一种人工或技术的时间尺度,以自己独特的衡量方式运行。人工智能的整个历史不过70年。正如人类普遍认为寒武纪大爆发之前的数亿年是一个无比漫长的空白期,然后动物生命和进化进程才突然迎来爆发一样,人工智能很可能会将1950—2010年这60年描述为一个类似的缓慢、模糊的虚无期,只是到了最后10年才被生命的曙光照亮。
从社会和生物学角度来看,人类的一个世代大约持续25年。
相比之下,人工智能以非人的速度发展;它的世代更短,只需十分之一的时间就能实现飞跃。因此,我们应该预料到,在人类尺度时间里感觉像是一场革命的东西,在技术尺度时间里却只不过是一场进化。较新的人工智能模型——与先前版本只相隔几个月——可以对越来越多的开放性提示做出回应,为达到给定的目标而做出更多的选择,并在越来越多的模式中采取行动。
因此,人工智能时代——在人类的时间里,也许是一百年——可以被更精确地分割标记为“多个”不同时代,更进一步讲,根据技术时间尺度,人工智能时代甚至包含了数百个世代。
研究者用AI阅读古文字。图片来源:《自然》杂志引自慕尼黑大学。
人工智能的快速进化是一个多面性的挑战,而且在很大程度上尚未得到重视。人类以前从未经历过如此巨大的时间压缩,也从未为此做好准备。这种变化的速度之快,无疑带来了文化和心理上的迷失。随着新技术对日常生活的影响不断深化和复杂化,要确定任何一种应用到底是危机之源,还是令人欣慰的进步之兆,都将变得更加复杂难解。
要在现实世界中厘清这些彼此纠缠的问题将变得越来越困难,因为人工智能的多样性会带来多种难以捉摸的影响。此外,随着人工智能变得越发强大,未来其很可能会出现重大进化和多样化。只要不对机器学习的新基础架构和新技术加以限制,一代又一代的人工智能将层出不穷,其多样性、广泛性、能力和复杂性也会与日俱增。就像电能不仅能点亮灯泡一样,人工智能也将有多种用途。且正如产生电的方法有很多种——摩擦、传导、感应——我们可能也会发现多种创建人工智能的方法。
例如,催生人工智能最新进步的基础架构被称为“变换器”(transformer)。它允许机器同时考虑多个词语之间的联系。通俗而言,以前的结构是一个词一个词地读取,只捕获词1和词2之间的联系,然后再分别捕获词2和词3之间的联系,而变换器可以让模型同时捕获整个句子以及句子中每个词之间的联系。通过创建并利用所有联系的数学表征,人工智能就能预测出最佳响应。
5.规模带来分辨率的变化
理性时代可能已经将人类带到了自身所能理解世界的边缘。
爱因斯坦物理学和量子力学的提出,是人类进入未知领域的冒险开端,但这场冒险依然未竟:世界可能有自己的知识规则,不能通过运用感知来体验,而只能通过理论构思来理解。量子力学描述的是微观尺度上的世界,正如哈佛大学物理学家格雷格·凯斯汀所说,在微观尺度上,“没有什么是可预测的,物体在被观测到之前也没有精确的位置”;广义相对论描述的则是宇宙尺度上的世界,在这个尺度上,一切都是可预测的,无论其“是否”被观测到。6两种理论都没有失败,但不可能两者皆为真,而且“还没有实验能够证明这两种理论中的哪一种”占据主导地位。
具有讽刺意味的是,这种不确定性正是现代世界的基础。量子物理学促成了计算机革命等革命。人工智能在当下和将来也会如此。它已经通过我们尚未完全理解的机制产生了洞察力并改变了现实。很快,它还将致力于探索人类愈加无法理解的科学。
纪录片《科学未解之谜》(Science’s Greatest Mysteries,2022)画面。
历时300年的理性时代尽管取得了巨大的成功,如今却已停滞不前——我们在物理统一理论方面明显的一筹莫展就是明证。在相对论宇宙世界和量子世界的核心理论概念提出一个多世纪之后,人类科学愈加显得彷徨无措。我们在这个时代所体验到的焦虑和挣扎只是一个迹象,表明人类智力可能已接近某种生物极限。
由于其独特的探究和学习方法,人工智能将能够在规模(“尺度”)和精度(“分辨率”)方面取得非人的成就,从而引发根本性变革,这种变革与任何其他人类发明所引发的或源于人类物种本身的变革均不相同。然而,人工智能能否在人类现实的宏观和微观两端实现调和,用迄今为止人类经验完全陌生的方法引发一场感知革命?
人类大脑的物理规模是由我们的解剖结构决定的。人类的大脑必须置于人类的头骨里,而人类婴儿的头骨必须大体上适合通过女性的产道。如果大脑小一点,这样的人类的认知能力就会处于劣势;可如果再大一点,婴儿或他们的母亲就可能无法在分娩过程中存活下来。其他生理上的限制也会对大脑的重量造成实际限制。除非借助剖宫产或将来的人造子宫,才有可能突破这种限制,这意味着人类已经达到了某种进化平衡态。
对人工智能来说,今天的模型所具备的能力是在其创建之初未曾预料到的。迄今为止,应用于人工智能的标度律(scaling law,比如,在一个较古老的例子中,支配物体长度与面积之间关系的定律)似乎是正确的,但我们并不知道,参数数量呈指数级增长的模型究竟能实现什么,因为我们还没有找到某些能力会在特定的幂和复杂度下出现的科学原因。
在动物界,大脑大小相对于身体大小的比例与智力并没有明显的相关性——海豚、大象和一些鲸类的大脑都比人脑大得多。不过早期科学确实表明,规模在其中发挥了某种作用,而我们对此尚不了解。
规模带来的主要副作用之一是分辨率。长期以来,人类一直希望将我们的观察范围扩大到极小和极远之处。显微镜和望远镜是人类观察的典型工具。而不起眼的笔却鲜有人理会。这种4000年前发明的书写工具至今仍然是编纂和传递复杂性的杰出工具。其中就包括数学,它也许是最纯粹、最通用的人类语言,其本身就足以促进深奥思想的传递和技术项目的合作。以字节为单位计算的话,以各种优美形式呈现的语言都有着异常密集的数据结构——这是迄今发明的最有效的数据结构。
原文作者/[美]亨利·基辛格 等
摘编/罗东
导语部分校对/柳宝庆