北航李昂生教授:很多历史的机缘巧合,《人工智能科学——智能的数学原理》得以面世

图片







2024年11月30日,第十九届中国人工智能基础年会上,《人工智能科学——智能的数学原理》新书发布




和世界上任何一件事一样,《人工智能科学——智能的数学原理》的成书和面世是一系列确定性和不确定性联合作用生成的结果。



左右滑动查看更多

李昂生  著

北京 : 科学出版社, 2024. 11

ISBN 978-7-03-079649-3


本书建立人工智能的信息科学原理。包括信息世界的层谱抽象科学范式信息基本定律信息模型等作为科学概念的“信息”的基本概念与基本公理(或定律);包括编码树结构熵解码信息等离散系统的微积分原理,和以信息演算理论信息解码原理信息生成原理为支柱的信息的数学原理;包括以学习的信息模型这一通用学习机的数学模型为基础的学习的信息理论,以层谱抽象的自我感知、认知模型为基础的自我意识的信息理论,和以孙子理性原理、孙子净评估准则、孙子必胜策略原理和孙子模型为基础的博弈/谋算理论为支柱的人工智能的信息科学原理;提出了智能论断:一个自我意识主体的智能就是该自我意识主体的信息;提出了人工智能的信息模型,即孙子模型

本书提出信息世界的概念和信息世界科学体系, 建立信息科学体系基本原理和信息的数学原理,建立信息科学体系下的人工智能科学。但这仅仅是人工智能科学的一个开始,未来更多的原始创新理论和颠覆性新技术值得期待。



《人工智能科学——智能的数学原理》作者几十年如一日潜心研究的结果,作者几十年以来所学的、所有好的东西都体现在书中了。本书能够成立有很多历史的机缘巧合。下面简要介绍几个主要阶段的一些经历,以便人们更好地理解本书是怎么来的


▋第一个阶段,1985~2003年,研究可计算性理论。


可计算性理论是研究计算这个概念的数学实质的数学理论方向。当时选方向比较简单,找资料不容易,不知道别人在做什么,能找到比较新的、权威的专著来学就行了。我找到的就是可计算性理论。后来证实,这个方向比较适合我。可计算性理论方向的研究奠定了作者个人的科学自信。在可计算性理论研究中,作者的硕士生导师刘声烈教授,在科学精神、学术品位、学术品德等方面塑造了作者;作者的博士生导师杨东屏研究员对作者的信任使得作者开始了自由王国的研究;英国的Barry Cooper 教授(图灵的学术后代)是作者的良师益友与合作者。


▋第二个阶段,2003~2016年, 建立“结构信息论”。


2003 年以后,作者考虑寻找新方向。当我有这个想法的时候,姚期智先生跟我讲:



计算机科学跟数学不一样,数学是解决未解决问题,有名的人提出的问题,时间长,很多人做过没做出来,你做出来了,大家就认可;计算机没有那么多老问题,所以计算机科学要从提出问题、论证问题开始。


姚先生的这个建议让我后面20 多年一直受益。之后作者读了很多文章,认真学习了计算机科学和信息科学中开创性的经典文献。在学习过程中发现了一些比较典型的问题:


1.计算复杂性中一个非平凡下界都没有


很多天才的计算机科学家都在研究这些问题,为什么没有进展?


2.“信息”这个概念并不清楚


有数学定义的“信息”就是香农经典信息论中的定义,但是,香农的理论中,“信息”仅限于作为一个通信概念。


计算机科学要求的“信息”应该是“信息处理”的“信息”,这样的信息,香农的信息论中没有提到,完全忽视了。


3.“学习”的数学定义是什么?图灵为什么没有定义这个概念?


图灵花了好几年时间研究“机器智能”,他是基于计算来理解“学习”的,但是没有成功。


2008 年,作者带着这些问题访问计算复杂性的创始人Juris Hartamanis 教授(时任图灵奖评奖委员会主席)。和Hartamanis教授讨论以后,他给作者建议了两个题目:① 给“信息”这个概念重新下个定义;② P有可能首先突破(这个问题,直到现在也看不到希望,复杂性理论需要重新建立理论基础)。


访问Hartamanis 教授期间,他经常跟作者讲,要做第一个、崭新的、从来没人做过的成果。访问期间,有幸经常得到同系的JohnHopcroft 指导,Hopcroft 教授经常给我讲的是要为未来计算机科学创造新数学,不要把时间花在老问题上。Hartamanis Hopcroft 两位前辈科学家的教导对作者坚信做好的科学给予了极大的支持与鼓励


2009 年作者出访美国回来。中国科学院软件研究所所长李明树大力支持作者继续好的研究,他希望作者能锻造一支“指哪打哪”的研究力量。研究所的支持,还有中国科学院的百人计划、国家基金委杰出青年基金、国际重大项目等支持,使得作者能一门心思做研究。然而原始创新的工作难度是非常大的,原始创新的实质是用数学的方法解决哲学问题


2016 年,作者发表了全新的理论成果,建立了“结构信息论”Li A, Pan Y. Structural information and dynamical complexity ofnetworks. IEEE Transactions on Information Theory, 2016, 62(6): 3290-3339.)。


“结构信息论在包括医学数据分析、生物数据分析、自然语言处理、图神经网络、强化学习原理、博弈、图像分析等机器学习领域取得显著应用成果。


2016 年的“结构信息论”仅仅是一个开始。不过是一个关键的开始,它实际上找到了打开信息世界的钥匙,即作为科学概念的信息的数学定义与模型,以及作为信息世界认知模型与方法的层谱抽象的数学原理。


▋第三阶段,2018 年至今,研究人工智能。


人工智能研究是从2018 年开始的,有几个阶段:


1.学习理论


“结构信息论”在机器学习问题中的显著优势使得作者认真研究基于结构信息原理的机器学习理论。作者认识到,学习的数学实质就是回答问题和提出问题,回答问题就是解码信息、提出问题就是生成信息,确信可以建立一个学习的信息理论。


然而,学习还有几个根本问题需要解决,这些问题包括:


1)先验的认知模型是什么?

2)学习的策略是什么?

3)学习的目的是什么?

4)直觉推理的数学理论是什么?

5)知识的定义与度量是什么?

6)学习的可解释性原理是什么?

7)学习的模型是什么?

8)知识推理的数学理论是什么?,等等。


从理论上说,学习解决了“知彼”的问题,即除学习者以外的外部世界的认知。进一步,学习解决了认知世界、改造世界的科学问题。


这些问题的解决没有一个信息的数学原理是不可能的。


2.自我意识


学习是基于观察的学习,观察的对象是外部世界。因此,在极限情况下,学习也仅仅解决了对外部世界的认知,即学习解决:发现现实世界的知识,揭示现实世界的规律,并基于所发现的知识与揭示的规律的创造。


学习不能解决学习者对自身的认知。因此,还有一个自我意识的理论。自我意识是一个非常困难的概念。自我意识理论需要解决一系列新问题,包括:


1)自我意识主体是怎样感知自我的?感知模型是什么?

2)自我意识的定义是什么?

3)自我意识的基本矛盾是什么?有什么规律?

4)自我意识学习的模型是什么?等等。


自我意识的数学定义揭示了,自我意识的基本矛盾是。这是现实世界的基本矛盾。然而,在所有有严格数学定义的学科中,没有一个学科研究利与害的基本矛盾,即利与害的基本矛盾没有严格的科学研究。


从理论上来说,自我意识解决了“知己”的问题,或者说,自我意识解决了认知自我、改造自我的科学问题。


3.博弈/谋算


在知彼知己的条件下,在充满了不确定性、充满了竞争的世界中设计策略、做出决策、采取行动、获胜、获利就是博弈/谋算理论要解决的问题。


人工智能科学的核心就是:学习、自我意识、博弈/谋算。


人工智能科学原理的建立需要在信息科学体系下才有可能。


2016 年提出的“结构信息论”的关键科学思想是,编码树的概念、结构熵的度量、解码信息的度量。


编码树(encoding tree) 的思想是用树,而且,是一个有不同抽象层谱的树,来对复杂系统编码(树是最简单的图,有优越的性质,支持快速算法,而且保留图最美好的性质)。


为什么用树来编码图?2016 年的文章,作者花了一些篇幅来论证这件事。作者在一些地方做报告以后,有一些学者提出来,能否数学地证明“编码树”是唯一可行的编码方法。第一个提出这个问题的人是云南大学的刘惟一老师,同时还有其他同仁学者也提出这个问题。


用树来给图编码,对作者来说是比较自然的。在可计算性理论中,几乎每一个重要定理都可以用“树方法”来证明。所以当时很自然地就用了“编码树”的概念(编码树和可计算性理论中的树是不一样的,但是树结构是一样的)。


在尝试了证明“编码树”是唯一的可行编码以后,作者发现,编码树就是层谱抽象的数学模型和数据结构。“层谱抽象”正是一个普遍的认知模型与方法,是人的先验认知模型与方法。到此,才认识到,“结构信息论”中的“编码树”是信息世界的科学范式。在此基础上,发展出本书第II 部分,信息世界科学范式和信息定律的基本科学原理。所以,作者自己真正意识到编码树就是层谱抽象的数学模型与数据结构也是后来在尝试证明编码树的唯一性时才发现的。后来又进一步发现层谱抽象就是离散系统的微分算子。


信息基本定律涉及对作为科学概念,而不仅仅是通信概念的“信息”,给出一个数学定义和数学模型。信息的数学模型里面的核心科学概念策略,是一个全新的科学概念,是信息的相伴概念。没有“策略”这个新概念,不可能理解信息的实质。


“策略”这个概念是作者借用可计算性理论中的概念。可计算性理论中,最基本的概念就是“策略”,不过在可计算性理论中,策略是一个算法。

到此,可计算性理论研究中最重要的概念——策略,最重要的方法——树方法,都引入到信息的数学原理中了。


随后,根据结构信息原理自然地建立了信息演算理论,使得包括逻辑推理、直觉推理以及结合逻辑推理和直觉推理的推理的数学理论成为现实。


策略的概念包括生成策略解码策略。生成策略有一个信息生成原理,解码策略有一个信息解码原理


到此,信息的数学原理的三大支柱,包括信息演算理论、解码信息原理和生成信息原理就建立了


作者建立了一个新的博弈论,开始叫结构博弈论,不满意这个名字。后来去看《孙子兵法》有了神奇的发现:


  • 《孙子兵法》的每一条,或者在“谋”,或者在“算”;

  • “谋”就是层谱抽象;

  • “算”就是分而治之;

  • 谋算的目的就是非对称优势策略,在分与合中、在运动中创造非对称优势必胜策略;

  • 本书的总方法:层谱抽象认知方法和分而治之分析方法和《孙子兵法》的“谋算”的科学思想是一样的。


这个发现使作者解决了中国的科学自信问题,中国有科学,从《孙子兵法》开始。


作者把本书的人工智能的信息模型定名为孙子模型。中国科学从孙子开始,在孙子的基础上,必将在智能时代再造辉煌,中国科学崛起必将引领未来世界的科学革命、技术革命。


图片


本文摘编自《人工智能科学——智能的数学原理》(李昂生著. 北京 : 科学出版社, 2024. 11)一书“后记”,有删减修改,标题为编者所加。