刘兴亮|从内容智能到行动智能

01

有缺陷的人都有一些超出现实的梦想。

双腿残疾的人渴望拥有一台飞行器,可以垂直起落,随心所欲四处行动;耳聋目盲者梦想自己拥有千里眼顺风耳;五音不全的人乐于设想自己成为歌唱家受到万人敬仰;懒人渴望发财;猪八戒喜欢嫦娥;小偷撺掇自己的姐姐嫁给警察……

人类有普遍的缺陷。这缺陷导致他们渴望超越这平凡的生活,把自己开成一朵怒放的生命。然而人生不如意十之八九,万丈豪情最终落得个「时光拿走了你的美丽,岁月带走了我的脾气」。怎么办?

02


办法来了!

科技引领生活,智慧开启新篇。

AI时代,一日不见,远超三秋。这两年,人工智能的发展呈现爆炸式增长,特别是在内容智能领域已经让人类惊喜连连。生成式AI的问世使得文本、图像、音频和视频的生成和理解达到了前所未有的高度。

图片

然而,AI的进化并不会止步于此。尽管打开应用的对话框后,可以在提出任意问题后得到令人心满意足的答案,但想到这些答案还需要通过个体行为来转换为指导生活和工作的有效实践,距离「躺平式」生活还有距离。

古典经济学家说过,在很大意义上正是人类的懒惰造成了生产方式上的不断创新。在创新饱受质疑的时期结束后,它们就会铺天盖地地进入生活造福人类。

由此,在人工智能爆发后的下一个发展阶段,我的判断是,AI将从内容智能进一步迈向行动智能。

03

什么是行动智能呢?

行动智能(Action Intelligence)是指AI从「理解和生成内容」升级为「规划、决策和执行行动」。

图片

这是AI真正从「智囊」变为「执行者」的关键。这意味着AI应用不仅能给出对话框中的答案,而且能在与用户的长期互动中产生对环境和其行为的理解,通过对其行为信息的搜集和分析,做出决策和建议。

这就好比一个人配备了一个具有广阔的知识积累和深度思考能力的「全能秘书」,只不过这个秘书要更好地看护和协助自己的用户,需要长期开机,总是在线,以便能全面汲取足够的信息变量。

更具体地举例而言。比如我对AI说,帮我订个午餐。然后我就啥也不用管了,就等着吃就行了。AI会自行判断是订刀削面,还是川菜,然后去帮我叫外卖,替我付款,甚至替我决定几点送到。

它之所以能做出「最优选择」,关键在于背后的算法和对有效信息的搜集。

这里边涉及到三个层次的工作。首先是沉浸式对用户的行为信息的大量抓取;其次是对这些信息的分类存储;最后是当面临行动目的时通过算法提取与这一行动有关的信息,并进行信息单体之间的关联,做出判断。

很显然,长期伴随我的AI会发现我午餐就餐时间的范围,能够感知我的口味喜好;最后才能从我身处的环境中进行有效选择,并直接下单来安排。可以说,这是一系列的信息判断和行为决策,不亚于一位优秀的秘书的工作。

图片

但是要做到这一点,并非那么简单。人工智能需要在算法上达到以下几点才可能实现。

1)自主性。例如,自动驾驶汽车不仅需要识别路况,还要自行调整驾驶策略。

2)实时性。工业机器人、无人机和智能物流系统都需要这种能力。

3)目标导向。行动智能以实现特定目标为核心,可以根据环境反馈不断优化执行方案。它能够根据任务需求调整策略,而不是简单地完成一次性输出。

04

自主性、实时性、目标导向,对AI提出了更高更复杂的计算要求。这意味着AI系统在环境的万千变量中搜集与当前行动目标有关联的信息,并对这些信息做出关联,以指导下一步的行动,而这是一个不断生成、不断变化和发展的过程。

这意味着从内容智能到行动智能的进化,AI需要在多个层面上实现技术突破:

首先是多模态感知与融合,将不同的数据流(具有不同的维度、分辨率、类型等)组合起来以生成更易理解或更易使用的信息的过程。

这意味着AI需要进行跨学科的信息共享,能够同时处理和理解来自视觉、听觉、触觉等多种感知渠道的数据。例如,一个服务型机器人需要既能听懂语言指令,又能通过视觉分析周围环境。

图片

其次,长期规划与短期执行的有机结合,这需要将强化学习、深度学习与传统规划算法相互融合,以实现战略布局与即时反应的平衡。

AI可以做出一个行动计划,俗话说,计划赶不上变化,如何在常态中应对变态,就对人工智能提出了极大的挑战。常态是具有逻辑关联的一系列线性时间内发生的事件,这相对容易设计;变态则是突发的、不合逻辑的、缺乏因果关系的因素造成的对行为方式的改变,要能够应对变态,就对程序的算法提出了更深更广的要求。

最后是人机协同的提升。行动智能不是取代人类,而是更好地与人类合作。

无论机器人的计算能力如何强大,它终究缺乏人类的情感和欲望,对人的情绪波动和生活、行动目标的探测不可能百分百准确。

也许一个人三百六十五天都在清晨喝咖啡,可到了三百六十六天,他会改变主意,想要来一杯武夷岩茶,这时候听AI的显然不是好主意,最好遵从自己内心的呼唤。

05

由此,在人工智能的不断进化中,人类与AI的关系也将从「主导与工具」转变为「伙伴与协作」。我们所期待的未来,不仅是AI更聪明,而是AI更有行动力。

当然这个行动智能,是要非常懂你的。

比如同样是说了一句「买肯德基」,如果是我说,那就是买吃的;如果是我那个姓欧的朋友说的,那就是买肯德基的股票;如果是马老师说的,那就是买下肯德基这家公司。