人工智能技术赋能情报分析:灵丹妙药还是危机?

AI划重点 · 全文约4953字,阅读需15分钟

1.人工智能技术在情报分析领域具有巨大潜力,但短期内仍需情报分析师耗费时间验证其贡献。

2.生成式人工智能可以协助情报评估,但无法完全解决与认知偏见和心理模型相关的问题。

3.情报组织应谨慎行事,避免“继承”原始数据中的偏见,同时寻求合法方法获取私营部门数据。

4.为解决大模型“幻觉”问题,高质量训练数据和检索增强生成等功能有助于提高生成式人工智能的性能。

5.情报专业人员应将其视为一种会随着时间推移而改进的工具,而非灵丹妙药或危险。

以上内容由腾讯混元大模型生成,仅供参考



图片

编者按 :

2024年10月10日,美“战争困境”网站刊登了题为《人工智能与情报分析:灵丹妙药还是危机?》的文章,作者是美陆军职业军事情报官诺亚·库珀。文章称生成式人工智能成功进入情报领域的最重要因素是情报界的接受度。而在短期内,生成式人工智能在情报中的应用成果仍需情报分析师耗费时间验证。作者强调与其他新兴技术一样,人工智能并不是“开箱即用”的解决方案,而是一种不断发展的技术能力。现将全文编译如下。


当数字数据洪流席卷世界之后,专业情报分析师必须应对无穷无尽的数据流,这些数据流不仅使其不堪重负,还加剧其认知偏差带来的影响。人工智能赋能情报分析是最终的解决方案吗?还是会因为人工智能的缺陷(大模型幻觉)带来更多风险?
事实上,人工智能既不是灵丹妙药,也不是危险。与其他新兴技术一样,人工智能并不是“开箱即用”解决方案,而是一种不断发展的能力。今天,人工智能可以通过应对特定挑战来增强人类的能力并增强分析过程。特别是人工智能当前存在的种种缺陷意味着它的价值在于作为人类情报分析师的专业知识和判断力的补充能力。
在全面采用人工智能支持情报分析之前,必须了解情报分析师面临的具体问题:①应对海量数据 ;②从非传统渠道获取数据 ;③认知偏见对情报评估客观性的影响。人工智能可有效解决上述问题,前提是人类必须参与其中。

数据过载、完整性和偏见

区分真伪或对每天收集的大量信息进行分类是当今困扰美国情报界的主要问题。尽管已经投资了自动化收集手段和相应的基础设施来存储、组织和构建大量数据以供情报分析员将来检索和检查。而上述举措在消耗美国情报界很大一部分预算之后,很多信息仍然“散落一地”或未经情报分析员处理。
简单来说,数据过载比数据不足要好。然而,情报失误,例如2003年美军错误识别伊拉克拥有大规模杀伤性武器、1973年以色列情报失误导致埃叙两国于“赎罪日”发动进攻,以及2023年10月7日新一轮巴以冲突爆发都表明,过多的数据可能会对至关重要的情报分析过程造成不利影响,特别是如果分析人员无法整理和筛选现有信息来识别对手意图的关键指标。
处理越来越多的信息需要情报分析员梳理、识别和综合不同的数据点以做出判断—如果做得好,不确定性就会减少。然而,认知偏见加上数据过多或数据质量差的问题困扰着这一过程,导致评估不准确,还可能决策失败、军事行动风险增加以及其他一系列连锁反应。
如果人工智能的前景成真,那么基于大型语言模型的生成式人工智能技术(如 ChatGPT)可以提高分析过程的效率。例如,生成式人工智能可以总结冗长的文本(例如外国灰色文献)、翻译外语、进行开源情报分析以及执行其他各种任务。此外,生成式人工智能可以协助情报评估。这并非弱化人类情报分析师的关键职能,而是将生成式人工智能作为分析过程的辅助手段,帮助人类情报分析师识别缺陷或不一致之处。

图片

▲帕兰提尔公司为美军提供的AI软件运行截图

虽然这些功能都很有应用前景,而且有理由认为情报机构已经将这些技术融入到日常工作中,但生成式人工智能并非完美无缺。
首先,生成式人工智能对于解决长期存在的分析偏差问题方面收效甚微。基于大型语言模型构建的生成式人工智能技术依赖于预先存在的数据集,而这些数据集本质上是非结构化的,并且可能存在缺陷。与此相关,当今的生成式人工智能模型容易出错,可能会提供虚假或不准确的内容。这些“幻觉”与生成式人工智能模型的发展有关。尽管使用大量数据进行训练,但如果生成式人工智能系统遇到陌生的单词、短语或主题,或者数据不足,它就会根据对语言的理解做出推断,并给出系统认为合乎逻辑但可能是错误的答案。
其次,确定对手的能力和意图所需的信息不再局限于政府的职权范围。非政府组织、私营实体、社交媒体公司等已成为重要的数据代理,掌握着了解战略环境和构建准确情报评估所需的信息。在情报分析中使用生成式人工智能需要解决数据访问、质量和偏见等相关潜在问题。

关于思维的思考 :认知偏见

就情报分析而言,心理模型是一种范式,它指导情报分析师思考对手将如何行动或局势如何发展。与心理模型相关的优势因背景和环境而异。尽管如此,心理模型可以促进批判性思维,帮助决策,并将不同的观点纳入分析或决策过程。理想情况下,多种心理模型的组合有助于提升情报分析结果。
相反,对某一领域的丰富经验或知识可能会带来不利影响,因为心理模型可能会促使个人拒绝接收新的和矛盾的信息,或者错误地处理这些信息。也许心理模型最令人担忧的方面可能是抵制变化的倾向。一旦分析师制定了评估,特别是如果评估已经过审查和批准,分析师的心理模型可能会阻止他们接受改变其评估性质的新信息。

图片

1973年10月12日,在“赎罪日战争”期间,

以色列炮兵向叙利亚边境阵地发射炮弹


心理模型加剧分析偏差的一个鲜明例子是,在1973年“赎罪日战争”前夕,以色列情报机构的情报人员未能正确识别阿拉伯人的意图。在1967年“六日战争”取得成功后,以色列情报部门在组织和机构上创造了“形成概念”。这一“形成概念”为以色列情报部门和决策者提供了一个分析框架,塑造了他们对阿拉伯活动的看法。他们认为,鉴于以色列在1967年战争中取得的压倒性胜利,埃及和叙利亚不会在对方缺席的情况下发动攻击;阿拉伯军队不会在没有地对地弹道导弹的情况下发动攻击,因为这些导弹可能会威胁并危及以色列的机场和平民;阿拉伯联军不会发动攻击,除非他们能够借助苏联的防空能力与以色列的空中优势抗衡。以色列情报分析员倾向于仅根据与概念相关的视角来审查收到的情报,并试图根据战略考量而不是战术现实来推断阿拉伯人的意图,这导致了不精确的评估,最终导致阿拉伯联合部队发动突然袭击。

人工智能来救援?

情报机构是以信息为中心的组织,这意味着该组织的基础依赖于持续的数据流入。分析师随后将这些“原始”数据转化为连贯的信息,以便向用户展示或交付。根据一个问题的全部事实(如果有的话)能得出近乎确定的结论。但是,情报机构依靠情报收集的不确定事实以及从分析师的知识、专业知识和培训中得出的假设来确保评估的准确性。尽管他们对问题的历史方面有着深入的了解,更重要的是,他们精通技术,但心理模型的不利影响始终笼罩着情报评估。鉴于心理模型可能具有无意识和非自愿的影响,生成式人工智能能否突破人类认知的固有偏见,提供公正客观的评估?
要回答这个问题,首先需要了解生成式人工智能如何实现情报分析过程。生成式人工智能对情报分析的主要贡献是能够将复杂性提炼为分析师更易于管理的核心组件。具体而言,人工智能可以处理来自多个不同来源的大量结构化和非结构化数据,并确定数据中人类分析师不易察觉的联系。此外,假设生成式人工智能的大型语言模型具有能力,它可以融合来自多个情报门类(例如信号情报、人力情报、地理空间情报等)的信息,以更快的速度呈现更清晰的问题描述。可操作情报的价值很高,特别是在时间敏感的情况下,因此,人工智能识别模式和相关性的极快处理速度对分析师来说非常有价值。作为一项附带好处,提供可操作情报的更高及时性可以作为情报组织与其用户之间关系加强的措施。
人类能够与生成式人工智能系统交互——即使提示包含令人困惑的语法、拼写错误和缺少标点符号——并得到有用的答复,这就是自然语言处理的一种体现。自然语言处理促进了人与人工智能之间的互动,使系统能够处理和理解人类的文本和语音。当今世界约有7164种语言。此外,每天产生的数据量可能在3~4亿TB之间。从情报角度来看,即使只分析这些数据中的一小部分,也是一项困难且耗时的任务,尤其是当数据源是外语时。而自然语言处理减轻了翻译负担,有助于从文章、书籍和其他文档等文本数据中提取相关信息。或许更重要的是,随着这项技术的成熟,招募、培训和留住资深的语言专家的需求会逐步减少。

一切都与数据有关

数据分析和自然语言处理只是生成式人工智能在情报行动中应用的一个例子。事实上,人工智能的潜力可以在情报分析领域产生多方面的益处,而不仅仅是这两个功能。然而,人工智能并非没有问题。必须强调的是,生成式人工智能的核心功能源自用于训练模型的数据。如果数据集包含偏见,模型将继续传播,甚至放大这些偏见。因此,回到了一个长期存在的问题,即消极的思维模式会影响分析,从而可能为生成式人工智能系统提供潜在的支持。利用已有的智能数据集的主要后果是,最终的分析产品中包含的偏见可能带来未知的影响。注入此类数据集可能会继续扩散偏差分析,从而形成一个循环过程,以指数方式增加不精确且可疑的情报产品的数量。
生成式人工智能系统可能会提供由不完整或不准确的数据形成的误导性输出或幻觉,这是一个常见问题,也是当今人工智能技术的固有局限性。在该技术成熟之前,人类的知识、经验、专业知识和直觉将继续是情报技术的重要组成部分。

图片

美军第341军事情报营参加2023年“英勇语言”对抗赛,挑战内容包括战术质询、语音分析和撰写情报简报

高质量数据对于将生成式人工智能用于情报分析至关重要。获取数据或许同样重要。数据无疑是一种商品:一种可以购买、销售或收集的有利可图的产品。尽管情报组织在复杂的情报收集能力上花费的资金可能过多,从而获取高度机密的材料,但随着公开或开源信息的激增,政府不再垄断数据。私营部门的数据与通过高科技手段收集的数据一样有价值,甚至更有价值。情报组织应该努力获取此类数据。然而,当政府试图从私营部门获取数据时,会出现一些挑战,包括信任问题、专有权问题和兼容性问题。
一般来说,私营部门收集个人数据是为了通过为客户提供个性化产品和服务来改善公司的产品和服务,了解消费者行为并提高客户保留率。我们都可能经历过基于浏览历史、过去购买记录和人口统计数据的定向营销活动。此外,流媒体公司通常通过播放列表或推荐接下来要听或看的内容来提供定制体验。最终,以消费者为基础的公司会分析数据,通过满足客户的需求来发展和维持客户关系。虽然这些数据中的大部分看起来微不足道,但如果公司自由地与政府共享数据,可能会损害消费者的信任并产生公众对公司的负面看法。此外,共享个人数据存在道德问题,特别是个人是否同意与政府实体共享数据。
除了面向消费者的公司之外,还有一个庞大的行业收集并出售个人和企业数据。数据代理从各种公共和私人来源收集数据,然后将其出售用于营销、风险分析和商业智能等目的。此外,智库、非政府组织、教育机构和其他开展数据收集和分析活动的组织也产生了大量公开可用的数据。但与政府实体共享这些数据可能会带来问题。私营组织可能认为他们的数据是专有的,因为这提供了竞争性的市场优势,因此共享数据可能会影响他们的市场地位。此外,私营实体根据其用途构建数据,因此数据模式变化、数据完整性和数据安全性等兼容性问题可能需要昂贵的集成解决方案。
综合来看,这些数据的汇编有可能丰富情报数据,并为解决复杂的情报问题提供丰富的见解。但情报机构如何获取和利用这些信息的问题仍然存在。信任、专有数据和兼容性问题无疑会加剧此类信息的获取。不过,这仍然是值得的,因为将更多数据集(尤其是由生成式人工智能支持的数据集)输入情报数据库将增强分析过程。在此过程中,情报组织应该谨慎行事,避免“继承”原始数据中的偏见。

结论

情报问题通常不是信息收集不足的结果,而是分析不足的结果。面对情报失败,部署新的、高度复杂的收集能力不一定是最好的解决方案。快速识别大型数据集中关系的能力肯定会提高情报分析的效率,并带来更精准的评估。生成式人工智能也可以帮助,但不能完全解决与认知偏见和心理模型相关的问题。因此这要求情报组织必须筛选用于训练模型的数据,以确保它代表了经过深思熟虑和验证的分析方法,力求避免偏见。此外,由于数据是任何人工智能系统不可或缺的组成部分,情报组织应寻求合法的方法来获取私营部门的数据,同时认识到与这些数据相关的兼容性、结构和信任的固有问题。这是一项具有挑战性的任务,因为私营部门肯定会表现出不愿向政府实体提供数据,特别是他们担心会影响经济或消费者信任。解决这种情况需要政府强有力的参与和策略,以确保数据获取,同时平衡私营组织的担忧。
为解决大模型“幻觉”问题,更高质量的训练数据加上检索增强生成(一种对来源进行事实核查的功能)等工具可以有所帮助。在短期内,生成式人工智能在情报中的应用仍将需要分析师耗费时间验证和复查人工智能的贡献,这使人们对该技术的实用性产生了质疑。然而,随着情报组织测试和试验各种模型,现在投入的时间肯定会在未来长期产生回报,从而促进生成式人工智能更多地融入情报技术。
生成式人工智能成功进入情报领域最重要的因素或许是情报界的接受度。人工智能技术并不寻求替代人类,相反,它们仍需要人类“参与”其中,使系统能够运行并改进其功能。情报行动需要应对模糊性和复杂性,以快速识别环境中的变化,并相应地将这些信息提供给有权制定和执行决策的人。自动化和速度并不能免除情报分析员的主要职责,即在正确的时间提出和考虑正确的问题,以便提供及时和准确的情报。情报专业人员也不应将人工智能视为灵丹妙药或危险,而应将其视为一种会随着时间推移而改进的工具。


来源 | 军事科学文摘总第30期

图片 | 互联网

作者 | 聂永喜 

注:原文来源网络,文中观点不代表本公众号立场,相关建议仅供参考。