近日,汇丰银行发布了一份题为《AI能追踪美联储吗?》的报告,深入探讨生成式人工智能在分析美联储官员讲话及预测货币政策方向中的潜力与局限。
汇丰开发了一款基于GPT-4的AI工具,专门用来自动评估美联储讲话的相关性、内容摘要、政策倾向(鹰派/鸽派/中性)及其背后理由。
通过分析54篇美联储讲话,汇丰发现,对于分析与货币政策高度相关的讲话,AI工具的表现接近于一位“努力工作的初级分析师”,并且与人类专家的结论在大多数情况下接近。
然而,在处理与货币政策无关或相关性较低的讲话时,AI可能会生成不准确甚至虚构的内容,降低了用户的信任度。
因此,汇丰的结论是,AI工具虽有潜力提高生产力,但目前尚不足以完全取代人类分析师,尤其是在高精度要求的任务中。
AI分析美联储讲话
汇丰开发的AI工具通过“逐句筛选+整体分析”的方法,对美联储官员的讲话进行四个方面的分析:相关性筛选、内容摘要、政策倾向判断(鹰派、鸽派或中性)以及决策依据说明。
研究团队希望通过这一工具回答一个核心问题:AI是否能够可靠、准确地分析美联储的政策信号,从而为投资者提供实用的参考。
报告指出,AI工具在分析高度相关的讲话时表现令人印象深刻,其产出质量与一位“努力工作的初级分析师”相当。尤其在判断政策倾向时,AI的结果与人类专家大致一致。
例如,在研究的54篇讲话中,AI在判断其为“中性”时与人类专家完全一致,而在评估“鹰派”或“鸽派”时也较少出现重大偏差。
“我们可以看到,现在对鸽派或中立的演讲没有任何分歧。对于模型视为鹰派的10次演讲,我们的人类专家同意这一观点的演讲有8次,其他专家认为,只有2次演讲是中立的。”
AI的不足:随机性与“创造性”挑战
尽管AI工具展现了一定的能力,但报告也指出了多项AI的短板。
首先,生成式AI的“创造性”有时会导致问题,尤其在处理与货币政策无关的讲话时,AI可能会虚构信息以“满足”用户需求。这种现象被称为“幻觉”(Hallucination),可能会严重损害用户对工具的信任。
“人工智能模型已经被训练得表现出强烈的帮助愿望,它会倾向于编造信息来给你答复,而不是提醒你,你的问题令人困惑或无法回答。”
此外,AI工具在重复任务中的不一致性也是一个关键挑战。报告发现,即使在相同条件下,AI对同一讲话的分析结果可能会有所不同。
汇丰的研究团队强调,虽然人类分析师在一定程度上也存在主观性,但单一分析师在不同时间对同一内容的解读通常具有一致性,而AI却无法保证这一点。
AI能取代分析师吗?
汇丰的研究表明,尽管AI工具在分析任务中有一定表现,但其目前仍无法完全取代人类分析师的作用。
报告指出,AI在一些较为基础和重复性的任务中,如筛选相关信息和生成摘要,表现出色。然而,在涉及复杂推理和深度解读的工作中,AI与人类的差距仍然明显。
汇丰表示,AI工具的表现类似于初级分析师的水平,但它无法像人类一样通过经验和反馈不断改进。这一点对企业来说尤为重要,因为培养人类分析师不仅是为了当前的产出,也是为了未来的发展潜力。
报告还强调,AI的“随机性”和“创造性”特质虽然为技术带来了灵活性,但也成为广泛应用的障碍。在金融市场等高精度需求领域,用户对结果的稳定性和可信度要求极高。如果AI工具的产出需要人类专家反复核查,其所谓的效率提升将大打折扣。
“但当你向⼈⼯智能⼯具询问它的意见时,它的意见会时时刻刻发生变化。除非人性发生根本性变化,否则人工智能⼯具很可能无法充当值得信赖的顾问。这在短期内似乎不太可能发生。”
本文来自华尔街见闻,欢迎下载APP查看更多