2025 年人工智能值得关注的 7 个趋势

转自 | 科技世代千高原


图片


2024 年可以说是我们花费时间最热切期待新 AI 发布和公告的一年。


尽管一路上有一些失望和惊喜,但很明显,人工智能的发展总体上给我们留下了积极的印象。我之所以这么说,是因为我们中的许多人越来越多地将各种模型融入到我们的日常生活中。


话虽如此,我们总是想要更多,这是事实——这只是人性。考虑到这一点,让我们来探讨一些挑战和趋势,我相信大型科技公司已经在着手解决这些问题。


让我澄清一下:我并不是想预测未来——这根本不是我的目标。相反,我想强调您可能已经注意到的领域,就像我一样,人工智能仍有发展空间。


1)一切都与人工智能代理有关


近几个月来,人们对更好地了解这项技术的兴趣日益浓厚。但在深入研究之前,让我们先解决一个简单的问题:什么是人工智能代理?


这些是能够推理、规划和采取行动的智能系统。本质上,AI 代理可以分解复杂问题、制定多步骤计划并与工具和数据库交互以实现特定目标。因此,大多数人都认同性能良好的 AI 代理的价值。


然而,挑战在于,当前的模型往往难以进行逻辑和一致的推理。它们通常擅长执行简单的计划,但当涉及到处理具有多个变量的复杂场景时,它们往往会失去焦点并做出并不总是合理的决策。


人工智能代理有望根据我们提供的上下文或输入提供更具体、更个性化的响应。最大的障碍之一是在这些代理的自主性与它们产生的响应质量之间找到适当的平衡。

为了弥补这一差距,我们在 2025 年需要更先进的模型。


2)重新思考人机交互人工智能系统


您可能听说过一项研究,其中聊天机器人在临床推理方面的表现优于医生。在这项研究中,50 名医生被要求根据病例报告诊断病情。同样的信息被提供给聊天机器人,最终聊天机器人的得分高于医生。


更令人着迷的是,在研究期间,一些医生被随机分配使用聊天机器人作为助手。令人惊讶的是,这组医生(与聊天机器人一起工作的医生)的得分低于单独工作的聊天机器人。这表明人工智能系统和人类增强过程都出现了故障。理想情况下,专家与有效的人工智能系统相结合的表现应该比单独使用任何一种系统都要好。


部署 LLM 驱动的聊天机器人并非易事。它需要设计正确的提示,这意味着你需要以正确的方式提出要求。为了解决这个问题,我们需要更好的系统,使专业人士能够将 AI 工具无缝地整合到他们的工作流程中——而无需自己成为 AI 专家。


3)超大型人工智能模型的兴起


大型语言模型由大量参数构建而成,这些参数在训练过程中经过微调。我们在 2024 年看到的模型通常包含 1 到 2 万亿个参数。展望未来,下一代模型预计将更大,可能超过 50 万亿个参数。


随着 2024 年接近尾声,我们看到 ChatGPT 推出了 Gemini 2.0 和 o3 等产品,这表明了这些发展的方向。毫无疑问,这些更先进的模型也为随之而来的全新商业机会铺平了道路。


4)紧凑型人工智能模型的潜力


虽然我们谈到了大型模型的兴起,但小型模型也拥有越来越多的机会。这些模型只有几十亿个参数(听起来可能还是很多),不需要装载大量 GPU 的大型数据中心来运行。相反,它们可以在笔记本电脑甚至智能手机上运行。


以IBM的Granite 3模型为例,它只有20亿个参数,可以在笔记本电脑上运行,且不需要强大的计算能力。


展望未来,我们可能会看到更多这种规模的模型,它们专为特定任务而设计,无需耗费大量资源就能提供高效的解决方案。


5)人工智能中接近无限记忆的路径


我还记得第一次使用生成式人工智能帮我写电子邮件的情景。当时,法学硕士的上下文窗口只有 2,000 个标记。如今的模型可以处理数十万甚至数百万个标记的上下文,目标是达到近乎无限的内存——机器人可以随时保留他们所知道的关于我们的一切。


我们即将迎来一个客户服务聊天机器人将记住与我们进行的每一次对话的时代。乍一看,这似乎是一个积极的发展——但事实真是如此吗?


6)不断发展的人工智能应用


您知道 2024 年 AI 最常见的商业用例是什么吗?


根据哈里斯的一项调查,人工智能主要用于增强客户体验、改善 IT 运营和自动化、增强虚拟助手以及加强网络安全。


随着我们进入 2025 年,我们可以期待看到更多高级用例。随着多模式功能日益复杂,客户服务机器人可能会处理更复杂的问题,而不仅仅是生成支持单。我们还可能看到主动优化整个 IT 网络的 AI 系统或实时适应不断变化的威胁的安全工具。


7)推理时间的作用


在推理过程中,模型会处理实时数据,将用户的查询与训练期间学到的信息进行比较。在此过程中,新的 AI 模型正在扩展其推理能力,本质上需要一些时间进行“思考”才能生成响应。这需要多长时间取决于所需推理的复杂性。一个简单的查询可能只需要一两秒钟,但更复杂或更大规模的请求可能需要几分钟。


推理时间计算如此引人注目的原因在于,推理可以进行微调和改进,而无需重新训练或修改底层模型。这为 LLM 中的推理提供了两个关键机会:在训练期间(通过使用更高质量的数据)以及在推理期间(通过改进思路链过程)。


这种双重方法最终可能会让人工智能代理感觉“更聪明”。


——END——

苇草智酷简介——


苇草智酷(全称:北京苇草智酷科技文化有限公司)是一家思想者社群组织。通过各种形式的沙龙、对话、培训、丛书编撰、论坛合作、专题咨询、音视频内容生产、国内外学术交流活动,以及每年一度的互联网思想者大会,苇草智酷致力于广泛联系和连接科技前沿、应用实践、艺术人文等领域的学术团体和个人,促成更多有意愿、有能力、有造诣的同道成为智酷社区的成员,共同交流思想,启迪智慧,重塑认知。