Cloudera前瞻:数据与AI的碰撞,将如何驱动企业变革与增长

作者:王聪彬
针对未来一年生成式AI和AI Agent等创新技术的发展趋势,Cloudera发布了2025年五大科技趋势预测,为企业提供数据治理的战略指导,帮助其充分释放AI的潜力。
生成式AI、出海是近两年被最多提起的两个词。
生成AI不用过多赘述,国际有OpenAI、Google、Anthropic等,国内有百度、阿里、腾讯、火山引擎等不断在大模型进行投入。出海则是通过拓展国际市场,寻求在全球范围内的业务增长与技术布局。
两者的共同在于,都不可避免地带来了数据管理和处理的巨大挑战。
Cloudera大中华区技术总监刘隶放表示,生成式AI的应用在企业中并非一蹴而就,数据的准备和支持是一个至关重要的因素。他提到,生成式AI则依赖于更加丰富的数据类型,如文本、图像、声音等多元数据。
图片
Cloudera大中华区技术总监刘隶放
在一些成熟的行业如金融,银行业积累了大量的文本、声音和图像数据,这些数据经过整理后,能够直接支持生成式AI的训练,进而提升智能客服和金融服务的质量。
企业必须要建立数据文化,制造行业原来更多是积累生产数据,随着智能化的发展,企业需要采集更多维度的数据,例如消费者行为、实时反馈等,更好地支持生成式AI的应用,为产品优化和市场决策提供支持。
何时开启生成式AI的应用,在刘隶放看来,企业应根据自身数据积累情况进行推进。对于那些数据积累较为充分、能够支持生成式AI训练的企业,生成式AI无疑将提供强大的创新推动力。而对于那些数据储备较少的企业,传统的机器学习方法依然是更加实际的选择,尤其是在过渡阶段。
Cloudera针对企业数据和分析也总结了三大洞察,包括数据湖仓一体架构(Data Lakehouse)正成为重心;了解数据资产需要数据网格(Data Mesh)或数据编织(Data Fabric);人工智能应用生命周期需要可信数据。
加速企业AI、实现真正的混合、实现现代数据架构三大产品支柱顺应现代数据架构,紧随市场趋势。
最近12月12日,Cloudera发布7.3.1,进一步支持ARM芯片、Hive与Iceberg集成、Ozone与HBase集成、提升安全性,修复了超过225个通用漏洞和暴露(CVEs)。
“ARM芯片不仅具有更低的功耗,还能有效减少能源消耗,这对企业和环境都具有重要意义。”刘隶放说,在大型计算平台中,电力成本通常是运营的主要开支,降低功耗不仅能为企业节省成本,还为绿色环保做出贡献,同时Cloudera也将在未来与国产硬件做更多的适配工作。
未来随着智能化转型和数据文化的逐步建立,企业释放AI潜力的时刻将不再遥远。因为数据与AI的深度融合,必将创造出全新的发展机遇。
附2025年科技趋势预测
预测一:生成式AI热度减退,企业将采取更务实的AI策略
预计到2025年,企业将在生成式AI应用上分化为两大阵营。一类是已成功应用生成式AI的企业,通过成熟应用实现了显著成效。麦肯锡的数据显示,65%的企业已通过生成式AI实现了人力资源成本的有效控制,并在供应链管理中提升了收入。例如,金融服务机构作为生成式AI的早期用户,正逐步从基于规则的欺诈检测系统向基于模型的系统转型,推动行业迈向新的发展阶段。生成式AI的核心价值在于规模化的知识获取和洞察生成,数据质量是确保AI模型成功运行的关键。因此,拥有庞大、可信数据的企业将在这一趋势中更具竞争优势发,可以利用这些数据获得可操作的洞察。
而另一类企业由于缺乏足够的数据储备,难以从生成式AI中获得相同效益。因此他们将更倾向于采用传统AI或确定性机器学习模型,以提升效率和生产力。Cloudera预测,企业将不再相信生成式AI的大肆炒作,而是专注于制定与企业整体目标一致的技术投资计划。
预测二:AI智能体(AI Agent)将重塑商业决策
目前,AI仍无法复制人类做出的所有决策,但明年Agentic AI将改变这一现状。生成式AI智能体是中国企业持续探索创新行业应用场景并实现投资变现的一种方式。Agentic AI将推动创新浪潮,改变实时问题解决和决策过程。AI智能体高效优化任务,迅速应对挑战,并实时灵活调整。这将促使企业构建事件驱动型架构,支持AI能够及时响应现实事件,从而彻底改变电信和物流等行业。
Agentic AI运行复杂模拟的能力,将帮助企业更快地规划、测试和优化,提供实时且可实践的深刻洞察。例如,我们将见证电信网络变得更加智能,AI能够预测风暴等影响服务的情况,从而主动采取措施,将潜在的服务中断降至最低,同时以意想不到的方式全面提升客户体验。
预测三:“全天候”AI为数据管理带来新挑战
展望2025年,AI将如同空气无处不在,渗透至个人生活的方方面面。智能手机将成为私人助力,不仅能自动分析电子邮件,还可以根据个人日常习惯和偏好,智能规划后续行动步骤或确认任务的优先级,而且上述处理都将在本地模型中完成,严格保障隐私安全。同时,汽车也会变得更加智能,根据实时交通信息和天气预测,为个人出行预测最佳路线。
随着AI全面普及,其生成的数据量将呈现爆炸式增长。随着中国企业对计算能力需求的提高,这一趋势也会为数据管理带来巨大挑战。IDC预测,到2026年50%的中国企业将与云服务商形成生成式AI平台、开发者工具、基础设施的战略合作,这给企业数据和成本的管控治理提出了新的要求。
面对数量庞大且种类繁多的AI生成数据,企业如何从中挖掘出有价值的信息,成为亟待解决的问题。企业努力从不断增长且种类繁多的AI生成数据中获取洞察力,糟糕的数据管理可能会导致企业被信息流淹没,难以有效地利用这些数据资源。
随着AI成为日常运营的标配,新挑战也随之而来。如何确保AI提供的洞察信息既相关、又具可操作性,同时满足最基本的安全性和弹性要求,避免其成为无意义的噪音,成为企业亟需攻克的难题。为了充分释放 AI 潜力,企业需要强大的数据管理和多云策略来访问、存储和分析数据,无论数据是在本地、云中还是在边缘,都能提炼获取数据的最大价值。
预测四:单纯的混合云架构已无法满足企业需求
如果说2024年是生成式AI的试点年,那么在2025年企业将致力于推动生成式AI的全面生产和规模化部署。这一转变表明,单纯的混合云架构已无法满足企业需求,用于数据和分析的多云及混合能力将成为关键。随着混合环境的逐步扩展,企业的数据分布于本地、大型机、公有云和边缘等多种平台,生成式AI模型需要灵活部署到数据所在之处,确保数据和工作负载在业务内的无缝迁移,以产生高效洞察并满足企业需求。
随着大量数据输入至AI模型服务中,安全和治理问题也日益凸显。德勤的研究指出,企业采用生成式AI的最大障碍是合规风险和治理问题。随着企业开始在本地或公有云中运行私有AI模型和应用,混合数据管理平台的需求日益增长。这类平台集成了本地与云数据源,因此具备更高的灵活性且支持更广泛的数据访问,在保障模型端点安全和治理的同时,赋予企业更强的控制力。
预测五:私有大语言模型(LLM)将逐渐取代公有大语言模型,成为企业优选
随着企业AI创新将在未来一年成为新的焦点,企业将逐步摒弃公有LLM,转而选择企业级或私有LLM,以提供更加符合企业背景的精准洞察。麦肯锡研究显示,目前仅有不到一半(47%)的企业在积极定制和开发其专属模型。预计到2025年,企业将加快定制AI解决方案的步伐,包括AI聊天机器人、虚拟助手和专属代理应用等,以满足特定行业或业务的需求。
越来越多企业将采用企业级LLM,这将对GPU的高性能支持提出更高要求,以比传统CPU更快的速度运行,同时确保数据管理系统具有更高的安全性和隐私保护。此外,企业还将增加对检索增强生成(RAG)技术的应用,将通用LLM转化为行业或组织专属的数据仓库,从而为现场支持、人力资源和供应链等领域的终端用户提供更加精准、可靠的数据支持。