客户端
游戏
无障碍

0

评论

1

分享

手机看

微信扫一扫,随时随地看

从模型平权到“知本”复利,NoETL 打造 AI 时代的数据底座

作者 | 周卫林,Aloudata 大应科技创始人 & CEO

过去的三年,对我们科技创业者来说,每逢春节,必不安宁。2023 年 ChatGPT 炸场,2024 年 Sora 颠覆视频创作,今年春节 DeepSeek 又掀起新的风暴。所以今天我会结合大家关心的话题,分享我对大模型与数据结合的一些理解,包括“1 个问题、2 个判断和 3 个建议”。

1 个问题:在 AI 时代,企业的核心竞争力来自哪里?

过去我们通常认为企业的核心竞争力包含人才壁垒、技术壁垒以及资本壁垒

先看人才壁垒。当每家企业都能以 5 万元雇佣具备清北毕业生知识结构的数字化员工时,“人才壁垒”已被 AI 拉平。程序员用 Cursor 写代码,律师用 AI 写法律文书,专业技能门槛正在被快速拉平。AI 时代,企业需要重新定义自己的人才和人才优势。能否跟 AI 共生共创是未来企业员工的标准技能,就像信息化时代,员工需要会用电脑会用 Office 一样。

再看技术壁垒。AI 时代,技术壁垒包含算力、算法 / 模型和私域数据三大因素。回顾过去 15 年,从大数据普及到 AI 普惠,技术平权的周期从十年缩短到三年。现在中小企业也可以以极低的算力成本使用 DeepSeek 开源模型或 API 服务。当 GPU 和算法都变成基础设施,企业与企业之间技术护城河还剩下什么?唯一没被抹平的差异化要素,就是企业的私域数据。用大白话说就是:你有多少高质量数据,就能拥有多强的智能

最后看资本神话的破灭。移动互联网时代大家比拼“融资”和"烧钱”的速度,从“百团大战”延袭到“百模”大战,直到遭遇了 DeepSeek 的降维打击——DeepSeek 7 天用户破亿,根本不给资本筑墙的时间。我认为有一个概念发生了变化,就是“知本”这两个字,知识的知。知识的流动速度要比资本快十倍百倍,“知本”的杠杆效率也比资本要大十倍百倍,企业真正的壁垒不再是资本壁垒,而是你独有的认知体系和独有的知识库。知本一旦形成竞争优势,往往不可逆,因为同行来不及反应,战斗就已经结束了。因此,DeepSeek 没有开源他们的训练数据集,但开源了模型和核心代码,因为他们知道,当自己拥有“知本”优势的时候,自己的下一代模型依然会领先同行,竞争优势并没有丢失。

图片

基于以上分析,企业核心竞争力的落脚点究竟在哪里?我们认为,无论是零售品牌、先进制造还是金融机构,各行各业的核心竞争力都将建立在"知本"之上,具体表现为企业的私有知识库体系。人才、技术、资本等传统壁垒正在快速消融,唯有知识资产难以被复制和超越

未来的企业将构建多维知识库矩阵,通过多智能体(Agents)的协同与交互,形成动态进化的知识、决策与行动网络。在这一体系中,经营决策场景因其知识密度和价值密度最高,自然成为核心战场。企业的每一次决策,都是对市场认知、客户洞察、产品理解和技术评估的综合体现,这一过程本质上就是知识的萃取与应用。

图片

这也解释了为什么 DeepSeek 崛起后,市场对 Chat BI 表现出如此强烈的关注,因为它精准切入企业经营决策这一核心场景。经营决策场景下企业知识语义表达的载体就是“指标”,其管理平台就是“指标平台”。也因此,指标平台是企业最为确定性的私域知识库,Chat BI 是当前最为确定性的 AI 垂直应用之一。

2 个判断:Chat BI ,Chat 的不是 BI ,而是 Data;Chat BI ,关键不在 GPU,而在 CPU

BI 作为企业数字化进程中最为基础和普遍的应用场景,其与 AI 的结合是必然趋势。今天,我要提出两个关键判断:

第一,Chat BI,其关键不在 BI,而在数据。

图片

Chat BI 带来交互层体验变革,让“人人都是数据分析师”这一口号成为可能。但是,人类分析师遇到过的问题,Chat BI 也一样会遇到,一样存在“数据不好找、不敢用、用不对、取不出”的问题。

如果不解决数据供给侧的问题,数据消费侧的创新一样无法实现分析体验的革命。这里最主要的问题有:指标随业务发展而动态变化,怎么让业务日常沟通的指标口径跟 AI 获取到的指标语义保持一致,怎么让指标口径跟数据库里的数据保持一致,如何保证 Chat BI 在获取数据时的响应速度?

以上问题决定了 Chat BI 与数据仓库之间必然依赖指标平台实现语义层中介,实现数据的 AI-Ready

正如自动驾驶必须依托电动车而非燃油车才能实现,Chat BI 要实现真正的数据对话,必须建立在指标平台的语义化和虚拟化基础之上。这个指标中间层的引入,不仅要解决数据供给问题,更要实现数据的智能化治理和价值转化。

因此,Chat BI 的真正挑战不在于提升分析效率,而在于重构数据供应链。只有当数据能够被高效获取、准确理解和安全使用时,AI 的分析能力才能得到充分发挥。

第二,Chat BI 的核心不在 GPU,而在 CPU。

图片

要理解这一点,我们需要剖析 BI 活动的本质——它是一个既消耗脑力又消耗体力的复杂过程。

脑力层面,数据分析依赖数据分析师的脑力智能,受限于个人处理能力;体力层面,需要大量的计算、存储和数据处理资源。

首先,基于人工的数据分析是低频的,一个人一天只能够处理几件事;同时,人是可以容错的,人有主观能动性。面向人工的数据分析场景,工程领域诞生了 ETL 和传统数据仓库架构。

但 AI 不是这样的。一方面 AI 会释放十倍百倍的分析需求,灵活性要求也极高;另一方面 AI 是低度容错的。那传统 ETL 工程体系和工程师体系是否能够支撑 AI 时代海量、灵活的分析需求呢?

这正是我们三年前就提出 NoETL 理念的根本原因。NoETL 就是通过将 ETL Engineers 驱动的数据工程转变为 ETL Agents 驱动的数据工程,实现数据处理流程的自动化重构。只有完成这种生产力变革,才能真正满足 AI 时代的数据分析需求。

这种转变不仅仅是技术升级,更是整个数据处理范式的革命。它解决了传统 BI 体系中最根本的供需矛盾,为 Chat BI 的真正落地扫清了障碍。

3 个建议:好数据,强智能、可溯源,可审计、全开放,大生态

基于以上分析,我提出企业 Chat BI 落地的三个建议。

第一,好数据,强智能。企业拥有多少好数据,就能拥有多强大的智能。什么是“好数据”?好的数据应该是“好找的、敢用的、没有歧义的、AI-Ready 的”。反映在指标平台上,要产出好数据需要指标平台具备强大的指标定义能力,要实现  100% 的指标可以语义化定义,同时需要有强大的数据智能加速能力,实现至少 95% 的查询可以秒级返回。因此,我们认为,一个好的指标引擎必须实现真正的“管研用一体化”,才能解决 ChatBI 真正用起来的问题。

第二,可溯源,可审计。在数据分析领域,数据准确是一切使用的前提。如何解决大模型的幻觉问题需要系统性的思考和设计,需要实现思维链与数据链的双重展开,白盒化地呈现 Chat BI 从意图识别、语义理解,到查询 SQL 等每一个环节的生成结果,做到端到端可溯源、可审计

第三,全开放,大生态。指标平台是企业在 AI 时代的数字基建。指标平台的定位是企业内经管决策领域的知识库,独立于各类敏捷 BI、Chat BI、Agents 之外,为它们提供统一的数据语义层。正因其基建的定位,指标平台必须具备下层兼容性和上层开放性。对下,它不应绑定特定的计算引擎和数据仓库,能够支持动态连接不同的数据源;对上要跟各类工具、应用场景形成生态合作,比如 Quick BI、WPS,各类 Chat BI 产品,还包括各类业务解决方案的厂商,比如医疗、财税等。

我们坚信,NoETL 指标平台作为一个新兴的品类,一种基础设施,需要保持足够的独立性和开放性,不被特定的技术供应商绑定,才能保持可迭代性。

我们公司名称“Aloudata”,其实源于“AI on data”的理念。我们坚信,AI 时代的关键是 Data,是知识库,是数据语义层,是数据虚拟化,这是我们的判断,也是我们创立这家公司的初心。而我们所提出的 NoETL 的全新数据工程体系也以 AI-Ready 为核心使命。懂 BI、会洞察,为企业构建 AGI 时代的数智基建,相信我们是专业的。

免责声明:本内容来自腾讯平台创作者,不代表腾讯新闻或腾讯网的观点和立场。
举报
评论 0文明上网理性发言,请遵守《新闻评论服务协议》
请先登录后发表评论~
查看全部0条评论
首页
刷新
反馈
顶部