在这场原点Talk对话,他们给出了中国AI创业的很多真实逻辑

作者| 原点Talk

编辑| 周周

来源| 科技行者

不久前,PEC 2025 AI创新者大会暨第二届提示工程峰会的契机,一场关于AI创业现实的《原点Talk》对话在此展开。

主持人至顶科技CEO兼总编辑、PEC联合发起人高飞与六位身处产业一线的嘉宾——PingCAP副总裁刘松、云蝠智能创始人魏佳星、星汉未来创始人刘道儒、小水智能CEO孙雪峰、AI四合院联合创始人冯昊,以及水木清华校友种子基金管理合伙人王学辉,进行了约1小时的深入交流。

纵览全场,信息差反复出现,但这种差异并非互联网早期那种简单的信息不对称,说它一种结构性的认知断层,会更合适一些。

当一些创业者已经在探讨世界模型的实现路径时,在其他地区,200多名学生中可能仅有一人接触过豆包,一些硬件厂商对AI的理解或许还停留在给摄像头贴上“AI”标签的营销层面。

所以,技术浪潮的推进从来不是均速的。在新的技术范式下,优势或许属于那些最先洞察技术将成为基础设施、并据此重构商业模式的人。

这场对话的嘉宾都是来自AI一线的实践者,所以,这场讨论没有试图定义AGI(通用人工智能)的未来,也没有人预测下技术奇点。大家关注的是极其具体的现实问题:数字人的定制成本如何实现百倍骤降?儿童智能手表如何抓住用户心智?智能客服如何按照业务结果收费?

这些微观的商业实践,或许更能揭示这场变革的真实走向。

图片
图从左至右:AI四合院联合创始人冯昊、小水智能CEO孙雪峰、云蝠智能创始人魏佳星、水木清华校友种子基金管理合伙人王学辉、星汉未来创始人刘道儒、PingCAP副总裁刘松、至顶科技CEO兼总编辑 & PEC联合发起人高飞
图片

从“及格线”到“精细化”的较量

关于大模型的进化速度,业界的判断开始出现分化。

刘松提供了一个来自资本市场的观察信号。他提到,近期甲骨文和阿里云的良好表现,背后反映了,AI的繁荣正在转化为对底层基础设施的强劲需求。这表明,无论应用层如何波动,基础设施层正在稳固地收获第一波红利。

刘松认为,模型的迭代速度依然很快,尤其在图片和视频生成等多模态领域,近期的进展非常显著。虽然成本仍是挑战,但技术演进并未停滞。

王学辉则用了一个更结构化的比喻来描述当前的AI发展阶段。他认为,“ChatGPT时刻代表了模型能力从30分跨越到60分及格线的过程,是从0到1的突破。但现在行业面临的是从80分到90分,甚至95分的提升。这是一个精细化竞争的阶段,边际效应递减,市场对此可能会感到焦虑。

然而,从具体的应用领域来看,感知的速度并不一致。

魏佳星从语音交互这一垂直领域观察到了积极信号。他认为,虽然文本大模型的发展似乎遇到了一些瓶颈,但Agent已经展现出解决实际需求的能力。他特别强调,在过去半年里,语音技术在延迟、拟人化以及可控性上的迭代速度非常快,几乎是以“月”为单位在更新。

在应用前沿,孙雪峰的团队已经开始探索世界模型的应用。他们尝试在儿童腕表这一算力受限的设备上,通过Agent调用世界模型,模拟出一个可交互的虚拟环境。他认为,技术应用的速度之快超出了他自身的预期。

冯昊也认为模型能力已经超越了他的期待,当前的核心矛盾是技术与落地之间的脱节。他判断,至少在教育行业,AI的能力已经足够满足需求,接下来的关键在于普及。

图片

语音交互的“六重奏”:应用层的组合壁垒

一个长期困扰应用开发者的疑问是:基础大模型会不会最终碾压应用层?

魏佳星的回答很干脆:不会。因为一个完美的产品,可能需要完全来自不同平台的不同模型。在他们的系统中,完成一次人与AI的语音交互,背后需要同时调用六个不同的模型,目的是为了追求极致的用户体验。

他解释说,文本模型只能生成对话内容,但真实的交流远比文本复杂。要让AI的互动像真人一样自然,就必须关注到许多细节:例如在对话开始前的语气词,在对方说话时恰到好处的一声回应(在语言学中称为“Backchanneling”,是维持对话流畅的关键),甚至是模拟敲击键盘的背景音。

这些在真实沟通场景中至关重要的细节,单一的通用大模型无法全部覆盖。

魏佳星解释了这种现象:擅长文本生成的公司,其语音合成技术(TTS)不一定最强;而专业的语音技术厂商,其训练语料可能更偏向有声书风格,并不适合客服场景。他表示,目前市场上还没有任何一家公司能在所有细分能力上做到最好。

因此,他们的策略是选择当前物理世界中最强的技术组合,以达到最接近真人的交互水平。这个逻辑背后,是对模型与应用关系的清晰判断:模型是基础设施,应用层的价值在于对这些基础设施的精细化编排和场景化落地,因此不会被单一模型颠覆。

图片

企业AI的真相:先还“数字化旧债”

在探讨企业级AI落地时,刘松则指出了一个许多人忽视的现实:中国企业在推进AI项目的过程中,很大一部分精力是在为过去的数字化欠账还债

他接触了大量客户,最常听到的是企业高层的质疑:为什么像DeepSeek这样的通用模型效果惊艳,但在企业内部却难以复现?

刘松认为,这是目前最大的业务幻觉。企业高层往往将在C端场景下进行几次非严肃的提问,与在保险、银行、医疗等对容错率要求极高的B端场景中解决实际问题,错误地等同起来。后者所涉及的复杂性和挑战,远超短期内可以解决的范畴。

他提出了一个五层楼的比喻来解释企业AI落地的结构:构建一个成功的企业智能体,前四层楼是基础准备工作——包括数字化基础、数据治理、流程梳理、以及组织文化和人才建设。只有在这些基础稳固之后,第五层楼——即如何应用大模型——才能顺利搭建。

刘松断言,如果前四层楼没有问题,第五层楼的建设通常三个月内就可以完成。现实中AI项目之所以拖延,核心原因在于底层的数据没有准备好,业务流程没有理顺。一个为期三个月的项目,可能有两个月都在补课

面对承认基础薄弱等于自我否定的管理困境,刘松建议了一种更务实的策略:避开全局性的、横向的数据治理难题,优先选择一个垂直场景快速落地。例如智能招投标、员工助手或智能客服。

他强调,应该逆向利用AI的热潮。通过AI落地带来的业务价值形成共识,来倒逼企业补齐在数据治理和流程方面的不足。用智能化的新动力,推动数字化的实质性进展。

图片

从5万到500:AI原生带来的成本革命

刘道儒的公司专注于数字人领域。他明确表示,他们的业务逻辑与几年前元宇宙热潮下的数字人公司截然不同,核心区别在于“AI原生

他用当年QQ和微信的关系来类比。微信是为移动互联网时代原生的产品,因此能够享受到移动时代的所有红利。同样,AI原生的数字人,也能够充分享受大模型技术带来的效率提升和成本下降。

最直接的体现就是成本。刘道儒透露,过去行业内制作一个3D数字人的报价通常在45万元,而他们现在可以将成本控制在几百元人民币。

这种近乎降维打击的成本优势,并非来自降低质量,而是源于技术路线的彻底改变。传统的数字人制作依赖于昂贵的人工建模和渲染。而AI原生的方式,从背景图、人物形象到内容生成,全部由AI完成。

虽然软件层面实现了快速迭代(例如一个新功能仅用三天开发完成),但刘道儒也提到了软硬件结合的挑战。硬件开发的周期远长于软件,一个小小的改动可能需要几个月时间。

但硬件也有其优势。刘道儒认为,硬件在场景化适应能力上更强。软件在手机等通用设备上入口很深,受制于平台。而自有的硬件设备可以与系统深度耦合,形成更深的护城河。

图片

儿童腕表的“饱和攻击”:小团队如何逆袭大厂

孙雪峰在对话中,详细拆解了一个在存量市场中利用AI实现颠覆的案例:儿童智能腕表。

他指出了一个关键的商业逻辑:中国消费者对纯软件服务的付费意愿普遍不高,但对硬件的消费习惯已经非常成熟。因此,AI创业应积极探索“AI+硬件的路径。

他们选择了儿童腕表这个庞大的存量市场。在这个市场中,小天才、360等品牌已经占据主导地位。传统的儿童腕表主要满足家长的安全需求(通话、定位),但忽视了使用者(儿童)的体验,导致购买者和使用者之间的利益冲突。

引入AI Agent后,产品的价值主张发生了根本变化。孙雪峰透露了一个惊人的数据:他们最高频的用户,一个月与AI的互动次数高达1万次,平均每天超过300次。AI极大地增强了产品对儿童的吸引力和用户粘性。

面对如何与行业巨头竞争的问题,孙雪峰显得非常有信心。他总结了三个核心策略:

第一,全面拥抱技术红利,并采取饱和攻击策略。他认为,大厂虽然资源雄厚,但投入到特定项目上的人力可能还不如创业公司。他们投入了数倍于竞争对手的人力。

第二,垂类模型的极致打磨。例如,在AI情绪抚慰功能上,他们收集了全球最好的儿童心理学论文进行二次训练。这种在细分领域的专注度,是大厂难以做到的。

第三,运营商渠道的深度合作。他们目前是中国移动在AI儿童腕表领域的重要合作伙伴,通过保持AI交互体验的领先性来巩固合作关系。

孙雪峰还观察到一个有趣的产业现象:传统的硬件行业似乎与当前的AI浪潮存在脱节。他在走访华强北时发现,许多厂商宣称的“AI”功能,仅仅是简单的语音识别或营销噱头。这种行业性的迟钝,为率先投入的创业公司提供了巨大的时间窗口。

图片

“Service as a Software”:重塑SaaS商业模式

谈到AI创业,一定要谈及的一个方向,就是新商业模式。

魏佳星认为:他们现在销售的本质已经不是软件,而是劳动力。

这个定位的转变,带来了定价逻辑的根本性变革。传统的SaaSSoftware as a Service)模式通常采用订阅制收费,但在中国市场,企业客户为软件付费的意愿一直有限。

魏佳星的新模式是:在特定的交付场景下,可以放弃采购费和订阅费,转而按照业务结果付费。

他举例说,例如帮助客户回收废品,如果客户原本只能在白天8小时工作,AI系统可以使其实现24小时运营。那么,在额外16个小时内产生的收益,AI服务商可以从中抽取佣金。再比如电视购物,夜间时段往往因为客服不足而流失大量来电,AI系统可以承接这些溢出的流量,并按成交订单分成。

这种模式被高飞总结为“Service as a Software”,本质上提供的是服务,只是通过软件的形式来实现。

魏佳星坦言,他曾经历过传统SaaS模式的失败,对此有深刻反思。但他并未放弃SaaS的产品形态。他认为,AI时代对算力(如GPU资源)的依赖,使得本地化部署的难度和成本更高,反而使得一些甲方能够接受公有云部署的SaaS模式。

图片

认知鸿沟与AI平权

冯昊在分享中主要谈及了信息差问题。

今年2月,他在某地方大学进行演讲时,向台下200多名学生提问。结果发现,对主流AI工具的使用率极低,最终只有一位同学表示使用过豆包

这个案例直观地展示了当前中国社会存在的巨大认知鸿沟。在沿海发达城市,AI应用已经非常成熟,但在内陆地区,存在着显著的时间差。

这种认知差距不仅存在于学生群体,也存在于教育工作者中。冯昊提到,他看到有大学教授甚至院长级别的管理者公开反对使用AI,认为AI会让人丧失思考能力。这种观点可能会误导大量学生。

与此同时,在北京海淀区,家长们已经开始利用AI技术来辅助孩子的学习。冯昊担心,这种差距会导致教育资源的进一步分化,出现强者恒强的局面。

他强调了“AI平权的重要性。AI本应是普惠的工具,但现在的问题是,许多人根本不知道如何使用AI,或者被错误地引导。冯昊认为,当前产业界过于关注从80分到100分的提升,但更紧迫的任务是从060分的普及。他计划通过书籍、系统和课程,构建一个完整的AI教育生态,并认为这个市场的潜力远超传统的职业培训。

图片

投资的“哑铃”策略:寻找非共识

作为投资人,王学辉表示他们最近在看大量的AI应用项目,但出手非常谨慎。

他的核心观点是:AI领域最大的机会在于新场景。在旧场景和旧模式中,原有的行业巨头依然占据优势,创业者只有在新场景中才有可能突围。

但在AI应用层面,王学辉认为技术本身很难建立壁垒。真正的壁垒在于那些脏活累活:即对行业的深度理解、数据积累和业务落地能力。

王学辉的投资策略非常清晰,呈现出哑铃型结构(或称一头一尾逻辑):要么在第一轮以极低的价格投入,要么在IPO前夕投入。中间阶段的项目风险最高,因为绝大多数项目最终可能只是一门生意,难以成长为平台级的公司。

他强调,一级市场投资的核心是寻找非共识,这需要考验认知,甚至一点运气。二级市场才是寻找共识的地方。

他目前关注最多的是AI硬件。一个最近他注意到的案例是AI观鸟望远镜,它可以实时识别鸟类的品种和习性。他非常看好这类模仿大疆(DJI)走高品质、高定价路线的策略,认为纯粹追求性价比的华强北逻辑缺乏长期价值,不符合投资标准。

图片

错位竞争的法则:中立、开源与专业化

在谈到创业公司如何与大厂进行错位竞争时,刘松给出了几个关键词:中立、开源、全球化,以及在细分场景做到极致(一招鲜吃遍天)。

他以自己所在的数据库领域为例,阐述了AI时代对基础设施的新要求。AI需要数据库具备海量的存储能力、极快的响应速度,以及对多模态数据(如向量、图数据)的原生支持。

这要求底层架构必须是分布式的。刘松认为,传统的集中式架构缺乏扩展性,无法支撑AI时代的暴力计算需求——即在海量数据中快速返回结果。只有实现了原生分布式、云原生、Serverless(无服务器架构)以及按调用付费的模式,独立软件厂商才能获得足够的灵活性,与大厂竞争。

与会者也观察到大厂生态策略的变化。现在的云时代和AI时代,大厂更倾向于孵化生态。刘松认为,云厂商希望看到更多的应用在自己的平台上成长起来,只要能从中跑出一个像TikTok这样的超级应用,就足以覆盖成本。

讨论中形成了一个共识:AI时代,小公司获得的杠杆效应远大于大公司。过去需要100人完成的工作,现在可能10个人就足够。只要能找到独特的价值点,创业团队就有机会实现快速增长。

图片

建议与机会:在“黑暗森林”中寻找硬需求

在对话的最后,嘉宾们分享了他们认为最重要的建议和机会点。

冯昊继续看好教育行业,认为政策支持力度大,学校急需AI师资团队。他准备从图书教辅、课程到系统,进行全方位的生态布局。

孙雪峰建议创业者要结合自己擅长的行业资源,小步快跑地行动起来。他认为未来的机会主要有两类:一是在尚未应用AI的领域寻找机会;二是在已经应用AI但效果不佳的领域,利用更先进的技术进行替代。

魏佳星强调了人类相比AI的核心优势:想象力。AI基于历史数据推理未来,而人可以由果推因。他建议创业者要尽可能找到黑暗森林中尚未被发现的硬需求。他最看好的方向是语音交互,认为语音是人类交流的基础,且覆盖人群更广(包括不擅长打字的老人、儿童等)。他预测,如果语音交互技术如果继续向低延迟响应突破,将会涌现出大量新的机会点。

王学辉的判断更为冷静。他认为理论上所有应用都值得用AI重做一遍。但对大多数创业者来说,最现实的路径是“AI+最后一公里+包工头模式,即深入行业解决具体问题,做到一定规模后择机出售。

刘道儒强调了变现需求的重要性。他认为预先定义产品已经不再重要,关键是快速切入客户愿意付费的场景。他提到了一个重要的策略:利用AI技术成本快速下降的趋势(每年可能降至原来的10%-15%)。因此,只要能抓住需求,即使当前定价只能打平,明年也可能因为成本下降而实现盈利。

刘松提供了一个评估机会的公式:技术成熟度乘以场景优势,减去技术挑战(如幻觉、私有部署等)。据此推理,他认为未来两三年,面向C端、对幻觉容忍度较高的场景机会更大。如果能结合硬件则更具优势。


【音频收听渠道】

公众号:科技行者

播客渠道:苹果播客|小宇宙|喜马拉雅|蜻蜓FM

【监制】高飞

【运营】周雅