客户端
游戏
无障碍

3

评论

7

5

手机看

微信扫一扫,随时随地看

Z Potentials|沈振宇,一个潮玩公司如何做出世界第一的AIGC模型平台

图片

推荐语

本期我们邀请到了沈振宇作为访谈嘉宾。这位曾被张一鸣直接招募、亲历字节跳动崛起的产品人,如今已经完成了从图虫到千岛的两次创业蜕变。

在本次深度对话中,沈振宇分享了他对AI未来的独到见解:每个公司最终都会变成AI公司,而“AI革命不可能只由少数人主导。他坚信开源模型将主导未来,认为技术秘密正在加速流动这也是他在千岛取得阶段性成功后,选择同步布局AI模型平台的战略考量。

作为一个已经服务超10万模型训练师、超50万个模型的平台,Tensor.Art如何在激烈的全球竞争中脱颖而出?沈振宇的答案是构建双重护城河:"模型规模和创作者规模",同时坚持"低价才能带来更大规模"的商业哲学。他从字节学到的"以终为始"思维,让他能够"穿透短期噪音,看到那些必然会发生的事情",这也指导着他在AI时代的每一个决策。

在沈振宇看来,“AI技术未来一定会像水电一样基础普及,而"单一大模型的能力其实很有限",我们需要大量微调模型来解决细分场景的问题。正如他所言:"未来十年AI会改变一切",而Tensor.Art正是他参与这场变革的门票。

无论你是科技创业者、AI从业者还是产品经理,这场对话都将为你揭示一位顶尖创业者如何在技术与商业的交叉点上,以长期主义和开放心态构建下一代AI基础设施。Enjoy! :)

  • 每个公司最终都会变成AI公司,不会再有AI和非AI公司的区别,因为AI会改造做产品和解决问题的方方面面。

  • Tensor.Art实际上是我们公司'回响科技'进入AI世界的一张门票。通过这个切入点,我们能在AI世界占据一个社区和模型基础设施的位置。"

  • 我们平台上95%的模型训练师都不会写代码,只要对AIGC感兴趣、懂点基本原理就能训练出有价值的东西。"

  • 促使我们做Tensor.Art的一个重要契机是AI领域实现了两个标准化:算法运行环境和模型文件格式的统一

  • 从长远来看,模型社区的护城河主要体现在两个维度:模型规模和创作者规模

  • ChatBot和当前的 agent 都不是AI应用的最终形态,未来的交互一定会更高频、更碎片化、更能自我迭代。

  • AI技术未来一定会像水电一样基础普及,就像20年前的网页技术。开源与闭源模型将会共存,但开源模式更有利于吸引全球人才参与AI革命。"

  • 「以终为始」的思维方式让我们能够穿透短期噪音,看到那些必然会发生的事情,即使很多人要么不愿面对,要么觉得还早。

0从北大Coding少年到连续创业者,商业和情怀双重驱动的创业之路

ZP请沈总先介绍一下自己吧!过往有哪些重要的经历?

沈振宇:先介绍下我自己的背景,从小我就喜欢写代码,高中计算机竞赛保送到北大,后来又保研到计算机系人工智能实验室。从早期的经典机器学习算法的时代,到CNNRNN等神经网络算法大行其道,一直到今天的 Transformer 时代,我见证了 AI 算法发展和 AI 技术产品化商业化的全过程。

因为热衷于编程,也很享受做产品的成就感,我在本科时就开始创业了,首先做了图虫这个摄影爱好者社区,后来被字节收购。在字节期间,我向张一鸣汇报,先后做了时光相册、抖音、泡芙等产品,算是见证了字节崛起的关键时期。

ZP为什么选择第二次创业做了一个潮玩公司——千岛?

沈振宇:离开字节后,我创立了一个兴趣平台叫「千岛」。很多人问我为什么离开字节后选择做潮玩公司,但其实我做的不是潮玩,而是年轻人的兴趣爱好,只不过我们首先选择了潮玩这个品类作为切入点(第一个推出的产品是潮玩族小程序)。

其实是出于个人情怀和商业考虑两方面。说实话,要是纯为了商业回报,我可能就不会创业了,因为千岛真不是赚钱效率最高的项目。早年间,我在摄影、独立游戏、地下偶像、TCG卡牌等等圈子都算早期的爱好者和贡献者。其实在字节的时候思考过这些品类的机会,但当时看这些品类最多就几百万用户,对追求规模效应的字节来说意义不大。毕竟只有足够大的用户规模,才能支撑起高效的商业化模式。

不过这几年环境变了,这些小众兴趣慢慢变得大众化了,成了新一代年轻人的普遍选择。当这种量变到质变的过程发生时,我重新评估了这个机会。这就是我在 2019 年选择创业的原因。我相信每个兴趣爱好者都有他们的痛点需求,都值得被满足。与其做 1000 个不同的产品,不如建一个多品类的社区平台,用高效的中台和可复用的产品模式,同时服务几百个、上千个兴趣爱好品类。

这也是为啥我们叫千岛的原因——每个兴趣都是一个岛。今天,千岛已经覆盖了潮玩、卡牌、谷子、饭圈小卡、剧本杀、电玩游戏等几十个品类数千个IP,在这些领域我们都成为了规模最大的交易平台和兴趣社区,此外在模型手办、电玩游戏、桌游跑团、原创OC这些领域,我们也都聚集了非常活跃的玩家群体。

ZP字节的经历对你有哪些影响?

沈振宇:当初张一鸣问我要不要一起干的时候,我想都没想就答应了。其实当时手里有一家A股上市公司并购的 offer,选这家上市公司就能直接财富自由,但我还是选了字节。主要是因为在做图虫的时候就意识到内容分发的重要性,而我相信推荐算法是内容分发的最优解。

在字节的经历彻底改变了我。做图虫那会儿,我就是个纯粹的程序员思维,只管产品功能和用户体验,对商业模式、组织管理这些都没概念。可以说是张一鸣手把手教我怎么做产品、定战略、做一个真正的企业家。

最重要的是学到了两个方法论。第一个是组织的重要性。好的公司不该靠英明神武的 CEO,而是要建立一个让组织更容易把事情做对的机制,把公司组织当成产品去开发。第二个是以终为始的思维方式。每天我们都会面对很多噪音,比如短期趋势啊、竞争对手的动作啊,但从长远看可能都是无效信息。有些事情是必然会发生的,但很多人要么不愿面对,要么觉得还早。

就拿字节来说,我们在 2014 年就在讨论:移动互联网让用户规模翻十倍后,智能手机具有高速的带宽和强大的摄像头之后,互联网内容生态会变成啥样?需要什么样的内容媒介?用户会怎么消费内容?这些问题很少有人愿意深入想。

这种思考会带来一连串新发现。比如说,我们都知道随着智能手机越来越强,内容肯定会从文字到图片再到视频,这个点现在听起来像是废话。但关键是:视频到底应该是啥样的?是长的还是短的?横屏还是竖屏?UGC 还是 PGC?没人说得准。所以一鸣选择了饱和式尝试:先在头条做视频,觉得不够又在内涵段子接入视频;发现内涵段子偏搞笑有局限性,就做了火山小视频;看到火山还是摆脱不了快手的影子,为了不重演错失快手的遗憾,干脆把 Musical.ly 也模仿一遍。这种饱和式尝试,其实就是以终为始判断的结果:视频一定是下一代媒介,不惜代价找到视频的真正打开方式。

02 AI 船票理论,千岛为什么需要一个AI引擎?

ZP简单介绍一下 Tensor.Art 是干什么的?目前进展如何?

沈振宇:Tensor.Art是一个AIGC模型的托管平台和分享社区。今天在AI图像生成领域,广泛流行使用Stable DiffusionFlux等开源AI模型,并且有大量模型训练师在这些基座模型上继续训练出效果更出色的各种微调模型(CheckpointLoRA)。他们把这些微调模型上传托管到Tensor.Art,从而让其他内容创作者,可以0门槛地使用这些AI模型完成图像、视频的内容创作。

Tensor.Art 面向全球的开发者和设计师,目前用户量200万,模型数量超过50万,每天生成图片超过200万张。不管是模型数量、训练师数量、生成图片数量,Tensor.Art 都已超过同赛道玩家,成为世界领先的开源图像视频模型平台。

ZP千岛孵化 Tensor.Art 的背景是什么?为什么要做一个AI 产品?

沈振宇:确实很多人,包括投资人都问我,为什么千岛要做一个看起来跟主业不相关的 AI 产品。

其实很简单,未来十年 AI 将是推动整个行业发展的最主要驱动力,AI的确定性甚至比前面提到的短视频革命的确定性更强。未来 AI 会改造做产品和解决问题的方方面面,不会再有 AI 和非 AI 公司的区别,最终每个互联网公司都会变成 AI 公司。虽然我们并不清楚千岛如何用 AI 技术来重构,但我们肯定不想被排除在AI革命之外,我想尽早启动我们的 AI 引擎,更何况我本身就是学人工智能算法的。

AI 行业可以分三层:底层是算力和基座模型,中层是平台,上层是应用。对我们来说,底层大模型我们没能力做,上层应用又高度不确定。即使到现在,我们还是看不清未来人类应该怎么跟 AI 互动,AI 将如何改变我们的生活?所以我们选了中间的平台层,做平台是我的强项,我之前做过 个平台产品。在 AI 模型平台所需要的推理优化和工程化能力上,我们是行业领先的团队。

Tensor.Art 实际上是我们公司回响科技进入 AI 世界的一张门票。通过这个切入点,我们能在 AI 世界占据一个社区和模型基础设施的位置,随时可以参与更大的 AI 创新。从组织建设的角度来讲,这也让我有足够有挑战的愿景去招募和留住最顶级的 AI 人才。这就是千岛做 Tensor.Art 的动机。事实上,这种协同效应已经开始显现。AI 团队不仅帮助我们在 AI 开源模型的赛道上占据一席之地,也为千岛带来了显著的增长红利。

比如,去年千岛推出了拍照识物的功能,爱好者只需对感兴趣的商品拍照,我们的AI模型就能自动识别出他想找的是哪一个卡牌、盲盒、谷子,这个商品值多少钱,是哪家品牌什么时候推出的,有哪些人在卖。这个AI识物功能已经为千岛获得了超过1000万新增用户,给千岛带来了几倍规模的日活用户增长。这背后都是我们 Tensor.Art 团队的功劳。

这种技术协同让两个产品能够相互赋能,形成良性循环。未来,我们会继续深化这种协同,让AI成为驱动公司业务发展的核心引擎。

03 开源和闭源的路线之争:为何每家公司终将成为AI驱动的企业?

ZP站在 2025 年这个时间点,怎么看闭源模型 vs 开源模型的格局?

沈振宇:OpenAI的算法团队虽然通过闭源模式短暂保持领先,但是能加入OpenAI的算法工程师是极其有限。全世界大量优秀人才被挡在AI革命之外,从宏观来看这显然是糟糕的社会分工方式。对于剩下的聪明脑袋来说,参与到开源模型的开发迭代和应用生态中,才是最明智的选择。

同样的,对于一个企业来说,选择使用一个闭源模型公司的模型服务,无异于一个黑盒,它成本昂贵、可控性差、不利于二次开发。而使用开源的模型就没有这些困扰,给企业足够的二次开发空间。我们认为一个有效的模式是:在开源基座模型之上,各家公司专注自己的垂直领域。因为这些公司有专业场景和数据,可以训练出深度微调的模型,形成良性飞轮:场景带来数据,数据提升模型效果,模型效果提升带来更多用户。

ZP模型都开源了,还如何构建技术壁垒?

沈振宇:每当一个新技术出现的时候,人们总是过高估计它的难度,认为可以构建技术壁垒来形成垄断优势。但过去30IT行业的发展过程早就向我们证明,技术壁垒根本就不可能长期存在。2000年的时候,你会做网页就可以称之为一家科技公司。2012年的时候,你会做App就算是最时髦的前沿科技。现在,行业又试图神化AI大模型的威力和技术难度。而我的亲身感受是,Transformer的核心原理可以让普通大学生所理解,AI模型的推理和训练也并不复杂。AI 技术根本不是什么高科技,未来 AI 一定会像水和电一样普及。

其实大部分的算法工程师,大多数时间都在调参数。能创造像Transformer这样突破性算法的科学家很少。现在很多大模型公司的都在复用 ollama 开源的网络结构。技术秘密正在加速流动,主要通过三个渠道:学者发论文分享成果、模型参数开源、核心工程师在公司间人才流动。在这三个因素的驱动下,今天的技术秘密,明天就会变成全行业的共识,技术壁垒迅速瓦解。Deepseek的出现就把OpenAI拉下了神坛。

Tensor.Art 就是最好的证明。我们平台上大部分的模型训练师都不会写代码,只要对AIGC感兴趣、懂基本原理,准备好自己的数据样本就能训练出有价值的模型。比如有个德国作者“lykon”,是全球前三的AI开源模型贡献者,连命令行都不会用,刚开始给他训练脚本时把我都震惊了,他可是贡献了无数热门模型的顶级模型训练师啊。这说明普通人只要有独特数据和热情,也能参与AI的进化。

ZP是否会担心 Tensor.Art 过于依赖开源模型?会像Stability.AI那样推出自有模型吗?

沈振宇:我们的立场很明确:只做开源模型的基础设施,推动全球开源模型的发展,而不是去做自己的开源模型。我们不想当运动员,只想当好裁判员或者赞助商。

但我们会积极赞助开源模型。比如行业内流行的 illustrious 这个基座模型,就是在我们提供算力和资金赞助下完成训练的。我相信未来会有越来越多流行的开源模型获得我们的Sponsor。另外,我们的工程师也在积极为这些开源模型生态做贡献。

04 托管能力、全球化、规模效应:Tensor.Art的核心竞争策略

ZP您认为国内外的AI模型平台(如LiblibCivitai)在生态构建上有何本质差异?Tensor.Art 独特的差异化优势是什么?

沈振宇:作为一个模型平台,我们的核心竞争力围绕 Hosting(托管)能力展开。那什么是好的 Hosting 平台呢?

首先,是强大的推理功能。这一点和 Civitai 有很大差异,因为 Civitai 在推理方面非常弱。用户把模型托管到平台上,就是希望模型能展现出更强大的能力、更好的使用体验,所以推理功能是最重要的。

第二点,是推理的性能和价格。算力很贵,就算功能再强大,价格高到离谱也没人用。为此我们搭建了自己的数据中心,自主运行维护大量 GPU显卡,就是为了给用户提供既强大又快速,还要足够便宜的服务。说到和 Civitai 的竞争优势,我们的算力比它便宜 倍。不管是免费用户的更高算力,还是付费用户的更低价格,这种性价比优势都非常明显。

第三点,是关于如何帮助作者商业化。大家都不能永远靠爱发电,肯定希望通过模型创作获得一些收入,来激励后续的创作。Tensor.Art 一直在探索模型的商业化模式,我们做了几个主要尝试:

对于独家模型,我们会根据使用量给创作者分成,这跟抖音、B站、小红书的创作者补贴机制类似。我们鼓励开发者开发付费模型和工作流,并且让主要收益都归他们自己。作者可以在我们平台上直接挂付费模型或会员模型,从而获得收益。我们在努力降低模型作品的使用门槛。这些模型可以很容易地被打包成 H5 网页或者 AI Tools 小工具,方便传播和分享。用户第一次使用这些 AI 小工具和特效时,甚至可以免注册直接体验,这样也降低了作者商业化的门槛。

ZP长期来看,模型社区的护城河是什么?

沈振宇:前面提到技术壁垒并不能构成护城河,而我相信模型社区的护城河主要体现在两个维度:模型规模和创作者规模。

第一个维度是模型规模。现在内容生成都不是用单个模型,而是多个模型的组合,可能要叠加很多 Lora,或者用工作流的方式级联多个模型。如果其中有一个模型不在你平台上,整个生成就没法完成。所以模型数量特别重要,这里有很强的规模效应。目前我们在模型规模上已经远超 Civitai,无论是基座模型生态、核心创作者还是总模型数量都更高。

第二个维度是内容创作者的规模,这直接影响商业化效率。内容创作者越多,会员收入就越高,对模型训练师的反向激励也越强。因为模型训练师都想去更大的流量平台获得更好的分发效果,从而获得更多商业收益。所以内容创作者数量对平台发展非常关键。

ZP为什么 Tensor.Art 面向全球市场?

沈振宇:对于一个程序员来说,他开发的开源项目一定会选择发布在Github平台,而不是国内的技术社区,因为对于开发者而言他们追求全世界开发者的认可,也追求让更多人享受其开发成果同样的道理,AI模型开发者谁都希望自己的模型作品能被全球开发者使用,而不是仅仅局限在中国。所以我们做模型平台一定要面向全世界的AI开发者,这一点我们从立项第一天起就非常明确。

ZPTensor.Art 会考虑增加视频或者3D等形态吗?

沈振宇AI 视频领域正在发生重大变化。以前 RunwayPika 和 OpenAI 的 Sora 这些视频模型都是不开源的。但今年情况不一样了,腾讯混元、阿里的通义万相、智谱的CogVideo等等,很多公司都选择开源他们的预训练视频模型。现在可以说是开源视频模型的百花齐放时期。

目前视频模型还有些局限:没有物理引擎导致存在幻觉,难以生成长视频。大家更倾向于图生视频,因为文生视频的跨度太大,很难让人满意。短期内主要还是生成6-10秒的短视频,主要用在非严肃场景。

这里其实有巨大的商业机会。过去十年,图片一直保持高速增长,因为我们有大量图像处理工具。但今天视频的使用频率还受限于视频创作成本,如果AI能降低视频制作成本,视频产业的规模和价值还能再提升一个量级。

不过现在AI视频生成最大的障碍还是算力开销,因为一个视频几百帧就需要百倍于图像生成的算力。为此,我们正在做大量推理优化和算力建设。

Tensor.Art 现在是生成视频能力最强的模型平台,支持最多基座模型,推理成本最低,还支持视频模型LoRA的在线训练。虽然现在还不知道哪个模型最终会成为赢家,但我们愿意为所有这些开源视频模型提供最好的微调训练和在线推理环境。

ZPTensor.Art 会采用什么样的商业模式?是否会探索交易抽成或企业级服务?

沈振宇:现阶段Tensor.Art的主要客户是设计师,像剪映、Adobe这些创作软件一样,收入以用户增值服务为主,换言之就是每月会员订阅费。Tensor.Art 的用户主要来自美国、日本、巴西、印尼、印度等国家,我们发现海外用户的付费意愿显著高于国内用户。除了基础的会员订阅费之外他们还会额外购买算力包。实际上,我们现在有一半的收入都来自额外算力包。

作为一个MaaSModel as a Service)平台,我们同时也向B端客户提供模型和工作流的API接口。但现在还处在共同开发的阶段,暂时不关注toB业务收入。得益于我们的数据中心建设和推理优化,我们营收早就Cover了算力成本。

05 从工作流到 AgentAI 如何重构我们的创作方式?

ZPDeepseekManus相继爆火,你觉得现在AI产品形态会往什么方向发展?

沈振宇:我很怀疑,Chatbot不是AI应用的最终形态,现在的Agent可能也不是。虽然Agent这个概念本看起来很酷,但用户还停留在猎奇阶段,还没看到很多人真正用Agent大幅提升工作效率。其实很多时候我们未必需要AI从头到尾自主地完成整个思考过程得到完整结果。我猜想,未来AI应该更加无处不在,在创作的过程中时刻了解我的上下文,在我的每一步操作后及时反馈,通过持续人机交互,最终帮我完成真正属于我的创作。

ZPManus最近很火,你觉得它的影响被高估和低估的地方分别在哪?

沈振宇:很多人觉得大模型公司已经把核心问题都做完了,好像其他公司就没价值了。但我觉得这种想法不对,这根本不是个合理的分工方式。

为什么呢?因为单一大模型的能力其实很有限,它只是个预训练模型,解决垂直领域问题的完成度可能就只有50分。我们需要用深度微调过的模型来解决细分场景的问题。这就需要各个垂直领域的公司用自己的私域业务数据来训练,可能是LoRAcheckpointRAG,最后还得把通用模型和专有模型通过workflow或者agent组合起来才能真正解决问题。

说到这个,Manus给了我们很大启发。它没做基座模型,也没做模型微调,只在工作流上创新。以前我们都是直接调用大模型,问题解决得比较浅。现在通过AI生成工作流,能把问题解决得更深入。

这跟Tensor.Art的理念很像,因为我们也在做AI工作流。我们鼓励创作者基于现有模型搭建工作流,完成复杂任务。比如网上那些高级视频特效,都不是单个prompt能搞定的,而是AI工作流的结果。

这些解决垂直问题的模块可以由开发者通过开源社区来激发创新,然后用编排器组合成完整工作流。这就是为什么我们要做开源社区,也是为什么这么强调AI工作流的原因。

06 快问快答:

ZP创业至今最反直觉的决策是什么?

沈振宇:我有挺多直觉是反大众直觉的,比如说押注在潮玩赛道,之前总被人认为是小众品类没规模。比如 23 年初,整个市场疯狂去唱单一大模型解决所谓问题的时候。我坚定相信闭源的大模型不是万能的,未来是属于开源和微调模型的。还有,大家在炒 AI 应用和 Agent 的时候,我们没有下场去做。大家的判断很容易被市场情绪所左右,我在这种情绪面前,可能相对会更冷静,并且相信自己的判断。

ZP对你影响最大的企业家是谁?

沈振宇:我和很多人一样,崇拜两位企业家:张一鸣和雷军,但我比大多数人都幸运的是,这两位我都跟随过。特别是张一鸣对我影响特别大,现在我看问题的方式、验证产品的方法、增长策略、组织文化都深受他影响,很多我不是很确定的决策我都会萧规曹随

2010年在小米的工作经历也让我收获很多。我亲眼看着一群技术扎实的工程师团队,带着推动社会发展的情怀,做出影响全民的产品。小米最打动我的是它的科技普惠理念—— "让每个人都能享受科技的乐趣"他们虽然追求高科技,但不追求高利润,而是用贴近成本的定价让更多人用上好产品,通过规模效应来盈利。

这种思路深深影响了我。我的两个产品千岛和Tensor.Art都采用贴近成本的定价策略。投资人常问我为什么定价这么低,明明用户能接受更高价格。但我相信低价才能带来更大规模,让更多人愿意使用。就像现在Tensor.Art提供全网最低价的推理服务和算力资源,9.9美金的会员费在全球市场上都很极具性价比,这个价格能买到的算力和服务可能是竞品的10倍。

ZP字节跳动和小米都是靠规模效应成长的,一个做软件,一个做硬件,都瞄准了天花板很高的大众市场。但Tensor.Art是个相对小众的产品,它还适用这个模式吗?

沈振宇:这是个好问题。我相信未来十年AI会改变一切。虽然现在Tensor.Art只能服务开发者和设计师,但它最终会服务每个人。我们现在看不清AI的完整落地路径,但这个AI开源模型的方向是确定的。

现在还不能直接服务普通用户,主要是因为算法能力不够强大,而且C端用户对AI的需求还停留在娱乐层面,付费意愿不强。说实话,连设计师这个群体我们都还服务不好,图像生成的可控性还有很大提升空间。但我们要做的就是随时准备好,密切观察服务普通用户的机会。

ZP您认为CEO最重要的反人性能力是什么?

沈振宇:对我来说,是和自己的 ego 和解我和 ego(自负对抗了很长时间,后来发现完全放下是不可能的。ego也未必完全是坏事,但我要认识到ego的存在,因为它总是干扰我们做出准确判断的魔鬼,也是为什么很多聪明人会犯错的原因。关键是要学会合理控制它,这样才能做出伟大的产品。

请注意,本次访谈内容已经过编辑整理并已获得沈振宇的认可,仅代表受访者个人观点。有兴趣加入Tensor.Art的读者可以通过ZP联系公司 ,我们也欢迎读者通过留言互动,分享您对本访谈的看法。

Z Potentials 将继续提供更多关于人工智能、全球化市场、机器人技术等领域的创业者访谈。我们诚邀对未来充满憧憬的您加入我们的社群,与我们共同分享、学习、成长。

免责声明:本内容来自腾讯平台创作者,不代表腾讯新闻或腾讯网的观点和立场。
举报
评论 0文明上网理性发言,请遵守《新闻评论服务协议》
请先登录后发表评论~
查看全部0条评论
首页
刷新
反馈
顶部