别再 chatbot 了，内容创作的 AI OS 时代从一块画布开始？

硅星人Pro

2024-12-20 10:43发布于北京

全文2747字，阅读约需8分钟，帮我划重点

划重点

01百度文库与百度网盘推出的"自由画布"作为AI生产力工具的新解答，提供了画布式交互，使用户能够直观地拖拽、圈选内容进行创作。

02与ChatGPT的线性对话模式不同，画布式交互让AI从单纯的对话者转变为真正的共创者，提高创作效率。

03自由画布技术层面的自由包括多模态理解的突破，实现了对传统单一格式限制的突破，让AI获取像人一样的全模态信息。

04另一方面，产品层面的自由画布满足了交互层面的自由，采用类似思维导图的自由布局方式，支持发散式创意探索。

05随着95后、00后成为创作主力，自由画布的出现有望满足他们对自由创作的渴望，为下一代生产力工具竞争占得先机。

以上内容由腾讯混元大模型生成，仅供参考

作者｜summer
邮箱｜huangxiaoyi@pingwest.com

1981年，IBM推出个人计算机，用户需要通过DOS系统，输入繁复的命令与计算机对话。那是计算机的“命令行时代”。

1985年，Windows 1.0的诞生，带来了革命性的图形界面。用户可以直观地点击、拖拽，释放了人与计算机交互的自由度。而这个历史性的转变，让计算机真正走入千家万户。

如今，这段历史再一次重演了。从 2023 年到 2024 年，AI 生产力工具正在经历相似的革命。

2023年，ChatGPT横空出世，用户与AI对话的方式，强化了AI的“类人感”，让人与AI在交谈中相互启发、无限延展，也让chatbot的范式快速在市面上铺开，一时之间，几乎所有AI应用都在沿用这一模式。但多轮次的线性的对话，未必适合创作场景。一些创作类产品，例如OpenAI的Canvas引入了文档编辑面板，WPS AI、AiPPT则是保留了传统的文档形式，似乎又回到了互联网产品的旧范式之中。

直到11月12日，百度文库与百度网盘推出的"自由画布"给出了一个AI生产力工具的新解答。在这个全新的交互范式中，用户可以通过“一拖一圈”将多格式、全模态的文件自由组织，而画布本身则化身为理解全局的智能助手，与用户共同进行创作。这种突破性的交互方式，让AI从单纯的对话者转变为真正的共创者。

如果说，ChatGPT以对话方式让用户输入prompt，一如DOS时代用户输入命令；那么，画布式交互则像是AI时代的Windows，用户可以自由拖拽、框选内容，让创作回归直观与自然。

从用户反馈来看，自由画布首日就获得了20万用户预约的热度，也从侧面印证了市场对这种创新解决方案的渴望。

以史为镜，当AI工具从“命令行”进化到“图形界面”，或许真正的AI原生应用时代才刚刚开始。

AI生产力工具的破局：工具孤岛、流程断裂与学习门槛

当我们满怀期待地打开各类AI生产力工具，现实却总是不尽如人意：用AI制作视频需要经过多道处理，并像抽盲盒一样反复尝试，用AI写作也需要不断调试，采用不同的AI写不同类型的内容，最火爆的业务还得是 AI教学，这也折射出当前的AI工具依然是一种“高门槛生产力”。

鼓吹技术已经让人们逐渐麻木，如何在产品层面，让更多的用户用上、提升效率才是关键。

摆在用户面前的，首先是AI创作工具的孤岛。如今的市场上充斥着大量功能单一的垂类应用，用户不得不在多个工具间来回切换，能做PPT的工具往往无法进行文字优化，专注文本处理的又难以处理图片，就连AI消除都可以单独形成一个产品。

从人的创作过程来看，原本从素材收集、内容生产到成果输出，是一个连续完整的链条。但工具孤岛之下，创作流程断裂，用户无形中需要投入大量时间学习和适应。

你以为是AI在为你打工，但现实却是你得先明确、拆分自己的需求，并主动挑选适合的AI工具，多次调试再完成输出，可能比自己做还累。

实际上，用户需要AI参与创作的需求很简单，一个能够贯通全流程的智能工作空间：能搜索资料，能摘取素材，能整理素材和思路，能创作修改，能适配各类应用场景。和自动驾驶一样，在所有人类作业环节，最理想的状态都是端到端，让AI直接把活干了。

为了满足用户的需求，具体到产品形态上，首先是要做出一款All in One的产品，解决工具细碎的问题，像人一样先持续收集信息，再整体性地思考、创作。

All in One不是简单的功能堆砌，而是对人类认知方式的深度模拟和对现代工作需求的必然回应，是AI工具演进的内在逻辑和发展方向。

一方面，人类的思维方式本就是多模态的，我们在思考时自然地融合了语言、图像、声音等多种信息形式。All in One模式自然就贴近了人脑的整体认知模式。

另一方面，这也解决了现代工作场景往往需要多种能力协同。工具切换带来的时间和注意力成本不容忽视，而上下文的连续性对工作效率至关重要。

而自由画布，正好是All in One的绝佳形态。

从chatbot到画布，AI的All in One进化

像人一样持续收集信息，再进行整体创作，在All in One的模式下，无论是chatbot的交互方式，还是文档式的AI润色、续写，显然都不够用了。前者，意味着AI与人的交流仍然是线性的多轮次的沟通；后者则仍然还是将AI变成word里的一个功能插件。

那么，究竟什么样的AI功能/产品才能够解放用户生产力？

百度文库给出的答案是“自由”。

这个“自由”，不仅仅是界面形态的创新，对技术能力的全面包含，也是对创作本质的思考。

首先是技术层面的自由——多模态理解的突破。

在画布中，文本、图片、视频等多种格式内容可以自由导入，AI系统能自动理解不同模态内容间的关联，实现了对传统单一格式限制的突破。让AI获取像人一样的全模态信息。

比如在研究报告撰写场景中，用户可以同时导入PDF文献、网页、会议记录和相关图片，AI会自动分析这些异构数据之间的逻辑关系，帮助用户快速构建知识网络。

其次，则是在产品层面，自由画布满足了交互层面的自由。

不同于传统文档的线性排版，采用类似思维导图的自由布局方式，用户可以在对素材进行自由批注、圈选，任意选择素材的重点和使用方式，同时可以并行处理多个创作任务，同时展开多个思维分支，生成多种类型的作品。

以小红书博主的创作流程为例，他们可以在画布中同时准备多篇内容，将灵感、素材、文案并列展示，随时调整组合，突破了传统对话式交互的单线程限制。

最终，在技术和交互自由之上，才能实现思维自由。

类似思维导图的重要性，正是让人的思维从文档的线性输出，转向网状思维，支持发散式创意探索。画布的形式也是一样的，突破了文档的线性思维，也不受限于chatbot的线性思维，让创作回归人类思维本质，创作流程不再受限于固定的创作步骤，随时调整、重组内容结构，实现真正的灵活创作。

我们可以想象一个创意工作者的桌面：他可以随手将网络上的创意素材拖拽到画布中，AI助手会即时理解内容并提供创作建议，多个创意方向可以同时孵化。

这种多维度的“自由”正是画布范式区别于其他AI工具的核心优势。

它不只是解决了工具层面的效率问题，更重要的是符合了创作的思维方式，将创作从线性的轨道上解放出来，回归到更自然的网状模式。

结尾

媒介技术学者麦克卢汉曾提到过，媒介本身具备着影响文化和社会的能力。文字时代通过书写，培养了人类的“视觉线性思维”和个人化阅读习惯；印刷时代则通过标准化文本，加速知识传播，强化了理性主义和个人主义；电子时代，又通过“地球村”打破了线性叙事，实现即时交互和多感官参与。

同样地，chatbot也好，画布也好，作为创作和信息的载体，也在影响着人们思维的方式。

在chatbot中，AI是与你对话的个体，通过接收、理解用户发出的信息进行生成，而在画布的形态下，AI成了与用户共享视角的存在，这才是画布这一形态带来的价值。

当然，从目前已推出的自由画布功能来看，想要释放这一模式的潜力，还有很多空间。例如，目前，画布主要可以只能创作出长文、图片体裁的作品，创作的自由度还可以继续扩展；另一方面，自由画布也面临着，如何既兼容各式各样的功能，又保持简洁、避免繁琐复杂。

不过，无论如何，自由画布的出现，让AI从对话者转变为共创者，从线性突破到多维，都是一次新鲜的尝试。

随着95后、00后成为创作主力，谁能满足这一代人对自由创作的渴望，谁就能在下一代生产力工具的竞争中占得先机。画布模式的出现，或许会对AI原生应用带来更多的可能性。

查看原图 179K