AI未来指北特约作者 郝博阳
编辑 郑可君
OpenAI系列发布第四弹:Canvas免费开放,新增三大功能
12月11日,OpenAI 12日连续发布马拉松进入第四天。
第四天更新的是创作工具Canvas。它曾经只向付费用户开放,但现在会向所有ChatGPT用户开放使用。
这一天的更新发布会上,Sam Altman没来,但这个更新对于OpenAI的战略来讲相当重要。
因为Canvas已经进化成了集智能写作、代码协作和AI智能体为一体的一套完整工作台。它显示出了OpenAI超越Chatbot的产品野心。
看完发布会,我认为同样有编程能力的新秀Cursor可能会大受影响。但仔细考虑后,也许更该担心的是微软。因为它太像一个拥有超强智能的Google Docs了。
如果你想看前三天OpenAI都发布了哪些有趣的东西,可以点击以下链接:
Sora终于来了!自带剪辑工具,145块就能玩|OpenAI直播第三天
OpenAI系列发布第二弹:“强化微调”惊艳了不在现场的奥特曼
200美元/月!OpenAI推Pro版订阅计划,“满血版”o1模型也来了|OpenAI直播第一天
三大核心,打造AI版Google Docs
Canvas本次的更新,使其功能大为丰富。它可以分为三大核心领域:智能写作助手、编程协作环境和定制化AI代理。
智能写作助手:重新定义文档协作
Canvas的写作功能或许是其最容易上手的部分,但其深度令人惊叹。在发布会的深夜时分,工程师Lee展示了一个看似简单的任务:创作一个儿童圣诞故事。这个演示揭示了Canvas作为写作助手的独特魅力。
首先是界面的革新。Canvas完全抛弃了传统的聊天界面,采用了一个分屏设计:左侧保留了对话功能,右侧则是一个功能完整的文档编辑器。当Lee要求写一个"关于傻精灵的圣诞故事"时,AI立即开始创作。故事的开头提到了"北极边缘的丁瑟镇",这个细节立刻抓住了观众的注意力。有趣的是,Lee可以随时打断AI的创作,直接在文档中修改内容,而AI会智能地调整后续内容,保持故事的连贯性。
Canvas的编辑功能集令人印象深刻。当你需要调整文章时,右下角会出现一系列智能选项。你可以要求AI提供建议性的编辑,这些建议会以评论的形式出现在文档边缘,就像一个经验丰富的编辑在为你审稿。如果你觉得文章太长,可以让AI帮你精简;如果觉得用词太难,可以降低阅读难度;如果想让文章更生动,还可以添加适当的表情符号。
在另一个演示中,产品工程师Alexi展示了Canvas如何处理专业写作。
她将一篇关于暗能量与圣诞老人雪橇推进系统的物理学论文粘贴到平台上。Canvas立即进入学术模式,提供的建议不仅涉及表达方式,还包括论文结构和专业术语的使用。当Alexi接受了其中一个建议时,修改会以醒目的方式显示,让整个编辑过程变得透明且可控。
编程协作环境:代码的实时伙伴
Canvas的编程功能可能是此次更新中最具技术突破性的部分。通过内置的WebAssembly Python模拟器,Canvas创造了一个几乎无延迟的编程环境。
在发布会上,Alexi展示了一段数据可视化代码的调试过程。当Alexi粘贴了一段绘制Sankey图的Python代码时,Canvas立即识别出这是代码内容,自动启用了语法高亮显示。当她点击"运行"按钮时,代码在几毫秒内就完成了执行。虽然第一次运行出现了颜色渲染错误,但Canvas立即提供了修复建议。更令人惊讶的是,这些建议不是简单的文本描述,而是包含了具体的代码修改建议,你可以一键应用这些修改。
在处理代码时,Canvas的智能程度也相当惊艳。它不仅能识别语法错误,还能理解代码的意图。
例如,当Alexi试图创建一个展示圣诞玩具流向的可视化图表时,Canvas建议使用更适合的配色方案,并解释了为什么某些颜色组合更适合数据可视化。
定制化AI代理:超越通用助手
Canvas的第三个维度可能是最具突破性的尝试:与近期更新的Cursor和Devin一样,它上线了定制化AI智能体的能力。
在发布会的压轴演示中,团队展示了如何将Canvas转变为圣诸老人的信件助手。这个演示不仅展现了技术实力,还带来了一丝节日的温馨。
当系统收到一封来自Alexi的信件,要求得到"自行车、H100 GPU和暗物质"时,Canvas生成的回复令人莞尔。它以圣诞老人的口吻幽默地回应了这些请求:同意送出自行车,承诺让精灵们研究GPU的可能性,但委婉地表示暗物质可能超出了北极工作室的能力范围。这个回复不仅显示了系统的幽默感,还体现了其处理复杂情境的能力。
更重要的是,Canvas可以根据不同场景自动调整其行为模式。在处理儿童信件时,它会采用温暖友好的语气;在处理技术文档时,则会切换到专业严谨的风格。这种场景感知能力使Canvas成为一个真正的智能助手,而不是简单的处理工具。
三大板块联动,Google Docs成型
Canvas的这三个维度并不是孤立运作的。在实际使用中,它们往往会相互配合,创造出令人惊喜的效果。例如,当你在编程环境中工作时,可以随时调用写作助手来改善代码注释或编写文档。当你在撰写技术文档时,可以直接在文档中插入并运行代码示例。这种无缝的集成使Canvas成了一个多功能AI驱动的创作工作室原型。
OpenAI首席产品官Kevin Weil在发布会结束时所说:"这只是开始。"随着Canvas向所有用户开放,我们可能会看到更多创新的使用方式涌现。
Canvas的展示让我们得以一窥未来工作环境的雏形,而这一未来已经向所有人开放了。
三个试图跳出Chatbot的公司,
在一条路上的三种选择
Canvas这次的更新,第一次触到了AI编程产品的领域,在这一领域内目前声量最大的就是新星Cursor。
Canvas作为一种外部接入新工具,为基础Chatbot赋能的定位,又让人想到了Anthropic推出的Artifact工具。
这三家公司所做的尝试,其实都是突破ChatBot本身的限制,通过工具和Agent手段,让基础模型获得更大的空间,成为一种通用的基准工具系统。
他们选择的道路和侧重却并不相同。
先说主角Canvas。作为OpenAI的新作,其优势在于综合。用户可以在同一界面中进行写作和编程多面。然而,值得注意的是,Canvas目前不支持GPT o1模型,这在某种程度上限制了它的潜力。
而Cursor作为一个专注于开发者的工具,在编程能力上提供了更为细致的功能集:
首先是其代码编辑能力。通过Ctrl+K快捷键,开发者可以在代码文件的任意位置请求AI修改,这种精确定位的能力远超Canvas的整体编辑模式。同时,Ctrl+L触发的聊天窗口提供了更自然的交互方式,让开发者可以在编写代码时随时获取帮助。
在Agent方面,Cursor的Composer Agent可以允许AI对整个项目进行深度理解和重构。在一个实际案例中,Composer Agent成功分析了一个包含34个文件的WordPress插件,不仅提出了具体的改进建议,还自主完成了约580处代码修改,这种项目级别的理解和重构能力,是Canvas目前展示中所不具备的,它的能力范围主要还在“辅助”层面。
Cursor还支持GPT-o1,这意味着开发者可以使用最新的模型能力。加上其本地运行的特性,在性能和响应速度上都具有明显优势。
因此单就代码写作,这个当下在AI工具应用中最常用的分支来看,Cursor在很多方面确实领先于Canvas。
至于Claude的Artifacts,虽然功能相对简单,但其在前端开发方面的表现值得关注。与Canvas专注于Python代码执行不同,Artifacts能够直接运行HTML、CSS和JavaScript代码,并提供即时预览,这对前端开发者来说是一个重要优势。
因此,这三款工具似乎形成了各自的市场定位:Canvas针对普通用户,提供了一个综合的AI辅助创作环境;Cursor专注于专业开发者,提供深度的代码编辑和项目管理功能;而Artifacts则在前端开发领域找到了自己的位置。
但现在最该担心的应该是微软,因为Canvas最接近的目标对手应该是他们的Copilot。
Canvas的真正对手:
Windows Copilot
目前的Canvas怎么看都和Copilot面向的用户群体高度重叠:有办公或编程需求的一般用户。
Canvas的三大核心功能——智能写作、代码协作和AI智能体,恰好对应了微软意图通过在AI应用上的所有展示:Office、Github Copilot,以及潜在的Copilot智能体。除了LLMOS,Canva未曾染指外,其他都有涉及。
而且Canvas其实在使用GPT的能力上嵌入更深。比如在写作方面,Canvas不只是一个文字处理器,而是一个会思考的编辑。它能根据内容自动调整语气,提供修改建议,甚至能在不同的写作风格间自如切换。这已经超越了当下 365 Copilot的能力范围。
更令人担忧的是Canvas的整合能力。在同一个界面中,用户可以无缝切换文字编辑、代码运行和数据可视化。这意味着,你不再需要在Word和Excel间来回切换,一切都在Canvas中完成。这种"一站式"的体验,正是微软一直想通过Office 365实现,但始终未能完美做到的。
而且最釜底抽薪的是,Canvas向所有ChatGPT用户开放。这意味着,即便是免费用户,也能体验到这种新一代的创作方式。而Office的商业模式很大程度上依赖于企业用户的订阅收入。如果普通用户开始习惯使用Canvas这样的工具,企业用户会跟进也只是时间问题。
对微软来说,真正的挑战不是如何改进Office,而是如何在这场办公软件的范式转移中保持领先。否则,等到Canvas这样的工具成熟,追赶可能就为时已晚。
毕竟,历史告诉我们:范式转移往往比我们想象的来得更快,影响也更深远。