邮箱|yokyliu@pingwest.com
回顾2024年,无疑是AI应用爆发的一年。
大大小小层出不穷的应用产品涌现出来,乱花渐欲迷人眼,同一功能的产品甚至有十几款甚至几十款。
我们在年底,展开了一场激烈地讨论,究竟谁才是创作者最得力的AI助手?
最终,我们发现,不同的产品似乎只能解决某一个单点的工作环节,要想把所有的工作流在一款产品上解决,得出的答案是:没有。
真的没有么?
在2024年年尾,豆包电脑版“悄咪咪”的进行了一次重大更新,将豆包的属性,从一款从前以对话为主的产品,变成AI浏览器、文章编辑器、AIGC生成的All in one产品,相较于此前碎片化的工作流,如果能在一款产品中完成所有环节,效率无疑将得到大幅度提升。
今天,我们就挑战只用豆包,不切换到任何一款产品,能不能完成高效创作。
做款不一样AI浏览器
熬了三个通宵,开了几十个网页,互联网上的资料五花八门,要在信息海洋里高效地找到有价值的信息,创作者们都知道,这里面门道有多深。
当我们习惯性地打开浏览器搜索时,却发现豆包不仅支持AI搜索,也摇身一变成为了一款浏览器,对于官网信息、财报、论文等一手资料源,可直接查找。当我把原来浏览器里的书签一键导入无缝切换后,在使用体验上,几乎和Chrome没有任何差别。
当AI与搜索开始结合,AI搜索在过去的两年里演化成了两种形态:一是LLM本身具有搜索能力,在对话中通过搜索实时信息来生成准确回答;二是以Perplexity为代表的一类专门负责AI搜索的独立产品,无法直接生成内容。
当然,这两种形式对于用户来说相对便捷和无感,但往往只适用于二手信息的检索,对于搜索工具、服务、或者一手信源时,仍然需要打开浏览器,解决不了全部的问题,这也就导致了,创作者在AI搜索后,仍然需要通过传统搜索的方式来补充和确认信息。
在豆包电脑版里,不仅将上述两种形态结合在一起,同时也考虑到使用场景中的真实需求,保留了浏览器的原生能力。
让人惊喜的是,虽然功能极为复杂,但通过豆包的产品能力,依然保持了简洁的页面、简单的操作,哪怕是新手也能直接操作。
当我们提出一个准确地问题,需要高效地整合型的,直接获取答案,可以选择直接“问问豆包”,进入到对话页面。
但豆包电脑版浏览器功能并不是只为了构建浏览器本身,更重要的是,有了浏览器作为载体,浏览中可以更方便地调起AI协助。
比如在研究AI技术的过程中,创作者经常会查找和阅读许多论文,但外行看总是一个头两个大,对于很多名词的翻译和理解并不准确,豆包中配备学术搜索功能,在浏览中可随时划线AI搜索,翻译原文。
文字是搞懂了,但一涉及到图形演示或者数学问题,又犯了难。
在豆包电脑版浏览器功能中配备了「截图搜索」这一功能,在某一部分图像看不懂的时候,可以直接截图,使用豆包分析其中含义。
如果想快速高效地浏览一篇论文,也可以对网页进行总结,直接生成脑图,帮助我们快速了解论文里的复杂信息,同时可以针对网页内容进行音频播放,扩大使用场景。
除此之外,豆包还考虑到了,除了文字内容,创作者往往也需要大量浏览音频博客和视频一类更复杂的内容形式,豆包电脑版浏览器功能升级了理解图片和视频的视觉理解能力。
最近两周,整个科技圈都在跟进OpenAI的实时转播, 恨不得逐帧观看反复研究。通过豆包电脑版浏览器功能观看视频,能够理解和总结视频,甚至能够通过搜索关键词直接定位视频内容,就算落下了几天也不怕,在研究中也可以精准地搜索到“Sam Altman的原话”或者“关于o1有哪些更新”,再也不必凭着记忆一帧一帧地找视频了。
搜索、浏览、翻译、整理总结,在全新的豆包电脑版浏览器功能里,查阅资料变成了一件更简单的事。更让我们感慨的是,相比于在Chrome里按一堆插件,豆包电脑版浏览器功能好像更懂“我”的需求,也更加便捷。
边写边查边改,不让电脑屏幕忙到冒烟
从前,搜索和撰写必须在不同的产品里,从网页里把有效信息提取出来,进行整理和加工。
这就导致了电脑屏幕往往被分成两块,或者安装多块屏。
而这不单单只是效率问题,两边复制粘贴,两个页面来回切换,经常会出现bug和格式错误,影响创作内容的准确性。
相信每一个创作者都经历过这样的“痛”。在AI来了以后,本以为能提效的我们发现又更多了一个修改环节:查资料——大模型写初稿——复制粘贴在编辑器中——人工修改。
这个过程产生了一个更长的链条,中间无形的效率损耗非常大。
那么问题来了,能不能一边查一边生成,还能一边改?
豆包电脑版推出了「对话+编辑」一体的编辑器,页面形态与ChatGPT Canvas类似,但使用起来更符合创作者创作习惯,细化了产品功能,AI生成和创作者修改有机的融合在一起,打开了一种新的人机写作方式。
硅星人提前内测了豆包的编辑器功能,在对话入口或帮我写作入口输入写作指令字数大于300字时便可自动触发编辑器,无缝丝滑切换到写作模式,在一个页面几乎能搞定所有难题。
左边是自由对话页面,在左侧对话框提出框架需求在右侧生成一份更详尽的框架,并通过多轮对话来完善框架内容,分点、分层次、清晰有序的展现文章的逻辑和结构。
在豆包生成初稿后,创作者可以对生成的内容进行二次创作和编排,在创作中,如果对某一段落不满意,可直接在对话中提出修改意见,进行局部的修改并在文中直接生成,不会像传统AI那样,重新生成一篇全新的文章,产生过量文字使得最终的写作效率降低。
当然,在编辑器中创作者也可以随时AI改写和自主修改,支持对全文或指定段落句子进行扩写/润色/缩写等AI改写功能,也可自定义提示词,仅修改目标段落或句子,进行自主替换。
比如第一段豆包的生成结果稍微口语化,我们需要更严肃的商业报道时,通过Prompt将其调整为更加书面的文本,并可以自由选择整段替换或部分替换,提高了编辑的灵活性。
我们发现,每一个需求豆包编辑器都能够生成一份独立的文档云端存储,方便后续找回。
最后,我们可以使用全文优化的功能,对刚刚分段修改后的文章的语言重新润色一遍,来保证文章的整体性和一致性。
当超出了文章的范畴,比如写研报和论文,则需要更强的逻辑结构和关联性,豆包的分步骤写作功能,支持万字以上超长文本的写作,并支持三级标题,将复杂任务结构化拆解,创作者可以对大纲的每个部分进行细节修改,直到满意为止。
在分步骤写作中,AI撰写也可以变得越来越“像你”,将作者过往的作品发给豆包,豆包即可模仿语言风格和文章调性,进行更加个性化的生产。
这些表面上看似独立的能力,实际上都是在服务于同一个目标:确保生成内容的高度可用性。从辅助创作到直接生成可用的成果,AI正在重塑人机交互的全新方式。
从产品形态来看,豆包编辑器与10月份OpenAI推出的Canvas编辑器的页面布局类似,二者都不约而同地选择了将「对话」和「编辑」功能集成的形态,构建一种全新的人机协作范式,来试图打开AI和人类共创的时代。
懂事的AI编辑器,连图都不用自己找
在图文创作过程中,图像是不可或缺的重要组成部分。但对于大多数文字工作者而言,虽然撰写文字内容相对容易,但寻找合适的图片素材往往望而生阻。
特别是在要求图片与上下文语境相符,且不涉及版权问题的情况下,寻找适合的素材更加艰难。
过去我们常常通过文生图工具进行二次创作,但这需要重新编写Prompt,有时还会因为不熟悉专业术语而产生乱码,使得生成的图像根本无法用于文章之中。
懂事的豆包编辑器,连配图也能够联系上下文语义和对整篇文章的掌握,理解和生成更适合的插图内容,甚至不用提出Prompt。
在编辑器中,直接点击➕,即可调用全网搜图或AI生图能力,甚至不用提出新的提示词,根据上下文语义,对于“灵感的创意工坊”这个比喻,生成了带有魔法的提示板。如果对于生成结果不满意,可重新生成新的图片。
当然,我们也可以在对话中直接提出新的提示词,来更准确的描述图片信息。如上图,豆包生成了“AI搜索:信息的高速公路”,根据这个创意,我们提出了一个简单的图片构思,随机豆包的插图功能生成了四张插画风格的插图。
相信眼尖的你也注意到了,没错,在豆包电脑版中,也上新了此前“可控中文生成的能力”。豆包精准的生成了带有信息字符的高速公路,甚至在4张图片中,分别放在了不同位置。
不过,对于以图像为主文字为辅的创作者来说,对于图片的二创往往是常态,比如下面这张图中,明显广告牌中出现了乱码,我们分别使用了“区域重绘”能力,提出了新的Prompt,将广告牌变成了树,“擦除”和“扩图”三种不同的修改方式,对下图进行了实时编辑,最终保证可用的效果。
当然,基于图片和文字这两种比较基础的内容形态,据悉紧跟着豆包电脑版还将上线PPT生成能力,打工人的天菜能力终于要上线了!
另外,万众期待的视频生成的能力也在内测中了,刚刚OpenAI在Canvas中更新的代码能力,也可以小小的期待一下。
至此,豆包真的是集搜索、写稿、生图、视频为一身,不知道各位认为这次的挑战是否成功呢?
结尾
新石器时代,人类首次将木斧、锥器、火石等工具集成到一起使用,孕育了有史以来第一次工具革命。如今,AI驱动的All in One平台出现,将多种功能融为一体,为知识创作带来了深刻的变革。
不同于过去工具割裂的状态,All in One平台正在重塑创作者的思维和创作方式,开启了全新的创作范式。创作者不再被工具所局限,反过来工具组也在重塑人类的认知方式。这不仅提高了创作效率,更重要的是催生了人机深度交互的创作模式。
从另一个角度来看,在一个AI爆发的新时代,用户都是“用脚投票”,All in one的背后也是用户在不同的场景下都愿意选择豆包的一种自然的结果。一方面,多模态的输入、多端的部署,让豆包在用户身边无所不在,问问豆包最快、最及时。
All in One平台的无缝集成,标志着AI辅助创作向成熟阶段迈进。它汇集了人类智慧和AI能力,为知识生产力带来新的大规模提升。这不只是简单的功能集成,更是AI辅助走向成熟的必由之路。