最近我在研究怎么让 AI 更"懂我"。
不是说它不够好,DeepSeek 的能力确实很强。但每次问它问题,总觉得少了点默契。
比如我想让它帮我写文案,要反复强调"用轻松的语气"、“别太正式”;让它帮我整理资料,又得不断提醒"重点关注这个领域"、“用行业术语”。
更要命的是,很多写作任务的前置环节是资料查找,而市面上搜索能力强的 ChatBot 产品实在不多。想要跟 DeepSeek-R1 捏在一起,就更难找了。
每次对话都要重新设定上下文,说实话挺累的。尤其你干的工作就是要跟 AI 交代大量前置背景知识的时候。
我就在想:要是有个办法,让它能记住我的偏好就好了。更进一步,如果能让它自动带入我的专业背景,理解我的说话方式…
起初,我把目光投向了 ChatBot 产品,但我发现,单纯通过前缀提示词所带来的定制化空间非常有限。AI 只是表演式的应付了你一下而已。
显然,能傻瓜式做 AI 定制的云平台才是这份需求的最佳载体。
经过我的一番调研,我找到了一个省流 + 真香的产品——
我发现,百度智能云千帆大模型平台,可以零代码做基于 DeepSeek 系列模型的二次开发、定制 AI 应用。完成这事儿的,就是这个千帆 AppBuilder。
传送门:
https://console.bce.baidu.com/ai_apaas/dialogHome
比如,我们可以在这上面,一句话创建一个 AI 应用。
我这里输入:
“创建一个用“优雅发疯”的方式帮用户释放情绪的 AI 吐槽机器人”
不到 1 分钟,创建完成——
点击进入应用后——
可以看到,模型的基本信息,比如应用名称、描述、角色指令都已经生成好了,右侧可以直接对话测试。
就是这么简单,一句话搞定。
那 DeepSeek 用在哪儿了呢?别急,上面是玩具级体验,下面才是基于 DeepSeek 进行深度 DIY 的高级打开方式。
我们知道,一个牛逼的 AI,一定不止是跟你做离线对话。而是会自主思考、规划、记忆、调用外部工具甚至知识库来延展自身的能力。
这样的 AI,我们常常称为智能体。
但,要捏出来一个自己眼中完美的智能体,以前是一个技术活儿,你要写代码、调 Prompt、甚至工程化的去搞 RAG 等。现在,这些 DIY 的门槛都没了,千帆可以零代码干这件事儿,重点是,全链路支持 DeepSeek 系列模型。
在应用配置页面,从左到右有三个部分,分别是基础设定、能力扩展、预览与调试。
基础设定,就是设置这个智能体应用背后的基座模型、参数、角色设定等信息,完成内核构建; 能力扩展,则可以理解成配置可调用的工具、知识库等,用于延展 AI 的能力; 预览与调试,则是帮助开发者做最终的效果迭代优化的。
下面来捏一个试试。
将 DeepSeek-R1 设置为规划和问答模型
在模型设置页,你可以设置规划和问答背后使用的基座模型,这也是整个智能体应用中最重要的两个核心模型,一个用于任务规划和工具选择,一个用于生成最终回复。
就像你要举办一场派对,需要有人负责策划(规划),有人负责具体执行(问答/回复)。
规划模型负责理解你的需求,制定详细实施计划,协调各个步骤;问答模型则汇总所有中间结果生成最终回复。
与 Family 群里的家人想法一致,我这里都闭眼选 DeepSeek-R1 作为智能体的规划模型。
而如果为了更快速、低成本的回答,其实问答模型选用 DeepSeek-V3 或百度自研的 ERNIE 系列模型是更合适的,但我这里也是选择了无脑 R1。
让智能体集成百度 AI 搜索的能力
如果需要精雕细琢应用,最核心也是玩法最多的配置都放在"能力扩展"里,比如组件、知识库、数据库、记忆、语音对话这些功能。
这里的组件,其实就可以理解为智能体可调用的工具,是预先构建好的功能模块。
在千帆平台上有一个庞大的组件广场,包括 iRAG 图片生成、文生视频、图生视频等。
虽然琳琅满目,但我这里只对其中一个组件感兴趣——
百度 AI 搜索。
但凡搞过联网能力智能体的小伙伴,都深知搜索能力对于 AI 表现的重要性。
而在搜索这块,如果你横向摸底一下,会发现还是用百度搜索搭出来的智能体表现更稳定...
更有意思的是,我发现竟然可以为组件单独配置基座模型以及相关的参数——
这里,我把百度 AI 搜索组件果断添加到了智能体应用中。
于是,一个能通过百度 AI 搜索实时访问全网最新资讯信息,由 DeepSeek-R1 驱动的兼具深度思考 + 回答能力的智能体应用,就这样 DIY 完成了。
来,我们调试一下!
比如我问了一句——
claude3.7 要发布了
相比裸奔的 DeepSeek 模型,是不是突然有一种一眼高级的感觉了。
在这里,AI 回答之前,我们配置的 R1 模型先做了思维链推理,然后百度 AI 搜索组件对 Claude-3.7 的信息做了检索和提炼,最后,R1 整合信息完成最终回答。
此外,我发现「百度 AI 搜索」竟然开放 API调用了,而且还放出了支持网页、图片、视频等多模态搜索的 V2 版本。
API 接口文档:
https://cloud.baidu.com/doc/AppBuilder/s/mm3fa3tlh
总之,我觉得百度这次下了狠心,把能上的搜索手段都上去了,没有一点含糊。
此外,iRAG 图片生成组件,也是这次一起新上的。大模型不止在文本上胡说八道,在图片生成上 YY 幻觉也是很常见。比如北京天坛,真实是 3 层建筑,却生成了 4 层。
百度自研了 iRAG 技术,就是为了解决图像生成的幻觉的。
百度搜索的多年积累,收录了海量的可信图片资源,这就是一个图片“外挂”,大模型和这个外挂结合,在生成特定物品、特定人物以及特定人物与任意背景结合的图像时,幻觉会大大减少,尤其是广告拍摄、营销海报、商品展示、文旅海报、影视作品、漫画插图、连续画本等一些专业领域。
与配置 AI 搜索类似,要让这个智能体内置我的记忆、偏好以及一些我独有的专业知识,我们可以在记忆和知识库模块进行 DIY。
这里就不一一演示了,大家可以自行尝试。
开启追问功能,用DeepSeek 生成联想提问
你会经常在对话类产品看到一个功能,当一轮回答结束后,最后会生成几条用户可能的追问问题。
我没想到,千帆 AppBuilder 竟然把这个也给配置化了。
我们可以在配置页面的「追问」功能块中,将 DeepSeek 系列模型设置为追问生成模型。这里 AI 根据对话内容自动生成的追加问题,不知道下一步怎么提问时很方便。
加上这个后,瞬间感觉我的智能体又高级了一些...
如果真的要仔细研究下千帆这个平台,你会发现还有好多功能,这些功能只有实际做过产品研发的才知道有多香,比如支持上传自己的知识库和连接数据库——
甚至可以进一步设置知识库的检索方式,定制化的非常细致。
再比如,智能体中还集成了数字人技术,语音播报、音色、形象都可以选择或定制。
工作流配置
在千帆 AppBuilder 里,除了创建会自主规划任务的智能体应用,我发现还可以搭建工作流 Agent。
区别是能严格按照人工编排的流程执行。在金融、医疗这种高风险场景里,需要流程 100% 符合预设规则,还有审批、客服这种固定流程的场景,就得上工作流 Agent。
这里,我体验了一下,所有的大模型节点也都支持了 DeepSeek 模型。
看起来 DeepSeek 几乎是无孔不入地被集成进整个千帆平台,整个智能体开发涉猎的各个环节都被 DeepSeek 加持赋能。
在千帆这里,把 DeepSeek 深度思考、百度搜索、知识库、数字人这些核心功能,像搭积木一样摊开地给你用。
不是 DeepSeek 玩不起,而是 DIY 更有性价比。
突然觉得这次技术革命,可能真的触达了地面。
技术上的领先性最终还是要落在真实的产品体验中,我又去仔细了解下千帆大模型平台,去年 9 月最新升级的 3.0 版本包括模型开发层、模型服务层、应用开发层,可以提供企业级一站式大模型与 AI 原生应用开发及服务。百度拥有全栈 AI 技术能力,从云基础设施、框架、模型到应用端到端优化,DeepSeek 这一波对百度智能云最利好,这也是为什么能做到中国大模型产业落地规模第一,能源/政务/金融三大领域的中标王都是百度了。
那些挤在官网的人永远不会懂,当技术门槛消失后,想象力才是最凶残的生产力。