AI重塑记录:从“数字囤积”到“记忆引擎”,从笔记到创作-对谈闪念贝壳Ping

聊了笔记工具从PDA到AI时代的进化史,揭秘OpenAI Whisper如何引爆语音输入革命。今天的AI如何让思维更高效?闪念贝壳这样的工具如何从录音变身记忆引擎?未来的笔记不再是"存储",而是你的"第二大脑"与"思维引擎"。

第一部分:电子笔记进化史——从"数字垃圾场"到"知识复利"

  • PDA时代:Palm V与生产力四大金刚的诞生
  • Evernote:移动时代的"收集一切"与"只存不看"
  • Notion:打破纸张逻辑的Block革命
  • 幕布与Flomo:从大纲思维到无压记录
  • Obsidian:双向链接的理想与现实

第二部分:AI重塑记录——Whisper时刻与"上下文"革命

  • 从讯飞到Whisper:语音转录的质变
  • AI带来的根本变化:机器开始"听懂"你在说什么
  • 从"检索"到"对话":AI笔记的颠覆性区别

第三部分:产品解析——闪念贝壳、Notebook LM与记忆硬件

  • 闪念贝壳的设计哲学:为什么不做实时字幕?为什么模板指向行动?
  • Notebook LM:伪装成笔记的学习软件
  • 记忆软硬件盘点:Limitless、Bee、Dot的路线之争
  • 硬件vs手机:独立录音设备还有必要吗?
  • 基座模型策略:做容器而非做引擎

第四部分:AI笔记用法大赏与用户洞察

  • 闪念贝壳的"非典型"用户:养牛、吵架、看病都能用
  • 效率工具推荐:Todo!、闪念说、YourMind

第五部分:未来展望——记忆外挂与差异性放大

  • 记忆的生态化价值:从靴子放在哪到心理咨询
  • 学习、记录、创作三合一
  • 效率基准线之上,AI应放大人的差异性
---
你的手机里装了几个笔记软件?你上一次打开它们翻看旧笔记,是什么时候?
这个问题可能会让很多人沉默。我们花了十几年时间,从 Evernote 到 Notion,从 Obsidian 到 Flomo,把成百上千条笔记塞进各种软件里。结果呢?大部分人的笔记库变成了一个"数字垃圾场"——只存不看,越记越焦虑。
这期节目,我们请来了闪念贝壳的创始人 Ping,和两位主播 Nixon、Thomas 一起,从 90 年代的 PDA 聊到今天的 AI 语音笔记,试图回答一个问题:当 AI 开始"听懂"你在说什么,笔记这件事的本质,是不是正在发生一次根本性的改变?
Ping 曾是科技媒体"爱范儿"的 VP 与合伙人,2023 年底开始做闪念贝壳。这款产品从语音切入,在 Apple Watch 上做了"捏一捏"录音,在手机上做了八种快速录音入口,用户群体从知识工作者扩展到了德国养牛户、英国开车的大妈、盒马鲜生的销售。
Nixon 对闪念贝壳的第一印象很直接——"iOS 里见过的最漂亮的录音机"。
图片
Nixon:我越来越多地在不同的同事和朋友的手表上和手机上发现了它的 APP 图标。我去问这些人,他们为什么用这个东西,以及他们用到什么程度?很多人都告诉我他们是付费会员,甚至是终身会员。所以我觉得这里面一定有点东西。
Thomas:录完之后它会有一个非常简短的一句话总结,然后你可以在左下角点开系统模板,这些模板基本覆盖了大部分需求——总结纪要,甚至是生成待办事项。过去这些工具是分开的,日历有日历的管理,待办有待办的软件,录音有录音的 APP。闪念贝壳相当于把一些你本来就应该打通的工具,打通了。
Nixon 补充了一个很具体的使用场景:洗澡和睡前。
Nixon:洗澡的时候和睡觉前,我整个身上能抓到的录制工具只有手表。手机一般放在远一点的地方。所以手表上的闪念贝壳特别体现"闪念"这两个字。
还可以做闪卡和 Quiz。
Ping:我们的海外用户很多人用闪念贝壳来听课,听课之后生成 Quiz 和闪卡。这个功能 Notebook LM 最近一两周才上线,我们几个月前就已经有了。用户记录完不是结束,而是能促进后续的学习和行动。
Nixon:我当时一下子就觉得,这个产品还能做学习?这完全出乎我的意料。

第一部分:电子笔记进化史——从"数字垃圾场"到"知识复利"

PDA时代:Palm V与生产力四大金刚的诞生

如果把时间拨回 90 年代,电子记录的起点不是手机,而是一种叫 PDA(Personal Digital Assistant,个人电子助理)的设备。在中国,大家更熟悉的名字叫"商务通"。
Thomas 是 PDA 的真实用户。
Thomas:我大学的时候买过一个叫 Palm V 的产品。它是一个铝合金外壳的,氧化铝的,造型非常漂亮。下面是一片书写区,有些基本功能——电话本、地址簿、记账软件。对我来讲更多用的是看电子书。也有 TODO list,可以列一下 1234。它的输入输出难度很大,是一个小的电阻屏,键盘也比较小。那应该是初代的大家想用电子设备记录 Todo、做笔记的尝试。
Nixon 补充了一个关于 PDA 诞生的故事。
Nixon:最早做 PDA 的人——可能是 Palm 或者 General Magic 的团队——他们当时捏了个木板揣在包里,每天出门就想:假设我手里这个木板掏出来能做一些事情,我希望它做什么?我后来在计算机博物馆里看到了他们留下来的原件,下面写着备忘录是需要做的一件事情。所以 90 年代的 PDA 就把人的生产力定义为四大要素:日历、通讯录、待办和备忘录。而且那个时候的备忘录已经可以通过有线 USB 跟电脑做数据同步了。
图片
Thomas:是可以的,在我印象中是要拿有线 USB 接上去才能实现。
这四个功能——日历、通讯录、待办、备忘录——后来成了所有智能手机的标配。从 PDA 的底部那四个实体按钮,到今天 iPhone 里的原生应用,这个框架延续了三十年。

Evernote:移动时代的"收集一切"与"只存不看"

进入 PC 和移动软件时代,Nixon 认为第一个重要产品是微软的 OneNote——无限画布、自由布局、分页层级结构,和 Office 全家桶高度整合。但 OneNote 今天可能更多是 70 后、80 后职场人的记忆了。
真正在移动端引爆的产品是 Evernote(中国版叫印象笔记)。
Ping:真正在移动端开始用 Evernote,差不多是第一个随着 iPhone 的发布让大家随时随地做记录的产品。我觉得这确实是一个非常划时代的产品。我也买了他们 12 年的会员,以前超级喜欢。他们整个理念就是"大象什么都记得"。
Nixon 回忆了 Evernote 锁住他的两个杀手级功能。
Nixon:第一,各种格式都支持。你上传一个 PDF,拍一张照片进去,它都支持。甚至 PDF 里面的文字和照片里面的文字,它都给你 OCR,给你搜索出来。你想想今天这个东西平平无奇,但七八年前,这简直是开天辟地。第二,任何客户端你都可以找到一个给 Evernote 输入的方式。印象笔记是最早一批支持你在微信里给服务号发一篇文章,它就自动帮你保存在笔记里的产品。
Evernote 的整个商业模式就构建在"收集"上——你能不能在更多设备上收集,你能不能上传更多文件,免费额度用完了就要买付费会员。
这对应了那个时代人的一个思维范式:我面临前所未有的信息富足,我需要一个东西把这些信息收集起来。
问题是,收集之后呢?
Nixon 准备这期节目的时候回看了自己的印象笔记,发现一个事实:他真正需要的,从来不是某一篇完整的笔记,而是里面的一小坨、一小句话。

Notion:打破纸张逻辑的Block革命

这个发现恰好解释了 Notion 为什么能成功。
Nixon:Notion 是第一款把人在纸张上书写的习惯和电子书写习惯彻底割裂开的产品。人在纸张上写东西,某一页从头到尾,页和页之间有顺序,某页的内容不可能跳到前面去直接产生关联。但 Notion 有一个创造性的发现——人在电子世界没有必要遵循纸张世界的规则。
Notion 的核心创新是 Block(块)。一个块可以是一段话、一个表格、一张图片、一个看板,它可以挪动到任何位置,不同的块之间可以产生关联。
Ping:Block 和 Database 是 Notion 成功的两个非常重要的元素。
Nixon:人的思维本质就是那一瞬间的冲动,那一两个关键词。你的智慧是把一小块的东西串起来,形成你的知识、经验、智慧。而不是把一个有标题、有起承转合的完整笔记串起来——人脑不这么运作。
Notion 还有一个值得一提的动作:它是最早激进接入 ChatGPT 的笔记软件。
Thomas:Notion 应该是第一时间在 ChatGPT 出来的时候就非常激进地接入了。我们甚至认为它最开始接的模型是 GPT-3,不是 3.5。我用它的 summary 和生成能力,感觉比当时的 ChatGPT 稍微弱一点点。但在那个时间点,除了 ChatGPT 就是 Notion,所以它非常快地让用户体验到了 AI 的能力。
Ping 对此印象深刻,因为 Notion 让他第一次体验到了"上下文"的力量。
Ping:以前我们用 ChatGPT 聊天,每次都要跟 AI 讲非常多的背景,或者从其他地方复制很多东西过去。但 Notion 给我一个特别便利的体验——我直接在笔记下面让它去总结,或者基于这个内容去续写,或者做一些方案让它帮我扩散。它不仅仅是聊天了,而是真正跟我的工作文档结合起来。
Nixon:这玩意在 2024 年叫做 RAG,在 2025 年我们叫做上下文感知。

幕布与Flomo:从大纲思维到无压记录

Notion 之后,笔记软件继续分化。一个方向是大纲笔记,国内最有代表性的产品叫幕布。(幕布大约在 2020 年前后被字节跳动收购,2023 年又被卖给了 Flomo。)
Nixon:幕布洞察到了另一种东西——人的思维可以碎片化到什么程度?你可以那句话不完整写出来,记个关键词就好了,然后把几个关键词的层级关系整理好就行。而且幕布有一个非常好的功能,就是收缩和展开——你列了 10 个事情的清单,可以只看标题,也可以把 10 个清单全部打开来看。
Thomas 把幕布当成了一个快速思维导图工具。
Thomas:我一直用幕布的方式就是当我需要一个快速的思维导图,我可以在任何电脑上登录 Web 端,一行一行地写,然后上下拖动一下,最后就会形成一个很有结构性的脑图。有的时候我甚至不会导出来,就截个图丢到一个对话或者某一个 PPT 里面去。
Ping:幕布更像是一种思考工具。我们经常思考问题的时候,从 1、2、3 点一个个列,不需要在乎结构,不需要在乎排版,更多是把想法列出来,然后看全局是什么样的情况。这个过程压力会小很多。
幕布后来被 Flomo 收购了。Flomo 大约 2020 年开始做,走的是另一个方向——极简。
Nixon:Flomo 的核心就是打开软件,把你当下的想法写出来。一开始连笔记本、文件夹这种概念都没有。它很好地满足了人在微信里给"文件传输助手"发东西的需求。
Nixon 认为 Flomo 成功不只是因为简单。
Nixon:Flomo 做了两个功能。一个叫热力图,你可以看到过去一段时间里哪天记录了多少,颜色越深说明那天想法越多。第二个叫推送回顾,类似相册里的"那年今日"——你曾经有过一个什么样的 idea,它定期推送给你。这给了很多人一种回顾自己思想的满足感。
Ping 在这里做了一个过渡。
Ping:确实 Flomo 解决了一个很大的需求。以前大家记笔记都是很一本正经地要记下什么东西,但随着技术发展,大家发现这样做很累。每个人的想法都是临时发生的,所以现在的方向是对的——不再一本正经地非要坐在电脑上面记录,而是随时随地把想法记下来。随着 AI 能力的扩充,通过语音可以更方便地记录了,不需要每次都打字。而且记录了非常多的东西之后,AI 也会更懂你,这可能会带来一个新的变化。

Obsidian:双向链接的理想与现实

从 2019 年开始,笔记圈出现了一个新物种——以 Obsidian 为代表的双向链接笔记。被一些人认为能实现"知识复利"。
Nixon:不知道大家有没有遇到过这样的问题——当你要回顾关于某一个话题的笔记时,你要在笔记软件里搜索某一个关键字,把相关的所有笔记全都看一遍,才能把它们串联起来。双向链接笔记核心就是解决这个问题:你今天这句话记在哪个文件夹里、哪个笔记本里,无所谓,你只要用了同一个关键词,输入之后就能看到关于这个关键词的所有东西。它很像知识图谱的网状结构。
Nixon:有一个很老的说法——知识和事实连在一起,才能形成经验和智慧。双向链接笔记就能让你围绕同一个关键词、同一个主题一下子产生若干连接。
但 Ping 对 Obsidian 有不同看法。
Ping:Obsidian 是一个非常专业的笔记软件,非常小众。它的双向链接逻辑需要人花很多时间整理。我回忆起自己的 Evernote,有几千条笔记,一开始会设置各种文件夹和标签,但当超过 1000 条笔记的时候,我从来不关心是在哪个文件夹和标签了,因为你已经没有这个能力去做这件事情了。
Ping:Obsidian 用双向链接的方式,觉得可以让关联变得更简单,但实际上它的门槛极高。我打开 Obsidian 的时候,说实话,我这个做了这么多年笔记的人都不知道从哪下口。很多用户都不知道如何使用。所以它会成为一部分笔记发烧友的好工具,但也把普通用户拒之门外了。
Thomas 用相册做了一个类比。
Thomas:过去我们用数码相机拍照,要拷到电脑里,然后在电脑里整理——用旅行做文件夹,或者按时间排,或者用地理位置做标签。但手机流行之后,iCloud 里可能有几万张照片。在两三万张的规模下,人力已经不可为之了。我现在的管理上限就是在飞机上打开相册,删掉一些废片截图。而今天大部分手机厂商的相册软件已经提供了非常强的检索能力,你甚至可以搜"一只狗在海边奔跑"或者"牛排"。相册的整理变得没那么重要了,笔记可能是类似的情况。
Ping 认同这个判断。
Ping:我们的语音记录特别方便,用户没用多久就已经上千条笔记了。有两类用户:一类还是传统的笔记逻辑,tag 和文件夹分得非常清晰;另一类就是我自己——从来不整理,全部交给 AI 处理。AI 去打标签,AI 去做检索。我相信很快无论是我们的产品还是 AI 的能力,这些事情都会变得非常简单,不需要人力去操作了。

第二部分:AI重塑记录——Whisper时刻与"上下文"革命

从讯飞到Whisper:语音转录的质变

AI 对笔记软件的改变,第一步发生在录入端——语音转文字。
Nixon 五六年前是讯飞和搜狗语音转文字服务的付费用户。
Nixon:我是真正经地花钱买科大讯飞和搜狗的语音转文字服务的,买时长。但今天我再回看当时的笔记,已经看不懂当时在说什么了。虽然各家语音转录都吹着说准确率百分之九十八九十九,但真实世界里它的准确率就是六七十。一段话可能有百分之三十的字你回去看的时候已经恢复不了了,你不知道当时那句话说的是啥。没办法,只能把录音重新听一遍。
Ping 回忆了更原始的解决方案。
Ping:我在爱范儿的时候,开了一些比较重要的会,我们的方法是去淘宝花几百块钱找别人帮我们听写一段文字出来,直接人工听写。因为有些会议比较重要,要做纪要,但只有录音。
Thomas 想起了一个更古老的职业——速记员。
Thomas:几年前、十年前,所有的媒体专访在现场一定会有一个叫速记员的人。他们用一个非常特别的键盘,大概只有几十个键,不是我们现在的 QWERTY 键盘。通常是一个当打之年的年轻人,采访开始的时候手就上下翻飞,噼里啪啦。会议结束的同时,他就给你一个速记稿。但里面其实跟语音识别很像——科技类专访很多词他听不懂,记下来的也是乱七八糟的,你还要拿来再处理一遍。这个事情可能也就是十年左右,我现在不知道这个行业还在不在。
真正的转折点是 OpenAI 的 Whisper。
Nixon:OpenAI 在 2022 年 9 月——这个时间点还没有 ChatGPT——就做了一个成果叫 Whisper。大概用了 68 万个小时的素材来做语音转录,核心创新是用 Transformer 架构来做语音转写,而且把模型权重和代码开源出来了。我觉得这个成果在 ChatGPT 之前,OpenAI 就已经对整个行业有着巨大影响力。
Ping:确实是一个巨大的变化。以前中国可能讯飞的语音技术是最厉害的,但这几年因为 AI 的发展,整个语音转写能力的 gap 已经消失了,大家都能做到一个非常好的水准。
Thomas:从速记员到个人工具,我们大概只花了几年时间,实现了一个更高效、更厉害的解决方案。这个想想也是很神奇的。

AI带来的根本变化:机器开始"听懂"你在说什么

语音转文字只是第一步。Ping 认为更大的变化在于:机器第一次开始理解你在说什么。
Ping:从石刻、纸笔、鹅毛笔,再到 Evernote、Notion,记录这件事从来没有发生过本质变化——它都是帮我们记一件事情。纸笔变成本子,本子带走了,不记得了翻到哪一页找一找。用 Notion 或 Evernote 记也一样,只不过不用带几本子了,带一个手机,搜索一下就出来了。
Ping:但这里面有一个东西从来没变——机器从来不知道你在说什么。
Ping:现在有个巨大的变化——我跟闪念贝壳或者跟 ChatGPT 讲的语音之后,它可以回答我,它开始知道我在说什么了。这个时候发生了一个巨大的变化:你的记录不再只是记录本身,你可以跟它讨论了。比如我跟 AI 讲了一段我今天的心情,我可以继续跟它讨论怎么调整心情。这在以前是完全想不到的。
Ping 提到了几个在这个方向上探索的产品:Rewind(后来做了硬件 Limitless,已被 Meta 收购)通过录屏记录一切;Dot(被 OpenAI 投资,2025 年 10 月停运)试图通过聊天了解你、记忆你。
Ping:在 AI 时代的一个巨大变化就是大家不仅仅想要记了,还希望记的东西能跟 AI 一起来帮助我,更有意义、更有价值。这也是今年大家提到的"上下文"这件事情。我觉得这会成为未来笔记的一个新的思路和切入点,跟传统笔记的角度完全不一样。

从"检索"到"对话":AI笔记的颠覆性区别

Thomas 试图定义 AI 笔记和传统笔记的根本区别。
Thomas:过去不管是记在石板上、竹简上,还是记在 OneNote、Evernote 里面,你写的字是什么,它就是什么。不会被篡改,也不会有任何改变。好处当然就是它完全反映真实。缺点就是当信息变成海量的时候,你要如何去检索和使用?
Thomas 举了一个具体的例子。
Thomas:我们开一场会 3 个小时,即便记录下来的是文字,你要直接在里面找到关键信息,仍然是一件非常麻烦的事情。最早是要听录音,那就更可怕了。今天你可以看文字,可你仍然要从大量文字里面找关键信息。但 AI 带来的好处是——我可以用跟 AI 交互的方式来获得这些信息,而不是找到信息的原文。
Thomas:这可能是今天 AI 笔记区别于过去笔记最核心的区别。之前所有笔记无非就是换一种媒介形态、换一种物理存在的方式。而今天的笔记从物理上就不一样了——它给你的东西是一个经过处理的、AI 参与的、优化过的结果。
Nixon 从中提炼出两个关键的设计目标。
Nixon:今天要做 AI 笔记,很重要的两个点:第一,要提供人和信息的互动方式,这个互动借助 AI,chatbot 算是一种互动。第二,你借由笔记的形态,其实是把上下文喂给了 AI。所以今天的笔记如果要做的话,很重要的设计逻辑就是——你要怎么样尽可能快捷地、方便地把你的上下文喂给 AI。
---

第三部分:产品解析——闪念贝壳、Notebook LM与记忆硬件

闪念贝壳的设计哲学:为什么不做实时字幕?为什么模板指向行动?

Nixon:你刚才提到用户和信息在录音时候的交互很重要,比如插张图进来就是一种交互。但为什么没有考虑让录音的时候做实时转写?我身边确实有人有这么个用法——开会又需要走神的时候,把字幕打开,有人 cue 到他的时候,他就可以马上去看最近发生了什么。
Ping 的回答出乎意料——他们内部其实做过实时字幕,但最终砍掉了。
Ping:我们在移动端希望用户回归到记录本身。我们内部是有一个版本是有实时字幕的,但后来发现这件事情不好。为什么呢?如果有了实时字幕,大家会盯着内容看,如果有错别字或者符号不对的时候,大家会分神。用户在说自己的想法或者记录的时候产生了干扰,导致思考变得不那么 focus,所以当时把这个去掉了。
不过 Ping 补充说,PC 端的逻辑会不一样。
Ping:我们在 Web 版本会把实时字幕放出来。为什么在 PC 上会放?因为 PC 开会的时候大部分人会打开电脑,一个角度是我可能没听到哪个东西,有人 cue 的时候马上回翻一下,甚至可以加一个 AI 一句话帮我总结一下。另一个角度就是边看着文字边打字做记录,更符合电脑的操作方式。
Thomas:我现在在用豆包输入法,就很典型。你在说每一句话的时候,它会实时转写,但当你说完之后它会重新组织一次。第一遍多半是不准的,但第二遍几乎能变到让你觉得很满意的状态。我觉得转写的笔记软件也可以考虑这个方向——成本是在下降的,甚至未来在端侧有一个小模型也能解决类似的问题。
Ping 从技术角度做了补充。
Ping:技术确实会像 Thomas 讲的这样。第一,实时语音转写现在没有离线转写得更准确,但我相信会被解决。第二,成本确实比离线转写要高。这两个问题是客观存在的。
Nixon 接着抛出第二个问题——为什么录音结束后,默认只显示一句话总结,而不是自动展开完整的会议纪要?
Nixon:既然用这个东西的目的是为了录音然后生成总结,为什么默认进去的界面只有一句话总结?如果我要看到更完整的总结,为什么要再点一下?为什么它不是自动的?
Ping:这个原因主要在于我们的用户现在还是比较泛的。有人用它记日记,有人用它记会议。如果用一个通用的会议纪要总结,会导致用户觉得不准、不符合自己的要求。所以我们把这个复杂的东西让他需要点击第二步进入到总结里面去看,看的是一个泛用的通用总结,并且上面还有一个按钮让他去生成自己想要的。当他有了自己的习惯之后,默认的总结会出现在卡片下方,点一下就可以搞定了。
Nixon 进一步追问:闪念贝壳和其他语音笔记软件的核心差异到底是什么?Ping 的回答揭示了这款产品更深层的野心。
Ping:我们从来没有把自己定义成一个笔记软件。为什么会定义成笔记软件?因为在现阶段,讲"记忆"这件事情,"笔记"是用户最好理解的,所以我们把它定义成了 AI 语音笔记。语音会代替传统的文字输入,成为所有软件的输入方式,我们只是做得比较早而已。但这些产品去做语音之后,产品本质其实没有发生变化。
Ping:我们在小红书、官网一直提到的就是——我们想做的事情是你的记忆外挂和思维引擎。比如 Notion 也好,大家把东西记录完了就结束了,或者做一个总结就结束了。但我们生成闪卡、生成 Todo——比如春节的时候有一个用户,他通过录音把家里人吵架录下来了,我们有说话人识别,然后他就把说话人识别后的内容在 AI 里讨论谁对谁错、怎么去解决。这是以前的笔记软件 100% 不可能做的事情。
Ping 进一步阐述了闪念贝壳在输入方式和结果导向上的差异化思路。
Ping:我们更多的是让用户无感地去记,语音只是其中的手段之一。我们后面也会把会话做进去,也会把拍照、录像都做进去,等到这些技术成熟的时候都会加进去。第二个就是在结果上面,我并不在乎用户记的每一条内容。我们现在的首页是 feeds 各种记录,但我们认为笔记未来的首页绝对不是 feeds,而是这个记录产生的价值和结果。
Ping 举了一个即将上线的功能作为例子。
Ping:比如我们即将做的 Ask AI——你用最自然的语言来问你之前记了什么。甚至你扔了一个文件到闪念贝壳,可能是某一个保险单、一个车险的保单,然后你直接问"我之前什么时候扔了一个什么文件进来,你帮我找一下",它直接把你这个保单找出来。所以这个东西会成为你一个数字花园,无论是你的声音、文字、画的东西还是文件,都成为你记忆外挂的一部分。
Nixon 拿 Plaud 做了一个对比,点出了闪念贝壳模板设计的核心差异。
Nixon:比如 Plaud 的总结模板,它的核心 target 是"我为了更精准地知道你们在说什么"。但闪念贝壳里面的模板有非常大的差异——比如"形成一个项目提案",它的意思并不是把这段话按照项目提案来总结,而是说我听了这段录音之后,理解所有意思,generate 一个项目提案出来。还有一个模板叫"抖音视频脚本",很多自媒体工作者聊完一个小时,他要的不是这一个小时的总结,而是把里面能形成脚本的东西拎出来,generate 一个抖音视频脚本给我。
Nixon:所以闪念贝壳所有的模板设定里面,其实都是很呼之欲出地想让人去做下一步的事情,并不是只局限于把你的东西 summary 好。
Ping 对此做了进一步解释。
Ping:没错。Summary 只是一种让自己安心的形态,觉得我大概知道什么东西。但如果是我聊过的,大部分情况不需要直接的 summary,而我生成的内容相当程度是交给下一步去做什么的。比如思考的部分,我们会更直接地让 AI 跟内容直接聊天——我讲了一段内容,"你觉得我这个东西讲得靠不靠谱?"AI 可以直接聊天,而不需要先生成一个内容再让我读,那就回归到传统的思考逻辑了。

基座模型策略:做容器而非做引擎

Thomas:听起来我们会用到更多的 AI 生成的能力去生成更多的内容,我们采用的是什么样的基座模型?做了哪些优化?
Ping 的回答很坦诚。
Ping:我们用的就是通用的基座模型。国内用的是豆包、千问之类的,海外之前主要用 OpenAI,最近换成了 Gemini。我们没有做任何模型的调整。主要原因在于,我们想做的是一套系统、一个容器——就像我在设计一辆车,这个车跑得多快、跑得好不好,不是由车的细节决定的,而是由发动机决定的。但发动机是一直不断在变化的。
Ping 举了一个具体的例子来说明这个策略的合理性。
Ping:比如我们最开始的版本,半个小时、一个小时的上下文就会出问题,总结或对话会出现问题。当时我们有想去解决,但没有解决,原因是如果花非常多的成本去解决,但模型肯定能解决——现在模型就解决了这种问题。所以我们搭建一套系统、一个容器,让你的上下文跟 AI 更好地交流、更好地融在一起工作。
Thomas 对这个回答表示认同,并用自己的亲身经历做了延伸。
Thomas:这个答案我是满意的。我们其实更希望用到的产品是永远接入最新最强模型的产品。今天这个时代,即便是中国的模型六小龙这个级别,拿出来的模型水准跟行业一流仍然有 6 到 12 个月以上的差距。
Thomas 用理想汽车的 AI 眼镜举了一个反面案例。
Thomas:我之前买了理想的 Livis 眼镜,硬件设计我都挺满意的,包括跟蔡司的合作,响应速度都很好。唯一让我最后放弃这个产品的核心原因就是它用的是自研模型 Mind GPT,当我发现它的自研模型跟当下主流头部模型的差距已经让我无法接受的时候,我只能放弃这个产品了。它的硬件框架搭得很完整,但这是最大的遗憾。
Thomas:所以回到我的问题,如果我们的产品能持续接入最新的模型,就意味着我们持续能拿到最优的 AI 体验。为什么我要在闪念贝壳里跟它交互获得内容,而不是找我最熟悉的 Gemini 3.0 或者 GPT 5.2?必须有一个非常强大的理由——就是你们用的是一样的东西,我就不需要再把文字搬出来 copy 到我的 chatbot 里面去了。
Ping 补充了一个重要的设计理念。
Ping:我们针对整个容器的设计也特别注意——现在模型的进步真的非常大,反而很多产品自己的一些独特设计限制了模型的能力。我们很多的产品设计理念都是把 AI 当做一个人,而不是当做一个传统的技术去做。

记忆软硬件盘点:Limitless、Bee、Dot的路线之争

话题自然地转向了"记忆"这个关键词。Nixon 开始盘点市面上几款主打记忆功能的产品。
Nixon:记忆是不管对模型厂商还是消费者来说都具有巨大价值的东西。我们刚才点到几个产品,可以详细聊一聊。比如 Limitless,它的前身叫 Rewind,是一个安装在苹果电脑上的截屏软件,能够持续截屏,按照它宣称的几千倍压缩形成模型的记忆,然后就可以去问。这家公司现在被 Meta 收购了。
Nixon:亚马逊最近还收购了一家类似的公司叫 Bee,就小蜜蜂的那个 Bee。它跟闪念贝壳一样都有手表客户端,也有手环形态,鼓励用户全天都开着录音,然后给你 Insights——你今天获得了哪些 fact?有哪些 Insights?推荐你有哪些 Todo。
Nixon:还有一个产品叫 Dot,被 OpenAI 投资但关掉了,非常可惜。这个产品我用的时候感觉非常神奇——它读了我的日历之后,每天早上以及在日历接近半小时以前,会主动问你"接下来半小时你要去见谁了?你有什么关于哪方面的信息需不需要我帮你查一下?"它提供了一种类似助理、甚至有点像绩效教练的东西。
Ping:这个问题很有意思。Rewind 包括后面做的 Limitless,其实是一种被动记录——通过录屏,当时成立的原因是苹果发布了 M 系列芯片,本地算力非常厉害,加上他们有个超级厉害的压缩算法。后来微软也抄了一个叫 Recall。Bee 其实也是被动记录。但 Dot 不同——它是希望通过与人的交流、聊天过程中不断地去了解你、记忆你。从记忆的角度,大家的思路就很不一样了。
Ping 分享了他对记忆产品发展阶段的判断。
Ping:我觉得记忆是分阶段的。在现有阶段,主动记忆可能还是更好的方式。无论是 Limitless 的续航还是 Bee 的转写效果,其实都比较差。在用户隐私层面,接受程度可能也有点难。所以针对 AI 的处理能力和当前用户现状,主动记忆会更好一些。Dot 的形式是希望通过聊天来记忆,但我们很难为了记住自己的记忆,天天逼自己跟一个 AI 聊天,这个感觉非常难。
Ping:最终的形态应该是无感的、被动的记忆。但这里面要解决很多问题——第一是隐私问题,第二是有没有什么设备能够让大家更多地去记录。我自己觉得未来可能会分散,不一定是一个设备去记录。手机是输入输出设备,眼镜有摄像头或光波导,也有人做戒指、做挂坠、做摄像头。这些内容可能会越来越分散,未来的记忆应该不是被一家完全记录下来的,而是非常多东西组合的——可能有你的健康、你的对话、你的饮食情况等等。

硬件vs手机:独立录音设备还有必要吗?

Thomas 分享了自己使用各种录音设备的真实体验,引发了一场关于"独立硬件是否还有必要"的讨论。
Thomas:我自己过去一年用 AI 来做语音记录这件事情,用了很多设备。我有 Plaud,甚至有两个形态的 Plaud,还有 Loki(一个戴在胸口的定时录制视频的小相机),手机里录音软件不下 5 个。但每当我需要录制的时候,下意识会掏出什么东西来录?这其实是一个蛮有说服力的用户洞察。
Thomas 分享了他使用 Plaud 的真实痛点。
Thomas:如果我知道今天有一个很重要的会议,我会提前把 Plaud 充好电带过去,在现场按下录制键,会议结束前停止,然后总结。这套工作流我用了蛮长一段时间。但后面我发现经常会有临时的会议,但它也很重要——这个时候你发现 Plaud 没电了,或者你真的忘记带了。因为它是个项链,你要带、要充电,而这个设备没有到跟手机一样重要的时候,常常这两点无法兼顾。你只要没有兼顾,你就用不了它。
Thomas:后来我开始用闪念贝壳,就会下意识主动用它来记。然后就发现,Plaud 或者说硬件形态专门 for 录制这件事情好像又没有那么必要了。今天的手机也有两到四个不同的麦克风,也有指向麦克风,手机厂商也在向 AI 转型,在收音能力上也在提升。手机的电池也在不断变大,录上一两个小时没有任何压力。那为什么我还要拿一个第三方的硬件来录?
Thomas 对未来做了一个大胆的预测。
Thomas:可能三个月前问我,我会觉得独立设备、AI 硬件非常 make sense。但现在我又打一个问号了——它可能是一个不断回归的过程,就像历史一样,分久必合,合久必分。刚才 Ping 说终局会是录音数据分散在各地,但我觉得有可能不会,它有可能变成高度集中的结果,也许就是在你手机的某一个 APP 里面,甚至是手机的笔记里面。
Thomas:但如果再把终局想远一点,我认为 AI 可穿戴是一个明确的趋势,它一定会发生。当这个设备到了我必须带着它走、必须充满电的时候,它取代手机成为录音的最重要部件,我觉得仍然是成立的。不管是项链还是眼镜、耳机,它离我们输入输出接口的距离都更近,而手机可能揣在兜里,被掏出来的机会因为这些设备变得越来越少了。
Ping 对此表示认同。
Ping:我非常同意这种方式。我们为什么没有想一定要做一个类似 Plaud 这样的硬件?因为当你真的需要录音的时候,最快的方式就是拿手上的东西马上就能录。我们在手机上做了非常多的 widget、Action Button,做了八种方式让用户快速按一下就可以录音。在手表上我们做了 Apple Watch,甚至我们做了蓝牙选择——当你戴上华为眼镜的时候,选择华为眼镜为你的输出端,闪念贝壳就是通过你的眼镜录的。
Thomas:那这个还蛮重要的,相当于你就兼容了很多所谓的 AI 硬件了。
Ping:没错。我们也同样认为录音的介质和硬件其实不那么重要,它在不同的阶段可能都会有不同的形态。但最最重要的是它能够把东西记录下来,这是最最重要的。
---

第四部分:AI笔记用法大赏与用户洞察

闪念贝壳的"非典型"用户:养牛、吵架、看病都能用

Ping:我们的用户现在非常泛。比如刚刚提到的用户吵架的记录,还有一个特别有意思的——我们有个用户他是养牛的,在德国,他就记录自己牛的情况,比如今天给牛买了什么东西、牛大概什么情况。最近他还跟我们说要不要帮他们做一个记账的功能。
Ping:还有一个是英国的大妈,她当时买了我们的年会员,后来发现我们有终身会员,赶紧找我们来买。她最多的场景是在车上——开车的时候非常不方便打字,所以很多情景都是发生在车上,记录下来之后再去处理关于她小孩的各种东西。这是非常无感的、无打字的记录方式。
Nixon 也分享了他身边的一个案例。
Nixon:我一个同事为什么最后买了你们的会员?很重要的是他的家里人去医院,他跟着家里人去医院,发现医生说话就跟烫嘴一样,说得特别快,他记不住,所以就用这个东西。以往你很难想象一个病人在听医嘱的时候掏出手机说"医生,我记录一下"——我们国家的医生资源,一个医生给一个病人就 6 分钟,你哪有时间打字记录医嘱?
Ping 还分享了一个学习场景的用法。
Ping:前段时间有一群人特别喜欢用我们来背书。他们要备考,把书一个一个知识点背,比如这个知识点不到 10 分钟,读出来,再接着追加笔记,读完之后生成闪卡 Quiz 来练习,然后重复听。最近他想让我们加一个循环的功能,就是从第一个听到最后一个不断听自己的声音,不断复习。
Thomas:这个确实是一个学习神器。对于有考试的学生群体来讲,用来复习,我想象一下都觉得我们当年学习的时候要是有这个东西就好了,那个时候光是背书就可费劲了。
Ping:还有一个很有意思的,他是盒马鲜生的销售。销售经常出去,很少在办公室伏案,所以他会记录很多自己销售的情况或总结,因为可能还要写周报等等。
Ping 总结了他对用户使用方式的建议。
Ping:如果安利这个产品,我更多的角度是说大家可能要放弃以前对于笔记的执念——不是"我一定想好了什么东西要把它记下来",而是随时随地想到什么东西都记下来。你想象一下,如果五年前你把任何的想法都记到一个东西里面,现在 AI 能力这么强,那你的价值真的是非常非常大。

效率工具推荐:Todo!、闪念说、YourMind

Nixon 安利了一个他最近发现的效率工具。
Nixon:我今天安利一个跟个人效率相关的 APP,叫做 Todo!(T-O-D-O 加一个感叹号)。这个软件是一个很好的记待办、管理日程的软件。它比较亮眼的 feature 是截一张图丢给它——比如有人在微信上约你明天下午几点到哪个地方去吃饭,截一张图丢给它,它就自动把这个东西添加在你的日历上了。
Thomas 推荐了一个 PC 端的语音输入工具。
Thomas:我想给大家推荐一个 PC 端的输入法,叫闪念说。它首先会转写你说的所有文字,把语音转变成文字,但这个文字可以被再优化一次。第一次它会下载一个端侧的模型在端侧完成转写,第二次如果你希望它帮你优化,它会上云。我最喜欢的地方在于这个模型你是可以自己选择的——你可以在软件设置里面放你自己的 API、你自己的 Key,然后选择你想选的那个大模型来帮你做转写。
Thomas 分享了他的工作流。
Thomas:我还是会把这些话再丢到一个我熟悉的大模型里面,让它再结构化一次,把错别字、口癖去掉,变成一个更可读的内容。然后第三次用它生成一个东西——要么是图片,要么是 PPT,要么是 PDF。这是一个比较流畅的、整个基于语音来完成的工作流。
Nixon 最后安利了一个学习和创作一体化的工具。
Nixon:最近几天才开始发现比较厉害的叫 YourMind,是原来阿里语雀的一个核心成员玉伯出来创业做的项目。它一部分功能跟 Notebook LM 有点相似,帮你读各种文件。但它还多了后半段——如果你读了这个东西之后想生成一些模板化的流程,或者生成一些脚本之类的东西,它能帮你把素材收集起来,做一个智能任务流,帮你把脚本、论文提纲甚至论文片段给搞出来。
Nixon:它还提供了版本回溯的功能。总体来说就是一个新形态的文档和笔记的概念,比较适合你要产出一些东西的时候用——不管你是学生要写作业、写论文,还是内容创作者要写脚本,都挺适合用 YourMind。
---

第五部分:未来展望——记忆外挂与差异性放大

记忆的生态化价值:从靴子放在哪到心理咨询

Nixon:我觉得今天我们在用的这些笔记软件,严格意义上还没有很彻底地把记忆功能发挥到极致。未来这个记忆应该有很强的上下文能力,AI 的角色应该从原来只是生成文本或搜索的助理,变成一个有机会给你提供真正重要建议的角色。记忆里面包含了非常多的隐含信息,也包含了一个人的很多隐含需求。
Nixon 举了一个他在飞机上亲眼看到的例子。
Nixon:我原来在跨国航班上见到有人花几十美金买飞机上的 Wifi,就是要利用在飞机上的时间跟 ChatGPT 回顾自己的家庭——输入自己家里面的生辰八字、现在遇到什么问题,然后分析他的家庭。以往在物理世界里,这是一个人花几百上千块钱去算命的事情。但以后这种服务是不是应该软件来给人提供?我觉得记忆会是一个非常重要的基座能力。
Ping 从产品角度回应了记忆的生态化价值。
Ping:记忆的第一步是把更多的上下文摄入进来,但它的价值在于使用。我们会做的一个功能是——你今天用 Gemini,明天用 ChatGPT,但你没有办法在这些 AI 产品里面获取你的上下文。我们会去做 ChatGPT APP,你 at 闪念贝壳,说"我上周什么什么什么",然后基于这个东西再跟 AI 讨论,其实就有了上下文,可以更好地跟 ChatGPT 聊天。
Ping 用心理咨询的场景做了进一步说明。
Ping:比如心理医生,我现在真的要跟一个心理医生聊,自己真的是半天都聊不清楚。但如果有了 AI 的记录,我只要一键授权我的记录就好了。人的表达是很难的,我很难在半个小时、一个小时来讲清楚我是什么样的情况。所以这是一个巨大的变化——在使用上面它应该是一个生态化的,而不是只是一个软件独特的角度。
Thomas:我希望尽快能够有一个真的被动记录我所有语音和图像的设备出现。它不需要 24 小时,就我整个白天把该记的东西帮我记下来就好。因为我不算一个记忆力特别好的人,我经常会忘记一些刚认识朋友的名字,很尴尬的——大家打着招呼,然后你只能假装还记得,在蛛丝马迹中找到他到底叫什么。你知道他是谁,你知道他是干什么的,但你就忘了他叫什么名字。
Thomas 提到了苹果在 iPhone 16 发布时上线过的一支广告片,那支广告完美还原了他的期待。
Thomas:广告里一个小女孩有一个熟人从远处走过来,她完全不记得他是谁了,然后她快速拿起手机问 Siri——我一个月前在哪见过的这个人是谁?因为她记得那个场景,但记不得名字了。然后 Siri 调取她的日历,找到了那个 meeting with 谁,把名字告诉她。她就在那个人走过来的时候非常热情地打招呼。这个功能我非常需要,但苹果几个月之后把那个广告下架了,直到今天他们也没有实现。
Nixon 补充说,这种记忆调用的需求其实无处不在——在笔记里搜、在微信聊天记录里搜关键词、在飞书里往上翻找某天跟谁见过面,大家都做过类似的事情。
Ping 顺势追问了隐私问题。Thomas 的回答很坦率。
Thomas:如果它给我的体验足够好,隐私背书足够好——比如说它是苹果,是一个声誉非常好的大公司——我认为作为一个普通人不用太担心隐私出问题。仅代表个人观点,我本人愿意让渡一部分隐私去换取更大的便利和更好的体验。我身边有很多朋友至今不用 iCloud,不开任何云盘,所有照片、所有内容全部本地离线保存。但我觉得大的科技趋势不会以少数人的喜好做改变。
Thomas:隐私权是一个文化概念,不是所谓天赋人权,它是一个不断在变化的权利。
Nixon 接过话头,提到上一期节目正好讨论了 AI 语音落地带来的隐私观念变化。现在身边很多朋友开会时开录音,只要聊的内容有启发,大家反而会主动要求对方把录音纪要发过来。线上开会默认录制,已经是一个挺普遍的选项了。
Ping:我也同意这种看法。随着技术的变化、管理的规范以及大家认知的变化,我觉得这件事情未来不会有太多人在谈论。

学习、记录、创作三合一

Nixon 把话题拉回展望。他问大家觉得 2026 年还会有哪些变化。Thomas 觉得其实这期节目已经展望得差不多了,但他提炼了一个核心判断。
Thomas:AI 就是在把三件事整合在一起。过去学习是独立的部分,记录又是独立的部分,然后创作又是独立的部分。但是今天我觉得学习、记录、创作它们被合三为一了——在同一个场景下,我们既可以完成学习的过程,同时也做了记录,甚至还可以在上面完成创作。
Nixon:创作,或者指导你完成下一步,甚至是替你完成下一步。
Thomas:对,这会是未来一个很明确的趋势。

效率基准线之上,AI 应放大人的差异性

Ping 从另一个角度给出了他的展望,这段话也成了整期节目最有力的收尾。
Ping:无论什么时代的技术变革,它都带来了极大的效率提升,AI 也是。但效率的提升其实也带来了一些问题。以前人的智力是不一样的,每个人的想法、能力、文字能力都不一样。但因为有了 AI 之后,大家可能都会被拉到一个基准线——比如都变成了 80 分、90 分。这个时候如果每个人都用 AI,都用一样的工具,就可能存在一个问题:每个人都是一样的。
Ping:所以从这个角度来说,我会期待更多的工具——包括我们闪念贝壳——通过 AI 来拉开人的差距。在基准线之上提升人的差异性,而人的差异性更多的是来自于他自己的经验、自己的经历、自己的想法。
Ping 用创作举了一个例子。
Ping:讲创作这件事情,我觉得创作并非人人可为。我们现在看到非常多的 AI 工具一句话生成内容,在现阶段大家看着好像是创作,但过十年之后大家可能会觉得——天呐,你竟然会用键盘打字——一样简单,你会觉得这件事情非常荒谬。最终创作是因为每个人的差异性带来的变化,因为我对一个东西不同的认知、不同的理解、我的经历而产生了不一样的东西,我觉得这个才是创作。
Ping:所以回归到未来的角度,我更希望除了效率的提升,也有更多的工具来关注人本身,让人的差异性发生变化,让每一个人都不一样,让每个人产生的东西的差异性因为 AI 被放大,而不是因为效率而变得非常一致,变成了基准线。
Nixon:在效率上我们给人相同的工具,然后让人原本被效率束缚住的那些差异性——那些因为想法不同而产生的东西——更加体现在他们的行动上,体现在他们的人生决策和生活经历上。
Ping:没错,这个才能让每个人的差异都变化,这样才会更加多元。
Nixon:我觉得这段作为收尾很好。
---

结语

两个半小时的对话,从 Palm Pilot 聊到闪念贝壳,从 Evernote 的兴衰聊到 Notebook LM 的惊艳,从德国养牛大叔聊到心理咨询的授权场景。三个人围绕"AI 如何重塑笔记"这个命题,把过去二十年电子笔记的演化脉络、当下 AI 原生产品的设计取舍、以及未来记忆外挂的可能性都摊开聊了一遍。
如果要用一句话概括这期节目的核心观点,大概是 Ping 在最后说的那句——AI 应该放大人的差异性,而不是把所有人拉成同一条基准线。效率是手段,不是目的;记录是起点,不是终点。当 AI 帮你省下了整理、归纳、搜索的时间,真正重要的问题才浮出水面:你拿这些省下来的时间去做什么?
这个问题,笔记软件回答不了,只有你自己能回答。

人物:

  • Ping - 闪念贝壳创始人,曾是科技媒体“爱范儿”的 VP 与合伙人

  • 托马斯白 - “脑放电波”主播,消费电子营销人,科技媒体特约作者

  • Nixon - “脑放电波”主播,硬件产品经理,前媒体记者

本篇文章约1.6万字,是播客节目的文字版本,主播在不改变原意的前提下进行改写,也欢迎收听原始音频,获得更多信息

也欢迎来听友群交流