Claude
前段时间 OpenAI 发布的 Windows 版应用就是一个套壳软件(ChatGPT 发布 Windows 版应用),当时被我吐槽在 Windows 上偷工减料了,因为在 Mac 上是基于 Swift[1] 开发的原生应用。没想到这次 Claude 更是直接套壳所有平台,将“偷工减料”贯彻到底 😂。
下载地址:https://claude.ai/download
现在还可以通过 iPhone、iPad 或安卓向 Claude 应用口述消息。
📌 套壳证据我定位了一下 Claude 应用的安装目录,发现了 Electron 相关信息,所以是套壳无疑了。
照这个发展势头,Gemini 直接搞进 Chrome 还省了一个套壳。从这个角度看 Google 的优势还是大,Chrome 既是浏览器,又是 APP。搜索,AI 都不耽误...
目前都在发力应用层,感觉 AI 的下半场大概率是
APP + System (OS)
,有了操作系统的加持,大概率会演化为 Agent(在客户端执行任务或工作流)。
ChatGPT
记录搜索
ChatGPT 网页端新增聊天记录搜索功能,用户可快速查找和继续先前的对话。Plus 和团队用户已经可用,企业和教育用户在近一周内开放,免费用户将在下个月内陆续获得。
桌面语音
我之前就介绍过该功能(实测 ChatGPT 高级语音,有惊喜但不多),目前 OpenAI 已在 macOS 和 Windows 桌面应用中推出了高级语音模式(Advanced Voice Mode,简称 AVM)。AVM 利用 OpenAI 最先进的 GPT-4o 模型,允许用户与 ChatGPT 进行类似真人对话的交流,包括打断、停顿等自然语言行为,使对话更加流畅和自然。
网页搜索
目前 ChatGPT 已推出全新搜索功能,为用户带来更高效、更精准的信息获取体验(这个描述来自原文 Introducing ChatGPT search[2],感觉有点过分自夸了)。通过与网络搜索结合,ChatGPT 不仅能快速提供答案,还会附上相关网页来源链接,让用户在对话中就能获得包括最新体育比分、新闻和股市行情等及时信息。用户可在 chatgpt.com
网站、桌面和移动应用上使用该功能,目前已向 ChatGPT Plus、团队用户以及 SearchGPT 等候名单用户开放,未来几周内将覆盖企业和教育用户,随后逐步向免费用户推广。
此次升级,ChatGPT 能根据用户需求自动选择是否进行网络搜索,或由用户手动触发搜索。与传统搜索相比,ChatGPT 搜索整合了多方信息,减少了繁琐的多次搜索和筛选过程。用户可以通过对话式提问,深入探索答案,ChatGPT 也会结合上下文提供更精准的信息。
OpenAI 表示,他们与新闻及数据提供商深度合作,确保提供权威、最新的内容,并在天气、体育、股票等领域引入了全新的视觉设计(这也论证了之前为啥 OpenAI 要合作大量媒体,相关阅读 OpenAI 在收购合作之余,也不忘了封杀一波 API,OpenAI 生态布局:GPT-4o 免费或许只是一个开始...)。Vox Media、世界报和 Axel Springer 等媒体高层均表示,与 OpenAI 的合作不仅扩展了优质内容的受众范围,还为新闻行业带来了新的商业机遇。用户可点击回答中的来源链接直接访问新闻、博客等信息源。
ChatGPT 的搜索模型基于 GPT-4o 的微调版本(Canvas 其实也是基于 4o 的微调版,看来 4o 模型的多模态能力确实很强。了解更多 ChatGPT Canvas:交互式对话编辑器,ChatGPT 全新升级:GPT-4o Mini 取代 GPT-3.5,免费、快速、更强大!,GPT-4o:OpenAI 发布最强人机交互模型),结合了新颖的合成数据生成技术,未来将继续优化搜索体验,特别是在购物和旅行等领域。同时,OpenAI 计划逐步将该功能扩展至高级语音、Canvas 应用,并开放给更多用户。
📣 媒体代表
Pam Wasserstein, President, Vox Media:“ChatGPT search promises to better highlight and attribute information from trustworthy news sources, benefiting audiences while expanding the reach of publishers like ourselves who produce premium journalism.”
Louis Dreyfus, CEO & Publisher of Le Monde:“We are convinced that AI search will be, in a near future and for the next generations, a primary way to access information, and partnering with OpenAI positions Le Monde at the forefront of this shift. It allows us to test innovations at an early stage while safeguarding journalism’s core values and integrity.”
Mathias Sanchez, SVP Global Strategic Partnerships Axel Springer SE:“As AI reshapes the media landscape, Axel Springer’s partnership with OpenAI opens up tremendous opportunities for innovative advancements. Together, we're driving new business models that ensure journalism remains both trustworthy and profitable.”
📌 体验感受我简单上手体验了一下,可能是因为使用中文的缘故,在检索问题时,经常会列出一些不知名的信息源(也不知道 ChatGPT 的具体匹配规则是什么)。这种搜索黑盒我不太能接受,感觉会将人带入新的信息茧房,远不如搜索引擎返回的结果全面。
该搜索模式一旦在 AI 中普及,未来大概率会出现针对 AI 的 SEO 优化(感觉与搜索引擎的竞价排名没啥本质区别)。
值得注意的是,很多朋友都是通过代理软件在访问 ChatGPT,如果直接询问,则会返回和代理地区相关的信息(就近原则,没啥毛病)。为了避免这种情况发生,可以在提问时增加特定地点(例如“上海的天气”、“上海的景点”)。这个问题很可能是无解的,所以大家需要探索一下适合自己的提问方式。
延伸阅读
套壳应用
应用套壳指的是将现有的 Web 应用(在线 URL)通过一个壳程序封装,使其成为一个独立的桌面或移动端应用。这种壳程序通常利用跨平台的框架,如 Electron[3]、Tauri[4]、Cordova[5] 等,将 Web 技术与原生应用的特性结合起来(赋予 web 网站许多在浏览器所不具备的能力,如系统通知、本地文件读写等)。
Web 技术核心:利用 HTML、CSS、JavaScript 构建应用的用户界面和逻辑。
壳程序封装:通过一个原生的容器(如 Electron),将 Web 应用封装,使其可以作为独立的应用运行。
系统功能扩展:壳程序提供访问系统资源的接口,如文件系统、通知、剪贴板等,增强应用的功能。
跨平台开发
我所理解的跨平台开发主要分为原生开发和 Web 开发:
原生开发:
多代码基:不同平台需要维护不同的代码,增加了开发和维护成本。
语言多样性:需要掌握多种编程语言和框架,如 Java/Kotlin(Android)、Objective-C/Swift(iOS)、C#(Windows)。
发布周期长:各平台的更新和发布流程不同,协调复杂。
Web 开发:
技术统一:HTML、CSS、JavaScript 是全球最广泛使用的前端技术。
生态丰富:有大量的开源库、框架和工具可以选择,支持快速开发(NPM[6] 上有数百万的开源库可供开发选择)。
快速迭代:Web 应用的更新可以即时生效,无需用户手动升级。
从以上技术特点来对比,其实不难发现套壳的优势:同时兼顾了可维护性、即时性、以及和操作系统的交互性。
Electron
既然聊到了套壳,Electron 大概率是绕不开的一个话题,因为它是目前最流行的 PC 端跨平台方案(著名案例:VS Code、Discord、Figma、Notion、Slack 等)。
Electron.js 的发展史充满了创新和突破,它为跨平台桌面应用开发铺平了道路,尤其在 Web 技术与桌面应用之间架起了桥梁。Electron 诞生于 GitHub 的内部项目 Atom[7] 的需求。2013 年,GitHub 工程师 zcbenz[8] 和团队在开发 Atom 编辑器时,遇到了需要构建一个跨平台的桌面应用的需求。然而,当时的解决方案并不多,团队便决定打造一种新工具,这就是 Electron 的前身——Atom Shell[9]。该项目的所有权在 2019 年转移到了 OpenJS 基金会(Electron joins the OpenJS Foundation[10])。
📌 Electron 技术架构
主进程(Main Process):负责应用的生命周期管理和系统交互。
渲染进程(Renderer Process):每个窗口对应一个渲染进程,负责界面渲染和用户交互。
IPC 通信:主进程和渲染进程之间通过 IPC 机制通信,协调操作。
初期发展:从 Atom Shell 到 Electron
Atom Shell 于 2014 年开源,不久后被重命名为 Electron,进一步开发为通用的跨平台框架。它利用了 Chromium[11] 和 Node.js[12],将 Web 技术引入桌面应用的世界。开发者可以通过 HTML、CSS 和 JavaScript,使用 Electron 构建桌面应用并在 Windows、macOS 和 Linux 上运行。这种方式极大简化了跨平台开发的复杂性,因为 Web 技术相对统一,开发人员不再需要为每种操作系统单独编写代码。
Electron 的开源发布迅速引起了开发者的关注。Electron 让开发者可以在不熟悉桌面应用开发的情况下,使用常见的 Web 技术构建功能强大的应用,降低了技术门槛。同时,Electron 的 API 设计易于调用和扩展,例如与文件系统交互、访问原生窗口和菜单等,这些能力对 Web 开发者来说是全新的体验。
崛起:主流应用的采用
在随后的几年里,越来越多的知名公司采用了 Electron 来开发他们的桌面应用,例如 Slack、Visual Studio Code、Discord、Figma、Notion 等。Electron 的强大,特别是 Microsoft Visual Studio Code (VS Code) 的成功,使其成为业界的标杆。VS Code 的性能优化和跨平台兼容性展示了 Electron 的潜力,并推动了开发者社区对 Electron 的广泛认可。
挑战:性能和资源占用
尽管 Electron 成功地简化了跨平台开发,但其在性能和内存占用方面的不足也逐渐显现。由于 Electron 的每个应用都需要嵌入一个完整的 Chromium 浏览器实例,这导致其在启动速度和内存消耗上比原生应用要大,尤其在低配置设备上尤为明显。面对这些挑战,Electron 社区和开发团队不断优化框架。例如,2019 年 Electron 开发团队引入了 ContextBridge API,以提升主进程与渲染进程之间的通信性能,减少不必要的开销。
此外,Electron 不断升级 Chromium 和 Node.js,以确保应用的安全性和兼容性,并加入了 Tree Shaking 和 Code Splitting 等功能来减小应用体积。
未来:集成与性能的平衡
今天,Electron 已成为桌面开发的重要框架之一,但它也面临着新的竞争和趋势。像 Tauri 和 Flutter[13] 等新兴框架,以更小的资源占用和更高效的开发流程为卖点,给 Electron 带来了压力。Electron 的未来将可能更加注重与操作系统的深度集成和性能优化,以提升用户体验。
总结来看,Electron 的发展从解决内部需求到开源、被广泛采用,再到不断优化性能和功能,已成就了一个强大且灵活的跨平台开发工具。对于熟悉 Web 开发技术的开发者来说,Electron 仍是构建桌面应用的最佳选择之一,其生态也在随着社区的推动和新需求的出现不断成长。
AI 应用选择套壳
AI 技术发展迅猛,市场竞争激烈。使用套壳方式,可以:
加速开发:利用现有的 Web 版本,快速构建桌面或移动端应用。
节省成本:无需为每个平台开发和维护独立的原生应用。
统一界面:在不同平台上提供一致的界面和交互,增强品牌形象。
功能同步:通过统一的代码基,确保各平台功能一致,更新同步。
即时更新:服务器端更新即可让用户获得最新功能,无需频繁发布客户端版本。
减少运维:降低了多版本维护和兼容性的复杂度。
访问系统:套壳应用可以访问文件系统、通知、剪贴板等,提高应用的功能性。
...
套壳应用的流行,反映了当前软件开发对效率和跨平台性的追求。然而,技术没有银弹,每种方案都有其适用场景和局限性。作为开发者,应该保持对新技术的敏感度,理性评估,避免一味追求速度而忽略了应用的质量和用户体验。未来,我们需要在效率、性能和用户需求之间找到最佳平衡,才能开发出真正优秀的应用。