AI创投周报|AI浏览器ChatGPT Atlas发布,Oculus创始团队打造的Sesame融资2.5亿美元

AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社发现和投资非凡创业者(Alpha Founders),相信非凡创业者们在技术、商业和社会方面的巨大推动力,他们指引着创投生态的风向。


图片

本图片由“千象”(网址:www.hidreamai.com)生成


本周,我们观察到以下AI领域的新动向和新趋势:

1. OpenAI发布AI原生浏览器ChatGPT Atlas,这款产品的智能体模式可以让用户直接在浏览器内完成复杂操作,拿到结果,它也是OpenAI与谷歌争夺AI时代流量入口的“战略性武器

2. Oculus创始团队打造的Sesame融资2.5亿美元Sesame的产品是用自然、富含情感的人声与用户进行交互的AI智能体,它们未来计划将这智能体嵌入AI眼镜等AI硬件,为AI硬件提供更好的语音交互体验。

3. 谷歌的Quantum Echoes算法首次实现可验证量子优势,Quantum Echoes在解决原子相互作用问题上,比当前最强超级计算机Frontier快13000倍,成为全球首个在真实量子硬件上运行且结果可验证的算法,今年的诺奖得主Michel Devoret参与了这项研究。


图片

人工智能产品和技术的新突破


1.OpenAI发布首款AI原生浏览器ChatGPT Atlas,争夺AI时代的流量入口


OpenAI近日发布首款AI原生浏览器ChatGPT Atlas,它将AI功能原生集成在浏览器中,用户可以在浏览网页时与ChatGPT实时互动、总结内容或直接完成任务。  


图片


它还具有智能体模式和记忆功能。智能体模式让用户可以直接在浏览器内完成任务,例如做好一个旅行攻略后,不需要跳出浏览器去订票,浏览器可以直接自主化的帮你完成任务。


它的记忆功能,不仅能让用户越用越得心应手,而且帮助OpenAI积累了大量一手的用户使用数据(聊天的和Agent的),这些巨量的独家数据,能够帮助OpenAI建立起更深的数据护城河。


而AI原生浏览器的发布,代表OpenAI争夺AI时代流量入口的决心和努力。


2.宇树发布第四代人形机器人H2,首度配备仿生人脸与31个自由度


宇树科技正式发布第四代人形机器人Unitree H2,它身高180厘米、体重70公斤,较前代H1增加23公斤,自由度从19个提升至31个,使机器人在动作灵活性与协调性上大幅增强。


图片


H2在外观上首次采用仿生人脸设计,整体比例更接近真人。官方视频中,H2 完成了舞蹈旋转、功夫动作与走秀展示等复杂任务。其中,在“功夫”表演中,H2以180厘米的体型实现了接近G1机型(身高130厘米左右)的灵活度与稳定性,显示出宇树在动力学控制与动作规划方面的显著进步。H2的发布为具身智能在真实世界的人机交互场景落地奠定了基础。


3.DeepSeek发布视觉语言模型DeepSeek-OCR,实现视觉-文本“光学压缩”新突破


DeepSeek发布并开源全新视觉语言模型DeepSeek-OCR,在视觉-文本信息压缩领域取得重要进展。该模型提出“上下文光学压缩”概念,通过极少量视觉token即可还原数倍甚至十倍以上的文本内容,为多模态大模型显著降低计算和存储开销。


DeepSeek-OCR采用统一的端到端VLM架构,由视觉编码器DeepEncoder与解码器DeepSeek-3B-MoE组成。DeepEncoder融合SAM-base与CLIP-large架构,通过局部与全局注意力机制压缩图像信息并保持高精度感知;解码器采用混合专家结构,在推理中仅激活约5.7亿参数,实现性能与效率平衡。


测试结果显示,在OmniDocBench基准上,模型仅用100个视觉token便超越GOT-OCR 2.0表现,在10倍压缩比下的识别精度高达97%。实际部署中,它运行在单张A100 GPU可日均生成20万页数据。


研究团队认为,DeepSeek-OCR为解决长上下文处理瓶颈和提升视觉-语言协同效率提供了可行方案,标志着多模态AI迈向更高效、更通用的新阶段。


4.谷歌实现量子计算历史性突破:Quantum Echoes算法首次实现可验证量子优势


谷歌QuantumAI团队宣布其全新算法Quantum Echoes在Willow量子芯片上成功运行,在解决原子相互作用问题上,比当前最强超级计算机Frontier快13000倍,成为全球首个在真实量子硬件上运行且结果可验证的算法,相关研究登上《Nature》封面,标志着量子计算首次实现可验证的量子优势。


Quantum Echoes算法的核心是测量OTOC(out-of-time-order correlator),一种描述量子系统混沌演化的可观测量。与传统比特串不同,OTOC可提供在不同量子系统间一致、可重复验证的量子结果。这一算法通过“正向演化—扰动—反向演化—测量”四步操作,实现了量子信号的“回声”放大,从而精准捕捉量子相互作用的微小变化。


该研究由谷歌Quantum AI、DeepMind、加州大学伯克利分校和达特茅斯学院共同完成,新晋诺奖得主Michel Devoret亦参与其中。


5.谷歌让Gemini“吞下”2.5亿地图数据,赋予了AI“地理智能”


谷歌近期为其AI模型Gemini推出了名为「Grounding with Google Maps」的锚定功能。此举意味着Gemini将能直接接入并利用谷歌地图拥有的超过2.5亿个地点的实时地理空间数据。


通过在Gemini API中上线谷歌地图工具,谷歌让AI的能力从传统的文本理解,历史性地拓展到了对真实世界地理空间的理解与推理,赋予了AI前所未有的“地理智能”。


这项新功能的核心亮点在于,当Gemini识别到用户的提问涉及地理位置、路线或商户信息时,会自动调用地图数据,从而生成更精准、更贴合现实的回应。这极大地提升了AI在本地搜索、旅游规划、物流配送和房地产分析等领域的应用价值,催生出全新的地理空间感知AI产品,企业可利用该功能进行商业选址、优化动态物流、分析市场趋势。


6.港科大贾佳亚团队DreamOmni2开源,AI的P图能力再次进阶


香港科技大学讲座教授、冯诺依曼研究院院长贾佳亚团队开源发布了其最新成果DreamOmni2。


图片


DreamOmni2最核心的亮点在于,它在强大的指令编辑与文生图能力基础上,开创性地拓展了多参考图的生成与编辑功能,让创作者拥有了前所未有的灵活性与可玩性。无论是具体的物体替换,还是风格、光影、纹理等抽象概念的迁移,模型都能实现精准的语义理解与视觉还原。这一跃升得益于团队独创的三阶段式数据构建范式、为适应多参考图而优化的框架,以及视觉语言模型与生成模型联合训练的策略。


实测表明,DreamOmni2在多项任务上的表现优于当前的SOTA开源模型,甚至在某些方面超越了谷歌的Nano Banana等商业模型。


图片

2.人工智能初创公司的新融资


1.Oculus创始团队再创业,打造人声交互智能体Sesame,融资2.5亿美元


公司网站:www.sesame.com/


对话式AI初创公司Sesame近日完成2.5亿美元的B轮融资,此轮融资由Sequoia Capital和Spark Capital等知名投资机构领投。随着此次融资,公司也同步向部分特邀用户开放了其iOS应用程序的早期测试版。


Sesame的核心产品是一款能以自然、富含情感的人声与用户进行交互的AI智能体。其技术亮点在于,它并非简单地将大语言模型的文本输出转化为音频,而是能够直接生成捕捉了真实对话节奏与情感表现力的语音,创造出前所未有的沉浸式体验。


Sesame计划未来将这一个人AI智能体无缝集成到专为全天候佩戴而设计的轻量化智能眼镜中,让眼镜能够提供高品质的音频交互。


Sesame由Oculus的联合创始人兼前首席执行官Brendan Iribe掌舵,并汇集了Oculus的另一位联合创始人兼前首席产品官Nate Mitchell、前首席运营官Hans Hartmann以及多位曾在Oculus、Facebook和Meta担任核心工程与管理职务的高管。


2.General Intuition1.34亿美元种子轮融资,研发空间-时间推理 AI模型


公司网站:www.generalintuition.com


游戏视频分享平台Medal孵化的初创公司General Intuition近日获得约1.34亿美元的种子轮融资,领投方为Khosla Ventures与General Catalyst,投后估值达10亿美元,资金将用于强化其空间-时间推理AI模型的研发。


General Intuition专注于利用游戏视频数据训练模型和智能体,令其具备“空间-时间推理”能力。公司背靠的Medal游戏视频分享平台每年约收集20亿段游戏片段的数据,通过模拟玩家第一视角在虚拟环境中的运动与决策,训练模型理解物体运动轨迹、环境反馈及潜在动作。公司表示其模型已可在未见场景中仅凭视觉输入预测行为,具备迁移至机器人、无人机与自动驾驶系统的潜力。


General Intuition由Pim de Witte (CEO)发起创立,他此前任职Medal;联合创始人之一为Moritz Baier‑Lentz,其背景涵盖电竞选手经验及高频交易与游戏交互系统开发。


3.AI编程独角兽Poolside正进行一轮20亿美元新融资,估值将超140亿美元


公司网站:www.poolside.ai


AI编程独角兽Poolside目前正以超过140亿美元的估值筹集20亿美元资金,主要用于采购4万块英伟达GPU,以扩展模型训练与基础设施部署规模。此前Poolside曾以30亿美元估值完成5亿美元融资,投资方包括CIA旗下基金In-Q-Tel。


Poolside由前GitHub首席技术官Jason Warner共同创立,它的的核心业务是构建专为软件工程设计的先进AI基础模型,旨在通过自动化和增强编码过程,最终实现由AI主导、人类协作的软件创建模式。主要产品包括两款模型:旗舰模型Malibu,用于处理代码生成、重构和文档编写等复杂挑战;以及优化的Point模型,提供低延迟的即时智能代码补全。


Poolside正与CoreWeave合作建设名为 “地平线计划” 的超大型AI数据中心。项目规划总容量达2吉瓦(GW),预计2026年底投运。


4.AI文档解析公司Reducto完成7500万美元B轮融资,估值6亿美元


公司网站:www.reducto.ai


AI文档解析初创公司Reducto完成7500万美元B轮融资,由Andreessen Horowitz领投,Benchmark等现有投资方跟投,投后估值达6亿美元。此次融资距离其上轮2亿美元估值的A轮仅过去六个月,估值实现三倍增长,使Reducto总融资额达到1.08亿美元。


Reducto致力于将传统OCR技术与视觉语言模型相结合,以实现对复杂文档的深层语义理解。其系统能解析金融、医疗、法律与保险等领域的高复杂度文件并将其转换为可直接供大型语言模型读取的高质量数据。  


Reducto的核心技术通过约13个模型协同运行,它采用双引擎架构:VLM用于语义理解,OCR用于结果校验与防止“幻觉”,显著提升准确率与一致性。凭借这一系统,Reducto在精度上显著优于Amazon Textract、Microsoft Azure AI Document Intelligence等传统解决方案,客户已包括法律AI初创公司Harvey、投行AI平台Rogo及数据标注巨头Scale AI。


Reducto由Adit Abraham联合创立,他此前深耕AI文档解析与企业级数据智能领域,具备丰富的产品与算法经验。


5.创新型AI模型公司Sakana AI完成1亿美元新融资,估值达26亿美元


公司网站:www.sakana.ai


日本人工智能公司Sakana AI完成1亿美元新一轮融资,融资后公司估值达26亿美元。本轮融资由多家日本与美国机构投资者参与,包括日本三大商业银行、富士通、NEC、伊藤忠商事及KDDI等大型企业。


Sakana AI致力于打造“日本的DeepMind”,区别于OpenAI与Anthropic等主流技术路径,它采用受自然界进化机制启发的全新AI研发路线,其核心产品 “ShinkaEvolve” 为一款开源进化式AI软件,结合进化算法与大语言模型,能够自动生成并筛选多种潜在问题解决方案,在创造性与计算效率上显著优于传统Transformer模型。


Sakana AI由前谷歌研究员David Ha与Llion Jones共同创立,Jones是Transformer原始研究论文的合著者之一。


6.Viven完成3500万美元融资,为每位企业员工创建一个AI数字分身


公司网站:www.viven.ai


Viven近日完成由Khosla Ventures领投的3500万美元种子融资,Foundation Capital、FPV Ventures及多位天使投资人参投。


Viven的核心理念是为每位员工创建一个AI数字分身,让员工即便在本人离线时,也能即时访问其知识与项目经验。系统通过整合邮件、Slack、Google Docs等内部数据,训练出特定员工的个性化语言模型,实现对项目进展、历史决策及任务背景的自然查询。公司将此定位为“下一代知识型协作中枢”,通过AI封装个人经验,避免“人离岗、知识断”。


其隐私管理架构“pairwise context and privacy”确保数据使用的合规性与权限控制,使回答既真实可信又安全可控。


Viven由Ashutosh Garg与Varun Kacholia共同创立。两人曾联合创办Eightfold AI,并将其发展为全球领先的人才智能平台,目前估值突破21亿美元。


7.AI保险系统公司Liberate完成5000万美元融资


公司网站:www.liberate.ai


Liberate近日完成5000万美元融资,由Battery Ventures领投,新投资方Canapi Ventures加入,原有股东Redpoint Ventures、Eclipse、Commerce Ventures继续参与,投后估值达3亿美元。


Liberate专注于为财产与意外保险(P&C)公司打造深度AI系统,其核心产品包括语音助手Nicole及“智能代理网络”,能够自动处理报价、保单服务、理赔审核、保单变更等端到端流程,且支持电话、短信、邮件等多通道操作。


Liberate宣称其系统已帮助保险方提升销售平均15%,降低运营成本23%,且已从每月约1万次自动化处理跃升至130万次,覆盖超过60家客户。


Liberate的创始团队由 Amrish Singh(CEO)及联合创始人兼工程副总裁 Ryan Eldridge、CPO Jason St. Pierre组成,三人均来自保险科技或大型互联网科技公司。


8.AI营销工具Strella完成BVP领投的1400万美元A轮融资


公司网站:www.strella.io


Strella近日获得由Bessemer Venture Partners领投的1400万美元A轮融资,Decibel Partners、Bain Future Back Ventures、MVP Ventures及645 Ventures跟投。   


Strella专注为产品、设计与市场团队提供基于AI主持的访谈流程,将传统耗时八周的用户研究缩短至几天内。平台通过AI代理主持语音访谈,自动追问、识别欺诈行为并合成呈现高亮回放与结构化图表。比起仅做问卷或文字调研,Strella把“深度对话”“屏幕共享”“视频记录”作为切入点,使用户更真实地表达反馈,从而获得传统调研难以触及的洞察力。


此外平台支持移动屏幕共享、沉浸式录制和交互式可视化报告,真正解决研究执行低效、用户沉没动力弱、回报慢的行业痛点。目前它的企业客户超过40家,客户包括Amazon、Chobani等大厂,合同规模和月度营收均以50%月增长率攀升


9.Agent开发平台LangChain完成1.25亿美元B轮融资,估值达12.5亿美元


公司网站:www.langchain.com


Agent开发平台LangChain近日完成1.25亿美元B轮融资,公司估值达到12.5亿美元。本轮融资由IVP、CapitalG领投,ServiceNow Ventures、Workday Ventures、Cisco Investments、Datadog、Databricks 等参投。自2022年底成立以来,LangChain累计融资已超过1.6亿美元,商业产品 LangSmith 的年经常性收入已达1200万至1600万美元。


LangChain的核心产品为开源框架LangChain SDK,可帮助开发者将大型语言模型与外部数据源、API、数据库等连接,从而构建具备上下文理解与实时交互能力的智能应用。


该平台通过模块化链式调用框架,解决了LLM难以访问外部数据、接口标准不统一以及智能代理调优难等痛点。其商业化工具LangSmith已成为AI代理监控与性能分析的主流方案,为LangChain带来稳定营收。  


自2022年发布以来,LangChain已成为全球最活跃的AI开发框架之一,在GitHub上获超11万颗星标,被数万开发者复刻并应用于生产环境。


10.浏览器AI Agent公司Kernel完成2200万美元融资


公司网站:www.onkernel.com


Kernel完成2200万美元的种子轮及A轮融资,由Accel领投,Y Combinator、Vercel Ventures、SV Angel、Refinery Ventures 等参投,天使投资人包括 Paul Graham(Y Combinator创始人)、Solomon Hykes(Docker创始人) 与David Cramer。


Kernel致力于打造“浏览器即服务”的基础设施平台,为AI Agent提供能够像人类一样浏览网页、点击、填写表单和抓取数据的环境。


其产品具备毫秒级浏览器启动速度、实时可观察性及精细化身份与权限控制,解决了AI Agent在性能、可靠性与安全方面的核心难题。目前,Kernel已被 Cash App、Rye 等公司用于大规模网页自动化、数据采集与AI任务执行,被视为推动“浏览器AI Agent”时代的底层引擎。


公司由前Cash App工程负责人Catherine Jue与Clever联合创始人Rafael Garcia于2023年共同创立。Jue曾领导大型金融科技平台的工程与系统架构建设,Garcia则拥有在教育科技与身份验证基础设施领域的丰富经验。


11.OpenAI及Google Brain核心成员创立的AI for Science公司Periodic Labs完成3亿美元种子轮融资


公司网站:www.periodiclabs.ai


由前OpenAI核心成员Liam Fedus与前Google Brain研究员Dogus Cubuk创立的Periodic Labs完成3亿美元种子轮融资,融资由Felicis领投,Andreessen Horowitz、DST、NVentures与Accel 等参投,Jeff Bezos、Eric Schmidt、Jeff Dean、Elad Gil等科技界重量级人物以天使身份入局。


Periodic Labs致力于打造真正能够“做科学”的AI for Science实验体系,通过语言模型与自动化实验室的结合,让AI不仅能提出科学假设,更能亲自验证。


公司计划建立全自动机器人实验室,实验过程形成“AI生成假设—机器人实验验证—结果数据回馈模型”的闭环,从而将科学发现周期从数年缩短至数周。其研究初期聚焦于超导体、新型磁体与热电材料的发现,并以真实实验数据为训练源,构建具备“科学直觉”的AI模型。


Periodic Labs创始人Fedus曾是ChatGPT最早期核心成员,主导OpenAI的后训练部门工作;Cubuk则是Google Brain知名材料科学家,其2023年论文首次实现AI建议合成的41种全新化合物。


本文由阿尔法公社综合自多个信息源,并在AI大模型的辅助下写作,封面图片由Hidream.ai的Pixeling(千象)生成。



图片

图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片


图片