AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社发现和投资非凡创业者(Alpha Founders),相信非凡创业者们在技术、商业和社会方面的巨大推动力,他们指引着创投生态的风向。
本图片由“千象”(网址:www.hidreamai.com)生成
在NVIDIA GTC大会上,黄仁勋发布旗下最强AI芯片GB300,和去年发布的GB200相比,推理性能是其1.5倍。据悉,GB300将在今年的下半年出货。
他还预览了2026年下半年发货的下一代AI超级芯片Vera Rubin,其性能将达到GB300的14倍。进一步,他预告了Vera Rubin的下一代产品Feynman。
此外,NVIDIA推出两款个人AI超级计算机DGX Spark和DGX Station,面向研究人员、数据科学家、AI开发者和学生设计。
该技术已被多家公司如Mooncake和DeepSeek采用,并成为NVIDIA和PyTorch下一代大模型服务系统的基础。PD分离的核心在于将预填充和解码分配到不同的GPU上,从而避免两者之间的资源竞争和性能干扰,显著提升系统的有效吞吐量,即每秒完成的符合SLO的请求数。
UCSD华人团队在其博客中详细剖析了PD分离技术的原理和应用场景。他们指出,现有的大模型服务系统虽然通过连续批处理技术提高了吞吐量,但无法有效满足不同应用场景下的延迟需求。例如,聊天机器人需要快速响应,而代码补全则要求实时生成。
为了解决这一问题,团队提出了有效吞吐量的概念,强调在满足SLO的前提下优化系统性能。通过PD分离,团队开发了系统原型DistServe,成功在保持严格延迟约束的同时,大幅提升了有效吞吐量。这一创新不仅降低了大模型服务成本,还显著改善了用户体验。
3.OpenAI推出语音智能体,API价格低至每分钟0.015美元
OpenAI发布全新语音智能体API,此次发布的模型在语音识别、语音转文本(ASR)及文本转语音(TTS)方面均达到SOTA水平,能够更精准地处理复杂音频环境,包括口音差异、嘈杂背景和变速语音。
OpenAI推出的gpt-4o-transcribe和gpt-4o-mini-transcribe模型,相比之前的Whisper模型大幅降低了单词错误率(WER),提升了语言识别的准确性。
此外,gpt-4o-mini-tts让开发者可以直接操控 AI 语音的表达方式,使其更具个性化和表现力。gpt-4o-transcribe和gpt-4o-mini-transcribe 模型的语音API,最低每分钟仅0.015 美元,适用于客户服务、会议记录和语音助手等应用场景。
相比之下,OpenAI的o1-pro API输入价格为150美元/每百万token,输出价格高达600美元/每百万token,比其前代o1-mini贵了100多倍。与竞争对手DeepSeek-R1相比,o1-pro的价格更是高出270倍,甚至在某些情况下达到1000倍。
4.Gemini升级:编程只需一句话
5.百度版深度思考模型免费上线,API定价比DeepSeek R1再砍一半
百度近日宣布其文心大模型4.5和文心大模型X1正式上线,并免费向用户开放。文心大模型4.5是一款原生多模态基础大模型,具备强大的语言能力和多模态融合能力,已在百度智能云千帆大模型平台上线,企业用户和开发者可立即调用API。
文心大模型X1则是百度版的深度思考模型,具备更强的理解、规划、反思和进化能力,支持多模态,并能自主运用多种工具,如高级搜索、文档问答、AI绘图等。两款模型的API调用价格极具竞争力,文心大模型4.5的输入价格为0.004元/千tokens,输出价格为0.016元/千tokens;文心大模型X1的输入价格为0.002元/千tokens,输出价格为0.008元/千tokens,相比DeepSeek R1标准时段价格便宜了一半。百度还计划在6月30日正式开源文心大模型,并预计在下半年发布文心大模型5.0,持续推动人工智能技术的发展和应用。
6.谷歌推出全新Scaling Law,为大语言模型的分布式训练提供更高效、更稳健的解决方案
谷歌近期发布了一项名为Diloco的全新算法,由谷歌Research、谷歌Search和谷歌DeepMind三大核心团队协作推出,这一突破性技术为大语言模型的分布式训练提供了更高效、更稳健的解决方案。Diloco的核心优势在于其能够在多个数据中心进行模型训练,且随着模型规模的扩大,其性能优势愈发显著,开创了新的Scaling Law。
与传统的数据并行训练相比,Diloco在超参数稳定性、带宽需求、批大小容忍度等方面表现出色,尤其是在模型规模超过20亿参数时,其优势更为明显。
这一技术的发布,不仅解决了大规模模型训练中的通信瓶颈问题,还为未来AI模型的扩展提供了全新的可能性。谷歌的研究团队通过大量实验验证了Diloco的Scaling Law,并指出其在合理调优的情况下,甚至在小规模模型上也可能优于传统的数据并行训练。
7.超越DeepSeek GRPO的关键RL算法,字节、清华AIR开源DAPO
清华AIR与字节跳动联合SIA Lab近日发布了其首项研究成果——DAPO,这是一个开源的大规模LLM强化学习系统。DAPO通过解耦剪辑和动态采样策略优化,显著提升了强化学习的效率和稳定性。
该算法在AIME 2024基准测试中,使用Qwen2.5-32b模型获得了50分的成绩,优于同等规模的DeepSeek-R1-Zero-Qwen-32b,且训练步数减少了50%。相比之下,使用GRPO的Qwen2.5-32b模型仅获得30分。DAPO的成功在于其解决了GRPO面临的熵崩溃、奖励噪音和训练不稳定等关键问题,为工业级大规模强化学习系统的开发提供了新的解决方案。
人工智能初创公司的新融资
CelestialAI由半导体行业资深专家David Lazovsky和Preet Virk联合创立。公司专注于利用光子学技术解决AI计算中的数据传输瓶颈,其核心产品“Photonic Fabric”通过光信号替代传统铜基电信号,实现芯片间超高带宽、超低延迟及高能效的数据传输。
2.AI科研智能平台Lila Sciences完成高达2亿美元的种子轮融资
官网:www.lila.ai
本轮资金将用于加速其“科学超级智能平台”的算力升级、自主实验室基础设施建设,目标是通过整合生成式AI、自动化设备和机器人技术,打造“自动驾驶实验室”以规模化执行科学实验。
Lila Sciences由生物医药领域知名创投机构Flagship Pioneering孵化,公司专注于开发跨学科的“科学超级智能平台”,其核心技术突破传统AI依赖历史数据的限制,通过自主生成假设、设计实验并优化结果,加速生命科学、化学和材料科学领域的创新。
例如,该平台已成功设计出低成本绿色制氢催化剂,成本仅为商业铂基催化剂的零头,并开发出工业级碳捕获新材料,其性能在热稳定性和吸附效率上显著超越现有产品。此外,其大语言模型具备科学推理能力,可协助研究人员快速筛选治疗靶点并生成基因疗法结构,已成功验证数百种新型抗体和肽类分子。
公司由Flagship普通合伙人Geoffrey von Maltzahn博士担任CEO,核心团队汇聚了遗传学泰斗George Church、OpenAI前高管Kenneth Stanley、机器学习专家Andrew Beam等跨领域顶尖人才。
3.DeepMind核心研究员离职创业,获NVIDIA投资
官网:https://generalistai.com/
Pete Florence此前是DeepMind的机器人与人工智能高级研究科学家,他的新身份在本周的NVIDIA GTC大会曝光——Generalist AI 的联合创始人兼 CEO。这家创业公司已经获得NVIDIA的投资,虽然还没有披露具体的业务,但显然与机器人技术有关。
Florence在GTC表示,“我们坚定不移地致力于制造能够完成任何任务的机器人,我们希望在机器人的赋能下,体力劳动的边际成本被降至零。”
曾师从Bengio,o1/o3后训练掌门人出走创业,瞄准AI材料,获OpenAI投资
OpenAI后训练团队负责人William Fedus近日宣布离职,将创办一家专注于AI材料发现的创业公司。OpenAI对其新公司进行投资并建立战略合作伙伴关系。
William Fedus拥有深厚的学术背景和丰富的行业经验。他毕业于MIT和剑桥大学,获得物理学学士学位,并在加州大学圣迭戈分校获得基本粒子物理学硕士学位,随后,他又在蒙特利尔大学获得了计算机科学博士学位,师从Yoshua Bengio。2022年加入OpenAI后,他作为核心开发人员参与了ChatGPT的创建,并主导了多个重要模型的后训练研发工作。2024年10月,他接替Barret Zoph成为后训练团队负责人。
4.Cartesia获6400万美元,只需3秒克隆语音
官网:www.cartesia.ai
Cartesia获得6400万美元A轮融资,由Kleiner Perkins领投,Index Ventures、Lightspeed、A* Capital、Factory、Greycroft和Samsung Ventures等机构跟投。此次融资距离其2700万美元种子轮融资仅过去3个月。资金将用于加速新一代语音模型Sonic的研发,强化实时语音生成技术,并推动与Adobe、Meta、Spotify等企业的深度合作。
Cartesia脱胎于斯坦福大学AI实验室,由机器学习专家Karan Goel博士联合斯坦福教授Chris Ré(麦克阿瑟“天才奖”获得者)等人共同创立。其核心产品Sonic 2.0语音模型通过状态空间模型(SSM)架构,实现仅需3秒音频即可精准克隆语音,捕捉口音、情感甚至背景音效,支持15种语言及长文本处理,已在客服、医疗、游戏等领域落地。例如,Adobe利用其低延迟特性优化产品语音交互,Spotify则用于生成自然播客旁白。技术突破还体现在将语音转语音(Speech-to-Speech)全双工系统的延迟从90毫秒压缩至45毫秒,显著提升实时对话流畅度。
目前,Cartesia已服务超10万家客户,包括Quora、Cresta和Rasa等企业。其最新发布的Sonic Turbo模型进一步将延迟降至40毫秒,结合“语音本地化到任意语言”功能,正推动数字分身、元宇宙社交等新兴场景的应用。公司通过开源组件LiveKit和WebRTC技术构建语音编排平台,使开发者能快速部署定制化Voice Agent,将传统需6-12个月的开发周期缩短至数周。
5.AI网络安全公司Cybereason完成软银领投的1.2亿美元战略融资
官网:www.cybereason.com
Cybereason近日获得软银集团、SoftBank Vision Fund 2以及Liberty Strategic Capital联合领投的1.2亿美元战略融资。
Cybereason专注于提供基于人工智能的端点检测与响应(EDR)解决方案。其核心技术通过实时监控网络活动(如运行程序、文件访问、用户输入行为等),结合AI算法帮助企业预防、检测和应对高级网络威胁。其产品覆盖端点安全、威胁狩猎及托管检测与响应(MDR)服务,能够贯穿网络攻击的全生命周期防护,目前已在全球40多个国家落地应用。
在技术层面,Cybereason的软件以全面数据采集和实时分析为核心优势,不仅追踪传统网络行为,还能捕捉键盘输入、鼠标移动等细粒度用户操作,从而精准识别异常模式。这种能力使其在应对勒索软件、供应链攻击等复杂威胁时具备显著优势。此外,公司通过AI驱动的自动化响应机制,大幅缩短了威胁处置时间,助力企业构建动态防御体系。
6.Nirvana Insurance完成8000万美元C轮融资
官网:www.nirvanatech.com
Nirvana利用AI技术,为商业卡车车队提供合适的保险产品。它近日获得8000万美元C轮融资,由General Catalyst领投,现有投资者Lightspeed Venture Partners和Valor Equity Partners继续跟投,公司估值接近8.5亿美元。
在美国市场,通常情况下,每辆卡车每年的保费高达15000至20000美元,而且整理报价和保单通常需要数周时间,提交索赔和获得赔付又要让司机数周无法上路,这些都对利润微博的中小车队企业带来直接的生存威胁。
Nirvana通过整合嵌入式物联网设备(如车队远程信息处理系统)实时采集驾驶数据,结合超过200亿英里的真实驾驶记录,构建了专有的风险评估和定价模型,帮助保险公司优化承保策略并降低赔付成本。
Nirvana的创始团队经验丰富,Rushil Goel(CEO)曾在MIT做过研究助理,做过BCG的咨询官,Abhay Mitra拥有多年的软件工程师经历,Alex Carges则有丰富的精算从业经历。
7.“AI+合规”平台Norm AI完成4800万美元B轮融资
官网:www.norm.ai
Norm AI完成4800万美元B轮融资,由Coatue领投,参投方包括Craft Ventures、Vanguard、Blackstone Innovations Investments、Bain Capital、New York Life Ventures、Citi Ventures、TIAA Ventures以及Salesforce创始人Marc Benioff等。这笔资金使得过去18个月内Norm AI的总融资额达到 8700 万美元。
Norm AI是法律与合规自动化平台,旨在改变企业处理法律、法规和行业要求的方式。该平台采用“设计即合规”的方法,将合规检查融入商业活动中,包括AI生成内容、内部沟通、协议以及外部企业沟通(如营销内容和销售材料)。Norm AI并非将合规与业务割裂开来,而是主动实施合规检查,并提供端到端的企业级解决方案。
Norm AI的解决方案基于其法律工程自动化平台(Leap)构建,这是一个专有系统,用于创建具备法律和监管领域专业知识的 AI 代理。Leap使 Norm AI的律师和前监管人员能够将复杂的政策转化为由大型语言模型驱动的可操作AI系统。
Norm AI由斯坦福大学AI与法律交叉领域专家John Nay博士创立,核心团队汇聚了前美国证券交易委员会委员Troy Paredes、法律工程师及合规领域资深从业者。
8.AI视频工具Opus Clip完成2000万美元B轮融资,软银愿景领投
官网:www.opus.pro
Opus Clip宣布完成2000万美元B轮融资,由SoftBank Vision Fund 2领投,投后估值达2.15亿美元。此前,公司于2024年9月获得由Millennium New Horizons领投的3000万美元A轮融资,投资方包括三星Next、GTMfund和DCM Ventures等,总融资额已超5000万美元。
Opus Clip专注于AI驱动的视频编辑技术,其核心平台可将长视频自动切割、重组为适配TikTok、YouTube Shorts等平台的短视频,并通过“爆款基因算法”分析镜头切换频率、背景音乐节奏等数据,优化内容的传播效果。例如,平台能实时生成20个剪辑版本,使完播率提升最高达600%,已服务超1000万创作者及Univision、Visa、LinkedIn等企业客户。
Opus Clip总部位于美国,由清华校友赵洋(Young Zhao)担任CEO,联合创始人包括林娜(CTO)和Mike Chen(CMO)。赵洋表示,Opus Clip的目标是构建“视频创作超立方体”,通过数据飞轮持续优化AI的“社交直觉”,让非专业用户也能产出爆款内容。随着短视频算法转向“主题优先”逻辑,其技术正成为企业内容战略的核心基础设施。
9.基于授权数据模型厂商Bria完成4000万美元B轮融资,Red Dot Capital领投
官网:https://bria.ai
近日,基于授权数据的生成式AI模型公司Bria完成4000万美元B轮融资,由Red Dot Capital领投,参投方包括Maor Investment、Entrée Capital、GFT Ventures、Intel Capital和In-Venture等机构。截至目前,公司累计融资额达6500万美元,
关于阿尔法公社