AI创投周报是阿尔法公社关于全球人工智能投资的资讯周报,适合创业者和投资人参考。
阿尔法公社聚焦科技天使投资,近期集中投资了十余家AI初创企业,我们瞄准高段位创业者,投资了加拿大工程院外籍院士、美国工程院院士担任CEO的数个项目,以及国家重大专项首席专家、中国CIO标杆人物、大厂高端人才等创始人项目,包括HiDream智象未来、八方地动、创享数智等。
本图由“千象”(网址:www.hidreamai.com)生成
本周,我们观察到AI领域的新动向和新趋势:
1. OpenAI 本周连更产品全汇总。OpenAI 本周新发布了强化微调、Sora、Canvas重大升级以及苹果接入ChatGPT这4个新功能及产品。其中,强化微调(RFT)是OpenAI首次将内部使用的强化学习技术对外开放,允许开发者通过少量高质量样本定制领域专家模型,并根据参考答案对模型响应进行评分。Sora能精确遵循文本指令生成视频,并有效解决了视频生成中的主体一致性问题,此外,OpenAI还宣布与苹果合作,将ChatGPT集成到苹果全家桶产品中,包括iPhone、iPad、Mac和Siri。
2. 谷歌重磅发布新一代原生多模态模型:Gemini 2.0 Flash。该模型具有出色的多语言能力,能原生调用谷歌搜索等工具,并在编码方面表现出色。此外,谷歌还推出了基于Gemini 2.0的一系列智能体创新项目,包括通用AI助手Project Astra、浏览器交互智能体Project Mariner、AI代码智能体Jules、游戏辅助智能体和机器人智能体。这些智能体展示了在多模态推理、长文本理解、复杂指令执行等方面的技术突破,为用户提供了更加流畅直观的AI交互体验。
3. Ayar Labs获三大芯片巨头联投的1.55亿美元的D轮融资,估值超过10亿美元。芯片设计公司Ayar Labs宣布完成1.55亿美元的D轮融资,目前公司累计融资已达3.7亿美元,估值超过10亿美元,成为新晋芯片独角兽。本轮融资投资者包括芯片巨头英伟达、AMD、英特尔和格芯等。
人工智能产品和技术的新突破
1. OpenAI 直播连更一系列功能及产品
Day-2 强化微调(Reinforcement Fine-Tuning,RFT):这是OpenAI首次将内部使用的强化学习技术对外开放,允许开发者通过少量高质量样本定制领域专家模型,并根据参考答案对模型响应进行评分。在伯克利实验室的应用案例中,经过强化微调的o1-mini在诊断罕见疾病任务上表现出色,准确率显著提升。RFT通过强化学习算法提升模型的推理能力,尤其在需要高精确性和专业知识的领域如法律、金融等具有重大意义。
Day-3 Sora:基于DALL·E和GPT模型,使用Transformer架构和扩散模型技术,Sora解决了视频生成中的主体一致性问题,能精确遵循文本指令生成视频。此外,Sora还具有将静态图像动画化、扩展现有视频或填充缺失帧等功能。奥特曼直言:“Sora是AGI路线图上的重要里程碑。”
Day-4 Canvas重大升级:Canvas的新功能包括修改建议、润色文档、检查语法、添加表情,运行Python代码,以及整合进自定义GPTs。此外,OpenAI研究员Karina Nguyen还在直播中展示了Canvas如何成为个性化导师、自动化SWE和数据科学家,以及编写小工具或游戏。
Day-5 苹果接入ChatGPT:OpenAI宣布与苹果合作,将ChatGPT集成到苹果全家桶产品中,包括iPhone、iPad、Mac和Siri。这一合作将重塑苹果设备的功能,尤其是iPhone 16及以上型号将支持高级视觉功能,即iPhone 16的相机将能使用ChatGPT进行图像分析,提取关键信息并提供相关建议。此外,Siri与ChatGPT的协同工作将提高苹果设备的智能语音助手能力,提供更准确、详细的回答。ChatGPT在Mac系统中的原生集成,将增强Mac系统文本生成与理解能力,提升数据可视化和分析能力。
Sora新功能一览
召唤Canvas
来源:https://openai.com/
近日,谷歌发布了Gemini 2.0 Flash,该模型具有出色的多语言能力,能原生调用谷歌搜索等工具,并在编码方面表现出色。Gemini 2.0 Flash在性能上超越了上一代1.5 Pro,其速度提升一倍,也完全超越了OpenAI的o1-preview和o1-mini,目前仅次于GPT-4o。
此外,谷歌还推出了基于Gemini 2.0的一系列智能体创新项目,包括通用AI助手Project Astra、浏览器交互智能体Project Mariner、AI代码智能体Jules、游戏辅助智能体和机器人智能体。这些智能体展示了在多模态推理、长文本理解、复杂指令执行等方面的技术突破,为用户提供了更加流畅直观的AI交互体验。下一步,谷歌会将Gemini 2.0的高级推理功能引入AI Overviews,解决更复杂的主题和多步骤问题,包括高级数学方程、多模态查询和编码。
3. 谷歌Willow量子芯片突破计算极限
谷歌宣布了一项量子计算的重大突破,推出了全新的量子芯片Willow,该芯片拥有105个量子比特,T1时间(量子比特保持激发状态的时间)达到了近100微秒,比上一代提升了5倍,可以在不到5分钟的时间内完成了一个当前最强超级计算机需要10^25年才能完成的计算任务。
此外,Willow芯片的误差随着量子比特数量的增加而指数级下降,这意味着困扰量子行业近30年的量子纠错问题终于得到解决。谷歌表示,Willow芯片将成为构建有用量子计算的第一步,未来在药物发现、核聚变、电池设计等多个领域中将发挥不可估量的研究潜力。目前,这一研究成果已经发表在Nature期刊上。
4. Meta宣布开源最新大模型:Llama 3.3-70B
Meta近日宣布开源其最新的大语言模型——Llama 3.3-70B。尽管此模型参数仅为700亿,该模型性能与之前开源的Llama 3.1 4050亿参数模型相当,但模型参数仅为700亿。同时新模型还大幅降低了推理和部署成本,其中输入成本降低10倍,输出成本降低近5倍。Llama 3.3-70B已经在多个行业基准测试中表现优异,Meta内部也在使用Llama模型(其AI助手每月活跃用户近6亿)。在性能方面,该模型超越了谷歌的Gemini 1.5 Pro、OpenAI的GPT-4o以及亚马逊的Nova Pro,尤其在MMLU测试中展现出了强大的语言理解能力。该模型将在数学、常识、指令遵循和应用使用等领域带来显著改进。Meta首席执行官马克·扎克伯格表示,Meta AI有望成为全球使用最广泛的AI助手之一。
来源:https://huggingface.co/meta-llama/Llama-3.3-70B-Instruct
xAI公司发布了其首款完全自研的图像生成模型Aurora,并已集成到Grok平台中。这款模型耗时6个月研发,采用MoE架构的自回归模型,能够通过混合的文本和图像数据预测下一个 Token,已在混合文本和图像数据集上完成训练。Aurora的强大能力体现在其生成逼真图像渲染、执行复杂文本指令以及原生支持多模态输入等方面,极大地拓展了AI交互的边界。尤其在人物肖像生成方面,Auroras的生成作品已达到肉眼难以辨别的水平。此外,Aurora还在表情包、艺术字体、实物生成等方面也表现出色。在与其他AI生图模型的竞争中,Aurora也展现出了更高的生成质量和一致性。目前,Grok的全新图像生成功能已在部分国家上线,预计一周内将向所有用户全面开放。
来源:https://x.ai/blog/grok-image-generation-release
根据 The Information 最新透露,苹果正在开发内部代号为 Baltra 的 AI 芯片,并预计在 2026 年开始大规模生产。为了集中精力开发AI芯片,苹果取消了一款高性能Mac芯片的研发,将任务交给了位于以色列的设计团队,自己转向去研发一款由多个神经引擎组成,以加速AI任务的Baltra AI芯片。据了解,苹果将采用AMD首创的模块化芯片设计,将芯片和功能拆分成更小的模块,然后组合成一个完整的芯片,以减少制造复杂性和提高良品率。此外,该芯片将由博通提供有限的设计服务,并由台积电承接生产。
1. Ayar Labs获三大芯片巨头1.55亿美元的D轮融资,估值超过10亿美元
官方网站:https://ayarlabs.com/
芯片设计公司Ayar Labs宣布完成1.55亿美元的D轮融资,目前公司累计融资已达3.7亿美元,估值超过10亿美元,成为新晋芯片独角兽。本轮融资投资者包括三大芯片巨头英伟达、AMD、英特尔,以及格芯等公司。
Ayar Labs是一家专注于为大规模AI工作负载提供光互连解决方案的芯片设计公司,其技术被视为下一代AI基础设施建设的关键。公司开发的封装内光学I/O解决方案相比传统互连能实现5~10倍的更高带宽、4~8倍的能效提升,并将延迟降低至1/10倍。目前,公司已开始向部分客户出货约15000台设备,并计划到2026年中期实现大批量生产。
2. Crusoe Energy Systems LLC获6亿美元的D轮融资,Founders Fund领投
官方网站:https://crusoe.ai/
AI数据中心公司Crusoe Energy Systems LLC宣布完成6亿美元的D轮融资,使得公司估值达到28亿美元。此轮融资由彼得·蒂尔的Founders Fund领投,英伟达、富达投资、Long Journey Ventures、Mubadala、Ribbit Capital和Valor Equity Partners等跟投。
Crusoe Energy Systems LLC成立于2018年,是一家专注于为人工智能工作负载构建数据中心的公司。公司最初是在美国为油井提供小型集装箱化数据中心,后来转向AI和高性能计算。Crusoe声称其能够提供具有成本效益的大规模生成式AI计算能力,并使用清洁能源,从而实现环境友好的AI基础设施。在过去一年中,Crusoe与包括英伟达、Vast Data Inc.、德勤(Deloitte)和Rescale Inc.在内的领先技术公司扩大了合作。目前,Crusoe在九个美国州和包括冰岛在内的三个国家运营,为全球客户提供服务。
3. Tractian完成1.2亿美元的C轮融资,Sapphire Ventures领投
官方网站:https://tractian.com/
制造业AI公司Tractian宣布完成1.2亿美元的C轮融资,本轮融资由Sapphire Ventures领投,General Catalyst、Next47和NGP Capital跟投。根据Crunchbase,成立于2019年的Tractian已筹集超过1.8亿美元资金。
面对工业维护的重大危机,计划外停机导致全球大型公司损失巨额年收入,Tractian致力于通过提供集成硬件和软件解决方案,监控工业资产、物理操作和维护管理,帮助企业实现零停机并提高技术人员的生产力。公司共拥有200多名工程师团队,专注于数据、软件和硬件的研发,并于今年申请了12项技术专利。Tractian计划扩大其专利解决方案组合,并吸引更多顶尖人才。Tractian还表示,此次融资资金将用于优化机器性能并确保前所未有的正常运行时间。
4. OpenAI支持的语音AI初创Speak获7800万美元的C轮融资,Accel领投
官方网站:https://www.speak.com/
AI语言学习公司Speak宣布完成7800万美元的C轮融资,公司估值达到10亿美元,正式成为独角兽企业。此轮融资由Accel领投,OpenAI Startup Fund、Khosla Ventures和Y Combinator等跟投。
Speak成立于 2016 年,致力于研发语音AI语言学习APP,改变语言学习模式。其愿景是通过AI技术打破传统教育模式的局限,为用户提供切实有效的语言学习体验。产品通过AI生成音频对话来提高用户语言掌握能力,学习过程共分为三个阶段:直接进入听力和口语练习、反复练习新词汇或短语、将短语置于AI模拟的真实场景中。目前,Speak提供英语和西班牙语的学习,计划很快推出法语,并在2025年覆盖大多数流行语言。Speak在韩国首先推出,拥有1000多万用户,已在40多个国家开展业务。Speak表示,公司将利用新资金加速创新,增加更多语言支持,并吸引顶尖人才。
5. Sublime获6000万美元的B轮融资,Institutional Venture Partners(IVP)领投
生成式AI邮件安全平台提供商Sublime Security宣布完成6000万美元的B轮融资,由Institutional Venture Partners(IVP)领投,Citigroup Ventures、Index Ventures、Decibel Partners和Slow Ventures参投,使得公司总融资额达到9380万美元。
Sublime Security成立于2019年,专注于提供AI驱动的邮件安全解决方案,以应对钓鱼、恶意软件和商务邮件诈骗等威胁。其平台的核心特色是开源的Message Query Language(消息查询语言),使安全团队能够创建、运行和共享检测规则。此外,该平台还能够通过API无缝集成Microsoft 365和Google Workspace等主流邮件服务,无需更改邮件流或MX记录,部署便捷。
6. Anyrobotics新增6000万美元的B轮融资,融资总额达到1.1亿美元
机器人公司Anybotics宣布其额外获得6000万美元的B轮融资,使得该轮融资总额达到1.1亿美元。本轮B轮融资的延伸由高通创投和Supernova Invest领投,贝塞默风险投资公司、NGP Capital等新老投资者参与。
Anybotics自苏黎世联邦理工学院剥离,专注于研发四足自主巡检机器人Anymal。该机器人配备多种传感器和摄像头,用于监控工业设备,追踪热异常、检测可燃气体并进行预防性维护。Anybotics的业务涉及石油和天然气、采矿、电力、公用事业和金属等行业,共部署近200台机器人,客户包括Novelis、Iamgold、Stelco等。Anybotics表示,新资金将用于推动公司在美国市场上的扩张。
7. Waveforms AI获4000万美元的种子轮融资,Andreessen Horowitz(a16z)领投
情感通用AI研发商WaveForms AI宣布完成了4000万美元的种子轮融资。该轮融资由Andreessen Horowitz(a16z)领投,目前公司估值达到2亿美元。
WaveForms AI由前OpenAI研究员Alexis Conneau创立,专注于音频AI交互领域的创新,致力于开发能够理解语气、语调和口音等语音细微差别的音频大型语言模型(LLM),增强AI理解和响应人类语言的能力。WaveForms AI表示,这轮融资资金将用于支持公司在音频LLM领域的进一步研发和业务扩展,推动技术在理解和处理语音数据方面的应用。
本文由阿尔法公社综合自多个信息源,并在ChatGPT的辅助下写作,封面图片由Hidream.ai的Pixeling(千象)生成。