AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社发现和投资非凡创业者(Alpha Founders),相信非凡创业者们在技术、商业和社会方面的巨大推动力,他们指引着创投生态的风向。
本周,我们观察到以下AI领域的新动向和新趋势:
1. 特斯拉发布会:Cybercab无人驾驶出租车,无人驾驶货车Robovan正式亮相,同时展示Opimus机器人,FSD系统最新动态。在特斯拉“We, Robot”发布会上,公司推出了Cybercab无人驾驶出租车和Robovan无人驾驶货车。埃隆·马斯克透露,将运营名为Cybercabs的自动驾驶出租车队,乘客可通过应用叫车,特斯拉车主也能通过应用共享车辆赚钱。还展示了Optimus人形机器人的多种功能,包括跳舞、调酒和猜拳。关于FSD(全自动驾驶)系统,马斯克宣布FSD预计于2025年第一季度在中国和欧洲推出,特斯拉正努力为FSD的推出解决数据安全和行驶安全问题。
2. Meta发布视频生成工具Movie Gen,挑战OpenAI Sora。Meta首次公开自家的用于媒体的突破性生成式AI研究:Movie Gen的视频生成工具,是AI视频生成领域的重大突破。根据 Meta 的描述,Movie Gen 的功能包括:文本生成视频和音频、编辑已有视频、图片生视频。Movie Gen能够根据文本提示生成长达16秒、1080p分辨率、每秒16帧的高清视频,并且支持视频编辑和个性化视频生成。此外,它还能生成与视频同步的背景音乐和音效,大大增强了视频的沉浸感。这一发布可能会给Sora带来压力。
3. KoBold Metals利用AI技术完成4.91亿美元融资,探索矿产新纪元。KoBold Metals,一家专注于利用人工智能技术寻找关键矿产的初创公司,近期宣布完成了4.91亿美元的融资,本轮目标是5.27亿美元。根据 PitchBook,之前的 1.95 亿美元融资轮使公司在融资后估值达到 10 亿美元。这家初创公司据报道希望在当前融资轮中达到 20 亿美元的估值。之前的投资者包括比尔·盖茨、杰夫·贝索斯、马云等。
人工智能产品和技术的新突破
1. 特斯拉发布会:Cybercab无人驾驶出租车,无人驾驶货车Robovan正式亮相,同时展示Opimus机器人,FSD系统最新动态
北京时间10月11日上午,特斯拉召开"We, Robot"发布会,发布会上宣布了Cybercab无人驾驶出租车、无人驾驶货车Robovan,Opimus机器人的推出,以及自动驾驶FSD的最新动态。
无人驾驶出租车被命名为Cybercab。这款汽车没有方向盘和踏板,设计充满未来感,Cybercab的设计包括鸥翼车门,能够提供全新的无人驾驶体验,但只能容纳2名乘客。且这辆车使用感应充电无线充电,完全没有插头。预计将在2026年开始生产,并在2027年大规模生产。
埃隆·马斯克计划运营一个名为Cybercabs的自动驾驶出租车队,乘客可以通过应用程序叫车。特斯拉车主也可以将自己的车辆列为机器人出租车,通过应用程序赚钱。马斯克强调,自动驾驶技术可以提高出行效率并降低成本,未来每英里的出行成本可能降至5至10美分。
最后,马斯克公布了FSD(全自动驾驶)系统的最新动态:数百万车在接受训练,FSD推出时间线乐观。目前FSD已在美国累计行驶超过16亿英里,马斯克预测需要达到60亿英里的测试里程才能满足全球监管机构的要求。预计在2025年第一季度在中国和欧洲推出,具体推出时间还需监管批准。目前,特斯拉正从数据安全、行驶安全等角度为FSD的推出扫清障碍。
Meta首次公开自家的用于媒体的突破性生成式AI研究:Movie Gen的视频生成工具,是AI视频生成领域的重大突破。根据 Meta 的描述,Movie Gen 的功能包括:文本生成视频和音频、编辑已有视频、图片生视频。Movie Gen能够根据文本提示生成长达16秒、1080p分辨率、每秒16帧的高清视频,并且支持视频编辑和个性化视频生成。此外,它还能生成与视频同步的背景音乐和音效,大大增强了视频的沉浸感。
Movie Gen的核心是一个30B参数的Transformer模型,它通过预训练和微调在大量视频和图像数据集上学习,从而理解视觉世界。该模型采用了流匹配训练方法,相较于传统的扩散模型,它在生成效率和视频质量上都有显著提升。此外,Movie Gen还引入了创新的位置编码方法和时间平铺推理方法,以提高视频生成的灵活性和推理速度。
Meta还发布了一个13B参数的音频生成模型Movie Gen Audio,它能够生成长达45秒的高质量音频,包括环境声音、音效和背景音乐,与视频内容完美同步。Meta在92页的技术论文中公开了Movie Gen的架构和训练细节,展示了其在视频生成领域的深入研究和技术实力。尽管产品预计明年才会向公众开放,但这一发布无疑给OpenAI的Sora带来了压力,预示着AI视频生成领域的竞争将更加激烈。
3. AI成就获诺贝尔认可,AI领域的先驱者荣获2024年诺贝尔物理学奖和化学奖
2024年的诺贝尔奖在物理学和化学领域均授予了人工智能(AI)领域的先驱者,AI领域实现2024诺贝尔奖大丰收。
4. OpenAI近期动态:完成新一轮66亿美元融资,DevDay宣布四项API新功能,推出Canvas交互界面,但据有关报道,OpenAI 可能要到 2029 年才能盈利
上周,OpenAI完成融资,官宣获得Thrive Capital(13亿美元)、微软(7.5亿美元)、英伟达、软银(5亿美元)、老虎全球基金(3.5亿美元)、Altimeter Capital(2.5亿美元)等联合的达66亿美元融资,估值超1500亿美元。缓解了破产危机的同时加速Sora,猎户座等产品研发,新的资金将投入前沿AI研究的领导地位,增加计算能力,并继续构建帮助人们解决难题的创新工具。目前,全球每周有超过2.5亿人使用ChatGPT来提升工作、创造力和学习。在各个行业中,企业正在提高生产力和运营效率,开发者正在通过其平台创建全新的各种生成式AI应用。
2024年10月1日,OpenAI在旧金山召开了第二届开发者大会(DevDay),聚焦于对现有AI工具和API的增量改进。在大会上,OpenAI宣布了四项重要的API新功能:视觉微调(Vision Fine-Tuning)、实时API(Realtime API)、模型蒸馏(Model Distillation)和提示缓存(Prompt Caching)。这些新工具的发布,标志着OpenAI的战略重心转向赋予其开发者生态系统更多能力,而非直接在最终用户应用领域竞争。此外,GPT-4和GPT-4omini等模型的成本大幅下降,约下降98%,处理token的能力也得到了显著增强。
ChatGPT迎来了自发布以来最重大的UI更新,推出了名为Canvas的全新交互界面。Canvas允许用户在独立的窗口中与ChatGPT协同创作,打破了传统聊天框的限制,提供了一种全新的协作方式。Canvas有四个突出的亮点,更好的协作、更灵活的控制、更智能的触发和更丰富的快捷方式。Canvas目前处于早期测试阶段,OpenAI计划快速改进其功能。Canvas将逐步向ChatGPT Plus和团队用户推出,企业和教育用户将在下周获得访问权限,未来计划向所有ChatGPT免费用户开放。
尽管OpenAI不断推出新产品,据 The Information 的报道,其预计到 2029 年才能实现盈利,届时收入将达到 1000 亿美元,而 2026 年的亏损预计将达到 140 亿美元,是今年预期亏损的三倍。OpenAI 表示,尽管上半年的净亏损为 30 亿美元,但由于收入增长速度快于计算成本,其商业模式将会改善,毛利率预计从今年的 41% 提升至明年的 49%,并在 2028 年达到 67%。此外,OpenAI 的新产品的销售额预计在 2025 年底前超过 API 销售额,但 API 销售增长将放缓。OpenAI 正在研发能使用 PC 处理复杂任务的 Agent 产品,并考虑推出更昂贵的技术订阅服务。
Flux1.1模型在Artificial Analysis image arena上以“蓝莓”为代号,超越了所有其他模型,获得了最高的整体Elo评分。这一成就标志着Flux1.1在图像质量、指令响应和多样性上的巨大优势。此外,Flux1.1的速度是前代模型的6倍,而价格却更为亲民,这使得它在性能和成本效益上都具有显著的竞争力。
Flux1.1背后的团队是Stable Diffusion原团队,包括Robin Rombach、Andreas Blattmann、Dominik Lorenz等,他们曾是Stable Diffusion项目的核心成员。在Stability AI的支持下,他们进一步发展了文本到图像生成模型,并在2022年加入了Stability AI。今年,他们成立了新的团队Black Forest Labs(黑森林实验室),并迅速发布了Flux1.1。
Flux1.1的成功不仅体现在技术上,还体现在其商业模式上。Black Forest Labs已完成3100万美元的种子轮融资,由Andreessen Horowitz领投,这为团队的未来发展提供了坚实的资金支持。此外,Flux1.1模型还通过Together.ai、Replicate、fal.ai、Freepik等在线平台提供,并且推出了BFL API,供其他开发者集成到自己的应用程序中。
1. KoBold Metals利用AI技术完成4.91亿美元融资,探索矿产新纪元
KoBold Metals,一家专注于利用人工智能技术寻找关键矿产的初创公司,近期宣布完成了4.91亿美元的融资,本轮目标是5.27亿美元。根据 PitchBook,之前的 1.95 亿美元融资轮使公司在融资后估值达到 10 亿美元。这家初创公司据报道希望在当前融资轮中达到 20 亿美元的估值。之前的投资者包括比尔·盖茨、杰夫·贝索斯、马云等。
该公司最初专注于矿藏发现,现已向矿藏开发迈进,显示出战略调整和承担更多风险的意愿。KoBold Metals的CEO表示,公司最近发现的铜矿可能是历史上最重大的发现之一,预计年产铜量将达到数十万吨。为实现这一目标,KoBold计划投资约23亿美元用于资源开发。
该公司利用人工智能技术,在海量数据中寻找对能源转型至关重要的矿产,如铜、锂、镍和钴。在传统勘探中,发现矿藏的成功几率极低,大约一千次尝试中才有一次成功。KoBold希望利用AI技术提高这一成功率,减少失败的风险。
目前,KoBold在赞比亚进行的约60个勘探项目显示了其巨大的市场潜力。AI技术的应用使这家新兴公司在矿业领域崭露头角,为这一传统行业带来了新的机遇和挑战。
2. 前Salesforce CEO创立的AI客服Sierra,新一轮估值超40亿美元
Sierra,这家由前Salesforce联合首席执行官布雷特·泰勒共同创立的人工智能初创公司,正在寻求新一轮的数亿美元融资。本轮融资的投资方为Greenoaks Capital,新融资预计将使公司的估值至少达到三倍以上,超过40亿美元。此前在一月份的融资轮中,Sierra的估值为10亿美元。现有投资者包括红杉资本和Benchmark。
Sierra成立于一年多前,专注于销售一种能够自动化执行特定任务(例如客户服务,包括语音电话)的AI“代理”。布雷特·泰勒同时也是OpenAI董事会主席,他与曾负责谷歌增强现实和虚拟现实工作的克莱·巴沃共同创办了Sierra。泰勒表示,他在OpenAI的角色将是临时的,以便他最终能够专注于Sierra。
客户支持已成为对话式人工智能最成功的早期应用案例之一。然而,Sierra面临着激烈的竞争,既来自像Salesforce这样的科技巨头,也来自OpenAI本身,以及像Intercom、Decagon和Maven AGI这样的初创公司。Sierra最近宣布其人工智能代理现在可以通过电话与客户交谈,管理实时对话的来回交流,并提供服务特定上下文,以便能够使用公司的语言。
3. 专注于提供基于AMD硬件的GPU云平台的初创公司TensorWave获4300万美元融资,可能挑战英伟达GPU垄断地位
TensorWave,一家专注于提供基于AMD硬件的GPU云平台的初创公司,宣布已完成4300万美元的融资,由Nexus Venture Partners领投,公司估值达到1亿美元。此轮融资采用了SAFE(未来股权简单协议)形式。TensorWave的平台旨在提供优化的计算能力,专注于AI模型的训练、推理和部署,减少延迟并提供计算资源的灵活性。
TensorWave的使命是帮助企业在无需大量基础设施投资的情况下扩展其AI工作负载,同时减少对Nvidia的依赖。该公司的首席执行官Darrick Horton表示,他们意识到了Nvidia在GPU市场的垄断现象,并希望提供可行的替代方案以恢复市场竞争。TensorWave的总部设在拉斯维加斯,该地区的能源成本和运营费用较低,且团队与当地风险投资社区有着紧密联系。
TensorWave提供按小时租用GPU计算资源的服务,并要求至少六个月的合同期限。Horton指出,AMD MI300X的价格比Nvidia的GPU H100便宜,使得TensorWave能够将节省的成本传递给客户。此外,TensorWave还计划使用其GPU作为大规模债务融资的抵押品。
投资者对TensorWave的增长轨迹表示满意,预计年底经常性收入将增长8倍。TensorWave目前已有300万美元的年经常性收入,预计一旦将其MI300X的容量提高到20000个,年底将达到2500万美元。公司计划在今年年底开始使用AMD可能推出的下一代MI325X GPU,以应对日益增长的市场需求。随着TensorWave的迅速扩张,它有可能打破英伟达在AI算力领域的垄断地位。
4. 前亚马逊高管戴夫·克拉克创立供应链初创公司Auger,获1亿美元A轮融资
前亚马逊全球消费者部门CEO兼Flexport首席执行官戴夫·克拉克(Dave Clark)在贝尔维尤(Bellevue)成立了一家名为Auger的供应链科技初创公司,并从风险投资公司Oak HC/FT获得了1亿美元的A轮融资。Oak HC/FT是总部位于康涅狄格州斯坦福德和旧金山的风险投资公司,虽然以医疗保健和金融科技领域的投资闻名,但也对物流初创公司有所涉足。
Auger公司旨在通过一个基于人工智能的系统整合数据,减少供应链中的低效环节,提供实时洞察和自动化解决方案,以帮助大型企业做出更明智的决策。其核心理念源于克拉克在亚马逊23年的丰富经验,特别是在全球供应链领域。克拉克在亚马逊期间以消除低效、优化流程的声誉著称,推动了包括“最后一英里”包裹配送网络、Prime Air货运机队等重要项目。Auger是克拉克首次从零开始创立的公司,他将融合参与过的各种文化和经验,致力于解决全球供应链中的重大问题。
克拉克选择在西雅图地区启动Auger,主要是因为该地区拥有丰富的供应链专业人才。Auger的目标客户是那些拥有复杂全球供应链的财富100强公司,尤其是涉及制造、分销和零售的大型企业。克拉克认为,供应链技术市场潜力巨大,预计该市场规模将从现在的250亿美元增长到2030年代初期的500亿美元,年增长率接近20%。这次融资将主要用于Auger的初期团队组建和技术平台开发,并考虑收购一些具备创新技术和优秀人才的企业以加速发展。
5. 使用 LLM 构建应用程序的开发平台Braintrust完成3600万美元A轮融资,Andreessen Horowitz领投
使用 LLM 构建应用程序的开发平台Braintrust在A轮融资中成功筹集了3600万美元,该轮融资由知名风险投资公司Andreessen Horowitz领投,公司估值达到1.5亿美元。Braintrust通过迭代的LLM工作流程,适应了非确定性模型和不可预测的自然语言输入,从而简化了构建强大LLM应用的复杂性。用户可以轻松回答关于模型和提示变化的影响的问题,比如“更改提示时哪些示例会退化?”或“尝试这个新模型会怎样?”。
Braintrust的评估由三个组成部分:提示、评分器和示例数据集。提示用于引导LLM并跟踪其性能;评分器使用行业标准的自动评估或自定义代码来打分;数据集则集成了从生产和测试环境中捕获的评分示例,形成“黄金”数据集,这些数据集是集成的、版本化的、可扩展的和安全的。
该平台的特点是为技术和非技术团队成员直观设计,并且代码与用户界面同步。行业领导者已经加入使用Braintrust,他们认为Braintrust填补了评估非确定性AI系统的关键空白,将评估工作流程转变为主流工程过程,并为AI产品带来了端到端的测试,帮助公司产生有意义的质量指标。Braintrust已成为AI项目启动的首选平台,它改变了游戏规则,为寻找和解决问题提供了简便的方法。
6. 企业级全栈式文字生成平台Writer寻求1.5亿至2亿美元融资,估值达19亿美元
Writer,一家专注于企业级AI文字生成的平台,正在寻求1.5亿至2亿美元的融资,估值达到19亿美元,是一年前的两倍多。该公司推出了新的大语言模型,旨在与OpenAI等企业竞争。Writer的模型训练成本相对较低,仅花费约70万美元,而其他竞争对手则需数百万。Writer使用合成数据降低成本,同时保护隐私,这种方法正变得日益流行。
Writer的平台围绕其自研的Palmyra模型构建,提供Knowledge Graph、AI Guardrails和Application Layer等功能,满足企业在营销文案、数据分析和自定义AI应用等方面的需求。Palmyra模型专注于商业数据,不使用有版权问题的内容,保证了输出结果的干净和专业度。Writer承诺数据私密性,提供私有化部署,并针对企业需求进行模型微调。
Writer面临的竞争包括同赛道的创业公司、科技巨头如Google和Microsoft,以及LLM公司。尽管竞争加剧,Writer凭借其企业级安全保障、全栈式内容生成和管理平台,在企业市场中占据优势。公司目前已有250多家企业客户,包括Accenture、Uber、Salesforce等,使用Writer的技术进行支持、IT、运营、销售和市场营销等工作。Writer的增长和市场接受度表明,其在AI文字生成领域具有强大的潜力和市场认可。
本文由阿尔法公社综合自多个信息源,并在ChatGPT的辅助下写作,封面图片由Hidream.ai的Pixeling(千象)生成。