AI创投周报|谷歌发布Veo 2,英伟达推出掌上AI超算,Databricks创AI融资新纪录

AI创投周报是阿尔法公社关于全球人工智能投资的资讯周报,适合创业者和投资人参考。


阿尔法公社聚焦科技天使投资,近期集中投资了十余家AI初创企业,我们瞄准高段位创业者,投资了加拿大工程院外籍院士、美国工程院院士担任CEO的数个项目,以及国家重大专项首席专家、中国CIO标杆人物、大厂高端人才等创始人项目,包括HiDream智象未来、八方地动、创享数智等。


本视频由“千象”(网址:www.hidreamai.com)生成


本周,我们观察到AI领域的新动向和新趋势:


1. 谷歌发布一系列AI视频和图像生成技术:Veo 2、Imagen 3和Whisk。Veo 2是谷歌最先进的视频生成模型,以其4K高清分辨率和对现实物理、运动细节的深刻理解脱颖而出。全面升级后的 Imagen 3 图像生成模型能够提供更为明亮的图像质感和更为精准的构图,可以准确还原用户指定的艺术风格和纹理细节。此外,谷歌还推出了Whisk工具,该工具允许用户通过输入图像来定义主体和场景,实现创意混合和生成新图像。


2. 英伟达最新发布的Jetson Orin Nano开发者套件:性能涨70%,降价50%。英伟达最新推出紧凑型生成式AI超级计算机——Jetson Orin Nano Super开发者套件,该产品以其卓越的性能和亲民的价格成为焦点。该套件在算力上实现了70%的增长,同时还实现了内存带宽增加50%,功耗维持在25瓦的性能提升。其价格也从499美元降至249美元(约人民币1800元),降幅达50%。


3. Databricks宣布其J轮融资目标为100亿美元,目前已完成86亿美元。AI数据分析公司Databricks宣布其J轮融资目标为100亿美元(约合人民币728亿元),目前已完成86亿美元(约合人民币626亿元),超越了OpenAI在10月获得的65亿美元融资。本轮融资由Thrive Capital领投,使得Databricks估值达到620亿美元(约合人民币4517亿元)。


图片

人工智能产品和技术的新突破


1. 谷歌全新发布一系列全新AI视频和图像生成技术:Veo 2、Imagen 3、Whisk


谷歌近日发布了一系列AI视频和图像生成技术,包括Veo 2、Imagen 3和Whisk。Veo 2是谷歌最先进的视频生成模型,能够理解电影摄影语言,例如指定镜头类型、画面风格或电影特效,从而生成细节丰富、真实感强的视频内容。研究团队表示,Veo 2 的功能将逐步通过 VideoFX 、YouTube、Vertex AI 等工具面向更多用户开放,并计划于明年拓展至 YouTube Shorts 等产品。谷歌还对 Imagen 3 图像生成模型进行了全面升级,使得该模型能够提供更为明亮的图像质感和更为精准的构图,可以准确还原用户指定的艺术风格和纹理细节。目前,Imagen 3 已通过 ImageFX 工具在全球 100 多个国家开放。此外,谷歌还推出了Whisk工具,该工具允许用户通过输入图像来定义主体和场景,实现创意混合和生成新图像。


值得关注的是,Veo 2在许多性能方面远超Sora:Veo 2具有高达4K的分辨率,大大提升了画面细节和真实感;能实现更强大的相机控制选项,以更精确的方式生成运动画面;有效改善人体动作和表情的幻视问题;具有更好的物理建模和时间一致性。


图片

网友用Veo 2生成的切西红柿的视频

图片

网友用Sora生成的切西红柿的视频

来源:https://blog.google/technology/google-labs/video-image-generation-update-december-2024/


2. 英伟达推出Jetson Orin Nano开发者套件:性能涨70%,降价50%

英伟达最新推出紧凑型生成式AI超级计算机——Jetson Orin Nano Super开发者套件,该产品以其卓越的性能和亲民的价格成为焦点。由于这款新产品体积小巧,大小仅与手掌相当,因此被称为“掌心AI超算”。


这款“掌心AI超算”在算力上实现了70%的增长,达到67 TOPS(INT8),同时还实现了内存带宽增加50%,功耗维持在25瓦的性能提升。令人惊喜的是,其价格从499美元降至249美元(约人民币1800元),降幅达50%。该套件包括8GB SoM和参考载板,采用6核Arm CPU和NVIDIA Ampere架构GPU,具备1024个CUDA核心和32个张量核心。Jetson Orin Nano能够运行7B、8B的大型量化模型,如阿里Qwen和Llama;支持最多4个摄像头,从而提供比以往更高的分辨率和帧率;支持多个并发AI应用管道和高性能推理。英伟达将这一系列产品定位为机器人处理器,能够为商业 AI 开发者、科技爱好者和学生等各类人群提供更强大的生成式 AI 性能。

图片
来源:https://blogs.nvidia.cn/blog/jetson-generative-ai-supercomputer/

3. OpenAI新产品系列直播Day 6-Day10


Day-6 GPT-4o实时视频通话、屏幕共享:GPT-4o的语音和视觉功能为用户提供实时的视觉互动体验,同时这也使得GPT可以更好地理解用户的动作和环境,并在后续对话中对相关问题做出更为准确的回答。此外,屏幕共享让GPT能够查看用户屏幕,提供即时建议和反馈,从而提升工作效率。


Day-7 ChatGPT上线Projects功能:OpenAI推出了名为“Projects In ChatGPT”的新功能,并称其为今年发布的最重要的AI功能之一。该功能整合了ChatGPT的各项能力,使用户可以在项目中上传文件、设定个性化指令,并便捷地定制ChatGPT。


Day-8 ChatGPT集成高级语音模式Her,实现边聊边搜并全球免费:ChatGPT搜索功能向全球用户开放,用户可在移动端或桌面应用程序进行免费搜索。此外,其搜索功能还集成到了高级语音模式Her中,使用户可以边聊边搜。


Day-9 “满血o1” API放出:最强模型o1的满血版API正式对第三方开发者开放,可支持函数调用、开发者消息、结构化输出等功能。


Day-10 开通ChatGPT热线:OpenAI开通了ChatGPT热线服务,美国电话号码用户可以通过拨打1-800-242-8478与GPT进行对话。无论是智能手机、翻盖手机还是老式转盘电话都能使用,每月可免费通话15分钟。此外,全球用户现也可通过WhatsApp发送文本消息与ChatGPT交流。这些新服务无需ChatGPT账号,一定程度上提升了GPT的易用性和可访问性。

图片
OpenAI Project功能
来源:https://openai.com/12-days/

4. CMU等研究实验室发布开源生成式物理引擎Genesis


近日,CMU联合其他20多所研究实验室开源发布的一款生成式物理引擎Genesis,意为“创世纪”,是一个专为通用机器人和物理AI应用设计的、能够生成4D动态世界的物理模拟平台。Genesis的特点包括简单易安装的API、前所未有的并行模拟速度、支持多种物理求解器的统一框架、照片级真实感的光线追踪渲染、可微分性、物理上精确且可微分的触觉传感器,以及原生支持生成式模拟。这些特点使得Genesis能够支持多种硬件和操作系统,并在单台RTX4090上实现比实时速度快约430,000倍的模拟速度,仅需26秒就能训练完成一个可迁移到真实世界的机器人运动策略。目前,Genesis的开源底层物理引擎和模拟平台已经发布,未来将逐步推出对生成框架的访问。Genesis性能卓越,效果惊艳,为机器人技术及其他领域实现全自动数据生成提供了可能。


图片

项目贡献者 CMU 机器人研究所博士生 Zhou XianZhou Xian 展示了个用 Genesis 打造的俄罗斯方块游戏,其中的方块是果冻材质的,并且能以符合现实的物理规律运动

图片

来源:https://genesis-embodied-ai.github.io/


5. Meta公布黑科技:EMG腕带与Orion增强现实眼镜的产品原型

      

在Connect 2024大会上,Meta展示了EMG腕带与Orion增强现实眼镜的产品原型。这些设备可以让用户在不接触物理键盘的情况下,通过手腕上检测到的肌肉电信号来控制数字内容,实现科幻电影中的隔空操作。此外,在近日NeurIPS 2024 的“数据集和基”子会场中,Meta还发布了两个数据集——用于隔空打字的数据集emg2qwerty 和用于解决肌电信号与手部运动之间映射问题的数据集emg2pose。emg2qwerty数据集包含108名参与者的520万次按键记录,总计346小时,帮助实现通过手腕上的肌肉电信号自动解码对应虚拟键盘上的按键。而emg2pose数据集包含了193名参与者的370小时的sEMG数据和手部姿态数据,通过高分辨率动作捕捉阵列生成手部姿态标签,总计超过8000万个姿态标签,帮助实现提供对手部细微动作的深入洞察。

图片

来源:https://www.meta.com/blog/quest/orion-ar-glasses-augmented-reality/


6. GitHub Copilot 在VS Code上开启免费使用

      

Visual Studio Code(VS Code)迎来重大更新:GitHub Copilot 免费使用。开发者可以免费通过一个GitHub账号在VS Code中启用GitHub Copilot,享受AI代码助手的功能。免费版GitHub Copilot提供每月2000次代码补全和50次聊天请求,以及访问GPT-40和Claude 3.5 Sonnet模型的服务。GitHub Copilot 现已全面整合到 VS Code 编辑器中,此外,还新增了一系列强大功能,包括多文件编辑Copilot Edits、自定义指令custom instructions、语音输入VS Code Speech等。


图片

Github Copilot在VS Code编辑器中新增Copilot Edits等亮眼功能

来源:https://github.com/features/copilot


图片
人工智能初创公司的新融资


1. Databricks宣布其J轮融资目标为100亿美元,目前已完成86亿美元,创AI融资新纪录


官方网站:https://www.databricks.com/


AI数据分析公司Databricks宣布其J轮融资目标为100亿美元(约合人民币728亿元),目前已完成86亿美元(约合人民币626亿元),超越了OpenAI在10月获得的65亿美元融资。本轮融资由Thrive Capital领投,使得Databricks估值达到620亿美元(约合人民币4517亿元)。


Databricks由七位加州大学伯克利分校的教授和数据科学家联合创办,已成为全球最具价值的AI公司之一。Databricks的核心产品Delta Lake是一种增强型数据湖解决方案,支持事务存储层,并能与AWS、Azure、Google Cloud等云平台深度集成,使得用户能在单个平台上处理各类数据并进行深入分析,极大提升了数据处理的效率与可靠性。目前,公司计划将融资资金用于开发新的AI产品、进行战略性收购以及扩展国际市场。

2. Liquid AI获2.5亿美元的A轮融资,AMD领投


官方网站:https://www.liquid.ai/


Liquid AI宣布获得2.5亿美元A轮融资,由AMD领投,融资后公司估值达到23亿美元(约合160亿人民币)。


Liquid AI成立于2023年3月,致力于开发和提供创新的人工智能解决方案。Liquid AI提出的基于秀丽隐杆线虫神经结构的液体基础模型(Liquid Foundation Model, LFM)通过动态权重更新和基于非线性微分方程的连续时间建模,以更高效、轻量化的方式挑战了传统Transformer架构。与同等规模的传统模型相比,LFM在多个基准测试中表现卓越。此外,Liquid AI还开发了STAR优化框架,通过模拟自然选择的过程,自动化优化神经网络架构,进一步提升了模型的适配性和效率。目前,Liquid AI的技术已应用于基因数据分析、金融欺诈检测和自动驾驶等领域,其灵活性和轻量化特性受到产业界的关注。Liquid AI表示,此次融资将用于推动技术研发和市场化进程,扩大技术团队规模,并加速模型的行业落地。


3. 谷歌“兄弟公司”SandboxAQ完成超3亿美元的融资,估值达56亿美元


美国量子人工智能初创公司SandboxAQ宣布完成超过3亿美元的融资,此次融资的投资者包括Fred Alger Management、T. Rowe Price和Breyer Capital等,此次融资后公司估值达到了56亿美元。


SandboxAQ于2022年从谷歌母公司Alphabet独立出来,由前谷歌首席执行官Eric Schmidt担任董事长,旨在加速开发用于计算的先进人工智能系统,为各个领域的大型企业客户构建特定应用场景新模块。SandboxAQ的首席执行官Jack Hidary强调,公司专注于量化关系,与当前流行的依赖语言模型的生成性人工智能模型思路不同。公司表示,此次融资的资金将主要用于开发其大型定量模型(LQMs)和拓展在医疗保健、金融等多个行业的AI应用。


4. Backflip获3000万美元的A轮融资,NEA和Andreessen Horowitz领投


AI 3D建模和CAD设计公司Backflip宣布完成了3000万美元的A轮融资,本轮融资由New Enterprise Associates(NEA)和Andreessen Horowitz领投。该轮融资还吸引了包括微软CTO Kevin Scott、Android创始人Rich Miner以及Transformer架构发明人Ashish Vaswani在内的科技界重量级天使投资人。


Backflip成立于2022年,致力于通过AI技术重塑传统3D建模流程。Backflip开发的AI 3D建模平台能够根据文本描述、照片或草图自动创建3D模型。根据公司首席技术官Benhaim的说明,这项技术在训练效率上比现有方法快60倍,在推理速度上快10倍,在空间分辨率上高100倍。此外,Backflip还创建了一个包含约1000万个3D零件蓝图的训练数据集。该平台兼容多种3D打印材料,包括金属、碳纤维和塑料,并且能够处理如防水结构等特殊设计要求,显著缩短了CAD设计时间,将其从传统的小时级甚至天级缩短至分钟级,极大地提高了设计效率。Backflip表明,此轮融资的资金将用于进一步发展Backflip的AI技术,扩大团队规模,并推动其解决方案在市场上的应用。


5. Perplexity宣布收购了Carbon:将AI搜索与工作文件连接起来


AI搜索独角兽公司Perplexity宣布收购了西雅图的初创公司Carbon。Carbon专注于检索增强生成(RAG),实现了大型语言模型在生成答案前访问外部数据库信息的能力。Perplexity首席执行官Aravind Srinivasan表示,通过引入Carbon的技术,将使Perplexity的答案引擎更容易从多种信息源获取信息,包括内部数据库、云存储以及文档库等。Perplexity预计于2025年初实现搜索Notion、Google Docs、Slack等企业应用程序中文件和工作消息的功能,从而使用户企业能够快速搜索公司积累的大量非结构化数据。企业AI搜索正成为AI领域竞争激烈的热点,而此次收购是Perplexity继2023年收购Spellwise之后的第二次收购。

本文由阿尔法公社综合自多个信息源,并在ChatGPT的辅助下写作,封面图片由Hidream.ai的Pixeling(千象)生成。


关于阿尔法公社