划重点
01阶跃星辰已完成B轮融资,总融资金额达数亿美元,国资、战略和财务投资人多家参与。
02创始人兼CEO姜大昕曾是微软全球副总裁,团队拥有丰富的技术背景和行业经验。
03阶跃星辰战略聚焦在“超级模型+超级应用”,推出to C产品「跃问」,支持多模态交互。
04除此之外,大模型六小虎今年均有新融资信息传出,其中月之暗面、智谱AI估值达到200亿人民币。
以上内容由腾讯混元大模型生成,仅供参考
《AI未来指北》特约作者 晓静
编辑 郑可君
国内大模型“六小虎”成员又获得了新的融资,这次是阶跃星辰。
腾讯科技获悉,阶跃星辰已于近日完成 B 轮融资,总融资金额达数亿美元。此次融资有国资、战略和财务投资人等多家参与,核心投资方包括上海国有资本投资有限公司及其旗下基金,战略和财务投资人包括腾讯投资、五源资本、启明创投等。
该笔融资将用于继续投入基础模型研发,强化多模态和复杂推理能力,并通过产品和生态加大覆盖 C 端应用场景,提供丰富的用户体验。
阶跃星⾠于 2023 年 4 ⽉由微软前全球副总裁姜⼤昕博⼠创办,直到2024年3月才正式亮相。因此,它也被称为大模型明星创业公司之中最为低调的一家。据报道,阶跃星辰的早期投资中,已经有启明创投、五源资本等一线风投的身影,但并未公布具体的融资额度。
而在2024年6月,阶跃星辰传出正在进行20亿美元估值的融资,此后,阶跃星辰也加入了大模型创业企业头部玩家俱乐部,与智谱、月之暗面、零一万物、百川智能、MiniMax 组成的“大模型五虎”,一同组成“大模型六小虎”。
微软系创业团队,2024年又有AI大牛加入
除了估值因素,阶跃星辰的人才密度,也是吸引行业关注的最关键因素之一。
阶跃星辰的创始人兼CEO姜大昕,曾是微软全球副总裁和微软亚洲互联网工程研究院(STCA)的首席科学家。姜大昕在微软期间主导了多个知名产品的研发,包括微软搜索引擎Bing、智能语音助手Cortana、微软云Azure以及Microsoft 365等。他在数据挖掘和自然语言处理(NLP)领域有着深厚的研究背景,发表了100余篇论文。
图:阶跃星辰创始人兼CEO姜大昕
阶跃星辰的系统负责人朱亦博,毕业于美国加州大学圣芭芭拉分校,曾任微软研究院研究员,并在字节跳动、Google等公司任职,拥有丰富的系统建设与管理实践经验。
阶跃星辰的数据负责人焦斌星,中科大和MSRA联合培养博士,毕业后成为微软的一员,曾担任微软必应引擎核心搜索团队前负责人,负责利用数据挖掘和NLP算法优化索引和搜索质量。
近日,ResNet 作者之⼀的 AI 科学家张祥⾬也加入了阶跃星辰,他是AI大牛孙剑首位深度学习博士生,未来科学大奖得主。ResNet,作为一种革命性的残差学习方法,在计算机视觉领域取得了突破性进展,其核心理念“残差连接”,可以被称为深度学习的“标配”。作为上一次AI浪潮的标志性成果AlphaGo Zero,正是融合了ResNet、强化学习以及蒙特卡洛搜索技术。而最近引发AI热潮的ChatGPT,其背后的Transformer模型同样采用了残差连接。由此可见,张祥雨在AI领域的学术地位。
AGI技术路线,战略聚焦超级模型+超级应用
根据阶跃星⾠创始⼈、CEO 姜⼤昕的规划,阶跃星⾠实现 AGI 的技术路线是:“单模态 — 多模态 —多模理解和⽣成的统⼀ — 世界模型 — AGI”。
阶跃星辰在基座模型上,主打的是“万亿参数+多模态”,在过去10个月,阶跃星⾠⼀共发布了 11 个⾃研基座模型,包含千亿参数语⾔⼤模型 Step-1、万亿参数语⾔⼤模型 Step-2 、图像理解⼤模型 Step-1V、图像⽣成⼤模型 Step-1X、视频理解⼤模型Step-1.5V、视频⽣成⼤模型 Step-Video、语⾳复刻和⽣成⼤模型 Step-tts-mini、语⾳识别⼤模型Step-Asr,以及近期发布的国内⾸个千亿参数端到端语⾳⼤模型 Step-1o Audio 等。其中,Step-2是国内⾸个由⼤模型创业公司发布的万亿参数模型。
现在大模型应用落地处于早期,最重要的是先找到有真实需求、能带来用户体验的创新场景。所以,阶跃星辰将战略聚焦在“超级模型+超级应用”。目前重点推出的to C产品「跃问」,⽀持多模态交互,可帮助⽤⼾解决⼯作和⽣活场景下的一些问题,也能辅助内容创作。
跃问的多模态智能视觉搜索功能「拍照问」,目前是国内⾸个集成到 iPhone 16相机控制键中的⼤模型应⽤产品能⼒。
一级市场投资热情不减,大模型六小虎今年均有新融资
虽然今年一级市场投资遇冷,但是资金对于大模型创业的热情不减,根据公开报道显示,除了阶跃星辰之外,大模型六小虎的其他五家,今年也均有新的融资信息传出,而月之暗面、智谱AI之后,估值更是达到了200亿人民币。
1、 月之暗面:2024年2月,月之暗面斩获超10亿美元的A+轮融资,投资方包括红杉中国、小红书、阿里巴巴,老股东跟投。2024年8月,月之暗面完成了超3亿美元的最新一轮融资,估值高达33亿美元(约240亿人民币)。
2、 智谱AI:2024年12月,智谱AI完成新一轮30亿人民币融资,估值超过200亿人民币。
3、百川智能:根据公开报道,在2024年7月25日完成了A轮融资,总融资金额为50亿元人民币,并将以200亿元人民币的估值开启B轮融资。
4、MiniMax:2024年3月,MiniMax获得6亿美元融资,估值达到25亿美元,约175亿元人民币。
5、零一万物:在2024年8月完成了数亿美元的融资,此轮融资参与方包括某国际战投、东南亚财团等多家机构。具体的估值信息未披露。
附Step系列通⽤⼤模型介绍:
语⾔⼤模型
• Step-2 万亿参数语⾔⼤模型:采⽤MoE架构,聚焦深度智能的探索,这是国内⾸个由创业公司发布的万亿参数语⾔⼤模型。
• Step-1千亿参数语⾔⼤模型:两个⽉⼀次性训练成功,已完成充分打磨,在逻辑推理、中⽂知识、英⽂知识、数学、代码⽅⾯的性能全⾯超越 GPT-3.5。
• Step-1-flash极速版⼤模型:能够处理通⽤领域的任务,上下⽂⻓度为 8K。
多模态⼤模型
• Step-1V多模态⼤模型:性能⽐肩 GPT-4V,可以精准描述和理解图像中的⽂字、数据、图表等信息,并根据图像信息实现内容创作、逻辑推理、数据分析等多项任务。2024 年 11 ⽉,LMSYS Org发布了⼤模型竞技场 Chatbot Arena 最新榜单,Step-1V 上榜,位列视觉领域中国⼤模型第⼀,总分Gemini-1.5-Flash-8B-Exp-0827 持平。
• Step-1.5V多模态⼤模型:在Step-1V的基础上进⾏了迭代,具备更强⼤的多模态理解能⼒,实现了从图像理解到视频理解的跨越升级。
• Step-1.5v-turbo 视频理解模型:具备出⾊的视频理解能⼒,能够准确识别视频中的物体、⼈物和环境。此外,它还能够「读懂空⽓」,理解视频的整体氛围和⼈物情绪。最重要的是,它能「听懂⼈话」,具备指令跟随能⼒,维持稳定的格式化输出。
• Step-1X图像⽣成⼤模型:具有强⼤语义理解与图像创意实现能⼒,可⽤于各种图像创作和设计任务。
• Step-Video 视频⽣成⼤模型:⽀持⽂⽣视频,可⽣成 1080P ⻓达 10s 的⾼清视频。
• Step-tts-mini 语⾳复刻和⽣成⼤模型 :只需上传 5s ⾳频,step-tts-mini 就够捕捉并复现个体独特的⾳⾊特征,并将情绪真实地传达出来,为用户提供更加⾃然、⽣动的语⾳⽣成与⾳⾊复刻体验。
• Step-asr 语⾳识别⼤模型 :能识别不同的⼝⾳并将语⾳精准转化为⽂字,满⾜⽤⼾多场景需求。
• Step-1o Audio 语⾳⼤模型:国内⾸个千亿参数端到端语⾳⼤模型,⽀持语⾳、⽂本等混合形式的输⼊和输出,可以快速反应并随时打断,提供超⾃然、⾼智商、⾼情商的便捷交互体验。