甲辰岁末,多家杭州公司顶着“东方神秘力量”的光环,密集被放到国内外的聚光灯下。一时间,“杭州四小龙”的说法在江湖上不胫而走。
杭州四小龙
一个是国产首款3A大作,让唢呐声第一次在被誉为游戏奥斯卡的TGA上响起,即便遗憾错失年度最佳游戏,也留下了“功成何须袈裟证”的江湖美誉;一个是XR眼镜的中国代表,屡次被《时代周刊》、Geeky Gadgets等海外媒体拿来和Meta比较。
这一猴一镜也只是预热。
三天后的下午,宇树科技发布了B2机器狗进阶版B2-W的炫技视频。视频里,四足变四轮的它轻松展示了托马斯全旋、侧空翻、360°跳跃转体等丝滑连招,还能从2.8米高处飞跃而下。这条视频很快得到了马斯克的转发和评论。
数小时后,全球的AI圈子也炸锅了。来自中国的大模型创业公司DeepSeek(深度求索)上线并同步开源 DeepSeek-V3模型,并公布了长达53页的训练和技术细节。他们用不到同行十分之一的成本训练出的大模型,在多项指标上领先全球包括GPT-4o在内的其他大模型。
和看到B2-W一样,大量被惊掉下巴的国外网友发问:“中国人是怎么做到的?”而在国内,有网友敏锐地发现两家公司都是杭州的。于是,赶在甲辰龙年的尾巴,江湖上突然就有了“杭州四小龙”“杭州六小龙”的说法。
其中,宇树科技、深度求索和游戏科学这三家是所有名单公认的。其他上榜的除了Rokid,还有去年被李强总理调研、国内脑机接口的代表企业强脑科技,同样做机器狗和人形机器人、有深厚浙大背景的云深处科技,以及具备全球最大的可交互三维数据能力的空间智能企业群核科技等。
英雄莫问出处
严格来说,这已经不是宇树科技的机器狗第一次出来“炸街”了。这家在2016年创立的公司,已经拿下全球四足机器人市场的大半壁江山,出货量占比超过六成,客户里包含亚马逊、谷歌、英伟达、Meta等。
创始人王兴兴是余姚人,生于1990年,从小就表现出了对机械的热爱和极强的动手能力。10岁时,他就看到了MIT实验室做出的机器人。主导这一项目的Marc Raibert后来成了波士顿动力的创始人,把机器狗带入大众视野。
读大学时的王兴兴,曾花200元手工完成了一个简易版双足机器人。
不过王兴兴并没有沿用前辈做出点眉目的液压控制方案,从一开始就主攻电机驱动。研究生期间花了1万元不到做出XDog,获得创业比赛的二等奖,拿了8万元的第一桶金。可惜2015年那会儿,没有投资人看好这一领域,无奈之下王兴兴加入了大疆。
好在他顺手把XDog的视频传到网上,后来被人转到外网引发了热议,才有了一系列的转机。10年后,宇树被媒体描述成为“地面大疆”。
从小和各种机械部件打交道,王兴兴对每个构件的设计和成本都了然于胸,所以宇树的机器狗性能卓越,价格反倒大幅低于同行。
既有工程师的才华,又有商人精明的头脑,王兴兴却并不是传统意义上的学霸。他本科就读于浙江理工大学,因为在英语上的偏科,错失了进入浙大读研的机会。
但他在电机驱动机器狗领域有绝对的自信,XDog横空出世那会儿,MIT的博士都问他要了毕业论文——2019年,MIT开源了Cheetah四足机器狗的软硬件方案,在重要的电机部分,和三年前的XDog一模一样。
说到自信,两年前就写好TGA年度最佳游戏获奖感言的冯骥不遑多让。他说赢的时候才自信只是对结果的复读,他和游戏科学一直在“做具体的事,做困难的事,做相信的事……在做这些,当然应该自信”。
20年前,还就读于华中科技大学生命学院生物医学工程专业的冯骥,本有机会继续深造,却一入《魔兽世界》误了学业。他写下6000字的雄文《谁谋杀了我们的游戏?》,带着改变国产网游糟糕现状的满腔热血进入游戏行业。
10年前,他成立游戏科学,决心要用扎实的技术去解决具体问题,用实事求是的态度做一款高品质的游戏。2018年,他和团队终于下定决心“重走西游”,弥补10年前在《斗战神》上留下的遗憾,《黑神话:悟空》正式踏上取经路。
把GPU“连”起来的浙大人
对于2018年,中国股民充满了痛苦的回忆。上证指数大跌25%,个股“横尸遍野”。但在方兴未艾的量化江湖出现了一支名为“幻方”的新锐,全年取得了正收益。
“幻方”二字源于中国传统算术,常见的“九宫格”就是幻方的一种。如果光看幻方量化的团队构成,很难想象他们是一家金融公司。
公司CEO徐进本科毕业于浙大竺可桢学院混合班,是浙江大学信息学院信号与信息处理专业博士,研究的方向是机器人自主导航、立体视觉等。公司的实际控制人梁文锋是个80后,毕业于浙大软件工程专业,主修软件工程,人工智能方向,2008年开始研究量化交易。
2016年,幻方在交易系统里融入了AI,两年后“把AI确定为公司的主要发展方向”。2019年,幻方管理规模超过100亿,成为国内量化私募“四巨头”之一。同一年,他们开始研究怎么构建大规模GPU集群。
从那年开始,不缺钱的他们每年会购买大批GPU。到了2021年幻方量化对超算集群系统的投入增加到10亿元,并且搭载了超10000张英伟达A100显卡。江湖开始盛传:“中国持有高性能GPU最多的机构不是人工智能公司,而是幻方。”
2023年7月,梁文锋创立深度求索DeepSeek,专注于AI大模型的研究和开发,公司就在杭州。
同样是浙大校友共同创业,群核科技的故事始于两位创始人陈航和黄晓煌在学校的“卧谈会”。那会儿,两位就读于浙大竺可桢学院的“天之骄子”聊得最多的是计算机算力和摩尔定律。毕业后,两人远赴美国,继续攻读计算机图像图形专业。
左起:朱皓、黄晓煌和陈航
去美国,黄晓煌拿的是英伟达全额奖学金,博士研究方向是GPU高性能计算,毕业后顺理成章地加入英伟达,从事GPU芯片并行计算的编程框架搭建以及CUDA的开发。那时他恐怕还意识不到,自己正在参与书写一部波澜壮阔的科技史诗。
回国后,两位室友创立了群核科技。名字来源于他们搭建的GPU架构Many core processor——多核心处理器。最初他们的想法是把GPU放到云端,支持渲染等需要高性能计算的应用,家居设计成了最佳落地场景。很长一段时间,旗下“酷家乐”这个SaaS产品要比群核更有名。
得益于前期在家装领域,中期在工业4.0领域的长期沉淀,群核积累了大量物理世界的数据。在AI逐步从数字世界走入物理世界的过程中,坐在了“金矿”上——他们合成的数据不仅质量高,还遵循了物理规律。
去年11月20日,他们首次对外公开了其两大技术引擎:群核启真(渲染)引擎和群核矩阵(CAD)引擎。一个对应的是拥有超级算力支撑的万卡集群,一个对应的是由海量数据组成的“物理世界模拟器”。
后者比OpenAI对Sora“世界模拟器”的定义多了两个字,更强调“真实”。
风起于2018年
在梳理“杭州四小龙”们的发展历程时,自媒体“数智前线”敏锐地发现,2018年是关键的节点。那一年,群核科技和英国帝国理工大学、美国南加州大学、浙江大学等高校联手推出InteriorNet数据集,为室内环境理解、3D重构、机器人交互等研究提供数据基础。
那年年初,宇树科技拿到了新的融资,下半年预售产品开始发货,公司流水终于慢慢滚动起来。王兴兴熬过了至暗时刻。
几乎同一时间,《黑神话:悟空》立项,半年后游戏科学的精锐团队搬到了杭州,冯骥说这里的节奏没有深圳那么快,房价也不太高,大家能够耐得住性子。
那年年中,Rokid召开了一年一度的Rokid Jungle。习惯留络腮胡的祝铭明喜欢用猴子来称呼自己和团队。他硕士毕业于浙大网络多媒体实验室,当时就在尝试数字技术和现实的结合。
2007年,他创立“猛犸科技”做手机操作系统,三年后被阿里巴巴收购,他进入阿里掌舵阿里巴巴最神秘的部门——M工作室,探索人机交互的更多可能。主导这次收购的,是如今掌舵阿里的蔡崇信。
在2018年,Rokid Jungle的主角还是智能音箱。Rokid Glass AR眼镜只是one more thing。一年后,主配角易位,智能音箱业务最终没能阻挡巨头们疯狂价格战的铁骑,AR眼镜反倒成了力挽狂澜的救命稻草。
祝铭明也因此回到了“原点”:2012年4月,他现场参加了谷歌眼镜的发布会。数月后,念念不忘地在朋友圈发问,自己想出资找朋友做个谷歌眼镜类似的东西,能否推荐相关人才。
2018年年底,强脑科技正式落户杭州的人工智能小镇。他们收获了一位特殊的员工,手部有残疾的倪敏成。一年前,他佩戴假肢用意念控制它写毛笔字,完成了强脑科技在国内的首秀。
在他到来前,强脑科技的假肢数据主要源于工程师自己佩戴收集。曾经有很长一段时间,从哈佛大学脑科学中心博士毕业的创始人韩璧丞不得不用自己做实验,在头皮上抹医用导电膏,最多时一天洗了30多次头,一年下来洗了800多次。
因为打越洋电话时儿子总是在洗头,韩璧丞的母亲一度怀疑儿子是不是在外打工,专门给人洗头。
回国后,这家比马斯克的Neuralink成立还早一年的脑机接口公司驶上了快车道,越来越多身患残疾、热爱生活的人戴着他们的假肢弹起钢琴、举起火炬。
对未来的一次预演
在被称为“人工智能元年”的2018年,杭州聚齐四小龙只能算是青蘋之末。一年前,谷歌的一位研究员发布了一篇论文《Attention Is All You Need》,介绍了一个新的模型架构Transformer。
区别于以往的神经网络模型,它使用了全新的“自注意力机制”来处理语言,能让机器更好地关联上下文,更精准地理解人类语言。
到了2018年,谷歌基于Transformer推出了Bert模型,让机器知道一段话里提到的“苹果”究竟指的是吃的水果,还是苹果公司。另一家成立三年的人工智能初创公司OpenAI推出了一个名为GPT的系列模型,让机器看得懂也说得顺。
但这些都是回头看起来的轻松写意。那年,即使AI算力方面的业务大幅增长,英伟达还是被资本抛弃,到年底股价只剩3美元,差不多是去年最高价的五十分之一。
不过他们还是坚持给出了关于未来的一系列预演。比如,在年初的CES上,黄仁勋展示了AI在自动驾驶方面的成果。尽管当年3月,Uber因为无人驾驶测试撞死行人引发了巨大争议。
年底,英伟达还做了一个高精度、超逼真的人脸AI生成系统,可以按照要求生成细节极其丰富的人脸图像,以及和MIT合作尝试用视频生成视频。
这些在当时看上去像魔法的技术,最终影响了包括杭州四小龙在内,所有与AI、计算、数据相关的科技公司日后的发展轨迹。
2018年,AI的风也吹遍了中国的大江南北。继2017年后,人工智能再次被写入政府工作报告;在时任上海市委书记李强的主导下,第一届世界人工智能大会召开。去年,在达沃斯论坛上,李强特地为第七届大会发出邀请。
新华社资料图
当年10月10日,华为发布了两款AI芯片。一个月多后,美国商务部工业安全局出台了一份针对关键技术和相关产品的出口管制框架,将对人工智能、芯片、机器人、量子计算、脑机接口以及生物技术等前沿科技实施出口管制。
一场中美之间的科技对决徐徐拉开大幕。
为什么是杭州?
2018年,杭州也叩开了通向未来的大门。当年,杭州正式提出并动员“中国数字经济第一城”的建设,为如今高水平重塑全国数字经济第一城,数字经济和人工智能的双向奔赴埋下伏笔。
2月14日,西湖大学正式获得批复,施一公开始了“试点创建新型民办研究型大学”的求索之路。他们面向全球招收顶尖的科研人员,看的不是他们的论文篇数、引用率等数据,而是在自身深耕的领域有没有独一无二的想法。
一年后,他们迎来了戴着眼镜、书生模样,从事人工智能研究的年轻人蓝振忠。他是知名论文“ALBERT:A Lite BERT for Self-Supervised Learning of Language Representations”的第一作者。
蓝振忠用一个暑假的时间设计了一个解决方案,能有效降低Bert模型的训练参数,并且保证训练效果——像极了多年以后DeepSeek所做的事。
如果杭州科技小龙的名单继续外扩,他的西湖心辰肯定会名列其中。
同样的,当谈到DeepSeek,许多行内人会自然而然地提到另一款来自杭州的开源模型,阿里云旗下的Qwen。提到机器狗,宇树科技之外,还有家名字很有诗意的公司“云深处”。创始人朱秋国来自浙大,他们的轮足机器人“山猫”比宇树的B2-W发布更早,同样引发了轰动。
在全新的AR/AI眼镜赛道,也挤满了浙大精英创业者。光电本身就是浙大的传统优势专业。除了Rokid,这份名单里的杭州面孔包括被字节跳动投资的李未可,凭借技术切入泳镜细分赛道的光粒科技,从脑机接口跨界来的Looktech,等等。
他们遍地开花地分布在余杭、滨江、西湖等杭州各个区。在AI开启的新一轮技术浪潮下,这座城市的创业江湖远比多了一个“杭州四小龙”要热闹。
至于为什么他们会出现在杭州,游戏科学落户西湖区的艺创小镇后,有专员帮这群日夜颠倒的年轻人搞定单身公寓,协调食堂给他们开小灶,尽量做好服务但不打扰,以至于黑猴一夜成名后面对媒体的采访,只能抱歉地表示“平时打交道并不多”。
得知强脑科技要回国,余杭区的领导火速赶到波士顿,在一堆杂物的地下室见到了韩璧丞,郑重发出邀请。
这些曾经在服务阿里巴巴、蚂蚁集团、海康威视、华为杭研所等科技公司总结出来的经验,成了杭州打造优质营商环境基因里的东西。再加上深植其中的商业基因和活跃的资本,构成了对高端人才巨大的吸引力。
杭州全景 韩丹 摄
面对国外科技巨头的竞争,梁文锋说中国的企业应该要自信,要学会引领技术创新,学会组织和培养自己的高密度人才。王兴兴说高学历并不代表一切,“没有人特别天才,大家其实都差不多。”
冯骥希望大家都能继续怀着自信与雄心,保持勇敢、诚实和善良,踏实做好每一件具体的小事,坦然接受结果,一直在取经的路上,直至生命最后一刻。
这些关于自信、勇敢的叙事对冲着现实的困难,在甲辰龙年岁末,“杭州四小龙”们让许多人再次听到了新力量破土而出的声音。
橙柿互动·都市快报记者 梁应杰
编辑 潘俐
审核 毛迪 陈欣文