“从 Nvidia 去年的财报可以看出,公司的重心已经从人工智能芯片转到数据中心的系统上,如果你眼中的人工智能世界还只是芯片,那会离当今的 AI 世界非常遥远。”燧原科技创始人兼营运长张亚林这样告诉问芯Voice 。
刚进入 2021 年,国内人工智能产业出现一个令人眼睛一亮的数字:18 亿元。
燧原科技刚刚宣布完成 C 轮融资,由中信产业基金、中金资本旗下基金、春华资本领投,腾讯、武岳峰资本、红点创投中国基金等多家新老股东跟投,共融资人民币 18 亿元。
相较 2018 年是 AI 公司融资的鼎盛时期,2019 年、2020 年 AI 产业开始进入融资急速降温期。中国人工智能领域 2018 年的融资金额高达 667 亿元,2019 年、2020 年融资金额分别降至 272 亿元和 243 亿元。
在缺乏商业模式和落地场景下,投资人认为很多 AI 故事已经讲不动了。
那为什么燧原科技非但没有陷入投资人“逃离AI”的魔咒?更获得高达 18 亿元的融资。当中,腾讯更是自 2018 年 Pre-A 轮以来,连续四轮参投。
燧原科技创始人兼营运长张亚林接受问芯Voice 独家专访,畅谈面对国际巨头扎根深厚的技术实力与生态系统下,燧原要如何走出自己的道路,进而满足云端数据中心芯片的国产化需求,解决国内产业的痛点。
国产化云端AI芯片
燧原科技成立于 2018 年,是国内首家同时拥有云端训练+云端推理解决方案的新创公司。第一代产品是面向云端数据中心的 AI 训练加速卡 “云燧T10” 和推理加速卡 “云燧i10”。
其中,“云燧T10” 和由其组成的多卡分布式训练集群已在云数据中心落地商用;而“云燧i10” 也已经完成与浪潮、新华三及 Supermicro 等服务器厂商推理服务器的适配,预计在今年第一季量产上市。
综观国内面向云端数据中心的 AI 芯片,90% 以上份额都被英伟达的 GPU 盘踞。在面向云端领域上,能提供算力的国产化 AI 芯片公司不多,目前真正量产出货的有寒武纪的推理 AI 芯片,而燧原则是训练和推理都做。
值得注意的是,燧原这次融资 18 亿元後,会持续往前布局开发技术与工艺更为先进的 AI 芯片。
张亚林對問芯Voice 表示,燧原从一开始就坚持要建立全栈技术团队,能从前端做到后端设计,不单是 pre-silicon,流片回来的芯片要能点亮、测试、提升良率、改善可靠性和稳定性,更拥有与制造厂合作的能力。
如果只做到前端设计,后面的制造和封测都是以 Turn-Key 模式外包给设计服务公司去执行,会出现一个很大问题:成本根本无法控制。
张亚林分析,燧原做的和英伟达、AMD、英特尔一样是通用芯片,而通用芯片的特性之一是非常重视成本,如果团队不具备芯片的全段控制能力,意味着无法掌握成本,起跑的竞争力就先输了一半。
谈到成本控制,这也是张亚林最擅长之处。
燧原的两位创办人赵立东和张亚林都是师出 AMD。2008 年 1 月张亚林刚加入 AMD 时,赵立东是他的直属老板,当时赵立东负责整个团队的构建和项目争取,张亚林则是负责执行芯片项目。之后,赵立东加入紫光集团担任副总裁,而张亚林留在 AMD 继续担任芯片项目的主要负责人。 2018 年两人携手创办了燧原科技。
这一波 AI 芯片热潮中,从 AMD 研发体系走出来的团队非常多,创业的起点也很高,除了燧原外,还有沐曦、壁刃、天数智芯、登临、翰博等。
不同于英特尔和英伟达在中国布局不深,英特尔在国内培养的人才以软件居多,而英伟达做很多“点”的技术,要对应到北美的技术团队,技术层次较不具备“面”的能力,而 AMD 是把关键技术放到中国来。
AMD 中国成立超过 15 年,从零发展至今,已经有超过 2000 名研发工程师,从芯片架构设计到量产能力的全棧能力都具备,也因此培养出不少能真正掌握大芯片设计能力的项目领军人。基本上,很少有外商在中国的核心技术扎根如此之深。
AMD 与微软从 XBox 360 到 XBox ONE 游戏机合作已经超过十年,而张亚林曾是 AMD 的微软 XBox ONE 系列芯片项目的主要負責人,这颗芯片是在 AMD 上海研发中心主要研发的。
张亚林表示,要能商业化的公司一定要非常严格控制时间节点和计算成本,不能开发出一颗最后是带来亏损的芯片。
因为曾在 AMD 主导过大芯片项目的开发到量产,张亚林对于开发一颗芯片的 NRE(Non-Recurring Engineering)费用怎么算、芯片要卖多少量才能回本、利润如何计算等,非常有概念。
所谓 NRE 是指开发一颗芯片研究、发展、设计或测试(Research/Develope/Design/Test)过程中所产生的一次性费用,这些费用牵涉到量产之后的利润计算。
其实开发一颗芯片的 NRE 并不好算,要细化到非常细致,包括计算流片的工具成本、开发时间的长度,甚至连人员的出差费用都要算进去。
他认为,如果新创公司无法做到全棧(前端到后端)掌握,那成本绝对拿捏不准。
目前燧原量产中的产品是采用 GlobalFoundries 的 12nm FinFET 工艺结合 2.5D 高端封装技术。
GlobalFoundries 的 12nm 工艺是 14nm FinFET 工艺的微缩版本,也是当初与三星交叉授权的技术节点。AMD 最早的第一代 Zen 处理器就是采用 GlobalFoundries 的 14nm 工艺做的,基础非常稳固。
谈到客户端的拓展,燧原也规划了几条不同赛道:
互联网和垂直行业(金融、教育、医疗及运营商等),这两个部分客户对于产品性价比、兼容性的要求较高。
还有就是新基建,这部分生意不是板卡或是芯片,而是大系统解决方案,要与各种云服务商行业对接,包括公有云、私有云、混合云等。同时也与地方政府紧密合作,比如智慧城市等项目。
纵观当前的云端 AI 芯片市场,业界领先的英伟达最大优势在于其完整的生态系统。
张亚林表示,生态系统方面需要好几代的打磨,需要把开发者、商业客户、垂直行业客户、产学研协作、国家层面等每一个点都打开。
英伟达已经将营运重心从过去的 GPU 芯片“点”的层面,扩展到数据中心解决方案“面”的层级,如果企业还只是在谈芯片,那离 AI 世界会非常遥远。
商業化創新是企業可持續發展的動力
谈到国内人工智能经历了一波风风火火的狂热期,接下来的人工智能企业更重视商业化与产品要能真正落地。
张亚林常说,商業化創新是企業可持續發展的動力。
人工智能要能落地,必须能带来实质的价值,它不是噱头,而是真正实现算力,让人工智能应用普及且实惠。
有很多前瞻性的研究项目让我们对于创新未来世界保有无边的想像空间,但“算力”不是虚无飘渺的想像,而是踏实的。英伟达的 GPU 已经用十多亿美元的商业利润来告诉我们这件事。
燧原科技自 2018 年成立以来,已敲开人工智能大门。以第一代产品 “云燧T10” 和 “云燧i10” 为起点,投资方有腾讯的紧密合作,也成功打入多家服务器厂商,可以说是每一个点都踩准了。
张亚林表示,燧原未来是要与时间赛跑,要把云端算力做到極致,不管前面和后面的竞争者,要用力地往前跑,過去燧原從“ 0 到 1 ”跑很快,未來從“ 1 到 N ”要跑更快。