摩尔线程能平替英伟达？

NE时代新能源

2024-11-22 13:55发布于上海

全文4005字，阅读约需12分钟，帮我划重点

划重点

01摩尔线程成立于2020年10月，仅用4年时间于2024年11月启动上市，计划在科创板上市。

02该公司创始人张建中曾是英伟达全球副总裁，中国公司创始人，带领英伟达开拓中国市场。

03摩尔线程自主研发了MUSA统一系统架构，与CUDA无任何依赖关系，可兼容CUDA生态。

04除此之外，摩尔线程采用集群化解决方案应对算力瓶颈，推出夸娥万卡智算集群解决方案。

05尽管与英伟达在算力、制程技术和生态架构设计等方面存在差距，但摩尔线程仍被视为英伟达的平替。

以上内容由腾讯混元大模型生成，仅供参考

摩尔线程或成为上市速度最快的半导体企业之一。

2020年10月成立，2024年11月启动上市，这一过程摩尔线程仅用了4年的时间。

2024年11月12日，证监会网站显示，摩尔线程在北京证监局办理辅导备案登记，正式启动A股上市进程，辅导机构为中信证券。此外，还有消息表示，该公司将在科创板上市。

提到摩尔线程，业内都将其作为英伟达的平替看待，不仅是因为产品对标，更是因为其具备英伟达的深厚基因。

01.

中国的“英伟达”

创始人来自英伟达。

摩尔线程的创始人——张建中是英伟达原全球副总裁、中国区总经理，英伟达中国公司创始人。

张建中深耕GPU行业超过15年，覆盖产品研发、市场生态及营销领域；带领英伟达开拓中国GPU市场，建立生态系统；并推动中国市场成为英伟达全球最重要的市场。数据显示，2008年英伟达在中国的GPU市场占有率不到50%，2020年的市占率已经超过80%。

可见，张建中在为英伟达开拓中国市场方面，居功至伟。

2020年9月，张建中离开英伟达，同年10月创立摩尔线程。公司结构设计思路与英伟达也颇为相似，摩尔线程成立了AISG和MCSG两个战略部门，分别专注于AI芯片和消费级显卡的研发。

离开英伟达，短短19个月后，张建中便率队交付了一块国产全功能GPU—苏堤。它采用先进的公司架构集成、AI计算、加速、图形渲染、视频编解码、物理仿真和科学计算四大引擎。

2022年11月，摩尔线程推出了国产游戏显卡MTT S80，被誉为“国产游戏第一卡”，并且是国内唯一可以支持DX12的消费级显卡。至此，摩尔线程成为国产第一家消费级游戏显卡公司。

摩尔线程的这一成就在全世界范围内都不容小觑。要知道图形处理是GPU领域的珠峰，摩尔线程能以全功能GPU实现消费级图形处理，成为继英伟达、AMD、英特尔后第四家能创造出独立显卡的科技公司。

当然，摩尔线程全面对比哦啊英伟达。除了显卡之外，英伟达在数据中心、人工智能等领域都有布局。摩尔线程也有对应的产品布局，TO C端的桌面显卡，摩尔线程现有产品包括MTT S80、S70、S50、S30、S10。TO B端的AI大模型，摩尔线程产品包括训推一体机MCCX D800、AI超融合一体机KUAE FUSION，用于部署服务器推理、训练。且支持LLaMA、GLM、Aquila、Baichuan、GPT、Bloom、玉言等各类主流大模型的开源。摩尔线程的布局，已经形成从芯片到板卡到服务器到集群，再到软件的全栈式的人工智能的产品线。

摩尔线程能够取得这样的成绩，得益于技术能力强大的团队，他们多来自于英伟达、微软、英特尔、AMD、ARM等国际大企业，技术实力不容小觑。

根据国家知识产权局的数据，截至2024年10月，摩尔线程获得425项授权专利，稳居国内GPU企业中专利授权数量首位。这些专利主要覆盖了处理器架构设计、AI应用、驱动软件设计、GPU算力集群等关键技术领域。

02 .

用MUSA兼容CUDA

英伟达耗费多年构建的完整CUDA生态系统可以说是其最重要的护城河之一，巩固了其作为领先GPU计算和人工智能（AI）制造商的地位。

正因此，GPU企业要生存就要先兼容CUDA。

什么是CUDA？

CUDA(Compute Unified Device Architecture)，是NVIDIA推出的运算平台。CUD是一种NVIDIA推出的通用并行计算架构，该架构使GPU能够解决复杂的计算问题。它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。开发人员可以使用C语言来为CUDA"架构编写程序，所编写出的程序可以在支持CUDA的处理器上以超高性能运行。

用户一旦习惯了CUDA，就很难再迁移出去。因为迁移意味着代码完全重写，工作繁重耗时且不产生经济效益。

竞争对手们要挖英伟达的墙角就要采用尽量不改变用户习惯的方式，例如，在自己的GPU芯片上兼容CUDA。AMD和英特尔一直试图通过自己的开放API产品，包括ROCm和oneAPI进入计算领域。其想法是提供翻译层的开放访问，开发人员可以更容易地在非英伟达GPU上运行现有的CUDA代码，例如，开源的ZLUDA项目，可以使CUDA应用程序在AMD GPU上以接近原生性能运行，而且无需重新编码。

高通、英特尔和谷歌联手还建立UXL基金会，是以oneAPI构建的开源项目，为使用CUDA生态系统的用户提供新选择，最终目标就是要推翻英伟达的统治。

国内其他GPU企业也选择了兼容，例如壁仞科技的 BIRENSUPA 平台、沐曦科技的 MXMACA平台也都在通过兼容来化解英伟达CUDA带来的壁垒。

摩尔线程要生存也要采取类似手段，因此，摩尔线程自主研发了MUSA统一系统架构，包括统一的GPU编程模型、软件运行库、驱动程序框架、指令集架构和芯片架构。简单来说，只要通过一些代码自动转换的工具，用户就可以快捷的把原有的基于英伟达，生态的扩大代码牵引到MUSA平台，实现替代。

不过，今年3月份，市场上传出英伟达试图在CUDA软件中封杀第三方GPU公司的消息。

针对市场上的消息，摩尔线程迅速表态，其MUSA / MUSIFY不涉及英伟达EULA相关条款，开发者可以放心使用。

声明指出，摩尔线程研发的MUSA系统，与CUDA无任何依赖关系。MUSIFY则是其面向广大MUSA开发者提供的开发工具，方便用户在MUSA计算平台上进行应用移植与开发，可以让开发者将自己的C++源代码，转换成MUSA C++源代码，再通过MUSA编译器MCC编译生成基于MUSA指令集的二进制代码，最终运行在摩尔线程全功能GPU上。

当然也可以看出，兼容CUDA是其他GPU企业发展必须要走的路，因为只有兼容CUDA，企业发展的商业壁垒才能大幅降低。

03 .

“集群化”应对算力瓶颈

除了以MUSA应对CUDA，摩尔线程试图用“集群化”的解决方案，来解决国产GPU突破算力瓶颈。例如，以摩尔线程、华为为代表的少数厂商，选择从千卡向万卡进发，着重训练场景，直接硬刚英伟达。

7月3日，在2024世界人工智能大会召开前夕，摩尔线程宣布其夸娥（KUAE）智算集群解决方案实现重大升级，从千卡级别大幅扩展至万卡规模，以此来完成对大模型的托举，为万亿参数级别的大模型训练提供持续高效、稳定、且广泛适用的通用算力支持。

张建中表示，夸娥万卡智算集群作为摩尔线程全栈AI战略的一块重要拼图，可为各行各业数智化转型提供澎湃算力。

具体来看，摩尔线程夸娥万卡集群以全功能GPU为底座，软硬一体化、完整的系统级算力解决方案，包括以夸娥计算集群为核心的基础设施、夸娥集群管理平台（KUAE Platform）以及夸娥大模型服务平台（KUAE ModelStudio），旨在以一体化交付的方式解决大规模GPU算力的建设和运营管理问题。该方案可实现开箱即用，大大降低传统算力建设、应用开发和运维运营平台搭建的时间成本，实现快速投放市场开展商业化运营。

要知道，万卡集群并不是一万张GPU卡的简单堆叠，而是一个超级复杂的系统工程。规模变大的同时，难度也呈指数级倍增——既要实现智算中心扩容，也要兼顾质量。

首先，需要解决超大规模组网互联和提升集群有效计算效率问题；

其次，要解决稳定性问题，超万卡集群是由数千台GPU服务器、数千台交换机、数万根光纤/数万颗光模块构成，训练任务涉及上千万器件的共同作业，任何一个部件的故障，可能都会导致训练中断。

此外，要应对大模型的迭代问题，要求万卡集群具备生态Day0级的快速迁移能力，以适应不断变化的技术需求。同时，算力也不能局限于当下的大模型计算加速场景，还需要考虑未来通用计算的需求。

这对厂商而言是一项极其复杂的系统工程。尤其算力利用率与稳定性是行业衡量智算中心质量的两项重要指标。

具体来看下，夸娥万卡智算方案性能：

■单一集群规模突破万卡，总算力超万P；

■集群有效计算效率，目标最高可超过60%；

■稳定性卓越，周均训练有效率最高可达99%以上，平均无故障运行15天以上，最长稳定训练30天以上；

■具备强大的计算通用性，专为通用计算而设计，可以加速一切大模型；

■拥有良好的CUDA兼容能力，生态适配Instant On，加速新模型Day0级迁移。

至此，摩尔线程已经从一家GPU公司，转变为专注AI的加速计算平台企业。

04.

因进实体名单声名鹊起

摩尔线程，见诸媒体的次数屈指可数。

第一次声名鹊起是源自于美国的实体名单。

2023年10月17日，美国商务部将包括摩尔线程在内的13家中国GPU企业列入“实体清单”，以遏制中国AI产业的发展。

成立三年的摩尔线程才第一次进入大众视野。事实上，能够进入美国的“实体清单”也是对其技术实力的一次认可。

事实上，进入“实体清单”对摩尔线程的影响不小，最重要的就是限制其获取海外代工和先进技术的可能。

同时由于贸易限制和供应链中断，企业可能难以获得必要的原材料和零部件，导致生产受到影响，进而影响其财务状况和信用评级。这会使得企业在融资时面临更多困难，难以获得银行和其他金融机构的贷款和支持。

‌

摩尔线程对此的应对措施是降价扩大销售，当月其将原价MTT S80显卡从2999元一次性降价至1199元，通过扩大销售来稳定现金流。

‌

第二次被人们关注是因为《黑神话：悟空》发售。

《黑神话：悟空》正式发售之后，摩尔线程团队迅速推出了针对MTT S80显卡的优化驱动程序，后期发布的V270.80驱动程序解决了DirectX11模式下运行《黑神话：悟空》Benchmark时的闪退问题。

这也让摩尔线程小火了一把。8月下旬，摩尔线程的百度搜索指数达到了前后两个月内的峰值。

通过内部测试和市场反馈，玩家们普遍对MTT S80显卡在《黑神话：悟空》中性能提升表示满意。

这在一定程度上也反映出摩尔线程的技术实力。

第三次被关注，就是此次启动IPO。关注度创历史新高。

虽然在被列入实体清单之前，摩尔线程的知名度并不高，但是在创投圈却是名副其实的“当红炸子鸡”，一成立就获得红杉中国、字节跳动等国际顶级投资机构的投资。

天眼查显示，摩尔线程已完成5轮融资，累计融资金额或超过50亿元。2022年12月，摩尔线程完成15亿元的B轮融资时，估值已达到240亿元。

而根据胡润研究院发布的《2024全球独角兽榜》中，摩尔线程以255亿人民币的企业估值入选，排名第261位。

摩尔线程与英伟达相比，在算力、制程技术，以及生态架构设计上的性能和效率等方面的差距是显而易见的。例如，摩尔线程在集群训练规模上仍有一定差距，英伟达已能进行十万卡级别的集群训练；从芯片设计上来看，跟英伟达的差距为12—18个月；在芯片制造制程上，英伟达已采用3nm制程，而国内目前仍止步于5-7nm……

要翻越英伟达这座大山，摩尔线程需要做的还有很多，上市成为获取资金弹药的必然途径。

无论如何，作为一颗冉冉升起的新星，摩尔线程是值得期待的。

查看原图 21K