北京时间10月9日,联发科在深圳举行发布会,正式发布了全新一代的旗舰芯片天玑9400,这一代处理器在保持了和上一代天玑9300相同的全大核架构基础上,对包括CPU、GPU和NPU在内的三大件进行了性能提升,同时工艺升级到了台积电3nm制程,这也是Android体系下全球首款3nm移动处理器。
延续全大核设计,CPU/GPU提升超过20%
天玑9400系Android首颗3nm工艺芯片,使用了台积电的N3E工艺,和目前苹果的M4、A18 和A18 Pro使用了相同的工艺。相比天玑9300使用的台积电4nm工艺,N3E工艺加持下的天玑9400拥有更小的单个晶体管结构,这意味着在整体片上面积没有明显增加的前提下,9400的整体性能和能效比要比9300更好。
天玑9400依然采用了和天玑9300相同的全大核架构,包括了四个超大核和四个性能核,四个超大核中的一个使用饿了ARM最新的X925架构,主频提升到了3.62GHz,其余三个核心保持了和上一代相同的Arm X4核心,但主频提升到了3.3GHz,上一代是3.25GHz。
四个性能核心继续使用ARM A720架构,从上一代的2.0GHz提升到了现在的2.4GHz。得益于晶体管结构的缩小,天玑9400内部空间相对更大,使得联发科可以放下更多的缓存结构。这一代9400相比9300在二级缓存上翻了一倍,三级缓存提升了50%到12MB。
图形显示芯片部分,天玑9400也使用饿了ARM最新的G925的核心架构,整体保持12核心同时,图形芯片的主频提升到了1612MHz,比上一代的1300MHz提升24%。
另外这一代的图形芯片使用了联发科第三代的光追引擎,首次支持了OMM追光引擎。如果说第一代光追解决了镜面反射、第二代光追解决了全局光照,这个第三代技术则重点解决了像树影植被这种比较斑驳、模糊的阴影显示问题。
在腾讯科技对于天玑9400开发机的测试中,GeekBench 6的成绩,相比9300多核提升了20%左右的提升,单核则来到了32.5%。传统的光栅方面,GFXBench在Aztec Ruine Vulkan 1440P中,相比上一代提升了28.3%。 光追方面,3DMark最新的Steel Nomad Light测试结果则显示,9400的提升幅度达到了36.8%。
天玑9400支持本地LoRA训练集部署
作为AI手机时代必不可少的算力核心,此次天玑9400在NPU上继续加强,全新的第八代NPU相比上一代,在ETHZ AI测试中,跑分相比9300提升了2.86倍,同时功耗也进一步降低了35%。
和过往几代芯片发布时一样,联发科并没有给出这颗NPU具体的算力水平,但从目前的测试水平来看,这颗NPU的能力不会低于去年9300上的48TOPS。利用更高的算力以及整体能效比的提升,联发科在天玑9400上,首次支持了本地LoRA训练集的部署,这意味着这颗芯片通过端侧的算力,就可以实现自主的图形生成式内容的学习。
不单单是图片生成的能力,9400还支持了更多的多模态大模型的本地部署。现在除了可以通过通过文字或者语音与手机中的AI助手交流,还可以实现识图的操作,比如扔给它一个其他语言的菜单让AI帮助点餐,或者拍数学题让它给出解题步骤等等,都可以在端侧片上完成,完全不需要联网。
这使得手机厂商可以通过9400提供的基础能力,就能实现片上的AI多模态模型的部署。在上一代9300上,联发科更多的是提供接口和API,而在这一代9400上,更多的端侧AI都被做成模块化的能力提供给手机厂商选择使用。
这是Android生态系统上首次实现端侧模型处理复杂多模态任务、尤其是像LoRA训练集这样的复杂模型部署,从一定程度上讲,天玑9400的发布,意味着移动芯片将端侧AI带入了一个新的高度——NPU的算力更强、处理模型效率更高、第三方部署更简单。
而在发布会上,联发科宣布了和多个合作伙伴的本地化端侧模型合作方案,包括了与小红书合作AI图像生成、和全民K歌合作AI歌声生成、和面壁智能合作端侧AI的图片推理能力等,都利用了天玑9400的端侧能力实现。
智能手机全面进入3nm时代
随着联发科天玑9400的发布,以及即将在本月下旬亮相的高通骁龙8 Gen4芯片,它们都使用了最新一代台积电N3E工艺,加上已经于上月发布的iPhone 16系列上搭载的A18和A18 Pro,这意味着从今年10月开始,智能手机全面进入3nm时代。
目前台积电所有的N3E产能均被苹果、英伟达、英特尔、高通、博通、联发科这六大客户的人工智能(AI)、高性能计算(HPC)芯片所包揽。台积电目前正在加速扩张其3nm代工产能,预计将从去年的6万片增至今年年底的10万片以上。市场也预计随着第四季度包括搭载联发科和高通旗舰芯片的手机大量出货,3nm芯片的良率将进一步提升。
3nm制程N3E耗能比5nm制程改善12%-30%,这在一定程度上帮助更快的NPU以及相对更大规模的小型模型(3B-7B)常驻在SoC端侧,变相推动了AI智能手机的加速落地。
今年联发科先于高通推出旗舰芯片,一方面抢占了3nm的宣传周期节点,另一方面,联发科也借助3nm提供的先进制程和更好的能效比,实现了更多片上AI应用的技术落地。
这种变化会在未来2-5年的时间内,影响智能手机AI化的发展,在未来更多的手机AI应用将会是从芯片端发起,包括图片生成、表情包生成、本地翻译、识图等应用场景,都会从云端转移到端侧来进行,从而进一步改变用户使用智能手机的方式。(吴彬)