英飞凌TC4xx AI扩展处理器解构

欢迎关注下方公众号阿宝1990,本公众号专注于自动驾驶和智能座舱,每天给你一篇汽车干货,我们始于车,但不止于车。

英飞凌早在前两年就开始陆续推广TC4xx系列,但实际的量产案例应该想必也要等到在明年才会陆续上线,TC内嵌的PPU加速单元和eDSP数字信号处理核。两个处理器分别采用新思科技的sysnopsys ARC EV7X嵌入式处理器和适用于低功耗领域的ARC EM5D。那今天我们就换一个角度,从新思科技的产品一窥英飞凌在MCU智能化的道路上所作的探索。
图片
新思这款嵌入式处理核主要由两部分组成:
算数运算引擎:
矢量单元主要用于向量运算等以实现SIMD,单指令下多数据处理的高效计算。同时支持浮点,以达到51GFLOPS的等效GPU算力。而标量单元,支持div, √x, 1/√x, sin(x),   cos(x),  log_2 (x), 2^x “, “ e^x, atan2(x)等多种算术运算。针对雷达原始数据的快速傅里叶变换,摄像头图像处理,渲染,2D-3D建模等应用。
深度学习加速单元:
拥有大于30TOPS的算力,内嵌880-7040个乘加算数单元(MAC)。可用于自动驾驶的同步定位和建图(SLAM)和雷达等数字信号处理。对于深度学习神经网络算法,例如循环神经网路(RNN)和长短期记忆也有显著的速度提升。
这里我摘取了几个算数模型的计算公式供大家参考:
图片
图片
这些硬化的神经网络算法帮助自动驾驶软件快速实现目标的感知,识别,学习归纳等过程,以及基于卡尔曼滤波等算法的路径规划。
图片
下面是采用新思处理器PPU处理传感器数据并输出在观测窗口上,可以看到对底盘刹车和侧向助力输出扭矩的预测,以及对高频数字信号的平滑滤波。
图片
而且全球领先的嵌入式软件工具商Tasking也官宣了对ARC EV7x指令集的支持,同时新思原生的MetaWare Toolkit也可以帮助开发者实现simulink的快速仿真,DSP和底层数学库供神经网络软件开发者快速上手环境。
再来看另一款辅助cDSP小核ARC EM5D则是针对智能场景的低功耗处理器解决方案, 内含150个功耗优化的DSP指令集,以及精简指令集,标准化的32x32 MAC计算单元可以适配大部分神经网络计算场景,只支持定点DSP数据,SIMD的矢量运算。处理器基于3阶哈佛架构以提供高带宽及高实时响应性能。
图片
目的显然是进一步降低数字信号对主核CPU的消耗,提高运算速度的同时降低功耗。不用担心它的性能,因为对于单一且简单的ADC数模转换的信号的加工已经游刃有余。
图片
通过对硬件进行配置,可以根据不同数据精度需求,灵活实现不同的滤波链路,且Matlab 2024a版本也实现了对CDSP滤波模块的支持。
图片
关于人工智能MCU的讨论也是最近比较热的话题,前段时间国芯科技和赛舫合作推出了一款AI MCU,在汽车芯片圈也是引起不小反响。智能化的下半场,在与针对AI场景定制内核类似NPU等的正面交锋下,MCU如何接受SOC等域控计算单元所下放的任务,安全且不失效率的执行完成,必将成为MCU厂商长期需要探索的话题。