(图源:摄图网)文/Renee 编辑/孙越近日,清华大学发布的一颗忆阻器存算一体芯片,火了。该芯片的火爆源于一个月前,清华大学发的一篇论文:2023年9月14日,清华大学吴华强及高滨共同通讯在Science在线发表题为“Edge learning using a fully integrated neuro-inspired memristor chip”的研究论文,论文显示,团队基于存算一体计算范式,研制出全系统集成、支持高效片上学习(机器学习能在硬件端直接完成)的忆阻器存算一体芯片。“忆阻器存算一体”这一概念瞬间引爆学界与产业界,甚至登上了微博高位热搜。据笔者获悉,清华大学所用的忆阻器件就是RRAM(ReRAM)。此次清华大学科研成果的意义,不仅在于研发出首颗基于忆阻器(RRAM)的片上学习存算一体芯片,更在于为产业界存算一体存储介质的应用和发展给出了更多方向,以及在技术实践上的引导性意见。本文试图探究,学界与产界为何要选择研发该路线?该路线的发展前景如何?
PART-01
忆阻器存算一体是为何物?
无论是从其官方表述,还是论文中“可重构的忆阻器存算一体架构图”,我们都能明确知道,清华大学所说忆阻器便是阻变存储器RRAM(ReRAM)。2022年9月,清华大学集成电路学院钱鹤、吴华强教授课题组联合斯坦福大学、加州大学圣地亚哥分校(UCSD)、圣母大学等在《自然》(Nature)发表的题为A compute-in-memory chip based on resistive random-access memory研究论文。该论文报道了一款基于忆阻器(阻变存储器)的存算一体芯片NeuRRAM。该芯片具有可重新配置的计算核心(reconfiguring CIM cores),可以兼容不同的模型结构。(可重构的忆阻器存算一体架构图源:清华大学)专家表示,从定义来看,忆阻器(英文:memristor)为电阻受先前通过电荷量控制的电子器件,其特点为通常具有电流电压蝴蝶形回滞曲线。忆阻器的概念最早由蔡少棠教授提出,最早由阻变存储器,即RRAM实验验证,因此经常以RRAM作为忆阻器的代表。当然,严格来说,根据材料和物理机制,忆阻器件可分为阻变存储器(Resistive Random-Access Memory, 简称RRAM或ReRAM),相变存储器(PCRAM),磁随机存储器(MRAM)和铁电随机存储器(FeRAM)等不同种类。此外还有光电忆阻器、有机材料忆阻器、流体忆阻器等。也就是说,忆阻器有着诸多选项,那么为何要选择阻变存储器RRAM?我们都知道的是,传统冯·诺依曼结构下,数据的存储和计算相互分离,即数据存储在储存器中,需要计算时再把它搬运到运算器里。然而,AI类应用(例如大模型)需要对大量数据进行矩阵运算,其核心是乘法和加法,在此情形下算力是比较吃紧的,面临着很大挑战。如何拉近“存”“算”距离,即打破存储墙,成为AI计算的当务之急,清华大学给的解决方案便是基于忆阻器(RRAM)的存算一体。具体来说,如果用交叉阵列的方式做忆阻器,就可获得一种与矩阵很类似的结构,这种结构既可以存数据,也可以做计算。需要存储时,忆阻器本身就是存储器;而需要运算时,也无需把数据从存储器中搬到运算器里,因为忆阻器可直接用欧姆定律来做乘法运算。如此,数据便能“原地”计算,大大降低了由于数据“跑来跑去”所带来的消耗。除此之外,忆阻器(RRAM)还有着其他优点:比如尺寸小、速度快、与 CMOS(互补式金氧半导体)工艺可兼容等。于是,又能算又能存的忆阻器(RRAM)成了缓解算力焦虑的良药,引得包括清华大学在内的多方精英竞相布局。