人脑在有限尺寸和极低能耗下,能够完成复杂环境中的信息关联记忆、快速识别和自主学习等认知任务。随着芯片换代速度放缓、算力供不应求等挑战出现,面向未来,现有计算机的计算方式已难以为继。如何推动信息处理技术进一步发展,打造像人脑一样的“机器脑”?实现类脑计算是破局的方向。要想实现类脑计算,就需要寻找更多模拟人脑功能的神经形态器件。
借鉴人脑,让计算更高效、更具仿生性、更低能耗
电子计算机的发明将人类文明带入了一场数字化科技革命。在短短几十年中,计算机的算力从每秒几百次运算到每秒百亿亿次运算,增长了1016倍,创造了几千年人类文明史上最高的人造增长速度。计算机算力的提升得益于底层半导体器件(硅基晶体管)的集成密度提升。按照摩尔定律,单芯片上晶体管的数量每18至24个月翻一番。
在过去的半个多世纪,集成电路产业一直在摩尔定律的引导下发展。然而摆在现实面前的是,随着摩尔定律不断逼近极限,单个硅基芯片能够承载的晶体管日渐饱和。硅原子的大小约0.12纳米,照此大小推算,当芯片工艺达到1纳米,就只有对几个硅原子进行操纵的空间了。
事实上,在芯片工艺发展到10纳米水平后,能明显感受到换代速度放缓、成本攀升等问题。而另一方面,随着人工智能大模型浪潮席卷全球,对计算机算力的需求激增到了每2到3个月就要翻一番的程度,远超摩尔定律下的增长速度。
面对芯片换代速度放缓、算力供不应求等挑战,数字计算机的计算方式已经难以为继,如何推动信息处理技术进一步向前发展,成为学界与社会各行各业共同面临的难题。面对这一巨大困局,能够提供更高效、更具仿生性、更低能耗算力的类脑计算,成为破局的关键。
类脑计算是“国际半导体技术蓝图(ITRS/IRDS)”中的一个重要研究方向,旨在借鉴人脑的基本原理,实现人工通用智能(也称为类脑通用智能)。在2021年启动的“中国脑计划”中,类脑计算是一个重要组成部分。
与传统计算机不同的是,人脑在有限尺寸和极低能耗下,能够完成复杂环境中的信息关联记忆、快速识别和自主学习等认知任务。这与人脑神经网络的基本组成和结构密切相关:人脑中有860亿个神经元,相当于银河系天体的数量,并通过150万亿个神经突触互联构成了空间复杂的神经网络;同时人脑的神经树突等组织进一步使神经计算功能复杂化。
人脑的这些神经组织包含了多样化的离子通道,具备非常丰富的动力学行为,特征时间尺度也跨越几个数量级,这是人脑智能的物理基础。相对应的,计算机基本的组成单元是电子晶体管,其工作在准静态的0和1编码状态下,与人脑的丰富动力学相距甚远。
因此,类脑计算的实现,其中一个关键就是发现神经形态器件。它们可以模拟人脑中神经元、神经突触、神经树突的功能,具有更贴近神经组织行为的物理机制,从而可以实现传统电子晶体管所不能实现的诸多类神经功能。
基于神经形态器件的类脑计算快速发展
神经科学的研究发现,神经元之间的神经突触连接强度的可调性,是大脑学习和记忆功能的基础之一。由过往经历引起的神经突触连接强度改变,可以对大脑的功能产生影响。
神经突触连接强度改变,也叫神经突触可塑性,可以增强或抑制神经元的活动,而且其持续的时间可从几毫秒到几小时、几天甚至更长时间,跨度很大。
如果能借鉴神经突触可塑性原理,用某种手段来模仿和实现,构建类似于神经突触的人工突触,再进一步构建出系统,就可以更好地理解和模拟大脑的工作方式,进一步推动信息学和神经科学的交叉发展,实现类脑计算。
早在1971年,科学家蔡少棠就曾启发式地推理预言了一种新型器件——忆阻器。根据预言,忆阻器的电阻值取决于所施加的电压/电流激励历史,因此具有类神经记忆特性。
在这一预言过去37年后,惠普实验室宣布忆阻现象在新型微纳半导体器件中被观测到。此后,忆阻器件和神经形态器件几乎成了两个可以互换的概念,基于神经形态器件的类脑计算也进入了快速发展的阶段。
忆阻器作为一种有潜力的电路元件,除了生物相似性之外,在可微缩能力、存储密度和功耗等方面也要优于传统的晶体管器件。
近年来,在材料技术和功能方面,神经形态器件都取得重要进展。在材料技术方面,研究人员广泛应用各种材料——无机物、有机物、量子材料、铁电材料、铁磁材料、三维体材料和二维材料等,它们展现出各自独特的神经形态特性,为忆阻器的发展提供了多样性和灵活性。将传统晶体管和忆阻器进行混合的神经形态集成电路研究也取得了显著进展,加速了忆阻器的应用推广。在功能方面,忆阻器不仅能够模拟神经突触的可塑性功能,还可以模拟神经元的某些功能,这为实现全忆阻器的神经形态电路创造了可能性。
利用晶体管“非理想”物理机制,模拟人脑记忆功能
然而,神经形态器件发展到这个阶段,面临着新的挑战。其中一个关键挑战是仿生动力学功能不足,难以满足类脑计算对丰富神经形态动力学的要求。
正如前面所提到的,人脑的丰富动力学行为与神经组织中多样化的离子通道结构和机理是密切相关的。但是目前主流的神经形态器件通常是为模拟某一种特定的神经行为来定制,采用特定的单一物理机制来实现。
如果需要实现丰富的仿生动力学功能,就需要发展全功能的动力学神经形态器件。不过,通常来讲,功能越全面就需要更大尺寸的硬件,这与当前芯片的小型化相矛盾。要解决这个问题,就需要探索新型的器件原理和新的半导体材料。
前面提到,神经突触可塑性的一大特征是动力学时间尺度跨越几个数量级,这是人类认知和记忆功能的一个基础。事实上,我们每个人都能感受得到这种动力学的存在——有时候一件事情让人终生难忘;而有时候上一秒的事情,下一秒就忘了。这就是长期记忆和短期记忆两种时间尺度不一样的动力学行为,它们的共存帮助我们保留重要的信息,同时过滤掉不重要的信息,给大脑减负。但是现有的单器件人工突触,只能对长期可塑性或短期可塑性进行选择性的模拟,不能集成模拟。
基于这些神经突触原理,对人工突触器件和生物突触进行比较可以发现,它们之间有一个巨大的区别——前者利用相同的物理机制模拟两种功能,而后者分别利用来自突触后膜和前膜不同的钙离子通道机制来实现。
受此启发,清华大学类脑研究中心的研究团队将目光移回到晶体管上。作为计算机芯片的基本元器件,晶体管器件中实际蕴含了两种物理机制——“场效应”机制和“忆阻”机制。“场效应”机制让晶体管在0和1状态间切换,但没有持续供电的话,状态就会很快消失,从节能的角度来说不尽如人意。“忆阻”机制会让0、1状态混淆,这在以往被视为不利影响,所以在制造计算机芯片时一定要防止“忆阻”机制的显现。但“忆阻”机制还有一个特性——在断电后依然能持久地存在。
这两种对于传统计算机芯片来说不够完美,甚至不利的物理机制,不正是类脑计算中模拟突触长、短期可塑性功能所需要的吗?
至此,答案呼之欲出。通过对这两种机制的“反向”利用,清华大学类脑计算研究中心团队提出的动力学神经形态晶体管技术,使得长、短期记忆动力学功能可以在单个器件中集成地模拟,解决了类脑科学领域内的一个关键技术难题。
寻找更多能模拟人脑神经计算的半导体器件
神经元是另一种基本神经计算单元,其阈上的放电和阈下的振荡参与了几乎所有的认知功能环节,本质上是细胞膜电位的上升和下降。从生物角度来看,神经元膜电位的变化由两种离子通道参与——钠离子(Na+)通道和钾离子(K+)通道。
它们的工作过程是这样的——当钠离子通道打开时,膜外钠离子(Na+)内流进入细胞,从而导致膜电位升高,这被称为去极化过程;在膜电位达到一定程度后,重复极化过程开始,钠离子(Na+)通道关闭,钾离子(K+)通道打开,允许钾离子(K+)外流离开细胞,从而使膜电位降低。
神经元的动力学更复杂,要对其进行模拟往往需要多个电子元件组合成电路。为了让人工神经元器件既能动力学功能丰富,硬件又足够精简化,需要寻找新的材料来实现。
最终,碲这种新型半导体材料脱颖而出。它具有低熔点、低热导率和电化学活性等综合物理性质,很难在其他材料中找到这种组合性质。
这些性质使得碲导电通道结构能够在电流的电场作用下生长出来,降低器件电阻,这可以与钠离子(Na+)的内流去极化过程对应;随之而来的电流焦耳热则会熔断碲导电通道,使器件电阻恢复,这与钾离子(K+)的外流重极化过程对应。
在此基础上,清华大学类脑计算研究中心团队研制的碲半导体单器件,实现了对神经元阈上放电和阈下振荡的全功能模拟。
与神经元和神经突触相比较,神经树突作为典型的生物神经网络特征结构,曾被类比为简单的导线。但越来越多的研究表明,神经树突具备重要的神经计算功能,不仅执行被动计算,甚至还能主动“放电”,这或许是人脑通用智能信息处理能力的关键来源之一,是赋能类脑计算的重要灵感来源。
神经树突的主动放电动力学行为也源于丰富的离子通道。其以钙离子(Ca2+)为介导,放电持续时间更长,产生的影响或更为显著,并且其激活函数也可以呈现对于输入刺激强度的非单调响应。这使得单个树突就能解决更具挑战性的非线性分类问题。
为了模拟神经树突,清华大学类脑计算研究中心团队采用了一种新型的晶体管结构,即基于pn异质结半导体沟道的晶体管,取代了传统的均质或同质半导体沟道,利用这种特殊晶体管结构中非同寻常的“反双极性”的转移特性,模拟了钙离子(Ca2+)介导的非单调激活和树突放电,进一步丰富了晶体管的神经形态功能。
时至今日,尽管在模拟人脑神经计算方面已经取得一些进展,但大脑作为人类智慧的集结,是已知的宇宙当中最复杂的产物,对大脑的研究也被称作是自然科学的“终极疆域”。类脑计算作为模仿神经生理学和生理心理学机制,以计算建模为手段并通过软硬件协同实现的机器智能计算,距离实现人类打造像人脑一样的“机器脑”这样的梦想,还有充满挑战的路要走。