AI芯天下丨5G时代,SRAM和TCAM需求将飙升

“随着许多新技术的涌现,下一代存储器市场正在升温,但将这些产品引入主流市场仍面临一些挑战。多年来,该行业一直致力于各种存储技术的研究。这些不同类型的存储器都对应特定的应用领域,但都势必将在存储器家族中取代一个或者多个传统型存储。芯片架构正在与新市场一起发展,但数据在芯片、设备之间以及系统之间如何移动并不总是很清楚。汽车和AI应用的数据正变得越来越多和复杂,但芯片架构在处理时有时不清楚如何优先处理数据。这让芯片设计人员面临抉择,是选择共用内存降低成本,还是增加不同类型内存提高性能和降低功耗。”

AI芯天下丨5G时代,SRAM和TCAM需求将飙升
  5G需求带来的变化

目前,整个网络随着移动互联网和物联网技术的快速发展,从而使得网络中的移动设备的数量大幅度增加,导致了用户终端数、流量以及IP地址都出现了大量增长。这也就对针对不同类型设备的流量管控提出了挑战,很多客户需要对不同的访问流量而提供不同的服务,对于不同的移动设备在访问中的安全性和访问控制性也需要产生出不同的定义策略。

国内的电信运营商也一直对于智能管道保持着关注,其中就需要对用户在访问不同页面或使用不同业务时在网络上进行策略上的改变。此前,国内用户就曾发现过在同样网络环境下,使用移动的视频业务的流畅度就要高于使用普通的流媒体客户端。数据流量不是运营商的负担,而是新的收入增长源泉。数据流量的精细化经营需要提高到公司的战略层面。

网络搜索引擎芯片的意义就在于让设备可以在更复杂庞大的流量面前能够迅速完成对于不同流量的查找,然后在配之以相应的管控策略。下一代网络设备采用了新模式,既基于高度灵活、高度可扩展的流服务的模式,这类新型设备需要极高的可扩展性。

AI芯天下丨5G时代,SRAM和TCAM需求将飙升
  SRAM是未来存储的底层基础

尽管市场出现了新的变化,但片上SRAM仍是主流。其价格昂贵且密度有限,但其高速性能多年来已被验证。片上存储器的挑战是采用分布还是共用的方式,在某些情况下,为保证安全性需要增加冗余。所有这些要求都会影响存储器的类型和数量的选择,还涉及片上和片外存储器之间的权衡,以及访问每个存储器互连的复杂性。

当前的存储器能够正常运作,但是它们正在努力跟上系统中数据和带宽需求的激增。这彰显了下一代存储器的用武之地。新型存储器结合了SRAM的速度和Flash的非易失性和良好的耐久性。这些技术拥有出色的规格,但它们要么迟迟未出现,要么效能不尽人意。

所有这些都是以安全为前提,并且不同的市场设计的要求也不一样。比如,汽车中的各种类型的图像传感器(如激光雷达和摄像头)的大量数据需要在本地处理,AI芯片则希望性能能够提升100倍。解决内存问题有一些方法,其中一种是片上存储器,也就是将存储器分散地集成在运算单元旁,最大程度减少数据搬移,这种方法的目标是通过减少负载和存储的数量来突破内存瓶颈,也能降低功耗。

存储器将影响人工智能的发展

人工智能在几乎所有新技术中都扮演着重要角色,而存储器又在人工智能中起着重要作用。极高的速度和极低的功率是芯片一直以来追求的,不过这并不总是有效,因为空间有限。

无论应用领域如何,功率仍然是首要考虑因素。随着SoC设计向更小化发展,存储器的消耗正在增加,嵌入式存储器的容量也在增加。现在,超过50%的裸片是存储器,所以人们必须注意存储器的耗电量。

尽管有大量革命性技术和创新架构,但内存仍然是设计的核心。虽然即将出现新的存储器类型,例如相变和自旋扭矩,但大部分仍然应用于各种条件的市场。最大的变化在于如何对现有存储器进行优先级划分、共用、在设计中选择,以及最终如何使用它们。

AI芯天下丨5G时代,SRAM和TCAM需求将飙升
  TCAM是能有效应对5G需求

在像核心路由器或汇聚路由器这样的设备中,目前为了应对复杂庞大的数据流,网络搜索引擎芯片成为了设备中的双眼,来帮助进行流量识别。基于RRAM的三元内容可寻址存储器(TCAM)电路可以匹配多芯神经形态处理器应用的基于CMOS的SRAM电路的性能,尽管性能和可靠性权衡。

TCAM电路提供了一种使用指示范围的掩码搜索大型数据集的方法。它们允许通过其内容搜索存储的信息,而不是通过其物理地址检索存储器单元的存储信息的经典存储器系统。因此,这些电路非常适用于复杂路由和大数据应用,其中很少需要精确匹配。与经典的基于存储器的搜索算法相比,它们缩短了搜索时间,因为所有存储的信息在单个时钟周期内与搜索到的数据并行比较。

以电阻式随机存取内存(RRAM)为基础的三态内容可寻址内存(TCAM)电路性能媲美基于CMOS的动态随机存取内存(SRAM)电路,尽管仍存在性能和可靠性之间的权衡折衷,但适于多核心的神经形态网络处理器应用。传统基于SRAM的TCAM电路通常以16个CMOS晶体管建置,这使得TCAM在标准内存结构下的储存容量经常受限于几十个兆字节(megabyte;MB),而且在神经形态运算神经网络芯片中占用宝贵的芯片面积。

TCAM电路的工作原理是使用指示范围的屏蔽位来搜寻大量数据组合。相较于典型内存系统透过物理寻址方式检索内存单元储存的信息,TCAM则是透过内容搜寻储存的信息。因此,这些电路的性能非常适于复杂的路由和大数据应用——这类应用通常不太需要精确匹配。相较于典型的内存搜寻算法,TCAM电路的方式由于平行比对了所有储存数据以及单次频率周期内的搜寻数据,从而缩短了搜寻的时间。

TCAM的特性有利于未来发展

AI芯天下丨5G时代,SRAM和TCAM需求将飙升
  TCAM表内所有条目都可以并行访问,比如,如果你有100条ACL,TCAM能一次就能对比这100条ACL进行对比操作,过去如果有100条ACL的话,需要第一条ACL对比完后再对比第二条,然后第三条,直至N条,效率很明显没有TCAM高。

TCAM得结构已经经过了优化,支持更抽象的操作,通常是基于二进制关键字匹配,查询相当快。如FIBTCAM中每个表项都有对应的下一条,而每个下一条有维护了下一条邻居的MAC。正因为有上边的这些特性,所以无论表内有多少条数目,性能都不会减弱。

TCAM包含多组的Mask与Value对应关系,对应比例为1:8,一个Mask可对应8个Value。最长掩码位于TCAM顶部,如255.255.255.255位于最顶部,用于最长匹配,提升查找速率。

TCAM的可用掩码、值模式、LOU表项有限,如果访问列表很大或需要很多第四层运算,TCAM表和寄存器很可能溢出。

高速TCAM(三态内存储存器)可作为大数据资料的过滤器,以降低处理器资料运算的压力并大幅降低待机时的功率消耗。TCAM可以在一个时钟周期内搜索全部资料,且比传统RAM快。TCAM是支持网络装置的储存器,主要用来缩短资料搜寻时间,他们能提高路由器搜寻速度,分类数据,以及访问控制列权限,使得数据资料处理速度加快。

基于硬件的TCAM查找法正是在这种背景下提出的,用此方法进行查找时,整个表项空间的所有数据在同一时刻被查询,查找速度不受表项空间数据大小影响,每个时钟周期完成一次查找,平均查找速度是基于SRAM算法查找的6倍,最好情况下,能达到128倍。

尽管TCAM的寿命很长,但是仍然不普遍,其主要原因是成本昂贵,且供应商稀少。而可以预计的是,传统DRAM将被高速的SRAM取代。

AI芯天下丨5G时代,SRAM和TCAM需求将飙升
  结尾

5G最主要的目标便是高速的网络流畅度,他认为未来网络中的AI需求将大增,因此需要高频宽来处理资料。预计未来,电信网络和科技平台之间的界线将越来越模糊,网络不再只是追求音质和数据传输,而是能够支持电脑演算和物联网。包括了工业自动化、自动驾驶汽车和智慧科技城市。

如今的通讯服务,建立在电脑演算系统上,SRAM和TCAM正在取代过去的闪存和DRAM设备上,甚至还有更多空间能够搭载存储。

Loading

作者 aibbs