Rambus GDDR7 IP控制器:创建改进的边缘计算基础架
- 编辑:admin -Rambus GDDR7 IP控制器:创建改进的边缘计算基础架
配备了GDDR7的GPU将于2025年5月正式推出,NVIDIA GPU RTX 5060将首次推出,高端型号(例如RTX 5090)将于2025年底推出,在2025年底。 GDDR视频内存是专门为图形卡设计的高性能DDR存储器。它主要采用图形数据的存储和传输。它的操作频率,电压和其他参数与标准DDR内存不同。最初,内存卡存储器与CPU的内存和图形卡的内存兼容,该卡主要使用了DDR存储器。但是,由于对图像处理的需求年复一年,位宽度是有限的,并且满足与GPU平行的计算需求很难满足纪念性Eary DDR,从而导致帧速率或减少延迟。根据为此,视频GPU内存慢慢地更改为GDDR。三星电子在1998年推出了首个16 MB GDDR存储芯片,标志着GPU和CPU内存分离的开始。 GDDR具有很高的数据传输速度和带宽,并且在GPU的发展中起着重要作用。自GDDR视频记忆诞生以来,总共七个版本(GDDR到GDDR7)已经发展,每一代都在改善带宽并减少能源消耗。 GDDR7以32 gt/s的速度开始,比更快的GDDR6内存高60%,比更快的GDDR6X内存贵33%。在GTC 2024中,三星和SK Hynix显示的GDDR7内存解决方案表示GDDR7已进入商业实现阶段。这两家公司还将直接将实验室技术推广到终端市场的客户合作计划和批量生产时间表的澄清。根据该计划,配备GDDR7的GPU将正式启动2025年5月,首次推出了NVIDIA RTX 5060 GPU,高端型号(例如RTX 5090)将于2025年底启动。与此同时,它还表示,GDDR7内存控制器的Rambus'sla IP也将引入了Electronic Commise的国际信息信息中。 AI设备的产生需要更多的记忆才能伴随AI补贴。光线和流行的模型正在适应专用需求,并成为行业在Edge中实施AI设备的主要方式。简化的专用模型可以将参数量减少到较低级别,并改善用户体验,这是一种经济可行的业务模型。目前,手机必须兼容IA多少内存? Nidish Kamath说,当它由大语言模型(LLM)驱动时,设备端的AI侧AI范围内的AI PC和IA智能手机等设备的AI正在引领使用神经网络的计算机应用程序和最终点。新一代的高水位记忆技术和低潜伏期已成为解决边缘和终点设备的带宽和内存能力爆炸性需求的关键解决方案。当前,这些设备具有大量的高级内存实现,例如DDR5,GDDR7和LPDDR5/5X。但是,设备的类型还限制了支持AI应用程序的内存选择。当前,LPDDR5被广泛用于移动设备。它的产量和带宽足以满足手机AI应用程序的需求,并且还可以在低级别控制ANDL能源消耗。根据Yole Group Research的说法,发电机AI的演变正在促进对移动设备的需求的增加。最古老的型号限制了处理能力,难以满足要求。当前,基本AI功能仅需要约100 MB的内存,但是配备LLM的高级功能的内存要求可以增加到7 GB。 HBM领导AI培训,WHIle GDDR适用于边缘推理。这是内存需求的指数增长,它直接推动了不同的内存技术方案之间的区别。在云训练的侧面,HBM(高带宽内存)使用3D堆叠体系结构提供的超高带宽来使其大。它完美地适应了基纳模型参数的频繁调用的需求。在边缘侧面,GDDR6/7可以实时满足要求,以及通过更好的能源效率和模块化设计来推断LLM来推断LLM的成本的限制。 Nidish Kamath还分析了最后一个HBM3E操作率为每引脚9.6 GB/s,单个内存的总带宽可以达到1.2 tb/s。 GDDR7允许每个引脚的40 GB/s数据速度,单个内存带宽GDDR7为160 GB/s。相反,HBM3E和GDDR7之间的内存带宽存在很大的差距。两个产率之间的差异主要是由于差异在两个内存结构中。基于体系结构2.5D/3D,HBM直接集成到GPU芯片中,并包含一层集成的处理器和内存电池。这种设计使HBM可以以低潜伏期,能效率低,可以处理Tarhigh的绩效计算机科学(HPC),例如强化培训和自动学习。但是,强大的HBM性能背后是最大的复杂性,它继续增加生产成本。借助最终设备的传统优势和轻度工作量,内存能力和GDDR带宽可以满足他们的需求,而无需投资大量资金以获得HBM的强劲表现。此外,GDDR采用了传统的2D体系结构,并与GPU骰子分开。这比HBM使用的更复杂的2.5/3D架构更容易实现。这种低的复杂性和易于实施的性能进一步降低了成本。通过采用PAM3信号技术,GDDR7是ST不足以保持出色的带宽性能并满足Edge和Final设备上AI推理应用的需求,因此在Edge和Final设备的设计师中广受欢迎。未来的记忆挑战:当然,考虑到能源节省和性能,现在是该一代营销的第一年,具有相对较低的内存性能要求,但是随着将来最先进的能力的商业化,内存性能要求(带宽,潜伏期,效率,效率等)很高。从这个意义上说,尼迪什·卡玛斯(Nidish Kamath)表示,未来面临的主要挑战是“如何在节省更大的能源下提供更高的绩效”。该内存为处理器提供高速数据缓冲区的存储空间,互连技术在处理器和处理器内存之间构建了一个直接通道,并且两者一起解决了大规模数据处理效率问题。 “作为过程ORS加速,必须同时加速TDATA的ransities,即处理器之间或处理器和内存之间的数据传输。此外,我们必须确保可以满足数据传输的能耗要求,并且可以在处理器和内存,内存,处理器和其他处理器之间以更高的数据速度传输数据。金额。 “但是,随着记忆技术的增加,单个芯片中的数据位数量本身就是一个挑战。随着记忆单元的减少和容纳更多的数据位,需要控制的其他物理效果继续进行。问题包括芯片错误。因此,芯片误差校正技术的使用更广泛。领域,包括记忆体系结构的创新和OPT信号完整性的模仿。 “我们知道该行业目前面临的挑战,并且我们知道,行业中许多最佳才能正在努力解决这些问题。较高的性能记忆系统常见应用“ AI 1.0”包括语音助手,建议和平台Enginess搜索。这些系统在处理相对简单的任务(例如语音,文本,文本,文本,文本等文本等)的处理方面很好地奏效。有效性“ AI 2.0”以多种方式开放了无尽的创意和创新的可能性。边缘和终端pplication方案。从个性化的经验到计算机架构(云,边缘,终端)的特定解决方案,应用程序AI 2.0的快速开发都提出了您对内存带宽的重要要求以及对AI和推理工作流的培训的能力。例如,从AI训练的角度来看,相应的AI模型量表正在迅速扩展:与17.6亿GPT-4参数相比,1750亿聊天GPT-4参数苍白,这突出了记忆和容量需求的带宽持续增长。同时,许多AI应用程序正在从数据中心迁移到边缘和终端,现有的内存系统也有更大的需求。具有GDDR内存的GPU是推理引擎的第一个选择。 Rambus GDDR7控制器通过PAM3信号提供了带宽实现解决方案的功能和带宽 - 最后一代加速器,图形处理和高性能计算应用程序。 GDDR7在行业中提供了领先的性能和领导者的记忆乐队来改善带宽,我们使用PAM3而不是NRZ信号(PAM2)。这种新的编码方案可以在两个时钟周期中发送“ 3-位信息”。与GDDR6相比,以相同的时钟频率相比,这将数据传输速度提高了50%,以每引脚40 Gbps的速度提高了通道的性能。为了确保以如此高的运行速度的可靠数据传输,GDDR7内存集成了高级MR机制(可靠性,可用性和服务能力)。这有助于缓解高频操作和PAM3信号的固有特性所引起的信号的完整性挑战。 Nidish Kamath指出:“ Rambus GDDR7控制器通过整合数据完整性的特征性数据,包括芯片中的ECC,数据成瘾,满足了更大的可靠性要求ND错误验证。 "The Rambus GDDR7 Memory Controller IP offers a GDDR7 performance in the industry, which allows a unique GDDR7 memory to achieve transmission speeds of up to 40 GBPS and 160 GB/s Available bandwidth. The main features of the IP of the IP of the GDDR7 memory controller Maximum PIN transmission speed of 40 Gbps. (Self -Refresh, Sleeping Autoenfresh, Dynamic Frequency Adjustment, etc.).end -to -end ATO和存储验证保护Stumps,SoC整合和其他服务。在客户产品的设计和开发阶段需要技术支持的ES,它可以帮助客户快速识别问题并提供解决方案,从而减少客户上市的时间。 GDDR7在2025年将NVIDIA RTX50系列的GPU批量生产的一般描述将进一步促进产生代发电生成的产生的I。 GDDR7传输速率为48 GT/s,以承认超过150亿个参数模型的终端部署。