【高端设计】DDR4设计方法与仿真分析(一)

本文主要介绍了DDR4设计方法与仿真分析,并示范SIwave如何做DDR4的瞬时眼图、SSN、on-die de-cap影响、DBI耗电分析与规范性测试。

1.DDR4DDR3的区别

1.1 DDR4传输速度与带宽增加

DDR3 1600/1866MHz -> DDR4 1866/3200MHz

DDR3采用多点分支单流架构,DDR4采用点对点传输架构

DDR3采用了大水库理论,所有数据集中到一根大水管后送出。而DDR4则采用点对点分流架构,当每一条水管流量都很大时,累加起来的流量会超过单一条大水管,能避免单条信道传输带宽的瓶颈拖慢整体效能。

现在DDR4大部分还是采用2SPC (2 Slot per Channel)或称2DPC (2 DIMM per Channel)的架构,2017 Q1最新的Intel® Core™ i7-7920HQ处理器,最快支持到DDR4 2400MHz;开发中的2666/3200MHz也是采用2SPC传输架构。

1.2 DDR4更省电

操作电压降低:DDR4(1.2V), DDR3(1.5V)。除了降低工作电压,LPDDR4支持深度省电模式(DPD, Deep Power Down Mode),DDR4支持Max Power Saving Mode,在暂时不需要用到内存的时候可进入休眠状态,可进一步减少待机时功率的消耗。

Deep Power Down Mode:SDRAM controller发送Deep Power Down命令可以将SDRAM芯片推送到一个极低功耗状态(约15uA)。这时候存储数组的power会被shutdown,也就是意味着所有的数据是丢失掉了,这时候,mode register的设定是保持的。当从Deep Power Down退出的时候,需要对SDRAM芯片进行一个完整的初始化过程。

DDR4搭载了温度自更新回馈机制(TCSE,Temperature Compensated Self-Refresh),能够降低芯片在自动更新时所需耗费的电力,同时,还导入了数据汇流反转机制(DBI,Data Bus Inversion),使得VDDQ电流量得到有效控制。

DDR4使用POD(Pseudo Open Drain)接口,用以减少I/O电源消耗量。

对DDR4的IO来说,drive high时几乎不耗电的(下图右的红色虚线电流路径),这就是为何采用DBI+POD机制具有优势的原因。

DDR4虽然drive high的时候不耗电,但是在drive low的时候会消耗相比于SSTL两倍的电。所以,省电的关键在于较少输出0的数量。如果将要输出的数据bus上0比1多,DDR4会将数据翻转以达到降低功耗的目的。

1.3 DDR4高速讯号传输技术

-- I/O 技术不同:

DDR3采用SSTL,Vref=VDDQ/2;DDR4采用PODL,Vref不是固定的,会随VDDQ的AC变动而变动Vref=((2Rs+Rt)/(Rs+Rt))*VDDQ/2。

-- ODT眼图特征不同:

请注意下图是DQ的眼图,而不是DQS pair的眼图,前者DDR4眼图的crossover中心才会随ODT强度而变化。

-- DDR4增加了DBI(Data Bus Inversion)、CRC(Cyclic Redundancy Check)、CA parity等功能,让DDR4内存在更快速与更省电的同时亦能改善数据传输及储存的可靠性。

-- 对于2933/3200的支持,CPU/DIMM在DQ上都增加了EQ (CTLE),但是CAC (Command/Address/CTL)上,暂时还没有EQ,虽然其速率比DQ低,但是在DIMM卡上Diasy Chain 的结构 CTL有9 loads,Command/Address有36个loads,所以CAC的高速设计,对于UDIMM和SODIMM来说,更是一个很大的挑战。对于CAC,目前都是在DIMM最末端用电阻端接到Vtt来做终端 。

1.4 其他

DDR4 新增了4 个Bank Group 数据组的设计,Bnak Group可以选择2个或4个独立分组,而DDR4模块内的每单位Bnak Group都可独立进行读取、写入、唤醒及更新等动作。Bank Group 数据组可套用多任务的观念来想象,亦可解释为DDR4 在同一频率工作周期内,至多可以处理4 笔数据,效率明显好过于DDR3。又DDR4 虽然增加内存组数(bank)为 16,但却加入内存群组(bank group)的限制。不同 bank 但若属于同一个 bank group,连续读写指令间必须增加等待时间周期,造成数据总线的闲置机率升高,传输效能降低。在此种限制下,如何充分利用数据总线以达成最高效率,对于控制 DDR4 的逻辑电路设计是新的挑战。

由于以上因素,DDR3与DDR4不能混用(工作电压与防呆插槽的设计都不同)。

2.DDR4设计方法

DDR4的设计方法,其实与DDR3雷同,只是速度更快,设计要求更高。早从DDR3时代开始,从主控IC->PCB->内存整条信道,基于"3D结构"的角度考虑信道间耦合(inter-channel coupling)、因为回路(return path)的影响考虑封装的ball map与ball下方的slot、SI+PI的仿真...。

以下是一个欠佳的设计范例:

以下是优化后的设计范例:

这里为什么选择Via Stub较长的做法反而SI会比较好呢?这是考验所学的SI设计知识是否活用的好机会,想不出来的请参阅下面的2.4.1

2.1 3D封装(SiP,PoP,TSV,InFO)

2.1.1 Traditional 3D Packaging Technologies:SiP and PoP

POP用于中高端,MCP(Sip)用于低端到中端

2.1.2 基于TSV的3D封装新技术:用于宽IO DRAM和高带宽存储器

TSV硅穿孔技术因为成本高,良率与散热问题不易处理,有兴趣的人请自行参考数据。

2.1.3 TSMC's InFO (Integrated FanOut)

一般的Fan-Out技术:

TSMC的Fan-Out技术:

2.2 ICPI优化

早从DDR3时代开始,on-die de-cap摆放的大小,已经成为速度上不去的关键。记得数年前刚从DDR2转DDR3的年代,几家国内知名的IC设计公司,明明已经打开过别人IC看过,里面就是放一堆on-die de-cap,但就是不愿意把on-die de-cap加大,被cost-down的死脑筋卡关,拼命想着如何在封装与PCB层级内改善,最后还是徒劳无功。唉...这样的例子在业界屡见不鲜。

Micron DDR4甚至直接告诉你他on-die电容放多少(写在IBIS\SPICE quality report内),真是佛心来的,大厂的风范与格局就是不同。

对于DDR3,美光on-die de-cap加522pF per DQ/DQS。但对于DDR4,美光on-die de-cap加484pF per DQ/DQS。

2.3 系统的PI优化

如果从IC->封装->PCB都有抽取model正确的考虑,模拟的准确度是非常高的,不论是高速讯号或是EMI干扰的问题都可以有效分析 。

从下图中可以看出,百MHz的de-cap靠PCB叠层的设计,在P/G层之间的平板电容,而GHz以上的de-cap必须要靠on-die de-cap。

2.4 系统的SI优化

2.4.1在DesignCon2013由Samsung所发表的LPDDR3优化设计中,与在DesignCon2015由Xilinx所发表的DDR4 2400优化设计中,我们不约而同地看到了选择via导通长度较短(shorter via effective length, but longer via stub)的设计,得到较好的DDR SI特性。

这是因为,在via barrel结构上,讯号经过的部份(via effective length)贡献串联电感效应,而讯号没经过的部分(via stub)贡献电容效应,这两者是相互trade-off的。基于不同的板厚与传输速度带宽考虑,有时是以短的via effective length较佳,有时则以短的via stub较佳。

在DDR4的设计中,大部分时候,via stub并不是起主要作用,而via之间的crosstalk则是很重要的一个因素。

2.4.2减少因讯号换层引起的回路不连续,也是一个重要的方面。

2.4.3对于DDR4 3200,甚至DDR5的DQ都还是维持以单端讯号(Single-end)的方式传送,如何减少crosstalk也是很关键。

减少讯号线走线间的crosstalk – 保持间距, 保持2~3W比起插入保护地线在layout空间上较可行。

同时,也应减少因跨地引起的crosstalk :

减少DIMM connector与memory buffer routing间的crosstalk -- 在连接器焊盘旁边添加接地过孔:

【未完待续】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/34919.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

HTML基础

推荐W3school、developer.mozilla.org学习 文章目录 前言标签html标签标题标签h1-h6段落标签p换行标签br超链接标签a锚点定位图像标签img列表标签有序列表ol无序列表ul定义列表dl 表格标签表格列合并表单标签input:输入框文本框密码框单选按钮复选框上传文件按钮下拉…

Elasticsearch:文档版本控制和乐观并发控制

在今天的文章中,我来详细描述一下 Elasticsearch 文档的版本控制以及如何更新文档。你也可以阅读我之前的文章 “Elasticsearch:深刻理解文档中的 verision 及乐观并发控制”。 版本控制 我们知道 Elasticsearch 的每个文档都有一个相对应的版本。这个版…

html前端输入框模糊查询

1、一个页面内多个模糊查询情况&#xff1a; <!DOCTYPE html> <html> <head> <meta charset"UTF-8" /> <meta name"viewport" content"widthdevice-width, initial-scale1.0, user-scalable0, minimum-scale1.0, maximum-…

geoserver加载arcgis server瓦片地图显示异常问题处理

1.全能地图下载的瓦片conf.xml格式有问题首先要修改格式&#xff0c;conf.cdi文件也需要修改格式&#xff0c;修改为UTF-8或者UTF-8无BOM编码(不同的notepadd显示不同) 2. 下载的conf.xml坐标系默认从最小级别开始&#xff0c;一定要把前几级也补全&#xff0c;从0级开始 <L…

抖音SEO矩阵源码开发(一)

前言&#xff1a; 1.抖音SEO矩阵系统源码开发 是一项技术密集型工作&#xff0c;需要对大数据处理、人工智能等领域有深入了解。该系统开发过程中需要用到多种编程语言在服务器上安装LNMP环境&#xff0c;包括Linux操作系统、Nginx、MySQL、PHP等&#xff0c;如Java、Python等…

GitHub打不开的解决方案(超简单)

在国内&#xff0c;github官网经常面临打不开或访问极慢的问题&#xff0c;不挂梯子&#xff08;VPN&#xff0c;飞机&#xff0c;魔法&#xff09;使用体验极差&#xff0c;那有什么好办法解决GitHub官网访问不了的问题&#xff1f;今天小布教你几招轻松访问github官网。 git…

自定义MVC工作原理

目录 一、MVC二、MVC的演变2.1 极易MVCController层——Servletview层——JSP缺点&#xff1a;Servlet过多、代码冗余 2.2 简易MVCController层——Servletview层——JSP缺点&#xff1a;在Servlet中if语句冗余 2.3普易MVCController层——Servletview层——JSP缺点&#xff1a…

CentOS Linux的最佳替代方案(二)_AlmaLinux OS 8.6基础安装教程

文章目录 CentOS Linux的最佳替代方案&#xff08;二&#xff09;_AlmaLinux OS 8.6基础安装教程一 AlmaLinux介绍和发展历史二 AlmaLinux基础安装2.1 下载地址2.2 安装过程 三 AlmaLinux使用3.1 关闭selinux/firewalld3.2 替换默认源3.3 安装一些必要工具 CentOS Linux的最佳替…

uniapp - [全端兼容] 多选弹框选择器,弹框形式的列表多选选择器组件插件(底部弹框式列表多选功能,支持数据回显、动态数据、主题色等配置)

前言 网上的教程都太乱了,各种不兼容且 BUG 太多,注释也没有很难进行改造。 本文 实现了 uniapp 全端兼容的弹框多选选择器,从底部弹出列表项进行多选(可回显已选中和各种主题色、样式配置), 您可以直接复制代码,稍微改改样式就能用了。 如下图所示,数据列表(支持接口…

Centos7.9通过expect脚本批量修改H3C交换机配置

背景&#xff1a; 公司有几百台H3C二层交换机设备&#xff0c;当需要批量更改配置时非常的消耗工作量 解决&#xff1a; 通过一台Linux服务器&#xff0c;编写shell脚本&#xff0c;模拟Telnet至各台交换机&#xff0c;让一切变的很容易 1.首先在安装Telnet服务前需要检测centO…

途乐证券|股票低开好还是高开好?股票低开高走再回落什么意思?

对于一向不涨的股票&#xff0c;出资者常常感到困惑和不安。那么一向不涨的股票要留吗&#xff1f;什么股票更简单上涨&#xff1f;为我们预备了相关内容&#xff0c;以供参阅。 一向不涨的股票要留吗&#xff1f; 一向不涨的股票要不要留没有一个绝对的答案&#xff0c;出资者…

java开发微信公众平台之素材上传

微信公众平台官方文档 我在本地使用工具请求接口一切正常。 当我开始写代码的时候 我蒙了 后台怎么模拟form表单上传图片 放参考文章链接https://blog.csdn.net/subaiqiao/article/details/122059076 首先引入依赖 <dependency><groupId>com.squareup.okhttp3&l…

软件测试的生命周期、Bug

一、软件测试的生命周期 1、软件的生命周期&#xff1a; 需求分析&#xff1a;分析需求是否正确、完整。 设计&#xff1a;项目的上线时间、开始开发时间、测试时间、人员... 计划&#xff1a;设计技术文档、进行UI设计... 编码&#xff1a;写代码&#xff08;实现用户需求&am…

已上架的App在AppStore上无法搜索到的问题

已上架的App在AppStore上无法搜索到的问题 在AppStore上搜不到已经上架的应用程序可以采取以下解决办法&#xff1a; 拨打iTunes提供的支持电话&#xff1a;4006-701-855&#xff08;中国时间9:00-17:00&#xff09;。发送邮件给Review团队&#xff0c;在iTunes Connect登录后…

堆排序算法及其稳定性分析

堆排序算法及其稳定性分析 什么是堆排序&#xff1f; 堆排序是利用数据结构堆而设计的一种排序算法。 堆分为两种&#xff0c;大顶堆和小顶堆。 所谓大顶堆就是每个节点的值都大于或者等于其左右孩子节点的值。 小顶堆则是相反的&#xff0c;每个节点的值都小于或者等于其…

单片机STM32看门狗详解(嵌入式学习)

单片机STM32看门狗 什么是看门狗为什么需要看门狗&#xff1f;STM32CubeMX配置和应用示例独立看门狗&#xff08;IWDG&#xff09;窗口看门狗&#xff08;WWDG&#xff09; 注意事项 什么是看门狗 单片机STM32的看门狗&#xff08;Watchdog&#xff09;是一种硬件定时器&#…

Android中级——IPC

IPC IPC是什么&#xff1f;多进程带来的问题IPC前提SerializableParcelableBinder Android中的IPCBundle文件共享MessengerAIDLContentProviderSocket不同IPC优缺点 Binder连接池 IPC是什么&#xff1f; Inter-Process Communcation&#xff0c;含义为进程间通信或者跨进程通信…

【FFMPEG】AVFilter使用流程

流程图 核心类 AVFilterGraph ⽤于统合这整个滤波过程的结构体 AVFilter 滤波器&#xff0c;滤波器的实现是通过AVFilter以及位于其下的结构体/函数来维护的 AVFilterContext ⼀个滤波器实例&#xff0c;即使是同⼀个滤波器&#xff0c;但是在进⾏实际的滤波时&#xff0c;也…

易模为真人3D手办制作带来了创新

3d打印技术是一项近年来迅速发展的先进制造技术&#xff0c;逐渐在各个领域展现出无限的潜力。其中&#xff0c;3d打印真人手办成为了一个备受关注的领域。在市面上&#xff0c;我们常常可以看到一些热门动漫角色或明星的真人3d手办&#xff0c;逼真的细节和完美的再现度让人们…

实验室仪器管理系统/基于微信小程序的实验室仪器管理系统

摘 要 随着当今网络的发展&#xff0c;时代的进步&#xff0c;各行各业也在发生着变化&#xff0c;于是网络已经逐步进入人们的生活&#xff0c;给我们生活或者工作提供了新的方向新的可能。 本毕业设计的内容是设计实现一个实验室仪器管理系统。使用微信开发者是以java语言…