【高端设计】DDR4设计方法与仿真分析(一)

news2024/10/6 2:12:21

本文主要介绍了DDR4设计方法与仿真分析,并示范SIwave如何做DDR4的瞬时眼图、SSN、on-die de-cap影响、DBI耗电分析与规范性测试。

1.DDR4DDR3的区别

1.1 DDR4传输速度与带宽增加

DDR3 1600/1866MHz -> DDR4 1866/3200MHz

DDR3采用多点分支单流架构,DDR4采用点对点传输架构

DDR3采用了大水库理论,所有数据集中到一根大水管后送出。而DDR4则采用点对点分流架构,当每一条水管流量都很大时,累加起来的流量会超过单一条大水管,能避免单条信道传输带宽的瓶颈拖慢整体效能。

现在DDR4大部分还是采用2SPC (2 Slot per Channel)或称2DPC (2 DIMM per Channel)的架构,2017 Q1最新的Intel® Core™ i7-7920HQ处理器,最快支持到DDR4 2400MHz;开发中的2666/3200MHz也是采用2SPC传输架构。

1.2 DDR4更省电

操作电压降低:DDR4(1.2V), DDR3(1.5V)。除了降低工作电压,LPDDR4支持深度省电模式(DPD, Deep Power Down Mode),DDR4支持Max Power Saving Mode,在暂时不需要用到内存的时候可进入休眠状态,可进一步减少待机时功率的消耗。

Deep Power Down Mode:SDRAM controller发送Deep Power Down命令可以将SDRAM芯片推送到一个极低功耗状态(约15uA)。这时候存储数组的power会被shutdown,也就是意味着所有的数据是丢失掉了,这时候,mode register的设定是保持的。当从Deep Power Down退出的时候,需要对SDRAM芯片进行一个完整的初始化过程。

DDR4搭载了温度自更新回馈机制(TCSE,Temperature Compensated Self-Refresh),能够降低芯片在自动更新时所需耗费的电力,同时,还导入了数据汇流反转机制(DBI,Data Bus Inversion),使得VDDQ电流量得到有效控制。

DDR4使用POD(Pseudo Open Drain)接口,用以减少I/O电源消耗量。

对DDR4的IO来说,drive high时几乎不耗电的(下图右的红色虚线电流路径),这就是为何采用DBI+POD机制具有优势的原因。

DDR4虽然drive high的时候不耗电,但是在drive low的时候会消耗相比于SSTL两倍的电。所以,省电的关键在于较少输出0的数量。如果将要输出的数据bus上0比1多,DDR4会将数据翻转以达到降低功耗的目的。

1.3 DDR4高速讯号传输技术

-- I/O 技术不同:

DDR3采用SSTL,Vref=VDDQ/2;DDR4采用PODL,Vref不是固定的,会随VDDQ的AC变动而变动Vref=((2Rs+Rt)/(Rs+Rt))*VDDQ/2。

-- ODT眼图特征不同:

请注意下图是DQ的眼图,而不是DQS pair的眼图,前者DDR4眼图的crossover中心才会随ODT强度而变化。

-- DDR4增加了DBI(Data Bus Inversion)、CRC(Cyclic Redundancy Check)、CA parity等功能,让DDR4内存在更快速与更省电的同时亦能改善数据传输及储存的可靠性。

-- 对于2933/3200的支持,CPU/DIMM在DQ上都增加了EQ (CTLE),但是CAC (Command/Address/CTL)上,暂时还没有EQ,虽然其速率比DQ低,但是在DIMM卡上Diasy Chain 的结构 CTL有9 loads,Command/Address有36个loads,所以CAC的高速设计,对于UDIMM和SODIMM来说,更是一个很大的挑战。对于CAC,目前都是在DIMM最末端用电阻端接到Vtt来做终端 。

1.4 其他

DDR4 新增了4 个Bank Group 数据组的设计,Bnak Group可以选择2个或4个独立分组,而DDR4模块内的每单位Bnak Group都可独立进行读取、写入、唤醒及更新等动作。Bank Group 数据组可套用多任务的观念来想象,亦可解释为DDR4 在同一频率工作周期内,至多可以处理4 笔数据,效率明显好过于DDR3。又DDR4 虽然增加内存组数(bank)为 16,但却加入内存群组(bank group)的限制。不同 bank 但若属于同一个 bank group,连续读写指令间必须增加等待时间周期,造成数据总线的闲置机率升高,传输效能降低。在此种限制下,如何充分利用数据总线以达成最高效率,对于控制 DDR4 的逻辑电路设计是新的挑战。

由于以上因素,DDR3与DDR4不能混用(工作电压与防呆插槽的设计都不同)。

2.DDR4设计方法

DDR4的设计方法,其实与DDR3雷同,只是速度更快,设计要求更高。早从DDR3时代开始,从主控IC->PCB->内存整条信道,基于"3D结构"的角度考虑信道间耦合(inter-channel coupling)、因为回路(return path)的影响考虑封装的ball map与ball下方的slot、SI+PI的仿真...。

以下是一个欠佳的设计范例:

以下是优化后的设计范例:

这里为什么选择Via Stub较长的做法反而SI会比较好呢?这是考验所学的SI设计知识是否活用的好机会,想不出来的请参阅下面的2.4.1

2.1 3D封装(SiP,PoP,TSV,InFO)

2.1.1 Traditional 3D Packaging Technologies:SiP and PoP

POP用于中高端,MCP(Sip)用于低端到中端

2.1.2 基于TSV的3D封装新技术:用于宽IO DRAM和高带宽存储器

TSV硅穿孔技术因为成本高,良率与散热问题不易处理,有兴趣的人请自行参考数据。

2.1.3 TSMC's InFO (Integrated FanOut)

一般的Fan-Out技术:

TSMC的Fan-Out技术:

2.2 ICPI优化

早从DDR3时代开始,on-die de-cap摆放的大小,已经成为速度上不去的关键。记得数年前刚从DDR2转DDR3的年代,几家国内知名的IC设计公司,明明已经打开过别人IC看过,里面就是放一堆on-die de-cap,但就是不愿意把on-die de-cap加大,被cost-down的死脑筋卡关,拼命想着如何在封装与PCB层级内改善,最后还是徒劳无功。唉...这样的例子在业界屡见不鲜。

Micron DDR4甚至直接告诉你他on-die电容放多少(写在IBIS\SPICE quality report内),真是佛心来的,大厂的风范与格局就是不同。

对于DDR3,美光on-die de-cap加522pF per DQ/DQS。但对于DDR4,美光on-die de-cap加484pF per DQ/DQS。

2.3 系统的PI优化

如果从IC->封装->PCB都有抽取model正确的考虑,模拟的准确度是非常高的,不论是高速讯号或是EMI干扰的问题都可以有效分析 。

从下图中可以看出,百MHz的de-cap靠PCB叠层的设计,在P/G层之间的平板电容,而GHz以上的de-cap必须要靠on-die de-cap。

2.4 系统的SI优化

2.4.1在DesignCon2013由Samsung所发表的LPDDR3优化设计中,与在DesignCon2015由Xilinx所发表的DDR4 2400优化设计中,我们不约而同地看到了选择via导通长度较短(shorter via effective length, but longer via stub)的设计,得到较好的DDR SI特性。

这是因为,在via barrel结构上,讯号经过的部份(via effective length)贡献串联电感效应,而讯号没经过的部分(via stub)贡献电容效应,这两者是相互trade-off的。基于不同的板厚与传输速度带宽考虑,有时是以短的via effective length较佳,有时则以短的via stub较佳。

在DDR4的设计中,大部分时候,via stub并不是起主要作用,而via之间的crosstalk则是很重要的一个因素。

2.4.2减少因讯号换层引起的回路不连续,也是一个重要的方面。

2.4.3对于DDR4 3200,甚至DDR5的DQ都还是维持以单端讯号(Single-end)的方式传送,如何减少crosstalk也是很关键。

减少讯号线走线间的crosstalk – 保持间距, 保持2~3W比起插入保护地线在layout空间上较可行。

同时,也应减少因跨地引起的crosstalk :

减少DIMM connector与memory buffer routing间的crosstalk -- 在连接器焊盘旁边添加接地过孔:

【未完待续】

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/723700.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【电路原理学习笔记】第2章:电压、电流和电阻:2.7基本电路的测量

第2章:电压、电流和电阻 2.7基本电路的测量 用来测量电压的仪器是电压表,用来测量电流的仪器是电流表,用来测量电阻的仪器是欧姆表。通常,这3种仪器被集成到一个称为万用表的仪器中。在万用表中,可以通过开关选择特定…

Python接收摄像头输出的YCbYCr数据并显示图像(附Python源码)

前言 摄像头用的OV的2640,输出YCbYcr的十六进制数据,数据保存成字符串形式的hex文件,之后用Python读取文件,并显示图片。 文章先搭建Python环境,之后编程实现十六进制数据显示图片的功能。 十六进制文件格式如下图&am…

el-table合计样式修改,增加图片

这里的表格用的是el-table组件。如上图,在底部合计的两个字段上增加图片。合计用的是:summary-method"getSummaries"。增加图片的原理其实就是获取这个单元格的dom元素定位,然后在这个元素里面增加 img元素,还可以设置样式。如下图…

Django之常用组件

一、分页器组件 class Pagination(object):def __init__(self,current_page,all_count,per_page_num2,pager_count11):"""封装分页相关数据:param current_page: 当前页:param all_count: 数据库中的数据总条数:param per_page_num: 每页显示的数据条数:par…

峰会来袭 | CAD模型转换工具选择的难点和关键点解答

作为世界顶尖的3D软件开发SDK和CAD模型转换工具——HOOPS Exchange已问世十多年,深受开发者好评,并在工业测量、机械加工、造船设计等领域都有广泛的应用。 本次峰会将围绕CAD软件造型技术的多样性、CAD模型数据解析的难点、3D模型转换的经典问题等&…

曝光调整和曝光融合论文粗读

曝光调整论文调研 M. Afifi, K. G. Derpanis, B. Ommer and M. S. Brown, “Learning Multi-Scale Photo Exposure Correction,” 2021 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), Nashville, TN, USA, 2021, pp. 9153-9163, doi: 10.1109/CVPR4…

开放式耳机什么牌子性价比好,这些高颜值蓝牙耳机分享给你

入耳式耳机在运动过程中会与耳道产生摩擦,产生咀嚼音、摩擦音等杂音,会让耳朵难受,听音也会受到影响,特别是像边看电视剧边吃零食等情况,会很影响体验感,所以开放式耳机不入耳的设计完全处理了这一问题&…

卷积神经网络| 猫狗系列【AlexNet】

首先,搭建网络: AlexNet神经网络原理图: net代码:【根据网络图来搭建网络,不会的看看相关视频会好理解一些】 import torchfrom torch import nnimport torch.nn.functional as Fclass MyAlexNet(nn.Module): def…

Linux系统之neofetch工具的基本使用

Linux系统之neofetch工具的基本使用 一、neofetch工具介绍1.1 neofetch简介1.2 neofetch特点 二、检查本地环境2.1 检查操作系统版本2.2 检查内核版本 三、安装neofetch工具3.1 配置yum仓库3.2 安装neofetch3.3 查看neofetch版本 四、neofetch工具的基本使用4.1 直接使用neofet…

quilt data-Working with the Catalog

Quilt Catalog 是 Quilt 的第二部分。它提供了一个在您的 S3 存储桶上的界面,将 Quilt 的数据包和搜索等功能带到了 Web 界面上。 请注意,您可以在不使用 Quilt Catalog 的情况下使用 Quilt Python API,但它们是设计为配合使用的。 简要介绍…

【实现openGauss5.0企业版一主一备搭建部署】

【实现openGauss5.0企业版一主一备搭建部署】 🔻 前言🔻 一、安装前准备🔰 1.1 openGauss安装包下载🔰 1.2 安装环境准备⛳ 1.2.1 硬件环境要求⛳ 1.2.2 软件环境要求⛳ 1.2.3 软件依赖要求⛳ 1.2.4 修改 hosts 和 hostname&#…

【react】创建启动react项目和跨域代理:

文章目录 1、创建启动react项目:2、跨域代理:【1】文档:[https://create-react-app.dev/docs/proxying-api-requests-in-development/](https://create-react-app.dev/docs/proxying-api-requests-in-development/)【2】src/setupProxy.js: 1…

阿姆斯特丹大学Max Welling教授-深度学习和自然科学

目录 简介 AI4Science & Science4AI 深度学习简介 AI4Science Science4AI 总结/结束语 参考 简介 人工智能一直与自然科学有着深厚的联系。 人工神经网络最初被认为是生物神经网络的抽象,许多后续算法(例如强化学习)也是如此。 神经…

springcloud actuator暴露端点漏洞修复

前段时间网络安全的同事突然通知系统漏洞,swagger漏洞和暴露多余端点等,可能会泄露信息。刚开始只是修改了相关配置。如下: 更改config配置 management:security:enabled: true security:user:name: xxxpassword: xxxbasic:enabled: trueen…

配置tensorflow1.15版本遇到的问题:conda环境管理/tensorflow历史版本下载/pycharm中如何使用conda中的虚拟环境

0、前言: 我之前在做配置环境,或者不懂的操作时,总是遇到问题在csdn或者网上搜就行了,然后解决问题之后,也不知道期间搜了哪些知识。也记不住一些修改的地方,这就导致,我十分担心好不容易搭好的…

spring系列-SpringCloud

SpringCloud概述 微服务概述 什么是微服务 目前的微服务并没有一个统一的标准,一般是以业务来划分 将传统的一站式应用,拆分成一个个的服务,彻底去耦合,一个微服务就是单功能业务,只做一件事。 与微服务相对的叫巨石 …

“提高个人生产力:思维导图在时间管理和计划中的应用“

在高效成为当今时代职场人高频谈论的一个词后,时间管理和计划的重要性也日渐显现。一个好的时间管理和计划可以在不知不觉中有效帮助我们更加合理的安排时间,保证工作的有序进行和按时完成。通过合理的协调工作与休息之间的关系,避免我们浪费…

15、服务端实战:数据库工具封装

在了解完 NestJS 的基础配置之后,服务端的内容将引来一个比较重要的环节:数据库。 因为数据库的内容比较多,所以相关内容将分为两个章节来展开讨论: 数据库工具封装 - 将封装统一的数据库操作工具类,方便后期开发于集…

识别肿瘤内微生物的生物信息学工具—MEGA

谷禾健康 已有研究证明宿主微生物在癌症预防和治疗反应中的关键作用,了解宿主微生物和癌症之间的相互作用,可以推动癌症诊断和微生物治疗(即用微生物作为药物)。 然而肿瘤内微生物组数据通常是复杂的,想要厘清相互关系也是极为困难的&#xf…

低代码平台——少量编码即可快速生成应用程序

低代码平台,即无需编码或通过少量代码就可以快速生成应用程序的开发平台。 低代码平台面向的是IT或者平民程序员,解决传统软件开发模式带来的周期长、成本高等问题,客户群体主要为软件开发公司或者拥有IT的中大型企业。而零代码(N…