最新文章
Altera在40 nm工艺节点实现世界上最先进的定制逻辑器件
Altera于2008年第二季度发布 的Stratix® IV和HardCopy® IV器件系列,标志着世界上第一款40 nm FPGA以及业界唯一无风险40 nm ASIC移植方法的诞生。Altera三年多来竭尽全力的规划、开发以及与代工线合作伙伴——台积电(TSMC)的合作,最终获得成功,所交付的定制逻辑器件展示了产品领先优势。Altera随后于2009年第一季度发布的Arria® II GX和Stratix IV GT FPGA系列,曾是业界最全面的收发器系列产品。本文将对Altera这一里程碑式的技术做一全面的回顾,帮助读者理解40nm技术的重要意义。表1介绍了Altera开发世界上第一款40 nm FPGA的历史。
表1.Altera开发40 nm器件的时间线
日期 | 里程碑 |
2005年第一季度 | Altera开始开发40 nm FPGA和HardCopy ASIC系列,开始与TSMC在40 nm工艺上展开合作 |
2005年第四季度 | Altera第一次投片40 nm器件的9款测试芯片 |
2006年第二季度 | 评估测试芯片结构 |
2007年第四季度 | TSMC发布产品级45 nm工艺,并与Altera密切协作 |
2008年第一季度 | TSMC发布40 nm工艺 |
2008年第二季度 | Altera发布世界上第一款40 nm FPGA,Stratix IV器件系列,以及第一款40 nm HardCopy IV ASIC |
2009年第一季度 | Altera发布最全面的收发器系列产品,包括Arria II GX和Stratix IV GT FPGA |
40 nm工艺节点意义明显,为Altera在最高性能、最高密度、最低功耗以及性价比最高的FPGA和HardCopy ASIC上保持领先优势奠定了牢固的基础。
40 nm工艺技术的意义
和以前的65 nm节点以及最近的45 nm节点相比,40 nm工艺有很大的优势。最显著的一点是更高的集成度,半导体生产商可以在更小的物理空间中集成更多的功能。这类更高密度的实际结果在国际电子器件大会(IEDM)上有所报告,前沿的半导体制造商工艺技术的投入得到了这样的结果。基准测试是SRAM单元,表2显示了上次IEDM大会SRAM上报告的最近工艺节点的单元大小(按照45 nm工艺单元大小递增的顺序排列)。如表格所示,
表2. 65和45 nm工业节点报告的最小SRAM单元(1)
制造商/协作 (2) | 65 nm SRAM (µm2) | 45 nm SRAM (µm2) | 32 nm SRAM (µm2) |
TSMC | nr (3) | 0.242 | 0.15 |
ST Micro, Freescale, NXP | nr | 0.25 | nr |
Fujitsu | nr | 0.255 | nr |
Intel | 0.57 | 0.346 | nr |
IBM | 0.54 | 0.37 | nr |
0.49 | nr | nr | |
IBM, Chartered, Infineon, Samsung | 0.54 | nr | nr |
IBM, Toshiba, Sony, AMD | 0.65 | nr | nr |
注释:
(1) 来源:真实世界技术,“IEDM 2007上的工艺技术进步”
(2) 只显示了报告65或者45 nm SRAM单元大小的公司/组织
(3) nr = 没有报告
40 nm工艺的性能优势也很明显。40 nm最小的晶体管栅极长度比65 nm的栅极长度短38.5%,比45 nm工艺栅极长度短11%。40 nm更低的电阻进一步提高了驱动能力,从而提高了晶体管的性能。
Altera使用了应变硅技术,性能再次得以提高。例如,Altera的器件通过覆盖层在NMOS晶体管产生拉伸应变,通过源极和漏极的嵌入硅锗在PMOS晶体管产生压缩应变(参见图1)。这些应变硅技术使电子和空穴的移动能力提高了近30%,晶体管性能增强了40%以上。
图1. 40 nm应变硅技术实现了性能更好的晶体管
虽然密度和性能有非常显著的提高,但是,当今系统开发人员在设计中还需要着重考虑功耗问题。40 nm节点在这方面也有优势,更小的工艺尺寸降低了导致动态功耗增大的杂散电容。特别是,TSMC的40 nm工艺技术比45 nm工艺技术的动态功耗降低了15%。
然而,工艺尺寸的减小也使得待机功耗增大,如果不采取措施,将达到不可接受的程度。为解决这些以及其他越来越多的功耗问题,Altera采取了积极的措施来降低40 nm器件的动态和静态功耗。
前沿的工艺和器件体系结构相结合,满足了关键的系统设计需求
发展到40 nm节点实现了摩尔定律的密度和性能不断提高的优势。发挥这些工艺优势,并与器件体系结构创新相结合,Altera继续提供业界规模最大、性能最好的定制逻辑器件。相应的,Altera® Stratix IV FPGA和HardCopy IV ASIC分别具有650K逻辑单元(LE)和13M ASIC逻辑门。在性能方面,Altera的40 nm系列器件逻辑性能高达600-MHz,收发器性能达到8.5 Gbps,同时保持了业界领先的LVDS I/O性能,达到了1.6 Gbps,而单端I/O性能高达1066 Mbps,所有这些指标都没有牺牲信号完整性。
除了高密度和高性能,Altera还致力于实现最低功耗。紧凑型封装、便携性以及功效要求推动了目前对低功耗的需求。产品系统要求封装越来越薄,越来越小,有严格的散热、热沉大小要求,还有其他的热管理解决方案。此外,功率器件的运行成本是很多应用要首先考虑的,低功耗是很明显的竞争优势,或者在很多应用中都是必须的。设计目标的变化促使功耗成为系统元器件首要的选择标准。
FPGA供应商的器件发挥了越来越重要的电路板功能,在很多情况下要实现系统的核心功能,因此,他们在功耗管理上面临越来越大的挑战。在高性能和低功耗方面达到均衡需要付出很大的努力。
在亚微米尺寸,半导体功耗是关键问题,这是因为发展到高级工艺时,静态功耗会显著增大。更小的物理距离更容易导致电流泄漏。漏极到源极泄漏和栅极泄漏分别与沟道长度和栅极氧化层厚度成反比,随着沟道长度和氧化层厚度的减小而增大(图2)。
图2.晶体管泄漏电流源
源极至漏极漏电流,也称为亚阈值漏电流,是形成漏电流的主要原因之一。这里,即使晶体管栅极关断,电流也会从源极流向晶体管漏极。随着晶体管尺寸的减小,很难阻止这一电流的发生,因此,尺寸更小的40 nm晶体管会有更大的源极至漏极泄漏,在所有其他参数都相同的条件下,与较大工艺尺寸晶体管相比,其泄漏幅度更大。
晶体管阈值电压(Vt)也会影响源极至漏极漏电流的大小。晶体管Vt是源极与漏极之间沟道导通时的电压。较小的高速晶体管需要较低的Vt来维持晶体管关断和接通的速度,其控制通过栅极完成,但是,由于不能彻底关断晶体管沟道,因此,这会增大泄漏。另一个问题是栅极氧化层厚度,与掺杂相结合,会影响Vt。较薄的栅极氧化层支持晶体管较快的接通和关断,
但是,从栅极通过氧化层到基底也会产生较大的泄漏电流。工艺尺寸的减小实现了更短的栅极长度,这些泄漏电流源会越来越大,如图3所示。
图3. 随着工艺尺寸的减小,静态功耗显著增大
Altera主要采用五种方法来降低泄漏电流,如表3所示。这些都对性能有影响,降低了晶体管的性能。
但是,Altera做出了明智的选择,在晶体管级实现了性能和低功耗的均衡,从而维持了器件总体性能不变。通过分析目标器件体系结构的电流通路,Altera IC设计人员确定哪里适合采用高性能晶体管,哪里适合采用低性能晶体管以降低泄漏。通过这种方式,40 nm工艺使Altera IC设计人员拥有了一个平台,实现了最宽控制范围,同时实现了性能目标和最严格的功耗目标。
表3. Altera降低泄漏电流所采用的技术
技术 | 降低功耗的影响 | 对性能的影响 |
通过掺杂提高晶体管Vt | 降低了源极至漏极泄漏电流 | 提高了晶体管接通电压,降低了开关速度 |
提高了晶体管沟道长度 | 降低了源极至漏极泄漏电流 | 降低了晶体管开关速度 |
应用较厚的栅极氧化层 | 降低了栅极至基底泄漏电流 | 提高了晶体管Vt,降低了开关速度 |
通过可编程功耗技术,提高晶体管Vt | 降低了源极至漏极泄漏电流 | 提高了晶体管接通电压,降低了开关速度 |
降低了VCC | 降低了总泄漏电流 | 降低了开关速度 |
除了前面介绍的五种方法,Altera还采用了自己独特的可编程功耗技术来降低静态功耗。这一获得专利的特性内置在Stratix IV器件硅片中,支持Quartus® II开发软件改变晶体管Vt,根据设计要求使性能和功耗达到均衡。图4显示了可编程功耗技术的高级实现,Quartus II软件在时序驱动编译基础上分析了用户的FPGA设计,选择逻辑阵列中的哪些晶体管应该是高速模式,哪些应该是低功耗模式。通过反偏电压来修改晶体管Vt,减小时序不关键通路上的晶体管泄漏(提高了Vt),从而实现了低功耗,但是在需要的地方维持了高性能。
图4. 可编程功耗技术(1)通过设置晶体管的反偏电压,在功耗和性能上达到均衡
注释:
(1) 这是可编程功耗技术非常简单的“模型”。实际实现有变化,是获得专利的。
为降低器件的动态功耗,Altera把内核电压从以前系列器件所使用的1.1V降低到40 nm器件的0.9V。晶体管在开关期间的功耗与V2C (其中,C是电容)成正比,因此,降低供电电压能够以二次方的形式降低动态功耗。
降低内核电压也会影响晶体管效能,但是,Altera还是发挥了40 nm节点的高性能优势,在器件级保持高性能不变。如前所述,与以前的节点相比,Altera提高了40 nm节点某些晶体管的驱动能力,其IC设计人员可以均衡的考虑驱动能力和低功耗。
此外,Altera支持降低收发器每一个发送器和接收器通道的功耗,进一步降低了功耗。
Altera Stratix IV FPGA提供动态片内匹配(OCT)功能,降低了动态功耗。采用动态OCT,可以根据需要来接通或者关断Altera器件的匹配电阻。在存储器读写周期中,关断不需要的匹配电阻,去掉它们上面的电压,72位接口的功耗降低了1.2W。
总之,Altera在Arria II GX器件上采取的低功耗措施实现了功耗最低的FPGA,它具有3.75 Gbps收发器,功耗比竞争器件低65%。在Stratix IV FPGA中,与65 nm Stratix III FPGA中相似的设计相比,Altera的低功耗措施将总功耗平均降低了30%(待机功耗 + 动态功耗)。
从技术领先到顺利生产
实现第一款40 nm FPGA意义重大,但是,Altera的目标不限于此,继续维持了高质量和可靠的交付,这在以前工艺节点上一直如此。通过这些努力,鲁棒的开发实践,包括强大的测试芯片计划,严格的器件检查过程,以及在提高产量方面独特的优势,Altera终能获得成功。这些活动得到了业界最强大代工线合作伙伴的支持和加强。
Altera的代工线合作伙伴TSMC占据了全球专用代工线50%以上的市场份额,年度研究和开发投入比最相近的竞争厂家高出55%。这些投入实现了光刻和可制造性设计(DFM)的业界领先地位,进一步增强了TSMC在高级工艺代成功交付产品的能力。最重要的是,在40 nm节点,TSMC是浸入式光刻技术的领先者,这一工艺结合了光刻透镜和清澈液体,保持了很高的光线分辨率,支持实现更小、密度更高的封装器件。浸入式光刻是大部分半导体公司开发45 nm节点以及更小节点产品所选择的技术,认为是32 nm节点所必须的技术。
和TSMC一起,Altera积极组织了数十个联合工艺开发团队,全方位展开工艺开发,包括功耗/性能、建模、测试芯片规划、存储器、可靠性、聚乙烯熔丝、DFM、RF/模拟、ESD,以及封装,等等。每一个团队在产品交付上保持一致,两家公司的领导也达成一致,有始有终。