南科大潘权团队在高速有线芯片设计领域取得新进展

2024年12月31日 科研新闻

近日,南方科技大学深港微电子学院教授潘权团队在高速有线芯片设计领域取得进展。团队共发表4篇期刊论文,其中3篇发表在集成电路设计领域期刊《固态电路期刊》(IEEE Journal of Solid-State Circuits,JSSC)上,1篇受邀发表在集成电路设计领域开源期刊《固态电路学会开放期刊》(IEEE Open Journal of the Solid-State Circuits Society,OJ-SSCS)上。

JSSC是集成电路设计领域排名第一的期刊,以严苛的审稿过程、极具创新的芯片设计、全面而深刻的理论分析著称,投稿要求必须有芯片流片且实际测试指标世界领先。到目前为止,南方科技大学作为第一通讯单位在 JSSC 上共发表了11篇论文,其中5篇来自潘权团队。

微信图片_20241225092126.jpg

研发一种串扰消除收发机,实现插损串扰比提升的串扰抑制效果

团队提出了一种单端模式编码消除的串扰消除收发机,相关成果以“A 2 × 24 Gb/s Single-Ended Transceiver With Channel-Independent Encoder-Based Crosstalk Cancellation in 28-nm CMOS”为题发表在《固态电路期刊》(JSSC)上。

近日,人们对人工智能(AI)、机器学习(ML)以及高性能数据中心对高带宽和低功耗有线通信提出了更高的需求,这推动了有限面积内I/O数量的增加以及每个引脚的数据速率提升。尽管已有的研究通过采用高级调制方法、复杂的均衡技术以及前向纠错方案,证明了实现更高吞吐量链路的可行性,但这些方法会带来显著的硬件开销、高延迟以及较大的功耗。此外,随着波特率的提高,必须对无源链路进行精心优化以满足系统要求,这进一步导致了成本的增加。单端多输入多输出方案(SE-MIMO)提供了一种有前景的选择,通过在一对差分信道上利用两个单端信号来实现高数据速率。然而,高性能的单端多输入多输出传输必须依赖于串扰消除(XTC)技术,因为连接器、封装以及通道中走线的耦合会引入严重的串扰,会损害链路的信号完整性(SI)。此外,不同的应用涉及不同的通道特性,这要求 XTC 技术具有自适应性和鲁棒性。同时,信噪比(SNR)对单端系统的灵敏度有显著影响,因此,串扰消除方案不应该过度影响信噪比。为减轻紧耦合差分通道中的强串扰,推动 SE-MIMO 方案在多种场景下的应用,亟需一种不依赖于通道特性的有效 XTC 方法。

根据上述问题,本文提出了一种单端模式编码消除的串扰消除收发机,并深入分析了串扰形成的机理,模式编码串扰消除的数学原理,以及与现有方案的效果对比,并在实际的两通道收发机系统中进行了验证。测试结果表明,通过采用无通道依赖的模式编码串扰消除技术,该单端收发机在24 Gb/s/pin速率下,实现了插损串扰比(IL-to-Crosstalk Ratio)高达-13 dB的串扰抑制效果,系统误码率低至1e-12。图片1a.jpg

图1.1.模式编码串扰消除收发机芯片图片1b.jpg

图1.2. (a) 芯片照片; (b)芯片功耗分布;(c) 收发机眼图;(d) 误码率测试结果

图1.2(a),(b)展示了提出的收发机的芯片面积及其功耗分布,图1.2(c)展示了芯片在两种信道场景下工作的眼图测试结果。如图所示,有串扰情况下,收发机通过信道后的眼图完全闭合;在串扰消除功能开启后之后,24Gb/s NRZ 眼宽和眼高分别达到了 0.34UI(68mV) 和 0.33UI(32mV)。同时,如图1.2(d)所示,该收发机在24Gb/s的数据速率下,实现了10-12的误码率。

2022级博士生吴泓志为论文的第一作者,潘权为论文的唯一通讯作者,南方科技大学为论文的第一单位,该论文得到了国家自然科学基金和国家重点研发计划经费的支持。

研发单端串扰消除 TRX 技术,助力解决网络交换和云计算需求增长问题

团队研发了一种 2×112 Gb/s 单端串扰消除 TRX 技术,助力解决网络交换和云计算不断增长的需求,相关成果以“A 2×112 Gb/s/pin Single-Ended Crosstalk Cancellation Transceiver With 31 dB Loss Compensation in 28-nm CMOS”为题发表在《固态电路期刊》(JSSC)上。

随着人们对网络交换和云计算的需求不断增长,推动有线收发器(TRX)朝着更高的数据速率发展,达到224 Gb/s。为实现这些所需的高数据速率,研究者们已基于数字信号处理器(DSP)的四电平脉冲幅度调制(PAM-4)TRX 提出了多种潜在解决方案,在先进技术中实现了目标I/O带宽。由于其鲁棒性和强大的均衡器,基于DSP的TRX适用于长距离(LR)链路。然而,它们的高功率消耗限制了在甚短距离(VSR)和中距离(MR)链路中的适用性,对功率受限的应用提出了挑战。此外,由于带宽需求的增加,该方案已遇到重大的封装挑战。图片2a.jpg

图2.1.单端多输入多输出串扰消除接收机芯片

如图2.1所示,224 Gb/s PAM-4 方案的带宽需求为56 GHz。PAM-8 和 PAM-16 方案的带宽需求分别放宽到37和28 GHz。单端方案提供了一种有前景的选择,通过在一对差分信道上利用两个单端信号来实现高数据速率。与差分方案相比,该方法使吞吐量密度加倍,并放宽了对无源元件的奈奎斯特带宽要求。但由于串扰噪声,单端方案面临着重大挑战。本文介绍了一种 2×112 Gb/s单端串扰消除 TRX 的方案,用于带连接器的背板链路,通过一对差分信道传输总共224 Gb/s的数据。图片2b.jpg

图2.2. (a) 芯片照片及功耗分布;(b) 芯片眼图和误码率测试结果

图2.2(a)展示了提出的接收机芯片面积及其功耗分布,图2.2(b)展示了芯片的眼图测试结果和误码率测试结果。如图所示,TX 分别在无串扰情况下实现了 56 Gb/s NRZ 和 112 Gb/s PAM-4 的 0.6 UI/224 mV 和 0.29 UI/45 mV 的眼宽/高度。有串扰情况下,在 XTC 之后,56Gb/s NRZ 和 112Gb/s PAM-4 的眼宽分别平均提高了0.42和0.22UI。这项工作实现了 112 Gb/s 的 PAM-4,在 28 GHz 时信道损耗为 31 dB,能量效率为 2.77 pJ/b。同时,所提出的 TRX 为 12 Gb/s PAM-4 实现了10-10的BER。

2020级博士研究生钟立平为论文的第一作者,潘权为论文的唯一通讯作者,南方科技大学为论文的唯一单位,该论文得到了国家自然科学基金和国家重点研发计划经费的支持。

聚焦专业技术,解决内存接口数据需求问题

团队提出了一种集成型预加重电容-峰化串扰消除技术,助力解决不断增长的对内存接口的数据吞吐量要求,相关成果以“A 64 Gb/s/pin Single-Ended PAM-4 Transmitter with a Merged Pre-Emphasis Capacitive-Peaking Crosstalk Cancellation Scheme for Memory Interfaces in 28-nm CMOS”为题发表在《固态电路期刊》(JSSC)上。

随着海量计算和人工智能应用的发展,人们对内存接口的数据吞吐量要求不断提高。影响内存接口吞吐量的两个关键指标分别是单通道数据率和通道密度。由于工艺缩放所带来的带宽提升放缓,GDDR6X 等先进 DRAM 应用已经采用 PAM-4 信令来提高数据传输速率,然而 PAM-4 信令由于电压裕度的减少对信噪比更加敏感。随着通道间距的减少,串扰导致的信号完整性问题愈发严重,严重限制了通道密度和数据吞吐量的提高。虽然研究者们已开始研究发射机串扰消除技术,但主要集中在 NRZ,且存在信噪比低或接口效率低的缺点。因此,需要探究一种同时兼顾高信噪比、高接口效率的高速 PAM-4 串扰消除技术。

针对上述问题,本文提出了一种集成型预加重电容-峰化串扰消除技术,将电容峰化电路集成在驱动器内部生成串扰消除信号,即不降低输出摆幅,又避免了输出节点的寄生堆积,支持高速率运行。研究人员基于该技术设计了一款4通道高速 PAM-4 串扰消除单端发射机并完成了测试验证。测试结果表明,在 -11dB 插损和 -15.8dB 串扰强度的信道条件下,发射机最高能实现单通道 64Gb/s PAM-4 的传输速率,对应能量效率为 1.27pJ/bit。图片3a.jpg

图3.1.电容峰化串扰消除高速单端PAM-4发射机芯片图片3b.jpg

图3.2. (a) 芯片照片; (b)芯片功耗分布;(c) 发射机眼图;(d) 串扰抖动消除率测试结果

图3.2(a),(b)展示了提出的发射机的芯片面积及其功耗分布,图3.2(c)展示了芯片开启串扰消除功能前后的眼图测试结果。如图所示,在串扰消除功能关闭时,32Gb/s NRZ 的眼宽和眼高为0.32UI(100mV),64Gb/s PAM-4 眼图完全闭合;而串扰消除功能开启后之后,32Gb/s NRZ 和 64Gb/s PAM-4 眼图的眼宽和眼高分别达到了 0.6UI(180mV) 和 0.36UI(36mV)。如图3.2(d)所示,提出的串扰消除技术在 32Gb/s NRZ 和 64Gb/s PAM-4 模式下分别实现了87%和82%的串扰引入抖动消除率。

2023级博士研究生伍伟涛为论文的第一作者,潘权为论文的唯一通讯作者,南方科技大学为论文的第一单位。该论文得到了国家自然科学基金和国家重点研发计划经费的支持。

提出相关方案,解决数据速率需求问题

团队还为解决数据速率需求量问题提供几种方案,相关成果以“Design Techniques for Single-Ended Wireline Crosstalk Cancellation Receiver Up to 112 Gb/s”为题发表在《固态电路学会开放期刊》(IEEE Open Journal of the Solid-State Circuits Society,OJ-SSCS)上。

随着人工智能应用的发展,数据中心需要支持越来越高的数据速率来管理海量数据集。如图4.1所示,研究者们已提出了几种潜在解决方案,以实现每条通道高达224 Gb/s的数据速率。

主要方法之一是在先进技术中使用四电平脉冲幅度调制(PAM-4)收发器(TRX),可以实现目标224 Gb/s的数据速率。然而,由于带宽需求的增加和显著的均衡要求,该方案受到严重链路损耗和高功率消耗的挑战。另一种方法涉及使用更高级的脉冲幅度调制(PAM)方案,这可以减轻I/O带宽要求。通过将更多数据编码到每个符号中,这些方案理想情况下不需要更大的信道带宽。例如,如图4.1(b)所示,差分 PAM-8 方案需要大约0.67倍于差分 PAP-4 方案的带宽来实现等效的数据速率。然而,这一优势伴随着一个重要的信号噪声比(SNR)损失约为7.4 dB。此外,高阶 PAM 方案更容易受到抖动和反射等缺陷的影响。实现这种数据速率的另一个有前景的选择是单端 PAM-4 方案,该方案通过在一对差分信道上利用两个单端信号使数据吞吐量加倍。如图4.1(c)所示,对于等效数据速率,单端 PAM-4 方案的带宽需求放宽到差分 PAM-4 的0.5倍。然而,由于信号摆动减半,该方案会导致约6dB的信噪比损失,并面临串扰的重大挑战,特别是远端串扰(FEXT)。图片4a.jpg

图4.1.(a)差分PAM-4方案、(b)差分BAM-8方案和(c)单端PAM-4方法的比较

团队首先分析了单端方案,并将其与差分 PAM-4 和PAM-8 方案进行了比较。同时,回顾了基本的串扰消除技术。本文还介绍了几种技术,能使单端串扰消除接收机能使用 28nm CMOS 技术中的四电平脉冲幅度调制(PAM-4)实现每通道高达 56 Gb/s 和 112 Gb/s 的数据速率。这些 56 Gb/s 和 112 Gb/s 接收器分别实现了<10-10和<10-12的误码率,单端信道损耗分别为24和25 dB。

2020级博士研究生钟立平是论文的第一作者,潘权为论文的唯一通讯作者,南方科技大学为论文的唯一单位,该论文得到了国家自然科学基金和国家重点研发计划经费的支持。

 

论文链接:

论文一链接:https://ieeexplore.ieee.org/document/10777044

论文二链接:https://ieeexplore.ieee.org/document/10770123

论文三链接:https://ieeexplore.ieee.org/document/10781378

论文四链接:https://ieeexplore.ieee.org/document/10757331


供稿:深港微电子学院

通讯员:杜玉梅

编辑:曾昱雯


推荐阅读
查看更多 >>
FOLLOW US @SOCIAL MEDIA
关注社交媒体上的我们
  • 国家安全部官方微信

  • 南方科技大学微信

  • 南方科技大学视频号

  • 南方科技大学抖音号

  • 南方科技大学快手号

  • 南方科技大学头条号

  • 南方科技大学南方+