当前位置: X-MOL 学术arXiv.cs.NI › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
T-RACKs: A Faster Recovery Mechanism for TCP in Data Center Networks
arXiv - CS - Networking and Internet Architecture Pub Date : 2021-02-15 , DOI: arxiv-2102.07477
Ahmed M. Abdelmoniem, Brahim Bensaou

Cloud interactive data-driven applications generate swarms of small TCP flows that compete for the small buffer space in data-center switches. Such applications require a short flow completion time (FCT) to perform their jobs effectively. However, TCP is oblivious to the composite nature of application data and artificially inflates the FCT of such flows by several orders of magnitude. This is due to TCP's Internet-centric design that fixes the retransmission timeout (RTO) to be at least hundreds of milliseconds. To better understand this problem, in this paper, we use empirical measurements in a small testbed to study, at a microscopic level, the effects of various types of packet losses on TCP's performance. In particular, we single out packet losses that impact the tail end of small flows, as well as bursty losses, that span a significant fraction of the small congestion window of TCP flows in data-centers, to show a non-negligible effect on the FCT. Based on this, we propose the so-called, timely-retransmitted ACKs (or T-RACKs), a simple loss recovery mechanism to conceal the drawbacks of the long RTO even in the presence of heavy packet losses. Interestingly enough, T-RACKS achieves this transparently to TCP itself as it does not require any change to TCP in the tenant's virtual machine (VM). T-RACKs can be implemented as a software shim layer in the hypervisor between the VMs and server's NIC or in hardware as a networking function in a SmartNIC. Simulation and real testbed results show that T-RACKs achieves remarkable performance improvements.

中文翻译:

T-RACK:数据中心网络中TCP的更快恢复机制

云交互式数据驱动的应用程序生成大量的TCP小流,这些TCP流争夺数据中心交换机中的小缓冲区空间。这样的应用程序需要很短的流程完成时间(FCT)才能有效地执行其工作。但是,TCP忽略了应用程序数据的复合性质,并人为地夸大了此类流的FCT几个数量级。这是由于TCP的以Internet为中心的设计将重传超时(RTO)固定为至少数百毫秒。为了更好地理解此问题,在本文中,我们在小型测试平台上使用经验测量,以微观角度研究各种类型的数据包丢失对TCP性能的影响。特别是,我们会选择会影响小流量尾端的数据包丢失以及突发丢失,在数据中心中,TCP流量占TCP流量小拥塞窗口的很大一部分,对FCT的影响不可忽略。基于此,我们提出了所谓的及时重发ACK(或T-RACK),一种简单的丢失恢复机制,即使存在严重的数据包丢失,也能掩盖RTO较长的缺点。有趣的是,由于T-RACKS不需要在租户的虚拟机(VM)中对TCP进行任何更改,因此它对TCP本身是透明的。T-RACK可以作为VM和服务器NIC之间的管理程序中的软件中介层实现,也可以作为SmartNIC中的网络功能在硬件中实现。仿真和实际测试结果表明,T-RACK的性能得到了显着改善。对FCT的影响不可忽略。基于此,我们提出了所谓的及时重发ACK(或T-RACK),一种简单的丢失恢复机制,即使存在严重的数据包丢失,也能掩盖RTO较长的缺点。有趣的是,由于T-RACKS不需要在租户的虚拟机(VM)中对TCP进行任何更改,因此它对TCP本身是透明的。T-RACK可以作为VM和服务器NIC之间的管理程序中的软件中介层实现,也可以作为SmartNIC中的网络功能在硬件中实现。仿真和实际测试结果表明,T-RACK的性能得到了显着改善。对FCT的影响不可忽略。基于此,我们提出了所谓的及时重发ACK(或T-RACK),一种简单的丢失恢复机制,即使存在严重的数据包丢失,也能掩盖RTO较长的缺点。有趣的是,由于T-RACKS不需要在租户的虚拟机(VM)中对TCP进行任何更改,因此它对TCP本身是透明的。T-RACK可以作为VM和服务器NIC之间的管理程序中的软件中介层实现,也可以作为SmartNIC中的网络功能在硬件中实现。仿真和实际测试结果表明,T-RACK的性能得到了显着改善。一种简单的丢失恢复机制,即使存在严重的数据包丢失,也可以掩盖RTO较长的缺点。有趣的是,由于T-RACKS不需要在租户的虚拟机(VM)中对TCP进行任何更改,因此它对TCP本身是透明的。T-RACK可以作为VM和服务器NIC之间的管理程序中的软件中介层实现,也可以作为SmartNIC中的网络功能在硬件中实现。仿真和实际测试结果表明,T-RACK的性能得到了显着改善。一种简单的丢失恢复机制,即使存在严重的数据包丢失,也可以掩盖RTO较长的缺点。有趣的是,由于T-RACKS不需要在租户的虚拟机(VM)中对TCP进行任何更改,因此它对TCP本身是透明的。T-RACK可以作为VM和服务器NIC之间的管理程序中的软件中介层实现,也可以作为SmartNIC中的网络功能在硬件中实现。仿真和实际测试结果表明,T-RACK的性能得到了显着改善。NIC或硬件,作为SmartNIC中的网络功能。仿真和实际测试结果表明,T-RACK的性能得到了显着改善。NIC或硬件,作为SmartNIC中的网络功能。仿真和实际测试结果表明,T-RACK的性能得到了显着改善。
更新日期:2021-02-16
down
wechat
bug