当前位置: X-MOL 学术IEEE Trans. Parallel Distrib. Syst. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Random Priority-Based Thrashing Control for Distributed Shared Memory
IEEE Transactions on Parallel and Distributed Systems ( IF 5.3 ) Pub Date : 2020-03-01 , DOI: 10.1109/tpds.2019.2942302
Yi-Wei Ci , Michael R. Lyu , Zhan Zhang , De-Cheng Zuo , Xiao-Zong Yang

Shared memory is widely used for inter-process communication. The shared memory abstraction allows computation to be decoupled from communication, which offers benefits, including portability and ease of programming. To enable shared memory access by processes that are on different machines, distributed shared memory (DSM) can be employed. However, DSM systems can suffer from thrashing: while different processes update certain hot data items, the largest amount of effort is spent on data synchronization, and little progress is made by each process. To avoid interference between processes during data updating while providing shared memory at page granularity, more time is reserved for a writer to hold a page in a traditional manner. In this paper, we report on complex thrashing, which can explain why extending the time of holding a page might not be sufficient to control thrashing. To increase the throughput, we propose a thrashing control mechanism that allows each process to update a set of pages during a period of time, where the pages compose a logical area. Because of the isolation of areas, updates on different areas can be performed concurrently. To allow the areas to be fairly well used, each process is assigned with a random priority for thrashing control. The thrashing control mechanism is implemented on a Linux-based DSM system. Performance results show that the execution time of the applications that are apt to cause system thrashing can be significantly reduced by our approach.

中文翻译:

基于随机优先级的分布式共享内存抖动控制

共享内存广泛用于进程间通信。共享内存抽象允许计算与通信分离,这提供了包括可移植性和易于编程在内的好处。为了让不同机器上的进程能够访问共享内存,可以使用分布式共享内存 (DSM)。然而,DSM 系统可能会受到颠簸:当不同的进程更新某些热点数据项时,最大的努力是花在数据同步上,每个进程几乎没有取得任何进展。为了避免数据更新期间进程之间的干扰,同时以页面粒度提供共享内存,为写入器保留了更多时间以传统方式保存页面。在本文中,我们报告了复杂的抖动,这可以解释为什么延长保持页面的时间可能不足以控制抖动。为了提高吞吐量,我们提出了一种抖动控制机制,允许每个进程在一段时间内更新一组页面,其中页面组成一个逻辑区域。由于区域的隔离,不同区域的更新可以同时进行。为了让这些区域得到很好的利用,每个进程都被分配了一个随机的优先级来进行抖动控制。抖动控制机制是在基于 Linux 的 DSM 系统上实现的。性能结果表明,我们的方法可以显着减少容易导致系统抖动的应用程序的执行时间。我们提出了一种抖动控制机制,允许每个进程在一段时间内更新一组页面,这些页面组成一个逻辑区域。由于区域的隔离,不同区域的更新可以同时进行。为了让这些区域得到很好的利用,每个进程都被分配了一个随机的优先级来进行抖动控制。抖动控制机制是在基于 Linux 的 DSM 系统上实现的。性能结果表明,我们的方法可以显着减少容易导致系统抖动的应用程序的执行时间。我们提出了一种抖动控制机制,允许每个进程在一段时间内更新一组页面,这些页面组成一个逻辑区域。由于区域的隔离,不同区域的更新可以同时进行。为了让这些区域得到很好的利用,每个进程都被分配了一个随机的优先级来进行抖动控制。抖动控制机制是在基于 Linux 的 DSM 系统上实现的。性能结果表明,我们的方法可以显着减少容易导致系统抖动的应用程序的执行时间。每个进程都分配有随机优先级以进行抖动控制。抖动控制机制是在基于 Linux 的 DSM 系统上实现的。性能结果表明,我们的方法可以显着减少容易导致系统抖动的应用程序的执行时间。每个进程都分配有随机优先级以进行抖动控制。抖动控制机制是在基于 Linux 的 DSM 系统上实现的。性能结果表明,我们的方法可以显着减少容易导致系统抖动的应用程序的执行时间。
更新日期:2020-03-01
down
wechat
bug