当前位置: X-MOL 学术arXiv.cs.CR › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Efficient MDP Analysis for Selfish-Mining in Blockchains
arXiv - CS - Cryptography and Security Pub Date : 2020-07-10 , DOI: arxiv-2007.05614
Roi Bar-Zur, Ittay Eyal and Aviv Tamar

A proof of work (PoW) blockchain protocol distributes rewards to its participants, called miners, according to their share of the total computational power. Sufficiently large miners can perform selfish mining - deviate from the protocol to gain more than their fair share. Such systems are thus secure if all miners are smaller than a threshold size so their best response is following the protocol. To find the threshold, one has to identify the optimal strategy for miners of different sizes, i.e., solve a Markov Decision Process (MDP). However, because of the PoW difficulty adjustment mechanism, the miners' utility is a non-linear ratio function. We therefore call this an Average Reward Ratio (ARR) MDP. Sapirshtein et al.\ were the first to solve ARR MDPs by solving a series of standard MDPs that converge to the ARR MDP solution. In this work, we present a novel technique for solving an ARR MDP by solving a single standard MDP. The crux of our approach is to augment the MDP such that it terminates randomly, within an expected number of rounds. We call this Probabilistic Termination Optimization (PTO), and the technique applies to any MDP whose utility is a ratio function. We bound the approximation error of PTO - it is inversely proportional to the expected number of rounds before termination, a parameter that we control. Empirically, PTO's complexity is an order of magnitude lower than the state of the art. PTO can be easily applied to different blockchains. We use it to tighten the bound on the threshold for selfish mining in Ethereum.

中文翻译:

区块链中自私挖矿的高效 MDP 分析

工作量证明 (PoW) 区块链协议根据参与者在总计算能力中的份额向其参与者(称为矿工)分配奖励。足够大的矿工可以进行自私的挖掘 - 偏离协议以获得超过其公平份额的收益。因此,如果所有矿工都小于阈值大小,则此类系统是安全的,因此他们的最佳响应是遵循协议。为了找到阈值,必须为不同规模的矿工确定最佳策略,即解决马尔可夫决策过程(MDP)。然而,由于 PoW 难度调整机制,矿工的效用是一个非线性的比率函数。因此,我们将其称为平均奖励比率 (ARR) MDP。Sapirshtein 等人是第一个通过求解收敛到 ARR MDP 解决方案的一系列标准 MDP 来解决 ARR MDP 的人。在这项工作中,我们提出了一种通过解决单个标准 MDP 来解决 ARR MDP 的新技术。我们方法的关键是增加 MDP,使其在预期的轮数内随机终止。我们称之为概率终止优化 (PTO),该技术适用于任何效用为比率函数的 MDP。我们限制了 PTO 的近似误差——它与终止前的预期轮数成反比,这是我们控制的一个参数。根据经验,PTO 的复杂性比现有技术低一个数量级。PTO 可以轻松应用于不同的区块链。我们用它来收紧以太坊自私挖矿的门槛。我们方法的关键是增加 MDP,使其在预期的轮数内随机终止。我们称之为概率终止优化 (PTO),该技术适用于任何效用为比率函数的 MDP。我们限制了 PTO 的近似误差——它与终止前的预期轮数成反比,这是我们控制的一个参数。根据经验,PTO 的复杂性比现有技术低一个数量级。PTO 可以轻松应用于不同的区块链。我们用它来收紧以太坊自私挖矿的门槛。我们方法的关键是增加 MDP,使其在预期的轮数内随机终止。我们称之为概率终止优化 (PTO),该技术适用于任何效用为比率函数的 MDP。我们限制了 PTO 的近似误差——它与终止前的预期轮数成反比,这是我们控制的一个参数。根据经验,PTO 的复杂性比现有技术低一个数量级。PTO 可以轻松应用于不同的区块链。我们用它来收紧以太坊自私挖矿的门槛。我们限制了 PTO 的近似误差——它与终止前的预期轮数成反比,这是我们控制的一个参数。根据经验,PTO 的复杂性比现有技术低一个数量级。PTO 可以轻松应用于不同的区块链。我们用它来收紧以太坊自私挖矿的门槛。我们限制了 PTO 的近似误差——它与终止前的预期轮数成反比,这是我们控制的一个参数。根据经验,PTO 的复杂性比现有技术低一个数量级。PTO 可以轻松应用于不同的区块链。我们用它来收紧以太坊自私挖矿的门槛。
更新日期:2020-09-16
down
wechat
bug