当前位置: X-MOL 学术SIAM J. Optim. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
An Inverse-Adjusted Best Response Algorithm for Nash Equilibria
SIAM Journal on Optimization ( IF 3.1 ) Pub Date : 2020-06-18 , DOI: 10.1137/18m1213701
Francesco Caruso , Maria Carmela Ceparano , Jacqueline Morgan

SIAM Journal on Optimization, Volume 30, Issue 2, Page 1638-1663, January 2020.
Regarding the approximation of Nash equilibria in games where the players have a continuum of strategies, there exist various algorithms based on best response dynamics and on its relaxed variants: from one step to the next, a player's strategy is updated by using explicitly a best response to the strategies of the other players that come from the previous steps. These iterative schemes generate sequences of strategy profiles which are constructed by using continuous optimization techniques and they have been shown to converge in the following situations: in zero-sum games or, in non-zero-sum ones, under contraction assumptions or under linearity of best response functions. In this paper, we propose an algorithm which guarantees the convergence to a Nash equilibrium in two-player non-zero-sum games when the best response functions, called $r_1$ and $r_2$, are not necessarily linear, neither the composition $r_1\circ r_2$ nor $r_2\circ r_1$ is a contraction, and the strategy sets are Hilbert spaces. First, we address the issue of uniqueness of the Nash equilibrium extending to a more general class the result obtained by Caruso, Ceparano, and Morgan [J. Math. Anal. Appl., 459 (2018), pp. 1208--1221] for weighted potential games. Then, we describe a theoretical approximation scheme based on a nonstandard (nonconvex) relaxation of best response iterations which converges to the unique Nash equilibrium of the game. Finally, we define a numerical approximation scheme relying on a derivative-free continuous optimization technique applied in a finite dimensional setting and we provide convergence results and error bounds.


中文翻译:

纳什均衡的逆调整最佳响应算法

SIAM优化杂志,第30卷,第2期,第1638-1663页,2020年1月。
关于玩家具有连续策略的游戏中的纳什均衡近似,存在各种基于最佳响应动力学及其宽松变体的算法:从一个步骤到下一步骤,通过明确使用最佳响应来更新玩家的策略。前面步骤中其他参与者的策略。这些迭代方案生成策略配置文件序列,这些策略配置文件是使用连续优化技术构建的,并且已证明它们在以下情况下收敛:在零和游戏或非零和游戏中,在收缩假设下或在线性下最佳响应功能。在本文中,我们提出了一种算法,该算法可确保当最佳响应函数起作用时,两人非零和博弈中的纳什均衡收敛。$ r_1 $和$ r_2 $不一定是线性的,组成$ r_1 \ circ r_2 $或$ r_2 \ circ r_1 $都不是收缩,策略集也不是Hilbert空间。首先,我们解决了纳什均衡的唯一性问题,将卡鲁索,切帕拉诺和摩根[J. 数学。肛门 Appl。,459(2018),pp。1208--1221]。然后,我们描述了一种基于最佳响应迭代的非标准(非凸)松弛的理论逼近方案,该收敛收敛到游戏的唯一Nash平衡。最后,我们基于有限维设置中应用的无导数连续优化技术定义了一种数值近似方案,并提供了收敛结果和误差范围。组合$ r_1 \ circ r_2 $或$ r_2 \ circ r_1 $都不是收缩,策略集也不是希尔伯特空间。首先,我们解决了纳什均衡的唯一性问题,将卡鲁索,切帕拉诺和摩根[J. 数学。肛门 Appl。,459(2018),pp。1208--1221]。然后,我们描述了一种基于最佳响应迭代的非标准(非凸)松弛的理论逼近方案,该收敛收敛到游戏的唯一Nash平衡。最后,我们基于有限维设置中所应用的无导数连续优化技术定义了一种数值近似方案,并提供了收敛结果和误差范围。组合$ r_1 \ circ r_2 $或$ r_2 \ circ r_1 $都不是收缩,策略集也不是希尔伯特空间。首先,我们解决了纳什均衡的唯一性问题,将卡鲁索,切帕拉诺和摩根[J. 数学。肛门 Appl。,459(2018),pp。1208--1221]。然后,我们描述了一种基于最佳响应迭代的非标准(非凸)松弛的理论逼近方案,该收敛收敛到游戏的唯一Nash平衡。最后,我们基于有限维设置中应用的无导数连续优化技术定义了一种数值近似方案,并提供了收敛结果和误差范围。我们解决了纳什均衡的唯一性问题,将Caruso,Ceparano和Morgan所获得的结果扩展到了更一般的类别[J. 数学。肛门 Appl。,459(2018),pp。1208--1221]。然后,我们描述了一种基于最佳响应迭代的非标准(非凸)松弛的理论逼近方案,该收敛收敛到游戏的唯一Nash平衡。最后,我们基于有限维设置中应用的无导数连续优化技术定义了一种数值近似方案,并提供了收敛结果和误差范围。我们解决了纳什均衡的唯一性问题,将卡鲁索,切帕拉诺和摩根所获得的结果扩展到一个更一般的类[J. 数学。肛门 Appl。,459(2018),pp。1208--1221]。然后,我们描述了一种基于最佳响应迭代的非标准(非凸)松弛的理论逼近方案,该收敛收敛到游戏的唯一Nash平衡。最后,我们基于有限维设置中应用的无导数连续优化技术定义了一种数值近似方案,并提供了收敛结果和误差范围。我们根据最佳响应迭代的非标准(非凸)松弛描述了一种理论逼近方案,该收敛趋于博弈的唯一纳什均衡。最后,我们基于有限维设置中应用的无导数连续优化技术定义了一种数值近似方案,并提供了收敛结果和误差范围。我们根据最佳响应迭代的非标准(非凸)松弛描述了一种理论逼近方案,该收敛趋于博弈的唯一纳什均衡。最后,我们基于有限维设置中应用的无导数连续优化技术定义了一种数值近似方案,并提供了收敛结果和误差范围。
更新日期:2020-07-23
down
wechat
bug