当前位置: X-MOL 学术arXiv.cs.GT › 论文详情
Arena-Independent Finite-Memory Determinacy in Stochastic Games
arXiv - CS - Computer Science and Game Theory Pub Date : 2021-02-19 , DOI: arxiv-2102.10104
Patricia Bouyer; Youssouf Oualhadj; Mickael Randour; Pierre Vandenhove

We study stochastic zero-sum games on graphs, which are prevalent tools to model decision-making in presence of an antagonistic opponent in a random environment. In this setting, an important question is the one of strategy complexity: what kinds of strategies are sufficient or required to play optimally (e.g., randomization or memory requirements)? Our contributions further the understanding of arena-independent finite-memory (AIFM) determinacy, i.e., the study of objectives for which memory is needed, but in a way that only depends on limited parameters of the game graphs. First, we show that objectives for which pure AIFM strategies suffice to play optimally also admit pure AIFM subgame perfect strategies. Second, we show that we can reduce the study of objectives for which pure AIFM strategies suffice in two-player stochastic games to the easier study of one-player stochastic games (i.e., Markov decision processes). Third, we characterize the sufficiency of AIFM strategies through two intuitive properties of objectives. This work extends a line of research started on deterministic games in [BLO+20] to stochastic ones. [BLO+20] Patricia Bouyer, St\'ephane Le Roux, Youssouf Oualhadj, Mickael Randour, and Pierre Vandenhove. Games Where You Can Play Optimally with Arena-Independent Finite Memory. CONCUR 2020.

中文翻译:

随机游戏中与竞技场无关的有限记忆确定性

我们研究图表上的随机零和博弈,这是在随机环境中存在敌对对手的情况下进行决策建模的流行工具。在这种情况下,一个重要的问题是策略复杂性之一:哪种策略足以发挥作用或需要发挥最佳作用(例如,随机化或内存需求)?我们的贡献进一步了解了与舞台无关的有限内存(AIFM)的确定性,即需要记忆的目标的研究,但其方式仅取决于游戏图的有限参数。首先,我们证明了纯AIFM策略足以发挥其最佳性能的目标也承认了纯AIFM子游戏的完美策略。第二,我们表明,我们可以将对纯粹AIFM策略在两人随机游戏中就可以满足的目标的研究减少到对一人随机游戏(即,马尔可夫决策过程)的轻松研究中。第三,我们通过目标的两个直观属性来描述AIFM策略的充分性。这项工作将对[BLO + 20]中确定性游戏的研究范围扩展到了随机性游戏。[BLO + 20]帕特里夏·鲍耶(Patricia Bouyer),圣埃法内·勒·鲁(St \'ephane Le Roux),优素福·瓦尔哈德(Youssouf Oualhadj),米凯尔·兰杜(Mickael Randour)和皮埃尔·范登霍夫(Pierre Vandenhove)。借助独立于竞技场的有限记忆,可以最佳玩游戏的游戏。2020年大会。这项工作将对[BLO + 20]中确定性游戏的研究范围扩展到了随机性游戏。[BLO + 20]帕特里夏·鲍耶(Patricia Bouyer),圣埃法内·勒·鲁(St \'ephane Le Roux),优素福·瓦尔哈德(Youssouf Oualhadj),米凯尔·兰杜(Mickael Randour)和皮埃尔·范登霍夫(Pierre Vandenhove)。借助独立于竞技场的有限记忆,可以最佳玩游戏的游戏。2020年大会。这项工作将对[BLO + 20]中确定性游戏的研究范围扩展到了随机性游戏。[BLO + 20]帕特里夏·鲍耶(Patricia Bouyer),圣埃法内·勒·鲁(St \'ephane Le Roux),优素福·瓦尔哈德(Youssouf Oualhadj),米凯尔·兰杜(Mickael Randour)和皮埃尔·范登霍夫(Pierre Vandenhove)。借助独立于竞技场的有限记忆,可以最佳玩游戏的游戏。2020年大会。
更新日期:2021-02-22
全部期刊列表>>
2021新春特辑
SN Applied Sciences期刊征稿中
虚拟特刊
亚洲大洋洲地球科学
NPJ欢迎投稿
自然科研论文编辑
ERIS期刊投稿
欢迎阅读创刊号
自然职场,为您触达千万科研人才
spring&清华大学出版社
城市可持续发展前沿研究专辑
Springer 纳米技术权威期刊征稿
全球视野覆盖
施普林格·自然新
chemistry
物理学研究前沿热点精选期刊推荐
自然职位线上招聘会
欢迎报名注册2020量子在线大会
化学领域亟待解决的问题
材料学研究精选新
GIANT
ACS ES&T Engineering
ACS ES&T Water
屿渡论文,编辑服务
阿拉丁试剂right
上海中医药大学
哈工大
西湖大学
化学所
北京大学
山东大学
隐藏1h前已浏览文章
课题组网站
新版X-MOL期刊搜索和高级搜索功能介绍
ACS材料视界
南方科技大学
张凤娇
中国石油大学
天合科研
x-mol收录
试剂库存
down
wechat
bug