当前位置: X-MOL 学术arXiv.cs.AI › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
遗忘的广义线性强盗的自洽分析
arXiv - CS - Artificial Intelligence Pub Date : 2020-11-02 , DOI: arxiv-2011.00819
Yoan RussacDI-ENS, CNRS, PSL, VALDA, Louis FauryDI-ENS, VALDA, Olivier CappéDI-ENS, VALDA, Aurélien GarivierUMPA-ENSL

具有分类或数值观测的上下文顺序决策问题无处不在,而广义线性强盗(GLB)提供了解决这些问题的坚实理论框架。与线性强盗的情况相反,现有的GLB算法有两个缺点,削弱了它们的适用性。首先,由于模型的非线性性质,他们依赖过度悲观的集中范围。其次,它们需要非凸投影步骤或预热阶段以强制估计量的有界性。当考虑非平稳模型时,这两个问题都会恶化,在该模型中,GLB参数可能会随时间变化。在这项工作中,我们专注于自洽GLB(包括logistic和Poisson回归),而忘记是通过使用滑动窗口或指数权重实现的。我们为最大似然估计器提出了一种基于置信度的新颖算法,该算法具有遗忘功能,并分析了其在突然变化的环境中的性能。这些结果以及随附的数值模拟凸显了所提出的方法在解决GLB中的非平稳性方面的潜力。



"点击查看英文标题和摘要"

更新日期:2020-11-02
down
wechat
bug