TechBeat 2021: 一个通用零和博弈的求解框架
近年来,求解复杂双人零和博弈在强化学习的技术加持下取得了一系列的重要突破,在游戏AI等实际应用中取得了超人的效果。本次分享将介绍一个通用零和博弈的求解框架以及近期的一些进展和思考。
分享内容大纲:
1、研究零和博弈的动机以问题表述
2、为什么自博弈并不时常有效
3、一个通用的求解框架
4、最新进展:策略空间上的行为多样性
5、最新进展:如何更好的剥削对手
6、一些系统层面的思考Talk
近年来,求解复杂双人零和博弈在强化学习的技术加持下取得了一系列的重要突破,在游戏AI等实际应用中取得了超人的效果。本次分享将介绍一个通用零和博弈的求解框架以及近期的一些进展和思考。
分享内容大纲:
1、研究零和博弈的动机以问题表述
2、为什么自博弈并不时常有效
3、一个通用的求解框架
4、最新进展:策略空间上的行为多样性
5、最新进展:如何更好的剥削对手
6、一些系统层面的思考Talk