通过强化学习方法求解多智能体博弈合作问题具有众多的现实应用,例如灵巧双手操纵、无人机群编队等。在本次分享中,杨耀东老师将会介绍一个通用的基于多智能体强化学习技术的合作博弈求解框架:多智能体镜像学习 (Heterogeneous Multi-Agent Mirror Learning)。
近年来,求解复杂双人零和博弈在强化学习的技术加持下取得了一系列的重要突破,在游戏AI等实际应用中取得了超人的效果。本次分享将介绍一个通用零和博弈的求解框架以及近期的一些进展和思考。