ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ В ЭВОЛЮЦИОННЫХ ИГРАХ

Bibliographic Details
Title:	ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ В ЭВОЛЮЦИОННЫХ ИГРАХ
Publisher Information:	Институт проблем управления им. В. А. Трапезникова РАН, 2020.
Publication Year:	2020
Subject Terms:	обучение с подкреплением, дилемма заключенных, эволюционные игры, кооперирование, игры на графах
Description:	В докладе1 изучаются характеристики динамики системы, состоящей из N игроков, находящихся в узлах графа, результат взаимодействия между которыми в рамках одного периода описывается классической дилеммой заключенных. Поскольку рассматривается динамическая версия игры, агенты максимизируют не текущий однопериодный выигрыш, а суммарную приведенную ожидаемую полезность за весь период игры и, таким образом, действуют дальновидно. Изучается возможность использования алгоритмов обучения с подкреплением для реализации такой дальновидной стратегии игроков. Интерес представляет изучение свойств алгоритмов, позволяющих получить кооперирование двух агентов. Одним из таких свойств является необходимость разделения динамики на две стадии: обучение и непосредственно игра. Кроме того, изучается зависимость свойств динамики от степени дальновидности агентов.
Document Type:	Conference object
Language:	Russian
DOI:	10.25728/vspu.2019.2200
Accession Number:	edsair.doi...........f70bcb0f1b552297452f4b1f95d891e5
Database:	OpenAIRE

Description
DOI:	10.25728/vspu.2019.2200