ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ В ЭВОЛЮЦИОННЫХ ИГРАХ

Λεπτομέρειες βιβλιογραφικής εγγραφής
Τίτλος:	ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ В ЭВОЛЮЦИОННЫХ ИГРАХ
Στοιχεία εκδότη:	Институт проблем управления им. В. А. Трапезникова РАН, 2020.
Έτος έκδοσης:	2020
Θεματικοί όροι:	обучение с подкреплением, дилемма заключенных, эволюционные игры, кооперирование, игры на графах
Περιγραφή:	В докладе1 изучаются характеристики динамики системы, состоящей из N игроков, находящихся в узлах графа, результат взаимодействия между которыми в рамках одного периода описывается классической дилеммой заключенных. Поскольку рассматривается динамическая версия игры, агенты максимизируют не текущий однопериодный выигрыш, а суммарную приведенную ожидаемую полезность за весь период игры и, таким образом, действуют дальновидно. Изучается возможность использования алгоритмов обучения с подкреплением для реализации такой дальновидной стратегии игроков. Интерес представляет изучение свойств алгоритмов, позволяющих получить кооперирование двух агентов. Одним из таких свойств является необходимость разделения динамики на две стадии: обучение и непосредственно игра. Кроме того, изучается зависимость свойств динамики от степени дальновидности агентов.
Τύπος εγγράφου:	Conference object
Γλώσσα:	Russian
DOI:	10.25728/vspu.2019.2200
Αριθμός Καταχώρησης:	edsair.doi...........f70bcb0f1b552297452f4b1f95d891e5
Βάση Δεδομένων:	OpenAIRE

Περιγραφή
DOI:	10.25728/vspu.2019.2200