ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ В ЭВОЛЮЦИОННЫХ ИГРАХ

Λεπτομέρειες βιβλιογραφικής εγγραφής
Τίτλος: ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ В ЭВОЛЮЦИОННЫХ ИГРАХ
Στοιχεία εκδότη: Институт проблем управления им. В. А. Трапезникова РАН, 2020.
Έτος έκδοσης: 2020
Θεματικοί όροι: обучение с подкреплением, дилемма заключенных, эволюционные игры, кооперирование, игры на графах
Περιγραφή: В докладе1 изучаются характеристики динамики системы, состоящей из N игроков, находящихся в узлах графа, результат взаимодействия между которыми в рамках одного периода описывается классической дилеммой заключенных. Поскольку рассматривается динамическая версия игры, агенты максимизируют не текущий однопериодный выигрыш, а суммарную приведенную ожидаемую полезность за весь период игры и, таким образом, действуют дальновидно. Изучается возможность использования алгоритмов обучения с подкреплением для реализации такой дальновидной стратегии игроков. Интерес представляет изучение свойств алгоритмов, позволяющих получить кооперирование двух агентов. Одним из таких свойств является необходимость разделения динамики на две стадии: обучение и непосредственно игра. Кроме того, изучается зависимость свойств динамики от степени дальновидности агентов.
Τύπος εγγράφου: Conference object
Γλώσσα: Russian
DOI: 10.25728/vspu.2019.2200
Αριθμός Καταχώρησης: edsair.doi...........f70bcb0f1b552297452f4b1f95d891e5
Βάση Δεδομένων: OpenAIRE