Academic Journal
Finite approximation of zero-sum games played in staircase-function continuous spaces
| Title: | Finite approximation of zero-sum games played in staircase-function continuous spaces |
|---|---|
| Source: | Наукові вісті КПІ; № 4 (2021); 19-38 KPI Science News; No. 4 (2021); 19-38 Научные вести КПИ; № 4 (2021); 19-38 |
| Publisher Information: | National Technical University of Ukraine "Igor Sikorsky Kyiv Polytechnic Institute", 2022. |
| Publication Year: | 2022 |
| Subject Terms: | стратегія у формі сходинкової функції, game theory, staircase-function strategy, matrix game, нерегулярна дискретизація, функціонал виграшів, теорія ігор, узгодженість наближеного розв'язку, irregular sampling, матрична гра, payoff functional, approximate solution consistency |
| Description: | Проблематика. Существует известный способ аппроксимации непрерывных игр с нулевой суммой, где приближённое решение считается приемлемым, если оно меняется минимально при минимальном изменении шага дискретизации. Однако этот метод нельзя прямо применить к игре с нулевой суммой, разыгрываемой со стратегиями в форме лестничных функций. Кроме того, следует принимать во внимание независимость выбора игроком шага дискретизации. Цель исследования. Цель состоит в том, чтобы разработать метод конечной аппроксимации игр с нулевой суммой, которые разыгрываются в непрерывных пространствах лестничных функций, принимая во внимание, что игроки, вероятно, дискретизируют множества своих чистых стратегий самостоятельно. Методика реализации. Для достижения указанной цели формализуется игра с нулевой суммой, в которой стратегии игроков является лестничными функциями времени. В такой игре множество чистых стратегий игрока является континуумом лестничных функций времени, и время считается дискретным. Условия дискретизации множества возможных значений чистой стратегии игрока излагаются так, что игра становится определённой на произведении конечных пространств лестничных функций. В общем, шаг дискретизации у каждого игрока разный, и распределение выборочных точек (значений функции-стратегии) неоднородно. Результаты исследования. Представлен метод конечной аппроксимации игр с нулевой суммой, разыгрываемых в непрерывных пространствах лестничных функций. Метод заключается в нерегулярной дискретизации множества значений чистой стратегии игрока, решении “меньших” матричных игр, каждая из которых определена на подинтервале, где значение чистой стратегии является постоянным, и укладке их решений, если они согласованы. Укладка решений “меньших” матричных игр является приближённым решением исходной лестничной игры. Исследуется (слабая) согласованность приближённого решения тем, насколько меняется выигрыш и оптимальная ситуация, когда плотность дискретизации минимально увеличивается тремя способами: только прирост у первого игрока, только прирост у второго игрока, прирост в обоих игроков. Согласованность разлагается на согласованность выигрышей, согласованность мощности спектра оптимальной стратегии, согласованность плотности дискретизации оптимальной стратегии и согласованность спектральных вероятностей. С практической точки зрения целесообразно рассматривать релаксированную согласованность выигрышей. Выводы. Предложенный метод конечной аппроксимации лестничных игр с нулевой суммой заключается в независимых дискретизациях, решении “меньших” матричных игр за приемлемый промежуток времени и укладке их решений, если они согласованы. Конечное приближение считается приемлемым, если по крайней мере соответствующий приближённое (уложенное) решение является согласованным по epsilon-выигрышам. Проблематика. Існує відомий спосіб апроксимації неперервних ігор з нульовою сумою, де наближений розв’язоквважається прийнятним, якщо він змінюється мінімально за мінімальної зміни кроку дискретизації. Однак цей метод не можнапрямо застосувати до гри з нульовою сумою, що розігрується зі стратегіями у формі сходинкових функцій. Крім того, слід братидо уваги незалежність вибору гравцем кроку дискретизації.Мета дослідження. Мета полягає у тому, щоб розробити метод скінченної апроксимації ігор з нульовою сумою, якірозігруються у неперервних просторах сходинкових функцій, беручи до уваги, що гравці, ймовірно, дискретизують множини своїхчистих стратегій самостійно.Методика реалізації. Для досягнення зазначеної мети формалізується гра з нульовою сумою, в якій стратегії гравцівє сходинковими функціями часу. У такій грі множина чистих стратегій гравця є континуумом сходинкових функцій часу, і часвважається дискретним. Умови дискретизації множини можливих значень чистої стратегії гравця викладаються так, що гра стаєвизначеною на добутку скінченних просторів сходинкових функцій. Загалом, крок дискретизації у кожного гравця різний, і розподілвибіркових точок (значень функції-стратегії) неоднорідний.Результати дослідження. Представлено метод скінченної апроксимації ігор з нульовою сумою, які розігруютьсяу неперервних просторах сходинкових функцій. Метод полягає у нерегулярній дискретизації множини значень чистої стратегіїгравця, розв’язуванні матричних ігор меншого розміру, кожна з яких визначена на підінтервалі, де значення чистої стратегії єпостійним, й укладанні їхніх розв’язків, якщо вони є узгодженими. Уклад розв’язків матричних ігор меншого розміру є наближенимрозв’язком вихідної сходинкової гри. Досліджується (слабка) узгодженість наближеного розв’язку тим, наскільки змінюєтьсявиграш та оптимальна ситуація, коли щільність дискретизації мінімально збільшується трьома способами: лише прирісту першого гравця, лише приріст у другого гравця, приріст в обох гравців. Узгодженість розкладається на узгодженість виграшів,узгодженість потужності спектру оптимальної стратегії, узгодженість щільності дискретизації оптимальної стратегії та узгодженістьспектральних імовірностей. З практичної точки зору доцільно розглядати релаксовану узгодженість виграшів.Висновки. Запропонований метод скінченної апроксимації сходинкових ігор з нульовою сумою полягає у незалежнихдискретизаціях, розв’язуванні матричних ігор меншого розміру за прийнятний проміжок часу та укладенні їхніх розв’язків, якщовони є узгодженими. Скінченне наближення вважається прийнятним, якщо принаймні відповідний наближений (укладений)розв’язок є узгодженим за e-виграшами Background. There is a known method of approximating continuous zero-sum games, wherein an approximate solutionis considered acceptable if it changes minimally by changing the sampling step minimally. However, the method cannotbe applied straightforwardly to a zero-sum game played with staircase-function strategies. Besides, the independence ofthe player’s sampling step selection should be taken into account.Objective. The objective is to develop a method of finite approximation of zero-sum games played in staircase-functioncontinuous spaces by taking into account that the players are likely to independently sample their pure strategy sets.Methods. To achieve the said objective, a zero-sum game, in which the players’ strategies are staircase functions of time,is formalized. In such a game, the set of the player’s pure strategies is a continuum of staircase functions of time, andthe time is thought of as it is discrete. The conditions of sampling the set of possible values of the player’s pure strategyare stated so that the game becomes defined on a product of staircase-function finite spaces. In general, the samplingstep is different at each player and the distribution of the sampled points (function-strategy values) is non-uniform.Results. A method of finite approximation of zero-sum games played in staircase-function continuous spaces is pre-sented. The method consists in irregularly sampling the player’s pure strategy value set, solving smaller-sized matrixgames, each defined on a subinterval where the pure strategy value is constant, and stacking their solutions if they areconsistent. The stack of the smaller-sized matrix game solutions is an approximate solution to the initial staircase game.The (weak) consistency of the approximate solution is studied by how much the payoff and optimal situation change asthe sampling density minimally increases by the three ways of the sampling increment: only the first player’s increment,only the second player’s increment, both the players’ increment. The consistency is decomposed into the payoff, opti-mal strategy support cardinality, optimal strategy sampling density, and support probability consistency. It is practicallyreasonable to consider a relaxed payoff consistency.Conclusions. The suggested method of finite approximation of staircase zero-sum games consists in the independentsamplings, solving smaller-sized matrix games in a reasonable time span, and stacking their solutions if they are con-sistent. The finite approximation is regarded appropriate if at least the respective approximate (stacked) solution ise-payoff consistent. |
| Document Type: | Article |
| File Description: | application/pdf |
| Language: | English |
| ISSN: | 2617-5509 2663-7472 |
| Access URL: | http://scinews.kpi.ua/article/view/242769 |
| Rights: | CC BY |
| Accession Number: | edsair.scientific.p..0f187542b087d27f4f9fcfe16e14382c |
| Database: | OpenAIRE |
| ISSN: | 26175509 26637472 |
|---|