Проблема оптимальности. Принципы и критерии нахождения оптимального поведения игроков для разных типов игр

В данной статье описана проблема оптимальности в теории игр и представлены подходы к нахождению оптимального решения. 

В последние несколько десятилетий наблюдается стремительное повышение интереса к теории игр и значительное возрастание ее роли. Чаще всего методы теории игр находят применение в экономике, чуть реже в других общественных науках социологии, политологии, психологии, этике, юриспруденции и других. Начиная с 1970-х годов её взяли на вооружение биологи для исследования поведения животных и теории эволюции. Очень важное значение она имеет для искусственного интеллекта и кибернетики, особенно с проявлением интереса к интеллектуальным агентам.

Среди многочисленных определений того, что такое теория игр и каковы ее задачи, можно выделить следующие.

Теория игр это теория рационального поведения людей с несовпадающими интересами [1]. 

Теория игр наука о стратегическом мышлении [2].

Теория игр это теория математических моделей принятия оптимальных решений в условиях конфликтов [3].

По сути, теория игр это изложенное математическим языком описание механизмов принятия решений мыслящего индивида (игрока), оказавшегося в смоделированной ситуации (игре). Игра и игроки представлены совокупностью формул, параметров и показателей, а принятие любого решения сводится к комбинаторному уравнению (или системе уравнений).

Первоначально теория игр показывалась как обобщение теории оптимизации на случай двух и более участников экономического процесса. Дж. фон Нейман является создателем не только теории игр, но и соавтором симплекс-метода одного из основных алгоритмов решения оптимизационных задач, который также используется при решении матричных игр наиболее простого класса теоретико-игровых моделей. Но задачи, решаемые теорией игр, существенно отличаются от классических оптимизационных задач. Основное отличие от традиционной теории оптимизации заключается в том, что в теории игр учитываются взаимодействие сторон и возможность конфликта между ними.

В задачах векторной оптимизации задается целевая функция и соответствующие ограничения. Здесь предполагается, что искомые переменные полностью контролируются лицом принимающим решение (ЛПР). В данном случае в силу гипотезы рационального поведения ЛПР ведет себя таким образом, чтобы выбором действия максимизировать значение своей целевой функции. Дж. фон Нейман и О. Моргенштерн называют такую экономическую ситуацию «экономикой Робинзона Крузо» один изолированный индивид реализует свои цели в предположении, что у него есть ряд параметров и ему нужно скомбинировать их таким образом, чтобы получить желаемый результат [4].

 

Результат каждого участника процесса зависит не только от его собственного решения, но и от решения другого игрока. Если один из игроков не способен реализовывать свои цели (т.е. контролировать «свой» параметр) или определился с выбором значения этого параметра, то он превращается из игрока в обстоятельство, и задача игровой оптимизации редуцируется к случаю векторной оптимизации. Теоретическая возможность применять игровые модели имеется для любой ситуации с несколькими участниками, но фактическая возможность такого применения зависит не только от адекватности модели реальной ситуации и возможности аналитического или численного решения, но и от понимания того, что следует считать наилучшим решением, т.е. от формулировки принципа оптимальности. Общего положения нахождения наилучшего решения нет, и причиной этому служит не столько недостаток логико-математического аппарата теории игр, сколько большой выбор и сложность текущих процессов, а также наличие в них нескольких игроков, имеющих свои критерии оптимальности.

При нахождении решения игровой оптимизации участники могут следовать разнообразным принципам, например, прибыльностью, справедливостью или стабильностью (устойчивостью). В реальных ситуациях достаточно часто эти критерии оказываются несовместимыми и могут противоречить друг другу. Критерий оптимальности также зависит от отношения к риску. Например, одна компания может стремиться к максимизации выигрыша любым путем, в то время как другая компания стремится к недопущению банкротства. Из-за большого количества классов игр в настоящее время не выработан единый принцип оптимальности, который точно находит решение любой игры. Практически это означает, что единого для всех игр критерия оптимальности не установлено. Поэтому прежде чем говорить, например, об оптимальном (наивыгоднейшем) поведении игрока, необходимо установить, в каком смысле эта оптимальность (выгодность) понимается.

Все применяемые в теории игр принципы оптимальности и подходы к поиску оптимальных решений при всем их внешнем разнообразии отражают прямо или косвенно идею устойчивости ситуаций или множеств ситуаций, составляющих решения. В бескоалиционных играх основным принципом оптимальности считается принцип равновесия. Понятие равновесия характеризует ситуацию в игре, которая удовлетворяет (по крайней мере, теоретически) всех игроков. Ситуации равновесия обладают тем свойством, что любой игрок, который отклонится от этой ситуации (при условии, что остальные игроки не изменят своих стратегий), не увеличит этим свой платеж.

Однако равновесные ситуации могут быть разными в играх разных видов и, в свою очередь, определяются различными критериями.

Использование доминирующих стратегий обеспечивает рациональное и очень простое решение игры, поскольку, если имеются доминируемые стратегии, то рациональный игрок не будет их использовать, так как они заведомо не выгодны для него по сравнению с доминирующими, как бы ни поступали другие игроки. Такой подход называется принципом исключения доминируемых стратегий. Если у игрока есть стратегия, доминирующая все остальные его стратегии, ему не нужно строить никаких догадок и знать о платежах остальных игроков. Если хотя бы у одного из игроков имеется такая стратегия, его поведение можно считать известным, что позволяет исключить его из числа игроков и тем самым упростить игру. В этом случае говорят, что игра имеет решение в доминирующих (доминатных) стратегиях или, что в игре существует равновесие в доминирующих (доминатных) стратегиях. Если в результате последовательного исключения доминируемых стратегий можно получить решение игры, такая игра называется разрешимой по доминированию [6].

Из принципа исключения доминируемых стратегий следует, что ни одна сильно доминируемая чистая стратегия игрока не содержится в его смешанной стратегии, т.е. вероятность ее применения нулевая. Следует отметить, что данный принцип и следствия из него полностью построены на постулате о рациональности игроков и принципе «общего знания»

Принцип исключения доминируемых стратегий, безусловно, является полезным аналитическим инструментом. Но даже при наличии доминирования (что встречается в играх нечасто) он не может рассматриваться как универсальный принцип принятия оптимальных решений, и к анализу должны привлекаться дополнительные факторы и возможности. Этот вывод показывает, что даже такой простой принцип теории игр, как исключение доминируемых стратегий, не только предлагает вариант оптимального решения в определенной ситуации, но и некоторым образом подсказывает пути поиска лучшего («более оптимального») решения.

В игровом взаимодействии может также существовать оптимум по Парето или оптимум Парето. Стратегическая ситуация s* доминирует по Парето ситуацию s, если:

  • для любого игрока его выигрыш в ситуации sне больше, чем в ситуации s* ;
  • есть хотя бы один игрок, для которого его выигрыш в ситуации чем в ситуации sт.е.

Стратегии (решения), выводящие игроков в оптимум Парето, также называют эффективными по Парето.

Принцип Парето в некотором смысле противоположен равновесию в доминирующих стратегиях. В то время как равновесие в доминирующих стратегиях отражает «эгоистическое» поведение игроков, оптимум Парето отражает «кооперативное» поведение, т.е. их сотрудничество. Действительно, если есть ситуация, которая приносит всем игрокам не меньший выигрыш, чем существующая, то им можно реализовать более выигрышную для всех ситуацию [8]. Но для этого необходимы объединенные усилия всех игроков, что не всегда достижимо при заданных условиях.

Если существует временной лаг в принятии решений игроками, и один из них принимает решение, уже зная, как поступил другой (вариант динамической игры), оптимальное решение отыскивается, исходя из принципа равновесия по Штакельбергу. Равновесия по Штакельбергу соответствует максимальному выигрышу игроков, исходя из условий, сложившихся после уже сделанного выбора одним или несколькими игроками

Более общим критерием оптимального решения игры является равновесие Нэша. Равновесие Нэша предполагает такую ситуацию в игре, при которой ни одному из игроков не выгодно сепаратно (в одностороннем порядке, когда другие участники не меняют решения) отходить от выбранной стратегии. Это ситуация, в которой ни один из игроков не может увеличить свой платеж за счет только собственных действий. Равновесие Нэша и его модификации признаются наиболее подходящими концепциями решения бескоалиционных игр. Равновесие Нэша это профиль стратегий (один и тот же для всех игроков), при котором стратегия каждого игрока обеспечивает ему наилучший отклик на стратегии других игроков, т.е. обеспечивает максимальный платеж при стратегиях всех остальных игроков. Таким образом, при равновесии по Нэшу ни у одного из игроков нет стимула в одностороннем порядке изменять свою стратегию. Эта концепция основана на предположении максимизации выигрыша, к которой стремится каждый игрок, и на рациональном ожидании каждого игрока относительно поведения других игроков. Логические основания этой концепции решения игры можно объяснить следующим образом. В силу гипотезы рационального поведения каждый игрок стремится выбрать наилучшие для него действия при заданной обстановке, а обстановку эту определяют в том числе и другие игроки, рассуждающие подобным образом. Очевидно, что для реализации такого равновесия требуется информированность каждого игрока не только о допустимых стратегиях и платежных функциях всех игроков, но и информированность всех игроков о взаимной информированности. То есть для того, чтобы предположения о рациональном поведении оправдывались, необходимо выполнение постулата общего знания.

Равновесие Нэша является главным принципом оптимальности стратегий для некооперативного взаимодействия n игроков, которые принимают решения одновременно, однократно и независимо, не имея возможности договариваться о выбираемых действиях и перераспределять получаемые платежи. К настоящему времени разработана целая группа принципов, основанных на равновесии Нэша и называемых очищениями равновесия Нэша. Так, для некооперативных игр в развернутой форме используются принципы оптимальности, основанные на равновесии Нэша, но учитывающие специфику динамического взаимодействия игроков. К основным из них относятся: равновесие, совершенное по подыграм, секвенциальное равновесие, сильное секвенциальное равновесие. В играх с неполной информацией отыскивается равновесие Байеса Нэша. Применение принципа оптимальности, как равновесие Нэша, во многих случаях дает эффективные и рациональные решения.

Таким образом, выше были рассмотрены четыре основных принципа, определяющих оптимальное решение: равновесие в доминирующих стратегиях, оптимум Парето, равновесие по Нэшу и равновесие по Штакельбергу. Далеко не в каждой игре могут присутствовать и быть обнаружены все эти равновесия или хотя бы одно из них.

Следует отметить, что основная трудность применения методов теории игр заключается в том, что во многих случаях они не рассматривают однозначного оптимального поведения игроков. В случае, когда равновесий в игре много, т.е. когда имеется несколько возможных решений, фактически отсутствует однозначное решение игры, что ставит дополнительные вопросы о принципах дальнейшего выбора оптимальных стратегий. Однако из этой ситуации есть выход. Этот выход обнаружил Т. Шеллинг, который назвал его эффектом фокальной точки. Из множества равновесий игроки могут выбрать одно, исходя из неких общих социокультурных норм и представлений. Этот «спонтанно» выбираемый вариант и называется фокальной точкой. Выход на фокальную точку возможен лишь в рамках социально однородных групп или в рамках одной культуры, поскольку он связан с наличием общих представлений о приемлемых нормах поведения и общих ценностях.

В заключение еще раз следует сказать, что теория игр не имеет единственного и универсального принципа или критерия оптимального решения игр, предлагается много подходов и методов решения для разных типов игр.

 

Список использованной литературы: 

  1. Aumann R. Lectures on Game Theory. San Francisco: Westview Press, 1989 г.
  2. Авинаш Диксит, Бари Нейлбафф Теория игр. Искусство стратегического мышления /пер. с англ. Н. Яцюк. – М.: Манн, Иванов и Фербер, 2015. 387 с. 
  3. Воробьев Н.Н. Основы теории игр. Бескоалиционные игры. М.: Наука, 1984. 272с.
  4. Нейман Дж. фон, Моргенштерн О. Теория игр и экономическое поведение. М.:Наука, 1970. 708 с.
  5. Мазалов В.В. Математическая теория игр и приложения. Спб.: Лань, 2016 . – 448 с.
  6. Дубина И.Н. Основы теории игр и ее приложения в экономике и менеджменте. Барнаул: изд-во Алт. ун-та, 2013. 312 с.
  7. Bierman H.S. Game Theory with Economic Applications. - Reading, MA: AddisonWesley, 1998
  8. Губко М.В.Теория игр в управлении организационными системами. М.: Синтег, 2005. – 368 с.
Теги: Игры
Год: 2017
Город: Актюбинск
Категория: Социология
loading...