Теория игр в комиксах бесплатное чтение

Айван Пастин, Тувана Пастин
Теория игр в комиксах

Introducing Game Theory: A Graphic Guide (Introducing…)

by Ivan Pastine, Tuvana Pastine, illustrations by Tom Humberstone

Text and illustrations copyright © 2017 Icon Books Ltd


© Скворцова И., перевод на русский, 2017

© Леонтьев В., дизайн обложки, 2017

© Оформление. ООО «Издательство «Э», 2017

* * *

Что такое теория игр?

Теория игр представляет собой набор инструментов, применяемых для анализа ситуаций, в которых лучшая стратегия одного человека зависит от действий, в том числе ожидаемых, других людей. Благодаря теории игр мы можем понять, как люди действуют в ситуациях взаимной зависимости.

Такая взаимозависимость, или взаимосвязь, может сформироваться в самых разных ситуациях. Иногда кооперация помогает группе достичь большего, чем получилось бы у каждого человека в отдельности. С другой стороны, если человек добивается успеха за счет других, может произойти конфликт. Так, во многих ситуациях имеются и плюсы кооперации, и элементы конфликта.



Теория игр помогает проанализировать любую ситуацию, в которой успех одного человека зависит от поведения других. Именно поэтому она эффективно применяется во многих отраслях науки.

Экономика: на решения, принимаемые фирмами, влияют их ожидания относительно продукта, цены и рекламной политики, которые выберет фирма-конкурент.

Политология: на политическую платформу одного из кандидатов влияют политические заявления его соперника.

Биология: животным приходится бороться за скудные ресурсы, и в случае нападения на опасного противника они могут пострадать.

Информатика: подключенные к одной сети компьютеры «конкурируют» за канал передачи данных.

Социология: публичное выражение нетрадиционной точки зрения поддается влиянию других членов общества, чье поведение отвечает нормам социальной культуры.



Теория игр применяется при стратегическом взаимодействии в ситуациях, когда ваш успех зависит от действий других людей, а не только от ваших решений. В таких случаях на действия людей оказывают влияние те ожидания, которые они возлагают на действия других.


Почему она называется «теория игр»?

Теория игр изучает стратегическое взаимодействие, которое является основным элементом большинства настольных игр, – отсюда и название. От вашего решения зависят последующие действия вашего соперника, и наоборот. Большая часть жаргона теории игр заимствована напрямую из игр. Те, кто принимает решение, зовутся игроками. Игрок делает ход, когда принимает решение.


Работа с моделями

Вне игр стратегическое взаимодействие может быть устроено очень сложно. Взаимодействие между людьми включает, к примеру, не только наши решения, но и выражение лица, тон голоса, язык тела – все это оказывает влияние на других. То, как складываются отношения между людьми, во многом зависит от их личного опыта и точек зрения. Подобное разнообразие способно создавать сложные ситуации, которые с трудом поддаются анализу.

Эту сложность можно обойти, создавая упрощенные структуры, называемые моделями. Модели не так сложно анализировать, при этом они отражают важные элементы реальной задачи. Упрощенная модель, выбранная с умом, поможет узнать много полезной информации о сложной реальной задаче.



Шахматы – прекрасный пример того, как множество вариантов усложняет игру, предсказывание последующих шагов и исхода. В шахматах есть определенные правила. Существует ограниченное количество вариантов ходов в каждой позиции. Тем не менее сложность этой игры поражает, хоть она и намного проще любого акта человеческого взаимодействия.


Ничья

У сложных настольных игр вроде шахмат есть отличительная черта: чем опытнее игроки, тем чаще партия заканчивается ничьей. Как можно объяснить такую закономерность?

Шахматы – это игра, не поддающаяся доскональному анализу. Поэтому давайте используем упрощенную модель, которая отражала бы некоторые важные детали шахмат: крестики-нолики. Обе эти игры имеют игровые поля и правила. Игроки принимают решения по очереди, выбирая из ограниченного количества возможных ходов.

Конечно, крестики-нолики не отражают всего, что происходит в шахматах. Но благодаря тому, что эти две игры имеют некоторые одинаковые свойства, играя в крестики-нолики можно понять, почему опытные шахматисты часто заканчивают партию ничьей.



Крестики-нолики – любимая детская игра. Как правило, если играют двое неопытных игроков, то партия, скорее всего, окончится победой одного из них. Однако достаточно попрактиковавшись, вы быстро поймете как полезна может быть обратная индукция: вы можете предугадать реакцию вашего противника на ваши возможные действия и учитываете ее при принятии решения.

После того как игроки научатся использовать обратную индукцию, крестики-нолики, вероятнее всего, будут всегда заканчиваться ничьей. Если смотреть на игру с такой точки зрения, крестики-нолики играют роль упрощенной модели шахмат. Так, в шахматах, может, и существует намного больше возможных ходов, но когда играют искусные игроки – ничьей избежать трудно.


Рассмотрим сложность поближе: искусство и наука

Для теории игр наибольший интерес представляют все же не настольные игры вроде шахмат. Скорее, она направлена на улучшение нашего понимания того, как взаимодействуют люди, компании, страны, животные и так далее, когда сами проблемы слишком сложны для полного осмысления.

Чтобы достичь такого результата, мы создаем упрощенные модели, именуемые играми. Создание подобной полезной модели сочетает в себе науку и искусство. Правильная модель достаточно проста, чтобы обеспечивать понимание тех мотивов, что движут игроками. С другой стороны, она отражает важные элементы реальности, которые включают творческий подход и суждение, нацеленные на оценку значимости элементов.


Рациональность

Как правило, теория игр включает такие понятия, как рациональность и общеизвестность рациональности игроков. Рациональность – это качество игроков, которые хорошо понимают игровую ситуацию и рассуждают логически.

Общеизвестность рациональности игроков – это менее определенный критерий, значение которого в следующем: «Не только мы оба должны быть рациональны, но и я должен знать, что ты рационален. Мне нужен и второй уровень знания: я должен знать, что ты знаешь, что я рационален. Так же необходимый мне третий уровень знания гласит: я должен знать, что ты знаешь, что я знаю, что ты знаешь, что я рационален». И так далее к более глубоким уровням знания. Общеизвестность рациональности требует от игроков способности бесконечно продолжать эту цепь знаний.


«Кейнсианский конкурс красоты»

Эти требования общеизвестности рациональности легко могут запутать, но, что еще хуже, они могут просто-напросто не сработать, особенно в играх с большим количеством участников. Классический пример – так называемый «Кейнсианский конкурс красоты», в котором английский экономист Джон Мейнард Кейнс (1883–1946) сравнивает инвестиции в финансовые рынки с конкурсом, проводимым одной газетой в США, суть которого состояла в том, что читатели должны были выбрать «самую красивую девушку», то есть побеждали те читатели, что голосовали за наиболее часто выбираемую девушку.



На первый взгляд может показаться, что «Кейнсианский конкурс красоты» едва ли можно сравнивать с финансовыми рынками: тут нет никаких цен, покупателей и продавцов. Но у них есть один важный общий элемент. Добиться успеха на финансовом рынке можно лишь будучи на шаг впереди остальных. Если вы способны предсказать поведение среднестатистического инвестора, вы сорвете куш. Так же и в «Кейнсианском конкурсе красоты»: если вы можете предсказать среднестатистический выбор читателей газеты, вы можете победить.


Ричард Талер и «Игра на угадывание»

В 1997 году американский поведенческий экономист Ричард Талер (род. в 1945 г.) провел эксперимент в газете Financial Times под названием «Игра на угадывание» – его версия «Кейнсианского конкурса красоты».



Какое число выбрали бы вы?



Газета Financial Times получила более тысячи заявок в ходе эксперимента Ричарда Талера. Заявки с числом 33 были самыми частыми, на втором месте было число 22. Из этого можно сделать вывод, что многие продумали один шаг и выбрали 33. Но многие подумали, что другие на этом и остановятся, и попытались быть на шаг впереди них, выбрав число 22 (⅔ от 33).



Тем не менее если имеет место общеизвестность рациональности игроков, если вы знаете, что остальные не остановятся на первом шаге, то можете бесконечно продолжать такое итеративное рассуждение – процесс логического размышления, который включает повторение одного и того же действия, при котором результат одного этапа берется за отправную точку следующего.

Ученые, занимающиеся теорией игр, похожим образом играют в «Игру на угадывание» – они применяют итеративное исключение доминируемых стратегий.

Держим в уме, что нам необходимо найти число, равное ⅔ от среднего арифметического всех чисел, участвующих в конкурсе. Если бы все участники выбрали наибольшее из разрешенных чисел, то есть 100, то среднее арифметическое было бы равно 100. Соответственно, несмотря на то, каковы ожидания людей относительно среднего арифметического, нет никакого смысла в том, чтобы выбирать число, большее, чем ⅔ от 100, то есть 67.

Другими словами, любая стратегия с числом, большим, чем 67, доминируема числом 67. Говорят, что стратегия доминируема, если она (в данном случае выбор числа, большего, чем 67) дает игроку меньшие выигрыши, чем другая (выбор числа 67), при любых действиях оппонентов. Соответственно, даже если остальные игроки не рациональны, все стратегии, при которых названы числа больше 67, могут быть исключены.



Если остальные игроки рациональны, то каждый игрок может предполагать, что никто не назовет число больше 67. Таким образом, все догадки от 45 (ближайшее целое число к ⅔ от 67) также исключаются. А оттого, что каждый участник знает, что другие знают, что каждый рационален, все могут быть уверены, что никто не выберет число, большее, чем 45, и никто не выберет число большее, чем 30, которое равно ⅔ от 45.


Трудности, связанные с рациональностью и общеизвестностью рациональности

Тем не менее ноль не оказался выигрышным числом в этом эксперименте в Financial Times. Средним арифметическим было число 19, поэтому победило число 13.



В этом случае принципы рациональности и общеизвестности рациональности не были соблюдены. К примеру, многие участники нерационально выбрали число 100. Даже если бы кто-то ошибочно полагал, что все выберут 100, то оптимальным ответом было бы 67. Такие участники либо не совсем поняли правила игры, либо не смогли посчитать, сколько будет ⅔ от 100.

Концепция рациональности требует от игрока неограниченных когнитивных возможностей. Полностью рациональный человек знает, как решить любую математическую задачу, и может немедленно провести все вычисления, вне зависимости от уровня их сложности. Человеческое поведение можно было бы лучше соотнести с «ограниченной» рациональностью. Это значит, что человеческая рациональность ограничена разрешимостью задачи (то, насколько легко ее можно решить), нашими умственными возможностями, количеством отведенного времени и тем, насколько для нас важно решение этой задачи.



В дополнение к концепции «ограниченной» рациональности, которая имеет большое количество участников, как, например, было в «Игре на угадывание», трудно представить ситуацию, в которой сработал бы принцип общеизвестности рациональности. Даже если все игроки рациональны, вы не выберете 0, если думаете, что остальные игроки не знают, что вы рациональны. Вы бы выбрали число большее, чем 0.


Подъем и крах: применение рациональности на финансовых рынках

«Игра на угадывание» и «Кейнсианский конкурс красоты» объясняют тот интересный факт, что на финансовых рынках даже при условии рациональности всех участников наблюдаются так называемые экономические пузыри – чрезмерно «раздутые» цены. Это связывают с недостатком общеизвестной рациональности.


Игры с одновременными ходами

Часто так случается, что в момент принятия собственного решения игрок не знает, какое действие предпримет соперник. Подобные игры называются играми с одновременными ходами. Иногда игроки принимают решения буквально синхронно, а бывает, проходит какое-то время, но покуда соперники в момент принятия их собственного решения не знают, какой ход выбран другим игроком, мы можем называть их одновременными.

Рассмотрим пример. Кинокомпания Rabbit films сняла захватывающий рождественский фильм о супергероях. Эта лента может быть выпущена в прокат либо в октябре, либо в декабре.

Один из крупнейших конкурентов Rabbit films, кинокомпания Weasel studios, сняла ужасный фильм с огромным бюджетом. По сюжету главные герои этого фильма влюблены друг в друга, но плохая игра актеров не скрывает их взаимной неприязни. Weasel studios также может выпустить фильм в прокат в октябре или в декабре.



Люди чаще ходят в кино в декабре, чем в октябре, поэтому для обеих студий желателен выпуск фильма в декабре. Но оба фильма нацелены на одну аудиторию. Если они появятся в прокате в одно и то же время, то компаниям всеми правдами и неправдами придется бороться за зрителей.

Доход каждой студии зависит не только от даты выхода своего фильма в прокат, но и от даты выхода фильма студии-конкурента. Соответственно, между компаниями наблюдается стратегическое взаимодействие. Выигрыш, который одна студия получит благодаря выбору даты релиза, будет зависеть от выбора соперника.


Стратегическая форма игры

Мы можем проанализировать эту игру, записав возможные действия игроков (релиз фильма в октябре или декабре) и выигрыши (доходы) в таблицу под названием стратегическая (нормальная) форма игры. Стратегическая форма игры – это таблица, известная также как платежная матрица.



В каждом из двух рядов записан один возможный выбор Rabbit films (октябрь или декабрь), а в каждой колонке записаны возможные выборы Weasel studios. На пересечении каждого ряда и колонки указаны выигрыши каждого игрока: в этом примере под выигрышами понимаются доходы студии.

Эта матрица представляет все возможные исходы игры и указывает, что каждый участник получил бы в качестве выигрыша в каждой конкретной ситуации. Обе киностудии понимают, как работает платежная матрица, и знают, что имеют дело с одной и той же матрицей.

Выигрыши

В каждой конкретной ситуации под выигрышем будет пониматься что-то свое в зависимости от исследуемой проблемы. В примере с релизами фильмов выигрышем являются те многомиллионные доходы, которые с помощью этих фильмов заработали бы студии при любом из возможных исходов.

В иных случаях выигрыши будут иметь другие значения. В биологии выигрышами часто называют приспособленность животного. В экономике, социологии и других науках выигрыш понимается как относительное «благосостояние» или «полезность» участников.



Может показаться странным, что мы связываем с числовыми показателями понятия благосостояния и приспособленности животного. Однако на решения игроков влияют не столько сами числа, сколько то, как эти числа соотносятся.

Для стратегического взаимодействия двух студий важны лишь их предпочтения относительно исхода. Нам важно знать лишь то, какие результаты лучше, а какие хуже для каждого из участников. Числа – это просто удобный способ представления этих предпочтений.



Конечно, существует множество значимых ситуаций, в которых людям важны не только свои собственные выигрыши, но и чужие. Друзья и члены семьи, как правило, стараются радовать друг друга, а пары в состоянии развода и деловые конкуренты могут быть не против причинить друг другу неприятности.

Подобные ситуации легко поддаются анализу с помощью теории игр: записывая потенциальные выигрыши, мы учитываем все желания участников, включая и желания, связанные с личной выгодой, и желание помочь или навредить другим. Значащиеся в таблице числа – это итоговый выигрыш, который каждый из игроков получит при любом из исходов: так, выгода, которую участник способен извлечь, может быть прямой или непрямой (например, если он причинит вред или поможет кому-либо). Таким образом, выигрыш учитывает все, что для человека важно.

Соответственно, в игре стратегической формы каждый игрок заинтересован лишь в увеличении своих выигрышей.


Равновесие Нэша

Теперь, когда мы уточнили условия игры, записав ее в стратегической форме, можем перейти к возможным последующим событиям.

Равновесие Нэша – это фундаментальная концепция в теории игр, названная в честь американского математика Джона Нэша (1928–2015). Само понятие математического равновесия было придумано задолго до Нэша, но он был первым, кто приложил его к математическому анализу игр в общем, а не только к отдельным примерам, как делали раньше.



Идея равновесия Нэша и достаточно проста, и эффективна одновременно: в ситуации равновесия каждый рациональный игрок выбирает свою оптимальную стратегию, учитывая, что другой игрок также придерживается определенной стратегии. То есть участник выбирает стратегию в зависимости от действий оппонента.

Оптимальная стратегия Rabbit films

• Если Rabbit films ожидает, что Weasel Studios выпустит фильм в октябре, то их оптимальной стратегией будет выпуск фильма в декабре, так как R:120 > R:50. Подчеркиваем R:120.

• Если Rabbit films ожидает, что Weasel Studios выпустит фильм в декабре, то их оптимальной стратегией будет выпуск фильма в декабре, так как R:90 > R:70. Подчеркиваем R:90.

Оптимальная стратегия Weasel studios

• Если Weasel Studios ожидает, что Rabbit films выпустит фильм в октябре, то их оптимальной стратегией будет выпуск фильма в декабре, так как W:10 > W:5. Подчеркиваем W:10.

• Если Weasel Studios ожидает, что Rabbit films выпустит фильм в декабре, то их оптимальной стратегией будет выпуск фильма в декабре, так как W:8 > W:7. Подчеркиваем W:8.

В ситуации равновесия обе студии выпустили бы фильмы в декабре. Это единственный исход, при котором оптимальные стратегии обеих студий позволяют достичь наилучших результатов.



Одной из характеристик равновесия Нэша является отсутствие сожаления у каждого из игроков. Отказ от стратегии равновесия, подразумевающей выпуск фильмов в декабре, не принес бы ни одной из студий никакой выгоды. Равновесие Нэша также является и равновесием рациональных ожиданий. В такой ситуации Rabbit films выпускает фильм в прокат в декабре, ожидая, что Weasel Studios собирается выпускать фильм в прокат в декабре. И действительно, Weasel Studios назначает релиз на декабрь. Соответственно, ожидания правильны.


«Дилемма заключенных»

«Дилемма заключенных» – это самый известный парадокс во всей теории игр. Такое название этой дилемме дал канадский математик Альберт Такер (1905–1995). Эта игра профессора Такера очень похожа на голливудскую криминальную драму, в которой каждому из двух заключенных предлагают сделку о сотрудничестве с правосудием в обмен на донос о другом заключенном. Эта дилемма наглядно показывает, как трудно может быть действовать сообща для общего блага, если люди преследуют свои личные интересы.

Стимулы, которые мы наблюдаем в «Дилемме заключенных», достаточно часто встречаются и используются учеными при анализе задач в самых разнообразных областях науки, например конкуренция компаний в экономике, общественные нормы в социологии, механизмы принятия решения в психологии, борьба животных за скудные ресурсы в биологии или борьба компьютеров за канал передачи данных.



Алан и Бен угнали машину, но их вскоре поймали. Полицейские подозревают, что до того, как их арестовали, они сбили человека и скрылись с места преступления, но у следствия нет улик, прямо указывающих на их вину. Допрос преступников ведется в разных комнатах.

И у Алана, и у Бена есть два варианта действий: они могут сохранять молчание, а могут признаться. Соответственно, существует четыре возможных исхода этой игры:

Алан сохраняет молчание, и Бен сохраняет молчание;

Алан признается, и Бен сохраняет молчание;

Алан сохраняет молчание, и Бен признается;

Алан признается, и Бен признается.



«Дилемма заключенных» может быть представлена в стратегической форме, при которой каждый ряд матрицы представлял бы возможный выбор Алана, а каждая колонка – возможный выбор Бена. На пересечениях каждого ряда и колонки мы обозначим выигрыши каждого игрока: в данном случае это будет срок заключения.



Если Алан и Бен сохранят молчание, то оба получат срок в один год за угон автомобиля. Это отрицательный расклад, поэтому их выигрыши также в минусе (Алан: –1, Бен: –1). Если оба преступника сознаются, каждый сядет в тюрьму на 10 лет (А – 10, Б – 10).



Заключенные понимают, как работает эта матрица, и знают, что имеют дело с одной и той же матрицей.

Это пример игры с одновременными ходами. Даже если заключенные не принимают решения синхронно, мы все равно можем назвать их одновременными, потому что игроки находятся в разных комнатах и ни один из них в момент принятия своего решения не знает, как будет действовать другой.

Однако заметьте, что, воспринимая эту дилемму как игру в стратегической форме, мы не говорим о возможном исходе. Мы просто обозначаем все потенциально возможные итоги, будь они разумны или нет, и записываем выигрыши, которые игроки получили бы, если бы место имел именно такой исход.

Теперь, когда мы записали нашу задачу в стратегической форме, мы можем приступить к анализу возможного результата.



Очевидно, если бы Алан и Бен вместе придумали бы свою версию произошедшего, они смогли бы сохранить молчание и попали бы в тюрьму всего на один год.

Но этот вариант не входит в систему равновесия. Для Алана стратегия «сознаться» строго доминирует над стратегией «молчать»: всегда лучше сознаться, несмотря на его ожидания относительно действий Бена.



Точно так же и для Бена оптимальной стратегией было бы признание, вне зависимости от его ожиданий относительно действий Алана.

В ситуации равновесия Нэша в данной дилемме оба заключенных признаются. Стандартный способ записи этого исхода таков:

{признание, признание}

Это значит, что игрок, чьи выигрыши записаны в матрице в строку (Алан), сделал выбор в пользу признания, как и игрок, чьи выигрыши записаны в колонку (Бен). В равновесии оба заключенных получают по 10 лет тюремного срока.


Эффективность по Парето

Интересно, можно ли сказать, что равновесие Нэша в «Дилемме заключенных» Парето-эффективно? Исход игры можно назвать Парето-эффективным, если больше не существует ни одного возможного исхода, при котором один участник находился бы в лучших условиях, а другой – в худших. Это понятие распределительной эффективности названо в честь итальянского экономиста Вильфредо Парето (1848–1923).



Нэш-равновесный исход «Дилеммы заключенных» не Парето-эффективен, потому что каждый заключенный извлек бы большую выгоду, если бы оба промолчали, отсюда и прозвище «Дилемма заключенных».

Тем не менее во многих других играх равновесие Нэша Парето-эффективно. К примеру, в игре про киностудии не существует исхода, альтернативного Нэш-равновесному исходу, который приносит пользу одной студии, не вредя другой.

Проектирование сетей

Стимулы, представленные в «Дилемме заключенных», основываются на различных ситуациях. Действительно, как только один человек начинает смотреть на мир через такую призму этой дилеммы, трудно не начать замечать ее повсюду.

К примеру, когда беспроводные сетевые передатчики, такие как Wi-Fi-роутеры или вышки сотовой связи, используют одну и ту же частоту, их зоны покрытия накладываются, их взаимодействие нарушается и замедляется скорость работы.

Одним из возможных решений этой проблемы будет снижение мощности передачи обоих устройств, чтобы их зоны покрытия больше не накладывались. Но если мощность передачи снижена только на одном устройстве, второе более мощное устройство будет перегружать канал передачи данных.



Описанная ниже ситуация может быть представлена в матрице.

Разработчики каждого роутера должны принять решение: передавать сигнал высокой или низкой мощности? Выигрышами будут скорости передачи данных в миллионах бит в секунду (Мбит/с). В этой игре передача сигнала высокой мощности дает одному роутеру преимущество за счет другого устройства так же, как было с признаниями в «Дилемме заключенных».

Передача сигнала высокой мощности гарантирует одному устройству самую высокую скорость вне зависимости от функционирования другого устройства. «Высокая мощность» – это доминирующая стратегия. При равновесии Нэша оба устройства передают сигнал высокой мощности и скорость передачи данных для каждого достигает 5 Мбит/с – так же как и в «Дилемме заключенных» признания обоих преступников обеспечили им длительное пребывание в тюрьме.




Если бы оба роутера работали на низкой мощности, скорость передачи данных у каждого достигла бы 10 Мбит/с. Однако когда мощность задается независимо, ни одно устройство не «выберет» низкую мощность, так как каждый отдельный роутер улучшает свои показатели работы, увеличивая мощность.

Если оба роутера подсоединены к одной сети, то, возможно, они оба будут работать в режиме низкой мощности для облегчения этой «борьбы». У многих устройств есть более продвинутые настройки, благодаря которым становится возможным взаимодействие роутеров в одной сети вместо их конкуренции. Такие настройки помогают сетевым администраторам обойти эту «Дилемму заключенных».


Трагедия ресурсов общего пользования

Проблема сетевого роутера прямым образом связана с «трагедией ресурсов общего пользования» – концепцией, описанной Уильямом Фостером Ллойдом (1794–1852) задолго до появления «Дилеммы заключенных». В своей притче о чрезмерном выпасе скота Ллойд предполагал, что фермеры думают лишь о своей выгоде, а не об интересах группы людей, и тем самым истощают ресурсы блага общего пользования.

В экономике термин «ресурсы общего пользования» с ходом времени понемногу менял свое значение и на сегодняшний день включает в себя значение «любое общее благо». Поэтому в задаче о сетевом роутере ресурсы общего пользования – это канал передачи данных, за который конкурируют устройства. В этом примере чрезмерное использование блага не причиняет долгосрочного ущерба или истощения природного ресурса, как это происходит в примере Ллойда о выпасе скота. Тем не менее имеют место точно такие же стимулы каждого человека злоупотребить использованием ресурса в ущерб другим участникам группы.


Наращивание ядерного потенциала

Изначально «Дилемма заключенных» была сформулирована математиками Мелвином Дрешером (1911–1992) и Мериллом Фладом (1908–1991) в 1950 году во время их работы над одним проектом Военно-воздушных сил США. Тогда их целью была разработка перспектив развития глобальной ядерной стратегии.

В оригинальной формулировке Дрешера и Флада двумя участниками игры были США и СССР (хотя ко времени кульминации холодной войны в 1980-х годах игроков было существенно больше). Каждая страна должна была решить, стоит ли наращивать ядерный потенциал или нет. Если страна решает не наращивать свой ядерный потенциал, то она экономит деньги и избежит косвенных потерь в результате несчастных случаев. Но у каждого государства есть стимул наращивать свой ядерный потенциал: чтобы улучшать свое геополитическое положение. В интересах каждого государства инвестиции в ядерное вооружение, вне зависимости от действий другой страны. Соответственно, в этой игре глобальное наращивание ядерного потенциала и представляет собой равновесие Нэша.




Нэш-равновесный исход в гонке ядерных вооружений не эффективен по Парето, так как обе страны извлекли бы большую выгоду, если бы ни одна из них не занималась наращиванием ядерного потенциала. Однако, как утверждали Дрешер и Флад, такая ситуация не была бы равновесной. Если бы в правительстве США приняли решение перестать наращивать ядерный потенциал, СССР продолжил бы наращивание, чтобы стать сверхдержавой. Если уж на то пошло, то для США изначально было бы не рационально останавливать наращивание ядерного потенциала.

Кооперация

Несмотря на то что в «Дилемме заключенных» присутствует выгода от кооперативного поведения, личные стимулы провоцируют конфликт. В примере с сетевыми устройствами возможно решить проблему, если один человек контролирует оба роутера. Однако при человеческом взаимодействии добиться кооперации может быть не так просто.

Социопсихологи занимаются изучением конфликта и кооперации, чтобы разобраться в том, как социальные группы влияют на поведение отдельных индивидов. Рассмотрим другой пример «Дилеммы заключенных», игру под названием «Соседи по комнате». Эта игра не только демонстрирует широкий спектр применения теории игр, но и заставляет задуматься о том, как социальные нормы помогают преодолеть личностные стимулы к чрезмерному конфликту.



Элис и Бэт – соседки по квартире. Им обеим нравится порядок на кухне, но ни одной не нравится порядок наводить. У каждой из девушек есть выбор: мыть посуду или не мыть. Таким образом, мы видим пример стратегического взаимодействия, так как счастье Элис (выигрыш) зависит от выбора действия Бэт, и наоборот.



Если ни одна из соседок не помоет посуду, выигрыш Элис составит 10 (А:10), так же как и выигрыш Бэт (Б:10). Эти показатели «счастья» используются нами просто для демонстрации предпочтительного для каждой девушки исхода. Если только Бэт помоет посуду, выигрыш Элис составит 20, однако выигрыш Бэт в таком случае уменьшится до 8 (А:20, Б:8). Если посуду помоет только Элис, получится обратная ситуация (А:8, Б:20). Если они приберутся вместе, то, поделив работу, выигрыш каждой девушки составит 14. И Бэт, и Элис понимают то, как их счастье зависит от исхода.



Равновесие Нэша достигается в случае, если ни одна из девушек не помоет посуду, то есть {не мыть посуду, не мыть посуду}, так как если каждая ожидает, что соседка не будет убираться, то наилучшим ответом будет бездействие.



В «Соседях по комнате» наблюдается так называемая проблема безбилетника. Выигрыш Элис является наибольшим, когда она отдыхает, пока Бэт моет посуду. Такая же ситуация возникает и у Бэт.

В равновесной ситуации ни одна из девушек не моет посуду, и выигрыш обеих составляет 10. Если бы они объединили свои усилия, то выигрыш каждой составил бы 14. Тем не менее чистота, достигнутая совместной работой, это не равновесный исход игры. Как только один из участников начинает ожидать, что порядок наведет другой, возникает стимул стать «безбилетником».


Образование

Из проблемы безбилетника существует выход: можно изменить выигрыши в матрице. Велико влияние родительского воспитания и школьного образования на человека – у него могут появиться угрызения совести при некооперативном поведении (например, когда он оставляет грязную посуду в раковине).



Изначально возникновение угрызений совести может показаться очень неудобным для соседок. Естественно, ведь никому не нравится чувствовать себя виноватым. Но при социальном взаимодействии угрызения совести могут подтолкнуть девушек к более кооперативному поведению и таким образом изменить равновесную ситуацию. Элис и Бэт получат бо́льшую выгоду, если будут следовать своим моральным установкам, так как они позволяют им достичь тех плодов сотрудничества, которые ранее были им недоступны.

Предположим, что за невыполнение своей части работы человека начнут мучить угрызения совести. Если одна из девушек не помоет посуду, ей будет стыдно, и ее счастье, обозначенное цифрой в матрице, уменьшится на 7. Равновесная ситуация будет достигнута при исходе {помыть посуду, помыть посуду}, а выигрыш каждой девушки составит 14.

Так как игроки решают объединиться, в равновесной ситуации совесть их мучить не будет. В таком исходе в связи с моральными установками участников будет наблюдаться улучшение по Парето. А их равновесные выигрыши вырастут с 10 до 14.


Экологическая политика и кооперация

Международное сотрудничество в области защиты окружающей среды во многом похоже на игру «Соседи по квартире», только больше. Каждое государство предпочитает оставаться пассивным, пока другие страны внедряют дорогостоящие технологии, направленные на защиту природы и уменьшение выбросов углекислого газа. Решить этот вариант «проблемы безбилетника» можно было бы, подписав международное соглашение, которое обязывало бы государства платить денежные штрафы в случае, если выбросы углекислого газа в данной стране превышают установленный предел. Однако пока так и не удалось убедить страны, выбрасывающие в атмосферу наибольшее количество углекислого газа – США, Индия и Китай, – ратифицировать подобное международное соглашение.



Почему же так сложно подписать международное соглашение об ограничении вредных выбросов, ведь оно принесло бы всем столько пользы?

Сотрудничество принесло бы выгоду всем участникам, однако для США предпочтительнее всего было бы не подписывать соглашение о денежных штрафах, а оставить эту миссию другим странам. Ведь кто не любит прокатиться без билета?



С одной стороны, активная позиция относительно защиты окружающей среды означает усилия, направленные на изменение социальных норм. Те политики, что не поддерживают природоохранную политику, могут ощущать на себе давление. Это может изменить выигрыши лидеров государств точно так же, как угрызения совести девушек изменили их выигрыши в «Соседях по комнате». Такое политическое давление теоретически может привести к лучшему исходу, если оно создает равновесную ситуацию международного сотрудничества.

Множественность равновесий

До сих пор мы рассматривали игры только с точки зрения равновесия Нэша. В тех играх равновесие Нэша делает один-единственный прогноз поведения игроков. Тем не менее люди часто сталкиваются с множеством равновесий Нэша. В играх с множеством равновесий концепция равновесия Нэша сама по себе не предоставляет нам достаточных средств для прогнозирования действий участников.

Какое же равновесие изберут участники игры с множеством равновесий?

В поисках ответа на этот вопрос американский экономист, профессор политической экономии и лауреат Нобелевской премии 2005 года Томас Шеллинг (1921–2016) пересмотрел суть экономики и ее место среди общественных наук.


Множественность равновесия: «Битва полов»

Классическая игра «Битва полов» позволяет понять стимулы, возникающие в игре с множеством равновесий Нэша. Может показаться, что эта игра слишком проста и основывается на устаревших стереотипах, но она прекрасно иллюстрирует эту множественность, так как стимулы одной и той же формы проявляются в самых разных ситуациях.

За завтраком пара молодых людей, Эми и Боб, решают провести вечер вместе, но каждый из них предлагает разное занятие. Они договариваются созвониться днем и решить, куда пойти вечером.



Эта матрица выигрышей иллюстрирует «счастье» участников. Числа показывают, какой исход предпочтителен для каждого игрока. Например, если Эми и Боб пойдут на футбол, выигрыш Эми составит 5. Если они вместе пойдут танцевать, Эми выиграет 10 (Э:10). Точные числа не имеют никакого значения, они лишь условно обозначают желание Эми пойти танцевать, а не смотреть футбол, так как 10>5.

Хотя Эми и Боб предпочитают по-разному проводить время, им нравится быть вместе. Они оба думают, что худшим исходом было бы провести вечер порознь. Если они в итоге выберут разные занятия, то выигрыш каждого составит 0.




В тот день на телефонной станции произошел сбой. Эми и Боб должны принять это решение, не совещаясь и не зная, что выберет другой. Так эта игра становится игрой с одновременными ходами.

В ситуации равновесия Нэша оба участника пойдут на футбольный матч.



Однако равновесие Нэша сохранится, и если они оба пойдут танцевать.



В «Битве полов» возможны два равновесия Нэша, при которых игроки с уверенностью выбирают определенный вид деятельности: «футбольное» равновесие и «танцевальное» равновесие.

Но что же Эми и Боб в итоге выберут?



Вполне вероятно, что Эми и Боб потерпят так называемую координационную неудачу из-за несовпавших ожиданий. В этом случае ученый, занимающийся теорией игр, отметил бы «внеравновесный» исход, при котором оба участника проводят вечер порознь: ни одно из возможных равновесий Нэша не имело место.



Существуют способы преодолеть координационную неудачу в играх с множеством равновесий…

Социальные нормы

В ситуациях с множеством равновесий игроки могут координировать свои ожидания относительно одного равновесия с помощью социальных норм. К примеру, если Боб всегда старается делать все по-своему, то и Эми, и сам Боб будут ожидать, что равновесие, предпочтительное для Боба, будет доминировать в любой ситуации с множеством равновесий. В этом случае не только Боб будет рад пойти на матч с Эми, но и Эми будет рада, ведь она с Бобом, а не проводит вечер в одиночестве.



Игра «Битва полов» не предоставляет тех условий, при которых общество становится патриархальным (то есть обществом, в котором мужчины являются основными носителями власти), однако она иллюстрирует возможную выгоду доминирования по половому признаку. Возможно, это одна из причин, почему обществу так трудно перейти к более справедливой форме существования.


Средства координации

Если в играх с множеством равновесий отсутствует социальная норма, игроки могут воспользоваться средством координации, то есть таким коллективным наблюдением или общей историей, чтобы скоординировать ожидания относительно одного и того же равновесия.

К примеру, на радиостанции, которую слушают Эми и Боб, могут активно рекламировать их танцевальную студию. Для студии рационально вкладывать деньги в рекламу, если студия ожидает, что реклама скоординирует ожидания потребителей относительно равновесия, которое они выберут. Эми и Боб понимают, что студию рекламируют, потому что слушатели радиостанции используют рекламу, чтобы скоординировать ожидания. Соответственно, в отсутствие прямого общения между Бобом и Эми они могут использовать рекламу, услышанную в течение дня, как средство координации своих ожиданий относительно «танцевального» равновесия.


Банковское дело и ожидания: наплыв вкладчиков

Откуда у банков столько денег? Дело в том, что банк принимает наши вклады и часть этих средств дает в кредит юридическим и физическим лицам, которые платят банку процент. Такая схема выгодна для банка, она также позволяет людям покупать недвижимость, а предприятиям – инвестировать. Но это значит и то, что все вкладчики не могут одновременно забрать свои вклады. Бо́льшая часть всех средств обычно отдана в кредит, то есть ее нельзя будет получить, пока банку не будет выплачена вся сумма.

Соответственно, даже если банк находится в прекрасном финансовом состоянии, он будет вынужден признать себя банкротом в случае бегства вкладчиков (ситуация, при которой все вкладчики одновременно пытаются изъять свои вклады).



Так же, как и в «Битве полов», в банковском деле существует множество равновесий Нэша. В зависимости от ожиданий общественности мы можем наблюдать банк в штатном состоянии или в состоянии бегства вкладчиков.

Если одни вкладчики ожидают, что остальные вкладчики не будут забирать из банка деньги, они подождут окончания срока действия вклада, чтобы получить процент со всей суммы. Однако существует второе равновесие Нэша. Если вкладчики ожидают, что другие вкладчики будут забирать свои средства до окончания срока действия вклада, то каждый вкладчик что есть мочи помчится в банк за своими деньгами.

Вера в то, что скоро случится бегство вкладчиков, – это самореализующееся ожидание: само ожидание провоцирует бегство вкладчиков.



Тем не менее, даже если вклад застрахован и есть кредитор последней инстанции, никто не может гарантировать, что бегства вкладчиков не произойдет. Вкладчики вполне могут предположить, что страховая сумма не будет выплачена сразу же после банковской паники.




В банковском деле всегда существует множество равновесий, поэтому ожидания людей о том, что произойдет, определяют исход. Даже положительные высказывания и полезная деятельность банкиров и глав государств могут иметь негативный эффект, если будут восприняты обществом как признак слабости.

Равновесие Нэша в смешанных стратегиях

До сих пор мы рассматривали игры с равновесием Нэша в чистых стратегиях. Это такое равновесие, при котором игроки уверенно делают определенный выбор. Но такое равновесие возможно не во всех играх. Помните, как вы в детстве играли в «Камень, ножницы, бумага»? «Ножницы» режут «бумагу», «камень» бьет «ножницы», а «бумага» оборачивает «камень». Это игра с нулевой суммой, то есть если один участник выигрывает, другой проигрывает.

Игра «Камень, ножницы, бумага» кажется детям такой увлекательной за счет непредсказуемости исхода. А для теории игр она интересна тем, что в ней нет ни одного равновесия, при котором игроки действовали бы предсказуемо. Если действия игрока можно спрогнозировать, другой игрок воспользуется этим и выиграет. Поэтому участники стараются быть непредсказуемыми. У этой игры нет равновесия Нэша в чистых стратегиях.



В игре «Камень, ножницы, бумага», как мы уже сказали, нет равновесия Нэша в чистых стратегиях, однако в ней есть равновесие Нэша в смешанных стратегиях. Это значит, что в равновесной ситуации игроки наугад выбирают между несколькими возможными чистыми стратегиями: «камень», «ножницы» или «бумага».



Однако не все игры со случайным выбором имеют равновесие Нэша в смешанных стратегиях. Простого выбора наугад недостаточно. Смешанные стратегии игроков также должны быть их наилучшими ответами друг другу, чтобы сформировалось равновесие Нэша.

Давайте рассмотрим стратегию, которая не может поддерживать равновесие Нэша.

Предположим, что, согласно стратегии Джека, он выберет «бумагу» в 10 % случаев, «ножницы» в 10 %, а «камень» в 80 %.

Наилучшим ответом Сьюзан на стратегию Джека будет уверенно выбрать «бумагу», что будет значить, что вероятность ее выигрыша составит 80 % – как раз вероятность того, что Джек выберет «камень».



Стратегии Джека и Сьюзан не являются равновесием Нэша: выборы игроков – это не их наилучшие ответы друг другу. Учитывая стратегию Сьюзан, наилучшим ответом Джека было бы уверенно выбрать «ножницы» вместо его случайной стратегии.

В игре «Камень, ножницы, бумага» возможно только одно равновесие: каждый игрок выбирает смешанную стратегию, при которой он называет каждый из трех возможных вариантов («камень», «ножницы» или «бумага») с одинаковой вероятностью.

Джек делает случайный выбор, и у каждого варианта одинаковая вероятность. Это значит, что у Сьюзан нет никаких предпочтений относительно ее возможных выборов. Если Сьюзан выберет «ножницы», то вероятность ее выигрыша – один к трем (это случится, если Джек выберет «бумагу»); также это будет значить, что в этой ситуации вероятность ее проигрыша составит одну треть (если Джек выберет «камень»), и одну вероятность ничьей будет равно одной трети (если Джек также выберет «ножницы»). Но и любой другой выбор, помимо «ножниц», гарантирует Сьюзан те же выигрыши.



Такое же рассуждение рационально и для Джека. До тех пор пока существует одинаковая вероятность того, что Сьюзан выберет каждый из возможных вариантов, Джек будет получать те же выигрыши за выбор любого из трех вариантов. Поэтому он предпочитает делать случайный выбор.

Игра «Валютная спекуляция»

Равновесие Нэша в смешанных стратегиях может применяться в самых различных областях. Оно отражает неожиданность в играх, где участники должны быть непредсказуемы. К примеру, оно может наглядно продемонстрировать, как работают спекулятивные атаки, которые обычно достаточно внезапны и неожиданны.

16 сентября 1992 года, в день, известный как «Черная среда», произошла внезапная спекулятивная атака – инвесторы массово продавали британские фунты стерлингов, ожидая девальвации (резкое падение стоимости фунта стерлингов по сравнению с другими валютами). Тогда стоимость фунта относительно других валют ЕС была зафиксирована Банком Англии. В тот день Банк Англии купил 4 миллиарда фунтов стерлингов, чтобы предотвратить обесценивание валюты.

Однако на следующий день Банк Англии, который больше не мог противостоять силе рынка, допустил падение стоимости фунта более чем на 10 %. Спекулянты, за день до этого продавшие фунты и купившие немецкие марки, получили огромную выгоду, а Банк Англии понес колоссальные убытки. Тогда один из крупнейших спекулянтов, американский финансист венгерского происхождения Джордж Сорос (род. в 1930 г.) стал известен как «человек, который разорил Банк Англии».



Но почему же произошла «Черная среда»? Почему Банк Англии не обесценил фунт стерлинга на день раньше, чтобы предотвратить убытки?

Для инвестора лучше всего быть непредсказуемым, чтобы нельзя было спрогнозировать, когда выгоднее всего начать спекулятивную атаку. Если бы центральный банк мог предсказать атаку, он бы заранее обесценил валюту, чтобы избежать убытков. И тогда спекулянты не успели бы воспользоваться девальвацией.



В игре «Валютная спекуляция» нет равновесия Нэша в чистых стратегиях. Точно так же как и в «Камень, ножницы, бумага», единственным равновесием остается равновесие в смешанных стратегиях. Спекулянты наугад выбирают время атаки, с тем чтобы центральный банк не мог предсказать точную дату спекулятивной атаки. Именно поэтому Банк Англии был не в состоянии предотвратить события «Черной среды».


Игра «Кто первый струсит»

Равновесие Нэша в смешанных стратегиях может интуитивно казаться более выгодным в ситуациях, когда не существует равновесия Нэша в чистых стратегиях, потому что игроки решают вести себя непредсказуемо. Равновесие Нэша в смешанных стратегиях также интересно исследовать в положениях с множеством равновесий Нэша в чистых стратегиях, при которых каждый игрок предпочитает отличный от чужого равновесный исход.

Классическим примером этого является игра «Кто первый струсит»: два подростка едут в автомобилях навстречу друг другу. Они хотят проверить себя на смелость и определить, кто сможет дольше ехать в прямом направлении. Здесь имеется равновесие Нэша в чистых стратегиях, при котором один подросток продолжает ехать прямо, а другой сворачивает в сторону, а также есть другое равновесие, при котором они меняются ролями. Естественно, для каждого юноши предпочтителен исход, при котором он оказывается смельчаком, а другой – трусом.



Игра «Кто первый струсит» интересна оттого, что, если ни один из водителей не свернет, аварии будет не миновать. Тем не менее авария не является возможным равновесным исходом, если мы рассматриваем лишь равновесие Нэша в чистых стратегиях. Очевидно, если один водитель продолжает ехать по прямой, наилучшим ответом другого будет свернуть в сторону и избежать столкновения.

Чтобы передать увлекательность этой игры, нам необходимо рассмотреть равновесие Нэша в смешанных стратегиях, когда оба игрока наугад выбирают свою линию поведения. В равновесии Нэша в смешанных стратегиях лобовое столкновение – один из возможных исходов.


«Игра навылет»

«Игра навылет» – это пример применения «Кто первый струсит» в экономике. Эта игра наглядно иллюстрирует, как можно найти равновесные вероятности в равновесии Нэша в смешанных стратегиях.

В Смолвилле два продуктовых магазина: Kalemart и Radish. Недавно население этого города сильно уменьшилось. Теперь Смолвилль слишком мал, чтобы оба магазина могли продолжить успешно работать. Тем не менее один магазин сможет вести выгодную торговлю, только если второй закроется. Соответственно, каждый владелец предпочел бы наслаждаться продуктовой монополией в Смолвилле, пока другой покидает рынок.



Эта матрица демонстрирует, какими будут прибыль и убытки Kalemart и Radish при каждом возможном исходе. Если и Kalemart (К), и Radish (R) продолжат работать в городе, то оба магазина понесут убытки (К – 20, R – 50). Эти условные цифры используются для примерной демонстрации более реальных сумм, типа 20 000 фунтов стерлингов и 50 000 фунтов стерлингов. Если оба магазина закроются, то оба не получат никакой прибыли.

Если Kalemart продолжит работать, а Radish закроется, то Kalemart получит выигрыш в размере 80 (К:80), а выигрыш Radish составит 0 (R:0). Если Radish останется в Смолвилле и получит монополию, то он получит выигрыш в размере 100 (R:100), а выигрыш Kalemart будет равен 0 (К:0).



Неудивительно, что компании конфликтуют из-за их положения в Смолвилле, ведь каждая предпочла бы быть единственной в городе. Равновесие Нэша в смешанных стратегиях отражает этот конфликт. Ни один из магазинов не желает сдаваться, точно так же как ни один из подростков не хотел проиграть спор в «Кто первый струсит». И точно так же как в «Кто первый струсит», где любой юноша имел возможность показать свою смелость, в «Игре навылет» каждый магазин продолжает работать с некоторой вероятностью, но без абсолютной уверенности.



Чтобы решить вопрос вероятностей в равновесии Нэша в смешанных стратегиях, необходимо понять, что управление магазина будет принимать случайное решение, только если оно индифферентно к последующей судьбе этого магазина. А индифферентным управление магазина может быть, только если ожидаемая прибыль от работы равна ожидаемой прибыли от прекращения работы.

Если ожидаемая прибыль от одного действия выше, чем от другого, то управление магазина предпочло бы первое действие, и этот выбор был бы сделан с уверенностью. В равновесии случайный выбор и, соответственно, неуверенность в действиях имеют место, только если управление магазина индифферентно, то есть если ожидаемая прибыль от обоих действий равна.



Если Radish «вылетит», его ожидаемая прибыль составит 0 вне зависимости от действий Kalemart:

С другой стороны, если Radish продолжит работать, его ожидаемая прибыль будет зависеть от вероятности того, что Kalemart останется в Смолвилле. Пусть k будет означать вероятность работы Kalemart.

Если k = 0, то нет никакой вероятности, что Kalemart продолжит работу. А если k = ½, то существует 50 %-ная вероятность, что Kalemart будет работать. Если k = 1, то Kalemart точно продолжает работу в Смолвилле. (1 – k) означает вероятность прекращения работы Kalemart.

Если Radish продолжит работать, он понесет убытки, равные –50, при условии, что Kalemart также продолжает работать, что произойдет с вероятностью k. Radish получит 100, если Kalemart «вылетит», что произойдет с вероятностью (1 – k). Таким образом, для Radish:



«Рэдишу» безразлично, продолжать работу или закрываться, только если его ожидаемая прибыль от этих альтернатив равна:



Чтобы найти равновесную вероятность того, что Kalemart продолжит работать, разрешим эту задачу относительно k и получим, что k= ⅔.



Равновесная вероятность того, что Radish продолжит работать, равно ⅘. Это можно рассчитать, пытаясь найти такую вероятность, с которой Kalemart будет безразлично – работать или закрываться.

Если Kalemart продолжает работать, он понесет убытки в размере –20, при условии, что Radish работает, что произойдет с вероятностью ⅘. Kalemart получит прибыль в размере 80, если Radish «вылетит», что произойдет с вероятностью ⅕. Для Kalemart в равновесной ситуации ожидаемая прибыль от прекращения работы (равная нулю) равна ожидаемой прибыли от работы.



В равновесной ситуации Kalemart продолжил бы работу с вероятностью ⅔, а Radish остался бы с вероятностью ⅘, поэтому мы можем рассчитать вероятность каждого возможного исхода.

Вероятность того, что оба магазина закроются, равна 1/15, то есть мы умножаем вероятность того, что Kalemart закроется, на вероятность прекращения работы Radish: (1/3)*(1/5)=1/15.

Вероятность того, что оба магазина продолжат работу, равна 8/15, то есть мы умножаем вероятность того, что Kalemart продолжит работать, на вероятность работы Radish: (2/3)*(4/5)=8/15. В этом случае оба магазина несут убытки. Этот исход похож на один из возможных исходов в «Кто первый струсит», где оба подростка демонстрируют свою смелость и погибают в аварии.



Вероятность того, что Kalemart в конце концов останется единственным магазином в городе, или того, что Radish создаст продуктовую монополию, можно рассчитать этим же способом.

Также возможно смоделировать другую версию «Игры навылет», в которой оба игрока продолжают работать, у них есть возможность закрыть магазин попозже. В этом случае их конфликт продлится еще дольше, а их убытки будут расти. Это явление известно под названием война на истощение. Этот термин был заимствован из военного лексикона. В подобных играх могут происходить затяжные, изматывающие конфликты, даже если выигрыш на самом деле совсем незначителен по сравнению со всеми потерями и убытками.


«За» и «против» смешанных стратегий

Из всех тем в теории игр равновесие Нэша в смешанных стратегиях, наверное, вызывает наибольшие разногласия. Сторонники смешанных стратегий подчеркивают, что многие игры, например «Камень, ножницы, бумага» или «Валютная спекуляция», не имеют равновесия Нэша в чистых стратегиях, но в них наблюдается очень интересное равновесие Нэша в смешанных стратегиях. Они также утверждают, что даже в таких играх, как «Кто первый струсит» или «Игра навылет», в которых есть равновесие Нэша в чистых стратегиях, это равновесие зачастую является полностью интуитивным, так как оно выявляет неуверенность игроков.

Тем не менее оппоненты смешанных стратегий заявляют, что случайный выбор не является разумным человеческим поведением. Неужели люди принимают решения наугад? И в связи с тем, что при равновесии участники индифферентны, что мотивирует их выбирать как раз те вероятности, которые подталкивают других игроков к индифферентности?



Одним из защитников смешанных стратегий был американо-венгерский экономист Янош Харсаньи (1920–2000), который ввел понятие «очищение». В 1994 году он разделил Нобелевскую премию по экономике с Джоном Нэшем и немецким экономистом Рейнхардом Зельтеном (род. в 1930 г.).

Янош Харсаньи утверждал, что даже если игроки выбирают чистые стратегии, если присутствует даже малейшее сомнение в выигрышах друг друга, со стороны будет казаться, что они делают случайные выборы.



Знаменитое «очищение» Яноша Харсаньи доказывает, что если игроки почти, но не полностью уверены в выигрышах других участников, то отдельному игроку может показаться, что вероятность выбора другим игроком определенной линии поведения точно равна той вероятности, с которой мы имеем дело в равновесиях Нэша в смешанных стратегиях без неуверенности о чужих выигрышах.

Это значит, что равновесие Нэша в смешанных стратегиях относительно, даже если вы не верите, что людям свойственно принимать решения наугад.


«Уклонение от уплаты налогов»

Одним из примеров равновесия Нэша в смешанных стратегиях являются игроки, которые случайным образом выбирают свои возможные действия. Еще одним примером можно назвать некоторую неуверенность о выигрышах других игроков. Игра под названием «Уклонение от уплаты налогов», в которой взаимодействуют налогоплательщики и налоговая служба, может служить третьим примером.

Представьте ситуацию: женщина, владелица предприятия, должна заполнить налоговую декларацию. Для простоты допустим, что у нее есть два варианта: действовать согласно букве закона или уклоняться от уплаты налогов. Предположим, что с нравственной точки зрения уклонение от уплаты налогов нормально.



Налоговая служба, естественно, может поймать «уклониста», но аудит – это дорогостоящая процедура. Однако в аудите нет нужды, если налогоплательщик не уклоняется от уплаты налогов.

В этой игре нет равновесия Нэша в чистых стратегиях.

Налогоплательщик, несомненно, будет действовать в рамках закона, если точно знает, что его будут проверять. Тут не может быть равновесия Нэша: если налогоплательщик точно будет уплачивать налоги, государству нет нужды проводить аудит.

Налогоплательщик, несомненно, будет избегать уплаты налогов, если уверен, что аудит проводить не будут. Очевидно, что эта ситуация также неравновесна: если налогоплательщик уклоняется, то налоговой службе лучше провести аудит.

Единственное равновесие в этой ситуации – в смешанных стратегиях: налогоплательщики делают случайный выбор между законной деятельностью и уклонением, а налоговая служба наугад выбирает, стоит проводить аудит или нет.



Если в игру «Уклонение от уплаты налогов» играют многие граждане, то значительной альтернативной интерпретацией равновесия Нэша в смешанных стратегиях будет то, что каждый отдельный гражданин выбирает чистую стратегию: он либо «подчиняется закону», либо «уклоняется». Однако равновесие Нэша в смешанных стратегиях формирует вероятность, которая образует часть граждан, выбирающих чистую стратегию «подчиняться закону», и часть граждан, выбирающих чистую стратегию «уклоняться». Налоговому инспектору известно соотношение уклонистов и законопослушных налогоплательщиков, однако он не знает, кто из граждан к какой группе относится.


Повторяющееся взаимодействие

В 1883 году французский экономист Жозеф Луи Франсуа Бертран (1822–1900) изучал ценовую конкуренцию между несколькими фирмами, продававшими одну и ту же продукцию. Те стимулы, с которыми сталкиваются эти фирмы, схожи со стимулами заключенных в «Дилемме заключенных».



Бертран предсказал, что в равновесии фирмы будут продавать товар по более низкой цене, чем соперник, что похоже на исход {признание, признание} в «Дилемме заключенных». Несмотря на это предсказание, на рынках с небольшим количеством компаний часто можно заметить цены, основанные на сговоре. Большинство западных демократий обладают так называемым «антитрестовским» законодательством для предотвращения подобного сговора (кооперации нескольких фирм) и содействия конкуренции.

Чтобы понять, как игроки сговариваются в ситуациях вроде «Дилеммы заключенных», нам необходимо уйти от однократных игр (в которых участники играют один раз и затем игра кончается) и начать размышлять о более реалистичных сценариях повторяющегося взаимодействия, при котором участники играют в одну игру снова и снова.



Заметили бы мы равновесную кооперацию в «Дилемме заключенных», если бы игроки снова и снова взаимодействовали?

Представьте, что оба игрока знают, что они будут играть в «Дилемму заключенных» не один раз, а два. Чтобы найти равновесие в игре с повторяющимся взаимодействием, нам сначала необходимо предсказать равновесие, которое сформируется в последнем туре. А затем мы размышляли бы о том, каким будет равновесие в первом туре. Такая схема размышления называется обратной индукцией.


В конце игры

Во время второго раунда игроки понимают, что это последний раунд, поэтому нет больше необходимости пытаться изменить потенциальный исход. Соответственно, последний тур игры представляет собой однократную «Дилемму заключенных»: все сотрудничество отменяется.

Игроки могут рассудить, что во втором туре никто не будет сотрудничать вне зависимости от событий первого раунда. Таким образом, с точки зрения игрока первый тур игры также ничем не отличается от однократной «Дилеммы заключенных». Так что в равновесной ситуации ни на одной стадии игры никто не будет сотрудничать.

В действительности, даже если «Дилемму заключенных» повторять на протяжении многих раундов, мы никогда бы не увидели кооперации ни на одном из уровней, до тех пор пока у игры есть определенный финальный тур, так как обратная индукция разбирает игру с последнего раунда.


Что, если определенного последнего тура нет?

Роберт Джон Ауманн, израильский математик (род. в 1930 г.), в 2005 году разделивший Нобелевскую премию по экономике с Томасом Шеллингом, занимался изучением кооперации как равновесного исхода в случае, когда у игры бесконечный горизонт, то есть игра может повторяться вечно. При таком горизонте обратная индукция не разбирает кооперацию с последнего тура, ведь определенного последнего тура и не существует.

Первым условием для того, чтобы кооперация стала равновесным исходом, является обязательное наличие в стратегиях игроков элемента наказания за «плохое» поведение в прошлом (то есть за некооперативное поведение). Игроки могут вести себя кооперативно, чтобы избежать наказания в будущем.



В «Дилемме заключенных» с бесконечным горизонтом, то есть когда в игру играют непрерывно, вечно, можно рассмотреть так называемую стратегию вечной кары: сначала игрок действует кооперативно (в зависимости от игры это может оказаться преступник, хранящий молчание, соседка, моющая посуду, или компания, устанавливающая высокую цену по сговору). В последующих турах игрок сотрудничает, только если другой игрок до этого всегда вел себя кооперативно. Однако первый игрок перестает сотрудничать (заключенный признается, соседка перестает мыть посуду, а компания устанавливает более низкую цену), если другой игрок когда-либо в прошлом вел себя некооперативно.



Оба участника, выбирающие стратегию вечной кары, могут формировать равновесие Нэша в повторяющейся игре вроде «Дилеммы заключенных», если они достаточно терпеливы (если они способны не польститься на большой выигрыш сегодня, чтобы получить кооперативный выигрыш в будущем). В этом случае наказание за отступничество может удержать игроков от некооперативного поведения.

Тем не менее, если игроки нетерпеливы, они навряд ли смогут устоять и не предать другого игрока, несмотря на последующее наказание. Понимая это, соперник изначально не станет вступать в кооперацию. Таким образом, сотрудничество с нетерпеливыми игроками не может быть равновесным.



Когда участники терпеливы (из-за угрозы наказания, которое становится сдерживающим средством), угроза должна быть убедительной. Стратегия вечной кары может оказаться не убедительной, если наказывающий участник также не получает большого выигрыша из-за этого наказания. Соответственно, если сговор проваливается, у обоих игроков появляется стимул пересмотреть отношения, не обращать внимания на отклонения и просто начать сговор заново. Однако если игроки ожидают, что им удастся быстро пересмотреть их отношения, то их сговор изначально нельзя назвать устойчивым.



Тем не менее если участники ожидают, что пересмотр займет определенное время, то угроза может возыметь сдерживающее действие, и в конце концов будет сформирован равновесный исход, основанный на сговоре.

Даже если игра не повторяется вечно при условии, что игроки не уверены, когда она кончится, сотрудничество можно поддерживать в равновесии до тех пор, пока они верят, что игра, скорее всего, продолжится в следующем раунде. Тогда появляется вероятность того, что отступление от договоренности будет наказано, а значит, кооперация вне опасности.

Тем не менее, если игра, вероятнее всего, кончится в следующем туре, то игрок будет действовать с выгодой для себя и отступит от договоренности, чтобы в этом туре получить больший выигрыш. Понимая это, и его соперник не будет действовать кооперативно. Сговора в этой ситуации не будет.


Эксперимент с «Дилеммой заключенных»

Одним из отцов-основателей экспериментальной экономики был Рейнхард Зельтен, который в 1994 году разделил Нобелевскую премию по экономике с Джоном Нэшем и Яношем Харсаньи. Зельтен провел эксперимент, в ходе которого участники играли в версию повторяющейся «Дилеммы заключенных» на настоящие деньги. Игроки не знали, сколько раз будет повторяться игра, но знали, что рано или поздно эксперимент подойдет к концу.

Результаты этого эксперимента полностью соответствовали теории игр. Кооперативные исходы наблюдались чаще всего, если игроки чувствовали, что конец игры наступит не скоро. Однако когда время истекало и конец игры приближался, игроки начинали отступать от договоренностей и взаимное сотрудничество рушилось.


Эволюционная теория игр

В большинстве случаев теория игр означает понимание людей, компаний или государств как субъектов, принимающих рациональные решения. Затем она рассматривает решения, которые они принимают во время взаимодействия с теми, кто также принимает рациональные решения.

Однако многие поведенческие экономисты и биологи, такие, например, как британский эволюционный биолог Джон Мейнард Смит (1920–2004) и американский эволюционный биолог Джордж Прайс (1922–1975), смотрели на взаимодействие по-другому. Они считали людей и животных социально или генетически запрограммированными на определенное поведение, которое, возможно, основывается на разуме, а может, и нет.


Игра «Ястребы и голуби»

При исследовании проблем социального и генетического программирования может пригодиться игра «Ястребы и голуби». Она была введена Джоном Мейнардом Смитом и Джорджем Прайсом и по-прежнему широко применяется в эволюционной биологии как стартовая точка размышления о поведенческих шаблонах животных. Игра обращает наше внимание на важность эволюционной стабильности, которая определяет, как поведенческие шаблоны наиболее вероятно обеспечат выживание.

Для простоты в игре условно предполагается, что существует всего два типа животных: «ястреб» и «голубь». «Ястребы» всегда дерутся за приз, будь то возможность спариться с самкой или скудный ресурс. «Голубь» демонстрирует агрессивность, но оказывается не способен на настоящий физический конфликт.



Присваивать потенциальным исходам произвольные числа, обозначающие выигрыши, практически полезно. А эволюционной биологии эти выигрыши иллюстрируют эволюционную приспособленность животного. Победа животного в борьбе за желанную добычу (под добычей можно понимать возможность спариться с самкой или завладеть скудными ресурсами) улучшает выживаемость и способность животного к воспроизводству потомства. Чем выше выигрыш, тем лучше эволюционная приспособленность животного.

Если между нашим условным «ястребом» и «голубем» завяжется конфликт, то «голубь» будет отступать и его выигрыш составит ноль, а «ястреб» получит выигрыш в размере 20, что равно ценности добычи.

Если оба животных «голуби», то у них равные возможности завладеть добычей. Так что вероятность победы каждого составляет 50 %, а ожидаемый выигрыш – 10 (20/2).



Если оба животных «ястребы», то между ними завяжется физический конфликт. Вероятность победы каждого животного составляет ½, а ценность добычи также равна 20. Побежденное животное получает увечья, его эволюционная приспособленность в этом случае равна – С. Таким образом, ожидаемые выигрыши каждого животного составят:



Эти потенциальные исходы можно записать в форме матрицы:


«Ястребы и голуби» с меньшей ценой конфликта

Давайте рассмотрим эту игру, когда цена конфликта меньше ценности добычи – предположим, что цена конфликта (С) равна 8.



Если животные выбирали бы свою линию поведения рационально, то поведение «ястреба» было бы доминирующей стратегией, так как вне зависимости от действий противника всегда лучше выбрать тактику «ястреба».



Предположим, что существует крупная популяция животных, из которых некоторые генетически или социально запрограммированы на поведение «ястреба», а некоторые – на поведение «голубя». Затем отдельные животные случайным образом распределяются по парам для проведения игры.

Животное, запрограммированное на поведение «голубя», ничего не выиграет, если в пару к нему поставят «ястреба», а в паре с другим «голубем» выиграет 10.

Животное, запрограммированное на поведение «ястреба», в паре с другим «ястребом» выиграет 6, а в борьбе против «голубя» – 20.

Когда цена конфликта меньше ценности добычи, животные, отличающиеся агрессивным поведением, показывают лучшие результаты по сравнению с менее агрессивными животными, вне зависимости от того, в паре с кем они находятся.



Игра «Ястребы и голуби» позволяет заглянуть в глубь эволюции видов. Победа в схватке и получение желанной добычи увеличивают возможности репродукции и выживания, а поражение эти возможности уменьшает. Животные, лучше приспособленные (имеющие более высокие выигрыши), имеют больше шансов на выживание и произведение потомства.



Силы эволюции подавляют «голубиное» поведение. Когда выживают только «ястребы», возможность конфликта слишком высока. Каждое животное получает выигрыш в размере 6. Если бы вместо этого животные вели себя как «голуби», каждый выиграл бы 10. Так что поведение «ястреба» не является оптимальным для всего вида животных.

Не всегда силы эволюции приводят к исходам, оптимальным для животных. Конкуренция за скудные ресурсы часто означает, что личная выгода и коллективная выгода противопоставлены друг другу. Когда так происходит, животные будут эволюционировать, чтобы увеличить личную выгоду ценой выгоды коллективной.



Противостояние коллективной выгоды и личной присутствует как в физических чертах, так и в поведенческих шаблонах. Те же эволюционные силы могут повлиять на процесс эволюции физических черт. Примером тому служит правило Коупа, названное в честь американского палеонтолога Эдварда Дринкера Коупа (1840–1997), которое гласит, что в ходе эволюции вид животных обычно становится крупнее.



Ограничением этого эволюционного процесса можно назвать увеличение размера конкурирующих видов, которые борются за те же экологические ресурсы: если один вид становится непроизводительным в силу большого размера, то через какое-то время его вытеснит более производительный конкурент.

Однако затем этот цикл может повториться, новый вид столкнется с противостоянием коллективной выгоды и личной, что впоследствии приведет к меньшей производительности.

«Ястребы и голуби» с большей ценой конфликта

Процессы эволюции еще интересней в ситуациях, где цена конфликта (С) очень высока по сравнению с ценностью желанной добычи. Предположим, что С = 24, а ценность добычи по-прежнему равна 20.



Высокая цена поражения в схватке значительно изменяет способность животного с поведением «ястреба» к выживанию и произведению потомства.

Предположим, что изначально часть популяции, условно названная «p», была запрограммирована на очень агрессивное поведение «ястреба». Оставшаяся часть популяции «(1-р)» перенимает линию поведения «голубя». Часть популяции «р» может опускаться до нуля (все животные в этой популяции – «голуби») или подниматься до единицы (все животные в этой популяции – «ястребы»).

«Голубь» ни за что не ввяжется в схватку с большой ценой, это та же самая ситуация, что и в случае с меньшей ценой конфликта. Однако было бы полезно более детально рассмотреть его ожидаемую эволюционную приспособленность.

«Голубь» вступает в схватку со случайным членом популяции. Это животное окажется «ястребом» с вероятностью «р». В этом случае противник получит добычу, а «голубь» не выиграет ничего.

Однако это животное может оказаться тоже «голубем», вероятность этого равна (1-р). В этом случае не будет физической схватки, и у животных будут равные шансы на победу. «Голубь» получает выигрыш в размере 10.



Таким образом ожидаемая эволюционная приспособленность «голубя» равняется сумме вероятности встречи с каждым из двух противников, умноженная на выигрыш в случае встречи:



Рассмотрим ситуацию с «ястребом»: это животное вступает в агрессивную схватку без страха за свою безопасность.

Вероятность того, что «ястреб» будет бороться с другим «ястребом», равна «р». Цена конфликта так высока, что перевешивает выгоду от желанной добычи, поэтому оба животных получат выигрыш в размере –2.

Вероятность того, что «ястреб» окажется в паре с «голубем», равна (1-р). Этот противник не станет вступать в схватку с агрессивным «ястребом», так что «голубь» получает весь выигрыш без физического боя и его выигрыш составляет 20.



Таким образом, ожидаемая эволюционная приспособленность «ястреба» равняется сумме вероятности встречи с каждым из двух противников, умноженная на выигрыш в случае встречи:




С помощью расчетов, приведенных на последних двух страницах, можно сказать, что ожидаемая эволюционная приспособленность «ястреба» выше, чем у «голубя», если:

20 – 22р > 10 – 10р

или

10 > 12 р

->

10/12 > р

->

5/6 > p

Если часть популяции, запрограммированная на поведение «ястреба» (р), меньше ⅚, то вероятность встречи двух «ястребов» и их схватки настолько мала, что ее перевешивает выгода от получения всего выигрыша при встрече с «голубем». Таким образом, со временем часть популяции «ястребов» (р) увеличится благодаря силам эволюции.

Если особей с поведением «ястреба» в популяции больше ⅚ (то есть, если р > ⅚), то «голуби» будут выживать и размножаться в больших количествах, чем «ястребы», так что часть популяции, запрограммированная на поведение «ястребов», (р) уменьшится.



В долгосрочной перспективе силы эволюции спровоцируют изменение в количестве особей каждого типа. Численность «ястребов» будет стремиться к ⅚ от всей популяции, а «голубей» – к ⅙. Мы имеем дело с такими точными пропорциями благодаря числам, которые мы указывали в платежной матрице. Однако как только цена конфликта станет выше ценности желанной добычи, эволюционные силы внесут свои коррективы в популяцию и заставят «голубей» и «ястребов» сосуществовать.

В долгосрочной перспективе «ястребы» и «голуби» будут сосуществовать в рамках одной популяции в соотношении 5 к 1, при этом оба вида в среднем будут нормально функционировать. При столкновении с «голубями» «ястребы» будут присваивать все ресурсы, но возможность серьезных увечий для них будет очень высока при схватке с другими «ястребами». «Голуби» не смогут удержать ресурсы, когда окажутся в паре с «ястребами», но никогда не пострадают в бою.

Такое долгосрочное эволюционное «устойчивое состояние», при котором количество «ястребов» в популяции равно ⅚, называется эволюционно стабильным равновесием. Это такое равновесие, которое сохраняет свою стабильность, даже если мы добавляем к одной группе животных некое количество особей, запрограммированных по-другому, в силу того, что эволюционные силы рано или поздно восстанавливают равновесие.



Вообще в эволюционных играх может быть множество исходов. В «Ястребах и голубях» наблюдается единственное эволюционно стабильное равновесие, а долгосрочное устойчивое состояние рано или поздно будет восстановлено, вне зависимости от того, сколько запрограммированных по-другому особей мы добавим.

Однако в некоторых играх возможно более чем одно эволюционно стабильное равновесие. В таких играх силы эволюции восстановят пропорции равновесия, если наблюдаются незначительные изменения в популяции. Но крупные изменения в составе популяции могут повлечь за собой совсем иное равновесие.



Некоторые игры вообще не имеют эволюционно стабильного равновесия. В таких играх популяция никогда не добьется стабильного устойчивого состояния. Наоборот, она окажется под влиянием цикличных изменений, при которых группы различных видов животных будут бесконечно то увеличиваться, то уменьшаться.

Эволюционная стабильность как усовершенствование равновесия

Интересно то, что эволюционно стабильное соотношение «ястребов» к остальной популяции (⅚) также было бы равно равновесной вероятности в равновесии Нэша в смешанных стратегиях, если бы животные выбирали стратегии рационально. И это не совпадение. Чтобы рассчитать равновесные вероятности в равновесии Нэша в смешанных стратегиях, мы должны найти такие вероятности, при которых игрокам безразлично, что выбрать – линию поведения «ястреба» или «голубя». В равновесии ожидаемые ценности обеих стратегий равны.

В «Ястребах и голубях» мы имеем дело с таким же уровнем ожидаемой эволюционной приспособленности обоих видов животных в эволюционно стабильных равновесных соотношениях. Если бы их приспособленность различалась, силам эволюции пришлось бы выделить один вид животных, существование которого было бы намного более благоприятным, чем у другого, вплоть до момента, когда было бы достигнуто устойчивое состояние.



В «Ястребах и голубях» эволюционно стабильное равновесие создает соотношение «ястребов» и «голубей» в рамках популяции, что похоже на интерпретацию равновесия Нэша в смешанных стратегиях в игре «Уклонение от уплаты налогов». В том случае равновесие создавало соотношение уклонистов и законопослушных налогоплательщиков, а решения, которые принимали игроки, были рациональными.

Когда речь идет об эволюции, концентрация на эволюционно стабильном равновесии разумна, так как она позволяет исключить равновесие, которое не выдержало бы и малейших изменений в популяции.


Игры с последовательными ходами

Часто так случается, что игроки могут проследить действия своих оппонентов перед принятием собственного решения. В некоторых играх существует порядок, в котором участники делают ходы. Они называются играми с последовательными ходами. В большинстве настольных игр, вроде шахмат, игроки совершают ходы последовательно, один за другим.

К примеру, предприниматель размышляет, стоит ей открывать кафе на определенном перекрестке или нет. При этом она может учитывать, какие магазины уже открыты поблизости, а также попробует предугадать, какие еще магазины появятся там в будущем, если она все-таки откроет там кафе.



Игры с последовательными ходами динамичны, то есть игроки могут принимать свои решения, базируясь на изучении предыдущих действий соперников и на ожиданиях их будущих действий. Участники пытаются предугадать, что их оппоненты предпримут в ответ на их возможные действия, и затем, разворачивая эту цепочку с конца, принимают решение.


Динамичная версия игры «Битва полов»

Мы можем рассмотреть трудности, которые возникают в играх с последовательными ходами, с помощью динамичной версии игры с одновременными ходами. Тут нам пригодится «Битва полов».

В обычной «Битве полов» Боб и Эми должны принять решение о планах на вечер поодиночке и одновременно. Они хотят провести вечер вместе, но им нравятся разные занятия. Помните стратегическую форму первой «Битвы полов»?



А теперь давайте немного изменим их историю. Предположим, что рабочий день Эми заканчивается на час раньше рабочего дня Боба. Она идет к месту проведения одного из занятий и звонит Бобу, чтобы сообщить, где находится. Как только она позвонила ему, у нее больше нет возможности поменять свое местоположение, но Боб пока может пойти на стадион или в танцевальный класс.


Расширенная форма игры

Эми делает первый ход, а Боб ходит вторым и учитывает выбор Эми. Нам больше ни к чему стратегическая форма игры, ведь она нужна была нам, когда игроки делали одновременные ходы, а стратегическая форма не фиксирует порядок принятия решений. Тут нам пригодится новая диаграмма, которая послужит иллюстрацией игры с последовательными ходами: представление расширенной формы, также известное как игровое дерево.



Расширенная форма вводит порядок возможных выборов с помощью точек принятия решения (то есть точек, которые указывают момент принятия решения).



Когда Эми принимает свое решение, она знает, что Боб проследит ее выбор до принятия своего решения. Она также знает, что ее выбор повлияет на его выбор. Поэтому она постарается предугадать, как он отреагирует на каждый из ее возможных выборов.

Равновесие, совершенное по под-играм

Если бы Эми позвонила Бобу с футбольного стадиона, то для Боба имела бы значение лишь левая нижняя ветвь дерева. Так что мы может рассмотреть игру саму по себе с этой точки, которая называется «под-игра». Начиная с этого момента, Боб просто будет стараться сделать все от него зависящее.



Эми также попробует предугадать, как поступит Боб, если она решит пойти на танцы. Если она позвонит Бобу из танцевального класса, Бобу пришлось бы играть в другую под-игру (правая ветвь расширенной формы).



Динамическая игра Эми и Боба может быть разрешена с помощью обратной индукции. Эми предугадывает, что произойдет в конце игры, и распутывает всю игровую цепочку оттуда, пытаясь понять, каким будет ее оптимальный выбор.

С точки зрения Эми было бы рациональным пойти танцевать, так как она знает, что Боб присоединится к ней. Это равновесие, совершенное по под-играм: игроки делают оптимальные для них обоих выборы в каждой под-игре изначальной игры. Равновесие, совершенное по под-играм, означает, что игроки концентрируются на будущем. На каждой точке принятия решения они делают все возможное, не тая обид за прошлые действия.

В этой игре равновесие, совершенное по под-играм, особенно выгодно для Эми. Здесь проявляется преимущество первого хода.



Однако не все игры с последовательными ходами имеют такую черту, как преимущество первого хода. Существует множество игр, в которых первый ход ставит игрока в сложное положение.

Недостоверные угрозы

Большинство людей считают, что равновесие Нэша, совершенное по под-играм, при котором оба участника идут на урок танцев, это самое вероятное равновесие, однако существуют и другие равновесия.

К примеру, Боб мог заявить, что он всегда будет ходить на футбол, вне зависимости от того, чего хочет Эми. Если Эми верит этому, то она будет ожидать провести этот вечер в одиночестве, если выберет урок танцев. Поэтому она тоже пойдет на футбол, ведь быть с Бобом ей нравится больше, чем быть одной. Это тоже равновесие Нэша, но оно основывается на вере Эми в то, что Боб действительно пойдет на футбол, даже если она позвонит ему из класса. Это не входит в интересы Боба, поэтому его угроза недостоверна.

Равновесие, совершенное по под-играм, не обращает внимания на равновесия Нэша, которые зависят от недостоверных угроз или обещаний.


Рынки кредитования

Взаимодействие между кредиторами и заемщиками могут быть смоделированы в виде игры с последовательными действиями. Это может быть полезно при анализе причин того, почему многообещающие проекты не получают финансирования.

Расширенная форма игры моделирует ожидаемые выигрыши (прибыль в миллионах фунтов) для потенциального заемщика (А) и банка (Б). Для упрощения предположим, что банк и заемщик прекрасно понимают, как работают игровое дерево и ожидаемые выигрыши.



У заемщика есть выбор: инвестировать в надежный или в ненадежный проект, но это будет возможно, только если кредит будет одобрен банком.



Банк предпочел бы, чтобы заемщик инвестировал в надежные проекты. Тем не менее он не может отслеживать ежедневную деятельность заемщика. Значит, он не может указывать, в какой проект можно инвестировать, а в какой нет. В равновесии, совершенном по под-играм, банковский работник отказывает заемщику в кредите, хотя и банк, и сам заемщик извлекли бы значительную выгоду из прибыльного надежного проекта.



Заемщик может пообещать работнику банка, что будет вкладывать средства в надежный проект. И он даже может говорит от чистого сердца, ведь в случае отклонения заявки его выигрыш составит ноль, но если кредит будет одобрен, получит выигрыш, равный 1 миллиону фунтов.

Тем не менее если бы банк одобрил этот кредит, то, как только заемщик получил бы деньги, он бы стал сравнивать ожидаемый выигрыш от надежного проекта с ожидаемым выигрышем от рискованного проекта. Так, он бы выбрал рискованный проект и тем самым нарушил бы свое обещание. Такой случай носит название «проблема несогласованности во времени»: человек, принимающий решение, не может не отступить от изначального плана действий.



Равновесие, совершенное по под-играм, при котором банк отклоняет заявку на кредит, не эффективно по Парето. И банковский работник, и заемщик извлекли бы большую выгоду, если бы в надежный проект были вложены средства.

Что, если бы заемщик смог убедить банк вложить средства в проекты, заслуживающие доверия, а они не стоили бы того? В этом случае заемщик решит не учавстовать.

На финансовых рынках часто используют залог как метод самоограничения. К примеру, заемщик может использовать свой дом как залог. Потерять свой дом для заемщика было бы достаточно неприятно (как с материальной, так и с моральной точки зрения), поэтому для заемщика залог изменяет ожидаемый выигрыш от рискованного проекта. Таким образом, он выбрал бы вкладывать деньги в надежный проект, а банк в свою очередь одобрил бы этот кредит.


Микрокредитование

Если потенциальные заемщики могут предоставить залог, чтобы подтвердить свою заинтересованность в надежном проекте, они получают доступ к рынкам кредитования и таким образом могут финансировать свои проекты. Тем не менее те, у кого нет никакого имущества, которое можно было бы использовать в качестве залога, получат отказ в кредите в равновесии, совершенном по под-играм в связи с проблемой несогласованности во времени.

Не так-то просто понять, что может сыграть роль средства самоограничения, поэтому бедняки остаются бедняками, а богачи становятся еще богаче. Отсутствие доступа к рынкам кредитования не позволяет бедным людям быть вертикально мобильными, что может спровоцировать ожесточенные общественные беспорядки.

Бангладешский экономист Мухаммад Юнус (род. в 1940 г.) в 2006 году получил Нобелевскую премию за свою версию решения этой проблемы: он основал Grameen Bank и стал пионером концепции микрокредитования, нацеленного на предоставление бедным людям доступа к финансовым рынкам.



Чтобы предоставить людям доступ к рынкам кредитования, Юнус предлагает решить проблему отсутствия средства сдерживания с помощью группового микрокредитования – кредиты предоставляются объединенной группе людей, а не одному человеку. Каждый заемщик в этой группе должен удостовериться, что другие члены группы вкладывают средства в надежные проекты.


Ядерное сдерживание

Со времен Второй мировой войны две величайшие ядерные державы – США и Россия – практиковали ядерное сдерживание, основанное на взаимной угрозе применения ядерного оружия. Суть в том, что если она из сторон нападет, другая сможет отомстить волной поражающего ядерного взрыва и тем самым сотрет с лица земли агрессора. Соответственно – понятно, почему ни одна из сторон не нападает.

До сих пор в мире не было ни одной глобальной ядерной войны, так что можно сказать, что эта политика удачна. Однако некоторые ученые считают, что желаемое равновесие может не оказаться совершенным по под-играм. Оно может основываться на недостоверных угрозах, и тогда в будущем нас могут ожидать серьезные проблемы.



Стратегия взаимной угрозы применения ядерного оружия основана на идее о том, что если вражеские ракеты окажутся на территории чужого государства, то правительство этого государства обязательно отомстит, уничтожив агрессора. Тем не менее месть не меняет ситуацию в стране, являющейся целью ракет: ее судьба уже предрешена поступающими ракетами.



Можно почти гарантировать, что глава атакованного государства захочет отомстить. Тогда ответный удар будет наилучшим выбором в этой под-игре, когда принимается решение о контратаке. Если так и произойдет и неприятелю об этом будет известно, то желаемое равновесие, при котором изначально не было никакой ракетной атаки, является совершенным по под-играм. Ядерной войны не будет.




Тем не менее человек, который решает, мстить или не мстить, может не хотеть жертвовать миллионами граждан. В конце концов, когда ракеты противника в воздухе, местью уже никого не спасти. Таким образом, в под-игре ответного удара человек с четкими нравственными устоями решит не совершать контратаки.

В этом случае угроза мести недостоверна. Желаемое равновесие, при котором изначально никто ни на кого не нападает, не является совершенным по под-играм. Нет никакой причины не запускать ракеты, если атакованное государство не будет наносить ответный удар.



Если правительство страны имеет четкие моральные устои и не желает убивать миллионы ни в чем не виновных людей, то как избежать нападения на свою страну?

Возможным решением может стать делегирование решения об ответном ударе тому, кто может быть мотивирован мстить или должен следовать установленной процедуре. Так государство сможет гарантировать достоверность угрозы ответного удара.



Сделать угрозу ответного удара достоверной можно, передав нескольким отдельным людям возможность начать контратаку, это так называемое наращивание. Таким образом, если неприятель начнет задумывать атаку, он должен определить вероятность того, что хотя бы один из этих людей мотивирован мстить. Чем больше людей, у которых есть возможность начать ответный удар, тем выше вероятность, что это правда произойдет. Если ответный удар может произойти, то атаки не будет с самого начала.



На практике и делегирование, и наращивание используются ради большей достоверности угрозы ответного удара. Соответственно, благодаря им в равновесии, совершенном по под-играм, атак и не происходит.

У Голливуда есть третий вариант решения этой проблемы: принятие решения о нанесении контратаки можно передать машинам, что означает полную гарантию контратаки. В кино эта роль отдана «Машине Судного дня» в фильме «Доктор Стрейнджлав, или Как я перестал бояться и полюбил бомбу», интеллектуальной системе WOPR в «Военных играх» и суперкомпьютеру «Скайнет» в «Терминаторе».

Неизвестно, насколько такой подход применяется в реальности. Тем не менее, как говорится в фильме «Доктор Стрейнджлав, или Как я перестал бояться и полюбил бомбу», «Машина Судного дня» может пригодиться лишь как сдерживающий элемент, если потенциальный противник знает о ее существовании. А если появляется необходимость в ее применении, значит, она уже не оправдала себя. Соответственно, незачем держать в секрете такое устройство. Наоборот, нужно стараться дать всем о нем знать. Таким образом, мы можем быть уверены, что сверхдержавы еще не дошли до подобных средств.


Информационные проблемы

В играх расширенной формы, которые мы обсуждали недавно, игроки полностью осознают игровое дерево. Тем не менее часто так случается, что игроки владеют лишь неполной информацией: им не известны все возможные стратегии противника или его выигрыши. Игроки могут быть не уверены в человеке, с которым играют, или могут не понимать его мотивации.



Бывают и такие ситуации, в которых игроки владеют несовершенной информацией о игровом дереве: предыдущие действия игроков могут быть ненаблюдаемы или несовершенно наблюдаемы. Это означает, что игроки не могут быть уверены насчет того, на какой точке принятия решения они сейчас находятся.



Каждому человеку порой приходится принимать решения, основываясь на неполной или несовершенной информации, а иногда эти два типа могут накладываться друг на друга. Это имеет важное значение при стратегическом взаимодействии между игроками, особенно если одна из сторон осведомлена лучше другой.

Асимметричная информация

Американские экономисты Джордж Акерлоф (род. в 1940 г.), Майкл Спенс (род. в 1943 г.) и Джозеф Стиглиц (род. в 1943 г.) в 2001 году были награждены Нобелевской премией за анализ рынков с асимметричной информацией: один игрок обладает более полной информацией, чем другие.

К примеру, водитель, желающий купить страховку, владеет частной информацией о его собственных водительских привычках. Страховая компания обладает неполной информацией: работникам не известны его водительские привычки, поэтому она не знает, какие выигрыши она получит от продажи страховки этому водителю.

Менеджер в компании может обладать несовершенной информацией о привычках своих подчиненных. Если работник не сможет успешно выполнить определенную задачу, то менеджер не будет знать, стоит ли ему винить в неудаче починенного или тут все дело в слишком сложной задаче.


Асимметричная информация и безработица

Макроэкономисты, исследующие экономику как целое, ее шаблоны и эффекты, часто рассматривают проблему постоянной безработицы, ситуации, при которой люди стремятся работать, но не могут найти работу.

Постоянная безработица представляет собой головоломку для стандартного экономического анализа: если существует безработица, значит, на каждую вакансию есть слишком много претендентов. В этом случае фирмы могут предложить людям низкую зарплату, и при этом все равно всем не хватит работы. При низкой зарплате прием на работу также дешевеет, поэтому фирмы имеют возможность нанимать больше работников. Похоже, зарплата должна рано или поздно настолько понизиться, что количество людей, желающих работать, будет равно количеству рабочих мест.



Нобелевский лауреат Джозеф Стиглиц и американский экономист Карл Шапиро (род. в 1955 г.) доказали, что одной из причин постоянной безработицы в экономике является скрытое действие на рабочем месте – там, где действия работников неполностью наблюдаемы.

Представим работника с фиксированной зарплатой. Он может прикладывать все свои усилия, а может лениться и уклоняться от работы. Его усилия нельзя полностью наблюдать. Начальник уволит подчиненного, который увиливает от своих обязанностей, но начальник не может полностью контролировать работника, поэтому у него далеко не всегда получится поймать ленивого подчиненного.



Когда работник решает, будет он увиливать от работы или нет, он сравнивает выгоду от своей лени с ее ценой. Выгода – это более приятно проведенный день в офисе. Цена – это возможность того, что его поймают, вместе с ценностью того, что он потеряет, если его уволят.

Если безработица отсутствует и фирма может предложить такие же регулирующие рынок зарплаты, как и другие фирмы, то работник попытается уклониться от работы.



Чтобы побудить работников усердно работать, фирме необходимо сделать так, чтобы у работников было что терять, если их поймают за халтурой. Можно предложить подчиненным более высокие зарплаты, чем в других компаниях. Высокая эффективная ставка заработной платы может мотивировать работников прилагать все свои усилия.



Однако эффективная ставка зарплаты может создавать и трудности: все фирмы начинают предлагать своим работникам бо́льшие суммы, чтобы мотивировать их на усердную работу. Но если каждая фирма установит более высокую зарплату, то зарплата повысится на всем рынке. Все больше людей будут хотеть зарабатывать еще больше, количество рабочих мест не будет увеличиваться, а результатом этого опять станет безработица.

В этом случае работники будут мотивированы усердно трудиться, чтобы не потерять работу, потому что поиск нового места займет долгое время.


Подробнее об асимметричной информации

Часто так случается, что люди не уверены в человеке, с которым они взаимодействуют. Такие игры называются играми с неполной информацией, в которых игроки не знают наверняка, каков характер противника, и, соответственно, не уверены насчет выигрышей в каждом из возможных исходов игры.

Такую ситуацию можно представить, воспринимая противника как субъекта определенного типа. Каждый тип ассоциируется с разными выигрышами при каждом возможном исходе игры. Обычно игрок знает, к какому типа принадлежит, но другому игроку это неизвестно. Соответственно, мы наблюдаем асимметричную информацию.


Сообщение о качестве продукции

Рядовому потребителю может быть непросто оценить качество продукта перед покупкой. Однако компания-производитель хорошо понимает, долговечный это продукт или нет. Она знает, к какому типу принадлежит этот продукт (высокое качество или низкое качество), но покупатель не может угадать.

Потребителям необходимо научиться разбираться, какие компании продают товары высокого качества, а какие нет. Естественно, любая компания будет утверждать, что их компания отличается высочайшим качеством, вне зависимости от истины. Так что прямые заявления компании не имеют никакой ценности.



Работая с некоторыми видами товаров, компании могут отказываться от асимметричной информации и предлагать бесплатные образцы на пробу клиентам. Однако такое возможно для определенных видов продуктов.

Если у компании нет возможности предоставить достоверную прямую информацию о качестве продукта, то производителям товаров высокого качества приходится искать способ сообщить покупателям о достойном качестве продукции. Чтобы эта схема сработала, компании необходимо представить это сообщение в виде какого-либо наблюдаемого действия, на которое способен производитель товара высокого качества в отличие от производителя некачественной продукции.


Гарантия как средство сообщения

Даже если потребитель не планирует сохранять чек на покупку, наличие гарантии на товар может убедить его приобрести этот товар, потому что оно сообщает ему о высоком качестве продукции.

Потребитель может рассудить, что только компания, выпускающая надежную продукцию, может позволить себе выдавать долгосрочную гарантию, так как количество покупателей, которым она пригодится, будет невелико.

Компания, предлагающая низкокачественные товары, понимает, что количество обращений недовольных клиентов было бы слишком высоко, поэтому долгосрочная гарантия была бы для них слишком дорога.



В разделяющем равновесии принятие решения о предоставлении гарантии зависит от типа производимого продукта (высокое или низкое качество). Производитель высококачественного товара решит давать гарантию, а фирма, продающая продукцию низкого качества, не станет. Определившись с гарантией, первая компания сможет с помощью самоотбора провести грань между собой и производителем низкокачественной продукции. Так посредством линии поведения два различных типа разделяются.


Реклама как средство сообщения

Реклама также может служить средством сообщения о качестве продукта, если компания производит товар, который обычно покупают повторно, вроде шампуня. Это связано с тем, что доходы от инвестиций в рекламу могут разниться в зависимости от качества продукта.

До первой покупки потребители, как правило, не могут судить о качестве того или иного продукта. Однако после первого использования они могут оценить его свойства. Если компания торгует низкокачественным товаром, то новые клиенты, купившие этот продукт под воздействием рекламы, больше его не приобретут. Они поймут, что это продукт низкого качества. Однако если фирма производит товар высокого качества, новые покупатели станут постоянными клиентами.



Реклама может быть средством сообщения о качестве продукта из-за простого анализа затрат и выгод. Затраты на рекламу всегда одинаковы, вне зависимости от качества рекламируемого продукта. Однако выгода от рекламы для производителя высококачественного товара будет намного выше, так как новые покупатели станут постоянными клиентами. Таким образом, вложив одинаковые суммы в рекламу, компания, продающая низкокачественные товары, будет довольствоваться лишь одноразовыми покупками. Соответственно, активная реклама может быть выгодна лишь для производителей высококачественной продукции.

Потребители, замечающие дорогую рекламную кампанию, могут понять, что фирма вкладывала бы деньги в рекламу, только если бы была уверена, что взамен получит множество постоянных клиентов. Так что можно сказать, что потребители используют рекламу как сообщение о высоком качестве товара.


Религиозный ритуал как средство сообщения

Англо-израильский экономист Джилат Леви (род. в 1970 г.) вместе с израильским экономистом Ронни Рэзин (род. в 1969 г.) доказали, что соблюдение религиозного ритуала может сообщать об искренней религиозной вере человека. Многие верующие люди поддерживают связь между духовной верой и поведением в обществе. Члены религиозных сообществ зачастую ведут себя более кооперативно друг с другом, чем с неверующими людьми. Отсюда вытекает материальная и духовная выгода в принадлежности к такому сообществу.

Но такая система может функционировать, только если члены этого сообщества понимают, что их взаимодействие основывается на их общей вере. Принадлежность к сообществу может давать некоторую материальную выгоду, поэтому иногда у неверующих людей возникает стимул притвориться верующими.



Принятие решений в группе

До сих пор мы рассматривали ситуации, в которых каждый игрок принимает решение самостоятельно.

Однако часто так случается, что решения принимает группа игроков. Отдельный игрок может внести свой вклад в принятие решения, однако не все члены группы могут быть согласны с оптимальной тактикой поведения. Когда каждый игрок не может выбрать предпочтительный для него вариант, согласиться на одном оптимальном ответе может быть не просто.

Исследование группового поведения представляет некоторую трудность для теории игр, так как группа как целое может казаться иррациональной, даже если каждый член этой группы рационален.



У рациональных людей, принимающих решения, переходные предпочтения. Это значит, что если он предпочитает альтернативу А альтернативе Б и предпочитает альтернативу Б альтернативе В, то он должен будет предпочесть альтернативу А альтернативе В (символ «>» означает «предпочтительнее»):

А > Б и Б > В, значит, А > В

Тем не менее, когда все члены группы рациональны, групповые предпочтения могут быть непереходными.

То есть для групп А > Б и Б > В не обязательно означает, что А > В.



Мы можем наблюдать непереходные групповые предпочтения в действии в примере с городом, во владении которого находится свободный участок земли. Существует три возможных варианта действий. На нем можно разбить парк, построить центр по переработке мусора или школу.

Городской совет должен решить судьбу этого земельного участка. В совете три человека. Каждый член совета имеет свой первый выбор.




Совет проводит голосование, теперь они решают между двумя вариантами за один раз. Предположим, что каждый член совета голосует за вариант, который он действительно предпочитает, то есть мы наблюдаем искреннее голосование.



Двое проголосовали за школу, один – за парк. Как группа они предпочитают школу парку, значит, они точно не будут разбивать парк:

Школа > Парк

Остается лишь выбрать между центром по переработке мусора и школой.



За постройку центра по переработке мусора проголосовали двое, а за школу один член совета:

Центр по переработке мусора > Школа

Значит, решено. Совет решил, что школа лучше парка, а центр по переработке мусора лучше школы.



В ходе выбора между центром по переработке мусора и парком мистер Питерс голосовал за парк (его первый выбор), мисс Рейнольдс – за центр (ее первый выбор), а мистер Сингх – за парк, так как центр был для него худшим выбором. Совет решил, что парк лучше центра по переработке мусора (два голоса против одного):

Парк > Центр по переработке мусора

Каждый член совета имеет переходные предпочтения и голосует искренне. Однако при совместных действиях предпочтения совета становятся непереходными, то есть вне зависимости от итогового выбора группы члены группы всегда будут считать, что другой вариант лучше.



Американский экономист Кеннет Эрроу (род. в 1921 г.) в 1972 году был награжден Нобелевской премией по экономике за его теорему невозможности Эрроу. Согласно ей, в группах, которыми не управляет диктатор, всегда будет вероятность того, что предпочтения станут непереходными, при которых мы будем отвергать выбор, который мог бы быть оптимален для всех, или при которых незначительные детали влияют на наш выбор. Этих проблем не избежать при групповом принятии решений.



Теорема невозможности Эрроу объясняет, почему люди на совещаниях комитетов и на парламентских собраниях часто ведут себя так странно. К примеру, на комитетских совещаниях члены комитета часто поднимают одну и ту же тему.



Существует много способов организовать групповое принятие решений. Возможна как автократия, при которой один человек принимает все решения в зависимости от его предпочтений, так и классическая демократия, при которой все члены групп обладают правом голоса при принятии решения. Помимо этих крайностей имеются и другие возможные системы.

В теореме невозможности Эрроу доказывается, что при любой системе, кроме автократии, в процессе принятия групповых решений всегда будет сохраняться вероятность непоследовательного поведения группы.


С чего все начиналось…

Теорию игр начали воспринимать как самостоятельный научный метод в 1940-х годах, однако ее центральные вопросы взаимодействия и конфликта стары как мир.

К примеру, английский философ Томас Гоббс (1588–1679) в своем произведении «Левиафан» пишет:



Его утверждение по природе своей гармонично со всей теорией игр: без сильного правительства, которое бы способствовало заключению соглашений, кооперация провалилась бы, потому что каждый игрок волновался бы об аморальности соперника, что также привело бы к жестокости.



Примеры размышлений в духе теории игр можно найти еще в текстах Платона, который передавал воспоминание Сократа о битве при Делии (424 г. до н. э.).


…и что будет дальше

Развитие теории игр как научной дисциплины предоставило нам возможность в мельчайших деталях исследовать конфликт и кооперацию.

Теперь мы можем ответить на вопросы, на которые было почти невозможно дать ответ раньше.



Из-за математической основы и способов представления большинства явлений теории игр новичкам бывает сложно разобраться в сути и овладеть необходимым инструментарием. Поэтому в настоящей книге мы старательно избегали усложнения и концентрировались на основных идеях теории игр.

Мы рассмотрели примеры, в которых игроки имеют ограниченное количество выборов. Однако часто игрокам приходится выбирать из бесконечного множества вариантов. В таких ситуациях логика теории игр точно такая же, но представляется в более математической манере.

К примеру, мы можем представить компанию, которая решает, стоит вкладывать деньги в рекламу или нет. В этой ситуации компания сделает выбор в пользу варианта, который принесет более крупный выигрыш. Этот выбор бинарен: инвестировать в рекламу или нет. В действительности чаще всего нужно выбрать как раз, сколько денег вложить, какого уровня будет эта реклама.



Когда будете применять инструменты, о которых вы узнали из настоящей книги, то рано или поздно столкнетесь с необходимостью более глубоких знаний. Или, возможно, вам будет интересно расширить свое понимание теории игр. Советуем вам обратиться к этой книге:



В этой книге примеры тяготеют к экономике, но инструменты теории игр будут полезны в любой области науки.

В ходе последних 70 лет было разработано множество инструментов теории игр, направленных на аналитику стратегического мышления. И действительно, многие из этих средств достаточно техничны по своей натуре.

Но чтобы заниматься полезной и интересной работой, применяя теорию игр, вам не нужен весь инструментарий. Точно так же как вам не нужен полный ящик инструментов, чтобы смастерить полку. Того, что вы уже узнали, будет вполне достаточно, чтобы с пользой разбираться в различных ситуациях.


Об авторах


Доктор Айван Пастин

Он бросил старшую школу и колледж, однако его обоснования финансового кризиса с точки зрения теории игр открыли ему двери в Гарвардский университет и Лондонскую школу экономики, где он читает лекции. Он старшина американского ВМФ, несколько лет назад начал читать лекции в университетском колледже Дублина и всегда любил мастерить.



Доктор Тувана Пастин

Турецкий экономист, которая работает в Ирландском национальном университете в Мейнуте. Она специализируется на различных способах применения теории игр. Ее многочисленные труды были напечатаны, в том числе книги о координирующей рекламе и ценовой динамике, финансировании политических кампаний, деятельности в поддержку образования, государственном дефолте, трудовой миграции и международной торговле.



Том Хамберстоун

Иллюстратор и создатель комиксов, лауреат многих премий. Живет в Эдинбурге. В течение трех лет еженедельно его политические карикатуры появлялись на страницах журнала New Statesman. В настоящее время он создает комиксы для таких изданий, как The Nib, Vox, The Guardian, Vice и Image Comics. Обожает слушать подкасты.


* * *


Оглавление

  • Что такое теория игр?
  • Почему она называется «теория игр»?
  • Работа с моделями
  • Ничья
  • Рассмотрим сложность поближе: искусство и наука
  • Рациональность
  • «Кейнсианский конкурс красоты»
  • Ричард Талер и «Игра на угадывание»
  • Трудности, связанные с рациональностью и общеизвестностью рациональности
  • Подъем и крах: применение рациональности на финансовых рынках
  • Игры с одновременными ходами
  • Стратегическая форма игры
  • Выигрыши
  • Равновесие Нэша
  • «Дилемма заключенных»
  • Эффективность по Парето
  • Проектирование сетей
  • Трагедия ресурсов общего пользования
  • Наращивание ядерного потенциала
  • Кооперация
  • Образование
  • Экологическая политика и кооперация
  • Множественность равновесий
  • Множественность равновесия: «Битва полов»
  • Социальные нормы
  • Средства координации
  • Банковское дело и ожидания: наплыв вкладчиков
  • Равновесие Нэша в смешанных стратегиях
  • Игра «Валютная спекуляция»
  • Игра «Кто первый струсит»
  • «Игра навылет»
  • «За» и «против» смешанных стратегий
  • «Уклонение от уплаты налогов»
  • Повторяющееся взаимодействие
  • В конце игры
  • Что, если определенного последнего тура нет?
  • Эксперимент с «Дилеммой заключенных»
  • Эволюционная теория игр
  • Игра «Ястребы и голуби»
  • «Ястребы и голуби» с меньшей ценой конфликта
  • «Ястребы и голуби» с большей ценой конфликта
  • Эволюционная стабильность как усовершенствование равновесия
  • Игры с последовательными ходами
  • Динамичная версия игры «Битва полов»
  • Расширенная форма игры
  • Равновесие, совершенное по под-играм
  • Недостоверные угрозы
  • Рынки кредитования
  • Микрокредитование
  • Ядерное сдерживание
  • Информационные проблемы
  • Асимметричная информация
  • Асимметричная информация и безработица
  • Подробнее об асимметричной информации
  • Сообщение о качестве продукции
  • Гарантия как средство сообщения
  • Реклама как средство сообщения
  • Религиозный ритуал как средство сообщения
  • Принятие решений в группе
  • С чего все начиналось…
  • …и что будет дальше
  • Об авторах
    Скачать книгу

    Introducing Game Theory: A Graphic Guide (Introducing…)

    by Ivan Pastine, Tuvana Pastine, illustrations by Tom Humberstone

    Text and illustrations copyright © 2017 Icon Books Ltd

    © Скворцова И., перевод на русский, 2017

    © Леонтьев В., дизайн обложки, 2017

    © Оформление. ООО «Издательство «Э», 2017

    * * *

    Что такое теория игр?

    Теория игр представляет собой набор инструментов, применяемых для анализа ситуаций, в которых лучшая стратегия одного человека зависит от действий, в том числе ожидаемых, других людей. Благодаря теории игр мы можем понять, как люди действуют в ситуациях взаимной зависимости.

    Такая взаимозависимость, или взаимосвязь, может сформироваться в самых разных ситуациях. Иногда кооперация помогает группе достичь большего, чем получилось бы у каждого человека в отдельности. С другой стороны, если человек добивается успеха за счет других, может произойти конфликт. Так, во многих ситуациях имеются и плюсы кооперации, и элементы конфликта.

    Теория игр помогает проанализировать любую ситуацию, в которой успех одного человека зависит от поведения других. Именно поэтому она эффективно применяется во многих отраслях науки.

    Экономика: на решения, принимаемые фирмами, влияют их ожидания относительно продукта, цены и рекламной политики, которые выберет фирма-конкурент.

    Политология: на политическую платформу одного из кандидатов влияют политические заявления его соперника.

    Биология: животным приходится бороться за скудные ресурсы, и в случае нападения на опасного противника они могут пострадать.

    Информатика: подключенные к одной сети компьютеры «конкурируют» за канал передачи данных.

    Социология: публичное выражение нетрадиционной точки зрения поддается влиянию других членов общества, чье поведение отвечает нормам социальной культуры.

    Теория игр применяется при стратегическом взаимодействии в ситуациях, когда ваш успех зависит от действий других людей, а не только от ваших решений. В таких случаях на действия людей оказывают влияние те ожидания, которые они возлагают на действия других.

    Почему она называется «теория игр»?

    Теория игр изучает стратегическое взаимодействие, которое является основным элементом большинства настольных игр, – отсюда и название. От вашего решения зависят последующие действия вашего соперника, и наоборот. Большая часть жаргона теории игр заимствована напрямую из игр. Те, кто принимает решение, зовутся игроками. Игрок делает ход, когда принимает решение.

    Работа с моделями

    Вне игр стратегическое взаимодействие может быть устроено очень сложно. Взаимодействие между людьми включает, к примеру, не только наши решения, но и выражение лица, тон голоса, язык тела – все это оказывает влияние на других. То, как складываются отношения между людьми, во многом зависит от их личного опыта и точек зрения. Подобное разнообразие способно создавать сложные ситуации, которые с трудом поддаются анализу.

    Эту сложность можно обойти, создавая упрощенные структуры, называемые моделями. Модели не так сложно анализировать, при этом они отражают важные элементы реальной задачи. Упрощенная модель, выбранная с умом, поможет узнать много полезной информации о сложной реальной задаче.

    Шахматы – прекрасный пример того, как множество вариантов усложняет игру, предсказывание последующих шагов и исхода. В шахматах есть определенные правила. Существует ограниченное количество вариантов ходов в каждой позиции. Тем не менее сложность этой игры поражает, хоть она и намного проще любого акта человеческого взаимодействия.

    Ничья

    У сложных настольных игр вроде шахмат есть отличительная черта: чем опытнее игроки, тем чаще партия заканчивается ничьей. Как можно объяснить такую закономерность?

    Шахматы – это игра, не поддающаяся доскональному анализу. Поэтому давайте используем упрощенную модель, которая отражала бы некоторые важные детали шахмат: крестики-нолики. Обе эти игры имеют игровые поля и правила. Игроки принимают решения по очереди, выбирая из ограниченного количества возможных ходов.

    Конечно, крестики-нолики не отражают всего, что происходит в шахматах. Но благодаря тому, что эти две игры имеют некоторые одинаковые свойства, играя в крестики-нолики можно понять, почему опытные шахматисты часто заканчивают партию ничьей.

    Крестики-нолики – любимая детская игра. Как правило, если играют двое неопытных игроков, то партия, скорее всего, окончится победой одного из них. Однако достаточно попрактиковавшись, вы быстро поймете как полезна может быть обратная индукция: вы можете предугадать реакцию вашего противника на ваши возможные действия и учитываете ее при принятии решения.

    После того как игроки научатся использовать обратную индукцию, крестики-нолики, вероятнее всего, будут всегда заканчиваться ничьей. Если смотреть на игру с такой точки зрения, крестики-нолики играют роль упрощенной модели шахмат. Так, в шахматах, может, и существует намного больше возможных ходов, но когда играют искусные игроки – ничьей избежать трудно.

    Рассмотрим сложность поближе: искусство и наука

    Для теории игр наибольший интерес представляют все же не настольные игры вроде шахмат. Скорее, она направлена на улучшение нашего понимания того, как взаимодействуют люди, компании, страны, животные и так далее, когда сами проблемы слишком сложны для полного осмысления.

    Чтобы достичь такого результата, мы создаем упрощенные модели, именуемые играми. Создание подобной полезной модели сочетает в себе науку и искусство. Правильная модель достаточно проста, чтобы обеспечивать понимание тех мотивов, что движут игроками. С другой стороны, она отражает важные элементы реальности, которые включают творческий подход и суждение, нацеленные на оценку значимости элементов.

    Рациональность

    Как правило, теория игр включает такие понятия, как рациональность и общеизвестность рациональности игроков. Рациональность – это качество игроков, которые хорошо понимают игровую ситуацию и рассуждают логически.

    Общеизвестность рациональности игроков – это менее определенный критерий, значение которого в следующем: «Не только мы оба должны быть рациональны, но и я должен знать, что ты рационален. Мне нужен и второй уровень знания: я должен знать, что ты знаешь, что я рационален. Так же необходимый мне третий уровень знания гласит: я должен знать, что ты знаешь, что я знаю, что ты знаешь, что я рационален». И так далее к более глубоким уровням знания. Общеизвестность рациональности требует от игроков способности бесконечно продолжать эту цепь знаний.

    «Кейнсианский конкурс красоты»

    Эти требования общеизвестности рациональности легко могут запутать, но, что еще хуже, они могут просто-напросто не сработать, особенно в играх с большим количеством участников. Классический пример – так называемый «Кейнсианский конкурс красоты», в котором английский экономист Джон Мейнард Кейнс (1883–1946) сравнивает инвестиции в финансовые рынки с конкурсом, проводимым одной газетой в США, суть которого состояла в том, что читатели должны были выбрать «самую красивую девушку», то есть побеждали те читатели, что голосовали за наиболее часто выбираемую девушку.

    На первый взгляд может показаться, что «Кейнсианский конкурс красоты» едва ли можно сравнивать с финансовыми рынками: тут нет никаких цен, покупателей и продавцов. Но у них есть один важный общий элемент. Добиться успеха на финансовом рынке можно лишь будучи на шаг впереди остальных. Если вы способны предсказать поведение среднестатистического инвестора, вы сорвете куш. Так же и в «Кейнсианском конкурсе красоты»: если вы можете предсказать среднестатистический выбор читателей газеты, вы можете победить.

    Ричард Талер и «Игра на угадывание»

    В 1997 году американский поведенческий экономист Ричард Талер (род. в 1945 г.) провел эксперимент в газете Financial Times под названием «Игра на угадывание» – его версия «Кейнсианского конкурса красоты».

    Какое число выбрали бы вы?

    Газета Financial Times получила более тысячи заявок в ходе эксперимента Ричарда Талера. Заявки с числом 33 были самыми частыми, на втором месте было число 22. Из этого можно сделать вывод, что многие продумали один шаг и выбрали 33. Но многие подумали, что другие на этом и остановятся, и попытались быть на шаг впереди них, выбрав число 22 (⅔ от 33).

    Тем не менее если имеет место общеизвестность рациональности игроков, если вы знаете, что остальные не остановятся на первом шаге, то можете бесконечно продолжать такое итеративное рассуждение – процесс логического размышления, который включает повторение одного и того же действия, при котором результат одного этапа берется за отправную точку следующего.

    Ученые, занимающиеся теорией игр, похожим образом играют в «Игру на угадывание» – они применяют итеративное исключение доминируемых стратегий.

    Держим в уме, что нам необходимо найти число, равное ⅔ от среднего арифметического всех чисел, участвующих в конкурсе. Если бы все участники выбрали наибольшее из разрешенных чисел, то есть 100, то среднее арифметическое было бы равно 100. Соответственно, несмотря на то, каковы ожидания людей относительно среднего арифметического, нет никакого смысла в том, чтобы выбирать число, большее, чем ⅔ от 100, то есть 67.

    Другими словами, любая стратегия с числом, большим, чем 67, доминируема числом 67. Говорят, что стратегия доминируема, если она (в данном случае выбор числа, большего, чем 67) дает игроку меньшие выигрыши, чем другая (выбор числа 67), при любых действиях оппонентов. Соответственно, даже если остальные игроки не рациональны, все стратегии, при которых названы числа больше 67, могут быть исключены.

    Если остальные игроки рациональны, то каждый игрок может предполагать, что никто не назовет число больше 67. Таким образом, все догадки от 45 (ближайшее целое число к ⅔ от 67) также исключаются. А оттого, что каждый участник знает, что другие знают, что каждый рационален, все могут быть уверены, что никто не выберет число, большее, чем 45, и никто не выберет число большее, чем 30, которое равно ⅔ от 45.

    Трудности, связанные с рациональностью и общеизвестностью рациональности

    Тем не менее ноль не оказался выигрышным числом в этом эксперименте в Financial Times. Средним арифметическим было число 19, поэтому победило число 13.

    В этом случае принципы рациональности и общеизвестности рациональности не были соблюдены. К примеру, многие участники нерационально выбрали число 100. Даже если бы кто-то ошибочно полагал, что все выберут 100, то оптимальным ответом было бы 67. Такие участники либо не совсем поняли правила игры, либо не смогли посчитать, сколько будет ⅔ от 100.

    Концепция рациональности требует от игрока неограниченных когнитивных возможностей. Полностью рациональный человек знает, как решить любую математическую задачу, и может немедленно провести все вычисления, вне зависимости от уровня их сложности. Человеческое поведение можно было бы лучше соотнести с «ограниченной» рациональностью

    Скачать книгу