«Дилемма заключенных» – это самый известный парадокс во всей теории игр. Такое название этой дилемме дал канадский математик Альберт Такер (1905–1995). Эта игра профессора Такера очень похожа на голливудскую криминальную драму, в которой каждому из двух заключенных предлагают сделку о сотрудничестве с правосудием в обмен на донос о другом заключенном. Эта дилемма наглядно показывает, как трудно может быть действовать сообща для общего блага, если люди преследуют свои личные интересы.
Стимулы, которые мы наблюдаем в «Дилемме заключенных», достаточно часто встречаются и используются учеными при анализе задач в самых разнообразных областях науки, например конкуренция компаний в экономике, общественные нормы в социологии, механизмы принятия решения в психологии, борьба животных за скудные ресурсы в биологии или борьба компьютеров за канал передачи данных.
Алан и Бен угнали машину, но их вскоре поймали. Полицейские подозревают, что до того, как их арестовали, они сбили человека и скрылись с места преступления, но у следствия нет улик, прямо указывающих на их вину. Допрос преступников ведется в разных комнатах.
И у Алана, и у Бена есть два варианта действий: они могут сохранять молчание, а могут признаться. Соответственно, существует четыре возможных исхода этой игры:
Алан сохраняет молчание, и Бен сохраняет молчание;
Алан признается, и Бен сохраняет молчание;
Алан сохраняет молчание, и Бен признается;
Алан признается, и Бен признается.
«Дилемма заключенных» может быть представлена в стратегической форме, при которой каждый ряд матрицы представлял бы возможный выбор Алана, а каждая колонка – возможный выбор Бена. На пересечениях каждого ряда и колонки мы обозначим выигрыши каждого игрока: в данном случае это будет срок заключения.
Если Алан и Бен сохранят молчание, то оба получат срок в один год за угон автомобиля. Это отрицательный расклад, поэтому их выигрыши также в минусе (Алан: –1, Бен: –1). Если оба преступника сознаются, каждый сядет в тюрьму на 10 лет (А – 10, Б – 10).
Заключенные понимают, как работает эта матрица, и знают, что имеют дело с одной и той же матрицей.
Это пример игры с одновременными ходами. Даже если заключенные не принимают решения синхронно, мы все равно можем назвать их одновременными, потому что игроки находятся в разных комнатах и ни один из них в момент принятия своего решения не знает, как будет действовать другой.
Однако заметьте, что, воспринимая эту дилемму как игру в стратегической форме, мы не говорим о возможном исходе. Мы просто обозначаем все потенциально возможные итоги, будь они разумны или нет, и записываем выигрыши, которые игроки получили бы, если бы место имел именно такой исход.
Теперь, когда мы записали нашу задачу в стратегической форме, мы можем приступить к анализу возможного результата.
Очевидно, если бы Алан и Бен вместе придумали бы свою версию произошедшего, они смогли бы сохранить молчание и попали бы в тюрьму всего на один год.
Но этот вариант не входит в систему равновесия. Для Алана стратегия «сознаться» строго доминирует над стратегией «молчать»: всегда лучше сознаться, несмотря на его ожидания относительно действий Бена.
Точно так же и для Бена оптимальной стратегией было бы признание, вне зависимости от его ожиданий относительно действий Алана.
В ситуации равновесия Нэша в данной дилемме оба заключенных признаются. Стандартный способ записи этого исхода таков:
{признание, признание}
Это значит, что игрок, чьи выигрыши записаны в матрице в строку (Алан), сделал выбор в пользу признания, как и игрок, чьи выигрыши записаны в колонку (Бен). В равновесии оба заключенных получают по 10 лет тюремного срока.
Интересно, можно ли сказать, что равновесие Нэша в «Дилемме заключенных» Парето-эффективно? Исход игры можно назвать Парето-эффективным, если больше не существует ни одного возможного исхода, при котором один участник находился бы в лучших условиях, а другой – в худших. Это понятие распределительной эффективности названо в честь итальянского экономиста Вильфредо Парето (1848–1923).
Нэш-равновесный исход «Дилеммы заключенных» не Парето-эффективен, потому что каждый заключенный извлек бы большую выгоду, если бы оба промолчали, отсюда и прозвище «Дилемма заключенных».
Тем не менее во многих других играх равновесие Нэша Парето-эффективно. К примеру, в игре про киностудии не существует исхода, альтернативного Нэш-равновесному исходу, который приносит пользу одной студии, не вредя другой.
Стимулы, представленные в «Дилемме заключенных», основываются на различных ситуациях. Действительно, как только один человек начинает смотреть на мир через такую призму этой дилеммы, трудно не начать замечать ее повсюду.
К примеру, когда беспроводные сетевые передатчики, такие как Wi-Fi-роутеры или вышки сотовой связи, используют одну и ту же частоту, их зоны покрытия накладываются, их взаимодействие нарушается и замедляется скорость работы.
Одним из возможных решений этой проблемы будет снижение мощности передачи обоих устройств, чтобы их зоны покрытия больше не накладывались. Но если мощность передачи снижена только на одном устройстве, второе более мощное устройство будет перегружать канал передачи данных.
Описанная ниже ситуация может быть представлена в матрице.
Разработчики каждого роутера должны принять решение: передавать сигнал высокой или низкой мощности? Выигрышами будут скорости передачи данных в миллионах бит в секунду (Мбит/с). В этой игре передача сигнала высокой мощности дает одному роутеру преимущество за счет другого устройства так же, как было с признаниями в «Дилемме заключенных».
Передача сигнала высокой мощности гарантирует одному устройству самую высокую скорость вне зависимости от функционирования другого устройства. «Высокая мощность» – это доминирующая стратегия. При равновесии Нэша оба устройства передают сигнал высокой мощности и скорость передачи данных для каждого достигает 5 Мбит/с – так же как и в «Дилемме заключенных» признания обоих преступников обеспечили им длительное пребывание в тюрьме.
Если бы оба роутера работали на низкой мощности, скорость передачи данных у каждого достигла бы 10 Мбит/с. Однако когда мощность задается независимо, ни одно устройство не «выберет» низкую мощность, так как каждый отдельный роутер улучшает свои показатели работы, увеличивая мощность.
Если оба роутера подсоединены к одной сети, то, возможно, они оба будут работать в режиме низкой мощности для облегчения этой «борьбы». У многих устройств есть более продвинутые настройки, благодаря которым становится возможным взаимодействие роутеров в одной сети вместо их конкуренции. Такие настройки помогают сетевым администраторам обойти эту «Дилемму заключенных».