Фикция “дилеммы узника”

В теории игр с 1950 г. имеется “дилемма узника” (та же статья на русском), рассматривающая ситуацию с двумя заключенными, которых поймали на небольшом нарушении закона, но прокуроры подорзревают их в более серьезном преступлении. В зависимости от того, как ведут себя заключенные, – молчат или дают нужные показания, – возможны разные результаты:

Prisoners dilemma

Всё довольно просто: оба могут молчать, тогда получат минимальные сроки за мелкое правонарушение, один может молчать, а второй дает показания (стукач выходит на свободу, а молчащий получает большой срок как не раскаявшийся в серьезном преступлении), оба дают показания и оба получают “средний” срок (должны получить за серьезное преступление большой срок, но им его скостили за “сотрудничество со следствием”).

В 1965 году математик, психолог и философ Анатолий Рапопорт публикует книгу Prisoner’s Dilemma, а потом создает самую эффективную программу, позволяющую в многочисленных раундах игры с другими программами-участниками в конце концов получить наименьший совокупный срок. Идея проще некуда: первый раз сотрудничаем, а потом повторяем решение противника из предыдущего раунда – если он “стучал”, то “стучим”, если молчал, то тоже молчим.

В книге воспоминаний “Уверенность и сомнения” (изданной на русском в 1999, а на английском в 2000) Анатолий Рапопорт упоминает “дилемму узника” в одной из главок. Он пишет: “Дилемма визникает оттого, что не принимается во внимание различие между индивидуальной и коллективной рациональностью. Индивидуальная рациональность приводит к выводу, что выгодно нарушить соглашение. Коллективная рациональность ставит вопрос “что нам выгодно?”, а не “что мне выгодно?”, т.к. выделяет различие между “каждому” и “обоим”. Действительно, каждому в отдельности выгодно нарушить соглашение. Наоборот, обоим вместе выгодно выполнить его.

Немецкий философ Петер Козловски в эссе “Эволюция и общество” (включено в английское изданиеEthics of Capitalism and Critique of Sociobiology, как “критика социобиологии”) обращается к этому же вопросу, ссылается на книгу Рапопорта и пишет: “Дилемма заключенных – это разновидность совокупноложного умозаключения в индивуалистически ориентированных, эволюционно развивающихся совокупностях.
Совокупноложное заключение – это ошибочный вывод, согласно которому то, что выгодно для каждого в отдельности, выгодно и для сообщества как целого, для всех вместе. При взаимодействии индивидуальных стратегий, когда каждый делает то, что выгодно для него самого, может эволюционно сложиться менее выгодное состояние, чем то, которое возникло бы при условии предугадывании совокупного результата.”

Тут у нас имеется некоторые логические неточности. “Индивидуальная рациональность” Рапопорта и “совокупноложное заключение” Козловски проистекают из ограниченний игровой модели, приводящих к той же невозможности разобраться в проблеме, что и известный софизм про Ахиллеса и черепаху. В последнем искусственное ограничение задачи уменьшающимися временными промежутками не дает быстрому Ахиллесу догнать медленную черепаху: как только мы перестаем делить время на всё более и более мелкие промежутки, Ахиллес без проблем перегоняет черепаху.

Начнем с ошибки Козловски. Предположим, что оба преступника признались, они получили больший срок, чем получили бы, если бы оба молчали. Можем ли мы сказать, что это не выгодно обществу в целом? Нет, общество получает двух преступников упрятанных в тюрьму на больший срок, что означает, что они дольше не будут совершать преступления. Если мы не начинаем спор о том, нужна ли тюрьма, выгодна ли она обществу, то не самое выгодное преступникам решение оказывается однозначно выгодным обществу.

Анатолий Рапопорт не говорит об обществе в целом, но только о том, что выгодно “каждому” и “обоим”. Тут вроде как не придраться: обоим преступникам не выгодно сдавать друг друга, но логика игры приводит к тому, что риск предательства со стороны подельника заставляет предавать самому. Потому что это выгодно. Или нет?

Если искусственно сузить рамки до игры, сделав ее напрочь бессмысленной математической задачей, то нужно ответить положительно. Но в реальности преступники, – а не компьютерные программки или студенты-психологи, которых обычно и уговаривают поучаствовать в опытах, – получают обратную связь от окружающих их людей, в том числе других преступников. За предательство – нарушение “воровских законов” или мафиозной омерты, – могут наказать (вплоть до смерти). Даже если никто не изобьет/убьет, то кто захочет работать с партнером, который сдает подельников? Преступники не столь уж иррациональны, чтобы не учитывать собственную выгоду и сопутствующие преступлению риски.

То есть играемая хоть несколько, хоть сотни тысяч раз в психологических экспериментах или компьютерных симуляциях “дилемма заключенного” не имеет никакого практического смысла, т.к. подобно апориям Зенона, ушедшим от здравого смысла в область не подкрепленной настоящим знанием теории, намеренно отказывается от имеющейся в реальности системы положительной и отрицательной обратной связи, повышающих выгоду от действий, выгодных преступникам, и увеличивающих риски для тех, кто наносит ущерб преступному сообществу. Как только мы начинаем принимать во внимание не двух игроков, а всех преступников и общество в целом, картина меняется драматически.

Лабораторная модель “дилеммы узника” лишена практической ценности главным образом из-за своей академической узости и неспособности учесть интересы значительного числа людей, чьё благополучие и несчастье зависят от выбора игроков.

PS. После того, как написал, обнаружил, что несколько лет назад писал практически о том же. Единственное различие, что в 2020 рассуждения были реакцией на прочтенные книги Козловски и Рапопорта. Что ж, хотя бы взгляды не сильно меняются 🙂

About khvostik

Это блог для тех, кто как и автор, предпочитает разбираться, а не верить. Что неизбежно приводит к отсутствию столь любимой многими однозначности и лёгкости при чтении. Мы живём в мире, где всегда есть "с другой стороны" (а нередко и "с третье", "четвертой" и т.д.). Потому некоторые тексты получаются длинными и отнюдь непростыми, т.е. требуют интеллектуальных усилий и от читателей. Что в свою очередь резко ограничивает аудиторию - любители задуматься толпами не ходят. Теперь собственно об авторе: живу в Канаде, в пригороде Торонто. Человек правых взглядов, мировоззренчески близкий к либертарианцам (направление, отстаивающее максимальную личную и экономическую свободу), но не состоящий ни в каких партиях. Стараюсь не повторять сказанное другими, во всяком случае в той мере, в которой знаком с этими мнениями (нельзя исключить, что во многих случаях к сходным выводам пришли и другие). На истину в последней инстанции или постоянную правоту не претендую, довольно часто ошибаюсь, но честно пытаюсь разобраться в вопросе, несмотря на собственную предвзятость и ограниченные знания. Хвостик - это имя кота. К автору проще обращаться по имени - Иван :)
This entry was posted in Uncategorized and tagged , , , , . Bookmark the permalink.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.