Высшие ценности и формальная теория выбора
Автор Лефевр В.А.   
13.05.2012 г.

Любая формальная теория выбора так или иначе включает в себя некоторое схематическое представление субъекта, принимающего решение. В первой половине ХХ в. эта схема была чрезвычайно проста. Скрыто предполагалось, что субъект не способен анализировать ни свои собственные мысли, ни мысли других игроков. Поэтому игрок должен пользоваться принципом гарантированного результата, т.е. стремиться принимать такие решения, которые позволяют минимизировать возможные потери.

Принцип гарантированного результата позволил построить одну из прекраснейших теорий ХХ в. - теорию игр. Первый шаг к ней сделал Д. фон Нейман в 1928 году, доказав свою теорему о существовании минимакса в играх двух лиц с нулевой суммой. Следует отметить, что теория игр обрела не только нормативный характер (т.е. давала указания, как следует играть), но и предсказательный (т.е. указывала на наиболее вероятное поведение игрока). Пик популярности теории приходится на 50-60-е годы ХХ в. В это время она становится основной референтной теорией принятия решений в условиях конфликта. Такие понятия как минимальный максимум, игра с нулевой суммой, смешанная стратегия, дилемма заключенного начинают употребляться не только специалистами, но и людьми, далекими от математики - военными, дипломатами, политологами и даже журналистами.

Однако в 70-е годы в использовании теории игр наступил кризис. Оказалось, что схема, положенная в ее основу, бедна. Это породило значительные трудности при попытках использовать формализм теории при моделировании военых операций, международных отношений и экономических коллизий.

Каков же главный недостаток классической теории игр, затормозивший ее развитие? Он заключается в слишком упрощенном взгляде на человеческие ценности. Эти ценности образуют два класса. К первому относятся высшие моральные ценности, ко второму - материальные. Моральные ценности связаны с такими категориями как вера, достоинство, чувства вины и справедливости. Теория игр и большинство формализованных экономических теорий игнорируют этот аспект жизни общества. Эти теории учитывают только утилитарные ценности.

Конечно, экономическое и психологическое мышление ушло далеко вперед. Никто не считает сегодня, что материальные ценности измеряются только деньгами. Уже в восемнадцатом веке Д. Бернулли начал рассматривать психологическую полезность денег как логарифм имеющегося капитала. В ХХ в. была создана формальная теория полезности, отражающая предпочтение различных альтернатив в условиях выбора и упорядочивания. Однако распространить теорию полезности на область моральных ценностей не удалось. Произошло это потому, что моральные ценности пронципиально не могут быть упорядочены. Что важнее: сохранить жизнь отца или жизнь матери? Мы не можем ответить на этот вопрос.

Далее я расскажу о четырех моделях выбора, когда наряду с утилитарными присутствуют и высшие ценности. В основе всех этих моделей лежит представление субъекта как существа рефлексирующего, т.е. предполагается, что субъект может иметь образы себя и других субъектов вместе с их внутренними мирами. Простейшие ситуации, в которых высшие ценности играют существенную роль, связаны с восприятием людьми успеха или неуспеха других людей.

В 1969 г. В.Е. Лепский, П.В. Баранов и я построили первую формальную модель генерации высших ценностей в подобных ситуациях [Лефевр…1969] Мы предположили, что каждый субъект является локальным центром социального организма и что ценности других членов группы влияют на его ценности. Боль другого по поводу своего проигрыша может усилить радость субъекта по поводу своего выигрыша, а может и уменьшить. Это зависит от отношений между субъектами. В этих ситуациях проявляется своеобразная “внутренняя валюта”. Она может многократно осознаваться субъектами. В результате возникает многоярусный каскад генерации высших ценностей, которые предопределяют выборы субъектов.

Вторая модель [Лефевр 2003] была создана для выявления склонности субъекта выбрать определенное отношение к другому субъекту. В рамках этой модели таких отношений может быть только два - союз или конфликт. Выбор одного из них предопределяется не утилитарными ценностями, а высшими. Мотивация выбора зависит от этического статуса образа себя у субъекта. Человек, рассматриваемый в своей культуре как достойный, стремится выбрать такое отношение, при котором этический статус образа себя будет выше, т.е. субъект будет лучше выглядеть в собственных глазах по сравнению с образом другого.

При построении этой модели оказалось необходимым провести различие между понятиями “система ценностей” и “этическая система”. Система ценностей - это список хороших и плохих оценок действий и явлений, оценок, которые регулируют жизнь некоторого сообщества. Например, красть - плохо, помогать бедным - хорошо; сражаться с врагом - хорошо, бежать с поля боя - плохо. Однако человеческое сознание, генерируя решения, не может опираться лишь на систему ценностей. Оно должно быть способным оценивать не только отдельные действия и явления, но также и их комплексы. Например, можно ли украсть, чтобы помочь бедным?

Анализ показал, что существуют два способа оценки комплексов, которые были названы этическими системами. В первой этической системе соединение добра и зла кодируется как зло, а во второй как добро. Например, в первой этической системе ответ на вопрос “Можно ли украсть, чтобы помочь бедным?” - негативен, а во второй - позитивен. Модель вскрыла важную связь между этической системой и выбором отношений к другому субъекту. В первой этической системе, где соединение добра и зла оценивается как зло, нормативно-достойный человек стремится вступить в кооперацию с другим человеком, а во второй этической системе - он склонен к конфронтации. Эмпирический анализ показал, что модель объясняет существенные различия нормативных оценок выбора отношения к другому в различных культурах.

Третья модель [Лефевр 2006], на которой я хочу остановиться, это модель биполярного выбора. Рассмотрим следующую ситуацию. Пусть некто хочет продать хорошую подделку знаменитой картины и стоит перед альтернативой: сказать покупателю правду или солгать. Если этот человек скажет правду, он получит тысячу долларов, если солжет - пятьсот тысяч. Спрашивается, с какой вероятностью человек скажет правду? Ответить на этот вопрос, используя понятие полезности, невозможно. На уровне высших ценностей человек стоит перед выбором между добром и злом. На уровне утилитарных ценностей человек стоит перед альтернативой “мало денег - много денег”. Модель биполярного выбора позволяет соединить эти, казалось бы, несовместимые аспекты [Лефевр 2005].

Как проверить эту модель? Эксперименты с людьми практически невозможны по этическим причинам. Однако, поскольку модель была построена на основе очень общих предположений, возникла мысль, что она должна предсказывать выбор не только человека, но и животных. Проведенный анализ показал, что животные (крысы, голуби) совершают выбор в соответствии с биполярной моделью. Речь идет об экспериментах в камере Скиннера с двумя ключами, нажимание на которые приводит к выдаче маленьких кусочков пищи. Рассмотрим эти эксперименты более подробно.

Полвека назад американский исследователь Р. Херрнстейн [Херрнстейн 1961] показал, что частоты выбора альтернатив животными пропорциональны частотам подкреплений. В.Б. выдвинул “экономическое” объяснение этой пропорциональности. Он предположил, что ее поддерживание позволяет животному максимизировать поступление пищи [Баум, Апарисио 1999]. Однако впоследствии Баум обнаружил, что закон пропорциональности не соблюдается. Более того, было установлено, что в большинстве случаев голуби и крысы чаще, чем того требует пропорциональность, выбирают ключ, который более скудно выдает пищу.

Попытки объяснить этот феномен экономическими моделями к успеху не привели. Мне пришла в голову следующая мысль, а что если у млекопитающих и птиц, так же как у человека, есть два класса ценностей: высшие и низшие. Высшие относятся к обширным классам ситуаций, а низшие проявляются в отдельных ситуациях. Другими словами, в обширном классе ситуаций один ключ олицетворяет для крысы “добро”, а другой - “зло”, а в каждой отдельной ситуации у ключей есть независиные от этого полезности, связанные именно с данной ситуацией. Тогда поведение животных может быть объяснено биполярной моделью.

Вместе со специалистом по поведению животных, Ф. Санабриа, мы провели анализ имеющихся экспериментальных данных и показали, что биполярная модель позволяет объяснить наблюдаемое отклонение реальных стратегий, которыми пользуются крысы и голуби, от стратегий, оптимальных, с точки зрения экономики [Лефевр, Санабриа 2008].

Сравним это с выбором человека. Верующий каменщик согласится получать меньшую сумму денег, строя собор, по сравнению с той, которую он потребует, чтобы строить банк. Один вариант олицетворяет для него добро, а второй - зло. Зачатки “сакральности” мы можем наблюдать и у животных. В силу этого они, также как и люди, отклоняются в своем поведении от экономически оптимальных стратегий.

Отдельные субъекты очень редко принимают решения, находясь в изоляции. Обычно на них воздействуют другие субъекты, входящие с ними в одну группу. Члены группы могут находится друг с другом в отношении союза или конфронтации. В рамках рефлексивных моделей выбор генерируется многоэтажной рефлексивной структурой, т.е. у каждого субъекта есть система образов себя, в свою очередь содержащая системы образов себя.

Поставим следующий вопрос: какова универсальная высшая ценность, объединяющая группу субъектов. В теории рефлексивных игр  (это четвертая модель) [Лефевр 2009] такой универсальной общей ценностью является принцип запрета эгоизма. Он формулируется так: каждый субъект, входящий в группу, преследуя свои личные цели, не должен наносить ущерб группе как целому. Таким образом, действия, выгодные для субъекта, но не выгодные для группы, являются неприемлемыми. Важно заметить, что этот принцип не запрещает действия, направленные против интересов группы или общества, если лицо, их совершающее, не получает никакой личной выгоды.

Пусть некто ограбил богача и сжег украденные деньги, протестуя против несправедливости общественного устройства. Этот человек на нарушил принцип запрета эгоизма, поскольку он бескорыстен. Если же он ограбил богача, чтобы купить себе дорогую машину, он явно его нарушил.

Принцип запрета эгоизма играет в теории рефлексивных игр примерно ту же роль, какую играет принцип гарантированного результата в классической теории игр. Теория рефлексивных игр позволяет предсказывать выборы субъектов, входящих в группу, если нам известен граф отношений между субъектами и их воздействия друг на друга.

В заключение подчеркну, что высшие ценности должны быть не только темой обсуждения в религиозных и педагогических кругах, но и фокусом работ исследовательских центров, в которых создаются формальные модели принятия решений. Это поможет нам решить многие социальные, экономические и политические проблемы. Ограничивая формальные модели лишь учетом утилитарных ценностей, мы исключаем из научного рассмотрения важнейший аспект реальности.

 

Литература

Баум, Апарисио 1999 – Baum, W.M., Aparicio, C.F. Optimality and Concurrent Variable-Interval and Variable-Ratio Schedules //  Journal of Experimental Analysis of Behavior. 1999. Vol.71, pp.75-89.

Лефевр 1969 – Лефевр В.А., Баранов П.В., Лепский В.Е. Внутренняя валюта в рефлексивных играх // Известия Академии Наук СССР. Техническая кибернетика. 1969.

Лефевр 2003 – Лефевр В.А. Алгебра совести. М., 2003.

Лефевр 2005 – Лефевр В.А. Космический субъект. М., 2005.

Лефевр 2006 – Lefebvre V.A. Research on Bipolarity and Reflexivity. Lewiston, 2006.

Лефевр 2009 – Лефевр, В.А. Лекции по теории рефлексивных игр. М., 2009.

Лефевр, Санабриа 2008 – Lefebvre, V.A., Sanabria, F. Matching by Fixing and Sampling: A Local Model Based on Internality // Behavioral Processes. 2008. Vol. 78. Перевод на русский: Лефевр, В.А., Санабриа Ф. 2009. Биполярный выбор в экспериментальной камере // Психологический журнал. Том 30, №4.

Хернстейн 1961 – Herrnstein, R.J. Relative and Absolute Strength of Response as a Function of Frequency of Reinforcement // Journal of Experimental Analysis of Behavior.