Объяснение социального поведения. Еще раз об основах социальных наук — Юн Эльстер

За рамками постепенного восхождения

Фрейдовский принцип удовольствия (глава IV) – стремление к немедленному удовлетворению желаний. Одним из его проявлений является склонность к убеждениям, которые хочется считать правдой, а не к тем, которые подтверждаются действительностью. Принятие желаемого за действительное в этом случае позволяет чувствовать себя комфортно здесь и сейчас, даже если в дальнейшем это приведет к неудаче. Еще одно его проявление возникает при выборе между двумя действиями, порождающими разнонаправленные потоки временно́й выгоды. Принцип удовольствия диктует выбор потока, предлагающего максимальную выгоду на первом этапе независимо от того, какую форму он примет на последующих.

Говоря более обобщенно, тот, кто принимает решения, будь то земляной червь или фирма, занят постепенным восхождением (gradient climbing). В каждый отдельный момент времени он изучает ближайшие возможности, чтобы увидеть, не принесет ли какая-то из них бо́льшие непосредственные дивиденды, чем нынешний статус-кво. Ограниченность ближайшими возможностями – это форма пространственной близорукости (spatial myopia): с глаз долой, из сердца вон. Ограниченность немедленными выгодами – форма темпоральной близорукости, принцип удовольствия. Земляной червь изучает окрестности, чтобы посмотреть, нет ли поблизости более влажного места, чем то, в котором он находится; обнаружив его, он переползает туда. Фирма изучает «пространство» рутинных процедур, близких к тому, чем она в настоящий момент занимается, чтобы найти нечто, что обеспечит основу для лучших краткосрочных показателей, и если находит, внедряет данные процедуры. Через некоторое время фирма или земляной червь может остановиться в месте, превосходящем (в краткосрочной перспективе) все остальные близлежащие позиции. Они достигли локального максимума.

Люди поступают умнее. Интенциональность, то есть способность представлять отсутствующее, дает нам возможность выйти за рамки принципа удовольствия и принять в расчет отдаленные по времени последствия нынешнего выбора. Планирование позволяет нам делать выбор, результат которого будет лучшим в сравнении с тем, что могут дать сиюминутные и сиюсекундные решения. В некоторых случаях дальновидные поступки могут совершаться для лучшего удовлетворения текущих потребностей, подобно тому как алкоголик воздерживается от посещения соседнего ресторана, чтобы купить в отдаленном магазине целую бутылку по той же цене. В других случаях действия направлены на удовлетворение будущих нужд, как в случае когда я откладываю на старость. Если прозорливость первого типа наблюдается и у животных, то поведение второго типа, как принято считать, выходит за рамки их способностей. Некоторые недавние данные, однако, позволяют предположить, что приматы, возможно, способны к планированию на основе не актуальных, а ожидаемых потребностей. Но как бы то ни было, очевидно, что действия на основе спроецированных потребностей являются более сложной операцией.

Позвольте привести четыре примера действий, основывающихся на удаленных во времени последствиях. Первые три примера также обсуждаются в последующих главах.

Отступить, чтобы дальше прыгнуть (reculer pour mieux sauter). Это французское выражение, приблизительным аналогом которого является «Шаг назад, два шага вперед», иллюстрируется фундаментальным фактом экономической жизни: чтобы достичь более высокого уровня потребления в будущем, нужно меньше потреблять в настоящем. Агент занимает положение, уступающее статусу-кво, потому что таково условие реализации более привлекательной альтернативы впоследствии. Излишне говорить, что это имеет смысл, если (1) более низкое положение позволяет ему выжить и (2) выигрыш от более высокого положения настолько велик, что оправдывает потери, связанные с переходом в более низкий статус.

Ожидание. Многие вина, хотя они уже неплохи, когда их разливают по бутылкам, со временем становятся еще лучше. Чтобы извлечь выгоду из этого факта, агент должен отказаться от опции (выпить вино сразу), которая превосходит статус-кво, поскольку отказ является условием достижения лучшего результата в будущем. В другой стороны, отложенное потребление не всегда имеет смысл, если, предположим, агент не уверен, что проживет долго, чтобы насладиться выдержанным вином. В качестве более веского примера можно привести выбор супруга. Вместо того чтобы делать или принимать предложение, как только подвернется приемлемый кандидат, можно подождать, пока не появится кто-то более подходящий. Риск, богато отраженный в мировой литературе, заключается в том, что никого лучше может и не появиться.

РИС. VI.1

Стрельба с опережением. Чтобы попасть в движущуюся мишень, нужно целиться не туда, где она находится, а туда, где она будет в момент соударения. Аналогичным образом, преследуя движущуюся мишень, нужно целиться по прямой туда, где мишень окажется, а не следовать по кривой, которая возникает при прицеливании в ее текущее положение.

На рис. VI.1 охотник, даже если он движется чуть медленнее, чем животное, может его нагнать, пойдя по прямой по направлению к точке, в которой оно окажется в некий заранее просчитанный момент. Если же он будет двигаться в направлении текущей позиции животного, следуя по кривой на графике, он никогда его не догонит. Как мы увидим (глава XVI), естественный отбор в меняющейся среде тоже может рассматриваться в этой перспективе.

Прямой путь не всегда самый быстрый. При попытке достичь стационарной цели прямая не всегда является самым эффективным маршрутом. На рис. VI.2 спасатель может импульсивно броситься к тонущему пловцу, прежде чем тот достигнет берега, а затем проплыть оставшееся расстояние. Если он остановился (но не надолго!), чтобы подумать, он сообразит, что может бежать быстрее, чем плыть, и что он быстрее доберется до пловца, пойдя по обходному пути, который хотя и окажется длиннее в целом, предполагает проведение меньшего времени в воде.

Так мы ведем себя, когда едем по платной автомагистрали, а не по дороге, которая на карте выглядит короче. В экономике планирование магистрального поведения часто является оптимальным.

РИС. VI.2

Дисконтирование во времени

Способность к долгосрочному планированию не предполагает, что обязательно будет востребована. Чтобы ожидаемые долгосрочные последствия имели значение для настоящего поведения, агенты должны быть мотивированы их учитывать. На языке психологов, они должны быть готовы отложить удовлетворение желания. На языке экономистов, они не должны подвергаться чрезмерному дисконтированию во времени (time discounting)[94]. Необходимы и когнитивный, и мотивационный элементы. Если будущие результаты окутаны неизвестностью, они не могут мотивировать поведение в настоящем. Если они предполагают риск, то их мотивационная сила тоже уменьшается. Способность будущих результатов формировать поведение в настоящем зависит как от времени, так и от вероятности их достижения. Механизмы, через которые они влияют на выбор, – это дисконтирование во времени и отношение к риску.

Как видно из этого выражения, дисконтирование во времени (или близорукость) – это склонность придавать вознаграждению в отдаленном будущем меньшее значение, чем вознаграждению в ближайшей перспективе и в настоящем[95]. Если надо выбрать между 100 долларами сегодня и 110 долларами через год, большинство людей предпочтут первое. Однако у такого предпочтения может быть несколько источников.

Некоторые могут предпочесть скорейшее вознаграждение, так как смогут инвестировать эти средства и получить через год больше, чем 110 долларов.

Другие могут взять 100 долларов сейчас, потому что нуждаются в них, чтобы выжить. Получение большей суммы в будущем для них бессмысленно, потому что к тому времени они уже могут умереть. Предположим, что у меня есть выбор: поймать рыбу в реке сейчас руками или сделать сеть и наловить гораздо больше рыбы потом. Поскольку я не могу ловить рыбу, пока плету сеть, цена изготовления сети может быть так высока, что я не смогу себе ее позволить.

Еще кто-то может выбрать меньшее вознаграждение потому, что болен болезнью, при которой с 10 %-й вероятностью через год он умрет. Планируя на будущее, нам приходится учитывать тот факт, что мы знаем, что умрем, но не знаем, когда.

Если ожидаемая в будущем сумма предполагает 50 %-ю вероятность получения 130 долларов и 90 долларов, то из нежелания рисковать можно предпочесть верные 100 долларов сегодня.

Наконец, некоторые люди могут предпочесть скорейшее вознаграждение просто потому, что оно более быстрое. Это чистое дисконтирование во времени. Подобно тому как большой дом с дальнего расстояния кажется меньше, чем маленький дом вблизи, бо́льшая сумма в будущем может субъективно казаться меньшей, чем маленькая сумма в настоящем. В дальнейшем я буду рассматривать только этот случай.

Иррационально ли чистое дисконтирование во времени? Предположим, молодой человек делает очень большой дисконт с будущих вознаграждений. Вместо того чтобы отправиться в колледж, для чего придется временно пожертвовать доходом, чтобы получать более высокий заработок позднее, он сразу после школы поступает на малопрестижную работу с минимальными возможностями для карьерного продвижения. Поскольку он пренебрегает долгосрочным воздействием курения и еды с высоким содержанием холестерина, у него небольшой предположительный срок жизни[96]. Если он не уважает закон по моральным основаниям, соображения благоразумия не удержат его от нарушения этого закона. Другими словами, вполне вероятно, что его жизнь будет короткой и несчастной. Если это не иррациональное поведение, то что это?

По моему мнению, чистое дисконтирование во времени само по себе не является иррациональным. Оно может стать причиной того, что жизнь агента будут хуже, чем если бы он больше заботился о своем будущем, но это касается и эгоистических мотиваций. Тот, кто думает только о себе, может в результате прожить печальную и обедненную жизнь, но мы не должны из-за этого говорить, что эгоизм иррационален. Я обсуждаю эти вопросы в главе XI. В ней я сосредоточусь на том, как следует подходить к концептуализации дисконтирования во времени. Имеется несколько подходов с радикально расходящимися следствиями.

При моделировании дисконтирования во времени специалисты по теории принятия решений традиционно предполагают, что люди дисконтируют будущую прибыль экспоненциально (exponentially). Одна единица прибыли t периодов в будущем имеет настоящую ценность k_t, где k< 1 является коэффициентом дисконта на этот период. Экспоненциальное дисконтирование привлекательно, с нормативной точки зрения, тем, что позволяет осуществлять последовательное планирование (consistent planning). Если один поток вознаграждений имеет в данный момент времени бо́льшую ценность, чем другой, он будет иметь бо́льшую настоящую ценность во всех временных точках. Следовательно, у агента никогда не происходит инверсия предпочтений (preference reversal), которая обычно (в отсутствие причин для пересмотра решения) рассматривается как знак иррациональности.

Однако эмпирически понятие последовательного планирования не имеет особого смысла. Случайное наблюдение показывает, а систематическое подтверждает, что у большинства из нас часто возникает инверсия предпочтений. Очень часто мы не в состоянии последовать намерениям экономить, делать зарядку по утрам, заниматься на фортепьяно, не опаздывать на встречи и так далее. Я могу позвонить дантисту 1 марта и записаться к нему на 1 апреля только затем, чтобы потом отменить запись 30 марта, сказав (солгав), что должен идти на похороны. Чтобы объяснить эти разновидности повседневной иррациональности (а также многие другие явления), мы можем заменить предположение об экспоненциальном дисконтировании гиперболическим дисконтированием (hyperbolic discounting).

Предположим, что дисконтированная настоящая ценность 1 единицы прибыли t периодов в будущем равна 1 / (1 + k_t) (в приведенном ниже примере я принимаю k = 1, но в более общем случае k может быть любым положительным числом: чем оно больше, тем меньше агента заботит будущее). Более того, предположим, что агент при t = 0 сталкивается с выбором: вознаграждение 10 при t = 5 и вознаграждение 30 при t = 10. При t = 0 настоящая ценность первого составляет 1,67, а у послед-него она равна 2,73. У агента, который максимизирует настоящую ценность, сформируется намерение выбрать отложенное вознаграждение. При t = 1 настоящая ценность более быстрой награды равняется 2, более поздней – 3. При t = 2 эти значения составляют соответственно 2,5 и 3,3; при t = 3 они составляют 3,3 и 3,75; и при t = 4 они равняются 5 и 4,29. В какой-то момент между t = 3 и t = 4 скорейшее вознаграждение перестает быть крайней опцией и становится более предпочтительной только в результате того, что идет время. Действительно, легко увидеть, что переключение происходит при t = 3,5; именно тогда я звоню своему дантисту, чтобы отменить встречу.

Еще лучше эта модель видна на графике. На рис. VI.3 агент может выбрать или небольшое вознаграждение Б при t1 или дождаться t2 и получить большее вознаграждение А. Гиперболические кривые I и II представляют то, как оцениваются значения этих вознаграждений в разные предшествующие моменты. По сути они являются кривыми безразличия (глава IX), которые представляют компромиссы между временем получения вознаграждения и размером этого вознаграждения. К примеру, в момент t агенту все равно, получить вознаграждение PQ немедленно или получить небольшое вознаграждение на t1, а также ему все равно, получить PR немедленно или получить большую награду в момент t2. Поскольку во момент t настоящая ценность у А больше, чем у Б, она сформирует намерение выбрать А. Однако поскольку гиперболические кривые пересекаются в t*, в этот момент возникает инверсия предпочтений и агент выбирает Б вместо этого[97].

РИС. VI.3

Пари Паскаля

Мы можем использовать паскалевское пари, чтобы проиллюстрировать отношения между экспоненциальным и гиперболическим дисконтированием во времени. Паскаль хотел убедить своих друзей, свободомыслящих игроков, в том, что они должны поставить на Бога, поскольку даже самая малая вероятность вечного блаженства компенсирует величайшие земные удовольствия. В аргументе Паскаля заключено много сложностей, некоторые из которых мы рассмотрим в следующей главе. Здесь я хочу привлечь внимание к вопросу, который Паскаль не упоминает: имеет настоящая (дисконтированная) ценность вечного блаженства конечную или бесконечную ценность? Если она конечна, игрок может предпочесть получить свои удовольствия на земле, вместо того чтобы ждать загробной жизни.

Предположим для простоты, что каждый период загробной жизни дает 1 единицу прибыли; что человек, по его предположениям, умрет через n число лет от настоящего момента; и наконец, что он дисконтирует будущее благосостояние по экспоненте с множителем k (0 <k< 1). Если Бог дарует человеку спасение по вере его, настоящая ценность блаженства в первый год после его смерти составит kⁿ единиц прибыли, во второй год k^{n + 1} и так далее. Если следовать элементарной алгебре, эта бесконечная сумма (kⁿ + kⁿ+ 1 + k^{n +2} …) складывается с конечной суммой k^n/1^{– k}. Можно представить по крайней мере, что эта сумма может быть меньше настоящей ценности n лет гедонистической жизни на земле. Наоборот, если агент подвержен гиперболическому дисконтированию, бесконечная сумма 1 / (n + 1) + 1 / (n + 2) + 1 / (n + 3) … увеличивается, выходя за пределы любой данной конечной ценности, предполагая, что если мы сравним настоящие ценности, любые земные удовольствия будут в конечном счете заслонены блаженством спасения. Даже если последнее будет умножено на сколь угодно малую вероятность того, что Бог существует, результат по-прежнему будет перерастать пределы любого конечного числа.

Предположим, однако, что собеседник Паскаля имеет возможность регулярно играть в азартные игры. Предварительно рассмотрев ситуацию, он предпочитает пойти к мессе, а не поиграть, потому что первая заставит его поверить и обещает ему вечное блаженство. Однако, по логике гиперболического дисконтирования, имманентная возможность играть в азартные игры вызывает инверсию предпочтений. У него появится намерение сыграть еще один раз, а затем начать ходить к мессе. Вслед за блаженным Августином он скажет: «Дай мне целомудрие и воздержание, но не сейчас». Однако на следующей неделе он рассудит таким же образом. Так сама структура дисконтирования во времени, обеспечивающая более высокую настоящую ценность вечного блаженства, помешает игроку предпринять шаги для его достижения.

Слабость воли

Как показывает этот пример, гиперболическое дисконтирование может прояснить классическую проблему слабости воли. Слабовольный (или акратический) человек характеризуется следующим образом:

1. Он имеет основание сделать Х.

2. Он имеет основание сделать Y.

3. Согласно его собственному суждению, у него есть более веское основание сделать Х, чем Y.

4. Он делает Y.

Часто именно эмоции считаются способными предопределять действия агента, противоречащие его здравому суждению. Когда Медея в пьесе Еврипида собирается убить своих детей, она говорит: «Я ведаю, какое зло я совершаю. Но ярость моя сильнее последующих раздумий». По версии Овидия, она говорит: «Неведомая сила влечет меня вниз вопреки воле. Понукаемая то в одну, то в другую сторону… я вижу добро, но следую по пути зла».

Эти признания, подобно четырем высказываниям, использованным для характеристики слабоволия, являются двусмысленными и неопределенными, поскольку в них отсутствует упоминание того, когда, как предполагается, они должны быть истинными. Давайте дадим строгое определение слабоволия следующим образом:

1. Человек имеет основание сделать Х.

2. Человек имеет основание сделать Y.

3. Человек делает Y, полагая в момент совершения действия, что основания для совершения Х более веские, чем основания для совершения Y.

Представим человека, который принял решение бросить курить и идет на вечеринку, где ему предложат сигарету. Он примет предложение, хотя знает, что ему не следует этого делать. Человек, сидящий на диете, может угоститься десертом, сознавая, что это лучшая идея. Хотя такая концепция слабости воли вполне возможна, она наталкивается на две эмпирические проблемы. Проще предположить, что здравое рассуждение изменилось за доли секунды до совершения действия, чем считать, что действие и здравое суждение сосуществует в одно и то же время. Кроме того, насколько я знаю, никто не установил причинно-следственный механизм, при помощи которого желание сделать Y приобретает бо́льшую побудительную силу, чем желание сделать Х.

Чтобы обойти эти проблемы, мы можем дать широкое определение слабоволию, которое позволит развести во времени суждение агента о том, что ему нужно сделать Х, и выбор Y:

1. Человек имеет основание сделать Х.

2. Человек имеет основание сделать Y.

3. По спокойному и здравому рассуждению, основания для совершения Х является более веским, чем основание для совершения Y.

4. Человек делает Y.

Сократ отрицал, что слабоволие в строгом смысле возможно. Аристотель тоже близко подошел к подобному утверждению. Он допускал слабоволие в более широком смысле, приводя пример человека, чья способность к суждению в момент совершения поступка находится под действием алкоголя. Предположим, я иду на вечеринку в офисе, слишком много пью, оскорбляю своего начальника и пристаю с домогательствами к его жене. В тот момент эти действия кажутся совершенно естественными. Но если бы кто-нибудь предположил до этого, что я способен на такое, я отверг бы подобные мысли как не совместимые с моим спокойным, здравым рассуждением. Если бы меня убедили в том, что мое здравое суждение может раствориться в алкоголе, я остался бы дома. После произошедшего я могу горько сожалеть о своем поведении.

Пример, представленный на рис. VI.4, иллюстрирует случай временного обращения предпочтений (temporary preference reversal), а не слабоволия в строгом смысле. Есть как минимум три механизма, которые производят подобные изменения. Один – это близость по времени (temporal proximity), как это объяснялось при обсуждении гиперболического дисконтирования. Другой механизм – пространственная близость (spatial proximity), которую можно проиллюстрировать феноменом зависимости от сигнала (cue dependence). Этот механизм объясняет, например, многие случаи рецидива у наркоманов. Даже после многих лет воздержания поданный окружением сигнал, ассоциирующийся с употреблением наркотиков, может вызвать рецидив. Иногда для этого достаточно увидеть по телевизору наркоманские принадлежности. Решимость сесть на диету может быть подорвана видом провозимой мимо тележки с десертами. В этих случаях агент делает выбор того, что он предпочитает с учетом всех возможностей в момент непосредственного выбора. Наконец, страсти способны спровоцировать временное изменение предпочтений в силу своей быстротечности (глава VIII). Они также могут вызвать инверсию предпочтений, заставив агента меньше задумываться об отдаленном будущем[98].

РИС. VI.4

Мы можем расширить эту идею, приняв в расчет временные (и мотивированные) изменения в убеждениях агента. В этой гораздо более широкой концепции слабоволие может быть также порождено самообманом (или принятием желаемого за действительное). Заранее решив, что на вечеринке он выпьет всего два бокала, чтобы не подвергать себя риску возвращаясь домой на машине, человек, побуждаемый желанием выпить третий бокал, может сказать себе, несмотря на веские контраргументы, что это никак не отразится на его водительских навыках[99]. Его предпочтения (безопасное вождение) остается неизменным, но изменились его представления об условиях, при которых вождение является безопасным. В то же время он может испытать временное изменение предпочтений, если решит, что хорошо провести время на вечеринке настолько важно, что это компенсирует (адекватно воспринимаемые) риски пьяного вождения.

Библиографические примечания

Касательно свидетельств способности приматов к планированию будущих (а не испытываемых в настоящий момент) потребностей см.: Н. Малкахи и Дж. Колл «Обезьяны сохраняют орудия для использования в будущем» (Mulcahy N., Call J. Apes save tools for future use // Science. 2006. No. 312. P. 1038–1040). Два источника по дисконтированию во времени и другим аспектам межвременного выбора – Дж. Левенстайн и Дж. Эльстер «Выбор во времени» (Loewenstein G., Elster J. (eds). Choice over Time. New York: Russell Sage Foundation, 1992) и Дж. Левенстайн, Д. Рид и Р. Баумейстер «Время и решение» (Loewenstein G., Read D., Baumeister R. (eds). Time and Decision. New York: Russell Sage Foundation, 2003). Паскалевское пари я подробнее обсуждаю в работе «Паскаль и теория принятия решений» (Pascal and decision theory // Hammond N. (ed.). T e Cambridge Companion to Pascal, Cambridge University Press, 2004). Нейрофизиологические данные о квазигиперболическом дисконтировании во времени приводятся в С. Макклюр и др. «Раздельные нейросистемы оценивают непосредственное и отложенное временное вознаграждение» (McClure S. et al. Separate neural systems evaluate immediate and delayed monetary rewards // Science. 2004. No. 306. P. 503–507). Современное обсуждение слабоволия восходит к работе Д. Дэвидсона «Как слабоволие возможно?» (Davidson D. How is weakness of the will possible? // Essays on Action and Events. Oxford University Press, 1980). Я комментирую его идеи в статье «Дэвидсон о слабоволии и самообмане» (Davidson on weakness of will and self-deception // Hahn L. (ed.). T e Philosophy of Donald Davidson. Chicago: Open Court, 1999). Мотивированное формирование убеждений обсуждается в книге Д. Пирса «Мотивированная иррациональность» (Pears D. Motivated Irrationality. Oxford University Press, 1984). Я более подробно обсуждаю связь между слабоволием и инверсией предпочтений в статье «Слабость воли и обращение предпочтений» (Weakness of will and preference reversal // Elster J. et al. (eds). Understanding Choice, Explaining Behavior: Essays in Honour of Ole-Jørgen Skog. Oslo Academic Press, 2006).

VII. Верования

Предыдущая Стр. 8 из 29 Следующая