Парадокс двух конвертов

Материал из synset
Перейти к: навигация, поиск

Формулировка парадокса

Рассмотрим следующую игру:
Есть 2 конверта. В один из них вкладывается сумма , во второй — . Значение неизвестно и каждый раз случайно изменяется. Конверты неразличимы. Игрок открывает один из конвертов и видит лежащую там сумму. У него есть две возможности - забрать её или выбрать второй, нераспечатанный конверт. Какая из этих возможностей в среднем даст большую прибыль?

Так как конверты неразличимы, вероятности того, что в данном конверте лежит сумма или , равны 1/2. Значения сумм, лежащих в каждом конверте, заранее неизвестны. Знание суммы в открытом конверте не добавляет информации о том, какая сумма лежит во втором. Поэтому любой выбор даст одинаковую доходность.

С другой стороны. Пусть игрок видит сумму . Тогда во втором (закрытом) конверте лежит или . Эти две возможности равноправны. Поэтому средний доход от выбора второго конверта равен:

Таким образом, игрок при выборе закрытого конверта получает больше, чем при выборе открытого, который даёт ему только . Независимо от значения суммы , относительная доходность при выборе закрытого конверта будет больше на .

Два разумных и вполне правдоподобных рассуждения приводят к несовпадающим результатам. Это противоречие и называется "парадоксом двух конвертов". Существуют также версии названия: "парадокс двух шкатулок", "парадокс двух карманов" и т.д.

Вокруг этого парадокса время от времени вспыхивают споры в интернет-сообществе. Иногда появляются "сенсационные" заявления о том, что некто парадокс наконец решил. С другой стороны, часто в общих словах происходит, в принципе, верное объяснение сути, но без конкретных расчётов. В результате создаётся ощущение философского надувательства.

Несмотря на то, что парадокс достаточно прост, мне не удалось быстро найти подходящий источник, а так как сын срочно требовал разъяснений, пришлось сесть и написать сей трактат.

Напомним кратко историю. Парадокс был предложен в 1953 году Морисом Крайчиком в книге "Математические развлечения". Широкую известность он получил благодаря Мартину Гарднеру который описал его в книге "А ну-ка, догадайся!" в 1982 г. Исходная версия парадокса "Чей кошелёк толще?" звучала следующим образом:
Два человека решают сравнить суммы денег в их кошельках. При этом они договариваются, что тот, у кого их окажется меньше, забирает все деньги себе. Каждый из них рассуждает следующим образом. Максимум, что я могу проиграть это деньги которые имею. А выиграть могу больше, поэтому эта игра выгодна для меня.
Понятно, что симметричная игра не может быть одновременно выгодной обеим сторонам. Получается парадокс.

Гарднер отмечает, что Крайчик для объяснения рассматривает одинаковое равновероятное распределение вероятностей сумм в каждом кошельке. При этом получается нулевая матрица платежей и игра оказывается симметричной. Однако, пишет Гарднер, "к сожалению, это ничего не говорит нам о том, где именно в рассуждениях двух игроков кроется ошибка. Как мы ни бились, нам так и не удалось найти простое и удовлетворительное решение парадокса Крайчика." Неудивительно, что после такого заявления парадокс вызвал большой интерес.

Приведенная в начале статьи формулировка парадокса была сделана Барри Нейлбуфом в 1989 г. Чтобы парадокс Крайчика стал больше похож на задачу с двумя конвертами, необходимо чуть изменить рассуждения каждой из сторон:
Я знаю, что у меня в кошельке сумма . Мой оппонент имеет неизвестную сумму . С вероятностью 1/2 я потеряю свои деньги и после открытия кошельков буду иметь 0. С вероятностью же 1/2 я заберу деньги оппонента, и у меня будет , где . Поэтому в среднем после игры у меня будет:
Мы будем обсуждать парадокс в "современной" формулировке двух конвертов, и вернёмся к парадоксу Крайчика в заключительном разделе статьи.

Уточнение задачи

Математика работает с непротиворечиво определёнными моделями. Пока исходные формулировки нечётки, любые рассуждения могут привести к любому ответу, в результате чего и возникают такие парадоксы.

В задаче с двумя конвертами необходимо сначала определить способ формирования конвертов. Вариантов может быть множество. Для определённости будем считать, что ведущий игру выбирает некоторую сумму , которую считает большей. Соответственно во второй конверт он кладёт . После этого конверты случайно перемешиваются.

Второе уточнение связано со способом выбора большей суммы . Предполагается, что она выбирается случайно. Это означает, что существует некоторое распределение вероятностей выбора того или иного значения . Возможны два варианта:

  • 1) Суммы, участвующие в игре, являются дискретными. Например, это может быть ограниченная последовательность с возможными парами конвертов , и . Можно также рассматривать неограниченные (в одну или обе стороны) последовательности. Например: . В любом случае вероятности будут дискретными числами , где — номер значения суммы.
  • 2) Суммы, участвующие в игре — непрерывные вещественные положительные числа. Их вероятность необходимо уже задавать при помощи плотности вероятности (или распределения вероятностей). В этом случае вероятность того, что при некотором малом , выбранное число попадёт в интервал , равняется .

В обоих вариантах должно выполняться условие нормировки, при котором полная вероятность любого исхода принимается за единичную. В общем случае условия нормировки имеют вид:

Понятно, что для равновероятных значений (т.е. или ) из бесконечного диапазона эти соотношения выполнятся не могут. Другими словами, невозможно ни в теории, ни на практике реализовать равновероятное распределение на бесконечном интервале.

Пусть случайная величина непрерывна. Рассмотрим два варианта:

  • 1) равномерное распределение с границей так, что при .
  • 2) неравномерное распределение, при котором убывает при .

Ниже на левом рисунке представлен первый вариант, а на правом, соответственно, второй:

Envel Px.png

Понятно, что первый вариант на самом деле эквивалентен второму, но имеет более "изломанное убывание" на бесконечности. Тем не менее, нам будет удобнее их различать.

Задача двух конвертов в более общей постановке предполагает формирование различных стратегий поведения игрока и выбор из них наиболее доходной. Стратегии могут учитывать или не учитывать информацию о сумме в открытом конверте. Например:

  • : Всегда забираю открытый конверт.
  • : Всегда забираю закрытый конверт.
  • : Если , беру открытый конверт, иначе — закрытый.

В случае, если конверты были тщательно перемешаны, первые две стратегии должны приводить к одинаковому доходу. Они никак не используют знания об , и в открытый конверт в этом случае можно даже не заглядывать. Собственно, это и утверждалось в первом варианте рассуждения. Вычисления среднего противоречат симметрии задачи, следовательно они ошибочны. Нам предстоит разобраться в чём состоит проблема.

Сначала мы рассмотрим влияние краевого эффекта для равномерного распределения с границей. Мы увидим, что даже при формальном "отодвигании" границы на бесконечность существует более выигрышная "активная" стратегия. Кроме этого будут вычислены доходности различных стратегий в модифицированных правилах игры, при помощи которых делается попытка снизить влияние краевого эффекта. В этом случае конверты перестают быть симметричными. Затем мы найдём оптимальную стратегию для непрерывного убывающего распределения.

Новая формулировка парадокса была предложена уже в процессе обсуждения этой статьи в Интернете. Мы попробуем по-возможности с ней также разобраться. В заключение мы обсудим некоторые общие вопросы, связанные с понятием вероятности и причинами появления подобных парадоксов. Любители математики не склонные к математическим вычислениям могут сразу перескочить к этому разделу.

Равномерное ограниченное распределение

Пусть в конвертах не могут появляться суммы большие, чем (верхняя граница). Как мы договорились выше, ведущий случайно выбирает из интервала большую сумму , а меньшую получает делением на 2. Понятно, что меньшая сумма будет также равновероятно распределена, но уже на интервале . После запечатывания конверты случайным образом перемешиваются.

Envel 24.png

Выше слева нарисовано равномерное ограниченное распределение плотности вероятностей. На правом рисунке изображено дерево вариантов, сопровождающих открытие конверта. С вероятностями 1/2 в открытом конверте может находиться меньшая () или большая сумма (). Если эта сумма большая, она снова равновероятно может быть меньше или больше .

Таким образом, существуют три исхода при открытии конверта со следующими вероятностями:

Рассмотрим сначала пассивные стратегии: "всегда берём открытый конверт" () и "всегда берём закрытый конверт" (). Если в открытом конверте находится сумма , то понятно, что средняя доходность первой стратегии равна . Конверты были перемешаны, значение никак не учитывается, поэтому вторая стратегия должна иметь такую же доходность .

С другой стороны, с вероятностью 1/2 в закрытом конверте находится (большая сумма). С такой же вероятностью там (меньшая сумма). Поэтому:

Упс. Фактически мы повторили рассуждение парадокса и, несмотря на все уточнения формулировки задачи, снова пришли к противоречию. Что неверно в наших вычислениях?

Зайдём с другого конца и вычислим абсолютный (безусловный) средний доход, получаемый игроком при выборе денег из открытого конверта. Большая и меньшая сумма в открытом конверте может появиться равновероятно. Меньшая сумма имеет равномерное распределение на интервале . Поэтому её среднее значение равно . Большая сумма, равномерно распределённая на интервале , имеет среднее значение . Поэтому среднее значение суммы в открытом конверте равно:

Очевидно, что такое же рассуждение и результат справедливы для средней доходности от выбора закрытого конверта. Поэтому средние доходности первой и второй стратегий равны .

Но что же тогда означают соотношения , , полученные выше, и какая при их выводе была сделана ошибка? Ответ прост. Вероятности появления большей или меньшей суммы в открытом конверте действительно одинаковы. Однако, выражая доход, полученный от выбора закрытого конверта через сумму , которая обнаружилась в открытом, мы вычисляем условное среднее. Т.е. вопрос стоит так: какова в среднем сумма в закрытом конверте, если в открытом мы видим . Знание значения меняет вероятности для сумм и в закрытом конверте. Например, если , то в закрытом конверте заведомо находится меньшая сумма (вероятность большей равна нулю). Поэтому в этом случае:

Если же , то вероятности того, что в открытом конверте лежит меньшая или большая суммы , изменяются. Это уже условные вероятности, рассчитанные после получении информации о том, что . Они по-прежнему пропорциональны и , т.е. меньшая сумма в открытом конверте в два раза более вероятна. Однако, их необходимо отнормировать, чтобы суммарная вероятность была равна единице. В результате для открытого конверта есть два исхода:

Таким образом, до открытия вероятности были 1/2 и 1/2. После открытия и получения информации, что они стали 2/3 и . Соответственно в закрытом конверте эти вероятности обратные.

Теперь не составляет труда записать условное среднее для стратегии при условии, что :

Окончательно, правильное выражение для , т.е. для значения условного среднего дохода при выборе закрытого конверта, если в открытом обнаружена сумма , имеет вид:

На прямую нельзя сравнивать c , так как при имеем , иначе . Поэтому, чтобы выяснить, какая из стратегий более доходная, необходимо усреднить эти условные средние.

Для этого потребуется распределение вероятностей для сумм в открытом конверте. Меньшая сумма существует на интервале , поэтому обозначим ступеньку её плотности вероятностей как . Соответственно, для большей суммы это функция-ступенька . Конверты равновероятно перемешаны, следовательно плотность вероятности для суммы в открытом конверте равна:

Другими словами, каждую ступеньку необходимо разделить на 2 и результаты сложить. Итоговая плотность вероятности представлена ниже на правом рисунке:

Envel sum.png

Обратим внимание, что в 2 раза уже и выше чем , как и должно быть для выполнения условия нормировки (см. левый рисунок).

Абсолютный средний доход от выбора второго конверта равен:

Этот же результат ранее мы получили более простым способом.

Если с плотностью вероятностей усреднить , то получится такое же выражение: . Поэтому, при аккуратной записи условных средних, результаты естественно совпадают.

Перейдём теперь к более активной и доходной стратегии. Если игрок в открытом конверте видит , то он должен брать эту сумму, так как в закрытом конверте лежит заведомо меньше. В этом случае выигрыш . Если , то более вероятно, что в открытом конверте меньшая сумма, поэтому стоит выбрать закрытый конверт. В этом случае . Объединяя оба варианта, запишем условное среднее выигрыша от "активной стратегии" следующим образом:

Чтобы найти средний доход, получаемый при использовании активной стратегии, необходимо снова проинтегрировать c плотностью :

"Отодвигание" границы на бесконечность не меняет относительной доходности активной и пассивной стратегий.

Можно изменить правила игры для ослабления краевого эффекта. Пусть, если в открытом конверте лежит , раунд игры останавливается. Игрок ничего не выбирает и не получает. Игра происходит, только если . В этом случае он лишен "активной" стратегии.

Найдём доходы от выбора открытого () и выбора закрытого () конверта. В первом случае игрок всегда получает ту сумму которую видит: . При выборе закрытого конверта необходимо воспользоваться условными вероятностями:

Закрытый конверт на 50\% более доходный. Это и понятно: дополнительное правило изменило симметрию между конвертами.

Абсолютная средняя доходность равна:

где — среднее значение меньшей суммы, а — среднее значение большей на интервале (при условии, что игра началась, т.е. ). Фактически сразу можно написать , так как это середина интервала для сумм, возможных в первом конверте. Поэтому при взятии закрытого конверта получается доход . Эта сумма несколько ниже, чем у активной стратегии в игре, которая начинается независимо от суммы в открытом конверте.

Неравномерное распределение

В случае неравномерного распределения очевидно, что конверты неравноправны. Кроме функции необходимо фиксировать также правило формирования конвертов. Пусть ведущий игру, как и раньше, выбирает случайное число с распределением , считая его максимальной суммой. Минимальная получается из делением на 2. Затем конверты перемешиваются.

Если известно распределение для случайной величины , то распределение для величины имеет вид . Действительно, пусть вычисляется среднее от некоторой функции . Его можно вычислить при помощи вероятности :

Во втором равенстве сделана замена переменной интегрирования . Так как последний интеграл усредняет по , то множитель при функции и является плотностью распределения для .

Таким образом, в приведенном выше алгоритме формирования случайно перемешанных конвертов, сумма в открытом конверте имеет следующую плотность вероятности:

В частности, среднее значение суммы в открытом конверте равно:

Естественно, что такая же сумма в среднем будет находиться и в закрытом конверте.

Найдём теперь оптимальную стратегию игры. Для определённости будем считать, что итоговая вероятность , обнаружить сумму в открытом конверте монотонно снижается с ростом . Тогда существует некоторая оптимальная константа для которой следующая стратегия приносит максимальный доход:
: Если в открытом конверте обнаружена сумма и при этом — забираем открытый конверт, иначе — закрытый.
Наша задача состоит в вычислении оптимального значения .

Запишем условное среднее. Если , то . Если же , для закрытого конверта необходимо воспользоваться условными вероятностями. Если мы видим в открытом конверте сумму , то вероятность того, что это меньшая сумма пропорциональна . Вероятность большой суммы пропорциональна . Поэтому в этом случае:

Вероятности разделены на , чтобы сумма условных вероятностей была равна единице. Найдём среднее значение :

После несложных преобразований, получаем:

Второй интеграл равен среднему доходу от пассивных стратегий. Первый интеграл — бонус за активность. Найдём его максимум, взяв производную по и приравняв её нулю. Это даст следующее уравнение для :

К примеру, вычислим доходности для распределения в виде убывающей экспоненты:

Она нормирована на единицу и имеет единичное среднее . Поэтому средний доход от пассивного выбора открытого или закрытого конвертов составляет .

Оптимальное значение константы равно . Соответственно, средний доход от активной стратегии будет равен:

В результате, активная стратегия оказывается на 12\% более доходной, чем пассивные.

В случае немонотонных функций плотности распределения, эффективная стратегия может быть существенно более затейливой, чем простой пороговый выбор одного или другого конверта.

Парадокс возвращается

Существует очень любопытная модификация парадокса для дискретных сумм с убывающими вероятностями. Она была предложена в Интернете участником SeTosha при обсуждении классического парадокса двух конвертов. Мы рассмотрим несколько более общую формулировку этой задачи.

Выберем некоторое число , и будем считать, что для игры формируются пары конвертов со следующими суммами и вероятностями:

Таким образом с вероятностью большая сумма в конверте равна , а меньшая в раз меньше, где . Несложно видеть, что сумма всех вероятностей равна единице, и такое распределение вполне реализуемо на практике. Как и раньше, после того как в два конверта кладутся деньги, эти конверты случайным образом тасуются. В этом случае средний выигрыш от взятия суммы из открытого конверта равен среднему выигрышу от выбора закрытого конверта.

Условное среднее при выборе открытого конверта равно . Для закрытого конверта необходимо рассмотреть две ситуации. Если , значит гарантированно, в закрытом конверте находится сумма . Во всех остальных случаях, вероятность того, что в открытом конверте находится меньшая сумма в 2 раза выше, чем вероятность того, что это большая сумма. Следовательно условные вероятности равны и . Соответственно, условное среднее для закрытого конверта, если , равно:

Поэтому, условные средние от выбора открытого и закрытого конверта можно записать следующим образом:

Теперь время парадокса. Пусть (как и принимается в классической задаче двух конвертов). Тогда, при имеем равенство стратегий , а при закрытый конверт лучше ( против ). Поэтому, при прочих равных, надо предпочесть закрытый конверт. Если же , то для любых условное среднее закрытого конверта больше: . Но конверты-то неразличимы и равноправны!

Ошибки в вычислении условных средних нет. Поэтому, чтобы разобраться в чём дело, вычислим абсолютный средний доход при любом . Вероятности обнаружить при открытии конверта сумму равны:

С — понятно. Пара конвертов выбирается с вероятностью . Каждый из конвертов может быть открыт также с вероятностью 1/2. Для всех остальных пар имеем . Естественно абсолютные средние доходности оказываются равными:

Несложно видеть, что при эти выражения остаются равными, но теряют смысл. В этом и кроется корень проблемы. Если , то дробь в меньше единицы, поэтому сравнить условные средние и не представляется возможным. Если , то больше , в противном случае — больше . Единственный способ, на основании этих условных средних принять правильное решение, это их усреднить. В результате оказывается, что выбор конверта роли не играет: . Точка оказывается пороговой, как для возможности однозначного сравнения условных средних, так и для сходимости рядов при усреднении по всем .

И всё же, почему нельзя сравнивать условные средние при ? Да, их усреднение невозможно (даёт бесконечный результат). Однако если при любом условии для конечных условных средних всегда , то хочется сделать вывод, что закрытый конверт лучше. Хотя понятно, что это заведомо неверный вывод. В чём дело?

Дело, по всей видимости, в математическом смысле условного среднего. Говоря, что при данном условная средняя доходность равна , мы подразумеваем, что для неё должно выполняться условие нормировки, как и для распределения вероятностей . При усреднении по всем возможным должно получаться осмысленное (конечное) выражение. Если этого не происходит, то функция плохо определена. Также как плохо определено ненормируемое распределение . В этом случае выводы на основе сравнения различных условных средних могут оказаться ошибочными. Всё как в школе: на ноль делить нельзя и точка.

Компьютерное моделирование

Решение или проверка решения задач по теории вероятности почти всегда могут быть реализованы при помощи компьютера. Ниже приведен исходный код на C++, который моделирует игру с непрерывным постоянным распределением вероятностей шириной .

#include <stdlib.h>
#include <stdio.h>
#include <math.h> 
#include <time.h> 

// случайное число (0 .. 1]
inline double Rnd(){ return double(rand()+1) / double(RAND_MAX+1); }          

void main()
{
   srand(time(0));                         // встряхиваем генератор
   double c[2];                            // конверты
   double L = 1;                           // граница

   int n=0;                                // число игр
   double v1=0, v2=0, v3=0;                // заработки от стратегий
   for(int iter=0; iter<10000000; iter++){
      c[0]=Rnd()*L;
      c[1]=c[0]/2;

      int i1 = rand()%2;                   // номер открытого конверта
      int i2 = (i1+1)%2;                   // номер закрытого конверта

      //if(c[i1]>L/2) continue;            // прерываем раунд

      v1+=c[i1];                           // доходы от стратегий:
      v2+=c[i2];
      v3+=( (c[i1]>L/2)? c[i1]: c[i2] );
      n++;
   }
   v1/=n; v2/=n; v3/=n;                    // средние значения

   printf("v1=%.4f\tv2=%.4f\tv3=%.4f\n", v1, v2, v3);
}

В основном цикле программы, который совершается 10 миллионов раз происходит формирование сумм в конвертах. Конверты реализованны в виде массива , . В "нулевой" конверт кладётся равномерно распределённое случайное число из диапазона . Для этого функция Rnd(), возвращающая случайное число в диапазоне , умножается на . В конверт помещается половина от . Затем, случайно выбирается номер открытого конверта . Соответственно — это номер закрытого конверта.

Закомментированная строка соответствует дополнительному условию по началу игры (прерываем раунд, если в открытом конверте сумма больше, чем ).

Для контроля статистической оценки достоверности получаемых результатов, в начале программы стоит "встряхиватель" случайных чисел: srand(time(0)). Несколько последовательных запусков позволят увидеть, какая цифра "дёргается". Это и есть примерная ошибка моделирования. Приведём примеры работы программы:

       v1=0.3752       v2=0.3751       v3=0.4689 
       v1=0.3750       v2=0.3751       v3=0.4688 
       v1=0.3750       v2=0.3750       v3=0.4687 
       v1=0.3751       v2=0.3750       v3=0.4688 
       v1=0.3750       v2=0.3750       v3=0.4687 

Каждая строка вычислений занимает около четверти секунды на машине средней мощности. Результаты работы с раскомментированным условием прерывания раунда следующие:

       v1=0.2500       v2=0.3749       v3=0.3749 
       v1=0.2501       v2=0.3751       v3=0.3751 
       v1=0.2499       v2=0.3749       v3=0.3749 
       v1=0.2500       v2=0.3750       v3=0.3750 
       v1=0.2500       v2=0.3750       v3=0.3750 

Заметим, что для проведения большого количества численных итераций необходимо обязательно использовать тип удвоенной точности double, а не одинарной — float. Ошибки округления достаточно быстро накапливаются, и без удвоенной точности появится систематическая ошибка. Вообще говоря, использование встроенного в С++ генератора случайных чисел для подобных моделирований это не лучший выбор. Он генерит только 32768 различных псевдослучайных чисел, хоти и с достаточно большим периодом повторения. Тем не менее для экспериментов "на скорую руку" он вполне приемлем.

Для получения случайной величины с распределением , можно воспользоваться формулой , где — равномерно распределённая на интервале (0,1] случайная величина, т.е. Rnd(). Действительно, интегральное распределение для равно: и изменяется от 0 до 1. Поэтому равновероятно выбрав то или иное значение несложно найти .

Аналогично, можно смоделировать дискретные случайные числа, появляющиеся с вероятностями . Для этого необходимо выяснить в какой из интервалов попала случайная величина . Одним словом, вариантов для численного моделирования задачи двух конвертов существует огромное множество.

Немного философии

Иногда на форумах при обсуждении задачи о двух конвертах, задаётся следующий вопрос:
Хорошо. Выбрав конкретные правила игры (=распределение), можно показать, что противоречия нет. Но как быть, если игрок не знает каким образом формируются конверты и суммы в них. В этом же случае вероятности по-любому 50/50?
Нет, это не верно. Важно понимать, что отсутствие знания не свидетельствует о равновероятности исходов. Наоборот, равновероятность возникает, если мы уверены в симметричности исходов, поэтому:

незнание равновозможности

Теория вероятностей может оперировать только вероятностями, которые заданны из соображений симметрии или получены в эмпирическом исследовании. Например, подбрасывая симметричную монету мы присваиваем каждому исходу (орёл или решка) вероятность 1/2 именно потому, что монета симметрична, а не потому, что мы не знаем, что выпадет. Бросая кость, мы тоже не знаем что выпадет, но из соображений симметрии уже считаем вероятности равными 1/6. Если проводится эмпирическое определение вероятностей, исходя из наблюдаемых частот, то мы предполагаем, что эти вероятности не изменяются во времени (чего увы нет, например, на финансовых рынках).

Ни каких других способов задания вероятностей нет. Ещё раз напомним, что математика — это игра с чётко определёнными правилами. Неявный выход за них и приводит парадоксам.

Незнание не обладает симметрией. Чтобы незнание превратить в числа (вероятности) необходимо, как минимум провести некое эмпирическое исследование. Однако и в этом случае математика подстерегает множество неприятностей (нестационарность, возможность чуда и т.п.).

Стоит напомнить старую шутку про блондинку, которая уверена, что завтра она с вероятностью 1/2 встретит динозавра, потому, что она его либо встретит, либо не встретит. Во времена культа политкорректности, эта шутка не актуальна и сейчас уже все блондинки умеют вычислять вероятности и знают, что динозавры давно вымерли .

Эти же блондинки понимают, что если им неизвестно в какую геологическую эпоху они живут, нельзя априори присвоить событию встречи динозавра ту или иную вероятность. И уж точно это не будет вероятность равная 1/2.

Теперь мы можем вернуться к парадоксу Крайчика с двумя кошельками. Напомним, что вывод о выгодности игры для каждого игрока был сделан на основании вероятностей выигрыша или проигрыша равных 1/2. Действительно, если бы, например, вероятность выиграть некоторую сумму была существенно ниже вероятности лишиться своих денег, вряд-ли участвующие желали бы сыграть в такую игру.

Поэтому это типичная сказка о динозавре. На основании незнания делается вывод о равновероятности, а затем применяется теория вероятности. В результате получается парадокс.

Естественно, если следуя Крайчику мы зададим конкретные вероятности распределения денег в кошельках, посмотрим в свой и увидим сумму , то будем знать, стоит или нет играть в такую игру. Если не заглядывать в кошелёк, то получится игра с нулевым средним доходом. Именно так и сформулирована эта проблема в терминах двух конвертов.

Таким образом, мы проанализировали задачу двух конвертов на примере различных распределений вероятностей для сумм, находящихся в конвертах. Если игра происходит без ограничений (нет селекции открытого конверта), то доходность выбора открытого и закрытого конвертов одинаковы, как и следует из соображений симметрии. Однако существует более доходная ("активная") стратегия, учитывающая значение суммы в открытом конверте. В случае равномерного ограниченного и монотонно убывающего распределений эта стратегия пороговая. В зависимости от того больше некоторой константы или меньше, выбирается открытый или закрытый конверт.

Если для равномерного на интервале распределения правила игры изменить, чтобы ослабить краевой эффект, то активная стратегия становится недоступной. Однако симметрия между конвертами нарушается. В открытом конверте может лежать только сумма , тогда как в закрытом она находится в диапазоне . Поэтому и доходность выбора закрытого конверта выше, чем открытого.

Парадокс двух конвертов возникает по двум причинам. Во-первых проводится некорректное вычисление условного среднего дохода при выборе закрытого конверта. Во-вторых это вычисление делается без конкретизации условий задачи, с неверной посылкой о том, что незнание этих условий соответствует равновероятности всех исходов.

Вот собственно и всё.

Степанов Сергей по просьбе Степанова Дениса
(с) 2010, synset.com

Cм. также:


Материалы статьи могут быть использованы в некоммерческих и public information целях на условиях лицензии GNU Free Documentation License (версии 1.2 или более поздней). При использовании необходима ссылка на источник: http://synset.com/ru/Парадокс_двух_конвертов