Парадокс двух конвертов — различия между версиями

Версия 18:42, 13 сентября 2010

Содержание

1 Формулировка парадокса
2 Уточнение задачи
3 Равномерное ограниченное распределение
4 Дискретная задача двух конвертов
5 Неравномерное распределение
6 Парадокс возвращается
7 Компьютерное моделирование
8 Немного философии

Формулировка парадокса

Рассмотрим следующую игру:

Есть 2 конверта. В один из них вкладывается сумма $\textstyle x$ , во второй — $\textstyle 2x$ . Значение $\textstyle x$ неизвестно и каждый раз случайно изменяется. Конверты неразличимы. Игрок открывает один из конвертов и видит лежащую там сумму. У него есть две возможности - забрать её или выбрать второй, нераспечатанный конверт. Какая из этих возможностей в среднем даст большую прибыль?

Так как конверты неразличимы, вероятность того, что в данном конверте лежит сумма $\textstyle x$ или $\textstyle 2x$ , равна 1/2. Значения сумм, лежащих в каждом конверте, заранее неизвестны. Знание суммы в открытом конверте не добавляет информации о том, какая сумма лежит во втором. Поэтому любой выбор даст одинаковую доходность.

С другой стороны. Пусть игрок видит сумму $\textstyle x$ . Тогда во втором конверте лежит $\textstyle 2x$ или $\textstyle x/2$ . Эти две возможности равноправны. Поэтому средний доход от выбора второго конверта равен:

v_{2}={\frac {1}{2}}\,(2x)+{\frac {1}{2}}\,(x/2)={\frac {5}{4}}\,x.

Таким образом, игрок при выборе второго конверта получает больше, чем при выборе первого, который даёт ему только $\textstyle v_{1}=x$ . Независимо от значения суммы $\textstyle x$ , относительная доходность при выборе закрытого конверта больше на $\textstyle (v_{2}-v_{1})/v_{1}=25\%$ .

Два разумных и вполне правдоподобных рассуждения приводят к несовпадающим результатам. Это противоречие и называется "парадоксом двух конвертов". Существуют также версии названия: "парадокс двух шкатулок", "парадокс двух карманов" и т.д.

Парадокс был предложен в 1953 году Кратчиком (Maurice Kraitchik), в терминах двух карманов. Широкую популярность парадокс получил благодаря Гарднеру (Martin Gardner), который описал его в 1982 г. в книге "Aha! Gotcha". В дальнейшем карманы превратились в конверты.

Вокруг парадокса время от времени вспыхивают споры в интернет-сообществе. Иногда появляются "сенсационные" заявления о том, что некто парадокс наконец решил. С другой стороны, часто в общих словах происходит, в принципе, верное объяснение сути, но без конкретных расчётов. В результате создаётся ощущение философского надувательства.

Несмотря на то, что парадокс достаточно прост, мне не удалось быстро найти подходящий источник, а так как сын срочно требовал разъяснений, пришлось сесть и написать сей трактат.

Уточнение задачи

Математика работает с непротиворечиво определёнными моделями. Пока исходные формулировки нечётки, любые рассуждения могут привести к любому ответу, в результате чего и возникают парадоксы такого рода.

В задаче с двумя конвертами необходимо сначала определить способ формирования конвертов. Вариантов может быть множество. Для определённости будем считать, что ведущий игру выбирает некоторую сумму $\textstyle x_{max}$ , которую считает большей. Соответственно во второй конверт он кладёт $\textstyle x_{min}=x_{max}/2$ . После этого конверты случайно перемешиваются.

Второе уточнение связано со способом выбора большей суммы $\textstyle x=x_{max}$ . Предполагается, что она выбирается случайно. Это означает, что существует некоторое распределение вероятностей выбора того или иного значения $\textstyle x$ . Возможны два варианта:

1) Суммы, участвующие в игре, являются дискретными. Например, это может быть ограниченная последовательность $\textstyle \{1,\,2,\,4,\,8\}$ с возможными парами конвертов $\textstyle (1,2)$ , $\textstyle (2,4)$ и $\textstyle (4,8)$ . Можно также рассматривать неограниченную (в одну или обе стороны) последовательность. Например: $\textstyle \{...,\,2^{-2},\,2^{-1},\,1,\,2,\,2^{2},\,...\}.$ . В любом случае вероятности будут дискретными числами $\textstyle p_{i}$ , где $\textstyle i$ — номер значения суммы.
2) Суммы, участвующие в игре — непрерывные вещественные положительные числа. Их вероятность необходимо уже задавать при помощи плотности вероятности $\textstyle P(x)$ (или распределения вероятностей). В этом случае вероятность того, что при некотором малом $\textstyle \Delta x$ , выбранное число попадёт в интервал $\textstyle [x,x+\Delta x]$ , равняется $\textstyle P(x)\Delta x$ .

В обоих вариантах должно выполняться условие нормировки, при котором полная вероятность любого исхода принимается за единичную. Если число возможных значений сумм $\textstyle x$ бесконечно, то условия нормировки имеют вид:

Невозможно разобрать выражение (синтаксическая ошибка): {\displaystyle \sum^\infty_{i=0} p_i = 1,\;\;\;\;\;\;\;или\;\;\;\;\;\;\; \int\limits^\infty_0 P(x)dx = 1.}

Понятно, что для равновероятных значений $\textstyle x$ (т.е. $\textstyle p_{i}=const$ или $\textstyle P(x)=const$ ) эти соотношения выполнятся не могут. Другими словами, невозможно ни в теории, ни на практике реализовать равновероятное распределение на бесконечном интервале.

Пусть, например, случайная величина $\textstyle x$ непрерывна. Тогда возможны только два варианта для плотности вероятности:

1) равномерное распределение с границей так, что $\textstyle P(x)=0$ при $\textstyle x>L$ .
2) неравномерное распределение, при котором $\textstyle P(x)$ убывает при $\textstyle x\to \infty$ .

Ниже на левом рисунке представлен первый вариант, а на правом, соответственно, второй:

Понятно, что первый вариант на самом деле эквивалентен второму, но имеет более "изломанное убывание" на бесконечности. Тем не менее, нам будет удобнее их различать.

Задача двух конвертов в более общей постановке предполагает формирование различных стратегий поведения игрока и выбор из них наиболее доходной. Стратегии могут учитывать или не учитывать информацию о сумме $\textstyle x$ в открытом конверте. Например:

$\textstyle v_{1}$ : Всегда забираю открытый конверт.
$\textstyle v_{2}$ : Всегда забираю закрытый конверт.
$\textstyle v_{3}$ : Если $\textstyle x>100$ , беру открытый конверт, иначе — закрытый.

В случае, если конверты были тщательно перемешаны, первые две стратегии должны приводить к одинаковому доходу. Они никак не используют знания об $\textstyle x$ , и в открытый конверт в этом случае можно даже не заглядывать. Собственно, это и утверждалось в первом варианте рассуждения. Поэтому не верны именно рассуждения при вычислении среднего $\textstyle v_{2}=5x/4$ . Нам предстоит разобраться в чём состоит проблема.

Ниже мы рассмотрим сначала влияние краевого эффекта для равномерного распределения с границей. Это будет проделано отдельно для непрерывного и дискретного случаев. Мы увидим, что даже при формальном "отодвигании" границы на бесконечность существует выигрышная стратегия, и в ряде случаев симметрия между открытым и закрытым конвертами не восстанавливается. В заключение мы приведём примеры моделирования задачи о двух конвертах на C++.

Равномерное ограниченное распределение

Пусть в конвертах не могут появляться суммы большие, чем $\textstyle L$ (верхняя граница). Как мы договорились выше, ведущий случайно выбирает из интервала $\textstyle [0,L]$ большую сумму $\textstyle x$ , а меньшую получает делением $\textstyle x$ на 2. Понятно, что меньшая сумма будет также равновероятно распределена, но уже на интервале $\textstyle [0,L/2]$ . После запечатывания конверты случайным образом перемешиваются.

Выше на правом рисунке изображено дерево вариантов, сопровождающих открытие конверта. С вероятностями 1/2 в открытом конверте может находиться меньшая и большая сумма. Если эта сумма большая, она снова равновероятно может быть меньше или больше $\textstyle L/2$ .

Таким образом, мы имеем три исхода при открытии первого конверта со следующими вероятностями:

{\begin{array}{r|c|c|c|}x=&\;\;\;\;\;\;x_{min}\;\;\;\;\;&\;\;x_{max}<{\frac {L}{2}}\;\;&\;\;x_{max}>{\frac {L}{2}}\;\;\\\hline p_{i}=&1/2&1/4&1/4\end{array}}

Рассмотрим сначала пассивные стратегии: "всегда берём открытый конверт" ( $\textstyle v_{1}$ ) и "всегда берём закрытый конверт" ( $\textstyle v_{2}$ ).

Если в открытом конверте находится сумма $\textstyle x$ , то понятно, что средняя доходность первой стратегии равна $\textstyle v_{1}=x$ . Конверты были перемешаны, значение $\textstyle x$ никак не учитывается, поэтому вторая стратегия должна иметь такую же доходность $\textstyle v_{2}=x$ . Попробуем, не используя соображений симметрии, вычислить $\textstyle v_{2}$ при помощи известных вероятностей. Рассмотрим следующее рассуждение: С вероятностью 1/2 в закрытом конверте находится $\textstyle 2x$ (большая сумма). С такой же вероятностью там $\textstyle x/2$ (меньшая сумма). Поэтому:

v_{2}={\frac {1}{2}}\,(2x)+{\frac {1}{2}}\,(x/2)={\frac {5}{4}}\,x.

Упс. Фактически мы повторили рассуждение парадокса и, несмотря на все уточнения формулировки задачи, снова пришли к противоречию. Что неверно в наших вычислениях?

Зайдём с другого конца и вычислим абсолютный средний доход, получаемый игроком при выборе денег из открытого конверта. Большая и меньшая сумма в открытом конверте может появиться равновероятно. Меньшая сумма имеет равномерное распределение на интервале $\textstyle [0,L/2]$ . Поэтому её среднее значение равно $\textstyle L/4$ . Большая сумма, равномерно распределённая на интервале $\textstyle [0,L]$ , имеет среднее значение $\textstyle L/2$ . Поэтому среднее значение суммы в открытом конверте равно:

\left\langle x\right\rangle ={\frac {1}{2}}\cdot {\frac {L}{4}}+{\frac {1}{2}}\cdot {\frac {L}{2}}={\frac {3L}{8}}.

Очевидно, что такое же рассуждение и результат справедливы для средней доходности от выбора закрытого конверта. Поэтому средние абсолютные доходности первой и второй стратегий равны $\textstyle \left\langle v_{1}\right\rangle =\left\langle v_{2}\right\rangle =3L/8$ .

Но что же тогда означают соотношения $\textstyle v_{1}=x$ , $\textstyle v_{2}=5x/4$ , полученные выше, и какая при их выводе была сделана ошибка? Ответ прост. Вероятности появления большей или меньшей суммы в открытом конверте действительно одинаковы. Однако, выражая доход, полученный от выбора закрытого конверта через сумму $\textstyle x$ , которая обнаружилась в открытом, мы вычисляем условное среднее. Т.е. вопрос стоит так: какова в среднем сумма в закрытом конверте, если в открытом мы видим $\textstyle x$ . Знание значения $\textstyle x$ меняет вероятности $\textstyle p_{1}$ и $\textstyle p_{2}$ для сумм $\textstyle x/2$ и $\textstyle 2x$ в закрытом конверте. Например, если $\textstyle x>L/2$ , то в закрытом конверте заведомо находится меньшая сумма и $\textstyle p_{1}=1$ , $\textstyle p_{2}=0$ . Поэтому в этом случае:

v_{2}=0\cdot (2x)+1\cdot (x/2)={\frac {x}{2}}.

Если же $\textstyle x<L/2$ , то вероятности того, что в открытом конверте лежит меньшая или большая суммы $\textstyle x$ , изменяются. Это уже условные вероятности, рассчитанные после получении информации о том, что $\textstyle x<L/2$ . Они по-прежнему пропорциональны $\textstyle 1/2$ и $\textstyle 1/4$ , т.е. меньшая сумма в открытом конверте в два раза более вероятна. Однако, их необходимо отнормировать, чтобы суммарная вероятность была равна единице. В результате имеется две возможности в открытом конверте:

if\;x<{\frac {L}{2}}\;\;\;\;\;\;\;\;{\begin{array}{r|c|c|c|}x=&\;\;\;\;\;\;x_{min}\;\;\;\;\;&\;\;x_{max}<{\frac {L}{2}}\\\hline p_{i}=&2/3&1/3\end{array}}

Таким образом, до открытия вероятности были 1/2 и 1/2. После открытия и получения информации $\textstyle x<L/2$ они стали 2/3 и $\textstyle 1/3$ . Соответственно в закрытом конверте эти вероятности обратные.

Теперь не составляет труда записать условное среднее для стратегии $\textstyle v_{2}$ при условии, что $\textstyle x<L/2$ :

v_{2}={\frac {2}{3}}\cdot (2x)+{\frac {1}{3}}\cdot (x/2)={\frac {3}{2}}\,x.

Окончательно, правильное выражение для $\textstyle v_{2}$ , т.е. для значения условного среднего дохода при выборе закрытого конверта, если в открытом обнаружена сумма $\textstyle x$ , имеет вид:

v_{2}=\left\{{\begin{array}{ll}3x/2,&\;\;if\;x<L/2\\x/2,&\;\;if\;x>L/2.\\\end{array}}\right.

Имея это условное среднее можно ещё раз вычислить абсолютное среднее $\textstyle \left\langle v_{2}\right\rangle$ . Для этого необходимо найти распределение вероятностей обнаружить в открытом конверте сумму $\textstyle x$ . Так как меньшая сумма существует на интервале $\textstyle [0,L/2]$ , обозначим ступеньку её плотности вероятностей как $\textstyle P_{L/2}(x)$ . Соответственно, для большей суммы это функция-ступенька $\textstyle P_{L}(x)$ . Конверты перемешаны, поэтому плотность вероятности для суммы $\textstyle x$ в открытом конверте равна:

P(x)={\frac {1}{2}}P_{L/2}(x)+{\frac {1}{2}}P_{L}(x).

Другими словами, каждую ступеньку необходимо разделить на 2 и результаты сложить. Итоговая плотность вероятности представлена ниже на правом рисунке:

Обратим внимание, что $\textstyle P_{L/2}(x)$ в 2 раза уже и выше чем $\textstyle P_{L}(x)$ , как и должно быть для выполнения условия нормировки (см. левый рисунок).

Чтобы найти абсолютный средний доход от выбора второго конверта, необходимо провести усреднение:

\left\langle v_{2}\right\rangle =\int \limits _{0}^{L}v_{2}(x)\cdot P(x)dx=\int \limits _{0}^{L/2}{\frac {3x}{2}}\cdot {\frac {3}{2L}}\,dx+\int \limits _{L/2}^{L}{\frac {x}{2}}\cdot {\frac {1}{2L}}\,dx={\frac {3}{8}}\,L.

Этот же результат ранее мы получили более простым способом.

Если с плотностью вероятностей $\textstyle P(x)$ усреднить $\textstyle v_{1}=x$ , то получится такое же выражение: $\textstyle \left\langle v_{1}\right\rangle =3L/8$ .

$\textstyle \bullet$ Перейдём теперь к более активной и доходной стратегии. Если игрок в открытом конверте видит $\textstyle x>L/2$ , то он должен тут же брать эту сумму, так как в закрытом конверте лежит заведомо меньше. В этом случае выигрыш $\textstyle v_{3}=x$ . Если $\textstyle x<L/2$ , то более вероятно, что в открытом конверте меньшая сумма, поэтому стоит выбрать закрытый конверт. В этом случае $\textstyle v_{3}=v_{2}$ . Поэтому, объединяя оба варианта, запишем условное среднее выигрыша от "разумной стратегии" следующим образом:

v_{3}=\left\{{\begin{array}{ll}3x/2,&\;\;if\;x<L/2\\x,&\;\;if\;x>L/2.\\\end{array}}\right.

Чтобы найти средний доход, получаемый при выборе разумной стратегии, необходимо снова проинтегрировать $\textstyle v_{3}$ c плотностью $\textstyle P(x)$ :

\left\langle v_{3}\right\rangle =\int \limits _{0}^{L}v_{3}(x)\cdot P(x)dx={\frac {15}{32}}\,L.

Относительная доходность "разумной стратегии" по сравнению с пассивным выбором любого конверта оказывается равной $\textstyle (v_{3}-v_{1})/v_{1}=25\%$ . Это значение не зависит от $\textstyle L$ , поэтому "отодвигание границы" на бесконечность ничего не изменит.

$\textstyle \bullet$ Можно изменить правила игры для ослабления краевого эффекта. Пусть, если в открытом конверте лежит $\textstyle x>L/2$ , раунд игры останавливается. Игрок ничего не выбирает и не получает. Игра происходит, только если $\textstyle x<L/2$ .

Найдём доходы от стратегии выбора открытого конверта $\textstyle v_{1}$ и выбора закрытого конверта $\textstyle v_{2}$ . При выборе открытого конверта игрок всегда получает ту сумму которую видит: $\textstyle v_{1}=x$ . При выборе закрытого конверта необходимо воспользоваться условными вероятностями:

v_{2}={\frac {2}{3}}\cdot (2x)+{\frac {1}{3}}\cdot (x/2)={\frac {3}{2}}\,x.

Закрытый конверт на 50\% более доходный (конверты неравноправны!).

Абсолютная средняя доходность равна:

\left\langle x\right\rangle ={\frac {2}{3}}\cdot {\frac {L}{4}}+{\frac {1}{3}}\cdot {\frac {L}{4}}={\frac {L}{4}},

где $\textstyle L/4$ — среднее значение меньшей суммы, а $\textstyle L/4$ — среднее значение большей на интервале $\textstyle [0,L/2]$ (при условии, что игра началась, т.е. $\textstyle x<L/2$ ). Фактически сразу можно написать $\textstyle L/4$ , так как это середина интервала для сумм, возможных в первом конверте. Поэтому при взятии закрытого конверта получается доход $\textstyle \left\langle v_{2}\right\rangle =(3/2)\cdot (L/4)=3L/8=0.375L$ . Эта сумма несколько ниже, чем в игре которая начинается независимо от суммы в открытом конверте.

Дискретная задача двух конвертов

$\textstyle \bullet$ Рассмотрим теперь дискретный вариант задачи двух конвертов. Пусть в конвертах может появится одно из следующих $\textstyle n+1$ чисел:

1,\;2,\;2^{2},\;2^{3},\;...,\;2^{n}.

Соответственно возможны следующие пары:

(1,2);\;(2,2^{2});\;(2^{2},2^{3});\;....;\;(2^{n-1},2^{n}),

Они выбираются равновероятно, затем конверты перемешиваются.

Чтобы по-возможности лишить игрока знания о краевых эффектах, снова ограничим его. Если в открытом конверте обнаруживается 1 или $\textstyle 2^{n}$ (крайние значения сумм), игрок ничего не выбирает и не получает (раунд игры пропускается). Во всех остальных случаях, как и прежде, он может забрать деньги из открытого конверта или выбрать вместо него закрытый.

Пусть, например, $\textstyle n=6$ , т.е. разрешены суммы от 1 до 64. В открытом конверте (если раунд игры не прекращён) равновероятно могут находится суммы от 2 до 32. Соответственно, во втором конверте, снова равновероятно, будут суммы в два раза больше или меньше. Изобразим это в виде следующего дерева:

Пары крайних значений 1,2 и 32,64 во втором конверте встречаются по разу, а остальные числа — по два раза. Поэтому гистограммы появления сумм в первом и втором конверте (число возможностей) имеют вид:

Для $\textstyle n+1$ чисел вероятность появления (в игре) в первом конверте сумм от 2 до $\textstyle 2^{n-1}$ одинаковые и равны $\textstyle 1/(n-1)$ . Чтобы найти вероятности во втором конверте необходимо посчитать число квадратиков в гистограмме. В нижнем ряду их $\textstyle n+1$ , а в верхнем $\textstyle n+1-4$ . Поэтому всего их $\textstyle 2(n-1)$ . В результате вероятности сумм в середине диапазона равны $\textstyle 1/(n-1)$ , а по краям — $\textstyle (1/2)/(n-1)$ .

Нарисуем эти два распределения:

При большом $\textstyle n$ заштрихованные области одинаковых вероятностей могут быть сколь угодно широкими. Кажется, что "краевыми эффектами" в этом случае можно пренебречь, оба конверта имеют одинаковые распределения и, следовательно, приносят одинаковый доход.

Однако это не так, даже при $\textstyle n\to \infty$ ! Действительно, найдём доход при выборе первого (открытого) конверта:

v_{1}={\frac {2+...+2^{n-1}}{n-1}}={\frac {2(2^{n-1}-1)}{n-1}}\to {\frac {2^{n}}{n}},

где использована известная формула для суммы геометрической прогрессии $\textstyle 1+q+q^{2}+...+q^{n}=(q^{n+1}-1)/(q-1)$ и записано выражение, к которому стремиться $\textstyle v_{1}$ при $\textstyle n\to \infty$ . Аналогично вычисляется средний доход при выборе второго конверта:

v_{2}={\frac {2+...+2^{n-2}}{n-1}}+{\frac {1+2+2^{n-1}+2^{n}}{2(n-1)}}={\frac {5}{4}}\,v_{1}.

Таким образом, относительная доходность второй стратегии при любом $\textstyle n$ больше на 25\%, чем для первой стратегии.

Разберёмся с тем, что получилось. Для больших $\textstyle n$ вклад в $\textstyle v_{1}$ или $\textstyle v_{2}$ левой границы (суммы 1 и 2) исчезающе мал и роли она не играет. Основной вклад в разницу средних даёт правая граница. И этот вклад остаётся, даже когда она формально отодвигается на бесконечность. Причина связана с быстрым (экспоненциальным) ростом величины суммы $\textstyle 2^{n}$ , потенциально получаемой во втором конверте. В тоже время эта сумма ни когда не встречается в первом конверте. При больших $\textstyle n$ она равна сумме всех денег до этой границы:

1+2+...+2^{n-1}=2^{n}-1.

Именно это приводит к тому, что относительная доходность выбора второго конверта оказывается больше, чем первого. Кажущийся парадокс возникает потому, что при $\textstyle n\to \infty$ существует сколь угодно много вариантов появления сумм в обоих конвертах, которые имеют одинаковую вероятность. Это и создаёт иллюзию равноправия конвертов.

Неравномерное распределение

В случае неравномерного распределения очевидно, что конверты неравноправны. Кроме функции $\textstyle P(x)$ необходимо фиксировать также правило формирования конвертов. Пусть ведущий игру, как и раньше, выбирает случайное число с распределением $\textstyle P(x)$ , считая его максимальной суммой. Минимальная получается из $\textstyle x$ делением на 2. Затем конверты перемешиваются.

Если известно распределение $\textstyle P(x)$ для случайной величины $\textstyle x$ , то распределение для величины $\textstyle y=x/2$ имеет вид $\textstyle 2P(2y)$ . Действительно, пусть вычисляется среднее от некоторой функции $\textstyle f(y)$ . Его можно вычислить при помощи вероятности $\textstyle P(x)$ :

\left\langle f(y)\right\rangle =\int \limits _{0}^{\infty }f(x/2)P(x)dx=\int \limits _{0}^{\infty }f(y)2P(2y)dy.

Во втором равенстве сделана замена переменной интегрирования $\textstyle x=2y$ . Так как последний интеграл усредняет $\textstyle f(y)$ по $\textstyle y$ , то множитель при функции и является плотностью распределения для $\textstyle y$ .

Таким образом, в приведенном выше алгоритме формирования случайно перемешанных конвертов, сумма $\textstyle x$ в открытом конверте имеет следующую плотность вероятности:

P_{o}(x)={\frac {1}{2}}\cdot P(x)+{\frac {1}{2}}\cdot 2P(2x).

В частности, среднее значение суммы в открытом конверте равно:

\left\langle x\right\rangle _{open}=\int \limits _{0}^{\infty }xP_{o}(x)dx={\frac {3}{4}}\,\int \limits _{0}^{\infty }x\,P(x)\,dx.

Естественно, что такая же сумма в среднем будет находиться и в закрытом конверте.

Найдём теперь оптимальную стратегию игры. Для определённости будем считать, что итоговая вероятность $\textstyle P_{o}(x)$ , обнаружить сумму $\textstyle x$ в открытом конверте монотонно снижается с ростом $\textstyle x$ . Тогда существует некоторая оптимальная константа $\textstyle x_{0}$ для которой следующая стратегия приносит максимальный доход:

$\textstyle \;v_{3}$ : Если в открытом конверте обнаружена сумма $\textstyle x$ и при этом $\textstyle x>x_{0}$ —
забираем открытый конверт, иначе — закрытый.

Наша задача состоит в вычислении оптимального значения $\textstyle x_{0}$ .

Запишем условное среднее. Если $\textstyle x>x_{0}$ , то $\textstyle v_{3}=x$ . Если же $\textstyle x<x_{0}$ , для закрытого конверта необходимо воспользоваться условными вероятностями. Если мы видим в открытом конверте сумму $\textstyle x$ , то вероятность того, что это меньшая сумма пропорциональна $\textstyle 2P(2x)$ . Вероятность большой суммы пропорциональна $\textstyle P(x)$ . Поэтому в этом случае:

v_{3}={\frac {2P(2x)}{2P_{o}(x)}}\cdot 2x+{\frac {P(x)}{2P_{o}(x)}}\cdot (x/2),\;\;\;\;\;\;\;if\;x<x_{0}.

Вероятности разделены на $\textstyle 2P_{o}(x)$ , чтобы сумма условных вероятностей была равна единице. Найдём среднее значение $\textstyle v_{3}$ :

\left\langle v_{3}\right\rangle =\int \limits _{0}^{\infty }v_{3}(x)P_{o}(x)dx=\int \limits _{0}^{x_{0}}x\left[2P(2x)+{\frac {1}{4}}\,P(x)\right]dx+\int \limits _{x_{0}}^{\infty }xP_{o}(x)dx.

После несложного преобразования, получаем:

\left\langle v_{3}\right\rangle =\int \limits _{0}^{x_{0}}x\cdot \left[P(2x)-{\frac {1}{4}}\,P(x)\right]\,dx+{\frac {3}{4}}\,\int \limits _{0}^{\infty }xP(x)dx.

Второй интеграл является средними доходом от пассивных стратегий. Первый интеграл — бонус за активность. Найдём его максимум, взяв производную по $\textstyle x_{0}$ и приравняв её нулю. Это даст следующее уравнение для определения $\textstyle x_{0}$ :

4P(2x_{0})=P(x_{0}).

Для определённости вычислим доходности для распределения в виде убывающей экспонентны:

P(x)=e^{-x}.

Это функция нормирована на единицу и имеет единичное среднее $\textstyle \left\langle x\right\rangle =1$ . Поэтому средний доход от пассивного выбора открытого или закрытого конвертов составляет $\textstyle \left\langle v_{1}\right\rangle =\left\langle v_{2}\right\rangle =3/4$ .

Оптимальное значение константы равно $\textstyle x_{0}=\ln 4$ . Соответственно, средний доход от активной стратегии будет равен:

\left\langle v_{3}\right\rangle ={\frac {3+\ln 16}{64}}+{\frac {3}{4}}={\frac {51+\ln 16}{64}}\approx 0.840197.

В результате, активная стратегия оказывается на 12\% более доходной, чем пассивные.

В случае немонотонных функций плотности распределения, эффективная доходность может быть существенно более затейливой, чем простой пороговый выбор одного или другого конверта.

Парадокс возвращается

Существует очень любопытная модификация парадокса для дискретных сумм с убывающими вероятностями. Она была предложена в Интернете при обсуждении классического парадокса двух конвертов участником SeTosha. Мы рассмотрим несколько более общую формулировку этой задачи.

Зафиксируем некоторое число $\textstyle q>1$ , и будем считать, что для игры формируются пары конвертов со следующими вероятностями:

{\begin{array}{r|ccccccc}envelopes:&(1,q)&(q,q^{2})&(q^{2},q^{3})&...&(q^{n-1},q^{n})&(q^{n},q^{n+1})&...\\\hline p_{i}=&1/2&1/4&1/8&...&1/2^{n}&1/2^{n+1}&...\end{array}}

Таким образом с вероятностью $\textstyle 1/2^{n}$ большая сумма в конверте равна $\textstyle q^{n}$ , а меньшая в $\textstyle q$ раз меньше, где $\textstyle n=1,2,...,\infty$ . Несложно видеть, что сумма всех вероятностей равна единице, и такое распределение вполне реализуемо на практике. Как и раньше, после того как в два конверта кладутся деньги, эти конверты случайным образом тасуются. В этом случае средний выигрыш от взятия суммы $\textstyle x$ из открытого конверта равен среднему выигрышу от выбора закрытого конверта.

Условное среднее при выборе открытого конверта равно $\textstyle v_{1}=x$ . Для закрытого конверта необходимо рассмотреть две ситуации. Если $\textstyle x=1$ , значит гарантированно, в закрытом конверте находится сумма $\textstyle v_{2}=q$ . Во всех остальных случаях, вероятность того, что в открытом конверте находится меньшая сумма в 2 раза выше, чем вероятность того, что это большая сумма. Следовательно условные вероятности равны $\textstyle 2/3$ и $\textstyle 1/3$ . Соответственно, условное среднее для закрытого конверта, если $\textstyle x=q^{n}$ , равно:

{\frac {1}{3}}\,q^{n-1}+{\frac {2}{3}}\,q^{n+1}={\frac {2+q^{2}}{3q}}\,q^{n}.

Поэтому условные стратегии от выбора открытого и закрытого конверта можно записать следующим образом:

v_{1}=q^{n},\;\;\;\;\;\;\;\;\;\;\;\;\;\;v_{2}=\left\{{\begin{array}{cl}q,&if\;n=0\\{\frac {2+q^{2}}{3q}}\,q^{n},&if\;n>0\end{array}}\right.

Теперь время парадокса. Пусть $\textstyle q=2$ (как и принимается в классической задаче двух конвертов). Тогда, при $\textstyle n>0$ имеем равенство стратегий $\textstyle v_{1}=v_{2}$ , а при $\textstyle n=0$ закрытый конверт лучше ( $\textstyle v_{2}=2$ против $\textstyle v_{1}=1$ ). Поэтому, при прочих равных, надо предпочесть закрытый конверт. Если же $\textstyle q>2$ , то для любых $\textstyle n$ условное среднее закрытого конверта больше: $\textstyle v_{2}>v_{1}$ . Но конверты-то неразличимы и равноправны!

Ошибки в вычислении условных средних нет. Поэтому, чтобы разобраться в чём дело, вычислим абсолютный средний доход при любом $\textstyle x$ . Вероятности $\textstyle p_{n}$ обнаружить при открытии конверта сумму $\textstyle x=q^{n}$ равны:

p_{0}={\frac {1}{4}},\;\;\;\;\;\;\;\;\;\;\;p_{n}={\frac {3}{2^{n+2}}}.

С $\textstyle p_{0}$ — понятно. Пара конвертов $\textstyle (1,q)$ выбирается с вероятностью $\textstyle 1/2$ . Каждый из конвертов может быть открыт также с вероятностью 1/2. Для всех остальных пар имеем $\textstyle (1/2)(1/2^{n})+(1/2)(1/2^{n+1})=3/2^{n+2}$ . Естественно абсолютные средние доходности оказываются равными:

\left\langle v_{1}\right\rangle \;\;\;=\;\;\;{\frac {1}{4}}\cdot 1+\sum _{n=1}^{\infty }{\frac {3}{2^{n+2}}}\cdot q^{n}\;\;\;=\;\;{\frac {1+q}{2(2-q)}}.

\left\langle v_{2}\right\rangle ={\frac {1}{4}}\cdot q+\sum _{n=1}^{\infty }{\frac {3}{2^{n+2}}}\cdot {\frac {2+q^{2}}{3q}}\,q^{n}={\frac {1+q}{2(2-q)}}.

Несложно видеть, что при $\textstyle q\geqslant 2$ эти выражения теряют смысл. В этом и кроется корень проблемы. Если $\textstyle 1<q<2$ , то дробь $\textstyle (2+q^{2})/(3q)$ меньше единицы, поэтому сравнить условные средние $\textstyle v_{1}$ и $\textstyle v_{2}$ не представляется возможным. Если $\textstyle n=0$ , то больше $\textstyle v_{2}$ , в противном случае — больше $\textstyle v_{1}$ . Поэтому единственный способ, на основании этих условных вероятностей принять правильное решение, это их усреднить. В результате оказывается, что выбор конверта роли не играет: $\textstyle \left\langle v_{1}\right\rangle =\left\langle v_{2}\right\rangle =(1+q)/(2(2-q))$ . Точка $\textstyle q=2$ оказывается пороговой, как для возможности однозначного сравнения условных средних, так и для сходимости рядов при усреднении по всем $\textstyle x$ .

И всё же, почему же нельзя сравнивать условные средние при $\textstyle q\geqslant 2$ ? Да их усреднение невозможно (даёт бесконечный результат). Однако если при любом условии $\textstyle x$ для конечных условных средних всегда $\textstyle v_{2}>v_{1}$ , то хочется сделать вывод, что закрытый конверт лучше. Хотя понятно, что это заведомо неверный вывод. В чём дело?

Дело, по всей видимости, в математическом смысле условного среднего. Говоря, что при данном $\textstyle x$ условная средняя доходность равна $\textstyle v_{2}(x)$ мы подразумеваем, что для неё должно выполняться условие нормировки, как и для распределения вероятностей $\textstyle P(x)$ . При усреднении по всем возможным $\textstyle x$ должно получаться осмысленное (конечное) выражение. Если этого не происходит, то функция $\textstyle v_{2}(x)$ плохо определена. Также как плохо определено ненормируемое распределение $\textstyle P(x)$ . В этом случае выводы на основе сравнения различных условных средних могут оказаться ошибочными. Всё как в школе: на ноль делить нельзя и точка.

Компьютерное моделирование

Решение или проверка решения задач по теории вероятности почти всегда могут быть реализованы при помощи компьютера. Ниже приведен исходный код на C++, который моделирует игру с непрерывным постоянным распределением вероятностей шириной $\textstyle L$ .

#include <stdlib.h>
#include <stdio.h>
#include <math.h> 
#include <time.h> 

// случайное число [0 .. 1]
inline double Rnd(){ return double(rand()) / double(RAND_MAX); }          

void main()
{
   srand(time(0));                         // встряхиваем генератор
   double c[2];                            // конверты
   double L = 1;                           // граница

   int n=0;                                // число игр
   double v1=0, v2=0, v3=0;                // заработки от стратегий
   for(int iter=0; iter<10000000; iter++){
      c[0]=Rnd()*L;
      c[1]=c[0]/2;

      int i1 = rand()%2;                    // номер открытого конверта
      int i2 = (i1+1)%2;                    // номер закрытого конверта

      //if(c[i1]>L/2) continue;             // прерываем раунд

      v1+=c[i1];                            // доходы от стратегий:
      v2+=c[i2];
      v3+=( (c[i1]>L/2)? c[i1]: c[i2] );
      n++;
   }
   v1/=n; v2/=n; v3/=n;                     // среднее значение

   printf("v1=%.4f\tv2=%.4f\tv3=%.4f\n", v1, v2, v3);
}

Закомментированная строка соответствует дополнительному условию по началу игры (прерываем раунд). Любое компьютерное моделирование требует проведения статистической оценки достоверности полученных результатов. Можно поступить проще и поставить встряхиватель случайных чисел (строка srand(time(0)); ). Несколько последовательных запусков позволят увидеть, какая цифра "дёргается". Это и есть примерная ошибка моделирования.

Немного философии

Мы проанализировали задачу двух конвертов на примере равномерного распределения непрерывных и дискретных случайных чисел. Если игра происходит без ограничений (т.е. нет селекции открытого конверта), то доходность выбора открытого и закрытого конвертов одинаковы, как и следует из соображений симметрии. Однако при этом существует стратегия с большей доходностью, учитывающая значение суммы, лежащей в открытом конверте. Если же в зависимости от суммы в открытом конверте игра прекращается (ослабление краевого эффекта), то симметрия между конвертами нарушается. В открытом может лежать только сумма $[0,L/2]$ , тогда как в закрытом она находится в диапазоне $[0,L]$ . Поэтому и доходность выбора закрытого конверта выше, чем открытого. Основная сложность, заложенная в парадокс, связана с корректным вычислением условного среднего, требующего использования условных вероятностей.

Иногда на форумах при обсуждении задачи о двух конвертах, задаётся следующий вопрос:

Хорошо. Выбрав конкретные правила игры (=распределение) можно показать, что противоречия нет. Но как быть, если игрок не знает каким образом формируются конверты и суммы в них. В этом же случае вероятности по-любому 50/50?

На самом деле этот вопрос выходит за рамки теории вероятности, которая применяется для решения задачи. Важно понимать, что отсутствие знания не свидетельствует о равновероятности исходов. Наоборот, равновероятность возникает, если мы уверены в симметричности исходов (например, подбрасывая монету).

незнание $\neq$ равновозможности

Теория вероятности может оперировать только вероятностями, которые заданны из соображений симметрии или получены в эмпирическом исследовании. В последнем случае предполагается их стационарность (неизменность вероятностей во времени).

Стоит напомнить старую шутку про блондинку, которая уверена, что завтра утром она с вероятностью 1/2 встретит динозавра, потому, что она его либо встретит, либо не встретит. Во времена культа политкорректности, эта шутка не актуальна и сейчас уже все блондинки знают, что динозавры давно вымерли ${\ddot {\smile }}$ .

Степанов Сергей по просьбе Степанова Дениса

(с) 2010, synset.com

Материалы статьи могут быть использованы в некоммерческих и public information целях на условиях лицензии GNU Free Documentation License (версии 1.2 или более поздней). При использовании необходима ссылка на источник: http://synset.com/ru/Парадокс_двух_конвертов

@@ Строка 244: / Строка 244: @@
 В случае немонотонных функций плотности распределения, эффективная доходность может быть существенно более затейливой, чем простой пороговый выбор одного или другого конверта.
+==Парадокс возвращается==
+Существует очень любопытная модификация парадокса для дискретных сумм с убывающими вероятностями. Она была предложена в Интернете при обсуждении классического парадокса двух конвертов участником SeTosha. Мы рассмотрим несколько более общую формулировку этой задачи.
+Зафиксируем некоторое число <math>\textstyle q>1</math>, и будем считать, что для игры формируются пары конвертов со следующими вероятностями:
+:<center><math>\begin{array}{r|ccccccc} envelopes: & (1, q) & (q,q^2) & (q^2,q^3) & ... & (q^{n-1},q^{n}) & (q^n,q^{n+1}) &...\\ \hline p_i=& 1/2 & 1/4 & 1/8 & ... & 1/2^{n} & 1/2^{n+1} &... \end{array}</math></center>
+Таким образом с вероятностью <math>\textstyle 1/2^n</math> большая сумма в конверте равна <math>\textstyle q^{n}</math>, а меньшая в <math>\textstyle q</math> раз меньше, где <math>\textstyle n=1,2,...,\infty</math>. Несложно видеть, что сумма всех вероятностей равна единице, и такое распределение вполне реализуемо на практике. Как и раньше, после того как в два конверта кладутся деньги, эти конверты случайным образом тасуются. В этом случае средний выигрыш от взятия суммы <math>\textstyle x</math> из открытого конверта равен среднему выигрышу от выбора закрытого конверта.
+Условное среднее при выборе открытого конверта равно <math>\textstyle v_1=x</math>. Для закрытого конверта необходимо рассмотреть две ситуации. Если <math>\textstyle x=1</math>, значит гарантированно, в закрытом конверте находится сумма <math>\textstyle v_2 = q</math>. Во всех остальных случаях, вероятность того, что в открытом конверте находится меньшая сумма в 2 раза выше, чем вероятность того, что это большая сумма. Следовательно условные вероятности равны <math>\textstyle 2/3</math> и <math>\textstyle 1/3</math>. Соответственно, условное среднее для закрытого конверта, если <math>\textstyle x=q^n</math>, равно:
+:<center><math>\frac{1}{3}\,q^{n-1} + \frac{2}{3}\,q^{n+1} = \frac{2+q^2}{3q}\, q^{n}.</math></center>
+Поэтому условные стратегии от выбора открытого и закрытого конверта можно записать следующим образом:
+:<center><math>v_1=q^n,\;\;\;\;\;\;\;\;\;\;\;\;\;\; v_2= \left\{ \begin{array}{cl} q, & if\;n=0\\ \frac{2+q^2}{3q}\, q^{n}, & if\;n>0 \end{array} \right.</math></center>
+Теперь время парадокса. Пусть <math>\textstyle q=2</math> (как и принимается в классической задаче двух конвертов). Тогда, при <math>\textstyle n>0</math> имеем равенство стратегий <math>\textstyle v_1=v_2</math>, а при <math>\textstyle n=0</math> закрытый конверт лучше (<math>\textstyle v_2=2</math> против <math>\textstyle v_1=1</math>). Поэтому, при прочих равных, надо предпочесть закрытый конверт. Если же <math>\textstyle q>2</math>, то для любых <math>\textstyle n</math> условное среднее закрытого конверта больше: <math>\textstyle v_2>v_1</math>. Но конверты-то неразличимы и равноправны!
+Ошибки в вычислении условных средних нет. Поэтому, чтобы разобраться в чём дело, вычислим абсолютный средний доход при любом <math>\textstyle x</math>. Вероятности <math>\textstyle p_n</math> обнаружить при открытии конверта сумму <math>\textstyle x=q^n</math> равны:
+:<center><math>p_0 = \frac{1}{4},\;\;\;\;\;\;\;\;\;\;\;p_n=\frac{3}{2^{n+2}}.</math></center>
+С <math>\textstyle p_0</math> &mdash; понятно. Пара конвертов <math>\textstyle (1,q)</math> выбирается с вероятностью <math>\textstyle 1/2</math>. Каждый из конвертов может быть открыт также с вероятностью 1/2. Для всех остальных пар имеем <math>\textstyle (1/2)(1/2^{n})+(1/2)(1/2^{n+1})=3/2^{n+2}</math>. Естественно абсолютные средние доходности оказываются равными:
+:<center><math>\left\langle v_1\right\rangle \;\;\;=\;\;\; \frac{1}{4}\cdot 1 + \sum^\infty_{n=1} \frac{3}{2^{n+2}}\cdot q^{n} \;\;\;=\;\;\frac{1+q}{2(2-q)}.</math></center>
+:<center><math>\left\langle v_2\right\rangle = \frac{1}{4}\cdot q + \sum^\infty_{n=1} \frac{3}{2^{n+2}}\cdot \frac{2+q^2}{3q}\,q^{n} = \frac{1+q}{2(2-q)}.</math></center>
+Несложно видеть, что при <math>\textstyle q\geqslant 2</math> эти выражения теряют смысл. В этом и кроется корень проблемы. Если <math>\textstyle 1<q<2</math>, то дробь <math>\textstyle (2+q^2)/(3q)</math> меньше единицы, поэтому сравнить условные средние <math>\textstyle v_1</math> и <math>\textstyle v_2</math> не представляется возможным. Если <math>\textstyle n=0</math>, то больше <math>\textstyle v_2</math>, в противном случае &mdash; больше <math>\textstyle v_1</math>. Поэтому единственный способ, на основании этих условных вероятностей принять правильное решение, это их усреднить. В результате оказывается, что выбор конверта роли не играет: <math>\textstyle \left\langle v_1\right\rangle =\left\langle v_2\right\rangle =(1+q)/(2(2-q))</math>. Точка <math>\textstyle q=2</math> оказывается пороговой, как для возможности однозначного сравнения условных средних, так и для сходимости рядов при усреднении по всем <math>\textstyle x</math>.
+И всё же, почему же нельзя сравнивать условные средние при <math>\textstyle q\geqslant 2</math>? Да их усреднение невозможно (даёт бесконечный результат). Однако если при любом условии <math>\textstyle x</math> для конечных условных средних всегда <math>\textstyle v_2>v_1</math>, то хочется сделать вывод, что закрытый конверт лучше. Хотя понятно, что это заведомо неверный вывод. В чём дело?
+Дело, по всей видимости, в математическом смысле условного среднего. Говоря, что при данном <math>\textstyle x</math> условная средняя доходность равна <math>\textstyle v_2(x)</math> мы подразумеваем, что для неё должно выполняться условие нормировки, как и для распределения вероятностей <math>\textstyle P(x)</math>. При усреднении по всем возможным <math>\textstyle x</math> должно получаться осмысленное (конечное) выражение. Если этого не происходит, то функция <math>\textstyle v_2(x)</math> плохо определена. Также как плохо определено ненормируемое распределение <math>\textstyle P(x)</math>. В этом случае выводы на основе сравнения различных условных средних могут оказаться ошибочными. Всё как в школе: на ноль делить нельзя и точка.
 ==Компьютерное моделирование==

Парадокс двух конвертов — различия между версиями

Версия 18:42, 13 сентября 2010

Содержание

Формулировка парадокса

Уточнение задачи

Равномерное ограниченное распределение

Дискретная задача двух конвертов

Неравномерное распределение

Парадокс возвращается

Компьютерное моделирование

Немного философии

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

почитай

Инструменты