Вероятность находится в голове

Элиезер Юдковский

Вчера я говорил об ошибке проецирования ума, рассматривая пример монстра-пришельца, который уносил девушку в порванном платье, об ошибке, которую я приписал тому, что художник думал о сексуальности женщины как о свойстве самой женщины, женщина.сексуальность, а не о чём-то, что существует исключительно в голове наблюдателя и, вероятно, не существует в голове пришельца.

Термин «ошибка проецирования ума» был введён великим покойным мастером байесианства Э. Т. Джейнсом. Джейнс полагал, что вероятности существуют в уме — не в окружении, — что вероятности выражают незнание, состояние частичной информации, и если я не знаю что-либо о явлении, то это говорит о состоянии моего ума, и ничего не говорит о явлении.

Я не могу отдать должное этому древнему спору, оставаясь при этом кратким, но я приведу классический пример.
У вас есть монета.
Монета несимметрична.
Вы не знаете, какая именно сторона выпадает чаще и насколько чаще. Кто-то сказал вам о том, что монета несимметрична и ничего больше.
Больше никакой информации у вас нет.

Вы вытаскиваете монету, подкидываете её, ловите.

А теперь, прежде чем убрать руку и взглянуть на результат, можете ли вы сказать, что вы приписываете вероятность 0,5 тому, что монета упала орлом?

Частотник (сторонник частотного определения вероятности — прим. перев.) скажет «Нет. Сказать, что вероятность равна 0,5, значит подразумевать, что монета имеет неотъемлемое свойство падать орлом так же часто, как и решкой, а значит, если мы подкинем монету бесконечное число раз, то отношение орлов и решек будет стремиться к 1:1. Но мы знаем, что монета несимметрична, поэтому она может иметь любую вероятность выпадения орла кроме 0,5».

Байесианец же скажет, «Неопределённость существует на карте, не на территории. В реальном мире монета выпадет либо орлом, либо решкой. Любой разговор о вероятности должен отражать ту информацию, которую я имею о монете — моё состояние частичного незнания и частичного знания, — а не какую-то там информацию о монете. Более того, у меня есть теоремы на любой вкус, показывающие, что если я не буду рассматривать моё частичное знание определённым образом(English), то я буду делать глупые ставки. Если мне придётся учитывать результат броска монеты при составлении плана, то я буду планировать исходя из состояния неопределённости 50:50, в котором я не могу сказать, что исходы, при которых выпадают орлы, имеют больший вес, чем исходы, при которых выпадают решки. Вы можете называть это число как угодно, но я не намерен подчиняться законам теории вероятностей из страха показаться глупым. Таким образом, я не испытываю ни малейшей нерешительности, когда называю такое взвешивание исходов вероятностью».

Я на стороне байесианцев. Вы могли это уже заметить.

Ещё до того как симметричная монета подброшена в воздух, мнение о том, что она имеет неотъемлемую вероятность 50% упасть орлом может быть элементарно ошибочно. Может быть вы держите монету таким образом, что она гарантированно упадёт орлом или решкой, при данной силе, с которой вы подбрасываете её, и при данных движениях воздуха вокруг вас. Но если вы не знаете каким образом смещены вероятности монеты в данном конкретном случае, то что?

Если я не ошибаюсь, было судебное разбирательство, в котором истец предъявлял претензии организаторам лотереи: карточки с именами участников не были перемешаны достаточно тщательно и поэтому шансы были не равны. Судья выслушал и спросил: «Кто именно имел больше шансов?»

Чтобы сделать эксперимент с монеткой повторяемым, как того имеют обыкновение требовать частотники, мы можем создать автоматический подбрасыватель монет и убедиться, что результаты 50% орлов и 50% решек. Но, быть может, робот с особо чувствительными глазами и хорошим пониманием физики сможет, наблюдая за приготовлениями автоподбрасывателя, предсказать падение монеты заранее — пускай и не совершенно определённо, но, допустим, с точностью 90%. И чем тогда будет настоящая вероятность в этом случае?

Не существует «настоящей вероятности». Робот имеет какую-то частичную информацию. Вы имеете другую частичную информацию. Монета не имеет ума и не владеет никакой информацией, она не назначает никаких вероятностей, она просто взлетает в воздух, переворачивается несколько раз, сталкиваясь с каким-то количеством молекул воздуха, а затем приземляется либо орлом, либо решкой.

Это байесианская точка зрения, и я, пожалуй, покажу несколько классических головоломок, которые обретают свою головоломность из-за склонности думать о вероятностях, как о неотъемлемых свойствах объектов.

Начнём со старой классики: вы встретили на улице математика и она случайно упомянула, что у неё два ребёнка. Вы спросили: «Хотя бы один из них мальчик?» Она ответила: «да».

Какова вероятность того, что она родила двоих мальчиков? Если вы предположите, что вероятность того, что ребёнок — мальчик, равна 1/2, то вероятность того, что она имеет двух мальчиков равна 1/3. Априорные вероятности такие: 1/4 для двух мальчиков, 1/2 для мальчика и девочки, 1/4 для двух девочек. Ответ математика «да» имеет вероятность ~1 в первых двух случаях и ~0 в третьем. Перенормируя вероятности мы получаем 1/3 вероятности двух мальчиков, и 2/3 вероятности мальчика с девочкой.

Предположим теперь, что вы задали другой вопрос: «Старший ребёнок — мальчик?» и математик ответила «да». Тогда вероятность того, что математик имеет двоих мальчиков будет равна 1/2. Поскольку старший ребёнок — мальчик, а младший может быть кем ему нравится.

То же самое, если бы вы спросили «Младший ребёнок — мальчик?» Вероятность двоих мальчиков опять же 1/2.

В этом случае, если хотя бы один ребёнок — мальчик, то он должен быть либо старшим, либо младшим. Так каким образом ответ в первом случае отличается от ответа в двух других?

Есть другой похожий пример: допустим, у меня есть четыре карты — туз червей, туз пик, двойка червей и двойка пик. Я беру из них в руку две карты случайным образом. Вы спрашиваете меня: «Держишь ли ты хотя бы одного туза?» и я отвечаю «Да». Какова вероятность того, что я держу пару тузов? Ответ 1/5. Существует шесть различных комбинаций из двух карт с равной априорной вероятностью, и вы исключили возможность, что я держу пару двоек. Из пяти оставшихся комбинаций только одна является парой тузов. Таким образом ответ — 1/5.

Теперь предположим, что вы спросили меня: «Держишь ли ты туза пик?» Если я отвечу «да», то вероятность того, что другая карта — туз червей равна 1/3. (Вы знаете, что я держу туза пик, и существует три возможных варианта для другой карты, туз червей — ровно один из них.) Точно так же, если вы спросите меня «Держишь ли ты туза червей?» и я отвечу «да», то вероятность того, что я держу пару тузов равна 1/3.

Но как такое может быть, если в случае вопроса «держишь ли ты по крайней мере одного туза» и ответа «да», вероятность того что я имею пару была 1/5? Я должен был держать либо туза пик, либо туза червей, как вы знали; и в любом случае вероятность того, что я держу пару тузов равна 1/3.

Как такое может быть? Может я вычитал какие-то вероятности неверно?

Если вы хотите выяснить это самостоятельно, то сделайте это сейчас, потому что я собираюсь раскрыть…

Все указанные расчёты верны.

Что же до парадокса, то его нет. Видимость парадокса возникает из-за того, что вероятности рассматриваются как свойства карт. Туз, которого я держу, может иметь масть либо червей, либо пик; но это не означает, что ваше знание о моих карт должно быть одинаковым, если вы знаете, что я держу червей, или вы знаете, что я держу пики.

Тут может помочь теорема Байеса:

P(H|E) = P(E|H)P(H) / P(E)

Последняя часть, где вы делите на P(E) — это часть, где вы отбрасываете все остальные возможности, которые были исключены и перенормируете ваши вероятности к тому, что осталось.

Давайте рассмотрим вопрос «Держишь ли ты по крайней мере одного туза?» Прежде чем я ответил, ваша вероятность того, что я скажу «да» должна была быть 5/6.

Но если вы спросили меня «держишь ли ты туза пик?», то ваши априорная вероятность того, что я скажу «да», всего лишь 1/2.

То есть, как вы видите, вы узнаёте весьма разные вещи в этих двух разных случаях. Вам придётся исключать какие-то различные возможности и перенормировать используя разную P(E). Если вы узнаете разные свидетельства, то вам не следует удивляться, если в результате вы приходите к разной частичной информации.

Точно так же, если я спросил математика «Есть ли среди твоих детей мальчик», то я ожидал услышать «да» с вероятностью 3/4, но если бы я спросил «старший ребёнок — мальчик?», то я бы ожидал услышать «да» с вероятностью 1/2. Таким образом, совершенно неудивительно, что я пришёл к разному частичному знанию, зависящему от того, какой именно из этих двух вопросов я задал.

Единственная причина, почему видится парадокс, в том, что вероятность пары тузов рассматривается как свойство карт которые имеют, по крайней мере, одного туза, или как свойство карт, которые, как выясняется, содержат туза пик. В этом случае, для набора карт, имеющего по крайней мере одного туза, было бы парадоксальным иметь прирождённую вероятность пары равную 1/5, в то время как наборы карт, имеющие одного туза пик, имеют прирождённую вероятность пары равную 1/3, и наборы карт, имеющие туза червей, имеют прирождённую вероятность пары 1/3.

Точно так же, если вы считаете о вероятности 1/3 того, что оба ребёнка мальчики — это прирождённое свойство наборов детей, которые включают хотя бы одного мальчика, то это не совместимо с наборами детей, из которых старший мальчик, имеющими прирождённую вероятность 1/2 того, что оба мальчики, также как и наборы детей, имеющие младшего мальчика, имеют врождённую вероятность того, что оба мальчики. Это было бы тоже самое, как говорить «все зелёные яблоки весят по фунту, все красные яблоки весят по фунту, и все яблоки, которые зелёные или красные, весят по полфунта».

Это то, что случается, когда вы начинаете думать о вероятностях как о чём-то, что содержится в вещи, вместо того, чтобы рассматривать вероятности как отражение частичной информации о вещи.

Вероятности отражают неопределённости, и только те, кто действует могут находится в неопределённом состоянии. Пустая карта не соответствует пустой территории. Незнание существует в голове.

Перевод: 

kuuff
  • Короткая ссылка сюда: lesswrong.ru/195