Правило Байеса: пропорции

Материал из Вики LessWrong.ru
Перейти к: навигация, поиск

Если Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle H_i} и Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle H_j} это гипотезы и Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle e} это свидетельство, то правило Байеса гласит:

Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle \dfrac{\mathbb P(H_i)}{\mathbb P(H_j)} \times \dfrac{\mathbb P(e\mid H_i)}{\mathbb P(e\mid H_j)} = \dfrac{\mathbb P(H_i\mid e)}{\mathbb P(H_j\mid e)}}

В задаче про Болезнит, мы использовали эту форму ТБ чтобы оправдать вычисление апостериорных шансов этой болезни с помощью такой процедуры: Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle (1 : 4) \times (3 : 1) = (3 : 4).}

В условиях задачи сказано, что Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle 20%} заражены, у Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle 90%} больных химический тест изменит цвет на черный, и у Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle 30%} здоровых произойдет то же самое. И мы, используя ту же форму правила Байеса можем оправдать такой способ вычислений: Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle (1 : 4) \times (3 : 1) = (3 : 4).}

Если вместо того, чтобы рассматривать соотношения как шансы, мы действительно вычислим ответы для каждой переменной, то получим Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle \frac{1}{4} \times \frac{3}{1} = \frac{3}{4},} или Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle 0.25 \times 3 = 0.75.}

Если попробовать это интерпретировать буквально, то получится что-то вроде: "Если начальные шансы пациента утверждают, что он в Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle 0.25} вероятней окажется больным, и положительные результаты теста случаются в Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle 3} раз чаще для больных, и у данного пациента тест дал положительный результат, то можно сделать вывод о том, что пациент теперь окажется больным в Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle 0.75} раз"

Это обоснованные рассуждения, и называются они пропорциональной формой правила Байеса. Чтобы получить отсюда вероятности, мы рассуждаем так: если у нас на каждого здорового пациента приходится Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle 0.75} больных, то у нас всего Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle 0.75/(0.75 + 1) = 3/7 = 43%} больных.

Прожекторная визуализация

Можно рассмотреть это с такой точки зрения: раз уж соотношение шансов получается эквивалентным после перемножения на положительную константу, то мы можем заменить правую часть уравнения на Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle 1} и рассмотреть лишь левую часть. Это мы и делали, когда использовали форму вычисления Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle (0.25 : 1) \cdot (3 : 1) = (0.75 : 1),} подсказанную доказанной ТБ.

Мы можем визуализировать правило Байеса для двух гипотез с помощью двух прожекторов с разной интенсивностью луча, которые (лучи) проходят сквозь усиливающие или ослабляющие каждый юнит света на определенный множитель линзы. В контексте задачи про Болезнит, мы можем настроить правый синий луч на интенсивность Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle 1} и линзу с коэффициентом Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle 1} , а для левого луча выставить интенсивность Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle 0.25} и линзу Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle 3x} . Результатом будет визуализация вычислений по ТБ:

Отметьте совпадения с водопадными диаграммами. Прожекторная визуализация добавляет возможность вообразить изменения абсолютной интенсивности лучей и линз, сохраняя при этом их относительную интенсивность так, что правый луч и линза имеют значение Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle 1} .

Применение в неформальной обстановке

Пропорциональная форма ТБ, возможно, является самым быстрым способом описать байесианские рассуждения так, чтобы они звучали правдоподобно. Если бы вы писали историю, где вымышленные персонажи внезапно должны были бы выдать байесианский аргумент для читателей, большинство из которых про ТБ и не слышали, вы могли бы написать что-то вроде:

Предположим, что метка действительно никуда не исчезает, пока сознание Тёмного Лорда продолжает жить, но априори у нас есть лишь догадка, что с двадцатипроцентной вероятностью Тёмная метка продолжает существовать и после смерти Тёмного Лорда. Тогда наблюдение «Тёмная метка не исчезла» происходит в пять раз вероятнее в мире, где Тёмный Лорд жив, чем в мире, где Тёмный Лорд мёртв. Это соразмерно априорной невероятности бессмертия? Допустим, первичные шансы против того, что Тёмный Лорд выжил — сто к одному. Если вероятность, что некая гипотеза скорее неверна, в сто раз больше, чем если она верна, и вы наблюдаете свидетельство, которое появляется в пять раз вероятнее, когда гипотеза верна, чем когда она не верна, то теперь у нас получается, что вероятность, что эта гипотеза неверна в двадцать раз больше, чем если она верна.

Точно так же, если вы доктор, который объясняет значение положительного результата пациенту, вы можете сказать что-то вроде: "До того, как мы пронаблюдали результат теста, мы знали, что пациент вроде вас в тысячу раз вероятней будет здоровым, чем больным. И этот тест лишь в сто раз вероятней покажет положительный результат для больного пациента, чем для здорового. Теперь же я думаю, что вы в десять раз вероятней окажетесь здоровым, а это все еще очень неплохие шансы!"

Водопадные диаграммы и специальные нотации для шансов и соотношения условных вероятностей могут сделать ТБ более интуитивно понятной, но пропорциональная форма - наиболее валидно-звучащая вещь, которая одновременно корректна с точки зрения чисел и при этом ее можно легко выразить словами.

Статьи по теме