Открыть главное меню

Вики LessWrong.ru β

Изменения

Правило Байеса: шансы

12 239 байт добавлено, 18:10, 4 декабря 2023
м
Золотая страница
{{Golden}} {{Arbital|bayes_rule_odds|Introduction to Bayes' rule: Odds form}} В одной из формулировок байесовское правило выглядит так: '''априорные шансы х соотношение условных шансов = апостериорные шансы'''.
Если мы рассмотрим [[Водопадные диаграммы и относительные шансы|водопадную визуализацию проблемы с Болезнитом]], то будет наглядно видно, как относительные шансы помогают думать про два потока на вершине водопада.
</gallery>
Пропорциональное соотношение воды из красного потока к воде из синего будет тем же, независимо от того идет ли речь 200 и 800 литрах в секунду или о 20 000 20 000 и 80 000 80 000 литрах в секунду илл о 1 и 4 л/с. Пока и остальная часть водопада способствует сохранению пропорции, мы будем получать такую же пропорцию красной и синей воды внизу. Таким образом мы вполне оправданно можем игнорировать количество воды и рассматривать лишь пропорции.
Точно так же, важно пропорциональное соотношение между количеством попадающей в фиолетовый водоем воды из красного потока к количеству из синего, и соотношение между количеством молекул из каждого литра. Вниз падает 4545 % и 1515 % красной и синей воды и точно такое же соотношение между красной и синей водой внизу - 90внизу — 90 % и 3030 %.
<gallery>
</gallery>
И это оправдывает игнорирование специфической информации о том что 9090 % красной воды падает вниз и 3030 % синей падает вниз, ведь это можно легко заменить соотношением (3 : 1). Это можно применить и для других проблем: предположим, что у нас есть медицинский тест, выявляющий болезнь с истинноположительной точностью в 90 % (10 % ложноотрицательных) и 30 % ложноположительных (70 % ложноотрицательных). Положительный результат такого теста будет свидетельством такой же силы, как и для теста с 60 % истинноположительными и 20 % ложноположительными. А отрицательный результат такого теста будет свидетельством такой же силы, как и для теста с 9 % ложноотрицательных и 63 % истинноотрицательных. В целом, сила свидетельства является соотношением того, насколько более/менее вероятными разные возможные состояния мира делают наблюдению специфических феноменов. Но об этом позже. == Уравнение ==Чтобы действительно выразить ТБ в формулах и доказать ее, нам потребуется ввести несколько новых обозначений. === Условная вероятность ===Во-первых, если <math>X</math> это утверждение, то <math>P(X)</math> это [[вероятность]] <math>X.</math> Другими словами: <math>X</math> это что-то истинное или ложное в действительности, но у нас есть какая-то неопределенность по этому поводу, и <math>P(X)</math> — это способ выразить [[lwru:/Интерпретации «вероятности»|уровень нашей убежденности]] в том, что <math>X</math> истинно. Пациент, на самом деле, либо болен либо здоров, но если вы не уверены, свидетельство может способствовать сдвигу субъективной вероятности к 43 % в пользу того, что он болен.
Это можно применить и для других проблем: предположим<math>\mathbb \neg X</math> означает «<math>X</math> ложно», так что у нас есть медицинский тест, выявляющий болезнь с истинноположительной точностью в 90% <math>\mathbb P(10% ложноотрицательных\neg X) и 30% ложноположительных (70% ложноотрицательных). Положительный результат такого теста будет свидетельством такой же силы</math> означает «вероятность, как и для теста с 60% истинноположительными и 20% ложноположительными. А отрицательный результат такого теста будет свидетельством такой же силы, как и для теста с 9% ложноотрицательных и 63% истинноотрицательныхчто <math>X</math> ложно».
В целомЗадача про Болезнит включала больше утверждений посложней, сила свидетельства является соотношением того, насколько более/менее вероятными разные возможные состояния мира способствуют наблюдению специфических феноменов. Но об этом позже.например:
Уравнение* Вероятность в 90 %, что у пациента почернеет депрессор, при условии что он заражен.* Вероятность в 30 %, что у пациента почернеет депрессор, при условии что он здоров.* Вероятность в 3/7, что пациент заражен, при условии, что его депрессор почернел.
Чтобы действительно <gallery>3MIl3s5K.png</gallery> В этих случаях мы идем от факта про который мы «знаем» или «предполагаем», что он истинен (справа), к утверждению (слева), вероятность которого мы оцениваем, принимая во внимание «известный» факт. Такие вероятностные утверждения называются «условными вероятностями». Если выразить ТБ приведенные выше утверждения с помощью стандартных формул, то они будут выглядеть так: * <math>\mathbb P(blackened \mid sick) = 0.9</math> * <math>\mathbb P(blackened \mid \neg sick) = 0.3</math> * <math>\mathbb P(sick \mid blackened) = 3/7</math> (прим. blackened — почерневший депрессор; sick — зараженный) <sarcasm>Стандартная запись <math>\mathbb P(X \mid Y)</math> означающая «вероятность <math>X</math>, при условии что <math>Y</math> истинно», содержит «полезную» вертикальную линию, которая, в свою очередь, не дает никаких визуальных подсказок о том, что справа находится предполагаемый факт, а слева — выводимый. </sarcasm> Вот как определяется условная вероятность, при использовании обозначений <math>X \wedge Y</math> для обозначения «X и Y» или же «оба <math>X</math> и <math>Y</math> истинны»: <math>\mathbb P(X \mid Y) := \frac{\mathbb P(X \wedge Y)}{\mathbb P(Y)}</math> То есть с точки зрения задачи с Болезнитом, <math>\mathbb P(sick \mid blackened)</math> вычисляется путем деления 18 % больных студентов с почерневшим депрессором (<math>\mathbb P(sick \wedge blackened)</math>) на 42 % всех с почерневшим депрессором (<math>\mathbb P(blackened)</math>). Или рассмотрим <math>\mathbb P(blackened \mid \neg sick),</math> — вероятность того, что депрессор почернеет, при условии что пациент здоров. Что эквивалентно делению 24 здоровых студентов с почерневшим депрессором на 80 здоровых. 24 / 80 = 3/10, что соответствует 30 % ложноположительных результатов из начальных условий. Закон условных вероятностей можно выразить так: "Сосредоточим все внимание на возможных мирах, где <math>Y</math> истинно, или истинны Y-подобные штуки. Рассматривая лишь случаи где <math>Y</math> истинно, сколько мы найдем случаев внутри этого множества, где еще и <math>X</math> истинно? То есть где истинно <math>Y</math> и <math>X</math>? Для получения дополнительной информации обратитесь к статье про [[Условная вероятность|условные вероятности]]. === Правило Байеса ===Правило Байеса гласит: '''априорные шансы х соотношение условных шансов = апостериорные шансы'''. Что для задачи про Болезнит будет выглядеть так: <math>\dfrac{\mathbb P({sick})}{\mathbb P(healthy)} \times \dfrac{\mathbb P({blackened}\mid {sick})}{\mathbb P({blackened}\mid healthy)} = \dfrac{\mathbb P({sick}\mid {blackened})}{\mathbb P(healthy\mid {blackened})}.</math>(прим. blackened — почерневший депрессор; sick — зараженный; healthy — здоровый) [[Априорная вероятность|Априорные]] [[шансы]] означают соотношение больных пациентов к здоровым <math>1 : 4</math>. Превращение этих шансов в вероятности даст нам <math>\mathbb P(sick)=\frac{1}{4+1}=\frac{1}{5}=20\%</math>. [[Соотношение условных вероятностей]] означает соотношение того, насколько вероятней у больного пациента почернеет депрессор к положительному результату у здорового, что с использованием обозначения для [[Условная вероятность|условных вероятностей]] будет выглядеть как <math>\frac{\mathbb P(positive \mid sick)}{\mathbb P(positive \mid healthy)}=\frac{0.90}{0.30},</math> то есть соотношение условных шансов будет <math>3 : 1.</math> [[Апостериорная вероятность|Апостериорные]] шансы означают соотношение больных пациентов к здоровым среди всех с положительным результатом, что выражается как <math>\frac{\mathbb P(sick \mid positive)}{\mathbb P(healthy \mid positive)} = \frac{3}{4}</math>, то есть шансы <math>3 : 4</math>. Для извлечения вероятности из шансов нам следует держать в уме, что [[Взаимоисключающие и исчерпывающие гипотезы|полная вероятность взаимоисключающих событий]] в сумме всегда составляет <math>1,</math> то есть есть 100 % вероятность для ''чего-то''. Раз уж все либо болеют либо здоровы, мы можем [[Нормализация вероятностей|нормализовать]] соотношение шансов <math>3 : 4</math> путем деления их на сумму: <math>(\frac{3}{3+4} : \frac{4}{3+4}) = (\frac{3}{7} : \frac{4}{7}) \approx (0.43 : 0.57)</math> …что в итоге дает нам вероятности <math>(0.43 : 0.57)</math>, пропорциональные шансам <math>(3 : 4)</math>, с суммой в <math>1</math>. Будет странно иметь вероятность в формулах <math>3</math> (300 %) для какого-то события. Если визуализировать это с помощью водопадной диаграммы: <gallery>4CXsoZhA.png</gallery> Мы можем обобщить это для любых конкурирующих гипотез <math>H_j</math> и <math>H_k</math> и доказать еесвидетельства <math>e</math>, что теорема Байеса может быть записана как: <math>\dfrac{\mathbb P(H_j)}{\mathbb P(H_k)} \times \dfrac{\mathbb P(e \mid H_j)}{\mathbb P(e \mid H_k)} = \dfrac{\mathbb P(H_j \mid e)}{\mathbb P(H_k \mid e)}</math> что говорит нам потребуется ввести несколько новых обозначений: «соотношение апостериорных шансов для конкурирующих гипотез <math>H_j</math> и <math>H_k</math> (при условии наблюдения свидетельства <math>e</math>), равно произведению априорных шансов с соотношением того, как <math>H_j</math> предсказывает свидетельство в сравнении с <math>H_k.</math>» Если <math>H_j</math> и <math>H_k</math> [[Взаимоисключающие и исчерпывающие гипотезы|взаимоисключающие и исчерпывающие]], мы можем конвертировать апостериорные шансы в апостериорную вероятность для <math>H_j</math> путем [[Нормализация вероятностей|нормализации]] шансов: делением соотношения шансов на их сумму, чтобы элементы нового соотношения суммировались к <math>1</math>. === Доказательство теоремы Байеса ===Перестроим [[Условная вероятность|определение условных вероятностей]] <math>\mathbb P(X \wedge Y) = \mathbb P(Y) \cdot \mathbb P(X|Y).</math> То есть чтобы найти «часть всех пациентов которые больны и с положительным результатом» мы перемножаем «часть пациентов, которые больны» и «вероятность того, что у зараженного пациента почернеет депрессор». Тогда доказательство теоремы Байеса, где <math>e_0</math> — новое свидетельство, будет выглядеть так:   <math>\frac{\mathbb P(H_j)}{\mathbb P(H_k)}\cdot\frac{\mathbb P(e_0 | H_j)}{\mathbb P(e_0 | H_k)}=\frac{\mathbb P(e_0 \wedge H_j)}{\mathbb P(e_0 \wedge H_k)}= \frac{\mathbb P(H_j \wedge e_0)/\mathbb P(e_0)}{\mathbb P(H_k \wedge e_0)/\mathbb P(e_0)}= \frac{\mathbb P(H_j | e_0)}{\mathbb P(H_k | e_0)}</math>ч.т.д. Для задачи про Болезнит, шаги этого доказательства соответствуют операциям: <math>\frac{0.20}{0.80}\cdot\frac{0.90}{0.30}=\frac{0.18}{0.24}= \frac{0.18/0.42}{0.24/0.42}= \frac{0.43}{0.57}</math> Используя красный цвет для обозначения больных, синий — для здоровых, серый для смеси больных и здоровых, и знак «+» для положительного результата, можно визуализировать вычисления: <gallery>5YBc2nYo.png</gallery>
Условная вероятность
Во-первыхЭтот процесс, если <math>X</math> это утверждение, то <math>Pгде мы наблюдаем свидетельства и используем соотношение условных вероятностей (Xотношения правдоподобия)</math> это [[вероятность]] <math>Xдля трансформации априорных убеждений в апостериорные называется «байесианским апдейтом» или же «пересмотром убеждений».</math>
Другими словами=== Статьи по теме ===* Оригинал статьи: <math>X<[https://arbital.com/math> это что-то истинное или ложное p/bayes_rule_odds/?l=1x8&pathId=24787 Introduction to Bayes' rule: Odds form ]* Каталог статей гайда по ТБ: [[Теорема Байеса]]* Предыдущая статья в действительности, но у нас есть какая-то неопределенность по этому поводу, гайде: [[Водопадные диаграммы и <math>P(X)</math> - это способ выразить относительные шансы]]* Следующая статья в гайде: [[уровень нашей убежденностиПравило Байеса: пропорции]] в том, что <math>X<[https://math> истинно. Пациент, на самом деле, либо болен либо здоров, но если вы не уверены, свидетельство может способствовать сдвигу субъективной вероятности к 43% в пользу того, что он боленarbital.com/p/bayes_rule_proportional/?pathId=24787 Bayes' rule: Proportional form ]
<math>\mathbb \neg X</math> означает "<math>X</math> ложно", так что <math>\mathbb P(\neg X)</math> означает "вероятность, что <math>X</math> ложно".[[Категория:Теория вероятностей]]