Частотные диаграммы. Первое знакомство с теоремой

Материал из Вики LessWrong.ru
Перейти к: навигация, поиск


Байесианские методы рассуждений о том, как менять убеждения при столкновении со свидетельствами.

В качестве первого примера мы рассмотрим сценарий, где явно присутствуют числа для измерения силы свидетельства.

Предположим, что вы доктор, проверяющий студентов на предмет заражения Болезнитом.

  • На основе прошлых проверок, вы знаете, что примерно 20% студентов заражены в это время года.

Для выявления Болезнита вы используете меняющий цвет депрессор для языка, который обычно окрашивается черным, если у человека Болезнит.

  • Среди всех зараженных Болезнитом, примерно у 90% депрессор становится черным.
  • Однако, тест не идеален, и окрашивается черным у 30% здоровых людей.

Один из ваших подопечных зашел в офис, засунул депрессор в рот, и он окрасился черным. Какова вероятность того, что у него Болезнит?

Эта задача может быть решена хитрым способом или сложным. Сначала мы рассмотрим сложный.

Для начала, представим популяцию из 100 студентов, 20 из которых заражены Болезнитом.

Лишь у 90% больных депрессов окрашивается черным, так же он окрашивается черным у 30% здоровых. Так что мы увидим черный цвет депрессора у 90% * 20 = 18 больных студентов, и у 30% * 80 = 24 здоровых

Какова вероятность того, что студент с черным депрессором заражен? Из диаграммы видно, что у нас 18 больных студентов с черным депрессором. Но у 18 + 24 = 42 студентов всего депрессор черный. Представьте, что вы из мешка со студентами с черным депрессором достаете одного из них наугад, каковы шансы на то, что он будет болен?

В итоге получается, что пациент с черным депрессором имеет 18/42 = 3/7 = 43% вероятность оказаться больным.

Множество студентов-медиков находят этот ответ контр-интуитивным. Ведь тест выявляет Болезнит в 90% случаев! Почему же при получении положительного результата вероятность все еще менее 50% на то, что человек заражен Болезнитом? Потому что тест неверно "выявляет" Болезнит в 30% случаев у здоровых людей, и у нас намного больше здоровых, чем больных.

Тест дает нам кое-какое свидетельство в пользу того, что пациент болен. Вероятность заражения поднимается с 20% до проведения теста к 43% после того, как депрессор окрасился черным. Но этого недостаточно для окончательного заключения и следует провести еще тесты, более дорогие, например.

Если вы ощущаете силы для решения таких задач, попробуйте определить вероятность того, что у студента с не-черным депрессором (с отрицательным результатом теста) есть Болезнит. Опять же, мы начинаем с 20% больных и 80% здоровых, 70% здоровых получат отрицательный результат, и лишь 10% больных тоже получат отрицательный результат.

Ответ
Представьте 20 больных студентов и 80 здоровых. У 10% * 20 = 2 больных студентов тест даст отрицательный результат. У 70% * 80 = 56 здоровых тоже будет отрицательный результат. Из 2+56=58 студентов с отрицательным результатом лишь 2 будут больны и с отрицательным результатом. Так что 2/58 = 1/29 = 3.4% студентов с отрицательным результатом будут заражены Болезнитом.


А теперь посмотрим на более хитрый способ решить задачу про Болезнит: Водопадные диаграммы и относительные шансы Waterfall diagrams and relative odds


Статьи по теме[править]