Частотные диаграммы. Первое знакомство с теоремой
Байесианские методы рассуждений о том, как менять убеждения при столкновении со свидетельствами.
В качестве первого примера мы рассмотрим сценарий, где явно присутствуют числа для измерения силы свидетельства.
Предположим, что вы доктор, проверяющий студентов на предмет заражения Болезнитом.
- На основе прошлых проверок, вы знаете, что примерно 20% студентов заражены в это время года.
Для выявления Болезнита вы используете меняющий цвет депрессор для языка, который обычно окрашивается черным, если у человека Болезнит.
- Среди всех зараженных Болезнитом, примерно у 90% депрессор становится черным.
- Однако, тест не идеален, и окрашивается черным у 30% здоровых людей.
Один из ваших подопечных зашел в офис, засунул депрессор в рот, и он окрасился черным. Какова вероятность того, что у него Болезнит?
Эта задача может быть решена хитрым способом или сложным. Сначала мы рассмотрим сложный.
Для начала, представим популяцию из 100 студентов, 20 из которых заражены Болезнитом.
Лишь у 90% больных депрессов окрашивается черным, так же он окрашивается черным у 30% здоровых. Так что мы увидим черный цвет депрессора у 90% * 20 = 18 больных студентов, и у 30% * 80 = 24 здоровых
Какова вероятность того, что студент с черным депрессором заражен? Из диаграммы видно, что у нас 18 больных студентов с черным депрессором. Но у 18 + 24 = 42 студентов всего депрессор черный. Представьте, что вы из мешка со студентами с черным депрессором достаете одного из них наугад, каковы шансы на то, что он будет болен?
В итоге получается, что пациент с черным депрессором имеет 18/42 = 3/7 = 43% вероятность оказаться больным.
Множество студентов-медиков находят этот ответ контр-интуитивным. Ведь тест выявляет Болезнит в 90% случаев! Почему же при получении положительного результата вероятность все еще менее 50% на то, что человек заражен Болезнитом? Потому что тест неверно "выявляет" Болезнит в 30% случаев у здоровых людей, и у нас намного больше здоровых, чем больных.
Тест дает нам кое-какое свидетельство в пользу того, что пациент болен. Вероятность заражения поднимается с 20% до проведения теста к 43% после того, как депрессор окрасился черным. Но этого недостаточно для окончательного заключения и следует провести еще тесты, более дорогие, например.
Если вы ощущаете силы для решения таких задач, попробуйте определить вероятность того, что у студента с не-черным депрессором (с отрицательным результатом теста) есть Болезнит. Опять же, мы начинаем с 20% больных и 80% здоровых, 70% здоровых получат отрицательный результат, и лишь 10% больных тоже получат отрицательный результат.
А теперь посмотрим на более хитрый способ решить задачу про Болезнит: Водопадные диаграммы и относительные шансы Waterfall diagrams and relative odds
Статьи по теме
- Каталог статей гайда по ТБ: Теорема Байеса Bayes' rule
- Frequency diagrams: A first look at Bayes
- Следующая статья в гайде: Водопадные диаграммы и относительные шансы Waterfall diagrams and relative odds
- Интерпретации «вероятности»
- Визуализация разных интерпретаций «вероятностей»