Водопадные диаграммы и относительные шансы

Материал из Вики LessWrong.ru
Перейти к: навигация, поиск

Водопадные диаграммы, как и частотные, дают возможность визуализировать вывод по ТБ.

Вообразите водопад с двумя потоками воды на вершине: красным и синим. Они приближаются к вершине раздельно, а потом часть воды в этих потоках уходит в сторону, а часть объединяется в один водоем.

Предположим что:

  • С вершины вниз падает 20 литров в секунду красной воды и 80 литров в секунду синей.
  • Лишь 90% красной воды попадает в объединенный водоем.
  • Лишь 30% синей воды попадает в объединенный водоем.

Сколько всего красной воды и синей воды падает вниз, образуя фиолетовый водоем?

Эта проблема аналогична задаче про Болезнит:

  • 20% популяции заражено Болезнитом.
  • У 90% зараженных депрессор чернеет.
  • У 30% здоровых людей тоже чернеет депрессор.

Эти 20% зараженных аналогичны 20 литрам в секунду красной воды; а 80% здоровых аналогичны 80 литрам в секунду синей воды.

Эти 90% зараженных с почерневшим депрессором аналогичны 90% красной воды, попадающей в фиолетовый водоем. А 30% здоровых пациентов с почерневшим депрессором аналогичны 30% синей воды, попадающей в фиолетовый водоем.

Следовательно, ответ на вопрос "какая часть воды в фиолетовом водоеме из красного потока?" и ответ на вопрос "какая часть пациентов с почерневшим депрессором заражена Болезнитом? совпадают.

А теперь я покажу быстрый способ ответить на тот вопрос из статьи про частотные диаграммы.

На вершине водопада синей воды в 4 раза больше, чем красной.

Потом у каждой молекулы красной воды есть 90% вероятность оказаться в фиолетовом водоеме, а у молекулы синей воды эта вероятность составляет 30%. Так что у молекулы воды шансы в три раза выше (0.90 / 0.30 = 3) оказаться в фиолетовом водоеме.

Мы умножаем априорные пропорции (соотношение красной и синей воды на вершине) и относительные пропорции и получаем итог , что значит - фиолетовый водоем состоит из 3 частей красной воды и четырех частей синей.

Если превратить эти относительные пропорции в абсолютные вероятности того, что случайная молекула воды в фиолетовом водоеме попала туда из красного потока мы вычисляем 3 / (3 + 4)= 3/7, что составляет примерно 47%. Столько воды в фиолетовом водоеме из красного потока.

Эта пропорция точно такая же как и 18 : 24 зараженных с положительным результатом и здоровых с положительным результатом, которую мы получим в ходе решения задачи про 100 пациентов.

Итак, чтобы решить задачу про Болезнит в уме, вам следует превратить эту словесную задачу:

  • 20% исследуемой популяции заражены Болезнитом. У 90% зараженных депрессор становится черным, как и у 30% незараженных. С учетом того, что депрессор почернел, какова вероятность того, что у пациента Болезнит?

В такие вычисления:

  • Итак, начальные шансы (20% : 80%) = (1 : 4), и относительные шансы (90% : 30%) = (3 : 1). Перемножаем и получаем (3 : 4) что составляет вероятность в 3 / (3 + 4) = 3/7.

(Возможно у вас будут трудности с переводом 3/7 в 43% в уме, но можно прикинуть и будет видно, что вероятность ниже 50%.)

Попробуйте применить этот же способ для такой задачи:

  • 90% виджетов хорошие, а 10% плохие.
  • 12% плохих виджетов искрят.
  • Лишь 4% хороших виджетов искрят.

Какой процент искрящих виджетов состовляют плохие? И если вам понятен метод, попробуйте решить эту задачу в уме.

(Можно даже вообразить виджетопад с плохими и хорошими виджетами на вершине и искрящими виджетами внизу.)

Решение
Соотношение плохих виджетов к хорошим составляет (1 : 9).

Относительное правдоподобие искрящих плохих виджетов к искрящим хорошим составляет (12 : 4).

Это упрощается в (1 : 9) x (3 : 1) = (3 : 9) = (1 : 3), т.е. на 1 плохой искрящийся виджет приходится 3 хороших искрящихся.

Что превращается в вероятность 1/(1+3) = 1/4 = 25%; т.е. 25% искрящихся виджетов плохие.


Это не значит, что мы, увидев искры, будем думать, что этот виджет плохой. Вероятность стала лишь 25%, что меньше чем 50/50. Но это и не означает, что мы будем думать "Я все еще верю, что этот виджет хороший!", и выкинем свидетельство из головы. Плохой виджет с большей вероятностью будет искрить, следовательно, наблюдая это свидетельство, мы должны ожидать с большей уверенностью, что это виджет плохой, даже если вероятность не поднялась выше 50%. Мы увеличиваем вероятность с 10% до 25%.


Водопады - один из способов визуализировать "шансовую форму" ТБ, которая выражается как: априорные шансы помноженные на условные шансы дают апостериорные шансы. Что в свою очередь можно рассматривать как формализацию концепции "силы свидетельства" или "как сильно мы должны изменить наши убеждения в случае наблюдения свидетельства". В следующей статье мы рассмотрим более общую форму.

Статьи по теме[править]