The Book of Why

Автор Тема: The Book of Why  (Прочитано 9184 раз)

kuuff

  • Старожил
  • *****
  • Сообщений: 2 133
  • +220/-52
    • Просмотр профиля
The Book of Why
« : 25 Марта 2021, 22:27 »
  • (+)0
  • (−)0
  • Читали такую книжку? Если нет, то я очень рекомендую.

    Байесианство -- это прошлый век. Judea Pearl с тех пор придумал кой-что покруче: causal inference. (не знаю как лучше перевести: "причинный вывод" мне слишком напоминает про причинное место, поэтому пускай будет "каузальный вывод"). И его наработки вырывают мозг, когда после неё думаешь о причинах и следствиях в реальности, ощущение будто наконец-то картинка попала в фокус, и вместо туманных очертаний мыслей видишь чёткие и резкие границы их.

    Я, почитав Юдковского, копал тему глубже, в частности и курс экспериментальной психологии одолел, который весь посвящён тому, как измерить причинно-следственную связь, тому как теория связана с реальностью, и тому подобным вещам. И там немало говорилось о том, как матстатистика может помочь в этом. Но в курсе экспериментальной психологии преподы прямо и чётко говорили: единственный способ измерить причинно-следственную связь -- это эксперимент, то есть исследование, в котором экспериментатор управляет тем фактором, который считает причиной, и смотрит на другой фактор, который он считает следствием. Он набирает данных, считает статистикой, и делает вывод. Помимо эксперимента есть и другие способы исследования, но они в лучшем случае меряют корреляцию. И хоть некоторые и близки к каузальности, но всё равно корреляционная хрень и зашквар.

    Так говорила экспериментальная психология, но я почитал Judea Pearl... Его подход: данные это не всё. Если у нас есть теоретическая модель изучаемого явления, то из неё мы можем предположить как там причинно-следственные связи выстроены и нарисовать диаграммку, по-типу байесианской сети, но не совсем. А потом, глядя на эту диаграммку, мы можем прикинуть какие данные мы можем собрать, и какие нам нужны для того, чтобы измерить вес каждой из предположенной причинно-следственной связи, то есть вклад этой причинно-следственной связи в результат.

    Этим дело, естественно не ограничивается -- counterfactuals, например, позволяют решать задачки типа: "Дано: ДТП с нетрезвым водителем, он уворачивался от пешехода и вошёл в столб. Какова вероятность, что его нетрезвость была причиной ДТП, и какова вероятность, что причиной было опасное поведение пешехода?" В смысле ответы на counterfactual вопросы типа "если бы водитель был трезв, ДТП бы всё равно произошло или нет?" Или mediation -- если мы видим, что средняя зарплата женщин в компании ниже чем средняя зарплата у мужчин, то почему так? Потому что женщин дискриминируют в компании, или потому что у женщин в более низкая квалификация? Все эти курсы экспериментальной психологии и матстатистики и даже байесианство не подготовили меня к такому вопросу, я искренне считал, что ответить на него невозможно. Ну вы сами прикиньте: пол явно влияет на зарплату, вопрос в том, влияет ли он через дискриминацию или через квалификацию. Как это можно распутать? Но Перл объясняет как.

    Когда я читал про байесианство, возможность ответить на вопрос "сколько локомотивов в компании X, если мы видели один её локомотив и у него номер 7" казалась мне мозговыносящей. Сейчас я прочитал The Book of Why, и у меня то же самое чувство: я могу осмысленно рассуждать о вещах, и при наличии данных делать осмысленные выводы в тех ситуациях, в которых раньше я даже помыслить не мог о возможности осмысленно рассуждать.

    Короче, я очень рекомендую взять и почитать. Книга написана для самой широкой аудитории. Она, тем не менее, местами требует морщить мозг, но, во-первых, местами, во-вторых, не запредельно, а в-третьих, результат выносит мозг, почище любой травы.