Почему байесовская вероятность важнее других проявлений рациональности?

Автор Тема: Почему байесовская вероятность важнее других проявлений рациональности?  (Прочитано 31897 раз)

LswAgnostic

  • Ветеран
  • ****
  • Сообщений: 313
  • +29/-12
    • Просмотр профиля
Ключевой вопрос рациональности "почему я знаю то, что я знаю? Почему я верю в то, во что я верю?"

Путь LessWrong пронизан идеей, что самое важное это байесовская вероятность. На чем основана эта вера/знание?

Ключевой вопрос управления: "Почему я знаю/верю, что предлагаемый вариант дает лучший результат?". Почему внимание к байесовской вероятности даёт лучший результат?

Лучший способ проверки идей - это решение модельных задач.
Рассмотрим модельные задачи: "Написать книгу", "Построить бизнес", "Сложить пасьянс", "Починить мотоцикл", "Справиться с паникой".
Где при решении этих задач появляется байесовская вероятность? Как она помогает?

kuuff

  • Старожил
  • *****
  • Сообщений: 2 133
  • +220/-52
    • Просмотр профиля
Откуда человек берёт знания о внешнем мире? Как человек делает умозаключения о том, каков он, внешний мир?
Знания о внешнем мире важны для успешного выполнения любой из перечисленных задач. Но откуда эти знания берутся, и почему мы доверяем тем знаниям, которые у нас есть?

Как в общем-то уже стало ясно, единственный способ знания обретать -- это матстатистика. Ну или что-то типа матстатистики. Человеческие мозги заточены на решение различных задач познания, они действуют не так, как предписывает матстатистика, но очень похожим образом, матстатистика просто чуть точнее. Конечно тут ещё следует учитывать, что мозги были заточены работать не в современной реальности, а немного в другой, и поэтому не всегда заложенные в мозги методы работают успешно -- соответственно начинаются разговоры о когнитивных искажениях и пр. Но между методами матстатистики и работой человеческих мозгов можно найти множество параллелей: глядя на то, как работают мозги, придумывают новые статистические методы, глядя на статистические методы решения тех или иных задач, строят теории о том, как работают мозги.

Но матстатистика подвешена в воздухе, благодаря частотному определению вероятности. Байесовская же вероятность резко упрощает статистический аппарат. Ну, это знаете, как скажем изобретение отрицательных чисел резко упростило решение задач: сложные алгоритмы решения с ветвлениями типа "если a < b, то вычесть a из b, и делать потом то, сё и это; а если a > b, то вычесть b из a, и делать затем что-то иное". С отрицательными же числами всё гораздо проще: надо подставить в формулу, вычислить всё безусловно, получить ответ, который может быть положительным или отрицательным, и сказать, что если число положительное, то мы в плюсе, а если отрицательное, то попали на бабки. Отрицательные числа упростили решения задач, таким образом они упростили задачи, таким образом они дали возможность мыслить о более сложных задачах, охватывать умственным взором более сложные пробемы. Хотя, на первый взгляд, они совершенно не нужны, те же задачи можно решать и без них.

Так и байесовская вероятность. Чтобы понимать, что такое знание, надо знать как знание строится из отдельных свидетельств. Но чтобы понимать это, гораздо удобнее освоить байесовскую вероятность; усвоить, что "вероятность находится в голове"; одолеть теорему Байеса и посмотреть на несколько применений байесовской вероятности -- после этого в голове всегда будет, по-крайней мере качественное понимание того, как из опыта строится знание. А это понимание позвояет оценивать качество этого самого знания.

Muyyd

  • Ветеран
  • ****
  • Сообщений: 756
  • +45/-1
    • Просмотр профиля
Сам я настолько пронизан байесовской эпистемологией, что она является метауровнем. Даже если что-либо окажется полезней, то фраза "метод Х более полезен, чам байесовская рациональность" слишком уж подозрительна похожа на "метод Х назначает большую вероятность наблюдениям У, чем байесовская вероятность". Так что даже если и появится метод более действенный, процесс выбора будет напоминать сильней процесс байесовского вывода, чем каких-либо еще выводов.
Ключевой вопрос рациональности "почему я знаю то, что я знаю? Почему я верю в то, во что я верю?"
Это, разумеется, light версия. Чтобы, читатель, услышав ее, подумал: "действительно, почему же?", вместо "а это, блин, что значит?", если бы Юдковский (в статьях или в МРМ, устами Гарри) формулировал фундаментальный вопрос рациональности в его истинной (вербальной, истинная форма - теорема Байеса) форме: "Какого соотношение априорных шансов среди конкурирующих гипотез к апостерироным, с учетом отношений правдоподобия?"

Путь LessWrong пронизан идеей, что самое важное это байесовская вероятность. На чем основана эта вера/знание?тих задач появляется байесовская вероятность? Как она помогает?
Насколько я знаю, не было эпической коммуникации, в ходе которой Святой Лапласс передал Человечеству Байесовскую Мудрость. Каким-то образом теорема Байеса проникла в когнитивную науку.
Цитировать
Принятие решений в неопределенности: Правила и предубеждения
С момента привлечения Эдвардсом и eгo коллегами идей Байеса в психологическое исследование, психологам впервые предложили целостную и четко сформулированную модель оптимального поведения в условиях неопределенности, с которой можно было сравнить принятие решений человеком. Соответствие принятия решений нормативным моделям стало одной из главных парадигм исследования в области суждения в условиях неопределенности.
И на этом мои познания исторической части заканчиваются.

Так уж получилось, что относительно одних утверждений мы чувствуем большую уверенность, чем относительно других. Просыпаясь утром, я еще на знаю будет ли дождь и не могу уверенно выбрать какой из вариантов скорее всего произойдет. Но, увидев тучи, мои ожидания меняются: уверенность в том, что будет дождь увеличится, а уверенность в том, что будет сухо - снизится (в идеале, разумеется, в реальности убеждения не всегда так легко меняются).

Нормой для определения действия, которое скорее всего, в сравнении с другими действиями, позволит достичь результата (дойти до пункта Х, сохранив сухость) стала байесовская система принятия решений, а именно максимизация ожидаемой полезности. Мы должны делать те действия, от которых ожидаем больше пользы для достижения желаемого результата.
Однако, необходимым условием так же является определение того, какие же из возможных результатов самые вероятные. И, какие действия являются самыми полезными (какие из разных результатов назначают наибольшую вероятность каким действиям (свидетельствам)).

Ключевой вопрос управления: "Почему я знаю/верю, что предлагаемый вариант дает лучший результат?". Почему внимание к байесовской вероятности даёт лучший результат?
Ознакомившись с некоторой литературой по рациональности, я начал задаваться вопросом: "почему наиболее вменяемые решения и правдоподобно звучащие варианты имеют байесовскую структуру, а ошибки часто оказываются результатом пренебрежения распределнием априорных вероятностей среди возможных гипотез и игнорированием вероятности, назначаемой свидетельству конкурирующими гипотезами?".

Есть [PDF]Интуитивное объяснение теоремы Байеса на русском, есть A Technical Explanation of Technical Explanation на английском. Но нет компактного сравнения разных систем репрезентации эмпирических убеждений (вроде "у большинства людей два зрячих глаза" (есть ведь и одноглазые, правда, их мы ожидаем встретить с меньшей уверенностью), а не "две молекулы водорода и молекула кислорода, при затрате энергии N образут молекулу воды H2O"). Я не встречал сравнения силлогизмов Аристотеля с байесовской эпистемологией. Загляните в
Decision Making and Rationality in the Modern World (Fundamentals in Cognition) 1st Edition
и в
A Critical Introduction to Formal Epistemology (Bloomsbury Critical Introductions to Contemporary Epistemology)
. Я пока не владею материалом, чтобы хотябы на десятке страниц изложить кратко почему же стоит использовать теорема Байеса для репрезентации частных убеждений в сравнении с силлогистикой, логикой первого порядка, кванторами.
Та же можно посмотреть: Highly Advanced Epistemology 101 for Beginners

Если вы хотите написать бестселлер, то ваше ожидание того,что ваша книга будет раскуплена может быть равно ожиданию запыления на полках. Ваше ожидание разных состояний реальности (раскуплена, пылиться) измениться в зависимости от того, о чем и как будет эта книга (см. байесовское свидетельство).

LswAgnostic

  • Ветеран
  • ****
  • Сообщений: 313
  • +29/-12
    • Просмотр профиля

Нормой для определения действия, которое скорее всего, в сравнении с другими действиями, позволит достичь результата (дойти до пункта Х, сохранив сухость) стала байесовская система принятия решений, а именно максимизация ожидаемой полезности. Мы должны делать те действия, от которых ожидаем больше пользы для достижения желаемого результата.


Почувствовал настрой этого абзаца следующим образом.
Байесовская оценка - это неочевидный, сложный алгоритм, которым Система 1 не владеет и поэтому ему следует уделять внимание Системы 2.
Максимизация полезности - это очевидный, простой навык, которым в совершенстве владеет Система 1. Ему не стоит уделять внимание Системы 2.
Это так?

ps
Уточню что я понимаю под "важностью".
Важность - это распределение ресурсов Системы 2. Чем важнее аспект N, тем большая доля ресурсов Системы 2  выделяется на просчитывание аспекта N.

Muyyd

  • Ветеран
  • ****
  • Сообщений: 756
  • +45/-1
    • Просмотр профиля
Байесовская оценка - это неочевидный, сложный алгоритм, которым Система 1 не владеет и поэтому ему следует уделять внимание Системы 2.
Как показала экспирементальная наука, Система 1 склонна к пренебрежению распределнием априорных вероятностей (base rate neglect) среди возможных гипотез и игнорированием вероятности, назначаемой свидетельству конкурирующими гипотезами (на встречал формального названия для этого искажения). Для корректировки этих искажений нужно следить, чтобы линия рассуждений на нарушала байесовский вывод, т.е. применять Систему 2.

Максимизация полезности - это очевидный, простой навык, которым в совершенстве владеет Система 1. Ему не стоит уделять внимание Системы 2.
Простота этого навыка иллюзорна. Чем обыденный действие - тем проще. Если вы хотите шоколадку из магазина, то вполне очевидно, какие действия будут наиболее эффективными (сходить самому, попросить соседа сгонять в магазин, позвонить в магизин и попросить доставку, например). Такие ситуации достаточно оптимизированы для обычного человека (вы ведь можете оказаться и владельцем магазина, не так ли?). Однако, чем дальше вы от часто повторяемых действий в сторону неизвестности, тем внимательней (с подозрением) надо относиться к тому, какие действия приходят вам в голову, когда вы ставите себе какую-то цель. Если мы примем в качестве репрезентации нашей уверенности тервер, то Юдковский написал довольно убедительную статью о том, почему при встрече с малознакомым явлением (бизнес в новой для вас области, отпуск "дикарем" в незнакомой местности) следует относиться с подозрением к возникающим идеям.

LswAgnostic

  • Ветеран
  • ****
  • Сообщений: 313
  • +29/-12
    • Просмотр профиля
Откуда человек берёт знания о внешнем мире? Как человек делает умозаключения о том, каков он, внешний мир?
Знания о внешнем мире важны для успешного выполнения любой из перечисленных задач. Но откуда эти знания берутся, и почему мы доверяем тем знаниям, которые у нас есть?

Знания берутся из наблюдения. Из декомпозиции наблюдения на отдельные части. Сравнения частей и выделения сходств и различий. Фиксировании эталонов. Формирования классификаций. Введеления шкал. Соотнесения наблюдений со шкалами. Композиции частей в стабильные объекты, наделенными характеристиками. Выделении степеней свободы объекта. Выделении влияния одних объектов на другие. Построении моделей, объясняющих наблюдения. Формировании формального аппарата, помогающего сделать выводы на основе моделей. Сравнении модели с наблюдениями. Формулировании целей. Выделении путей, приводящих к целе.

Цитировать
Какого соотношение априорных шансов среди конкурирующих гипотез к апостерироным, с учетом отношений правдоподобия?

Говоря о вероятности, подразумевается, что есть полное пространство элементарных исходов. И оценивается шанс выпадения данного исхода к полному пространству.
В каком пространстве исходов рассматривается приведенное утверждение?

Цитировать
Как в общем-то уже стало ясно, единственный способ знания обретать -- это матстатистика.

Матстатистика, теория вероятности и соответственно, байесовская вероятность - применимы к независимым явлениям.
Бессмыслен вопрос "Какова вероятность того или иного хода оппонента в шахматах?". Ход оппонента зависит от хода пропонента, зависит от ментальных моделей оппонента и т.д.

Возьмем модельную задачу "Игра в шахматы". Допустим рациональный агент ничего не знает о шахматах. Каково его рациональное поведение в этом случае? Как ему помогает байесовская вероятность и в каком виде?

Вот запись наблюдений рационального агента:
"Белая лампочка. Попытка передвижения маленькой черной фигурки с g7 на g6. Fail"
"Белая лампочка. Попытка передвижения белой толстой фигурки с h1 на h3. Fail"
"Белая лампочка. Попытка передвижения белой маленькой фигурки с a2 на a3. Success"
"Черная лампочка. Попытка передвижения белой маленькой фигурки с a3 на a4. Fail"
"Черная лампочка. Оппонент передвинул маленькую черную фигурку с g7 на g6."
"Белая лампочка. Попытка передвижения белой маленькой фигурки с h2 на h5. Fail"
и т.д.


Добавлено 07 Мая 2016, 15:40:
Простота этого навыка иллюзорна. Чем обыденный действие - тем проще.

Если простота максимизации полезности иллюзорна, то почему тогда в LessWrong много уделяются внимания расчету байесовской оценки, но мало уделено вниманию расчета полезности?

« Последнее редактирование: 07 Мая 2016, 15:51 от LswAgnostic »

Muyyd

  • Ветеран
  • ****
  • Сообщений: 756
  • +45/-1
    • Просмотр профиля
Говоря о вероятности, подразумевается, что есть полное пространство элементарных исходов. И оценивается шанс выпадения данного исхода к полному пространству.
В каком пространстве исходов рассматривается приведенное утверждение?
И вот мы подошли к понятию "Bounded rationality": пространство приходящих в человеческую голову исходов. Есть рациональные техники, которые позволяют как увеличитьколичество приходящих в голову исходов - табуирование, так и снизить: Fallacies of Compression и Ухватить задачу.

Возьмем модельную задачу "Игра в шахматы". Допустим рациональный агент ничего не знает о шахматах. Каково его рациональное поведение в этом случае? Как ему помогает байесовская вероятность и в каком виде?
Давайте зададимся вопросом, что ему поможет больше байесовской вероятности? Или еще лучше: какие методы ему позволят максимально приблизить выигрыш? Замечаете байесовскую структуру моих вопросов?

Моделируя агента, ничего не знающего о шахматах, вы неспособны избавиться (важный рациональный навык) от вашего знания о шахматах. Вы знаете, что фигуры не нужно есть или засовывать в другие отверстия, что не нужно их расставлять по увеличению массы. И если агент будет обучаться игре, то ему лучше бы следить, чтобы алгоритм обучения учитывал предыдущую информацию (априорные; каждый следующий ход не должен восприниматься как первый) и то, какую вероятность класс расположения фигур, при котором выигрывают черные, назначает разным ходами (отношения правдоподобия).


Добавлено [time]07 Май 2016, 16:00[/time]:
Если простота максимизации полезности иллюзорна, то почему тогда в LessWrong много уделяются внимания расчету байесовской оценки, но мало уделено вниманию расчета полезности?
Не знаю соотношения. Поделитесь данными?

LswAgnostic

  • Ветеран
  • ****
  • Сообщений: 313
  • +29/-12
    • Просмотр профиля
Не знаю соотношения. Поделитесь данными?

lesswrong.ru/forum:
Search байес* - 112
Search максимум* полезност* - 5

Добавлено 07 Мая 2016, 16:43:
Цитировать
И вот мы подошли к понятию "Bounded rationality": пространство приходящих в человеческую голову исходов.

Подмена пространств. Произошел переход от пространства исходов реальности к пространству исходов, моделируемых индивидуумом.
Вероятность исхода имеет смысл в первом пространстве, но не имеет смысла во втором.

Давайте зададимся вопросом, что ему поможет больше байесовской вероятности? Или еще лучше: какие методы ему позволят максимально приблизить выигрыш? Замечаете байесовскую структуру моих вопросов?

Вижу задачу максимизации полезности. Вижу структуру - максимизация выходов Zi при входных условиях Kj. Не вижу пространства независимых исходов и поэтому не вижу байеса.

Цитировать
Моделируя агента, ничего не знающего о шахматах, вы неспособны избавиться (важный рациональный навык) от вашего знания о шахматах.

С помощью Системы 2 есть алгоритмы, помогающие избавиться от своего знания. Общая идея - всякое решение раскладывается на элементарные характеристики. Далее конструируются другие решения из элементарных частей и разбирается почему они были отвергнуты.

Цитировать
И если агент будет обучаться игре, то ему лучше бы следить, чтобы алгоритм обучения учитывал предыдущую информацию (априорные) и то, какую вероятность класс расположения фигур, при котором выигрывают черные, назначает разным ходами (отношения правдоподобия).
Имхо, идет искажение задачи. Вместо оценки полезности вводится оценка вероятности. Верно утверждение "Ладья в 5 раз полезнее пешки", но неверно утверждение "Ладья в 5 раз чаще, чем пешка приводит к победе".
« Последнее редактирование: 07 Мая 2016, 16:45 от LswAgnostic »

kuuff

  • Старожил
  • *****
  • Сообщений: 2 133
  • +220/-52
    • Просмотр профиля
Знания берутся из наблюдения. Из декомпозиции наблюдения на отдельные части.
Это звучит просто, потому что наши мозги это делают просто (точнее нам кажется, что они делают это просто, потому что бОльшая часть этой работы скрыта от нас), но если вы попробуете написать алгоритм, который выполнит такую декомпозицию, то вы утонете в матстатистике.

Сравнения частей и выделения сходств и различий. Фиксировании эталонов. Формирования классификаций.
Это называется категоризация. Data clustering. Это зубодробительная матстатистика. Ну или, в качестве варианта, нейронные сети, делающие то же самое, но ещё менее понятным образом.

Композиции частей в стабильные объекты, наделенными характеристиками. Выделении степеней свободы объекта. Выделении влияния одних объектов на другие. Построении моделей, объясняющих наблюдения. Формировании формального аппарата, помогающего сделать выводы на основе моделей. Сравнении модели с наблюдениями. Формулировании целей. Выделении путей, приводящих к целе.
Вы говорите много умных слов, за каждым из которых я вижу "статистика, статистика, статистика"... Или вы знаете как можно сделать хоть что-то из этого не привлекая матстатистики?

Матстатистика, теория вероятности и соответственно, байесовская вероятность - применимы к независимым явлениям.
Применимы к независимым, да. И что?

Бессмыслен вопрос "Какова вероятность того или иного хода оппонента в шахматах?". Ход оппонента зависит от хода пропонента, зависит от ментальных моделей оппонента и т.д.

Возьмем модельную задачу "Игра в шахматы". Допустим рациональный агент ничего не знает о шахматах. Каково его рациональное поведение в этом случае? Как ему помогает байесовская вероятность и в каком виде?

Вот запись наблюдений рационального агента:
"Белая лампочка. Попытка передвижения маленькой черной фигурки с g7 на g6. Fail"
"Белая лампочка. Попытка передвижения белой толстой фигурки с h1 на h3. Fail"
"Белая лампочка. Попытка передвижения белой маленькой фигурки с a2 на a3. Success"
"Черная лампочка. Попытка передвижения белой маленькой фигурки с a3 на a4. Fail"
"Черная лампочка. Оппонент передвинул маленькую черную фигурку с g7 на g6."
"Белая лампочка. Попытка передвижения белой маленькой фигурки с h2 на h5. Fail"
и т.д.
Ну а вы как предполагаете проводить подобное исследование шахмат? У вас есть идеи, как это сделать не привлекая матстатистики? Расскажите нам о вашем видении этого, а то мне, лично, неясно вообще что творится в вашей голове, и что именно надо объяснить вам, чтобы вы поняли.

Muyyd

  • Ветеран
  • ****
  • Сообщений: 756
  • +45/-1
    • Просмотр профиля
Когда вы спросили, я подумал про http://lesswrong.com/ и там немало статей про это в контексте утилитаризма, а так же прямо про функцию полезности и ожидаемою полезность. Это неочевидная важная проблема, затмеваемая очевидными важными проблемами.
Подмена пространств. Произошел переход от пространства исходов реальности к пространству исходов, моделируемых индивидуумом.
Вероятность исхода имеет смысл в первом пространстве, но не имеет смысла во втором.
У меня, к сожалению нет доступа (насколько я знаю) к пространству исходов реальности (чем бы это пространство ни было). Как индивидууму, мне приходя в голову разные исходы. Одни исходы я ожидаю уверенней, другие менее уверенней.

Во второй половине двадцатого века появляется идея рассматривать теорему Байеса и другие важные (вроде правила конъюнкции) моменты теории вероятностей, как нормативную модель принятия решений и правдонахождения для рациональных агентов. Было проведено множество исследований, в ходе которых люди решали выдуманные задачи и ошибки объяснялись расхождениями с нормативной рациональностью, а успехи - следованием ей.

Джейнс, ввел термин "заблуждение проецирования разума" и описал в книге "Probability Theory: The Logic of Science" множество примеров того, к чему приводят взгляд на вероятности, как на "что-то там вовне", вместо "вероятность - мера уверенности агента" (агентом может быть даже робот).

Потом Юдковский написал несколько статей и теперь я думаю о вероятностях, как о мере неуверенности агента. Но нам необязательно говорить об этом. Чем бы вероятности не являлись, мы все еще остаемся планирующими будущее агентами. В нашу голову приходя разные варианты будущего, в некоторых мы уверены больше чем в остальных. То же самое касается и того, какие действия увеличивают нашу уверенность в том, что конкретный вариант будущего реализуется. И для репрезентации этой неуверенности наиболее полезным инструментом является теорема Байеса.  И для краткости мы называем убеждения в которых мы не уверены (а это почти все наши убеждения об эмпирическом мире) - вероятностями.

Максимизация ожидаемой полезности напрямую зависит от оценки того, насколько вероятны разные исходы, которые мы стремимся претворить в жизнь. Даже если я буду делать ходы, которые сочту оптимизирующими мои шансы на выигрыш в матче против чемпиона мира, априорное ожидание моей победы настолько ниже априорного ожидания победы чемпиона, что можно и не садиться за стол. Инструментальная рациональность зависит от эпистемической.

LswAgnostic

  • Ветеран
  • ****
  • Сообщений: 313
  • +29/-12
    • Просмотр профиля
Это называется категоризация. Data clustering. Это зубодробительная матстатистика.

В рамках данного треда, согласен что статистика используется. (Чтобы не вдаваться в терминологический спор)

Статистика используется для отделения случайного от неслучайного.
Статистика используется для выделения вида закономерностей между неслучайными аспектами величин.

Формула байесовской вероятности - это одна из неслучайных закономерностей между случайными величинами.

Соответственно остались неотвеченными вопросы, сходные с темой треда:
- почему в рамках lesswrong байесовская вероятность выделяется из всех остальных видов закономерностей?
- почему в рамках lesswrong статистика редуцируется до байесовской вероятности?

Muyyd

  • Ветеран
  • ****
  • Сообщений: 756
  • +45/-1
    • Просмотр профиля
Цитировать
В конце концов, хорошо известно что вы не можете использовать байесовские методы на множестве проблем из-за того, что байесовские вычисления сложны для подсчетов. Так почему бы не позволить цвести многим цветам? Почему бы не иметь больше одного инструмента в вашем наборе?

Это фундаментальное различие в сознании. Статистики старой школы думают в терминах инструментов и трюков, применяемых для определенных проблем. Байесианцы, по крайней мере этот байесианец, хотя я не думаю, что говорю только за себя — мы думаем в терминах законов.

Поиск законов это не то же самое что поиск особенно чистых и красивых инструментов. Второй закон термодинамики это не одно и то же, что и чистый и красивый холодильник.

Цикл Карно это идеальный двигатель — на самом деле идеальный. Нет двигателя, который бы питался от двух накопителей тепла и был бы эффективней чем двигатель Карно. Как следствие, все термодинамически обратимые двигатели, которые функционируют между одинаковыми накопителями тепла, имеют одинаковую эффективность.

Но, конечно, вы не можете использовать двигатель Карно для питания реальной машины. Двигатель машины имеет такое же сходство с двигателем Карно, что и шины автомобиля с идеальными катящимися цилиндрами.

Тогда ясно, что двигатель Карно бесполезный инструмент для постройки настоящей машины. Второй закон термодинамики, очевидно, неприменим здесь. Чересчур сложно сделать двигатель который будет отвечать таким условиям, в реальности. Просто игнорируйте термодинамику — используйте все что работает.

Это определенный род путаницы, который, как я думаю, управляет теми, кто все еще цепляется за старые методы.

Нет, вы не можете всегда делать точные байесовские вычисления для проблемы. Иногда вам надо искать аппроксимацию; на самом деле, часто. Это не значит что теорию вероятности нужно прекратить применять, так же как ваша неспособность вычислить аэродинамику самолета из атомных взаимодействий не означает что самолет не сделан из атомов. Какую бы аппроксимацию вы не использовали, она будет работать если является аппроксимацией идеального байесовского вычисления — и не будет работать в любом другом случае.

Доказательства когерентности и уникальности байесианства отметают оба пути. Так же как любой расчет, который подчиняется аксиомам когерентности Кокса (или любой из его переформулировок или обобщений) должен отображаться в вероятностях, так что точно так же любой не байесовский расчет должен провалить какой-либо из тестов на когерентность. Что, в свою очередь, приводит к наказаниями таким как голландское бронирование (прием комбинаций ставок, которые приводят к точным убыткам или отказу от комбинаций, которые дают точные выгоды).

Вы можете быть не способны вычислить оптимальный ответ. Но любая аппроксимация которую вы используете, с ее достоинствами и недостатками, должна быть объяснима с позиции байесовской теории вероятности. Вы можете не знать объяснения: но это не значит что его не существует.
...
Бесполезно быть простым на поверхностном уровне. Вы должны погрузиться глубже, чтобы найти стабильность.

Мыслите законами, а не инструментами. Необходимость вычислять аппроксимации к закону не меняет закон. Самолеты по-прежнему состоят из атомов, они не станут исключением только из-за аэродинамических вычислений. Аппроксимация существует на карте, не на территории. Вы можете знать второй закон термодинамики и все еще пробовать себя как инженера, строя несовершенный двигатель машины. Второй закон не перестает быть применим; ваше знание этого закона и цикла Карно помогает вам приблизиться к наибольшей эффективности, которую вы только можете достигнуть.

Мы не очаровываемся байесовскими методами только потому что они красивы. Красота всего лишь побочный эффект. Теоремы Байеса изящны, когерентны, оптимальны и доказуемо однозначны, потому что они относятся к законам.
Прекрасная вероятность

Добавлено 07 Мая 2016, 18:20:
Так же рекомендую ознакомится с мысленным экспериментом - фокусировкой неуверенности.
« Последнее редактирование: 07 Мая 2016, 18:20 от Muyyd »

kuuff

  • Старожил
  • *****
  • Сообщений: 2 133
  • +220/-52
    • Просмотр профиля
В рамках данного треда, согласен что статистика используется. (Чтобы не вдаваться в терминологический спор)
Тут ни к чему терминологический спор. Если вы загляните в любую научную статью, которая делает какие-либо выводы из наблюдений или экспериментов, то вы увидите там матстатистку, вы увидите там матожидание, дисперсию и среднеквадратичное отклонение. В обязательном порядке, потому что из наблюдений невозможно сделать вывод не прибегая к матстатистике. Точнее не так. Люди могут делать выводы из наблюдений не прибегая к матстатистике, но люди склонны в этой деятельности совершать систематические ошибки. И единственный способ их избежать -- это проделывать всё строго и формально, а это значит -- заниматься матстатистикой.
Формула байесовской вероятности - это одна из неслучайных закономерностей между случайными величинами.
Мне ужасно не нравится эта ваша фраза, но и спорить с ней невозможно, потому что я не понимаю, что именно вы хотели донести этой фразой. А не нравится она мне потому, что свозь неё просвечивает непонимание вами:
1. разницы между формулой Байеса и байесовской вероятностью: вторая основана на первой, но это разные вещи, их следует отличать друг от друга. Формула Байеса работает и для частотной вероятности. И в частотной матстатистике формула Байеса -- это действительно один из многих костылей, из которых построена матстатистика -- почти так как вы и говорите, но с одним нюансом: не байесовская вероятность является одним из многих костылей частотной матстатистики, а теорема байеса является таким костылём.
2. закономерность -- это слово относящееся к чему-то из реального мира, байесовская же вероятность -- это сущность находящаяся в голове. И если мы говорим про байесовскую вероятность, то для неё формула байеса -- это не закономерность, а правило. То есть это инструмент. Типа молотка. Только молоток создан для работы с гвоздями, а теорема байеса для работы с вероятностями. Теорема Байеса в байесианстве порождает понятие вероятностей, и таким образом она порождает байесианство в целом.
Соответственно остались неотвеченными вопросы, сходные с темой треда:
- почему в рамках lesswrong байесовская вероятность выделяется из всех остальных видов закономерностей?
Предыдущий мой пассаж ответил на этот вопрос? Если нет, то попробуйте ответить на следующий вопрос:
какие закономерности, на ваш взгляд, должны стоять выше понятия вероятности, или хотя бы вровень с ней?
- почему в рамках lesswrong статистика редуцируется до байесовской вероятности?
Если совсем вкратце, то матстатистика -- это набор слабосвязанных друг с другом костылей, которые не могут быть связаны друг с другом в цельную систему потому, что матстатистика, опираясь на частотное опредление вероятности, отрицает таким образом субъективную природу вероятности. Познание, как процесс, базируется на матстатистике, на вероятности, на сомнении. На выдвижении гипотез и проверке их. Познание -- субъективный процесс, но поскольку матстатистика отрицает субъективность вероятности, она вынуждена постоянно создавать эту субъективность заново. Байесовая же вероятность, которая по определению субъективна, отлично приспособлена для отражения субъективных знаний, и из неё выводятся методы матстатистики как логичные следствия.
Но это если вкратце. Если подробно, то вам следует либо почитать Юдковского, либо понять, фразу "вероятность находится в голове", после чего взять учебник по матстатистике и почитать его, глядя на все его построения двойным взглядом: с точки зрения частотного определения и с точки зрения байесовского. Ещё можно посмотреть на теорию кодирования информации, теорию сжатия информации с точки зрения байесовской вероятности -- на них тоже очень хорошо видно разницу.

LswAgnostic

  • Ветеран
  • ****
  • Сообщений: 313
  • +29/-12
    • Просмотр профиля
какие закономерности, на ваш взгляд, должны стоять выше понятия вероятности, или хотя бы вровень с ней?

1+1=2; ((A=>B) and (B=> C)) => (A => C); вид случайного распределения(нормальное, пуасоново, равномерное и т.д.); матожидание.

Добавлено 08 Мая 2016, 00:34:
Потом Юдковский написал несколько статей и теперь я думаю о вероятностях, как о мере неуверенности агента. Но нам необязательно говорить об этом. Чем бы вероятности не являлись, мы все еще остаемся планирующими будущее агентами. В нашу голову приходя разные варианты будущего, в некоторых мы уверены больше чем в остальных. То же самое касается и того, какие действия увеличивают нашу уверенность в том, что конкретный вариант будущего реализуется. И для репрезентации этой неуверенности наиболее полезным инструментом является теорема Байеса.  И для краткости мы называем убеждения в которых мы не уверены (а это почти все наши убеждения об эмпирическом мире) - вероятностями.

Мера неуверенности != вероятность.

Мера неуверенности - в математике рассматривается нечеткой логикой и нечеткими множествами.

К мере неуверенности не применимы Байесовские законы, потому что мера неуверенности не является вероятностью.

ps
Мера полезности != вероятности; мера уверенности != вероятности; мера желательности != вероятности.
Все эти меры могут записываться в виде процентов, и из-за этого их можно спутать с вероятностью. Но они про другое, они ведут себя по другому, и к ним применимы другие законы.

Добавлено 08 Мая 2016, 00:42:
Тут ни к чему терминологический спор. Если вы загляните в любую научную статью, которая делает какие-либо выводы из наблюдений или экспериментов, то вы увидите там матстатистку, вы увидите там матожидание, дисперсию и среднеквадратичное отклонение.

Изначально утверждалось, что всякая кластеризация появляется как результат применения математической статистики.
Это не так.
Например, кластеризация чисел на целые, положительные, отрицательные, дробные, простые, иррациональные, Фибоначчи, Мерсенна делается на основе поведения чисел. На основе законов, которыми описывается данная группа чисел.

ps
Также неявно подразумевается, что все знания появляются в результате наблюдения за реальностью. Это не так.
Значительная часть знаний появляется в результате наблюдения за моделями. И исследования этих моделей.
Большая часть точных наук построена в результате исследования моделей.
« Последнее редактирование: 08 Мая 2016, 00:42 от LswAgnostic »

Muyyd

  • Ветеран
  • ****
  • Сообщений: 756
  • +45/-1
    • Просмотр профиля
Моя модель обучения и убеждения, разумеется, байесовская - в физическом смысле. И, если бы я хотел вас убедить в том, что, не только это возможно, но что
1. люди действительно моделируют неуверенность\уверенность с помощью вероятностей и теоремы Байеса;
2. что это один из (с учетом того, что я мало знаком с этой областью) мейнстримных способов моделирования убеждений (убеждение не как идеал, вроде "демократия - хорошо", а как знание_о_мире "в моем холодильнике возможно есть молоко")
В соответствии с принципом близости к задаче мне следовало бы, как это делается в литературе, разобрать несколько примеров, где мы могли бы посмотреть, какие модели неполного знания удобней и согласованней (должен признаться, я могу лишь приводить примеры и анализировать их с помощью теоремы Байеса, а не сравнивать разные способы моделирования неуверенности). Однако мне очень не хочется этим заниматься.

Вместо этого, я могу указать на литературу для чтения.

Юдковский:
Убеждения должны окупаться Убеждения, как ожидания. Убеждение - не то, что люди говорят, а то, что они ожидают. Убеждения не являющиеся ожиданиями принимают разные формы: Вера в убеждения, Провозглашения и крики ободрения, Убеждение как одеяние.
Интуитивное объяснение теоремы Байеса
A Technical Explanation of Technical Explanation Большая статья про особенности рациональности и байесовской эпистемологии: вероятностная фальсифицируемость, ожидание проснуться с тентаклем вместо руки, религия Байесианства и правило святого Лапласа.
Закономерная неуверенность. Статья о том, как при столкновении со случайными событиями люди склонны принимать решения по "случайному" алгоритму, вместо того, чтобы действовать по упорядоченному.
Рациональность: введение. Статья  Роба Бенсинджера из Rationality: From AI to Zombies.
Лотереи: бессмысленная трата надежды. Статья об эффекте уверенности и оценке шанса на примере лотереи. "Но шанс то есть?" - так люди говорят.
But There's Still A Chance, Right? Статья об эффекте уверенности и оценке шанса с другими примерами и новыми выводами.
Софизм серого. Статья про то, что убеждения не делятся исключительно на "точно произойдет" (1), может быть да\может быть нет (.5), точно нет (0). В скобках, разумеется, вероятности.
Absolute Authority. Про чудовщных размеров разрыв между людьми, привыкшими к уверенности и наукой, утверждения которой часто носят вероятностный характер, как и большая часть человеческого знания.
Как убедить меня в том, что 2+2=3 Описывается причинная цепочка, которая приводит людей к убеждению 2+2=4 и как такая же цепочка событий может убедить рационалиста в том, что 2+2=3.
Infinite Certainty В рамках байесовской эпистемологии, в соответствии с законами вероятности принято назначать логическим истинам вероятность 1. В рамках фреймворка "вероятность - мера уверенности" с вероятностями 1 возникают некоторые сложности. Эта статья описывает некоторые из них.
0 And 1 Are Not Probabilities . Знаменитое  доказательство Кокса (и разные его расширения и переделки) показывает, что все способы репрезентации неуверенности, подчиняющиеся разумным правилам будут изоморфны друг другу. И если перевести вероятности путем десятичного логарифма в децибелы, то будет видно, что 1 и 0 превращаются в бесконечности, что, в свою очередь требует свидетельство бесконечной силы.
Entropy, and Short Codes Энтропия Шеннона и вероятностная формализация бритвы Оккама - Сообщение минимальной длины
Mutual Information, and Density in Thingspace. Продолжение предыдущей статьи.
Conditional Independence, and Naive Bayes Эту статью я не осилил.
Прекрасная вероятность Про разные подходы к вероятностям и законам.
The Second Law of Thermodynamics, and Engines of Cognition Вероятностное доказательство необходимости взаимодействия с реальностью для получения точных убеждений о ней.
Perpetual Motion Beliefs Продолжение предыдущей статьи.
Decoherence is Simple Вероятностная интерпретация сложности гипотезы на примере "decoherence (a.k.a. many-worlds) version of quantum mechanics".
Decoherence is Falsifiable and Testable Вероятностная интерпретация фальсифицируемости (опровергаемости) и верифицируемости (способности делать новые предсказания), а так же формализации бритвы Оккама - "Индукция Соломонова" и "Сообщение минимальной Длинны".



Decision Making and Rationality in the Modern World (Fundamentals in Cognition) 1st Edition
Книга Становича про рациональность.
Во второй главе рассматривается рациональность действий (инструментальная рациональность - максимизация ожидаемой полезности; какое действие позволит максимально приблизить цель) и поведенческие паттерны, того, как люди отклоняются от норм инструментальной рациональности.
В третьей главе описывается рациональность убеждений (как придерживаться убеждений, которые соответствуют доступным свидетельствам - эпистемическая рациональность). И поведенческие паттерны, того, как люди отклоняются от норм эпистемической рациональности.
Обе рациональности - вероятностные, разумеется.

A Critical Introduction to Formal Epistemology (Bloomsbury Critical Introductions to Contemporary Epistemology) Применение формальной системы (тервер - Байес) для моделирования убеждений и разные трудности связанные с этим. Лодка, в которой плывет человек медленно погружается под воду. Он не верит в то, что тонет. Рациональны ли его убеждения?

Bayesian Epistemology 1st Edition Bayes is all the rage in philosophy. Metaphysicians discuss the nature of probability, philosophers of religion recast the problem of evil and the argument from design in probabilistic terms, ethicists appeal to decision- and game-theoretic arguments. We ride this wave and examine what probabilistic models have to offer for certain topics in epistemology and for epistemological questions in philosophyof science. Our approach is an engineering approach rather than a foundational approach. Just as engineers do not bother with the foundations of geometrywhen constructing a bridge, we are consumers of probabilitytheoryand the theoryof Bayesian Networks and construct models to resolve philosophical questions.


Probability Theory: The Logic of Science 1st Edition
Впечатлившая Юдковского своей дотошностью книга про репрезентацию убеждений с помощью тервера от автора Mind projection fallacy. И статьи Юдковского на эту тему: Вероятность находится в голове, Probability is Subjectively Objective, Frequentist Statistics are Frequently Subjective.

Книги Канемана, разумеется, без них куда.

И финальная статья: Ожидая короткие понятийные расстояния