Автор Тема: Парадокс Аллэ (Прочитано 33266 раз)

mihaild · « **Ответ #15 :** 20 Июля 2016, 02:57 »

Цитата: LswAgnostic от 20 Июля 2016, 01:57

По какому определению?

Ну например из VNM рациональности. Вообще, с учетом того что мы хотим считать от нее мат. ожидание - ее кодоменом логично считать вещественные числа (меньше нельзя, т.к. вероятности вещественные; больше бессмысленно, т.к. наибольшая галактика забьет всё остальное).

Но я не настаиваю на этом определении - можно взять ваше, если вы его приведете (и сформулируете, что вы от него хотите).

valergrad · « **Ответ #16 :** 20 Июля 2016, 09:46 »

По-моему там под функцией полезности имеется ввиду другое, нечто попроще.
f(X) - функция от количества денег которую мы хотим максимизировать.
И для нее, в общем-то, не требуется монотонность в данном парадоксе.

LswAgnostic · « **Ответ #17 :** 20 Июля 2016, 11:21 »

Общая постановка задачи:
Есть состояние S0.
Есть действия Di, которые возможно выполнить из S0.
Есть получаемые состояния Si, Si = S0+Di
Необходимо из множества Di выбрать лучшее.

Для выбора лучшего удобно задать функцию полезности f. Общий вид функции полезности: f(D1..Dn)->Di или f(S1..Sn)->Si.
Частные способы задания функции f могут быть следующие:
1. f(Si) -> R, где R - рациональное число
2. f(Di) -> R, где R - рациональное число
3. f(Si, Sj) -> bool или f(Si, Sj) -> Si | Sj
4. f(Di, Dj) -> bool или f(Di, Dj) -> Di | Dj
5. f(подможество(Si1..Sin)) -> Si, где Si принадлежит (Si1..Sin)
6. f(подможество(Di1..Din)) -> Di, где Di принадлежит (Di1..Din)

У каждого из вариантов есть свои минусы:
1, 2: трудоемко описать функцию, описывающую отображение континиуума континиумов исходов на множество рациональных чисел. Невозможно описать нетранзитивную реальность. Например, игру камень-ножницы-бумага.
3, 4: требует N^2 вызовов f для сравнения всех вариантов
5, 6: требует нетривиальную функцию перебора подмножеств исходов

Добавлено 20 Июля 2016, 11:47:
Поговорим теперь о транзитивности, а не о монотонности )

Цитата: valergrad от 20 Июля 2016, 09:46

И для нее, в общем-то, не требуется монотонность в данном парадоксе.

Если функция полезности задается как: f(Si) -> R, то она требует, чтобы все исходы Si были упорядочены одним образом. Требуется транзитивность исходов. В кейсе "гони 100$ или смерть" нет транзитивности исходов при переходе от одного выбора к неизвестному числу нескольких выборов.

mihaild · « **Ответ #18 :** 20 Июля 2016, 15:20 »

Цитата: LswAgnostic от 20 Июля 2016, 11:21

Есть получаемые состояния Si, Si = S0+Di

Что здесь значит "+"?

Цитата: LswAgnostic от 20 Июля 2016, 11:21

1. f(Si) -> R, где R - рациональное число

А почему рациональное, а не вещественное?

Цитата: LswAgnostic от 20 Июля 2016, 11:21

3. f(Si, Sj) -> bool или f(Si, Sj) -> Si | Sj

Что за объект Si | Sj? Имеется в виду, что f: S \ times S \to \{0, 1\}?

Цитата: LswAgnostic от 20 Июля 2016, 11:21

5. f(подможество(Si1..Sin)) -> Si, где Si принадлежит (Si1..Sin)

Если между (A, B) мы выбираем A, а между (A, B, C) мы выбираем B, то это как-то совсем странно, так что тут хочется f(S' \cup S'') = f(\{f(S'), f(S'')\})$ - что сводит этот случай к предыдущему.

Цитата: LswAgnostic от 20 Июля 2016, 11:21

1, 2: трудоемко описать функцию, описывающую отображение континиуума континиумов исходов на множество рациональных чисел. Невозможно описать нетранзитивную реальность. Например, игру камень-ножницы-бумага.

Выпишите, пожалуйста, определение "транзитивной реальности".

Цитата: LswAgnostic от 20 Июля 2016, 11:21

Если функция полезности задается как: f(Si) -> R, то она требует, чтобы все исходы Si были упорядочены одним образом. Требуется транзитивность исходов. В кейсе "гони 100$ или смерть" нет транзитивности исходов при переходе от одного выбора к неизвестному числу нескольких выборов.

Она не требует никакого упорядочения - она его задает (собственно за этим она и нужна).
Если у вас предпочтения имеют вид "А лучше Б, Б лучше В, В лучше А", то давайте я вам выдам вариант А, вы мне заплатите $1 за переход к варианту Б, потом $1 за переход к В, потом $1 за переход к А. Повторять до достижения просветления.

anagor1 · « **Ответ #19 :** 20 Июля 2016, 16:59 »

ТС на самом деле очень правильный подход продемонстрировал. Только надо его обобщить и не пытаться сразу вот так вот втиснуть в рамки формальной математики.

Всякий парадокс субъективен. (Если он объективен, то это не парадокс, а научная проблема.) То есть, он существует у нас в сознании (но не обязательно у всех нас) и отражает наличие там некоего когнитивного искажения. По сути, парадоксальность - это не факт, а ощущение, чувство, эмоция. Это звоночек у нас в голове: "братан, типа по жизни чота не так, ну-ка давай проверь настройки!" Избавиться от чувства парадокса - с практической точки зрения и означает его разрешить. Он перестает тебя мучить, перестает отбирать твои ресурсы - а не в этом ли задача? Не абстрактная задача, а твоя, личная?

Одним из типичных искажений при "чувстве парадокса" является т.н. "баба", или "аберрация абстрагирования". Суть ее в том, что во всех задачках, подобных Аллэ, в качестве условия всегда приводится абстрактная, оторванная от жизни ситуация. Но человек не живет в абстрактном платоновском мире. Он живет в в мире вещном, где не бывает таких простых ситуаций, где каждая ситуация всегда обставлена кучей привходящих обстоятельств, а условия якобы парадоксальной задачи - лишь проекция, искаженная, аберрированная и частично обессмысленная, как вырванная из контекста фраза. Причем обстоятельства эти разные и у разных людей, и у меня в разные моменты моего бытия. Реальные решения принимаются в реальной жизни (а моя жизнь для меня субъективно реальна, в рамках туннеля, конечно), а не в платоновском мире идей.

Дело в том, что в студенческие годы мы тоже баловались всякими рациональными идеями и концепциями (не теряя, впрочем, самоиронии). И насочиняли всякой херни _{не меньше Юдковски}, часть из которой, видимо, не совсем херня, так как запала в память. Причем отдельные понятия, вроде бы чисто наши, тусовочные - например, "туннель реальности" - и вовсе обнаружились через некоторое время в популярных концепциях почти в такой же формулировке.

Еще одним универсальным понятием был и является УДК - Условный Душевный Комфорт. Это по определению, видимо, и есть та самая "функция полезности". Ибо "всё, что мы делаем - мы делаем ради того, чтобы максимизировать УДК". Вот только формализовать УДК в терминах математики нет никакого смысла. Он и так вполне годится, чтобы снимать баб... э-э-э... в смысле, устранять аберрации. И для многих других задач (скажем, чтобы жить было веселее).

Теперь у нас достаточно понятий, чтобы рассмотреть этот якобы парадокс. Собственно, серьезную дилемму представляет лишь первая его половина. Выбор (может быть, не рациональный, но правильный, потому что максимизирует УДК) сильно зависит от обстоятельств. Скажем, если я банкир и речь идет о наполнении кассы банка (в которой уже лежат миллионы), я наверняка выберу 27000. Если у меня есть знание о многократной повторяемости данного эксперимента - тоже. Если страховая компания готова за 1000 застраховать меня от потери 27 тыс. - тем более. (И будь у меня тыщ 100, я готов буду поработать такой страховой компанией, если у Аллэ в приемной выстроится очередь желающих попытать счастья.)
Но в типичной своей ситуации я выберу 24, и буду прав. Потому что с точки зрения своего бюджета я плохо различаю 24 и 27, у меня все равно нет четких планов, как их потратить. УДК, полученный от приобретения этих денег, примерно один и тот же. А вот выбрав 27, я рискую этого УДК лишиться на много дней вперед. С вероятностью 1/34 (пусть маленькой, но далеко не нулевой) меня как минимум неделю будет грызть живьем моя жаба, напевая: "Дурак, вот дурак! А выбрал бы 24 - сейчас бы летел на Канары..." Минутный дискомфорт в момент выбора или долгий-долгий потом... да о чем тут говорить!

А вот во втором варианте выбора дилемма в проекции на УДК на самом деле очень слабая. Я у него (у комфорта своего) спросил, и он ответил, что почти не различает вероятности 33% и 34%. "Поэтому, - говорит, - бери 27 и не мучайся." Я и беру. Хотя три на два в кубе мне кажется красивее, чем три в кубе. Потому что особой разницы нет Получится урвать - хорошо, не получится - хрен с ним. Главное, правильно настроиться и быть готовым к облому.
То есть, психотехника, позволяющая подавить раздражение от неудачи, гораздо проще (деньги - пыль!), УДК в обоих случаях страдает примерно одинаково, и куда меньше, чем в случае неудачи при шансах 33/34.

Так что я вот лично никак не пойму, где парадокс. Я умею считать, чесслово. Две секунды - и я скажу вам, что абстрактно выгоднее с точки зрения тервера. Но я не понимаю, зачем видеть тут парадокс? Какая мне с этого польза? У меня за дверью живой Юдковски, что ли, стоит с двумя коробками? Но коли так - тем более неважно, 24 или 27. Все равно ж часть пропьем, а остальное придется пожертвовать на цели создания дружественного ИИ.

mihaild · « **Ответ #20 :** 20 Июля 2016, 17:18 »

А теперь представьте, что во втором варианте при вас кидается d100, и в А дают 24к, если выпало 1-34, а в Б - 27к, если выпало 1-33.

Мне кажется, что если поймать на улице человека, объяснить ему, что такое VNM независимость (на простом примере "расстрел-яблоко-апельсин"), то он скажет, что его выбор этой аксиоме удовлетворяет.

LswAgnostic · « **Ответ #21 :** 21 Июля 2016, 00:45 »

Цитата: mihaild от 20 Июля 2016, 15:20

Что здесь значит "+"?

оператор сложения

Цитировать

А почему рациональное, а не вещественное?

ошибка, вещественное.

Цитировать

Что за объект Si | Sj? Имеется в виду, что f: S \ times S \to \{0, 1\}?

Цитировать

> 5. f(подможество(Si1..Sin)) -> Si, где Si принадлежит (Si1..Sin)

Если между (A, B) мы выбираем A, а между (A, B, C) мы выбираем B, то это как-то совсем странно

Такое задание помогает оценивать сразу целые подмножества состояний, без необходимости оценки каждого состояния.

Цитировать

Выпишите, пожалуйста, определение "транзитивной реальности".

В виде "транзитивной игры" конкретнее?

Цитировать

Она не требует никакого упорядочения - она его задает (собственно за этим она и нужна).

Откуда следует, что задание транзитивным способом является самым оптимальным?

Цитировать

Если у вас предпочтения имеют вид "А лучше Б, Б лучше В, В лучше А", то давайте я вам выдам вариант А, вы мне заплатите $1 за переход к варианту Б, потом $1 за переход к В, потом $1 за переход к А. Повторять до достижения просветления.

Да, почему нет?

A - отдых на пляже
Б - вечер с привлекательной девушкой
В - увлекательное дело

Kroid · « **Ответ #22 :** 21 Июля 2016, 01:23 »

Отмечу еще один момент:

Цитировать

[...] большинство людей предпочтут вариант 1А, и большинство людей предпочтут вариант 2Б [...]
Это проблема, поскольку второй вариант задачи эквивалентен одной трети шанса от первого. То есть, 2А это все равно что получить 1А с вероятностью в 34%, и 2Б эквивалентно 1Б с вероятностью 34%.

Проблема как-раз таки не в этом, а в том, что эквивалентность этих задач формальная. Есть фундаментальная разница между вероятностным событием и точным событием.

Большая часть людей в этой теме, если упростить, пишет нечто вроде: "Пфф, глупенькие, вот вам формула как считать вероятности, так что нечего противоречивые варианты выбирать. Другая функция полезности? Выбросьте, вот вам правильная, вот вам формулы. И солидное трехбуквенное сокращение захватите."

Добро пожаловать в реальный мир, Нео! Оказывается, у большинства людей цель - не теоретическая максимизация количества денег. Оказывается, на принятие решения влияет больше одного соображения. Оказывается, в функции полезности у них не простая формула вроде "y=2x+5", а логика с кучей if'ов и приоритетов.

Цитировать

Выберите между двумя следующими возможностями

Нигде не написано: "парни, не бойтесь, этот эксперимент будет повторяться значимое количество раз, это не единичный случай".
24к$ это 60 месяцев при средней зарплате в 400$. 27к$ - всего лишь 68 месяцев.
В первом случае мы выбираем между гарантией получения большой суммы денег и азартной игрой с чуть большей суммой.
Во втором случае у нас и там и там азартная игра, варианты выбора которой не слишком сильно друг от друга отличаются.
Говорить об эквивалентности этих задач довольно смело.

Вот, в общем-то и всё. Читал я о том, как чиновники без проблем договариваются о проектах с бюджетом в миллиарды, но грызутся в проектах на сумму в десятки тысяч. Что-то о строительстве электростанции и стоянки велосипедов рядом с ней. С одной стороны абстрактный миллион, с другой - вполне реальные пара тысяч, сравнимые с зарплатой. Так же и тут. Одни абстрактно воспринимают 24 и 27 тысяч, подсчитывая их формулой. Другие накладывают эти цифры на свои текущие приоритеты.

mihaild · « **Ответ #23 :** 21 Июля 2016, 01:51 »

Цитата: LswAgnostic от 21 Июля 2016, 00:45

оператор сложения

Цитата: LswAgnostic от 21 Июля 2016, 00:45

Такое задание помогает оценивать сразу целые подмножества состояний, без необходимости оценки каждого состояния.

Вы согласны, что если мы выбираем А из (А, Б), то мы не можем выбирать Б из (А, Б, В)? Если да - то все функции на подмножествах однозначно задаются своими значениями на двухэлементных подмножествах, и для простоты анализа можно считать, что они сразу заданы на них.

Цитата: LswAgnostic от 21 Июля 2016, 00:45

В виде "транзитивной игры" конкретнее?

Нет. Что такое "транзитивная игра"?

Цитата: LswAgnostic от 21 Июля 2016, 00:45

Откуда следует, что задание транзитивным способом является самым оптимальным?

Что значит "оптимальным"? Без транзитивности неизбежно будет существовать money pump.

Цитата: LswAgnostic от 21 Июля 2016, 00:45

Да, почему нет?

Потому что вам на каждом шаге становилось лучше, а в результате всех шагов получилось, что вы имеете всё что было, минус $3.

Цитата: Kroid от 21 Июля 2016, 01:23

Отмечу еще один момент:
Проблема как-раз таки не в этом, а в том, что эквивалентность этих задач формальная. Есть фундаментальная разница между вероятностным событием и точным событием.

Можно это воспринимать как одно из объяснений парадокса - люди не умеют оперировать с вероятностью (и вообще не любят числа).

Цитата: Kroid от 21 Июля 2016, 01:23

Другая функция полезности? Выбросьте, вот вам правильная, вот вам формулы.

Тут противоречие для любой функции полезности, удовлетворяющей аксиоме независимости.

Цитата: Kroid от 21 Июля 2016, 01:23

Оказывается, у большинства людей цель - не теоретическая максимизация количества денег.

А никто не предполагает, что функция полезности линейна по деньгам.

Еще раз. Нет ничего странного в выборе А в обоих случаях. Нет ничего странного в выборе Б в обоих случаях. Странно выбирать А в одном, а Б в другом.

Цитата: Kroid от 21 Июля 2016, 01:23

Оказывается, на принятие решения влияет больше одного соображения. Оказывается, в функции полезности у них не простая формула вроде "y=2x+5", а логика с кучей if'ов и приоритетов.

А это неважно. Нигде не используются никакие свойства функции полезности, кроме непрерывности (ну и определения).
Вообще, аргумент "в реальном мире всё сложнее" одинаково применим против любой точки зрения, поэтому он ничего не подтверждает.

Цитата: Kroid от 21 Июля 2016, 01:23

Говорить об эквивалентности этих задач довольно смело.

Ну давайте переформулируем. Игра проходит так.
Вам предлагают выбрать вариант А или Б. Потом с вероятностью 66% вас отправляют домой. В противном случае вам предлагают сменить выбор, заплатив за это $1. Если вы (с учетом смены) выбираете А, то получаете свои 24к, если Б - то с вероятностью 33/34 получаете 27к, с вероятностью 1/34 получаете 0.

Те, кто выбирают Б в варианте 33%/34% и А в варианте 100%/(33/34), просто так ни за что заплатят $1.

Цитата: Kroid от 21 Июля 2016, 01:23

Вот, в общем-то и всё. Читал я о том, как чиновники без проблем договариваются о проектах с бюджетом в миллиарды, но грызутся в проектах на сумму в десятки тысяч. Что-то о строительстве электростанции и стоянки велосипедов рядом с ней. С одной стороны абстрактный миллион, с другой - вполне реальные пара тысяч, сравнимые с зарплатой.

(это еще у Паркинсона было - что максимальное время обсуждение требуется на расходы от годовой до 10 годовых зарплат участников)

Kroid · « **Ответ #24 :** 21 Июля 2016, 02:24 »

Цитировать

Тут противоречие для любой функции полезности, удовлетворяющей аксиоме независимости.

Вот вам пара процедур с разными приоритетами, входящие в состав некоторой логики, определяющей принятие решений:
if азартная_игра then некоторый_рассчет else другой_рассчет end
if выбор_между_заработком_и_азартной_игрой then специальный_способ_рассчета end

Их вполне можно заменить отрицанием, if и else местами поменять, всего-то. Удовлетворяет ли эта функция полезности неким принципам или нет, это как-бы ваша проблема. Вы придумали какое-то определение или вычитали его где-то и отбраковываете все остальные. Типа "неправильные". Недавно в чемпионате по Го компьютер обыграл одного корейца. Я почти уверен, что алгоритм выбора хода будет противоречить вашему определению "функции полезности".

Цитировать

Можно это воспринимать как одно из объяснений парадокса - люди не умеют оперировать с вероятностью (и вообще не любят числа).

Вы не поняли, что я хочу донести. Повторю немного другими словами и, надеюсь, более точно:

У нас два разных случая.
В первом случае мы выбираем между детерминированной и недетерминированной ситацией.
Во втором случае у нас на выбор две недетерминированные ситуации.
Обе ситуации единичны.

Нет противоречий в том, чтобы использовать стандартный тервер во втором случае и другой способ принятия решения в первом. И это не потому что "люди не умеют оперировать с вероятностью". Если человеку больше нравится апельсин, а не яблоко, то это не значит, что ему будет больше нравится апельсиновый пирог, а не шарлотка.

Цитировать

Ну давайте переформулируем. Игра проходит так.
Вам предлагают выбрать вариант А или Б. Потом с вероятностью 66% вас отправляют домой. В противном случае вам предлагают сменить выбор, заплатив за это $1. Если вы (с учетом смены) выбираете А, то получаете свои 24к, если Б - то с вероятностью 33/34 получаете 27к, с вероятностью 1/34 получаете 0.

Может, из-за ночи, но я не понял смысл. 1$ на фоне 24-27к - погрешность, ну да ладно. В чем смысл изменять свое решение, да еще платить за это? Может, наоборот? Мне предлагают 1к$ за то, чтобы я сменил решение?

LswAgnostic · « **Ответ #25 :** 21 Июля 2016, 02:43 »

Цитата: mihaild от 21 Июля 2016, 01:51

Вы согласны, что если мы выбираем А из (А, Б), то мы не можем выбирать Б из (А, Б, В)? Если да - то все функции на подмножествах однозначно задаются своими значениями на двухэлементных подмножествах, и для простоты анализа можно считать, что они сразу заданы на них.

Допустим, да.

Предполагаю, что "простота анализа" не является однозначным понятием.

Вычислительно проще - один раз выполнить f(множество размерности N), чем делать N*logN вызовов f для попарного сравнения.

ps

Цитировать

и для простоты анализа можно считать, что они сразу заданы на них.

Согласен с вами, если оперировать в понятиях классической математики.
Не согласен, если перейти к конструктивной математике.

Цитировать

Что такое "транзитивная игра"?

Транзитивная игра - "сила" состояний не образует циклов. Другими словами: есть заведомо выигрышное состояние, которое "бьёт" все остальные состояния.

Нетранзитивные игры: камень-ножницы-бумага, пьяница, переводной дурак.

Цитировать

Что значит "оптимальным"?

Например, если такой подход позволяет достичь результата в большем количестве игр.

Цитировать

Без транзитивности неизбежно будет существовать money pump.

Money pump будет, если все состояния можно перевести в деньги, и когда всё можно получить за деньги. Но не все состояния переводятся в деньги и получаются за деньги.

Цитировать

Потому что вам на каждом шаге становилось лучше, а в результате всех шагов получилось, что вы имеете всё что было, минус $3.

Но ведь глупо задавать функцию полезности, что девушка всегда лучше, чем работа и отдых? Или что отдых лучше, чем девушка и работа? Или что работа, лучше чем отдых или девушка?
И одновременные девушка + работа + отдых, тоже едва ли лучше, чем девушка, работа и отдых - по отдельности.

Чем больше у индивидуума различных потребностей и чем больше в мире независимых между собой аспектов, тем больше появляется несравнимых между собой состояний. Состояния не сравнимы -> нет возможности их отобразить на множество вещественных чисел.

mihaild · « **Ответ #26 :** 21 Июля 2016, 02:43 »

Цитировать

Вот вам пара процедур с разными приоритетами, входящие в состав некоторой логики, определяющей принятие решений:
if азартная_игра then некоторый_рассчет else другой_рассчет end
if выбор_между_заработком_и_азартной_игрой then специальный_способ_рассчета end

А тут портится непрерывность, что еще хуже (мы совсем слабо поменяли условия, и получили резкую смену предпочтений).

Цитировать

Удовлетворяет ли эта функция полезности неким принципам или нет, это как-бы ваша проблема

Как бы 1) название "функция полезности" стоит за чем-то зарезервировать, если не за VNM полезность, то дайте своё определение; 2) отказ от этих аксиом тоже приводит к разным неинтуитивным эффектам (я привел пример).

Цитировать

Я почти уверен, что алгоритм выбора хода будет противоречить вашему определению "функции полезности".

Прежде чем обсуждать, истинно ли это утверждение - сформулируйте, пожалуйста, что оно значит. Как вообще может "алгоритм" противоречить "определению" (что это значит синтаксически?)

Цитировать

Может, из-за ночи, но я не понял смысл. 1$ на фоне 24-27к - погрешность, ну да ладно. В чем смысл изменять свое решение, да еще платить за это? Может, наоборот? Мне предлагают 1к$ за то, чтобы я сменил решение?

Вы, я так понял, берете гарантированные 24, а в лотерее выбирайте 27.
Давайте проводить лотерею в 2 этапа: с вероятностью 66% мы тут же заканчиваем, в противном случае выбор между гарантированными 24 и возможными 27.
Т.к. неважно, как генерировать вероятности 33%/34%, то вы изначально должны выбрать 27к.
Т.к. после броска (если повезло) мы переходим в первый вариант, то вы должны выбрать после него 24к.
В предположении, что предпочтения строгие, вы должны быть готовы доплатить $1 за то, чтобы получить тот вариант, который выбираете, а не противоположный.

Добавлено [time]21 Июль 2016, 02:53[/time]:

Цитировать

Предполагаю, что "простота анализа" не является однозначным понятием.

Функций на двухэлементных множествах меньше, чем функций на всех подмножествах. Ладно, можно считать, что у нас есть предпочтения на парах - из них можно сделать предпочтения на всех подмножествах.

Цитировать

Не согласен, если перейти к конструктивной математике.

Т.к. все множества можно считать конечными (нам доступно конечное количество информации, и наши действия имеют конечную точность), то неважно.

Цитировать

Транзитивная игра - "сила" состояний не образует циклов. Другими словами: есть заведомо выигрышное состояние, которое "бьёт" все остальные состояния.

В смысле - есть чистая доминирующая стратегия?
И как вообще функция полезности связана с играми? (если мы хотим определить, какую стратегию играть - то честно взвешиваем различные исходы при каждой стратегии на вероятности, и считаем)

Цитировать

Например, если такой подход позволяет достичь результата в большем количестве игр.

Какой "такой"?
Вообще, функция полезности и теория игр - это формализмы про немного разные вещи. Первое конечно можно прикрутить ко второму, но это какое-то натягивание совы на глобус.

Цитировать

Но не все состояния переводятся в деньги и получаются за деньги

За какую сумму вы согласитесь нажать кнопку, убивающую вас с вероятностью p, в зависимости от p? (ответ "ни за какую ни для какого p > 0" не согласуется с вашими действиями на практике - т.е. беря его, вы просто теряете деньги и увеличиваете риск)

Цитировать

Но ведь глупо задавать функцию полезности, что девушка всегда лучше, чем работа и отдых? Или что отдых лучше, чем девушка и работа? Или что работа, лучше чем отдых или девушка?

Порядок задается на простых исходах, и продолжается на их стохастические комбинации. Никакого суммирования исходов в VNM формализме нет, если вы хотите этим заниматься - это нужно делать в другой модели.

Цитировать

Состояния не сравнимы -> нет возможности их отобразить на множество вещественных чисел

Ну вы же как-то сделаете выбор между двумя вариантами, если он возникнет?

Добавлено 21 Июля 2016, 02:55:

Цитировать

Money pump будет, если все состояния можно перевести в деньги, и когда всё можно получить за деньги

Money pump будет в случае, если будут 3 состояния A > B > C > A, где разница между состояниями важнее, чем 1 цент.

valergrad · « **Ответ #27 :** 21 Июля 2016, 08:36 »

В целом, как мы видим, парадокс не так уж и прост. Я вижу в этой теме несколько человек так и не понявших суть...
Необходимо придумать пример, в котором разница между 33% и 34% была бы наглядней, тогда вероятно людям будет проще. Сделаю попытку:

Вы приходите на игру "Поле чудес". Сейчас вы вращаете барабан и в зависимости от того, на каком делении остановится стрелка - получите или деньги или ничего. На барабане ровно 100 делений. Среди них 66 делений - черные. Если стрелка остановится на черном делении - вы не получите ничего. 33 деления из 100 - красные. И одно, последнее деление - золотое. Вы вращнули барабан, стрелка еще не остановилась, а пока она крутится, ведущий спрашивает у вас - выберите вариант A или B. В варианте "A" вы получите 24 тысячи если выпадет красное деление и 24 тысячи - на золотом. В варианте "B" вы получите 27 тысяч на красных делениях и ничего не получите на золотом. Что бы вы выбрали?

Те, кто отстаивает вариант 2B, не ощущая разницу между 33% и 34%, как бы вы поступили если бы эта разница была визуализирована вам в виде золотого деления? Я понимаю людей, которые выбирают 1A - они не хотят потом в случае ( маловероятного, с вероятностью 1/33 ) проигрыша думать, что могли бы выиграть хотя бы 24 тысячи, и поэтому выбирают 1A.
А теперь подумайте, как вы будете себя ругать, если выберете 2B, а стрелка остановится на золотом делении? Не чувствуете ли вы, что надо выбирать 2A?

anagor1 · « **Ответ #28 :** 21 Июля 2016, 10:37 »

Цитата: Kroid от 21 Июля 2016, 01:23

Большая часть людей в этой теме, если упростить, пишет нечто вроде: "Пфф, глупенькие, вот вам формула как считать вероятности, так что нечего противоречивые варианты выбирать. Другая функция полезности? Выбросьте, вот вам правильная, вот вам формулы. И солидное трехбуквенное сокращение захватите."

Добро пожаловать в реальный мир, Нео! Оказывается, у большинства людей цель - не теоретическая максимизация количества денег. Оказывается, на принятие решения влияет больше одного соображения. Оказывается, в функции полезности у них не простая формула вроде "y=2x+5", а логика с кучей if'ов и приоритетов.

У большинства людей нет функции полезности. Есть ощущение полезности. Его формирует Система 1, которая "размышляет" в других терминах. Грубо говоря - в гештальтах. Можно допустить, что их тоже можно свести с элементарным понятиям теории информации. Но никакого практического смысла в этом нет. Гештальное ("ассоциативное") мышление дает при принятии решений огромный выигрыш во времени по сравнению с рациональным. А время, в отличие от денег - невосполнимый ресурс.
Увы, аберрация абстрагирования - типичное когнитивное искажение байесианца. Связано это, видимо, с ложной индукцией убеждения "вероятность - у нас в голове" в "у нас в голове - вероятность [и ничего более]".
Утверждение "рациональное решение всегда правильно" не эквивалентно "правильное решение всегда рационально", если правильных решений много, поскольку "правильность" - субъективна. Подмена первого (к которому коннотативно приписывается "для меня") на второе фактически означает претензию на "правда одна, и именно я ей обладаю [поскольку рационален]" и придает таким убеждениям отчетливый оттенок религиозности.
В итоге возникает каузальная аберрация - грубо говоря, "подмена цели методом", а точнее - наделение метода каузальностью, придание ему осмысливающего начала, превращение его в самоцель. Но в жизни никогда нет цели "решить задачу методами теорвера", есть цель лишь "решить задачу". Есть разница между "использовать в задаче рациональное мышление" и "навязывать задаче рациональное мышление". Если вы убеждены, что методами теорвера решите ее лучше, или даже если вы убеждены, что методами теорвера кто угодно решит ее лучше - это лишь ваше убеждение, не более.
"Убежденность" - вообще опасное понятие. В голове оно легко и незаметно трансформируется из субъективного "мне не известны свидетельства против" в объективное "отсутствуют свидетельства против", не допускающее в голову сомнений. Например, убежденность в универсальности и "правоте" байесианства мотивирует "глушить звук" на любые возражения, ведь сомнение - это дискомфорт. Лучше уж не иметь никаких убеждений.

valergrad · « **Ответ #29 :** 21 Июля 2016, 11:59 »

Цитата: Kroid от 21 Июля 2016, 01:23

Большая часть людей в этой теме, если упростить, пишет нечто вроде: "Пфф, глупенькие, вот вам формула как считать вероятности, так что нечего противоречивые варианты выбирать. Другая функция полезности? Выбросьте, вот вам правильная, вот вам формулы. И солидное трехбуквенное сокращение захватите."

Добро пожаловать в реальный мир, Нео! Оказывается, у большинства людей цель - не теоретическая максимизация количества денег. Оказывается, на принятие решения влияет больше одного соображения. Оказывается, в функции полезности у них не простая формула вроде "y=2x+5", а логика с кучей if'ов и приоритетов.

Kroid, вы просто ничего не поняли.
Нигде в этом парадоксе не требуется, что функция полезности - это максимизация количества денег. Она может быть какой угодно, хоть максимизацией, хоть минимизацией, хоть выкладыванием красивых узоров из циферек.
Нигде в этом парадоксе не требуется, чтобы влияло ровно одно соображение, чтобы была логика в виде формулы, или чтобы не было логики с кучей if-в и приоритетов. Функция полезности может быть какой угодно - нет, прям вообще какой угодно какую вы себе можете вообразить.
Единственное требование которое мы требовали от нее - это ее одинаковость в эксперименте 1 и эксперименте 2. Если я считаю что заработать доллар с помощью азартной игры - это хорошо, заработать 2 доллара - еще лучше, и 3 почему-то уже некомильфо - то я считаю это и в эксперименте 1 и в эксперименте 2. Если я считаю что это плохо, и вообще я люблю синенькие бумажки, а не зелененькие - то точно также в обоих экспериментах. Мы не накладывали НИКАКИХ ограничений на функцию полезности, мы требовали всего лишь чтобы она была ОДИНАКОВОЙ в эксперименте 1 и в эксперименте 2.
Но люди по разному выбирают в эксперименте 1 и в эксперименте 2 - это значит что они не считают функцию полезности для вариантов, а учитывают еще формулировку самих вариантов, потому что любая функция полезности учитывающая только сами варианты а не их формулировку дала бы одинаковый результат в этих двух экспериментах.

Другой, значительно более упрощенный вариант этого парадокса, может вам будет понятней. Человек собирается пить какую-то фарму для бодибилдинга, и мы ему говорим:
Вариант 1: "Ты знаешь, что одна сотая процента людей в мире погибает от этого препарата, даже вчера так было?"
Вариант 2: "Ты знаешь, что 20 человек в мире умерло из-за этого препарата только за вчера?"

Вариант 1 и Вариант 2 идентичны, но я могу себе представить человека, который на Вариант 1 скажет "ээээ, фигня!", а на вариант 2: "ничего себе! может не стоит...". Это просто разные способы подачи информации. Рациональный человек рассчитал бы в обоих случаях функцию полезности с учетом рисков и получил бы одинаковый результат в обоих случаях. Функция полезности могла быть самой разной, хоть "да я все равно хочу сдохнуть" или "такая красивенькая упаковка...", но решение было бы одинаковым в обоих случаях. У нерационального оно может оказаться разным, просто из-за разного способа представления.
С этим парадоксом то же самое. Задача 2 - это просто-напросто переформулированная задача 1, хоть это и значительно труднее увидеть чем, например в моем примере. Я допускаю что вы этого не видите, тервер сложно дается людям, я сам не сразу увидел, но это так. Поэтому ответ должен быть одинаков, если наш ответ зависит от задачи, а не от ее формулировки.

Добавлено [time]21 Июль 2016, 12:11[/time]:

Цитата: anagor1 от 21 Июля 2016, 10:37

У большинства людей нет функции полезности. Есть ощущение полезности. Его формирует Система 1, которая "размышляет" в других терминах. Грубо говоря - в гештальтах. Можно допустить, что их тоже можно свести с элементарным понятиям теории информации. Но никакого практического смысла в этом нет. Гештальное ("ассоциативное") мышление дает при принятии решений огромный выигрыш во времени по сравнению с рациональным. А время, в отличие от денег - невосполнимый ресурс.
Увы, аберрация абстрагирования - типичное когнитивное искажение байесианца. Связано это, видимо, с ложной индукцией убеждения "вероятность - у нас в голове" в "у нас в голове - вероятность [и ничего более]".
Утверждение "рациональное решение всегда правильно" не эквивалентно "правильное решение всегда рационально", если правильных решений много, поскольку "правильность" - субъективна. Подмена первого (к которому коннотативно приписывается "для меня") на второе фактически означает претензию на "правда одна, и именно я ей обладаю [поскольку рационален]" и придает таким убеждениям отчетливый оттенок религиозности.
В итоге возникает каузальная аберрация - грубо говоря, "подмена цели методом", а точнее - наделение метода каузальностью, придание ему осмысливающего начала, превращение его в самоцель. Но в жизни никогда нет цели "решить задачу методами теорвера", есть цель лишь "решить задачу". Есть разница между "использовать в задаче рациональное мышление" и "навязывать задаче рациональное мышление". Если вы убеждены, что методами теорвера решите ее лучше, или даже если вы убеждены, что методами теорвера кто угодно решит ее лучше - это лишь ваше убеждение, не более.
"Убежденность" - вообще опасное понятие. В голове оно легко и незаметно трансформируется из субъективного "мне не известны свидетельства против" в объективное "отсутствуют свидетельства против", не допускающее в голову сомнений. Например, убежденность в универсальности и "правоте" байесианства мотивирует "глушить звук" на любые возражения, ведь сомнение - это дискомфорт. Лучше уж не иметь никаких убеждений.

Ненене. В данной задаче утверждается не "рациональным быть круто, поэтому срочно все придумывайте для себя функцию полезности и считайте ее всюду, потому что таковы заповеди рационализма". Не вещь в себе, для какой-то абстрактной цели.
В данной задаче Юдковский пишет "придумайте для себя функцию полезности и считайте ее, потому что в противном случае вы можете потерять деньги или не получить того, чего на самом деле хотели" с конкретным примером как это происходит.
Конкретный пример оторван от жизни, слишком абстрактен, поэтому плохо дается людям. Если бы я хотел внушить людям, что им необходимо придумывать для себя функции полезности и использовать их при принятии решений, я бы воспользовался другим примером. Это там где люди платили 20 долларов чтобы получить одну конкретную услугу, когда она могли заплатить 10 долларов, чтобы получить целый пакет услуг включающих в себя и эту услугу. Не помню уже где я читал об этом эксперименте.

Форум LessWrong.ru

Новости:

Автор Тема: Парадокс Аллэ (Прочитано 33266 раз)

mihaild

Re: Парадокс Аллэ

valergrad

Re: Парадокс Аллэ

LswAgnostic

Re: Парадокс Аллэ

mihaild

Re: Парадокс Аллэ

anagor1

Re: Парадокс Аллэ

mihaild

Re: Парадокс Аллэ

LswAgnostic

Re: Парадокс Аллэ

Kroid

Re: Парадокс Аллэ

mihaild

Re: Парадокс Аллэ

Kroid

Re: Парадокс Аллэ

LswAgnostic

Re: Парадокс Аллэ

mihaild

Re: Парадокс Аллэ

valergrad

Re: Парадокс Аллэ

anagor1

Re: Парадокс Аллэ

valergrad

Re: Парадокс Аллэ