Парадокс Аллэ

Автор Тема: Парадокс Аллэ  (Прочитано 44987 раз)

valergrad

  • Ветеран
  • ****
  • Сообщений: 487
  • +143/-21
    • Просмотр профиля
Парадокс Аллэ
« : 19 Июля 2016, 14:35 »
  • (+)1
  • (−)0
  • http://lesswrong.ru/w/%D0%9F%D0%B0%D1%80%D0%B0%D0%B4%D0%BE%D0%BA%D1%81_%D0%90%D0%BB%D0%BB%D1%8D


    Много раз сталкивался с данным парадоксом в разных формах и никак не пойму - это я что-то не понимаю, или все остальные?
    С моей точки зрения все вполне логично, никакого парадокса нет. Ведь человек вполне рационально выбирает вариант при котором мат. ожидание будет максимально. Но мат. ожидание не количества денег , конечно ( ведь это всего лишь бумажки ), а своего уровня удовлетворенности жизнью ( который деньги могут дать). При этом, если нарисовать график зависимости уровня счастья от уровня денег, то он очевидно будет выпуклой функцией для подавляющего большинства ( т.е. с отрицательной второй производной). Если наш доход увеличится  в 10 раз  - мы не будем более удовлетворены жизнью в 10 раз,  раза в 2-3 выглядит более правдоподобной оценкой. А если принять, что она выпуклая, то простые подсчеты показывают что правильно ( = рационально ) брать, к примеру, "24 000 долларов, точно" чем "шанс в 33/34 выиграть 27 000 долларов и в 1/34 — не получить ничего".
    Страховые компании работают точно так же уже 3 тысячи лет. Да, матожидание количества денег которое мы им заплатим и которое получим - для нас отрицательно, но мат.ожидание удовлетворенности жизни - положительно ( именно из-за выпуклости этой функции).

    Quilfe

    • Ветеран
    • ****
    • Сообщений: 282
    • +51/-7
      • Просмотр профиля
    Re: Парадокс Аллэ
    « Ответ #1 : 19 Июля 2016, 14:59 »
  • (+)1
  • (−)0
  • Разные выборы в этих экспериментах противоречивы для любой функции полезности (хотя для одних функций полезности всегда правилен первый, а для других второй).

    Эксперимент 2 - это эксперимент 1 с вероятностью 34%. То есть эксперимент 2 можно представить так:

    - с вероятностью 66% мы не получаем ничего,
    - с вероятностью 34% мы играем в эксперимент 1.

    Таким образом, если разбить рандомизацию эксперимента 2 по шагам, то на первом шаге мы ничего не выбираем (и он не может ничего менять), на втором имеем эксперимент 1 и обязаны выбирать как в нём. Таким образом, консистентный агент будет выбирать в этих экспериментах одинаково.

    Вот тут я расписывал эти выборы (конкретные числа другие), правда, так и не сделал потом разбор: http://bormvit.livejournal.com/43059.html

    Добавлено 19 Июля 2016, 15:13:
    Или, пусть мы выбираем 1А и 2Б. Пусть p = U(24 000), q = U(27 000), 0 = U(0), 0 < p < q.

    Тогда 1А > 1Б означает p > 33/34 q, 2Б > 2А означает 33/100 q > 34/100 p => p < 33/34 q. Противоречие.

    Парадокс именно в выборе 1А и 2Б, если вы выбираем 1А и 2А или 1Б и 2Б, проблемы нет, хотя в первом случае мы не максимизируем матожидание собственно денег. Никто не говорит, что нужно максимизировать именно его.

    Kroid

    • Ветеран
    • ****
    • Сообщений: 779
    • +62/-7
      • Просмотр профиля
    Re: Парадокс Аллэ
    « Ответ #2 : 19 Июля 2016, 15:24 »
  • (+)1
  • (−)1
  • Цитировать
    Разные выборы в этих экспериментах противоречивы для любой функции полезности
    Ну уж любой. Никто почему-то не рассматривает поправку вроде "умножаем полезность исхода с вероятностью в 100% на некий коэффицент, к примеру 1.2". Ведь "уверенность в завтрашнем дне" тоже чего-то должна стоить, разве нет?

    Quilfe

    • Ветеран
    • ****
    • Сообщений: 282
    • +51/-7
      • Просмотр профиля
    Re: Парадокс Аллэ
    « Ответ #3 : 19 Июля 2016, 15:40 »
  • (+)0
  • (−)0
  • В рамках VNM-модели, в которой вводится понятие функции полезности, она оценивает состояния мира отдельно от вероятностей, в этом весь смысл такого понятия. Так что для любой.

    mihaild

    • Пользователь
    • **
    • Сообщений: 22
    • +5/-0
      • Просмотр профиля
    Re: Парадокс Аллэ
    « Ответ #4 : 19 Июля 2016, 15:40 »
  • (+)0
  • (−)0
  • Ну уж любой. Никто почему-то не рассматривает поправку вроде "умножаем полезность исхода с вероятностью в 100% на некий коэффицент, к примеру 1.2". Ведь "уверенность в завтрашнем дне" тоже чего-то должна стоить, разве нет?
    А это уже определению функции полезности противоречит.

    LswAgnostic

    • Ветеран
    • ****
    • Сообщений: 313
    • +29/-12
      • Просмотр профиля
    Re: Парадокс Аллэ
    « Ответ #5 : 19 Июля 2016, 15:56 »
  • (+)0
  • (−)0
  • Так что для любой.

    Для любой монотонной.

    ps
    Парадокса нет на немонотонных функциях полезности. Но немонотонные функции полезности появляются в более сложных кейсах.

    Quilfe

    • Ветеран
    • ****
    • Сообщений: 282
    • +51/-7
      • Просмотр профиля
    Re: Парадокс Аллэ
    « Ответ #6 : 19 Июля 2016, 16:21 »
  • (+)0
  • (−)0
  • Для немонотонной тоже, в сообщении выше, где я пришел к противоречию, на самом деле никак не использовалось, что p < q. Точнее, при U(24 000) = 33/34 U(27 000) 1А равнозначно 1Б и 2А равнозначно 2Б и любые варианты рациональны, во всех остальных случаях либо 1А, 2А, либо 1Б, 2Б, даже если U(24 000) > U(27 000).

    valergrad

    • Ветеран
    • ****
    • Сообщений: 487
    • +143/-21
      • Просмотр профиля
    Re: Парадокс Аллэ
    « Ответ #7 : 19 Июля 2016, 16:24 »
  • (+)0
  • (−)0
  • Quillife, согласен, теперь я понял, парадокс немного не о том, о чем я первоначально подумал. Спасибо всем за разьяснения! :)


    LswAgnostic, "Для любой монотонной. " - вот здесь несогласен, проследил за выкладками, даже монотонность не требуется. Для любой  функции полезности которая одинакова для двух экспериментов нелогично выбирать 1A и 2B. Подумав получше, я понял, что рациональный выбор в обоих случаях - 1A и 2A. А проблема, получается, в том, что мы интуитивно значительно лучше понимаем разницу между 27 и 24 тысячами долларов, чем между 34% и 33% шансами на выигрыш.
    Как это исправить? Нужно очевидно, 34% и 33% представлять каким-то другим образом, чтобы разница между ними была более наглядной ( пока что это два мелких очень близких числа, в то время как 3000 долларов - весьма ощутимы). Каким образом? Надо подумать.

    LswAgnostic

    • Ветеран
    • ****
    • Сообщений: 313
    • +29/-12
      • Просмотр профиля
    Re: Парадокс Аллэ
    « Ответ #8 : 19 Июля 2016, 18:29 »
  • (+)0
  • (−)0
  • Для немонотонной тоже, в сообщении выше, где я пришел к противоречию, на самом деле никак не использовалось, что p < q.

    Монотонность - это A < B < C, а f такая, что f(A) < f(B) < f(C) или f(A) > f(B) > f(C).
    Немонотонность - это A < B < C, но f такая, что f(A) <f(B) > f(C) или f(A) < f(B) > f(C).

    Монотонность в парадоксе используется несколько раз. Считается, что (здесь f - функция полезности):
    f(получить(сумма1)) < f(получить(сумма2)) < f(получить(сумма3)), где сумма1 < сумма2 < сумма3,
    f(выиграть(вероятность1, сумма)) < f(выиграть(вероятность2, сумма)) < f(выиграть(вероятность3, сумма)), где вероятность1 < вероятность2 < вероятность3
    f(риск1) < f(риск2) < f(риск3), где риск1 < риск2 < риск3

    ps
    Допустим, что человеку к понедельнику необходимо получить 100$, иначе его убъют. Тогда в точке 100$ функция полезности будет немонотонной.
    При выборе в паре гарантированное-получение-меньше-100/риск-выиграть-больше-100 оптимальнее рисковать.
    При выборе в паре гарантированное-получение-больше-100/риск-выиграть-больше-10000 оптимальнее не рисковать.

    Парадокс рассматривает только монотонные ФП, когда выбор человека брать/рискнуть один и тот же вне зависимости от величины предлагаемых сумм.

    pps
    Монотонные функции обладает свойством аддитивности, немонотонные - не обладают.
    Парадокс строится на том, что после сложения (аддитивности) упорядоченность не совпадает с упорядоченностью до сложения, а сохранение упорядоченности после сложения есть только у монотонных функций.

    mihaild

    • Пользователь
    • **
    • Сообщений: 22
    • +5/-0
      • Просмотр профиля
    Re: Парадокс Аллэ
    « Ответ #9 : 19 Июля 2016, 22:28 »
  • (+)0
  • (−)0
  • Допустим, что человеку к понедельнику необходимо получить 100$, иначе его убъют. Тогда в точке 100$ функция полезности будет немонотонной.
    Не будет. Получится что (полезность 0$) ~ (полезность 99$) << (полезность 100$) ~ (полезность 10000$).

    (правда само понятие "монотонности" требует какого-то порядка на простых исходах, который вы берете непонятно откуда)

    Функция полезности (в VNM модели) может определяться произвольным образом только на простых исходах - и эти значения однозначно задают полезность всех лотерей.

    LswAgnostic

    • Ветеран
    • ****
    • Сообщений: 313
    • +29/-12
      • Просмотр профиля
    Re: Парадокс Аллэ
    « Ответ #10 : 19 Июля 2016, 23:28 »
  • (+)0
  • (−)0
  • Не будет. Получится что (полезность 0$) ~ (полезность 99$) << (полезность 100$) ~ (полезность 10000$).

    В парадоксе рассматривается функция полезности, которая по паре (гарантированное получение X; игра(мат.ожиданием Y, выигрыш Z, вероятность P)) выдает предпочтение (получение | игра).
    Далее ожидается, что данная функция будет монотонной:
    1) относительно параметров - f(X1; Y1) < f(X2; Y1) < f(X2; Y2), где X1 < X2, Y1 < Y2
    2) относительно соотношения - X1/Y1: f(X1; Y1) < f(X2; Y2) < f(X3; Y3), где X1/Y1 < X2/Y2 < X3/Y3

    В кейсе "гони 100$ или смерть" сохраняется первая монотонность, но не сохраняется вторая монотонность.

    mihaild

    • Пользователь
    • **
    • Сообщений: 22
    • +5/-0
      • Просмотр профиля
    Re: Парадокс Аллэ
    « Ответ #11 : 20 Июля 2016, 00:05 »
  • (+)0
  • (−)0
  • 1) так F зависит от 2х аргументов или 4х?
    2) а что там область значений - полезность или выбор? Если первое - то зачем туда сразу параметры двух разных простых исходов подставлять? Если второе - то как сравниваются гарантированное получение с разными играми?

    LswAgnostic

    • Ветеран
    • ****
    • Сообщений: 313
    • +29/-12
      • Просмотр профиля
    Re: Парадокс Аллэ
    « Ответ #12 : 20 Июля 2016, 00:41 »
  • (+)0
  • (−)0
  • 1) так F зависит от 2х аргументов или 4х?

    в простом случае - от 2, в усложном - от 4. В кейсе "гони 100$ или смерть" от 4-х

    Цитировать
    2) а что там область значений - полезность или выбор? Если первое - то зачем туда сразу параметры двух разных простых исходов подставлять?

    выбор

    Цитировать
    Если второе - то как сравниваются гарантированное получение с разными играми?

    Сравнивают как-то участники, а в парадоксе исследуются свойства выборов участников.

    mihaild

    • Пользователь
    • **
    • Сообщений: 22
    • +5/-0
      • Просмотр профиля
    Re: Парадокс Аллэ
    « Ответ #13 : 20 Июля 2016, 01:52 »
  • (+)0
  • (−)0
  • Сравнивают как-то участники, а в парадоксе исследуются свойства выборов участников.
    Так это сравнение как раз с помощью функции полезности - а вы им пользуетесь отдельно от нее.

    Вообще, функция полезности - это по определению функция из простых исходов в вещественные числа. А парадокс в том, что тут нет VNM независимости.

    В вашем понятии "монотонность функции полезности" - что именно вы понимаете под функцией полезности? (область определения и значений)

    LswAgnostic

    • Ветеран
    • ****
    • Сообщений: 313
    • +29/-12
      • Просмотр профиля
    Re: Парадокс Аллэ
    « Ответ #14 : 20 Июля 2016, 01:57 »
  • (+)0
  • (−)0
  • Вообще, функция полезности - это по определению функция из простых исходов в вещественные числа.

    По какому определению?