Главное > Рациональность
Элиезер и парадокс Ньюкома
Kroid:
В своих статьях Элиезер пишет о парадоксе Ньюкома, противопоставляя рациональное решение традиционному. Я бы хотел поговорить об этом.
Описание в википедии:
--- Цитировать ---Парадокс предполагает мысленный эксперимент, игру с двумя участниками — предсказателем (который может безошибочно предсказывать будущее) и собственно игроком.
Предсказатель ставит перед игроком две коробки — открытую и закрытую. В открытой коробке находится тысяча долларов, в закрытой — либо миллион долларов, либо ничего. Игрок может взять себе или только закрытую коробку, или обе коробки вместе. Содержимое коробки зависит от предсказателя:
Если он предскажет, что игрок выберет обе коробки, то закрытая коробка будет пустой
Если предсказывается, что игрок выберет закрытую коробку, то коробка будет содержать миллион долларов.
Какую коробку следует выбрать игроку, чтобы получить наибольшую сумму? Ему известны все условия игры, известно, что содержимое коробки зависит от предсказаний; единственное, что ему неизвестно, — это какое именно из двух предсказаний сделано.
--- Конец цитаты ---
Элиезер в двух разных статьях описывает немного отличающиеся способности предсказывать будущее:
--- Цитата: Newcomb's Problem and Regret of Rationality http://lesswrong.com/lw/nc/newcombs_problem_and_regret_of_rationality/ ---Omega has been correct on each of 100 observed occasions so far - everyone who took both boxes has found box B empty and received only a thousand dollars; everyone who took only box B has found B containing a million dollars.
---
До сих пор Омега оказывался прав на каждом из ста наблюдаемых случаев: каждый, кто брал оба ящика, находил ящик Б пустым и получал только тысячу долларов; каждый, кто брал только ящик Б, обнаруживал в нём миллион.
--- Конец цитаты ---
--- Цитата: Rationality is Systematized Winning http://lesswrong.com/lw/7i/rationality_is_systematized_winning/ ---Omega has played this game many times before, and has been right 99 times out of 100.
---
Омега играл в эту игру много раз и предсказывает правильно 99 раз из 100.
--- Конец цитаты ---
Сам Элиезер предлагает всегда брать ящик Б, даже если предсказатель может ошибаться 1 раз из 100 (спишем эту ошибку на статистическую погрешность).
На той же странице википедии очень лаконично написаны 3 способа рассуждений:
--- Цитировать ---С одной стороны, если считать, что предсказатель может ошибаться, то независимо от того, какое предсказание сделал предсказатель, выгоднее выбрать обе коробки. При этом можно руководствоваться следующими соображениями: если был предсказан первый вариант, то игрок получит либо тысячу долларов, либо ничего. Если же было сделано второе предсказание, то игрок фактически выбирает между 1000000$ и 1001000$. Поэтому выбирая всегда обе коробки игрок получит больше денег.
С другой стороны, если считать, что сделав выбор, игрок повлияет на предсказание (которое будет безошибочным), то таких результатов как 0$ и 1001000$ (расхождений в предсказании и выборе игрока) не может получиться в принципе. Поэтому игрок может получить либо тысячу (если он выберет обе коробки, то вторая будет пустой), либо миллион (если выберет только закрытую).
Наконец, если считать, что предсказатель уже безошибочно предсказал будущее, то игроку не о чем беспокоиться: выбор уже сделан за него и до него, он лишь механически исполняет неизбежное.
--- Конец цитаты ---
Всё это сводится к такому вопросу: может ли игрок повлиять на предсказание?
1. Если не может - само мироздание заставит взять ту коробку, которую предсказал Омега. Как такое возможно?
3. Если может - лучше выбрать Б.
Есть ли у нас свидетельства того, что выбор игрока влияет на предсказание? Как вообще будущее может влиять на прошлое?
Я озадачен. Что-то не так. Вспоминается история с нагретой тарелкой:
--- Цитировать ---— Мне кажется, — наконец, заговорил Гарри, — что мы смотрим на это под неверным углом. Однажды я слышал историю, как ученики пришли на урок физики, и учительница показала им большую металлическую тарелку, стоявшую у огня. По её просьбе ученики потрогали тарелку и обнаружили, что ближайшая к огню сторона холоднее, чем дальняя. Учительница попросила их письменно ответить на вопрос, как такое возможно. Некоторые ученики написали «потому что металл проводит тепло», кто-то — «это произошло из-за воздушных потоков», и никто не сказал «по-моему, это совершенно невозможно». А на самом деле учительница просто повернула тарелку, перед тем как ученики вошли в класс.
--- Конец цитаты ---
Предсказание на самом деле появляется уже после выбора. Например, коробка Б на самом деле с потайным дном и перемещающимся механизмом. Или Омега наблюдает из кустов за игроком и вручную абракадабрит деньги в коробки.
Вот почему надо всегда выбирать ящик Б. Ошибка не в традиционной системе принятия решений, а в неверной интерпретации получаемых данных.
А вы что думаете?
Remlin:
Не вижу, где вы здесь усмотрели неверную интерпретацию данных.
Насколько понимаю, традиционная казуальная теория принятия решений не нравится Юдковскому тем, что она испытывает трудности при столкновении с подобными ситуациями, когда есть агент, способный предсказывать ваше поведение. В задаче Ньюкома согласно казуальной теории человек должен рассуждать так: "Если я возьму одну коробку, и предсказание было верным - я получу миллион. Если неверным - ничего. Если я возьму обе коробки, то в первом случае получу миллион и тысячу, во втором - тысячу. Следовательно, разумнее будет взять обе коробки." Учитывая, что степень точности прогнозов Омеги высока, можно понять, что получается парадоксальный вывод - человек, пользующийся теорией принятия решений (которая должна давать возможность делать лучшие решения), будет систематически получать не самый лучший результат, в отличие от тех, кто "нерационально" выбирает одну коробку. И именно поэтому Юдковский разрабатывает свою версию теории принятия решений, которая будет работать и в таких условиях.
И ничего тут не сводится к вопросу возможности повлиять на предсказание. Если вам трудно представить предсказателя - представьте психолога, который может с высокой степенью точности предсказать ваше поведение.
logic:
--- Цитата: Remlin от 09 Января 2014, 20:24 ---И именно поэтому Юдковский разрабатывает свою версию теории принятия решений, которая будет работать и в таких условиях.
--- Конец цитаты ---
А почему бы не воспользоваться "вашим" методом? Если известна статистика по обоим вариантам, то выбираем, руководствуясь ею. Если встречаемся с такой ситуацией впервые, то выбираем, опираясь на "жизненный опыт". Кстати, какое значение апостериорной вероятности вы получите в этом случае? :)
Remlin:
--- Цитата: logic от 10 Января 2014, 12:57 ---А почему бы не воспользоваться "вашим" методом? Если известна статистика по обоим вариантам, то выбираем, руководствуясь ею. Если встречаемся с такой ситуацией впервые, то выбираем, опираясь на "жизненный опыт". Кстати, какое значение апостериорной вероятности вы получите в этом случае? :)
--- Конец цитаты ---
Куда-то вас в сторону понесло. В той теме, на которую вы косвенно ссылаетесь, я говорил о другом, а именно - об оценке вероятности успешности методов действий. А здесь все значения уже известны - мы знаем, с какой вероятностью получим какой исход. Вот вам и апостериорное значение, которое вы просите. :)
А применение метода, который вы называете "моим", здесь зависит от поставленной цели. Если цель - максимизировать выигрыш, то для решения данной задачи я бы использовал функцию полезности, которую вычислял бы как вероятность исхода, умноженную на величину полезности исхода (для простоты полезность я измерял бы в количестве полученных денег):
Нам известно, что Омега верно предсказывает в 99% случаев и ошибается в 1%.
Следовательно, возможны следующие исходы:
мы выбираем две коробки, и при этом Омега ошибся в прогнозе (1% вероятность) - мы получаем 1001000 долларов.
мы выбираем одну коробку, и при этом Омега ошибся в прогнозе (1% вероятность) - мы получаем 0 долларов.
мы выбираем две коробки, и Омега сделал верный прогноз (99% вероятность) - получаем 1000 долларов.
мы выбираем одну коробку, и Омега сделал верный прогноз (99% вероятность) - получаем 1000000 долларов.
Значение ожидаемой полезности при выборе двух коробок получается 0.01*1001000+0.99*1000 = 11000
Значение ожидаемой полезности при выборе одной коробки - 0.01*0+0.99*1000000 = 990000
А как бы вы решили задачу?
logic:
--- Цитата: Remlin от 10 Января 2014, 13:36 ---В той теме, на которую вы косвенно ссылаетесь, я говорил о другом, а именно - об оценке вероятности успешности методов действий. А здесь все значения уже известны - мы знаем, с какой вероятностью получим какой исход.
--- Конец цитаты ---
Это первый вариант, о котором я говорил, когда известна статистика из неких независимых источников, которым вы по какой-то причине доверяете. Но предположим, что вы встречаетесь с предсказателем впервые. Поверите ему на слово? :)
--- Цитата: Remlin от 10 Января 2014, 13:36 ---мы выбираем две коробки, и при этом Омега ошибся в прогнозе (1% вероятность) - мы получаем 1001000 долларов.
--- Конец цитаты ---
Условия в исходной задаче сформулированы не вполне четко. Я исхожу из версии, когда вариант "1001000 долларов" исключен. Возможны лишь два исхода: либо две коробки и 1000 долларов, либо одна коробка и 1000000 долларов.
--- Цитата: Remlin от 10 Января 2014, 13:36 ---А как бы вы решили задачу?
--- Конец цитаты ---
Я согласен, что выбор определяется исключительно нашим доверием к словам предсказателя. Даже если он уверяет, что ошибается всего один раз из ста. :)
А доверие – вещь субъективная (т.е. иррациональная). Но в крайнем случае всегда можно сделать выбор, просто подбросив монетку. Интересно, способен ли предсказатель предсказать результат случайного процесса? :D
Навигация
Перейти к полной версии