Изменения

Встреча/Санкт-Петербург/2019-11-30

Нет изменений в размере, 22:25, 1 декабря 2019

→‎Теории принятия решений. TDT

== Теории принятия решений. TDT ==

* Утилоны, ожидаемая полезность и связь с убеждениями.

* Представьте, что вы стоите на крыше высотки и раздумываете прыгать ли. Ваша терминальная ценность - максимизация ожидаемой продолжительности жизни. Ряд упрощений: если вы ~~спрыгните~~спрыгнете, то точно ~~умрёте~~ умрете в ~~течении~~ течение минуты. Если вы не спрыгнете, то точно проживете хотя бы минут 10. Можно ли придумать контекст, в котором прыгать - рационально?

* [https://lesswrong.ru/w/Парадокс_Ньюкома_сожалея_о_своей_рациональности Парадокс Ньюкома].

* Суть проблемы, решаемой с помощью TDT - есть что-то в реальности, что меняется в зависимости от того, как ты обычно принимаешь решения(того, как принимает решения симуляция тебя), но не зависит от твоего конкретного решения в момент t0.

* Юдковский: Выбирайте, как если бы вы контролировали логические выходы внедряемых абстрактных вычислений, включая выходы всех других реализаций и симуляций этих вычислений.

* Предположим в момент t0 ты выбираешь из А=(100 утилонов, если симуляция тебя выбирает А, и 1000 утилонов, если симуляция тебя выбирает Б) и Б=(10 утилонов, если симуляция тебя прошлом выбирает А, и 500 утилонов, если симуляция тебя выбирает Б). Если ты байесианец, то ты выбираешь А и радуешься, потому что в каждом из возможных вариантов А больше Б. Ну и конечно ты получаешь 100 утилонов, а не 500, как мог бы получить, если бы всегда выбирал Б и ~~симуляции~~ симуляция была бы абсолютно точной.

* Какие ситуации могут встречать в реальной жизни: 1. Тебя пытается просимулировать другое разумное существо. 2. Есть несколько агентов внутри тебя( или разные состояния тебя во времени, что почти одно и тоже), которые обладают симуляциями друг друга.

* Например, собеседования. Где Б - это вести себя вызывающе и нагло, а А - вести себя спокойно и уважительно. При этом, если собеседующий будет изначально предполагать тебя наглым и вызывающим, то ты получишь только плюс к карме за счёт Б, а если будет думать, что ты выберешь А, то соответственно наоборот. Собеседующий - не идеальная машина для предсказаний. Но собеседующий может тебя предсказывать по сообщениям, по твоему взгляду и внешнему виду. Если ты всегда выбираешь Б и думаешь, что ты всегда выбираешь Б, то вероятность, что Б сработает больше. При этом в момент принятия решения об этом(начинать ли вести себя как Б или нет) ты уже не влияешь на модель собеседующего или по крайней мере часть влияния приходится именно на момент до этого решения.

Анонимный участник

5.16.122.253

Вики LessWrong.ru β

Изменения

Встреча/Санкт-Петербург/2019-11-30

Вики LessWrong.ru ^β