Изменения
Нет описания правки
* Выписали на доске 7 примеров убеждений (пара были не очень политкорректными, мы постеснялись и поставили вопросики).
* Убеждение - кусок модели окружающего мира, который храниться в голове (возникло непонимание в определениях, кто-то понимал под убеждениями штуки, которые считаются фактами, но не имеют обоснования).
* Влад нарисовал график стратегий работы с убеждениями в осях обновляемость и запоминание. В левом вернем углу Боб - не обновляет, но запоминает - преимущество. Преимущество: делает, а не думает, социальное - уверен в сообществе с такими же убеждениями и модели их поведения. Думает, что точность его убеждений абсолютная. В правом нижнем Элис - не запоминает, но обновляет - преимущества. Преимущества: адаптация и манипуляции. Точность не имеет значения. Мы хотим оказаться в правом верхнем (или по крайней мере предполагаем, что хотим, и оставляем вопрос почему за рамками данной лекции).
* Проблемы с разделением этических и не этических ценностей, прозвучало понятие терминальных ценностей, хотя не все могут разделять или понимать консеквенциализм, из-за этого было недопонимание.
== Теории принятия решений. TDT ==
* Утилоны, ожидаемая полезность и связь с убеждениями.
* Представьте, что вы стоите на крыше высотки и раздумываете прыгать ли. Ваша терминальная ценность - максимизация ожидаемой продолжительности жизни. Ряд упрощений: если вы спрыгните, то точно умрёте в течении минуты. Если вы не спрыгнете, то точно проживете хотя бы минут 10. Можно и ли придумать контекст, в котором прыгать - рационально?
* [https://lesswrong.ru/w/Парадокс_Ньюкома_сожалея_о_своей_рациональности Парадокс Ньюкома].
* Суть TDT - есть что-то в реальности, что меняется в зависимости от того, как ты обычно принимаешь решения(того, как принимает решения симуляция тебя), но не зависит от твоего конкретного решения в момент t0.
* Юдковский: Выбирайте, как если бы вы контролировали логические выходы внедряемых абстрактных вычислений, включая выходы всех других реализаций и симуляций этих вычислений.
* Предположим в момент t0 ты выбираешь из А=(100 утилонов, если симуляция тебя выбирает А, и 1000 утилонов, если симуляция тебя выбирает Б) и Б=(10 утилонов, если симуляция тебя прошлом выбирает А, и 500 утилонов, если симуляция тебя выбирает Б). Если ты байесианец, то ты выбираешь А и радуешься, потому что в каждом из возможных вариантов А больше Б. Ну и конечно ты получаешь 100 утилонов, а не 500, как мог бы получить, если бы всегда выбирал Б и симуляции была бы абсолютно точной.
* Какие ситуации могут встречать в реальной жизни: 1. Тебя пытается просимулировать другое разумное существо. 2. Есть несколько агентов внутри тебя( или разные состояния тебя во времени, что почти одно и тоже), которые обладают симуляциями друг друга.