Вы здесь

Время молотков, день 19: TDT для людей

alkjash

По традиции времени молотков я делаю небольшую смену планов как раз в момент, когда надо выпускать тексты про Планирование. Моя отмазка на этот раз такая:

Несколько комментаторов указали на серьезные пробелы в моих знаниях Фокусирования. Я отложу Внутренний Корень Разногласия, улучшенную форму Фокусирования, до следующего цикла. Вместо этого у нас будет ещё два поста о создании и выполнении долгосрочных планов.

День 19: TDT для людей 1

Ранее о планировании: День 8, День 9, День 10.

Сегодня хотелось бы описать два уровня приближения рабочей теории принятия решений для людей.

TDT 101

Дополнительные материалы: Как я потерял 50 килограмм, используя TDT

Выбирайте, как если бы вы контролировали логические выходы внедряемых абстрактных вычислений, включая выходы всех других реализаций и симуляций этих вычислений.
~Элиезер

Другими словами, каждый раз, когда вы принимаете решение, определитесь, что будете делать то же самое решение во всех концептуально схожих ситуациях в будущем.

Поразительная ценность TDT вот в чем: принимайте каждое решение, как если бы вы мгновенно получили все долгосрочные вознаграждения от всех повторов этого решения. И если окажется, что вы необновляемый агент, то этот способ в самом деле работает. Вы действительно теряете 50 килограммов, приняв одно решение.

Призываю читателей, которые ещё не пробовали жить по TDT остановиться здесь и попробовать в течение недели.

TDT 201

Существует некоторая разница между вневременными агентами и человеческими существами, поэтому применение TDT в той форме, что указана выше, требует неприемлемого (по моим меркам) уровня самообмана. Мой второй уровень приближения - предложить практическую ослабленную версию TDT, основанную на принципе Солитера и волшебного мозгового сока.

Три возражения к применению TDT в реальной жизни:

Сущности

Человек это нечто промежуточное между «одной монолитной кодовой базой» и «несвязным содружеством сущностей, реализующих случайную серийную диктатуру». Грубо говоря, каждая сущность это кусочек вас, созданный для удовлетворения одной первородной потребности: голода, дружбы, любопытства, справедливости. В любой момент времени, только одна или две из этих сущностей активны и принимают решения. В таком случае, даже если каждая отдельная сущность является необновляемой и строго определенной, вы не принимаете решения в пользу всех остальных сущностей, неактивных в данный момент. У вас нет столь большого влияния на другими сущностями, как бы вам хотелось.

Разные сущности имеют доступ к разным данным и убеждениям. Я уже упоминал, например, что у меня есть разные личности, говорящие на китайском и английском. Вы можете спросить меня о любимой еде на английском и я отвечу «пельмени», но истинный ответ 饺子 ощущается качественно лучше, чем пельмени с большим отрывом.

Разные сущности имеют разные ценности. У меня есть два друга, которые регулярно провоцируют мою сущность «меряющийся членами садист-засранец». Если человеческие существа действительно обладают функциями полезности, то у этой сущности она с отрицательным знаком по меркам других людей. Она нехарактерно рада вовлекаться в игры с отрицательной суммой.

Практически невозможно предсказать, когда сущности проявят себя. Недавно я летел 13-часовым рейсом из Китая. Начал марафон по просмотру «Игры престолов» после того, как закончились комедии, и целый сезон Серсеи Ланнистер перевел меня в режим «садиста-засранца» на весь следующий день. Если бы Hainan Airlines загрузили больше комедий, этого могло бы не произойти.

Сущности могут оставаться в спячке месяцами или годами. Встретившись с друзьями из старшей школы в прошлом декабре, я окунулся в прежние роли и получил легчайший доступ к огромному массиву ушедших воспоминаний.

Концептуальные фальсификации

Дополнительное чтение: концептуальные фальсификации

Я могу заставить задачу выглядеть большой или маленькой, нарисовав соответственно большие и маленькие концептуальные границы вокруг неё, а затем определяя задачу через указанные концептуальные границы.

TDT реализуется через неопределенный термин «концептуальная похожесть»: вы определяете для себя, что будете принимать одно и то же решение в концептуально похожих ситуациях. К сожалению, вы будете склонны к мотивированным суждениям и концептуальным фальсификациям, чтобы выбраться из вневременных решений, сделанных в прошлом.

Эта задача может быть упрощена, но не решена, через четкое определение границ. Жизнь имеет слишком много измерений, чтобы даже определить, какие переменные стоит отслеживать, не говоря уже о том, чтобы провести границу для каждой из них. Значимость информации есть функция вашего внимания и навыков обнаружения настолько же, насколько функцией реальности самой по себе. Последнее время стало практически обыденным делом прочесть статью, которая достаточно изменяет возможности моего внимания, чтобы превратить ситуации, ранее воспринимаемые как «концептуально схожие» в абсолютно разные.

Волшебный мозговой сок

Дополнительное чтение: волшебный мозговой сок

Каждое совершенное действие сопровождается ненамеренным самоизменением

Человеческий мозг это такой привередливый код, который самоизменяется каждый раз, когда выполняет какое-то действие. Ситуация даже хуже: ваши поступки могут сдвинуть ваши ценности в неожиданном и непонятном направлении. Этот баг есть неотъемлемое противоречие в применении TDT человеком.

Самоизменение происходит множеством способов. Когда я писал «волшебный мозговой сок» я имел в виду мгновенное усиление нейронных маршрутов, которые активизировались и соответствующее ослабление с течением времени всех маршрутов, которые не активизировались. Но происходят и другие вещи. Вы привязываетесь к определенной идентичности. Вы втягиваетесь в ближайший аттрактор в социальной сети. А также:

Экспозиционная терапия это мощный, но неразборчивый инструмент. Вы можете свести любую антипатию практически до нуля просто вновь и вновь осознанно сталкиваясь с ней. Но страхи и антипатий есть в каждом направлении!

Каждое движение, что вы делаете, есть экспозиционная терапия в его направлении.

Именно так.

Каждое осознанное действие подстраивает вашу зону комфорта в его направлении, уничтожая антипатии и уклонения (желанные или нет) на своём пути.

Упс!

Решения

Надеюсь, я убедил вас, что человеческий мозг достаточно поломан, что наши представления о «необновляемом исходном коде» неприменимы и попытка принимать решения через TDT будет в результате сложнее (и может иметь нежелательные побочные эффекты). Что можно сделать?

Во-первых, думаю, что есть смысл инвестировать напрямую в TDT-подобное поведение. Принимайте осознанные решения для подкрепления сущностей, способных принимать и сдерживать обещания. Принимайте более четкие решения и ясно определяйте концептуальные границы. Исследуйте этику добродетели и деонтологию. Блог Зви хорошее место для начала.

В то же время, тренируйте предсказание собственного будущего поведения. Если у вас получится стать своим собственным Омегой, то все задачи, с которыми вы сталкиваетесь, будут казаться вам Ньюкомбианскими. Тогда вам придётся оставить CDT (causal decision theory, каузальная теория принятия решений - прим. перев.) и все проблемы, что она вызывает.

Во-вторых, однажды я предложил модель под названием «сдвиг десяти процентов»:

Сдвиг десяти процентов это мысленный эксперимент, который я успешно внедрил в систему 1, позволяющий формировать долгосрочные привычки вроде «писать в блог каждый день». Он основан на предположении, что каждый следующий ваш выбор на одну тему на 10% легче предыдущего.
Предположим, что существует привычка, которую вы хотите сформировать, например, ходить в зал. Вы рисовали пентаграммы, рассыпали пепел фей, проделали все необходимые ритуалы, дабы определить, что преимущества точно превосходят затраты и не существует лучших альтернатив. И тем не менее, усилие, которое вы совершаете, чтобы ходить в зал каждый день, кажется невыносимым.
Вы тратите 100 единиц силы воли на принесение своего тела в зал в первый день. Теперь, обратите внимание, что волшебный мозговой сок на вашей стороне. На второй день станет немного легче. Вы тратите 90 единиц. На третий день, стоимость решения уже 80.
Используя некоторое количество математики и значительное количество мозгового сока, вы тратите 500 единиц силы воли за первые десять дней и привычка бесплатна на всю оставшуюся жизнь.

Конкретное число не имеет значения, но я рассматриваю эту модель как правильно ослабленную версию TDT: действуйте, как если бы каждое принятое решение награждало вас 10% всех преимуществ постоянного принятия такого решения. Одно решение позволяет потерять только 5 килограммов, поэтому вам потребуется принять десять последовательных решений прежде чем вы сможете пожать все плоды.

Сдвиг десяти процентов охраняет вас от ваших сущностей. Как только вы примете одно и то же решение десять раз подряд, вы примете его в широком спектре состояний сознания и контекст будет отличаться в каждой ситуации. Вероятно вам удастся убедить большую часть своих сущностей согласиться с вашим решение.

Сдвиг десяти процентов также предохраняет против концептуальных фальсификаций. Приняв одно и то же решение из разных ситуаций, концептуальное пространство, собранное из точек данных, будет представлять собой десятимерный регион, который вы сможете однозначным образом определить как условия, которыми вы будете руководствоваться, несмотря ни на что, как вневременную определенность.

Челлендж дня

Этот пост исключительно ориентировочный и теоретический, так что я просто открою комментарии для дискуссии.

  • 1. TDT - Timeless Decision Theory, вневременная теория принятия решений, русскоязычная аббревиатура выглядит некрасиво, потому не переводил - прим. перев.

Перевод: 
sepremento
Оцените перевод: 
Средняя оценка: 5 (Всего оценок: 1)
  • Короткая ссылка сюда: lesswrong.ru/521