Рациональность: от ИИ до зомби

«Рациональность: от ИИ до зомби» (англ. Rationality: From AI to Zombies) — книга-сборник из 333 эссе о человеческой рациональности. Стоит начать с этой книги, если хотите разобраться в темах, которые часто обсуждают в сообществе LessWrong. Вы прочтете о когнитивных искажениях, соотношении «карты» и «территории», обществе и языке, о рисках искусственного интеллекта, о науке и её философии.

Перевод пока не завершён, здесь лежат уже переведенные главы.

Книга и перевод распространяются по лицензии Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Unported license.

Карта и территория

«Карта и территория» («Map and Territory») — первая часть электронной книги Элиезера Юдковского «Рациональность: от ИИ до зомби» (Rationality: From AI to Zombies). Это отредактированная и расширенная версия серии блог-постов из числа «Цепочек» («The Sequences»), и в ней рассматривается природа рациональности, убеждений и объяснений.

«Карта и территория» содержит четыре «цепочки» эссе, завершаясь самодостаточным эссе «Простая истина». Все они собраны в книге «Рациональность: от ИИ до зомби», но здесь собраны ссылки на их переводы.

Следующая часть: Как успешно менять своё мнение.

Предисловие

Элиезер Юдковский

Перед вами — собрание записей в блог за два года. Сейчас я оглядываюсь на этот проект и вижу, что многое сделал совершенно неправильно. Я считаю, это хорошо. Если бы я оглянулся назад и НЕ увидел ошибок — это бы значило, что с 2009 года я не вырос как писатель и не улучшил своё понимание материала. «Ой!» — говорим мы, когда пересматриваем свои убеждения и стратегии. Если, оглядываясь назад, ты не видишь, что именно ты сделал неправильно — значит, ты с тех пор ничему не научился и не изменил свое мнение.

В течение двух лет я писал посты в блог и не думал о том, чтобы помогать людям в их повседневной жизни, и я ошибался. Я хотел помогать людям с большими, сложными и важными проблемами, и подбирал впечатляющие абстрактные примеры.

По прошествии времени я вижу, что это было второй по важности ошибкой в моём подходе. Она была связана с первой: я не понимал, что огромная проблема в изучении описанного мною способа рассуждений — применять его на практике, а не просто знать теорию. Я не осознавал, что важна именно практическая часть; оглядываясь назад, я могу сказать разве что «Ой!» и «Эх».

Да, порой те самые большие проблемы и вправду важны, но это не отменяет простой правды: чтобы мастерски овладеть этими навыками, нужно практиковаться, а это трудно делать на отвлеченных задачах. (Сегодня CFAR, Центр прикладной рациональности, постоянно работает над тем, чтобы устранить последствия этой серьёзной ошибки).

И третья огромная ошибка в том, что я слишком сильно концентрировался на рациональных убеждениях — и слишком мало на рациональном действии.

Четвёртая по важности ошибка — организация содержания цепочек. В частности, нужно было раньше создать вики и предоставить возможность читать посты как части цепочек.

Эту ошибку по крайней мере можно исправить. В нашей книге «Rationality: From AI to Zombies» Роб Бенсинджер отредактировал мои записи и организовал их по-другому, стараясь не переписывать содержание материалов (хотя кое-где всё же пришлось это сделать).

Моей пятой ошибкой было то, что я — как мне казалось — пытался прямо говорить о глупости того, что казалось мне глупым. Я хотел избежать искажения под названием бульверизм — это когда вы начинаете обсуждение с того, что люди, которые верят в то-то и то-то, глупые. Сначала я рассматривал саму тему, а потом уже говорил: «Вот почему это глупо». Но в 2009 году я ещё не определился, важно ли, чтобы меня окружали люди, в открытую презирающие гомеопатию. Я считал (и до сих пор считаю), что если вежливо обходиться с какой-то идеей, то некоторые люди понимают это как «ничего страшного, если я скажу, что верю в гомеопатию; это не повредит моему статусу». Что ирония и насмешки могут развеять их иллюзии.

Думаю, сейчас я был бы вежливее. Беспардонность послужила определенной цели и даже кому-то помогла. Однако теперь я более серьёзно отношусь к риску построить сообщество, в котором нормальной и ожидаемой реакцией на новичка будет открытое презрение и насмешки.

Тем не менее я очень рад, что моя читательская аудитория не стала использовать мою риторику для унижения или травли. (Я хотел бы отдельно упомянуть Скотта Александера: он более приятный человек, чем я, и отлично пишет на эти темы, а потому заслуживает благодарности за построение здоровой атмосферы сообщества Less Wrong.)

Если я оглядываюсь назад и сообщаю, что провалился — значит, у меня были цели, которых я хотел достичь. Что же это за цели?

Есть один ценный способ рассуждений, которому пока не учат в школах. Ему систематически вообще нигде не учат. Он просто проявляется сам у тех, кто вырос на книгах вроде «Вы, конечно, шутите, мистер Фейнман» — или у тех, кому в университете повезло с хорошим преподавателем.

Чаще всего этот способ мышления практикуется в науке и проведении экспериментов. Просто идёте и смотрите на Вселенную, а не выдумываете. И говорите «Ой!» и отказываетесь от плохой теории, если экспериментом она не подтверждается.

Но такой склад ума применяется и шире. Он универсальнее тех очков, которые вы надеваете в лаборатории. Его можно использовать в реальной жизни, хотя тут есть свои нюансы. Если вы не можете сказать «Ой!» и отказаться от нерабочей теории — вы будете постоянно стрелять себе в ногу. Вы обречены перезаряжать оружие и спускать курок. Вы знаете таких людей. И иногда вы, даже не задумываясь об этом, действуете в точности как они. Хорошо бы существовал способ мышления, благодаря которому можно перестать так делать.

Несмотря на серьёзность моих ошибок, статьи, выложенные за два года ведения моего блога помогли удивительному количеству людей, чего я не ожидал. Это работает не слишком надёжно, но иногда всё-таки срабатывает.

В современном обществе так мало учат навыкам рациональных убеждений и принятия решений, так мало учат математике и другим наукам, на которых всё это основано! В результате даже просто прочитать мои излияния о проблемах науки и философии может быть полезным. Посмотрите на всё это с десятков разных точек зрения — это иногда помогает уловить единый ритм.

На самом деле всё сводится к одному и тому же. Я описывал огромные отвлеченные задачи и пренебрегал повседневной жизнью, но законы в обоих случаях одинаковы. Я концентрировался на одном и упускал многое другое; но всё сводится к одному. Я горжусь тем, что оглядываюсь назад — и даже при учёте всех моих ошибок и всех моих «Ой!», даже спустя пять лет я всё ещё считаю, что это лучше, чем ничего.

— февраль 2015

Перевод: 
Remlin, Muyyd, Staenrey
Оцените качество перевода: 
Средняя оценка: 5 (53 votes)

Искажения: введение

Роб Бенсинджер

Это не тайна. Но почему-то это редко всплывает в разговорах и очень немногие спрашивают, что же нам с этим делать. Это шаблон, спрятанный за всеми нашими победами и поражениями, невидимый нашему глазу. Что же это?

Представьте себе урну с 70 белыми и 30 красными шарами; вы вытаскиваете 10 наугад. Возможно, 3 из них будут красными, и вы верно угадаете, сколько всего красных шаров в урне. Или, возможно, у вас будет 4 красных шара, а может быть, другое число. И тогда вы получите неверное общее число.

Эта случайная ошибка — цена за неполное знание, и это в целом неплохо, как и любая ошибка. В среднем наши оценки будут верны, и чем больше мы узнаём — тем меньше мы делаем ошибок.

Но предположим, что белые шары тяжелее и опускаются на дно урны. Тогда ваша выборка может быть нерепрезентативной постоянно.

Такие ошибки называются систематическими. Когда ваш метод познания мира искажён, изучение мира может вводить вас в заблуждение. Накопленные данные могут даже искажать предсказания. Для человека, привыкшего высоко ценить знания и способы их получения, это пугающая перспектива. Если мы хотим быть уверены, что познание помогает, а не делает всё только хуже, нужно узнавать об искажениях в наших данных и исправлять их.

Идея когнитивного искажения в психологии работает похожим образом. Когнитивное искажение — систематическая ошибка нашего мышления (в противоположность случайной ошибке, вызванной простым невежеством). Статистическая погрешность искажает выборку так, что она менее точно отражает положение дел. Когнитивные искажения же портят не выборку, а наши убеждения, и убеждения менее точно отражают факты; такие искажения вмешиваются в процесс принятия решений, и мы достигаем наших целей с меньшей надёжностью.

Возможно, вы оптимист, а красные шары можно использовать как лекарство от редкой тропической болезни, которую подхватил ваш брат. Тогда вы переоцените количество красных шаров в урне, потому что вам хочется, чтобы их было больше. И здесь искажена не выборка, а вы сами.

Тем не менее нужно быть осторожным, говоря про искажения в людях. Обычно мы имеем в виду, что люди нечестны или предвзяты. Но когнитивные искажения — это совершенно другое. Они — неотъемлемая часть человеческого мышления, а не дефект, который можно списать на воспитание или гнилой характер1.

Когнитивное искажение — это проторенная дорожка для ваших внутренних шаблонов мысли, по которой нельзя прийти к истине (или другой потенциально достижимой цели — например, счастью). Как и статистические погрешности, когнитивные искажения могут искривлять наше видение реальности, в большинстве случаев их нельзя исправить, просто собрав побольше данных, и их эффекты со временем суммируются. Но когда неточный инструмент, который нужно откалибровать, это вы сами — избавиться от искажений будет уникальным вызовом.

И тут возникает вполне очевидный вопрос. Если нельзя доверять своему мозгу, то как вообще чему-то можно доверять?

Хорошо бы иметь конкретное название для преодоления когнитивных искажений и вообще ошибок, которыми наши сознания могут себе навредить.

Мы могли бы назвать этот проект как угодно. Я считаю, что на данный момент название «рациональность» прекрасно подходит.

Рациональные чувства

Голливуд считает, что быть «рациональным» — значит суровым и гиперинтеллектуальным. Вспомните Спока из «Звёздного пути» — он «рационально» подавляет эмоции, «рационально» отказывается полагаться на интуицию, но его может легко сбить с толку «иррациональный» оппонент2.

Есть и другое определение «рациональности», которое используют математики, психологи и социологи. Грубо говоря, идея в том, чтобы действовать наилучшим возможным образом. Рациональный человек, даже если он не знаком с темой, формирует максимально близкие к реальности убеждения на основе имеющихся у него свидетельств. Неважно, насколько плохо идут дела у рационального человека — он делает наилучший возможный выбор и таким образом повышает свои шансы на успех.

Реальная рациональность состоит не в том, чтобы игнорировать интуицию и эмоции. Для рационального человека быть рациональным зачастую означает лучше осознать свои чувства и учитывать их при принятии решений.

Рациональность — это и знание о том, когда не нужно слишком долго размышлять. В экспериментах, где нужно было выбрать постер на стену или предсказать исход баскетбольного матча, испытуемые показывали худший результат, если старательно обдумывали своё решение. 3, 4 Есть задачи, решать которые лучше вдумчиво, и есть другие задачи, где лучше принять решение быстро. Психологи, работающие над теорией двух процессов, выделяют процесс «Система 1» (быстрое, неявное, ассоциативное, автоматическое суждение) и процесс «Система 2» (медленное, явное, интеллектуальное, подконтрольное суждение)5. Стереотипный рационалист целиком полагается на Систему 2, игнорируя чувства и импульсы. Если посмотреть не на стереотип, а на того, кто действительно рационален, кто достигает своих целей, кто действительно смягчает урон от когнитивных искажений, можно обнаружить, что он сильно полагается на привычки и интуицию Системы 1, в ситуациях, где на них можно положиться.

К сожалению, Система 1 является плохим помощником, когда надо определить «стоит ли сейчас доверять Системе 1?». Наша нетренированная интуиция не подскажет нам когда мы должны перестать полагаться на нее. Предвзятость и непредвзятость ощущаются одинаково6. С другой стороны, поведенческий экономист Дэн Ариели отмечает: мы предсказуемо иррациональны. Мы запарываемся одними и теми же способами, снова и снова, систематически.

Если мы не можем использовать инстинкт, чтобы понять, когда поддаемся когнитивному искажению, то можно использовать науки о разуме.

Многоликие Ошибки

В процессе эволюции наши мозги для решения задач научились применять когнитивные эвристики — грубые методы, которые позволяют получить ответ быстро. В большинстве случаев этот ответ оказывается правильным, но иногда — нет. Когнитивные искажения возникают в тех случаях, когда эти эвристики достаточно последовательно порождают ярко-выраженные ошибки.

Эвристика репрезентативности, например, является нашей склонностью оценивать феномен, основываясь на том, насколько он характерен по отношению к разным категориям. Это может вести к таким ошибкам, как конъюнктивное заблуждение. Тверский и Канеман обнаружили, что субъекты эксперимента считали менее вероятным, что сильный игрок в теннис «проиграет в первом сете», чем «проиграет в первом сете, но выиграет матч»7. То, что сильный игрок сможет отыграться, кажется более характерным, так что мы переоцениваем вероятность такого сложного-но-так-разумно-звучащего рассказа, по сравнению с вероятностью действительно простого сценария.

Также эвристика репрезентативности может быть частью нечувствительности к априорной вероятности, когда мы основываем наше суждение на том, насколько «нормальна» комбинация атрибутов, пренебрегая тем, насколько распространены атрибуты в популяции в целом8. Стив более вероятно является застенчивым библиотекарем, или застенчивым продавцом? Большинство людей будет думать над этим, анализируя насколько «застенчивость» сочетается с стереотипами этих профессий. Они терпят неудачу в том, чтобы учесть насколько больше продавцов в сравнении с библиотекарями в Соединенных Штатах9.

Среди других примеров искажений есть: игнорирование срока действия (оценка опыта без учета того, как долго он будет переживаться), заблуждение невозвратных затрат (чувство необходимости продолжать заниматься тем, на что уже потрачены силы и время, тогда как следует сжечь мосты и двигаться дальше), и ошибка подтверждения (придавать больше значения подтверждающим наши убеждения свидетельствам)10. Игнорирование вероятности — еще один пример когнитивного искажения. В течение месяцев и лет после атаки 11 сентября, множество людей предпочитали вождение на дальние расстояния полетам. Захват был маловероятен, но теперь чувствовалось, что он был одним из вариантов; всего лишь возможность захвата самолета сильно влияла на решения. Полагаясь на черно-белое мышление (машины и самолеты либо «безопасны» либо «опасны», и точка), люди подвергали себя еще большей опасности. В то время как им следовало взвешивать вероятности умереть в автомобильной аварии против смерти во время перелета через страну — первое гораздо более вероятно; они, вместо этого, полагались на общее чувство беспокойства и тревоги (аффективная эвристика).
Такой же поведенческий шаблон можно наблюдать и у детей, которые, слушая аргументы за и против ремней безопасности, мечутся между мыслями «ремень это хорошо» и «ремень это плохо», вместо взвешивания за и против11. Еще несколько примеров искажений: правило кульминации\завершения (оценка воспоминаний на основе самых интенсивных моментов и того, как они завершились); якорение (принятие решения, основываясь на недавно полученной информации, даже если она не относится к делу)12 и само-якорение (использование самого себя в качестве модели определения вероятных черт, не оценивая внимательно насколько вы атипичны)13; искажение «статус кво» (чрезмерная переоценка пользы нормального и ожидаемого, по сравнению с новым и другим)14.

Знание об искажениях редко может защитить от них. В ходе исследований слепоты по отношению к искажениям, субъекты эксперимента предсказали, что если они будут знать, что оцениваемая картина принадлежит кисти известного художника, им будет сложней нейтрально оценить качества этой картины. И, действительно, субъекты, которым сообщили имя автора картины и попросили оценить ее качество продемонстрировали действие искажения, которого они предсказали, относительно контрольной группы. Когда их опрашивали после, эти же субъекты заявляли, что их оценка картины была объективной и нетронутой искажением — и так во всех группах! 15. По аналогии, Пронин пишет на тему искажения гендерной слепоты:
В одном из исследований, участники оценивали мужские и женские кандидатуры на пост шефа полиции, и потом сравнивали пользу «знания жизни на улице» с «формальным обучением». В результате, участники предпочитали то образование, которое получили мужские кандидаты (т.е. если им было сказано, что он «знает жизнь на улице», то это считали более важным). Участники были слепы по отношению к искажению гендерного восприятия; действительно, чем объективней они себя считали, тем больше признаков искажения демонстрировали16. Даже если мы знаем об искажениях, замечает Пронин, мы остаемся «наивными реалистами», когда речь идет о наших собственных убеждениях. Мы быстро откатываемся на позицию оценки наших убеждений, как свободных от искажений представлений о реальности, такой, какая она на самом деле есть17.

Особенно отвратительна мысль о том, что именно наши убеждения ошибочны. Даже если мы корректно определим ошибки других, для своих у нас есть особое слепое пятно. Как показал опрос, проводившийся в аэропорту среди 76 ожидающих, люди оценивали себя, в среднем, как менее подверженных когнитивным искажениям, чем типичная персона в аэропорту. В частности, люди думали о себе, как о необычайно объективных, когда речь заходила об общественно порицаемых искажениях или искажениях с мало заметными в ближайшем времени последствиями 18. Другое исследование показало, что сильные чувства по отношению к проблеме воспринимались людьми как усиливающие понимание и объективность, если эти чувства испытывали опрашиваемые, если же речь заходила о других, то их, по мнению опрашиваемых, такие чувства делали менее объективными и более предвзятыми. Нам не удается заметить «ошибочно-чувствующиеся мысли», когда мы занимаемся самоанализом, так что мы полагаем себя более объективными, чем все остальные19.

Изучение искажений может сделать вас более уязвимыми для сверхуверенности и ошибки подтверждения, по мере того, как вы будете видеть влияние искажений у окружающих, но не у вас. И слепое пятно, в отличии от остальных искажений, особенно серьезно проявляется среди интеллектуальных, вдумчивых, непредубежденных20, 21.

Это причина для беспокойства.

И все же… Кажется, мы способны на большее. Известно, что мы можем снизить влияние нечувствительности к априорной вероятности, представляя вероятности, как частоты событий. Мы можем минимизировать игнорирование срока действия, уделяя внимание сроку действия и изображая его графически22. Сила проявления различных искажений отличается у разных людей, так что должны существовать способы повлиять на наши заблуждения.

Однако, если мы хотим стать лучше, недостаточно просто создать список когнитивных искажений. Подход к устранению искажений в «Рациональности: от ИИ до Зомби» предполагает системное понимание того, как работает правильное мышление и как мозг отстает от него. Этот подход можно сравнить с описанием Серфаса, который заметил, что «годы работы в финансовом секторе» не влияют на уязвимость к заблуждению невозвратных затрат, тогда как «посещение некоторого количества курсов по бухгалтерскому учету» влияет.

Следовательно, нужно отличать опыт от компетентности, где «компетентность» означает «развитие схематических принципов, включающих концептуальное понимание проблем», и, в свою очередь, позволяет лицу, принимающему решения, распознать конкретное искажение. Однако, использование компетентности в качестве ответной меры требует больше, чем просто быть знакомым с контекстом проблемы или быть экспертом в предметной области. Оно требует полного понимания скрытой подоплеки конкретного искажения, способности заметить его и использовать для его нейтрализации соответствующие инструменты23.

Цель этой книги — заложить фундамент для создания рациональной компетентности. То есть научить глубже понимать структуры очень общих проблем: человеческих ошибок, самообмана, и тысячи способов того, как утонченная мысль может победить сама себя.

Пара слов об этом тексте

«Рациональность: от ИИ до Зомби» родилась в качестве серии эссе Элиезера Юдковского, опубликованных между 2006 и 2009 в экономическом блоге «Overcoming Bias» и его ответвлении, блоге «Less Wrong». Я работал с Юдковским вот уже год в Machine Intelligence Research Institute(MIRI), некоммерческой организации, основанной им в 2000 для исследования теоретических требований к созданию умней-чем-человеческого интеллекта (ИИ).

Читая его посты, я заинтересовался его работой. Он впечатлил меня способностью кратко передать идеи, выработка которых у меня занимала годы изучения аналитической философии. В поиске путей объединения духа науки и скептицизма со строгим и системным подходом к исследованиям, Юдковский старается не только опровергнуть, но и понять ложные шаги и слепые пятна плохой философии (плохой недо-философии). Помогая собрать его эссе в книгу, я надеюсь облегчить погружение в них и понимание их как целого.

Получившийся в результате рациональный букварь полон личных деталей — Юдковский использует свой опыт общения с матерью, ортодоксальной иудейкой (психиатром) и отцом (физиком), разговоров в чате и рассылках. Читатели, знакомые с Юдковским по «Гарри Поттеру и Методам Рационального Мышления», его научно-ориентированной интерпретацией Гарри Поттера Дж. К. Роулинг, узнают элементы непочтительного иконоборчества, и основные концепты.

С точки зрения стилистики, эссе в этой книге представляют гамму от «жизнерадостного учебника» до «сборника вдумчивых виньеток» и «буйного манифеста», контент, соответственно, тоже отличается от эссе к эссе. В книге сотни постов Юдковского из блога собраны в двадцать шесть «цепочек», как бы глав, связанных по смыслу постов. Цепочки же сгруппированы в шесть книг, раскрывающих темы:

Книга 1 - Карта и территория. Что такое убеждение и почему одни убеждения работают лучше других? Эти четыре цепочки объясняют Байесовские понятия рациональности, убеждений и свидетельств. Основная тема: штуки, которые мы называем «объяснениями» и «теориями», не всегда функционируют как карты для навигации по миру. В результате есть риск перепутать наши ментальные карты с другими инструментами.

Книга 2 - Как Действительно Изменить Свое Мнение. Штука, называемая «правдой», похоже полезная. Так почему же мы спешим с выводами, наступаем на те же грабли, повторяя те же ошибки? Почему мы так плохо умеем вырабатывать точные убеждения и как делать это лучше? В этих семи цепочках обсуждаются предвзятые рассуждения и ошибка подтверждения, особый фокус на образцах самообмана, которые трудно заметить, и ловушке «использования аргументов как солдат».

Книга 3 - Машина В Призраке. Почему мы не эволюционировали более рациональными? Даже при условии ограниченных ресурсов, похоже, мы могли бы получать больше эпистемической отдачи от наших свидетельств. Чтобы получить более реалистичную картину того, почему и как наш разум исполняет свои биологические функции, нам нужно залезть под капот и внимательно посмотреть как работает эволюция и наш мозг. Эти три цепочки иллюстрируют, как даже философы и ученые могут заблуждаться, если полагаются на интуитивное, не-техническое понимание эволюционных и психологический идей. Обозначив наши разумы внутри огромной целеполагающей системы, мы можем идентифицировать некоторые основы человеческого рассуждения и понять как эта система может «потерять цель».

Книга 4 - Всего Лишь Реальность. В каком мире мы живем? Каково наше место в нем? Основываясь на примерах работы эволюционных и когнитивных моделей из предыдущих цепочек, в этих шести цепочках мы исследуем природу ума и физического закона. В дополнение к применению и обобщению прошлых уроков о научных тайнах и скупости, эссе этой части поднимают новые вопросы о роли науки в рациональности отдельного индивида.

Книга 5 - Всего Лишь Доброта. Как что-то становится ценным — морально, эстетически или пруденциально? Эти три цепочки задаются вопросами о том, как мы можем оправдать, пересмотреть и принять наши ценности и желания. Цель — понять наши цели, не повредив их достижению. Самая сложная проблема: как понять, когда стоит доверять запутанному, сложному, работающему от случая к случаю импульсивному пониманию «хорошо» и «плохо», а когда заменить его на простые, не ведающие исключений, принципы.

Книга 6 - Становясь Сильней. Как люди и сообщества могут применить все это на практике? Эти три цепочки начинаются с автобиографической истории о самых серьезных философских промахах Юдковского, сочетающейся с советами о том, как другие люди могут избежать подобных. Книга заканчивается рекомендацией по разработке курса обучения прикладной рациональности, основанной (основана рациональность, а не рекомендация (прим. перев.)) на фактических данных. И по формированию групп и институтов для поддержки заинтересованных студентов, педагогов, исследователей и друзей.

Еще цепочки дополнены «интерлюдиями», эссе с личного сайта Юдковского (http://www.yudkowsky.net). Они связаны с разными цепочками, например, «Двенадцать добродетелей рациональности» лирически суммируют множество уроков «Рациональности: от ИИ до Зомби», и часто цитируются в эссе.

Кликнув на звездочку в конце каждого эссе, вы попадете на оригинальную версию с сайта Less Wrong (так можно оставить комментарий) или с сайта Юдковского. Также вы можете обнаружить словарь терминов на http://wiki.lesswrong.com/wiki/RAZ_Glossary.

Карта и территория

Первая книга начинается с цепочки о когнитивных искажениях: «Предсказуемо неправы». Книга не ограничена этой темой: плохие привычки и плохие идеи тоже имеют значение, даже если они становятся следствием содержания нашего разума, а не его структуры. Таким образом, эволюционировавшие и изобретенные будут показаны в цепочках, начиная с дискуссии в «Ложных Убеждениях» о том, как ожидания расходятся с декларированными убеждениями.

Оценка иррациональности была бы неполной без теории, описывающей рациональность, или если «теория» будет состоять из смутных трюизмов, без точного объяснительного механизма. Цепочка «Замечая замешательство» раскрывает вопрос: почему полезно основывать поведение на «рациональных» ожиданиях и как это ощущается изнутри.

Дальше, «Загадочные ответы» ставит вопрос: способна ли наука решить эти проблемы для нас. Ученые основывают свои модели на повторяемых экспериментах, а не на спекуляциях и слухах. Наука также имеет великолепную репутацию в сравнении с историями, религией и… Да в сравнении с чем угодно имеет. Стоит ли волноваться по поводу «ложных» убеждений, ошибки подтверждения, ошибки знания задним числом и им подобных, если мы работаем с сообществом людей, желающих объяснять феномены, а не рассказывать трогательные истории?

За этим следует «Простая Истина», отдельная аллегория о природе знания и убеждений.

Однако именно когнитивные искажения предоставляют наиболее ясное и прямое представление о нашей психологии, виды эвристик и логику наших ограничений. Именно с искажений мы и начнем. Строка в Чжуан-цзы, пре-Даосского философского трактата, гласит: «Ловушка для рыбы существует из-за рыбы, заполучив рыбу, ты можешь позабыть о ловушке» 24.

Приглашаю исследовать эту книгу именно в таком духе. Используйте ее так, как использовали бы ловушку для рыбы, всегда внимательно следя за целью, для которой вы ее используете. Берите то, что можете использовать, то, что будет полезным, остальное — отбросьте. И пусть ваша цель послужит вам верно.

Благодарности

Я чрезвычайно признателен Nate Soares, Elizabeth Tarleton, Paul Crowley, Brienne Strohl, Adam Freese, Helen Toner и десяткам волонтеров, вычитывавших эту книгу.

Отдельно от всей души хочу сказать спасибо Alex Vermeer, который помог довести эту книгу до конца, и Tsvi Benson-Tilsen, который прочел ее от корки до корки, чтобы убедиться в удобочитаемости и связности изложения.

  • 1. Идея персональной ошибки, медиа ошибки, и т.д. похожи на статистическую в том смысле, что это ошибки. По-другому можно обобщить идею искажений, сфокусировавшись на их ассоциации с неслучайностью. В машинном обучении, например, индуктивное искажение— совокупность предположений, которые использует обучающийся для выведения предсказаний на основе имеющихся данных. Т.е. обучающийся предубежден в специфическом направлении, но так как на этом пути может быть правда, не так уж и плохо для агента иметь индуктивное искажение. Оно ценное и необходимое. Это различает индуктивную ошибку от остальных довольно четко.
  • 2. Печальное совпадение: Леонард Нимой, актер, сыгравший Спока, ушел из жизни за несколько дней до выхода этой книги. Несмотря на то, что мы использовали его персонажа как классический пример «Голливудской рациональности», это не значит, что мы не уважаем память о нем.
  • 3. Timothy D. Wilson et al., “Introspecting About Reasons Can Reduce Post-choice Satisfaction,” Personality and Social Psychology Bulletin 19 (1993): 331–331.
  • 4. Jamin Brett Halberstadt and Gary M. Levine, “Effects of Reasons Analysis on the Accuracy of Predicting Basketball Games,” Journal of Applied Social Psychology 29, no. 3 (1999): 517–530.
  • 5. Keith E. Stanovich and Richard F. West, “Individual Differences in Reasoning: Implications for the Rationality Debate?,” Behavioral and Brain Sciences 23, no. 5 (2000): 645–665, http://journals.cambridge.org/abstract_S0140525X00003435.
  • 6. Timothy D. Wilson, David B. Centerbar, and Nancy Brekke, “Mental Contamination and the Debiasing Problem,” in Heuristics and Biases: The Psychology of Intuitive Judgment, ed. Thomas Gilovich, Dale Griffin, and Daniel Kahneman (Cambridge University Press, 2002).
  • 7. Amos Tversky and Daniel Kahneman, “Extensional Versus Intuitive Reasoning: The Conjunction Fallacy in Probability Judgment,” Psychological Review 90, no. 4 (1983): 293–315, doi:10.1037/0033-295X.90.4.293.
  • 8. Richards J. Heuer, Psychology of Intelligence Analysis (Center for the Study of Intelligence, Central Intelligence Agency, 1999).
  • 9. Wayne Weiten, Psychology: Themes and Variations, Briefer Version, Eighth Edition (Cengage Learning, 2010).
  • 10. Raymond S. Nickerson, “Confirmation Bias: A Ubiquitous Phenomenon in Many Guises,” Review of General Psychology 2, no. 2 (1998): 175.
  • 11. Cass R. Sunstein, “Probability Neglect: Emotions, Worst Cases, and Law,” Yale Law Journal (2002): 61–107.
  • 12. Dan Ariely, Predictably Irrational: The Hidden Forces That Shape Our Decisions (HarperCollins, 2008).
  • 13. Boaz Keysar and Dale J. Barr, “Self-Anchoring in Conversation: Why Language Users Do Not Do What They ‘Should,”’ in Heuristics and Biases: The Psychology of Intuitive Judgment: The Psychology of Intuitive Judgment, ed. Griffin Gilovich and Daniel Kahneman (New York: Cambridge University Press, 2002), 150–166, doi:10.2277/0521796792.
  • 14. Scott Eidelman and Christian S. Crandall, “Bias in Favor of the Status Quo,” Social and Personality Psychology Compass 6, no. 3 (2012): 270–281.
  • 15. Katherine Hansen et al., “People Claim Objectivity After Knowingly Using Biased Strategies,” Personality and Social Psychology Bulletin 40, no. 6 (2014): 691–699.
  • 16. Eric Luis Uhlmann and Geoffrey L. Cohen, “‘I think it, therefore it’s true’: Effects of Self-perceived Objectivity on Hiring Discrimination,” Organizational Behavior and Human Decision Processes 104, no. 2 (2007): 207–223.
  • 17. Emily Pronin, “How We See Ourselves and How We See Others,” Science 320 (2008): 1177–1180, http://psych.princeton.edu/psychology/research/pronin/pubs/2008%20Self%2….
  • 18. Emily Pronin, Daniel Y. Lin, and Lee Ross, “The Bias Blind Spot: Perceptions of Bias in Self versus Others,” Personality and Social Psychology Bulletin 28, no. 3 (2002): 369–381.
  • 19. Joyce Ehrlinger, Thomas Gilovich, and Lee Ross, “Peering Into the Bias Blind Spot: People’s Assessments of Bias in Themselves and Others,” Personality and Social Psychology Bulletin 31, no. 5 (2005): 680–692.
  • 20. Richard F. West, Russell J. Meserve, and Keith E. Stanovich, “Cognitive Sophistication Does Not Attenuate the Bias Blind Spot,” Journal of Personality and Social Psychology 103, no. 3 (2012): 506.
  • 21. Не путать с людьми, думающими о себе как о интеллектуальных, из-за эффекта мнимого превосходства.
  • 22. Michael J. Liersch and Craig R. M. McKenzie, “Duration Neglect by Numbers and Its Elimination by Graphs,” Organizational Behavior and Human Decision Processes 108, no. 2 (2009): 303–314.
  • 23. Sebastian Serfas, Cognitive Biases in the Capital Investment Context: Theoretical Considerations and Empirical Experiments on Violations of Normative Rationality (Springer, 2010).
  • 24. Zhuangzi and Burton Watson, The Complete Works of Zhuangzi (Columbia University Press, 1968).
Перевод: 
Muyyd, Remlin
Оцените качество перевода: 
Средняя оценка: 4.7 (23 votes)

Предсказуемо неправы

Материалы цепочки распространяются по лицензии CC BY-NC-SA 3.0

Автор: 
Элиезер Юдковский

Что такое рациональность

Элиезер Юдковский

Под рациональностью я подразумеваю:

  1. Эпистемическую рациональность, то есть систематическое улучшение точности своих убеждений.
  2. Инструментальную рациональность, то есть систематическое достижение желаемых результатов.

Когда вы открываете глаза и осматриваете комнату, вы замечаете ноутбук на столе и книжный шкаф около стены. Если с вашими глазами или вашим мозгом случится что-нибудь плохое, возможно, у вас в голове окажется мысленная модель, которая скажет, что шкаф стоит там, где его на самом деле нет. В этом случае, когда вы пойдёте за книгой, вам будет обидно.

Примерно так и выглядят ложные убеждения — карта мира, не соответствующая территории1. Эпистемическая рациональность посвящена построению карт, точно отображающих реальность. Точную связь между убеждением и реальностью обычно называют «истиной», и я тоже с радостью пользуюсь этим словом.

С другой стороны, инструментальная рациональность посвящена управлению реальностью. Вы делаете будущее таким, каким вам хочется. Инструментальная рациональность — это искусство выбрать действия, которые приведут к последствиям, стоящим выше в вашей шкале предпочтений. Иногда я называю это «выигрыванием».

Так что рациональность — это искусство формировать истинные убеждения и принимать выигрышные решения.

Поиск «истины» не означает, что нужно отвергать нечёткие или косвенные свидетельства. Вы можете оглядеть комнату и построить её мысленную модель. Убеждения о комнате принципиально ничем не отличаются от убеждений, что у Земли есть расплавленное ядро, а Юлий Цезарь был лысым. Возможно, эти вопросы вам кажутся более сложными и абстрактными, чем вопрос о вашем шкафе, ведь вас и предметы этих вопросов разделяет значительное пространство и время. И тем не менее состояние ядра Земли в 2015 году нашей эры и состояние головы Цезаря в 50 году до нашей эры — это вопросы о фактах. Эти факты могут влиять на реальность, даже если у вас нет никакой возможности лично встретить Цезаря или посмотреть на земное ядро.

А когда я пишу о «выигрывании», это не значит, что речь идёт о достижении успеха за счёт других. Не обязательно превращать жизнь в соревнование, её можно строить на базе сотрудничества и самопожертвования. Под «вашими ценностями» подразумевается абсолютно всё, о чём вы заботитесь — включая других людей. Они не ограничиваются исключительно эгоистическими ценностями.

Зачастую, когда люди говорят «Х — рационально!», это просто более звучный способ сказать: «Я думаю, что Х — истинно» или «Я считаю, что Х — хорошо!». Так зачем же использовать дополнительное слово «рационально», если можно говорить «истинно» и «хорошо»?

Тот же самый аргумент применим и к слову «истинно». Незачем говорить «истинно, что снег белый», когда можно сказать просто «снег белый». Идея истины полезна, потому что она позволяет нам говорить о соответствии карты и территории в целом. Фраза «истинные модели позволяют лучше делать проверяемые предсказания, чем ложные модели» — это полезное обобщение, и его нельзя сделать, не пользуясь понятиями вроде «истины» и «точности».

Аналогично, фраза «Рациональные агенты принимают решения, которые максимизируют вероятностное ожидание согласованной функции полезности» относится к понятию (инструментальной) рациональности, а фразу «Рационально есть овощи» наверняка можно заменить на «Полезно есть овощи» или «Есть овощи — в ваших интересах». Нам нужно понятие, вроде «рациональности», чтобы описывать общие факты о том, какие способы мышления систематически приводят нас к истине или к выигрышу, а также какие способы систематически приводят нас к обратному.

Иногда экспериментальные психологи обнаруживают, что в некоторых ситуациях люди, размышляют, судя по всему, очень странно. Например, человек присваивает утверждению «Билл играет джаз» вероятность меньшую, чем утверждению «Билл — бухгалтер, который играет джаз». Поскольку, очевидно, любой играющий джаз бухгалтер — играет джаз, такое суждение выглядит странно. Однако какими принципами мы пользуемся, когда говорим, что это суждение неверно?

Экспериментальные психологи применяют два золотых стандарта: теория вероятностей и теория принятия решений.

Теория вероятностей — это набор законов, лежащих в основе рациональных убеждений. Математика теории вероятностей абсолютно одинаково описывает и а) как выяснить, где находится ваш книжный шкаф, и б) как узнать температуру земного ядра, и в) как вычислить, сколько волос было на голове Юлия Цезаря. С точки зрения того, как нужно обрабатывать свидетельства и наблюдения, чтобы пересматривать и обновлять свои убеждения, это одинаковые задачи. Аналогично, теория принятия решений — это набор законов, лежащих в основе рациональных действий, и её можно применять независимо от того, о каких целях и каких вариантах действий идёт речь.

Обозначим выражением «Р(что-нибудь)» вероятность того, что это что-нибудь случится, а выражением «Р(А, В)» — вероятность, что А и В случатся вместе. Поскольку в теории вероятностей есть универсальный закон, что P(A)P(A, B), суждение, что Р(Билл играет джаз) меньше, чем Р(Билл играет джаз, Билл — бухгалтер) отмечается как неверное.

Говоря формально, такое рассуждение о вероятностях — небайесианское. Убеждения и действия, рациональные в строго определённом математическом смысле, называются байесианскими.

Обратите внимание, современное понятие рациональности не привязано к словесным рассуждениям. Я привёл пример, как вы открываете глаза, осматриваетесь и строите мысленную модель комнаты со шкафом около стены. Современное понятие рациональности — достаточно общее и включает ваши глаза и зрительную кору вашего мозга, как объекты на карте. Оно включает и вашу интуицию, которую сложно выразить словами. Математика не обращает внимание на то, что мы используем одинаковое слово «рациональный», и описывая Спока2, и описывая байесианский способ рассуждений. Математические модели — это хороший способ достигать своих целей или строить карту мира, независимо от того, какие у нас сложились предубеждения и стереотипы относительно слова «рациональность».

Однако это не решает проблему о том, что именно подразумевается под занятием «рациональностью», по двум основным причинам.

Во-первых, невозможно строго вычислить байесовские вероятности, необходимые для решения подавляющего большинства реальных задач. Никто не в состоянии посчитать правильное решение и ему следовать. Это всё равно, что попытаться предсказать поведение рынка акций, исходя из движения кварков.

Именно поэтому существует целый сайт под названием «Less Wrong», а не одна страница, которая ограничивается простым перечислением строгих аксиом. Для человеческого разума находить истину и достигать своих целей — это целое искусство. Чтобы сталкиваться с правдой и делать то, что должно, нам надо изучать собственные недостатки, справляться со своими предубеждениями, удерживаться от самообмана, поддерживать себя в хорошей эмоциональной форме, и так далее, и так далее.

Во-вторых, иногда математика сама по себе приводит к новым вопросам. Например, точные правила теории вероятностей приводят к вопросу антропного принципа, где неизвестно число наблюдателей. Точные правила теории принятия решений приводят к задачам вроде парадокса Ньюкома, в которых другие агенты могут предсказать ваше решение до того, как вы его примете.

В таких случаях совершенно бессмысленно пытаться решить проблему, введя новое определение слова «рациональность» и заявив: «Таким образом под «рациональностью», по определению, будет подразумеваться предпочитаемый мной ответ». В этом случае, естественно, встанет вопрос, почему ваше определение должно кого-то интересовать. Теория вероятностей важна для меня не потому, что это священные слова, вручённые нам Лапласом. Байесианское обновление убеждений (вместе с оккамовскими априорными вероятностями) интересно для меня, потому что я ожидаю, что именно такой способ думать приведёт нас к карте, которая систематически более точно отображает территорию.

А ещё некоторые вопросы о том, как следует думать, кажется, не решаются целиком ни с помощью теории вероятностей, ни с помощью теории принятия решений. Например, вопрос о том, какие чувства испытывать по отношению к правде. В этих случаях какое-то собственное определение «рациональности» тоже лишь будет включать в себя уже существующий ответ, но не позволит найти что-то новое.

Я не собираюсь здесь спорить о значении слов, даже если речь идёт о слове «рациональность». Привязка неких последовательностей букв к определённым понятиям нужна, чтобы люди могли разговаривать между собой — передавать мысли от одного человека к другому. Невозможно изменить реальность или доказать какую-то мысль, манипулируя этими привязками.

Поэтому если вы поняли, какое понятие я связываю со словом «рациональность» и со словосочетаниями «эпистемическая рациональность» и «инструментальная рациональность», передача информации уже случилась. В рамках разговора о том, как определять «рациональность», мы сделали всё, что нужно. Дальше мы не будем разговаривать, какой смысл привязан к слогам «ра-ци-о-наль-ность». Дальше мы будем разговаривать, как именно лучше рассуждать.

Если вы говорите «Для меня (эпистемически) рационально считать, что Х, однако истина в том, что Y», вы наверняка используете слово «рационально» не в том же смысле, что и я. (Например, «рациональность» должна «выдерживать рефлексию» — «рациональный» взгляд на свидетельства и «рациональные» размышления о том, как ваш разум обрабатывает эти свидетельства, не должны приводить к разным выводам.)

Аналогично, если вы вдруг говорите «Для меня (инструментально) рационально сделать Х, но я считаю, что правильно делать Y», то почти наверняка вы используете для слова «рационально» или для слова «правильно» какие-то другие значения. Я использую термин «рациональность» нормативно: чтобы выбирать предпочитаемый способ рассуждений.

В этих случаях — а также во всех других, когда люди не соглашаются относительно смысла слов — вам стоит заменять слово «рационально» на более точные описания. Например: «Ради собственного благополучия следовало бы убежать, но я надеюсь, что хотя бы постараюсь вытащить ребёнка с рельсов». Или: «Причинная теория приятия решений в привычной формулировке говорит, что в задаче Ньюкома нужно брать оба ящика, но я предпочту получить миллион долларов».

Я вообще рекомендую перечитать это эссе, заменяя все вхождения слова «рационально»(и однокоренные) на «фузально». Проверьте, изменится ли смысл текста. Если изменится, стремитесь не к рациональности, а к фузальности.

В слове «рационально» таятся многочисленные ловушки. Однако во многих случаях с его помощью можно прекрасно передавать тот смысл, который я в него вкладываю. В этих случаях я не боюсь его использовать.

И всё же будьте с этим словом осторожны и не используйте его напрасно. Вы ничего не заработаете, просто произнося его вслух. Слишком много рассуждающий о пути не достигнет просветления.

  • 1. Фраза «Карта — это не территория» является одним из ключевых положений дисциплины под названием «общая семантика». В эссе Rationalist Fiction Юдковский рассказывает, что ещё в детстве прочитал эту фразу в научно-фантастическом романе «Мир Нуль-А» Альфреда ван Вогта. Примечательно, что в данной книге Юдковский ни разу не упоминает ни общую семантику, ни её главного разработчика – Альфреда Коржибски — Прим. перев.
  • 2. Известный персонаж сериала «Звёздный путь», . — Прим.перев.
Перевод: 
Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
1
Оцените качество перевода: 
Средняя оценка: 3.6 (34 votes)

Мне сегодня рационально

Элиезер Юдковский

Есть распространённое мнение, что рациональность противостоит эмоциям: все оттенки грусти и все оттенки радости автоматически нелогичны лишь потому, что это всего лишь чувства. Что удивительно, я не нашел ни одной теоремы в теории вероятностей, которая бы доказывала, что я должен быть холодным и бесчувственным.

Выходит, рациональность вообще не имеет отношения к чувствам? Это не так, ведь наши эмоции порождаются нашими моделями реальности. Если я решу, что мой мёртвый брат воскрес, я обрадуюсь; если я проснусь и пойму, что это был сон, я буду расстроен. Пэт Ходжилл однажды сказала: «То, что может быть разрушено правдой, должно быть разрушено». Во сне я был счастлив, но правда этому счастью противоречила. Проснувшись, я ощутил грусть, но эта грусть рациональна: нет такой правды, которая могла бы её разрушить.

Рациональность начинается с вопроса «каков мир на самом деле и как он работает», но словно вирус, распространяется на любую другую мысль, зависящую от того, каков он, по нашим представлениям. Убеждения о том, каков мир на самом деле, могут включать все, что ты думаешь о реальности, что существует, а что нет, и что угодно из класса «вещи, которые могут заставить случаться другие вещи». Если ты считаешь, что в твоем чулане живёт гоблин, который привязывает друг к другу шнурки твоих ботинок, то это — убеждение о том, как работает мир. Шнурки реальны: их можно потрогать. Сущность, которая может их связать, тоже должна быть реальной: она — часть гигантской сети причин и следствий, которую мы называем «вселенной».

Чувство злости на гоблина, за то что он связал шнурки - это состояние разума, которое касается не только того, как работает мир. Если ты, скажем, буддист, или тебе сделали лоботомию, или ты просто родился очень флегматичным человеком, то действия гоблина тебя не разозлят. Это не влияет на твои ожидания: ты все еще уверен, что открыв чулан, увидишь пару ботинок, привязанных друг к другу шнурками. Зол ты или спокоен - это не должно влиять на твои прогнозы, поскольку твои эмоции не влияют на происходящее в чулане (хотя, конечно, может потребоваться некоторое усилие, чтобы рассуждать трезво).

Однако, злость сцеплена с состоянием разума, имеющим отношение к тому, как работает мир: ты злишься потому, что думаешь, что гоблин связал шнурки ботинок. Критерий рациональности рапространяется как вирус: от исходного вопроса, завязал ли гоблин шнурки, и до возникшей в итоге злости.

По мере улучшения представлений о том, каков мир на самом деле, эмоции могут как ослабнуть, так и усилиться. Иногда мы избегаем сильных эмоций, отрицая факты, прячась от мира, порождающего столь сильные эмоции. В таком случае, изучая искусство рациональности и тренируясь не отрицать факты, ты можешь заметить усиление эмоций.

Когда я начинал учиться рациональности, я постоянно сомневался, нормально ли испытывать сильные эмоции, допустимо ли это вообще, и правильно ли. Не думаю, что замешательство было вызвано только лишь моим неверным представлением о рациональности. Я встречал немало людей с подобными проблемами, и эти люди даже и не думали становиться рационалистами. Когда они были счастливы, они сомневались в своём праве быть счастливыми, а когда расстроены - не могли понять, нужно ли бороться с этой эмоцией. Ещё со времён Сократа (а возможно, и гораздо раньше) в кругу людей, считавших себя культурными и утончёнными, было не принято показывать, что вам что-то небезразлично. Испытывать чувства постыдно — в приличном обществе так просто не делают. Надо видеть взгляды, которые на меня бросают люди, узнав, насколько мне важна рациональность. И я подозреваю, что причина кроется не в необычности предмета интереса, а в том, что они не привыкли встречать здравомыслящих взрослых людей, которые демонстрируют, что им важно хоть что-то.

Но сейчас я знаю, что нет ничего постыдного в сильных эмоциях. Усвоив правило «То, что может быть разрушено правдой, должно быть разрушено», я также понял, что «То, что питается правдой, должно расцветать». Когда случается что-то хорошее, я счастлив, и не мучаюсь сомнениями, рационально ли быть счастливым. Когда случается что-то ужасное(English), я не бегу от печали, ища ложные утешения и фальшивые плюсы. Я представляю прошлое и будущее человечества, десятки миллиардов смертей на протяжении всей истории, горе и страх, поиск ответов, дрожащие руки, тянущиеся вверх из рек крови, то, чем мы можем стать в тот день, когда звёзды станут нашими городами, вся эта тьма и весь этот свет; я знаю, что я никогда не смогу полностью это понять, и я не знаю слов, которыми можно было бы передать эти мысли. Несмотря на всю мою философию, я всё ещё смущаюсь показывать сильные эмоции, а тебе, возможно, некомфортно видеть их проявления. Но теперь я знаю, что в чувствах нет ничего иррационального.

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
2
Оцените качество перевода: 
Средняя оценка: 4.2 (53 votes)

Зачем нужна истина?

Элиезер Юдковский

Некоторые комментаторы спрашивают меня, зачем необходимо искать истину (к счастью, почти никому не нужно объяснять, что есть истина). Желание сделать своё мировоззрение рациональным вырастает именно из стремления к истине, и уже благодаря этому желанию все мировоззрения можно разделить на «хорошие» и «плохие».

В «Двенадцати добродетелях рациональности» я писал: «Первая добродетель — любопытство». Любопытство — первая причина искать истину, и, несмотря на то, что эта причина не единственна, в ней есть особая восхитительная чистота. В глазах человека, движимого любопытством, приоритет вопроса зависит от его эстетической ценности. Сложный вопрос, где вероятность неудачи необычно высока, стоит больших усилий, чем простой, где ответ и без того ясен — ведь узнавать новое интересно.

Кто-то может возразить: «Любопытство — эмоция, а эмоции иррациональны». Я называю эмоцию «иррациональной», если она основана на ложных убеждениях или, точнее, поведении, неправильном в свете известной информации: «К твоему лицу подносят железо, и ты веришь, что оно раскалено, но можно видеть, что оно холодно — тогда Учение осуждает твой страх. К твоему лицу подносят железо, и ты веришь, что оно холодно, но можно видеть, что оно раскалено — тогда Учение осуждает твоё спокойствие». И наоборот: эмоцию, вызванную истинными убеждениями либо рациональным с точки зрения желания узнать истину мышлением можно назвать «рациональной эмоцией» (Поэтому удобно считать, что спокойствие — не абсолютный ноль шкалы, а тоже эмоция, не лучше и не хуже всех остальных).

Мне кажется, что люди, противопоставляющие «эмоции» и «рациональность», на самом деле говорят о Системе 1 — системе быстрых, основанных на восприятии суждений — и Системе 2 — системе медленных обоснованных суждений. Обоснованные суждения не всегда правдивы и интуитивные суждения не всегда ложны, поэтому важно не путать эту дихотомию с вопросом о рациональности и иррациональности. Обе системы могут служить как истине, так и самообману.

Что ещё заставляет искать истину, не считая любопытства? Желание достигнуть какой-то цели в реальном мире: например, братья Райт хотят построить самолёт и для этого им необходимо знать правду о законах аэродинамики. Или, более повседневно: я хочу шоколадного молока, и поэтому меня интересует, можно ли купить его в ближайшем магазине: тогда я смогу решить, пойти ли туда, или куда-нибудь ещё. В глазах человека, движимого прагматизмом, приоритет вопроса определяется ожидаемой полезностью ответа на него: степенью влияния на решения, важностью этих решений, вероятностью того, что ответ сместит итоговое решение в сторону от первоначального решения.

Поиск истины в прагматичных целях выглядит неблагородным — разве истина не ценна сама по себе? — но такие поиски очень важны, поскольку они создают внешний критерий проверки. Упавший на землю самолёт или отсутствие молока в магазине говорят о том, что ты сделал что-то неправильно. Ты получаешь обратную связь и можешь понять, какие методы мышления работают, а какие нет. Чистое любопытство прекрасно, но стоит найти ответ — оно исчезает вместе с поразительной загадкой, и ничто уже не заставляет проверять ответы. Любопытство — древняя эмоция, появившаяся задолго до древних греков, руководившая ещё предками их предков. Но легенды о богах и героях удовлетворяют любопытство ничуть не хуже результатов научных экспериментов, и очень долго никто не видел в этом ничего плохого. Лишь наблюдение «некоторые методы мышления отыскивают суждения, позволяющие управлять миром» уверенно направило человечество на путь науки.

Итак, есть любопытство, есть прагматизм, что ещё? Третья причина поиска истины, которая приходит мне в голову — честь. Вера в то, что отыскание истины благородно, нравственно и важно. Такой идеал приписывает истине внутреннюю ценность, но он не похож на любопытство. Мысль «Интересно, что за занавесом» ощущается не так, как мысль «Мой долг — заглянуть за занавес». Паладину истины легче верить в то, что за занавес должен заглянуть кто-то ещё, и легче осуждать кого-то за добровольное закрывание глаз. Из этих соображений я называю «честью» убеждение в том, что истина имеет практическую ценность для общества и поэтому её следует искать всем. Приоритеты паладина истины в отношении белых пятен карты определяются не полезностью и не интересностью, но важностью; кроме того, в одних ситуациях долг искать истину зовёт сильнее, чем в других.

Я с подозрением отношусь к долгу как мотивации для поиска истины: не потому, что идеал плох сам по себе, а потому, что из такого мировоззрения могут вытекать некоторые проблемы. Слишком легко приобрести в корне ошибочные методы мышления. Например, посмотрим на наивный архетип рациональности — мистера Спока из «Звёздного пути». Эмоциональное состояние Спока всегда зафиксировано на отметке «спокойствие», даже когда это совершенно неадекватно ситуации. Он часто сообщает чудовищно неоткалиброванные вероятности, называя при этом слишком много значащих цифр («Капитан! Если ты отправишь Энтерпрайз в эту чёрную дыру, то вероятность нашего выживания всего лишь 2,234%!» — и при этом в девяти случаях из десяти Энтерпрайз отделывается мелкими царапинами. Оценка отличается от реального значения на два порядка; каким идиотом надо быть, чтобы раз за разом называть четыре значащие цифры?). Но при этом многие люди, думая о «долге быть рациональным» представляют себе в качестве примера именно Спока — неудивительно, что они не принимают искренне такой идеал.

Если сделать рациональность моральным долгом, то она теряет все степени свободы и превращается в деспотичный первобытный обычай. Получившие неверный ответ люди возмущённо утверждают, что они действовали в точности по правилам, вместо того, чтобы учиться на ошибках.

Но всё же, если мы желаем стать более рациональными, чем наши предки охотники и собиратели, то нам необходимы обоснованные убеждения о том, как правильно мыслить. Написанные нами ментальные программы рождаются в Системе 2, системе медленных обдуманных решений, и очень медленно переселяются — если вообще переселяются — в цепи и сети нейронов, образующих Систему 1. Поэтому, если мы желаем избежать некоторых определённых типов рассуждений, — например, когнитивных искажений — то это желание остаётся внутри Системы 2 в качестве предписания сторониться нежелательных мыслей, превращается в своеобразный профессиональный долг.

Некоторые методы мышления помогают найти истину лучше, чем другие — это приёмы рациональности. Часть приёмов рациональности говорят о преодолении определённого класса препятствий, когнитивных искажений.

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
3
Оцените качество перевода: 
Средняя оценка: 4.4 (23 votes)

Что же такое искажение?

Элиезер Юдковский

Искажения — определённый вид препятствий на пути к истине (то есть их характер как препятствие мешает найти истину, но при этом существует множество других препятствий, искажениями не являющихся).

Если спросить «что такое искажение?» прямо сейчас, то вопрос будет задан слишком рано. Как говорится в английской поговорке, «существует сорок видов безумия, но лишь один вид здравого смысла». Истина — небольшая цель, компактная область в пространстве возможных конфигураций. «Любит она меня или нет?» — простой общий вопрос, однако $E=mc^2$ — всего лишь маленькая точка в пространстве всех возможных уравнений, словно выигрышный лотерейный билет в пространстве всех лотерейных билетов. В ошибке нет ничего исключительного, объяснения требует успех — настолько он невероятен априори.

Моральный долг «бороться с искажениями» (потому что искажения — плохие, злобные и Просто Неправильные штуки) — неверный подход к проблеме. Так может думать кто-то, кто приобрёл деонтологический долг «быть рациональным» в результате социального осмоса. Это порождает людей, пытающихся применять техники, не понимая стоящих за техниками причин (а это плохая, злобная и Просто Неправильная штука, если верить замечательной книге «Вы, конечно, шутите, мистер Фейнман»).

Подойдём к проблеме правильно.

По какой-то причине мы желаем попасть к истине, и по пути нам встречаются различные препятствия. Эти препятствия не сильно отличаются друг от друга: например, есть препятствия, имеющие отношение к недостатку вычислительных мощностей или к дороговизне информации. Большая группа препятствий разделяет общие черты — образует кластер в пространстве препятствий-на-пути-к-истине — и члены этого кластера называются искажениями.

Что такое искажение? Можно ли найти простой тест на принадлежность к этому эмпирическому кластеру? Может быть, мы так и не сможем найти объяснения, лучшего чем «показать пальцем на несколько ярких примеров и надеяться, что слушатель поймёт». Порой для учёного, только начавшего изучать огонь, мудрее сказать «огонь — это вон та яркая оранжевая штука», чем «я определяю огонь как алхимическую трансмутацию материи, выделяющую флогистон». Как я сказал в «Простой истине», нельзя игнорировать что-то лишь потому, что ты не знаешь, как это определить. Я не помню уравнения Общей Теории Относительности наизусть, но тем не менее, если я шагну с обрыва, то я упаду. То же самое можно сказать и про искажения — они не перестанут больно кусаться, если выяснится, что никто не может внятно объяснить, что такое «искажение». Поэтому вполне законно рассказать про ошибки в ситуации с логическим «И», эффект знания задним числом, сверхуверенность, эвристику доступности, ошибочную оценку поведения и гиперболическое обесценивание, а после сказать «Что-то типа этого».

Можно заметить, что мы называем «искажениями» те препятствия на пути к истине, которые созданы ни дороговизной информации, ни недостатком вычислительных мощностей, но формой ментального оборудования. Например, эволюция оптимизировала оборудование для целей, противостоящих эпистемологической точности (оборудование выигрывать политические споры). Или давление естественного отбора извратило желание добиться эпистемологической точности (вместо этого люди верят в то же, что и окружающие, приобретая благодаря этому союзников и друзей). Или классическая проблема эвристики, когда оборудование работает по понятному алгоритму, который обычно делает всё правильно, но временами совершает систематические ошибки. Сама по себе, эвристика доступности не является искажением, но она порождает характерные, компактно описываемые искажения. Человеческий мозг делает что-то неправильно, и проведя кучу экспериментов и/или хорошо подумав, кто-нибудь формулирует проблему на понятном Системе 2 языке — тогда мы называем эту ошибку «искажением». Даже если мы так и не узнаем большего, всё же ясно, что эта ошибка возникает — известным образом — из-за определённой формы когнитивного оборудования. Не из-за того, что оборудования слишком мало, а из-за того, что оно особой формы.

«Искажения» — это не ошибки, порождённые информацией внутри мозга (например, перенятые у кого-то убеждения или некого рода моральный долг). Они не называются «искажениями», и их намного проще исправить после того, как они замечены (тем не менее, источником ошибки, или источником источника ошибки, может быть и какое-либо искажение).

«Искажения» — это не ошибки, вызванные каким-то индивидуальным повреждением мозга или впитанными культурными нравами. «Искажения» — следствие работы механизмов, общих для всех людей.

Нельзя сказать «Платон страдал от когнитивных искажений, ведь он не знал теории относительности» — он не мог о ней узнать, его незнание было порождено не формой его ментального оборудования. Но если Платон считал, что лучшими правителями будут философы, из-за того что он сам был философом — а это убеждение, в свою очередь, возникло благодаря универсальному политическому инстинкту рекламировать себя, а не из-за того, что отец Платона говорил «долг каждого — говорить, что его профессия достойна занимать трон правителя», и не из-за того, что в детстве Платон нюхал слишком много клея — то тогда это значит, что Платон страдал от когнитивных искажений, и не имеет значения, знал ли об этом сам Платон.

Возможно, искажения трудно исправить. Возможно, они не исправляются в принципе. Но дело не в этом. Если, взглянув на своё ментальное оборудование, мы видим заурядный пример известного класса ошибок, и эта ошибка возникает из-за созданной эволюцией формы оборудования, а не из-за недостатка оборудования или плохого его содержимого, то мы называем её искажением.

Лично я вижу цель оттачивания навыков рационалиста в усилении способностей находить истину. Задание состоит в том, чтобы добраться до позитивной отметки (истины), а не в том, чтобы избежать негативной отметки (неудачи). Пространство неудач велико, там найдётся бесконечное множество ошибок в бесконечном их разнообразии. Трудно описать столь обширное пространство: «Свойство этого яблока может не быть свойством того яблока. Поэтому про одно яблоко можно рассказать большее, чем про все яблоки в мире». Пространство успеха меньше, и поэтому про него можно рассказать больше.

Я не питаю отвращения к разговорам об определениях, но нельзя забывать, что это не главная наша цель. Мы преследуем великую цель нахождения истины, нам отчаянно нужны знания, и кроме того, мы любопытны. Поэтому мы стремимся преодолеть все лежащие на пути препятствия, и без разницы, как мы их при этом называем.

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
4
Оцените качество перевода: 
Средняя оценка: 4.2 (32 votes)

Доступность

Элиезер Юдковский

Эвристика доступности - суждение о частоте или вероятности события по тому, насколько легко приходят на ум примеры данного события.

В известном исследовании 1978 года «Оценка частоты смертельных исходов»1 изучались ошибки при количественной оценке серьёзности рисков. Испытуемым называли два бедствия и спрашивали, какое из них происходит чаще. Испытуемые считали, что несчастные случаи уносят столько же жизней, сколько и болезни, думали, что убийство является более частой причиной смерти, нежели самоубийство. Хотя на самом деле, число умерших от болезней в шестнадцать раз превосходит число погибших от несчастного случая, а самоубийства происходят в два раза чаще убийств.

Очевидная гипотеза, объясняющая эти искажённые убеждения - что об убийствах чаще говорят, нежели о самоубийствах, и, таким образом, людям проще вспомнить разговор об убийце, нежели о суициднике. Несчастные случаи производят большее впечатление, нежели болезни - возможно, поэтому людям проще запомнить или вспомнить несчастный случай. В 1979 году, следующее исследование Комбса и Словика показало, что суждения с искажённой вероятностью сильно коррелируют (0.85 и 0.89) с искажёнными цифрами, которые были размещены в двух газетах2. Хотя это не проясняет, легче ли вспомнить убийства, потому что о них больше пишут, или же репортёры больше пишут об убийствах, потому что убийства производят большее впечатление (и поэтому легко запоминаются).

Но так или иначе, эвристика доступности тут присутствует. Избирательная отчётность - это один из основных источников искажений доступности. В родоплеменном окружении большая часть ваших знаний была основана на вашем личном опыте или же услышана напрямую от члена племени, который видел это. То есть между вами и фактом был максимум один слой избирательного сообщения. Сегодня, при помощи интернета, вы можете увидеть сообщения, которые проходят через шесть и более рук по пути к вам - шесть последовательных фильтров. По сравнению с нашими предками, мы живём в большем мире, в котором происходит больше событий, информации о которых к нам доходит меньше, поэтому эффект избирательности куда сильнее, что создает большие искажения доступности.

В реальной жизни, едва ли вы встречались с Биллом Гейтсом. Однако благодаря избирательным сообщениям от СМИ, у вас может появиться искушение сравнивать ваш жизненный успех с его - и страдать, соответственно, от полученного результата. Объективная частота встречи таких людей как Билл Гейтс - 0.00000000015, но слышите вы о нем куда чаще. И наоборот, 19% планеты живёт менее чем на один доллар в день, но я сомневаюсь, что хотя бы одна пятая тех постов, что вы сегодня читали, пишут о них.

Использование доступности, похоже, отвечает и за искажение абсурдности; события, которые никогда не происходили, нельзя вспомнить, вследствие чего их вероятность наступления начинает считаться нулевой. Если давно не было наводнений (а вероятности все еще считаются правильно), люди отказываются покупать страховку от наводнения, даже когда стоит она не больше, чем должна, а выплаты по ней немалые. Кунрейтер и соавторы в своём исследовании3 предполагают, что недооценка угрозы наводнения может происходить от «неспособности людей осмыслить концепцию наводнений, которых никогда не было…люди на затапливаемых равнинах, похоже, являются узниками своего опыта…недавно пережившие наводнение имеют тенденцию привязываться к верхней границе потерь, которую потом считают величиной, о которой и следует задумываться».

В исследовании Бёртона и соавторов4 говорится, что когда строятся дамбы и плотины, они уменьшают частоту наводнений, и, видимо, создают ложное ощущение безопасности, приводя к снижению мер безопасности, в то время как постройка дамб уменьшает частоту наводнений, но увеличивает ущерб от тех, что все же могут произойти (4). Мудрый человек экстраполировал бы из памяти о небольших угрозах возможность больши́х. Но вместо этого, прошлый опыт небольших угроз, похоже, устанавливает верхнюю «границу» риска. Общество, хорошо защищённое от малых угроз, не предпринимает действий против больши́х, расселяясь на затапливаемых равнинах как только риск небольших наводнений уходит. Общество рассматривает регулярные небольшие угрозы так, словно таких угроз большего размера не существует, предпринимая меры безопасности против регулярных небольших наводнений, но не против редких крупных наводнений.

Память не всегда хороший проводник даже для вычисления вероятностей прошедших событий, не говоря уже о будущих.

  • 1. Lichtenstein, S., Slovic, P., Fischhoff, B., Layman, M. and Combs, B. 1978. Judged Frequency of Lethal Events. Journal of Experimental Psychology: Human Learning and Memory, 4(6), November: 551-78.
  • 2. Combs, B. and Slovic, P. 1979. Causes of death: Biased newspaper coverage and biased judgments. Journalism Quarterly, 56: 837-843.
  • 3. Kunreuther, H., Hogarth, R. and Meszaros, J. 1993. Insurer ambiguity and market failure. Journal of Risk and Uncertainty, 7: 71-87.
  • 4. Burton, I., Kates, R. and White, G. 1978. Environment as Hazard. New York: Oxford University Press.
Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
5
Оцените качество перевода: 
Средняя оценка: 5 (25 votes)

Обременительные детали

Элиезер Юдковский

Простая подтверждающая подробность, чтобы добавить художественной правдоподобности в противном случае сухому и неубедительному рассказу…

— Пу-Ба, из оперы «Микадо»1

Конъюнктивное заблуждение это когда люди оценивают вероятность P(A, B) выше вероятности P(B), несмотря на то, что доказано P(A, B) ≤ P(B). Например, в ходе эксперимента в 1981, 68% испытуемых эксперимента оценили «Рейган увеличит поддержку незамужних матерей и снизит поддержку местных администраций» выше, чем «Рейган увеличит поддержку незамужних матерей».

Длинная серия ловко разработанных экспериментов, отделивших альтернативные гипотезы и прибивших стандартную интерпретацию, показали, что конъюнктивное заблуждение возникает, потому что мы «подменяем суждением репрезентативности суждение о вероятности». Добавляя дополнительные детали, можно сделать итоги более характерными для процесса их производящего. Слова о том, что Рейган увеличит поддержку для незамужних матерей, будут звучать убедительней, если добавить утверждение о том, что Рейган снизит поддержку местных администраций. Неправдоподобность одного утверждения компенсируется правдоподобностью другого; они усредняются.

Поэтому и говорят: добавив деталей, можно сделать сценарий звучащим более правдоподобно, несмотря на то что события, в совокупности, станут менее вероятными.

Если это так, то мы можем легко найти футуристов, бессовестно распространяющих правдоподобные и детализированные сценарии будущего, или людей, легко принимающих огромные порции неподтвержденных утверждений, сдобренных несколькими звучащими сильно добавками. Если вы сталкиваетесь с конъюнктивным заблуждением лоб в лоб, вы, возможно, преуспеете в преодолении этой конкретной проблемы, постоянно поправляя себя. Но это лишь вре́менное решение.

В эксперименте 1982 года профессиональные прогнозисты назначали систематически более высокие вероятности утверждению «Россия вторгнется в Польшу, и дипломатические отношения между СССР и США временно прекратятся», чем «Дипломатические отношения между СССР и США временно прекратятся»2. В этом эксперименте каждую группу прогнозистов просили оценивать только одно утверждение. Какой стратегии эти прогнозисты, как группа, могли следовать, дабы исключить влияние конъюнктивного заблуждения, если никто не знал про альтернативное утверждение? Если никто не знал, что эксперимент и был про конъюнктивное заблуждение? Как они могли улучшить их суждения о вероятностях?

Вре́менные решения не помогут. Лечить нужно не симптомы, а болезнь.

Что прогнозисты могли предпринять во избежание конъюнктивного заблуждения, не видя с чем сравнивать, не зная даже о том, что тестироваться будет именно конъюнктивное заблуждение? Мне кажется, что им следовало заметить «и». С этим надо быть поосторожней, да не просто так, а бежать от него. Даже без знания, что исследователи специально тестировали их на конъюнктивное заблуждение. Им придется замечать соединение деталей, быть шокированными наглостью просьб оценить вероятности таких безумно сложных предсказаний. Им придется штрафовать вероятность существенно - как минимум в четыре раза, в соответствии с деталями эксперимента.

Размышления о возможных причинах приостановки дипломатических отношений между США и Советским Союзом так же помогли бы прогнозистам. «США и Советский Союз приостановили дипломатические отношения без причины» не являлся сценарием, им был «США и Советский Союз приостановили дипломатические отношения по любой причине».

Что насчет субъектов, оценивавших «Рейган увеличит поддержку незамужних матерей и снизит поддержку местных администраций»? Опять же, они должны быть шокированы союзом «и». Более того, им нужно сложить силу утверждений (логарифм вероятности со знаком минус), а не взять среднее. Им следует думать: «Рейган может снизить поддержку местных администраций, а может и не снизить (1 бит), но увеличение поддержки незамужних матерей кажется маловероятным (4 бита). Итоговая сила утверждения: 5 бит»3. Или: «Рейган не поддержит незамужних матерей. Один промах и он вне игры. Другое предположение только ухудшает дело».

По аналогии, давайте рассмотрим шестигранную игральную кость с четырьмя зелеными гранями и двумя красными. Испытуемым давали на выбор три серии исходов — 1 [КЗККК], 2 [ЗКЗККК] или 3 [ЗККККК] — и просили поставить на ту из них, которая с их точки зрения встретится в серии из двадцати бросков4. Шестьдесят пять процентов испытуемых выбрали [ЗКЗККК], вероятность получения которой меньше, чем вероятность получения [КЗККК], так как любая серия, содержащая [ЗКЗККК] включает и [КЗККК]. Как испытуемые могли преуспеть больше? Заметив вкрапление? Возможно; но это лишь лечение симптома, оно не решит фундаментальной проблемы. Вычисляя вероятности? Это определенно решило бы фундаментальную проблему, но мы не всегда можем вычислить точную вероятность.

Испытуемые проиграли эвристически, думая: «Ага! Цепочка 2 имеет наибольшую пропорцию зеленых и красных! Я должен ставить на нее!» Чтобы выиграть эвристически, им следовало думать: «Ага! Цепочка 1 короче. Я должен ставить на нее!».

Бритва Оккама должна вызывать у них сильные эмоции - каждая деталь должна ощущаться как бремя, даже один поворот кости.

Однажды, я беседовал кое с кем, очарованным одним неосмотрительным футуристом (тем, который добавляет множество изящно звучащих деталей). Я пытался объяснить почему я не был так же очарован этими потрясающими, невероятными теориями. Так что я рассказал про конъюнктивное заблуждение, конкретно про эксперимент «приостановленные отношения ± вторжение в Польшу». И он сказал: «Ладно, но как это связано с -», и я ответил: «Более вероятно, что вселенная копируется по любой причине, чем что она копируется посредством черных дыр, которые создаются продвинутыми цивилизациями, созданных в результате эволюции этой вселенной для этой конкретной цели». И он сказал «Ох».

До этого он не ощущал дополнительные детали, как бремя. Вместо этого они были подтверждающими деталями, добавляющими художественной правдоподобности рассказу. Кто-то подает вам группу странных идей, одна из них - вселенная копируется. Далее, он предоставляет поддержку утверждению о копировании. Но это не поддержка группы, несмотря на то, что рассказывается, как одна история.

Вам следует распутывать детали. Следует рассматривать их отдельно и вопрошать: «Откуда мы знаем эту деталь?». Кто-то набрасывает картину падения человечества в нанотехнологическое столкновение, где Китай отказывается подчиняться международному соглашению о контроле, за этим следует гонка вооружений… Подождите-ка… Откуда вы знаете, что это будет Китай? Это хрустальный шар в вашем кармане или вы просто рады быть футуристом? Откуда взялись все эти детали? Откуда взялась эта конкретная деталь?

Ибо сказано:

Если можешь облегчить бремя своё, сделай это.
Нет такой соломинки, что бессильна сломать твой хребет.

  • 1. https://en.wikipedia.org/wiki/The_Mikado
  • 2. Tversky and Kahneman, «Extensional Versus Intuitive Reasoning.»
  • 3. Здесь «сила утверждения» — его двоичный логарифм со знаком минус; чем она больше, тем менее вероятно утверждение. В примере вероятности утверждений должны быть 1/2 и 1/16 соответственно, вероятность всего утверждения — 1/32. — Прим. перев.
  • 4. Amos Tversky and Daniel Kahneman, «Judgments of and by Representativeness,» in Judgment Under Uncertainty: Heuristics and Biases, ed. Daniel Kahneman, Paul Slovic, and Amos Tversky (New York: Cambridge University Press, 1982), 84–98.
Перевод: 
Muyyd
Номер в книге "Рациональность: от ИИ до зомби": 
6
Оцените качество перевода: 
Средняя оценка: 4 (38 votes)

Ошибка планирования

Элиезер Юдковский

Международный Аэропорт Денвера открылся на 16 месяцев позже срока и с превышением бюджета на 2 млрд \$1.

Еврофайтер Тайфун, совместный оборонный проект нескольких европейских стран, был завершён с отставанием в 54 месяца, итоговая стоимость составила 19 млрд \$ вместо изначальных 7 млрд \$.

Сиднейский Оперный Театр, возможно, самый легендарный по превышению начальной стоимости проект. Изначально, оценка предполагала завершение в 1967 за 7 млн \$, но в итоге был завершен в 1973 за 102 млн \$2.

Неужели эти отдельные катастрофы привлекли наше внимание благодаря селективной доступности? Неужели они являются симптомами бюрократического или правительственного провала? Да, очень может быть. Но так же тут играет роль соответствующее когнитивное искажение, повторенное экспериментально с отдельными планирующими индивидуумами.

Бюлер и др. просили студентов оценить сроки сдачи своих академических проектов3. Конкретно они просили сказать, когда проекты будут сданы с 50%, 75%, 99% вероятностью. Попробуйте догадаться сколько студентов закончили до или после оцененного в 50%, 75%, 99% вероятности срока сдачи?

• 13% испытуемых уложились в срок, оцененный с 50% вероятностью успеха.

• 19% уложились в срок, оцененный в 75% вероятности успеха.

• и лишь 45% (менее половины!) уложились в срок, оцененный в 99% вероятности успеха.

Как Бюлер и др. отметили: «Результаты оценки 99% вероятности особенно удивляют: даже если их просили сделать крайне осторожное предсказание, по отношению к которому они чувствовали бы сильную уверенность, самоуверенность студентов намного превзошла их реальные достижения4.

В целом, этот феномен известен как «ошибка планирования». Ошибка планирования - это когда люди думают, что могут планировать, ха, ха.

Ньюби-Кларк и др. нашли ключ к скрытой подоплеке алгоритма планирования. Обнаружили, что

• Просьба спрогнозировать сценарии на лучшей реалистичной догадке

и

• Просьба спрогнозировать сценарии на самом удачном стечении обстоятельств…

… Привели к неразличимым результатам5.

Когда людей просили предоставить «реалистичный» сценарий, они воображали, что все пойдет как запланировано, без неожиданных задержек или непредвиденных катастроф - такой же сценарий, как и при самом удачном стечении обстоятельств.

Как оказалось, реальность преподносит обстоятельства хуже, чем «самое неудачное стечение обстоятельств», какое мы обычно воображаем.

В отличие от большинства когнитивных искажений, для борьбы с ошибкой планирования есть хорошая эвристика. Она не сработает для масштабного бардака вроде Международного Аэропорта Денвера, но пойдет для личного планирования или организации чего-то небольшого масштаба. Просто используйте «наружное наблюдение» вместо «взгляда изнутри».

У людей есть склонность генерировать предсказания, думая о конкретных, уникальных деталях задания, первыми приходящих на ум. И создавать сценарии того, как они будут выполнять задание - это мы, обычно, и называем планированием. Когда вы желаете, чтобы что-то было сделано, вам необходимо спланировать где, когда, и как; подумать сколько времени и ресурсов это потребует; визуализировать все шаги от начала до успешного завершения. Все это - «взгляд изнутри», и он не принимает в расчет неожиданные задержки и непредвиденные катастрофы. Как мы уже увидели, просьба визуализировать «худший сценарий» явно недостаточно сильно гасит оптимизм - они воображают недостаточно Мёрфично.

Взгляд снаружи - когда вы специально избегаете мыслей о конкретных, уникальных деталях проекта, и просто вопрошаете, сколько времени заняло завершение похожего проекта в прошлом. Это кажется контринтуитивным, ведь взгляд изнутри позволяет заметить больше деталей. Мысль об аккуратно сотканном предсказании, в котором была учтена вся доступная информация, выдающем лучшие результаты, искушает.

Но эксперименты показали: чем подробней испытуемые визуализировали, тем оптимистичнее (менее точными) они становились. Бюлер и др. просили испытуемых описать исключительно подробно их планы по шоппингу на Рождество: где, когда и как6. В среднем, эта группа ожидала покончить с покупками менее чем за неделю до Рождества. Другую группу просто попросили сказать, за какой срок до Рождества они планируют купить все необходимые рождественские подарки, и средний ответ был: за четыре дня. Обе группы закончили в реальности за три дня до Рождества в среднем.

Точно так же, Бюлер и др. сообщили об исследовании, в котором японские студенты ожидали закончить их сочинения за десять дней до срока сдачи. Закончили же они за один день до срока. Когда их спрашивали о прошлых сочинениях, выяснилось, что они так же были закончены «за день до срока». Такова сила взгляда снаружи против взгляда изнутри.

Похожее исследование свидетельствует, что опытные посторонние, знающие меньше деталей конкретного задания, но имеющие в памяти выполнение похожих, менее оптимистичны и более точны, чем те, кто проводит планирование.

Похоже, есть относительно надежный способ исправить ошибку планирования, если вам предстоит делать что-то похожее на то, что вы делали ранее. Просто задайтесь вопросом о том, сколько такие проекты длились в прошлом, игнорируя детали. Еще лучше: посоветуйтесь с опытным аутсайдером о том, сколько времени заняло выполнение похожих проектов в прошлом.

Вы получите ответ, который будет звучать отвратительно долгим, который, очевидно, был дан без учета всех особых причин по которым ваше конкретное задание будет выполнено быстрей. Но ответ остается правдой. Смиритесь.

  • 1. Я видел так же предположения о 3,1 млрд \$
  • 2. Roger Buehler, Dale Griffin, and Michael Ross, “Inside the Planning Fallacy: The Causes and Consequences of Optimistic Time Predictions,” in Gilovich, Griffin, and Kahneman, Heuristics and Biases, 250–270.
  • 3. Roger Buehler, Dale Griffin, and Michael Ross, “It’s About Time: Optimistic Predictions in Work and Love,” European Review of Social Psychology 6, no. 1 (1995): 1–32.
  • 4. Roger Buehler, Dale Griffin, and Michael Ross, “Inside the Planning Fallacy: The Causes and Consequences of Optimistic Time Predictions,” in Heuristics and Biases: The Psychology of Intuitive Judgment, ed. Thomas Gilovich, Dale Griffin, and Daniel Kahneman (New York: Cambridge University Press, 2002), 250–270.
  • 5. Ian R. Newby-Clark et al., “People Focus on Optimistic Scenarios and Disregard Pessimistic Scenarios While Predicting Task Completion Times,” Journal of Experimental Psychology: Applied 6, no. 3 (2000): 171–182.
  • 6. Buehler, Griffin, and Ross, “Inside the Planning Fallacy.” https://www.lesswrong.com/posts/CPm5LTwHrvBJCa9h5/planning-fallacy#cite….
Перевод: 
Muyyd
Номер в книге "Рациональность: от ИИ до зомби": 
7
Оцените качество перевода: 
Средняя оценка: 4.8 (32 votes)

Иллюзия прозрачности: почему вас не понимают

Элиезер Юдковский

Существует когнитивное искажение «знание задним числом». Оно проявляется так: люди, знающие, чем закончилась ситуация, верят, что исход можно было легко предсказать заранее. Когда мы знаем результат, мы переосмысливаем ситуацию с учетом этого результата. Даже если мы знаем об этом искажении, мы не можем воспринимать ситуацию так, как её воспринимает человек, который не знает того, что знаем мы.

С этим тесно связана иллюзия прозрачности: мы всегда знаем, что означают наши слова, и ожидаем, что остальные тоже это знают. Мы правильно понимаем смысл, читая написанное нами, обладая знаниями о том, что мы действительно имели в виду. Этим смыслом сложно поделиться с кем-то, кто будет руководствоваться лишь словами.

Джун порекомендовала ресторан Марку; Марк обедает там и обнаруживает, что там (а) посредственные еда и сервис или (б) вкусная еда и безупречный сервис. Затем Марк оставляет сообщение на автоответчик Джун: «Джун, я только что пообедал в ресторане, который ты мне порекомендовала, и я должен сказать, что это было изумительно, просто изумительно». Кейсар рассказал сценарий (а) группе людей, и 59% решило, что сообщение Марка было саркастическим и что Джун распознает сарказм.(1)

Среди тех, кому рассказали сценарий (б), только 3% решили, что Джун должна подумать о сообщении Марка как о саркастическом. Кейсар и Барр, по видимому, указывают, что испытуемые слышали голосовое сообщение. Кейсар показал, что если испытуемым сказали, что ресторан ужасен, но что Марк хотел скрыть свою реакцию, то они верили, что Джун не распознает сарказм в подобном сообщении.

Они предсказывали, что Джун должна распознать сарказм, когда Марк пытался скрыть негативную реакцию, так же легко, как когда он искренне хвалил ресторан. Так что они восприняли сообщение Марка прозрачным. Как будто они ожидали, что Джун поймет всё, что Марк захочет ей сказать.

«The goose hangs high» («Дело на мази») - старая английская идиома, которая не используется в современном языке. Кейсар и Блай сказали группе испытуемых, что «the goose hangs high» означает, что будущее выглядит многообещающим; другой группе сказали, что она означает, что будущее кажется мрачным. Затем испытуемых спросили, какое значение из этих двух кажется более подходящим для идиомы. Каждая группа решила, что именно услышанный ими смысл будет восприниматься как значение идиомы.

(Также тестировались другие идиомы: “come the uncle over someone”, “to go by the board” и “to lay out in lavender”. Ах, английский, прелестный язык).

Кейсар и Хенли тестировали калибровку ораторов. Будут ли они недооценивать, переоценивать, или оценивать верно, как часто слушатели понимают их? (6). Ораторам были предоставлены неоднозначные выражения («Мужчина преследует женщину на велосипеде») и снимающие неоднозначность изображения (мужчина бежит за женщиной, которая едет на велосипеде). Ораторов попросили произнести выражения перед аудиторией и оценить, как много слушателей поняли вложенный смысл. Ораторы думали, что были поняты в 72% случаев, тогда как настоящая цифра - 61%. Когда слушатели не понимали, ораторы оценивали понимание в 46%. Когда слушатели понимали, ораторы оценивали непонимание в 12%.

Другие субъекты, подслушавшие объяснение, показали отсутствие таких ошибок: они оценивали понимание в 56%.

Как заметили Кейсар и Барр, за два дня до атаки Германии на Польшу, Чемберлен послал письмо, вложив туда намерение показать, что Британия вступит в бой, если вторжение состоится (7). Письмо, составленное из дипломатичных выражений, было воспринято Гитлером как примирительное - и танки поехали.

Так что не стоит винить тех, кто не понял твои очевидные слова, в разговоре или письменно. Есть шанс, что твои слова более туманны, чем кажутся.

  1. Boaz Keysar, “The Illusory Transparency of Intention: Linguistic Perspective Taking in Text,” Cognitive Psychology 26 (2 1994): 165–208, doi:10.1006/cogp.1994.1006.
  2. Keysar and Barr, “Self-Anchoring in Conversation.”
  3. Boaz Keysar, “Language Users as Problem Solvers: Just What Ambiguity Problem Do They Solve?,” in Social and Cognitive Approaches to Interpersonal Communication, ed. Susan R. Fussell and Roger J. Kreuz (Mahwah, NJ: Lawrence Erlbaum Associates, 1998), 175–200.
  4. Keysar and Barr, “Self-Anchoring in Conversation.”
  5. Boaz Keysar and Bridget Bly, “Intuitions of the Transparency of Idioms: Can One Keep a Secret by Spilling the Beans?,” Journal of Memory and Language 34 (1 1995): 89–109,
    doi:10.1006/jmla.1995.1005.
  6. Boaz Keysar and Anne S. Henly, “Speakers’ Overestimation of Their Effectiveness,” Psychological Science 13 (3 2002): 207–212, doi:10.1111/1467-9280.00439.
  7. Keysar and Barr, “Self-Anchoring in Conversation.”
Перевод: 
Kroid, Muyyd
Номер в книге "Рациональность: от ИИ до зомби": 
8
Оцените качество перевода: 
Средняя оценка: 4.3 (23 votes)

Ожидая короткие понятийные расстояния

Элиезер Юдковский

Эволюция приспособила homo sapiens к жизни в маленьких (не более 200 человек) племенах охотников и собирателей, не знающих письменности. В этих условиях — в так называемой «среде эволюционной адаптации» — всё накопленное знание сохранялось в памяти и передавалось устно.

В таком мире все фундаментальные знания — всеобщи. Любая информация, которую нельзя назвать строго приватной, является публичной, и из этого правила нет исключений.

В среде эволюционной адаптации было очень маловероятным оказаться от кого-то на расстоянии, большем чем один понятийный шаг, одно логическое умозаключение. Когда ты обнаруживал новый оазис, тебе не надо было рассказывать своим соплеменникам, что такое оазис, или почему стоит пить воду, или как перемещать ноги для того, чтобы ходить. Где находится оазис, знаешь только ты; это знание приватно. Но у всех остальных уже есть предпосылки для того, чтобы понять описание оазиса, все уже владеют понятиями, необходимыми, чтобы думать о воде; это знание универсально. В тех редких случаях, когда какие-то объяснения были необходимы, тебе почти никогда не нужно было разъяснять свои понятия. В самом худшем случае, нужно было рассказать об одном новом понятии, но не о двух (или больше) одновременно.

В среде эволюционной адаптации не было абстрактных дисциплин, сжимавших огромные кучи свидетельств в элегантные теории, описанные в книгах, выводы которых на десятки понятий и сотни умозаключений удалены от всеобщего информационного фундамента.

В среде эволюционной адаптации лишь лгуны или идиоты пытаются рассказывать о вещах, обоснование которых не очевидно. У их слушателей вряд ли возникнет мысль о том, что, возможно, этот парень располагает какой-либо достоверной фундаментальной информацией, неизвестной никому в твоём окружении. Невозможность такого положения дел была надёжной неизменной характеристикой среды эволюционной адаптации.

И наоборот, если ты сказал что-то вопиюще очевидное, а твой собеседник с этим не согласился, то он либо идиот, либо намеренно упирается с целью позлить тебя.

И к тому же, если кто-то рассказывает о какой-то вещи, обоснование которой не очевидно, а затем ждёт от тебя понимания и поддержки, — и возмущается, не найдя их — то он явно безумен.

И я думаю, что этот эффект (вкупе с иллюзией прозрачности и самоякорением(English)) объясняет многие аспекты тех легендарных затруднений, с которыми сталкиваются учёные, пытающиеся общаться с обывателями (или даже просто с учёными из других областей науки). Я часто вижу следующую картину: объяснение не удаётся. Популяризатор науки делает один шаг назад, хотя правильным было бы сделать два, или даже больше шагов назад. Слушатель же, в свою очередь, считает, что всё должно стать понятным через один шаг, хотя на самом деле для этого необходимо больше шагов. Обе стороны ведут себя так, словно понятийное расстояние между ними очень мало; будто бы всеобщие знания очень близки к любому новому знанию.

Биолог, говоря с физиком, может обосновать теорию эволюции, сказав, что она — «простейшее объяснение». Но легендарная история науки не впиталась в души большинства остальных людей; они не видят этих столетий, от Ньютона до Эйнштейна, подаривших фразе «простейшее объяснение» весь её потрясающий смысл, превративших её в Слово Силы, что произносится при рождении теорий и высекается на их надгробных камнях. Для не-учёного фраза «но это — простейшее объяснение!» звучит, как любопытный, но вряд ли решающий аргумент; простота не выглядит могущественным инструментом для постижения офисных интриг или для починки автомобиля. Должно быть, биолог слишком ослеплён любовью к своим идеям для того, чтобы непредвзято взглянуть на альтернативные объяснения, которые звучат настолько же убедительно (они звучат убедительно для меня, поэтому они должны звучать убедительно для любого человека из моего окружения).

Биолог может понять, что впервые теория эволюции звучит странновато. Однако, если кто-то отвергает эволюцию даже после того, как биолог рассказал, что это наиболее простое объяснение и пояснил, почему… Ну, видимо, не-учёные просто глупы, и нет смысла с ними разговаривать.

Хорошее выступление должно проложить понятийный путь, начинающийся от позиций, которые аудитория уже знает или принимает. Если ты задашь недостаточную глубину рекурсии, то в итоге ты будешь просто разговаривать сам с собой.

Каждое новое заявление должно очевидным образом опираться на аргументы, сказанные тобой ранее и принятые аудиторией. Как только эта цепочка нарушается, аудитория начинает считать тебя жертвой секты.

То же самое произойдёт, если ты позволишь себе опираться на аргумент более сильно, чем готовы разрешить слушатели. Например, если ты посчитаешь фразу «эволюция — простейшее объяснение» решающим аргументом (таким она и является), а не любопытным, чуточку забавным нюансом (так она выглядит в глазах человека, не привыкшего чтить Бритву Оккама).

И не давай слушателям намёков на то, что ты считаешь их отставшими от тебя на дюжину понятийных шагов, или то, что ты думаешь, что располагаешь какими-то особыми неизвестными им фундаментальными знаниями. Слушатели не знают о том, что эволюционная психология предсказывает существование дефекта мышления, ведущего к недооценке понятийных расстояний. Они не думают, что у пробок на дороге общения есть какая-то особенная причина. Поэтому их просто будет раздражать твоя снисходительность.

И если ты считаешь, что можешь кратко объяснить понятие «систематической недооценки понятийных расстояний», быстренько бросив пару слов, то вынужден тебя огорчить…

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
9
Оцените качество перевода: 
Средняя оценка: 3.7 (86 votes)

Линза, видящая свои изъяны

Элиезер Юдковский

Свет покидает Солнце, падает на шнурки и отражается от них; часть фотонов проходит сквозь зрачок и попадает на сетчатку; энергия фотонов запускает волну нервных импульсов; нервные импульсы доходят до зрительной коры, где на основе оптической информации строится трёхмерная модель, распознанная как развязанные шнурки; и теперь ты убеждён в том, что твои шнурки и в самом деле развязаны.

Вот секрет осознанной рациональности: в этом процессе передачи сцепленности нет ничего магического, и его можно понять. Ты можешь понять, как ты видишь свои шнурки. Ты можешь думать о том, какие когнитивные процессы создают убеждения, отражающие реальность, и какие когнитивные процессы — нет.

Мыши могут видеть, но они не могут понять зрения. Ты можешь понять зрение, и поэтому ты способен на вещи, которые мышам и не снились. Подивись этому несколько секунд, ведь это действительно чудо.

Мыши видят, но они не знают, что у них есть зрительная кора, и поэтому они не могут систематически бороться с оптическими иллюзиями. Мышь живёт в ментальном мире, где есть кошки, дыры, сыр и мышеловки, — но нет мышиных мозгов. Их камеры не могут сфотографировать линзы собственного объектива. Но люди могут посмотреть на причудливую картину и осознать, что часть того, что они видят, является линзами их объектива. Ты не обязан всегда верить своим глазам, но ты обязан понимать, что у тебя есть глаза — у тебя должны быть отдельные участки памяти для карты и для местности, для чувств и реальности. Если ты считаешь этот навык тривиальным, вспомни, насколько он редок в царстве животных.

Вся идея Науки — это, в сущности, поиск наиболее надёжного способа отразить в зеркале разума содержимое целого мира. Мыши никогда не смогли бы изобрести такую идею. Размышляя о всех вопросах вроде «мы проводим повторяемые эксперименты, чтобы фальсифицировать теорию», мы можем разобраться, почему именно наука работает. Наука — это не отдельный магистерий, далёкий от реальной жизни и непонятный для простых смертных. Нельзя сказать, что науку можно применять только в лабораториях. Наука — это постижимый и объективно существующий процесс, который связывает содержимое мозга с реальностью.

Наука довольно логична, если как следует о ней подумать. Но мыши не могут думать о мышлении, и поэтому у них нет науки. Не проглядите заключённого в этом чуда, не упустите потенциальной мощи, которую нам дарит этот факт. Нам — в смысле «личностям», а не «научным сообществам».

Нужно признать, что задача понять мыслительный механизм может быть сложнее задачи понять часовой механизм — но между этими задачами нет фундаментальных различий.

Однажды я спросил посетителей канала #philosophy: «Верите ли вы в то, что ядерная война случится в течение ближайших 20 лет? Если нет, то почему?». Один человек сказал: «Я не думаю, что в ближайшие 100 лет начнётся ядерная война: все игроки, участвующие в принятии подобных решений, сейчас в ней не заинтересованны». Я спросил: «Но почему ты считаешь, что ситуация сохранится в течение 100 лет?». «Просто надежда», ответил он.

Если поразмыслить об этом мыслительном процессе, то можно увидеть, что перспектива ядерной войны пугает этого человека, и поэтому его мозг отвергает соответствующее убеждение. Но если представить себе миллиард миров — ответвления Эверетта или дупликаты Тегмарка(English) — то станет ясно, что такие размышления не создают корреляции между оптимистами и мирами без ядерной войны, как должно было бы быть, если бы они были бы рациональными.

(В этот момент у кого-то может появится соблазн сказать «Но если у меня есть надежда, я буду работать лучше, заработаю больше денег, тем самым помогу мировой экономике, и в результате страны будет не так просто столкнуть в пучину злобы, бедности и отчаяния, когда возможность ядерной войны всерьёз угрожает будущему. Получается, что надежда имеет отношение к реальности». Раз уж дошло до такого, мне придётся вытащить теорему Байеса и количественно измерить силу этого свидетельства. Оптимизм не может иметь столь огромный эффект на мире; его недостаточно для того, чтобы сместить вероятность ядерной войны на 20%, или насколько там оптимизм смещает степень убеждённости. Сильно изменять свои убеждения из-за события, несущего очень малый заряд сцепленности — практика, не способствующая точному картографированию.)

Задуматься о том, какие убеждения сделают тебя счастливым — посмотреть внутрь, а не наружу. Ответ может сказать что-то новое о твоей психике, но это не свидетельство, сцепленное с окружением. Я не имею ничего против счастья, но счастье должно порождаться картиной мира, а не преступным использованием ментальных карандашей в целях сокрытия правды.

Если ты можешь это увидеть — если ты можешь заметить, что надежда слишком сильно влияет на твои размышления первого уровня; если ты можешь увидеть свой мозг как рисующий карты механизм, в котором есть недочёты — то ты можешь что-нибудь исправить. Мозг — дефектная линза, не совсем точно показывающая действительность. Это верно в отношении мозга как мыши, так и человека. Но мозг человека — это линза, могущая понять свои изъяны, могущая увидеть свои систематические ошибки, свои искажения, а после применить к ним исправления второго уровня. Этот факт делает дефектную линзу намного могущественней на практике. Делает её не совершенной, но намного более эффективной.

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
10
Оцените качество перевода: 
Средняя оценка: 3.5 (100 votes)

Ложные убеждения

В цепочке «Ложные убеждения» показана дискуссия об ожиданиях, которые расходятся с декларированными убеждениями.

Материалы цепочки распространяются по лицензии CC BY-NC-SA 3.0

Автор: 
Элиезер Юдковский

Убеждения должны окупаться

Элиезер Юдковский

Начало одной древней притчи звучит так:

Если дерево падает в лесу, и нет никого рядом, чтобы это услышать — создаёт ли дерево звук? Кто-то говорит «да, оно порождает колебания воздуха». Другой говорит «нет, никакой мозг не производит обработку слуховой информации».

Представим, что после того, как дерево упало, эти двое вместе входят в лес. Будет ли первый ожидать увидеть дерево, упавшее влево, а второй — дерево, упавшее вправо? Представим, что перед падением дерева двое оставили рядом с ним включённый диктофон; а после — воспроизводят его запись. Будет ли кто-либо из них ждать не тех звуков, что другой? Представим, что они присоединили электроэнцефалограф к каждому мозгу на планете — планирует ли кто-нибудь увидеть график, который не рассчитывал увидеть второй? Несмотря на то, что эти люди спорят, один говорит «нет», а другой «да», ожидаемые ими переживания не отличаются. Спорщики считают, что у них разные модели мира, но в этих моделях нет никаких различий по отношению к тому, какие будущие наблюдения им предстоят.

Соблазнительно попытаться уничтожить этот класс ошибок с помощью запрета всех убеждений, не являющихся ожиданиями какого-либо чувственного опыта. Но в мире есть многое, что не ощущается напрямую. Мы не видим атомов, из которых состоит кирпич, но эти атомы действительно существуют. Под твоими ногами пол, но ты не ощущаешь его напрямую, ты видишь отражённый от него свет (или, точнее, ты видишь результат обработки этого света сетчаткой и зрительной корой). Сделать вывод о существовании пола на основе его зрительного наблюдения — значит подумать о незримых причинах, стоящих за ощущениями. Этот шаг выглядит очень незначительным и очевидным, но это всё же шаг.

Ты стоишь на вершине небоскрёба, рядом с тикающими старинными часами, имеющими часовую, минутную и секундную стрелки. В твоей руке шар для боулинга, и ты сбрасываешь его с крыши. На какой по счёту щелчок стрелок ты ожидаешь услышать грохот шара, упавшего на землю?

Чтобы точно ответить на этот вопрос, тебе нужно использовать убеждения вроде «гравитация Земли равна 9,8 м/с^2» и «высота этого здания равна 120 метрам». Эти убеждения нельзя назвать бессловесными ожиданиями чувственного опыта; они довольно словесные, пропозициональные. Можно, не сильно погрешив против истины, описать эти убеждения как предложения, составленные из слов. Но эти убеждения имеют выводимое последствие, которое является прямым чувственным ожиданием — если секундная стрелка часов стоит на числе 12, когда ты бросил шар, то ты ожидаешь увидеть её на числе 1, когда ты услышишь грохот пять секунд спустя. Для того, чтобы ожидать чувственный опыт настолько точно, насколько это возможно, необходимо обрабатывать убеждения, не являющиеся ожиданиями чувственного опыта.

Великая сила Homo Sapiens состоит в том, что мы, лучше чем любой другой вид на планете, можем научиться моделировать невидимое. И в этом же состоит одна из наших величайших слабостей. У людей нередко встречаются убеждения о вещах, которые не просто незримы, но и нереальны.

Тот же самый мозг, что может логически вывести и построить сеть причин, лежащую за чувственным опытом, может построить и сеть причин, не соединённую ни с каким чувственным опытом (или очень плохо соединённую). Алхимики были убеждены в том, что флогистон вызывает огонь — очень упрощённо, это можно представить, как узел с надписью «флогистон», от которого тянется стрелка к чувственному опыту тёплого костра — но это убеждение не производило предсказаний на будущее; связь между флогистоном и наблюдениями всегда корректировалась после наблюдений, вместо того, чтобы как-нибудь ограничить наблюдения заранее. Или, скажем, учитель литературы говорит тебе, что знаменитый писатель Валки Вилкинсен — «пост-утопист». Что изменилось в твоих ожиданиях по поводу его книг в свете этой новой информации? Ничего. Это убеждение — если вообще можно называть это убеждением — вообще никак не связано с чувственным опытом. Но, тем не менее, тебе лучше запомнить о связи между Валки Вилкинсеном и атрибутом «пост-утопист»: тогда ты сможешь извергнуть это обратно на будущем экзамене. Если тебе сообщат, что «пост-утописты» показывают «охлаждение колониальных чувств», то ситуация совершенно аналогична: если автор письменного теста спросит, показывал ли Вилкинсен охлаждение колониальных чувств, то стоит ответить утвердительно. Убеждения связаны друг с другом, хоть и не связаны ни с каким ожидаемым опытом.

Люди могут построить целые сети убеждений, соединённые только друг с другом — будем называть это явление «плавающими» убеждениями. Это уникальный человеческий изъян, не имеющий аналогов у остальных животных, извращение способности Homo Sapiens строить абстрактные и гибкие сети убеждений.

Одна из добродетелей рационализма — эмпиризм — состоит в привычке постоянно задаваться вопросом о том, какой опыт предсказывается этим убеждением — или, ещё лучше, какой запрещается. Ты убеждён, что флогистон — причина огня? Тогда что ты ожидаешь увидеть, исходя из этого? Ты считаешь Валки Вилкинсена пост-утопистом? Тогда что ты рассчитываешь встретить в его книгах? Нет, не «охлаждение колониальных чувств»; какое переживание случится с тобой? Веришь ли ты в то, что если дерево падает в лесу, и нет никого рядом, чтобы это услышать, то оно всё равно создаёт звук? Тогда какой опыт должен выпасть на твою долю?

Ещё лучше спросить о том, какой опыт тогда с тобой точно не случится. Ты веришь в то, что жизненная сила объясняет загадочную разницу между живым и неживым? Тогда какие происшествия это убеждение запрещает, какое событие совершенно точно опровергнет это убеждение? Ответ «никакое» говорит о том, что это убеждение не ограничивает возможные переживания. Оно позволяет случиться с тобой чему угодно. Оно плавает.

Споря по поводу вопроса, вроде бы связанного с фактами, всегда держи в уме различие ожиданий будущего, из-за которого происходит спор. Если найти это различие не удаётся, то, скорее всего, вы спорите о названиях ярлыков в сети убеждений — или, ещё хуже, о плавающих убеждениях: ракушках-прилипалах на сети убеждений. Если ты не представляешь, какой опыт следует из того, что Валки Вилкинсен принадлежит к пост-утопистам, то ты можешь спорить бесконечно (а ещё ты можешь опубликовать бесконечное количество статей в литературных журналах).

И самое главное: не спрашивай, во что верить, — спрашивай, чего ожидать. Каждый вопрос об убеждениях должен порождаться вопросом о предсказаниях, и именно этот вопрос о предсказаниях должен быть в центре внимания. Каждое смутное убеждение должно рождаться как смутное ожидание, а затем оплачивать жилплощадь прогнозами будущего. Если убеждение становится злостным неплательщиком — высели его.

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
11
Аудио: 

Убеждения должны окупаться

Аудиофайл: 
Чтец: 
Даниил Храмцов
Оцените качество перевода: 
Средняя оценка: 4.1 (77 votes)

Сказ о науке и политике

Элиезер Юдковский

Во времена Византийской империи светская жизнь оказалась разделена на два лагеря: Синий и Зелёный. Синие и Зелёные убивали друг друга на дуэлях, в драках «стенка на стенку», в засадах и погромах. Прокопий Кесарийский говорил о них: «Вражда к противникам возникает у них без причины и остаётся навеки; не уважаются ни родство, ни свойство, ни узы дружбы. Даже родные братья, приставшие один к одному из этих цветов, другой к другому, бывают в раздоре между собою». Эдвард Гиббон писал: «Поддержка одной из группировок стала необходимой для любого кандидата, будь он светским или духовным лицом».

Кто же были эти Синие и Зелёные? Всего лишь спортивные болельщики — сторонники синей и зелёной команд в гонках на колесницах.

А теперь представьте общество будущего, которому пришлось сбежать в сеть подземных туннелей и пещер и закрыть все входы. Мы не будем уточнять, бежали ли они от болезни, войны или от радиации. Первым подземным жителям удалось наладить производство еды, возобновление воздуха, найти воду, организовать освещение и выжить. Их потомки благоденствовали и даже стали строить города. О верхнем мире остались лишь легенды, написанные на клочках бумаги, и один из таких клочков описывал небо, бескрайний простор воздуха над полом без стен. Небо было лазурного цвета, и в нем летали странные объекты, напоминающие пучки белого хлопка. Значение слова «лазурный» вызывало противоречия, некоторые говорили, что оно обозначает синий цвет, а другие — зелёный.

В ранние дни подземного сообщества соперничество Синих и Зелёных доходило до открытого насилия, но теперь царит перемирие — мир, рождённый отвращением к бессмысленной вражде. Культурные обычаи изменились, существует многочисленный и преуспевающий средний класс, воспитанный в духе правового государства и непривычный к насилию. В школах преподаётся история: как долго длилась вражда между Синими и Зелёными, как много людей погибло, как мало в итоге изменилось. Граждане подготовлены к странной новой философии, гласящей, что люди — это люди, не важно, за Синих они или за Зелёных.

Сам конфликт не исчез. Общество всё ещё разделено на Синие и Зелёные области, в любом актуальном культурном или политическом вопросе выделяется «Синяя» и «Зелёная» позиции. Синие ратуют за налоги на личные доходы, Зелёные поддерживают налоги на продажи торговцев. Синие придерживаются более строгих законов о браке, в то время как Зелёные хотели бы упростить бракоразводный процесс. Синие пользуются поддержкой центральных городских районов, а периферийные фермеры и продавцы воды обычно оказываются в лагере Зелёных. Синие верят, что Земля — это огромная шарообразная скала в центре вселенной, а Зелёные считают, что Земля — это огромная плоская скала, вращающаяся вокруг другого объекта, называемого Солнцем. Отнюдь не каждый Синий или Зелёный гражданин принимает «Синюю» или «Зелёную» позицию по любому вопросу, но довольно тяжело найти городского торговца, который считает, что небо было синим, и в то же время голосует за налоги на личные доходы и более свободные законы о браке.

Подземелье всё ещё поляризовано. Царит хрупкий мир. Есть некоторое число людей, искренне считающих, что Синие и Зелёные должны быть друзьями. Обычное дело, когда Зелёный покровительствует Синему магазину или Синий любит посещать Зелёную таверну. Из перемирия, изначально рождённого усталостью, медленно растёт дух терпимости и даже дружбы.

Однажды в Подземелье произошло небольшое землетрясение. Группа из шести туристов почувствовала содрогание земли, находясь на прогулке среди руин древнего поселения, где-то в верхних пещерах. Один из туристов упал и поранил колено, и группа решила повернуть назад, опасаясь новых землетрясений. На обратном пути один из них заметил странное дуновение воздуха, какой-то запах, исходящий из давно заброшенного туннеля. Не обращая внимания на предостережения спутников, этот человек одолжил лампу и направился к туннелю. Каменный коридор шёл выше… и выше… и наконец закончился дырой, выходящей из этого мира. Каменные стены закончились. Пространство, бесконечное пространство простиралось в никуда, здесь хватило бы места для тысячи городов. Невообразимо далеко наверху и слишком ярко, чтобы смотреть не щурясь, жгучий огонёк лучился светом, освещающим всё вокруг, как ничем не прикрытая нить накаливания какой-то гигантской лампы. В воздухе, ничем не поддерживаемые, висели непостижимые пучки белого хлопка. И цвет бескрайнего сияющего потолка был…

На этом месте история разветвляется, в зависимости от того, кто именно из туристов решил последовать по коридору к поверхности.

Адитья Синяя стояла под синей бесконечностью и медленно улыбалась. Улыбка не была радостной. В ней была ненависть и раненная гордость. Она припоминала каждый свой аргумент в спорах с Зелёными, каждое соперничество, каждую вырванную победу. «Ты всё время была права», — шепнуло ей небо, — «и теперь ты можешь это доказать». Какое-то мгновенье Адитья стояла, впитывая послание, упиваясь им, а затем она повернулась и ушла в коридор, неся его миру. Шаг, ещё шаг… её пальцы сжались в кулак. «Перемирие закончено», — сказала она.

Бэррон Зелёный бессмысленно глазел на хаос цветов долгие секунды. А потом запоздавшее понимание взорвалось в его животе, как удар молота. Слёзы потекли из его глаз. Бэррон думал о Катэйской Резне, когда армия Синих вырезала всё население городка Зелёных, включая детей. Он думал о древнем Синем генерале — Аннасе Релле, который объявил Зелёных «чумной ямой, язвой, нуждающейся в прижигании». Он думал об огоньках ненависти, которые он замечал в глазах Синих, и что-то внутри него треснуло. «Как ты можешь быть на их стороне?!» – закричал он небу и начал рыдать. Стоя под злобным синим свечением, он знал, что вселенная всегда была обителью зла.

Чарльз Синий ошеломлённо созерцал синий потолок. Как профессор смешанного колледжа он всегда аккуратно подчёркивал, что Синяя и Зелёная точки зрения в равной степени верны и заслуживают терпимого отношения, небо — это метафизическая сущность, а «лазурный» — цвет, который может восприниматься по-разному. На мгновенье Чарльз задумался, не увидит ли какой-нибудь Зелёный, встав на его место, зелёный потолок, или не будет ли потолок зелёным завтра, но он не стал бы делать выживание цивилизации ставкой в этом споре. Это был всего лишь природный феномен, не имеющий никакого отношения к морали или к обществу… Но феномен, который наверняка поймут неправильно, как опасался Чарльз. Он вздохнул и повернулся к коридору. Завтра он придёт сюда один и закроет проход.

Дарья, когда-то Зелёная, пыталась дышать посреди обломков своего мира. «Я не зажмурюсь» — сказала она себе. — «Я не отвернусь». Всю свою жизнь она была Зелёной, а теперь она должна стать Синей. Её друзья, её семья… все они отвернутся от неё. Говори правду, даже если твой голос дрожит, когда-то говорил ей отец. Но сейчас отец был мёртв, а мать никогда не сможет понять. Дарья смотрела в спокойный синий глаз неба, пытаясь принять его, и наконец её дыхание успокоилось. «Я ошибалась», — скорбно сказала она себе. В конце концов, не так уж это и сложно. Она найдёт новых друзей, и, возможно, семья сможет простить её… А может, они даже отважатся сами встать под этим небом и пройти этот экзамен, подумала она с надеждой. «Небо синее», — произнесла Дарья в качестве эксперимента, и ничего ужасного с ней не произошло, правда, у неё не получилось заставить себя улыбнуться. Дарья Синяя печально выдохнула и пошла обратно в свой мир, думая о том, что она скажет.

Эддин Зелёный посмотрел в синее небо и цинично рассмеялся. Наконец-то он понял учебник мировой истории, правда, ему всё равно не верилось, что они были такими дураками. «Глупцы», — произнёс Эддин, — «глупцы, глупцы, всё это время оно было здесь». Ненависть, убийства, войны, и всё это время оно было просто явлением, о котором кто-то когда-то написал на бумаге, как обычно пишут о любом другом явлении. Никакой поэзии, никакой красоты, ничего такого, о чём любой здравомыслящий человек станет беспокоиться. Просто одно бессмысленное слово, влияние которого распространилось за любые разумные границы. Эддин устало прислонился к стене пещеры, пытаясь придумать, как не дать миру взорваться от этого открытия, и задаваясь вопросом, а не заслуживают ли все они именно этого.

Феррис невольно открыл рот, он замер на месте в абсолютном изумлении и восхищении. Его глаза жадно метались туда-сюда, с неохотой покидая одно зрелище, чтобы впиться взглядом в другое. Синее небо, белые облака, бескрайняя неизвестность снаружи, полная мест и предметов, а, возможно, и людей, которых никогда не видели в Подземелье. «О, так вот какой это цвет», — сказал Феррис и отправился исследовать.

Дополнение от ex-Parrot

Лоретта Зелёная посмотрела на небо и сказала: «Оно синее. Следовательно, это не небо. Несмотря на безграничность, несмотря на открытость и несмотря на эти штуки, похожие на клочки белого хлопка. Вообще, после того, как я задумалась, они не кажутся так уж сильно похожими на хлопок» .

Джон Экуменист сказал: «Как я всегда и говорил. Оно лазурное!»

Перевод: 
xeye
Номер в книге "Рациональность: от ИИ до зомби": 
12
Аудио: 

Сказ о науке и политике

Аудиофайл: 
Чтец: 
Даниил Храмцов
Оцените качество перевода: 
Средняя оценка: 4.3 (52 votes)

Вера в убеждения

Элиезер Юдковский

Карл Саган как-то рассказал притчу(English) о человеке (для удобства дадим ему имя Кредерус), который пришёл к нему и заявил: «В моём гараже живёт дракон». Потрясающе! В течение столетий по всему миру гуляли легенды о драконах, но до сих пор ни у кого нет никаких убедительных свидетельств их существования. Конечно же, любой человек ответит: «Я хочу посмотреть на настоящего дракона, где этот гараж?». Но гость вынужден нас огорчить: дракон невидим.

Далее Саган замечает, что невидимость не делает гипотезу о драконе нефальсифицируемой. Можно войти в гараж и услышать громкое дыхание из пустоты, увидеть неожиданно возникающие следы на земле, а потом при помощи инструментов обнаружить, что что-то в гараже поглощает кислород и выделяет углекислый газ.

Поэтому стоит ответить: «Ничего страшного, я попробую услышать его дыхание». Но Кредерус отвечает, что дракон совершенно бесшумен. — А что, если я измерю содержание углекислоты в воздухе? — Нет, дракон не дышит. — Можно распылить в воздухе муку, тогда она налипнет на дракона, и его контур можно будет увидеть. — Дракон проницаем для муки.

Мораль этой басни в том, что плохая гипотеза должна ловко маневрировать, чтобы избежать опровержения. Но я рассказываю эту историю не для того же, что и Карл Саган. Я хочу проиллюстрировать другую идею.

Где-то в недрах разума Кредеруса явно хранится правильная модель ситуации, поскольку он заранее ожидает определённых результатов всех этих проверок (а именно — таких результатов, которые ему придётся оправдывать).

Некоторые философы запутываются в подобных сценариях, не понимая, верит ли Кредерус в дракона, или всё-таки нет. Можно подумать, что в человеческом мозге мало места, и храниться может только одно убеждение за раз! Реальный разум намного сложнее. Как я уже говорил, убеждения бывают разными, не все можно назвать «прямыми ожиданиями чувственного опыта». Кредерус явно не ожидает увидеть в гараже ничего необычного, иначе он не оправдывался бы заранее. Также возможно, что в его фонде словесных убеждений хранится «В моём гараже живёт дракон». Рационалисту может показаться, что эти два убеждения должны конфликтовать друг с другом, даже несмотря на то, что они разных видов. Но, тем не менее, если написать «небо зелёное» на фотографии синего неба, то бумага и не подумает исчезать в языках пламени.

Добродетель эмпиризма должна не позволить нам совершать подобные ошибки. Рационалисты должны постоянно выяснять, какие переживания предсказывают их убеждения — требовать, чтобы убеждения окупались. Но проблема Кредеруса лежит глубже, и её не исцелить этим простым советом. Довольно просто соединить убеждение в драконе с ожидаемым наблюдением гаража: если ты веришь в живущего в гараже дракона, то ты, открыв дверь, рассчитываешь увидеть этого дракона. Если ты не видишь дракона, то это означает, что в гараже дракон не живёт. Действия довольно просты. Ты даже можешь попытаться повторить это со своим гаражом.

Но нет, эта невидимость — симптом чего-то похуже.

Возможно, ты помнишь тот момент из детства, когда ты уже начал сомневаться в существовании деда Мороза, но ещё считал правильным верить в деда Мороза, и поэтому пытался отвергнуть сомнения. Дэниел Деннет заметил: когда трудно верить в X, намного легче верить в то, что ты обязан верить в X. Как можно верить в то, что Первичное Космическое Небо одновременно совершенно синее, и совершенно зелёное? Эта фраза вводит в замешательство; непонятно, что это означает в смысле ожидаемых переживаний, непонятно, во что именно ты бы верил, если бы верил. Намного проще поверить в то, что правильно, хорошо, добродетельно и полезно верить в то, что Первичное Космическое Небо одновременно полностью зелёное и полностью синее. Деннет называет это «верой в убеждение» (того же термина буду придерживаться и я).

Ну и затем, раз мы имеем дело с человеческим разумом, всё как обычно усложняется. Думаю, что даже Деннет слишком сильно упростил то, как эта психологическая уловка работает на практике. К примеру, если человек верит в убеждение, то он не может признаться себе в том, что он просто верит в убеждение: ведь добродетельно верить, а не верить в убеждение, следовательно если ты веришь в убеждение, а не просто веришь, то ты не добродетелен. Никто не скажет (даже про себя): «Я не считаю, что Первичное Космическое Небо одновременно синее и зелёное, но я считаю, что мне следует так считать», разве что этот человек необычайно хорошо умеет признавать свои недостатки. Люди не верят в веру в убеждения, они просто верят в убеждения.

(Если вы находите предыдущий абзац сложным для понимания, попробуйте поизучать математическую логику, которая учит остро различать такие вещи, как утверждение P, доказательство P и доказательство того, что P доказуемо. Такие же коренные различия есть и между P, желанием P, верой в P, желанием верить в P и верой в то, что ты веришь в P.)

Вера в убеждения бывает разной. Она может быть явной: человек осознанно повторяет про себя «Добродетельно верить в то, что Первичное Космическое Небо одновременно совершенно синее, и совершенно зелёное» (и при этом считает, что он в это верит, разве что этот человек необычайно хорошо умеет признавать свои недостатки). Бывают и менее бросающиеся в глаза формы. Возможно, Кредерус боится публичного осмеяния, которое, как он считает, неизбежно последует, если он публично признает, что был неправ (хотя, фактически, любой рационалист искренне порадуется за него, а остальные будут скорее высмеивать Кредеруса, если он, отнюдь, продолжит заявлять о драконе, живущем в гараже). Возможно, Кредеруса передёргивает от перспективы признаться себе в том, что дракона нет (точно также, как его передёргивало бы от физической боли): это противоречит его представлению о себе как о победителе-первооткрывателе, увидевшем в своём гараже то, что упустили все остальные.

Будь все наши мысли теми осознанными предложениями на естественном языке, которыми обычно манипулируют философы, человеческий мозг был бы намного проще для понимания. Быстро утекающие мысленные образы, невысказанные вспышки боли, исполняемые без сознательного ведома желания — всё это составляет такую же часть личности, как и слова.

Несмотря на то, что я не соглашаюсь с Деннетом касательно некоторых деталей и тонкостей, я всё равно считаю, что введённое им понятие вера в убеждение — ключ к понимаю Кредеруса. Однако, необходимо более широко трактовать понятие «убеждения», не ограничивать его вербальными утверждениями. «Убеждение» может включать в себя неявные регуляторы ожиданий. «Вера в убеждение» может содержать неявные ориентиры когнитивного поведения. С точки зрения психологии, утверждение «Кредерус не убеждён в том, что в его гараже живёт дракон; но он убеждён в том, что полезно быть убеждённым в существовании дракона в гараже» в лучшем случае нереалистично. Но вполне допустимо сказать, что Кредерус рассчитывает на отсутствие дракона, и оправдывается, словно он убеждён в наличии дракона.

Человек может каждый день использовать заурядную мысленную картину своего гаража (без драконов), всегда правильно предсказывающую его ощущения после открытия двери, но ни разу в жизни не произнести про себя предложение «В моём гараже драконов нет». Это почти наверняка случалось и с тобой: открывая дверь гаража, или спальни, или чего-нибудь ещё, и ожидая не увидеть драконов, на сознательном уровне ты думаешь о чём угодно, но не о драконах.

И для того, чтобы продолжать стоять на своём и верить в дракона — или чтобы продолжать уклоняться от мысли изменения представления о себе как о верящем в дракона — совсем необязательно думать: «Я хочу верить в дракона, живущего в моём гараже». Достаточно лишь нежелания перспективы признания в ложности заявленных убеждений.

Для того, чтобы правильно готовить оправдания для будущих экспериментальных результатов, Кредерус должен, во-первых, хранить где-то в разуме правильную модель ситуации, контролирующую его ожидания, и, во-вторых, действовать и мыслить таким образом, чтобы защитить либо своё свободно плавающее убеждение о драконе, либо своё представление о себе, как о верящем в дракона.

Если Кредерус верил в убеждение о существовании дракона и вдобавок был убеждён в существовании дракона, то проблема была бы уже не так грозна. Кредерус желал бы рисковать, если речь идёт об экспериментальных предсказаниях, и, возможно, даже согласился бы отказаться от убеждения о существовании дракона, если бы его предсказания бы не сбылись (хотя, если Кредерус был бы не до конца уверен в существовании дракона, то его вера в убеждение могла бы помешать этому признанию). Однако, когда кто-то заранее оправдывается, это обычно требует расхождения убеждения и веры в убеждение.

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
13
Аудио: 

Вера в убеждения

Аудиофайл: 
Чтец: 
Даниил Храмцов
Оцените качество перевода: 
Средняя оценка: 4.4 (33 votes)

Байесианское дзюдо

Элиезер Юдковский

Вы можете получить массу удовольствия, общаясь с людьми, чьи ожидания будущего теряют связь с их же верой в убеждения.

Как-то на одном званом обеде я пытался объяснить человеку, чем я зарабатываю на жизнь; и он сказал: «Я не верю в возможность искусственного интеллекта, ведь лишь Бог может создать душу».

Я, должно быть, движимый божественным наитием, немедленно ответил:

— То есть, если я смогу создать искусственный интеллект, то это докажет ложность вашей религии?

— Что? — сказал он.

— Ну, если ваша религия предсказывает, что я неспособен создать искусственный интеллект, то факт создания мной искусственного интеллекта будет означать неправоту вашей религии. Либо ваша религия допускает возможность создания ИИ, либо его создание опровергнет вашу религию.

Повисла пауза — он осознал, что только что сделал свою гипотезу фальсифицируемой — и затем он ответил:

— Ну, я не имел ввиду, что вы не сможете создать интеллект. Я хотел сказать, что он не может испытывать эмоции таким же образом, что и мы.

— Итак, если я создам искусственный интеллект, в который не будет заложено ничего навроде заранее написанного сценария, и моё творение начнёт говорить о чём-то, похожем на нашу духовную жизнь, то тогда ваша религия неверна.

— Ну, гм, видимо нам придётся остаться при своих мнениях на этот счёт. «Согласиться не соглашаться» — в таких случаях говорят англичане.

— На самом деле, так нельзя. Есть теорема из области рациональности — теорема Ауманна о согласии — которая говорит о том, что два рационалиста не могут согласиться не соглашаться. Если два человека не соглашаются друг с другом, то хотя бы один из них должен быть в чем-то неправ.

Мы коротко прошлись по этой теме. И, наконец, он сказал:

— Ну, кажется, на самом деле я пытался сказать вот что: я считаю, что вы не можете создать что-то вечное.

— Ну, я тоже так считаю!— ответил я. — Я рад, что мы смогли прийти к консенсусу по этому вопросу, как и требует теорема Ауманна о согласии.

Я протянул свою руку и он пожал ее, а потом побрёл дальше.

Женщина, которая стояла рядом и слушала наш разговор, серьёзно посмотрев на меня, сказала: «Это было прекрасно».

— Большое спасибо, — ответил я.

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
14
Аудио: 

Байесианское дзюдо

Аудиофайл: 
Чтец: 
Даниил Храмцов
Оцените качество перевода: 
Средняя оценка: 4.7 (19 votes)

Притворная мудрость

Элиезер Юдковский

Самое жаркое место в аду закреплено за теми, кто во время кризиса оставались нейтральными.
Данте Алигьери, эксперт по аду. Ой, то есть Джон Ф. Кеннеди, который приписывал цитаты кому попало.

Нейтральность и неторопливость с выводами - широко известный прием, который часто применяется в тех случаях, когда люди желают выставить себя взрослыми, мудрыми, непредвзятыми, или просто показать свое превосходство над другими.

Примером этого выступают мои родители, которые отвечали на теологические вопросы вроде «Почему в Древнем Египте, несмотря на обилие хороших записей о множестве разных событий, нет записей о том, что евреи хотя бы были там?» фразами: «Когда я был в твоем возрасте, я тоже задавал такие вопросы, но теперь я это перерос».

Другой пример – директор школы, который, представ перед двумя детьми, пойманными за дракой на игровой площадке, строго говорит: «Неважно кто начал драку, важно лишь кто ее закончил». Ну разумеется важно, кто начал драку. Директор, возможно, не имеет доступа к точной информации на этот счет, но если так, то ему стоит так и сказать, а не отрицать важность того, кто же ударил первым. Представим, что родитель ударил директора – как высоко оценит суд мудрость фразы «не важно кто начал драку» в этом случае? Но для взрослых детская драка – всего лишь неудобство, и для их удобства совершенно не важно, кто ее начал. Для их удобства важно только то, чтобы она закончилась и закончилась так быстро, как только можно.

Похожая динамика, по-моему, управляет международными дипломатическими случаями, когда Великие Силы строго говорят меньшим группам прекратить конфликты прямо сейчас. Великим Силам не важно кто начал: кто спровоцировал, кто непропорционально ответил на провокацию, ведь длящееся неудобство для Великих Сил - это только всего лишь функция длящегося конфликта. Блин, почему бы Израилю и Хамасу не найти наконец общий язык?

Это я называю «притворяться Мудрым». Разумеется, есть множество способов продемонстрировать мудрость. Но демонстрировать ее отказываясь делать догадки, отказываясь анализировать свидетельства, отказываясь выносить суждения, отказываясь принимать сторону, оставаясь в стороне, взирая высокомерно и снисходительно, т.е. демонстрировать мудрость ничего не говоря и не делая - ну, это я нахожу особенно претенциозным.

Паулу Фрейре сказал: «Умывать руки во время конфликта между сильным и бессильным – значит встать на сторону сильного, а не быть нейтральным.1 Игровая площадка на которой учителей не волнует кто начал конфликт представляет собой хорошее место для хулиганов, и отвратительное для их жертв. Это касается и международной политики: мир, где Великие Силы отказываются принимать сторону и лишь требуют немедленных договоренностей – удобный мир для агрессоров и ужасный для тех, на кого эта агрессия направлена. Но, разумеется, это очень удобный мир, если вы в нем Великая Сила или школьный директор.

Так что это поведение по крайней мере отчасти можно объяснить элементарным эгоизмом со стороны Мудрого.

Однако, в то же время, это еще и выражение превосходства. В конце концов, что подумают о директоре другие взрослые, если он встанет на чью-то сторону в обыкновенной детской драке? Ну как же, это ведь понизит статус директора до обычного участника столкновения!

То же самое касается любого уважаемого старшего – исполнительного директора, влиятельного академика, основателя форума – чья репутация непредвзятого человека основывается на том, что он практически никогда не выносит суждений сам, пока другие занимают стороны. Стороны обращаются к ним за поддержкой, но почти всегда впустую. Ведь Мудрых почитают как судей только при условии, что они почти никогда не выносят суждений – ведь в противном случае они были бы рядовыми участниками спора, ничем не лучше других.

(Как ни странно, судьи в судах могут себе позволить регулярно выносить реальные приговоры без автоматической потери своей репутации непредвзятых. Может потому, что все понимают, что они должны судить, ведь это их работа. Или потому, что судьям не приходится раз за разом разрешать вопросы, разделяющие на две части племя, от чьего уважения они зависят).

Существуют случаи, в которых рационально подождать с суждениями. Это, когда люди торопятся с выводами исключительно из-за своих искажений. Как сказал Майкл Руни: «Эту ошибку я неоднократно замечал у студентов, которые начинают изучать философию: столкнувшись с причинами стать скептиками, они вместо этого становятся релятивистами». Выходит, что в случаях, когда рационально не торопиться с выводами о чем-либо, слишком многие вместо этого приходят к решению, что все выводы одинаково приемлемы.

Как мы можем избежать связанной с предыдущей, но отдельной ошибки –псевдорационального поведения, заключающегося в демонстрации вашей неискаженной непредвзятости путем необоснованного утверждения, что текущий баланс свидетельств нейтрален? «Ох, ну, разумеется, есть немало убежденных дарвинистов, но я думаю, что свидетельства не позволяют нам сделать окончательный вывод о превосходстве естественного отбора над разумным творением».

Тут я предлагаю вспомнить, что нейтральность это точное суждение. Это совсем не то же самое, что оставаться вне и над. Это выражение ясной и конкретной позиции о том, что баланс свидетельств в конкретном деле допускает только одну трактовку - нейтральную. Это суждение тоже может оказаться неверным. Вывод о нейтральности может обсуждаться так же, как и вывод о правоте любой из сторон.

Точно так же дело обстоит и с политическими вопросами. Если какие-то люди утверждают, что и у пролайф («движения в защиту жизни») и у прочойс («движения в защиту репродуктивного выбора») позиции есть разумные идеи, и им определенно стоит стремиться к компромиссу и уважению, то они не занимают позицию вне дискуссии. Они выносят конкретное суждение, настолько же конкретное как и суждения «пролайф правы» или «прочойс правы».

Кстати говоря… этот текст не является приглашением к дискуссии об абортах или Палестино-Израильском конфликте в комментариях. Этот сайт - не для этих дискуссий, есть другие места чтобы обсуждать эти полностью заслуживающие обсуждения темы. Может быть потом, когда LessWrong станет достаточно большим… но сейчас не время.

Но дело не в том, что рационалисты слишком зрелые, чтобы говорить о политике. Дело не в том, что рационалисты выше этой глупой потасовки, до участия в которой унижаются только обычные сторонники политических партий и юные энтузиасты.

Робин Хэнсон отмечает, что способность участвовать в горячих спорах - ограниченный ресурс. Если вам удастся найти, где применить те же силы с большим результатом, то с вашей стороны разумно тратить силы на обсуждения, от которых может быть больше пользы, чем на те, в которых множество участников тратит много сил.
Но в таком случае ваши приоритеты – это следствие вашей ограниченности в ресурсах. Это не значит, что вы мудро и спокойно парите над схватками, в которых решаете не участвовать.

Мой ответ Полу Грэму на Хакер Ньюс, похоже, стоит повторить здесь:

Есть разница между:

  • Принятием нейтрального суждения

  • Отказом вложить незначительные ресурсы.

  • Претензией на то, что любой из вариантов выше является признаком большой мудрости, зрелости и демонстрацией превосходства, с подтекстом, что исходные стороны конфликта - это худшие точки зрения, которые не так уж сильно отличаются с высоты вашего полета.

  • 1. Paulo Freire, The Politics of Education: Culture, Power, and Liberation (Greenwood Publishing Group, 1985), 122.
Перевод: 
Muyyd, Remlin, Greenochre, Peter Tanatarov
Номер в книге "Рациональность: от ИИ до зомби": 
15
Аудио: 

Притворная мудрость

Аудиофайл: 
Чтец: 
Даниил Храмцов
Оцените качество перевода: 
Средняя оценка: 4.8 (20 votes)

Претензия религии на неопровергаемость

Элиезер Юдковский

Самое раннее известное мне упоминание научного эксперимента — это, как ни иронично, история об Илии и жрецах Ваала (English).

Народ Израиля колеблется между Иеговой и Ваалом, поэтому Илия объявляет, что проведёт эксперимент, чтобы решить эту проблему— какое новаторство по тем временам! Жрецы Ваала поместят своего быка на алтарь, а Илия поместит на алтарь быка Иеговы, но никому из них не будет позволено зажечь огонь; чей Бог истинный, тот и заставит огонь сойти на Его жертву. Жрецы Ваала служат для Илии контрольной группой — такое же древесное топливо, такой же бык и такие же жрецы, возносящие молитвы, но ложному богу. Затем Илия льёт воду на свой алтарь, разрушая симметрию эксперимента, но ведь это было так давно — тем самым он обозначает добровольное принятие бремени доказательства — эквивалент современного уровня значимости в 0,05. Огонь сходит на алтарь Илии, что является экспериментальным наблюдением. Народ Израиля, кричащий: «Господь есть Бог!» — экспертная оценка.

А потом они оттащили 450 жрецов Ваала к реке Кишон и перерезали им глотки. Это сурово, но необходимо. Надо жёстко отсечь опровергнутую гипотезу — и сделать это быстро, прежде чем она сможет найти предлог для самозащиты. Если бы жрецам Ваала сохранили жизнь, они бы начали болтать, что религия на самом деле — отдельный магистерий, недоступный ни подтверждению, ни опровержению.

В былые дни люди действительно верили в то, что говорила им их религия, а не просто считали религию важной. Библейские археологи, отправившиеся искать Ноев Ковчег, не считали, что впустую тратят своё время; они предполагали стать знаменитыми. И лишь после того, как не смогли найти подтверждающих свидетельств — а нашли опровергающие — только тогда эти святоши совершили то, что Уильям Бартли назвал возвращением к убеждению: «Я верю, ибо я верую».

В былые дни не существовало концепции религии как отдельного магистерия. Ветхий Завет — это свалка культурного потока сознания: история, право, притчи о морали, и, да, модели того, как работает Вселенная. Вы не найдёте ни в одной строчке Ветхого Завета трансцендентного восхищения сложностью Вселенной. Но вы найдёте множество вполне научных заявлений (English), вроде Вселенной, созданной за шесть дней (что является метафорой Большого Взрыва), или кроликов, жующих жвачку (что является метафорой…).

В былые дни заявление о том, что местную религию «невозможно подтвердить», привело бы вас на костёр. Одно из главных верований ортодоксального иудаизма заключается в том, что Бог появился на горе Синай и произнёс громовым голосом: «Ага, это всё правда». В байесианской перспективе это, чёрт возьми, весьма однозначное доказательство существования нечеловечески могущественной сущности. (Хотя и не того, что эта сущность, собственно, Бог, или что эта сущность добродетельна — это могли быть и подростки-инопланетяне.) Абсолютное большинство религий в истории человечества — не считая придуманных совсем недавно, — рассказывают истории о событиях, которые представляли бы собой совершенно безошибочное доказательство, если бы действительно случились. Независимость религии от фактических реалий — весьма недавняя и исключительно западная концепция. Люди, создававшие оригинальные писания, даже не знали о разнице между одним и другим.

Римская империя унаследовала древнегреческую философию, установила закон и порядок в своих провинциях, вела бюрократические записи и насаждала религиозную терпимость. Новый Завет, созданный уже во времена Римской империи, благодаря этому несёт на себе своеобразную печать модерна. Вы не можете придумать историю о том, как Бог полностью уничтожает город Рим (à la Содом и Гоморра), потому что римские историки ткнули бы вас в это носом, и вы не смогли бы просто закидать их камнями.

Но в былые дни люди, придумавшие истории Ветхого Завета, могли сочинять всё, чего бы им ни захотелось. Ранние египтологи были неподдельно шокированы тем, что не нашли абсолютно никаких следов еврейских племён, когда-либо бывавших в Египте — найти записи о Десяти казнях они и не мечтали, но они хоть что-нибудь обнаружить надеялись. Как оказалось, кое-что всё-таки нашли. Они обнаружили, что в предположительное время Исхода Египет правил большей частью Ханаана. Это гигантская историческая ошибка, но, поскольку библиотек не существует, вас некому ткнуть в неё носом.

А вот в Римской империи были библиотеки. Поэтому Новый Завет не заявлял о больших красочных широкомасштабных геополитических чудесах, что было привычным для Ветхого Завета. Вместо этого Новый Завет заявляет о меньших чудесах, которые, тем не менее, помещаются в те же самые доказательные рамки. Мальчик падает на землю, у него изо рта идёт пена; причина тому — нечистый дух; резонно ожидать, что нечистый дух убежит от истинного пророка, но не убежит от шарлатана; Иисус изгоняет нечистый дух; таким образом, Иисус — истинный пророк, а не шарлатан. Это совершенно обычное байесовское рассуждение, если принять в качестве базовой предпосылку, что эпилепсия вызывается демонами (и что прекращение эпилептического припадка доказывает, что демон сбежал).

Религия высказывала своё мнение не только в фактических и научных вопросах, религия высказывала своё мнение обо всём. Религия создала кодекс законов до возникновения законодательных органов; религия записывала историю до историков и археологов; религия устанавливала сексуальную мораль до женской эмансипации; религия расписывала формы государства до конституций; и религия отвечала на все научные вопросы: от биологической таксономии до формирования звёзд. Ветхий Завет не говорит о чувстве восхищения сложностью Вселенной — он слишком занят назначением смертной казни женщинам, носящим мужскую одежду, что, по тем временам, было вполне удовлетворительным содержанием религиозного текста. Современная концепция религии как чего-то строго морального порождена тем, что все остальные сферы были отняты у неё более компетентными институтами. Мораль — это всё, что осталось.

Или, скорее, люди думают, что мораль — это всё, что осталось. Возьмите свалку культуры, какой она была 2500 лет назад. Со временем человечество безмерно продвинется вперёд и части древней культурной свалки станут уже вопиюще устаревшими. Мораль не защищена от человеческого прогресса — например, сейчас мы весьма неодобрительно смотрим на такую одобренную Библией практику, как рабство. Почему люди думают, что такая мораль всё ещё допустима?

В действительности, нет ничего несущественного в этической проблеме убийства тысяч невинных перворождённых младенцев мужского пола, совершённого с целью убедить неизбранного фараона выпустить рабов, которые, если рассуждать логически, могли быть просто телепортированы из страны. Это должно быть более вопиющим, чем сравнительно тривиальная научная ошибка в заявлении, что у кузнечиков четыре ноги. Однако если вы заявите, что Земля плоская, на вас посмотрят, как на идиота. А вот если вы скажете, что Библия — источник вашей морали, ни одна женщина не даст вам пощёчины. Для большинства людей концепция рациональности определяется тем, что, по их мнению, может сойти им с рук; они думают, что одобрение библейской морали сойдёт им с рук; так что для того, чтобы закрыть глаза на моральные проблемы Библии, нужен лишь весьма терпимый уровень самообмана. Все согласились не замечать слона в посудной лавке, и такое состояние дел какое-то время может сохраняться.

Может быть, однажды человечество продвинется дальше, и каждый, кто предложит Библию в качестве источника морали, столкнётся с тем же отношением, с каким столкнулся Трент Лотт (Trent Lott), поддержавший президентскую кампанию Строма Термонда (Strom Thurmond). И тогда скажут, что истинной сутью религии всегда была генеалогия или ещё что-нибудь.

Идея, что религия — это отдельный магистерий, который нельзя ни доказать, ни опровергнуть, — это Большая Ложь, повторяющаяся снова и снова, так что люди говорят её не вдумываясь; но, критически рассмотренная, она оказывается попросту неверной.
Это — невероятное искажение того, как религия исторически зарождалась, как писания выражают свои верования, что говорят детям для того, чтобы убедить их, и того, во что до сих пор верит большинство религиозных людей на Земле. Нельзя не восхищаться беспредельной дерзостью этой лжи, стоящей на уровне с «Океания всегда воевала с Остазией». Прокурор показывает всем окровавленный топор, а обвиняемый, шокированный на мгновение, заявляет, поразмыслив: «Но вы не можете опровергнуть мою невиновность какими-то там доказательствами — это отдельный магистерий!»

А если это не сработает, возьмите листок бумаги и намалюйте себе карточку «Бесплатный выход из тюрьмы».

Перевод: 
Максим Расчупкин
Номер в книге "Рациональность: от ИИ до зомби": 
16
Оцените качество перевода: 
Средняя оценка: 4.9 (35 votes)

Провозглашения и крики одобрения

Элиезер Юдковский

Однажды я посетил конференцию по теме «совместимы ли религия и наука?». Одна женщина-язычник с жаром рассказывала о своих представлениях о сотворении Земли: гигантская первичная корова была рождена в первичной бездне, а затем создала первичного бога при помощи слюны и языка; потомки первичного бога убили корову и сотворили Землю из её плоти, и так далее. История была длинной, подробной и более абсурдной, чем модель мира, в которой Земля покоится на спине огромной черепахи. И эта женщина явно разбиралась в науке достаточно, чтобы это понимать.

Я до сих пор не могу подобрать слов, чтобы описать, как именно говорила эта женщина. Она говорила… гордо? С самодовольством? Осознанно щеголяя собой?

Казалось, что женщина рассказывала этот миф о сотворении целую вечность (на самом деле, вероятно, прошло не более пяти минут). Странное нечто, гордость/удовлетворение/выставление себя напоказ, явно имело какое-то отношение к её знанию того, что эти убеждения были возмутительны с научной точки зрения. И она не презирала науку: она выступала за то, что наука и религия совместимы. Она даже рассказала о том, что, если взглянуть на землю, в которой жили викинги, то нетрудно понять, почему они верили в первичную бездну (этим объяснением она свела свои верования к чему-то заурядному!), но при этом всё равно настаивала на своей вере в этот миф, говоря об этом с исключительным удовлетворением.

Я не думаю, что понятие «вера в убеждение» можно растянуть настолько, чтобы покрыть это событие. Слишком странной была эта речь. Она не повторяла легенду с фанатичной верой кого-то, кому нужно подбодрять себя. Она не надеялась убедить в чём-то аудиторию, и ей не нужна была наша поддержка для того, чтобы чувствовать себя полноценной.

Деннет, автор понятия «веры в убеждение», считает, что большую часть того, что мы называем «религиозными верованиями» (или «религиозными убеждениями») стоит изучать как «религиозные провозглашения». Представим, что пришелец-антрополог изучает группу современных студентов-филологов, все из которых, кажется, считают, что Валки Вилкинсен является пост-утопистом. В этом случае правильный вопрос звучит не как «почему все они разделяют это странное убеждение?», а как «почему все они пишут это странное предложение на письменном экзамене?». Даже если предложение совершенно бессмысленно, ты всё равно знаешь, когда следует его громко пропеть.

Я думаю, что всё же несколько чересчур считать, что религиозные верования заключаются лишь в громком повторении определённых фраз: большинство людей довольно честны, и после произнесения религиозных предложений вслух чувствуют себя обязанными повторить их мысленно, чтобы эта мысль прозвучала и в сознании.

Но даже понятие «религиозных утверждений» вряд ли покрывает рассказ язычницы о своей вере в первичную корову. Если кому-то нужно произнести религиозное убеждение вслух, чтобы понравиться священнику или собрату по вере — да что там, просто, чтобы подтвердить своё представление о себе как о верующем — ему стоит притвориться верящим намного убедительнее, чем притворялась эта женщина. Пересказывая легенду с нарочито подчёркнутой гордостью, она даже не пыталась быть убедительной, даже не пыталась заставить аудиторию поверить в то, что она воспринимала свою религию всерьёз. Кажется, именно это меня и ошеломило. Несколько известных мне людей верят в свою веру касательно совершенно абсурдных вещей; но когда они страстно рассказывают о предмете своей веры в убеждения, они намного сильнее стараются убедить себя в том, что воспринимают всё это всерьёз.

Наконец, я понял, что язычница не пыталась убедить в чём-то нас и не пыталась убедить в чём-то себя. Её пересказ легенды о сотворении вообще не имел отношения к сотворению мира. Пятиминутная обличительная речь была одобрительным возгласом, что-то вроде транспаранта на футбольном стадионе. Транспарант с надписью «ВПЕРЁД СИНИЕ» не утверждает ничего о фактах и не пытается быть убедительным. Это просто кричалка.

Та странная подчёркнутая гордость… язычница словно участвовала в гей-параде обнажённой (Замечу мимоходом: не имею ничего против участия в гей-параде в обнажённом виде. Лесбиянство не относится к числу вещей, которые могут быть уничтожены правдой). Это было не просто выражением одобрения, как участие в гей-параде, это было оскорбительно эпатажным выражением одобрения, как участие в гей-параде голышом. В этом проглядывало убеждение в том, что её не смогут раскритиковать или арестовать, ведь всё это сделано во имя прославления её сообщества.

Именно поэтому для неё столь большое значение имела смехотворная абсурдность её слов. Попытка звучать более разумно эквивалентна надеванию одежды.

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
17
Аудио: 

Провозглашения и крики ободрения

Аудиофайл: 
Чтец: 
Даниил Храмцов
Оцените качество перевода: 
Средняя оценка: 4.1 (17 votes)

Убеждение как одеяние

Элиезер Юдковский

Я уже разделил убеждения на контроллеры ожиданий, веру в убеждения, провозглашения и крики ободрения. Контроллеры ожиданий мы будем называть «полноценными убеждениями», остальные формы «неполноценными убеждениями». Полноценное убеждение может быть неверным или иррациональным (искреннее убеждение в том, что молитва исцелит больного ребёнка), но остальные формы иногда трудно вообще считать за убеждения.

Ещё один подвид неполноценных убеждений — убеждение как групповая идентификация, способ входить в сообщество. Робин Хансон использует великолепную метафору(English): люди, носящие необычную одежду в качестве своей униформы (например, риза священника или еврейская кипа), поэтому я буду называть это «убеждением как одеянием».

Зная человеческую психологию, можно сказать, что мусульмане, атаковавшие Всемирный торговый центр, без сомнения считали себя героями, защищающими истину, правосудие и Путь Ислама от ужасающих инопланетных чудовищ а-ля «День независимости». Нужно быть сильно не от мира сего — не иметь ни малейшего представления о том, как видят мир обычные люди — чтобы сказать это вслух в баре Алабамы. Американцы так не говорят. Американцы говорят, что террористы «ненавидят нашу свободу», а столкновение самолёта со зданием было «актом трусости». Нельзя говорить «героическое самопожертвование» и «террорист-смертник» в одном предложении, даже с целью правдиво показать, как видит мир Враг. Само понятие «отвага и альтруизм террориста» является одеянием Врага — поскольку об этом понятии говорит Враг. Понятие «трусость и социопатия террориста» является американским одеянием. Хочешь описать, как мир видит Враг, — забудь о кавычках; ты же не одеваешься на Хэллоуин фашистом, так?

Убеждение-как-одеяние может объяснить, почему люди могут придавать такой вес неполноценным убеждениям. Подозреваю, что вера в убеждения или религиозные провозглашения, сами по себе, с трудом порождают глубокие и мощные эмоциональные эффекты. Я не эксперт в этой области, но у меня сложилось следующее впечатление: люди, переставшие ожидать предсказанного религией будущего, пойдут на многое ради того, чтобы убедить себя в своей страстной вере, и эту отчаянность легко спутать с настоящим сильным чувством. Но всё же, это уже не тот огонь, который они носили в детстве.

С другой стороны, человеку очень легко искренне, пылко, на инстинктивном уровне принадлежать группе, болеть за любимую команду (Этот факт — фундамент надувательства под названием «Республиканцы против Демократов» и аналогичных лжедилемм в других странах, но это уже другой разговор). Идентификация с племенем — очень мощная эмоциональная сила, люди готовы за неё умереть. И после того, как человек стал членом племени, он начинает вкладывать в убеждения, которые играют роль племенной униформы, всю ту страсть, с которой он принадлежит этому племени.

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
18
Аудио: 

Убеждение как одеяние

Аудиофайл: 
Чтец: 
Даниил Храмцов
Оцените качество перевода: 
Средняя оценка: 4.7 (12 votes)

Табличка "Аплодисменты"

Элиезер Юдковский

Во время Сингулярного Саммита 2007, один из ораторов ратовал за создание демократичного мультинационального проекта по разработке Искусственного Интеллекта. Я подошел к микрофону и задал вопрос:

Предположим, группа демократических республик сформирует консорциум по разработке ИИ; в процессе будет много политизирования: некоторые группы будут иметь необычайно сильное влияние, другие будут отодвинуты на задний план, другими словами, результат будет напоминать другие продукты современной демократии. С другой стороны, группа независимых ботаников разработает ИИ у себя в подвале. Снабдит его инструкциями опросить всё население земного шара: даже раздать мобильники всем, кто их не имеет, и выполнить то, что будет утверждено подавляющим большинством голосов. Какой из вариантов более «демократичный» и с каким вы будете чувствовать себя более спокойно?

Я хотел узнать, верит ли он в прагматическую адекватность демократического политического процесса или он верит в моральную правильность голосования.

Но оратор ответил:

Первый сценарий выглядит как редакторская статья в журнале «Reason», а второй - как сюжет голливудского фильма.

Смутившись, я спросил:

Так какой демократический процесс вы имели в виду?

Оратор ответил:

Что-то вроде Проекта Человеческого Генома (это был интернационально финансируемый проект).

Я спросил:

Как разные группы будут разрешать свои разногласия в структуре вроде Проекта Человеческого Генома?

И оратор ответил:

Я не знаю.

Благодаря этому обмену репликами, я вспомнил цитату одного диктатора или кого-то еще, которого спрашивали о его намерениях двигать его карманное государство к демократии:

«Мы полагаем, что уже находимся в демократической системе. Некоторые факторы пока отсутствуют, вроде выражения воли народа».

Суть демократии в специфическом механизме разрешения политических конфликтов. Если все группы имеют одинаковые предпочтения, то в демократии не будет нужды - мы и так будем сотрудничать. Процесс разрешения может выражаться через голосование, или выбранного представителя, или даже через чувствительного к голосованию ИИ, но выражение должно быть хоть каким-нибудь. Какой смысл призывать к «демократическому» решению, если не подразумевается какой-то механизм разрешения конфликтов?

Думаю, слово «демократия» в данном контексте не относится к какому-то конкретному предложению или убеждению. Это скорее эквивалент светящейся таблички «Аплодисменты» в студии, которая загорается как сигнал к тому, что аудитория должна начать аплодировать.

Этот случай запомнился лишь потому, что я перепутал табличку «Аплодисменты» с политическим предложением, к моему стыду. В большинстве случаев таблички «Аплодисменты» более прямолинейны и могут быть выявлены простым реверсивным тестом. Например, кто-то скажет:

«Мы должны сбалансировать риски и возможности ИИ»

Если перевернуть это высказывание, мы получим:

Мы не должны соблюдать баланс рисков и возможностей ИИ.

Поскольку обратное звучит абсурдно, следовательно, неперевернутое утверждение, возможно, нормально, подразумевая, что это не несет новой информации. Есть множество хороших причин для утверждения, которое не является информативным вне контекста. «Нам нужно соблюдать баланс рисков и возможностей ИИ» может быть темой для обсуждения; может делать ударение на важности определенных планов для баланса; может критиковать планы, не соблюдающие баланс. Связывая другие утверждения, предложение может передать новую информацию ограниченному рационалисту - но сама по себе связь может быть неочевидной. Но без уточняющих положений, утверждение не более чем табличка «Аплодисменты!»

Порой мне хочется толкнуть речь, целиком состоящую из табличек «Аплодисменты», чтобы посмотреть, сколько времени пройдет, прежде чем аудитория начнет хохотать.

Я здесь, чтобы предложить взвесить риски и возможности продвинутого Искусственного Интеллекта. Нам следует избегать рисков и, если получится, реализовывать возможности. Нам не следует беспричинно подвергаться совершенно необязательным рискам. Для достижения этих целей нам следует планировать рационально и мудро.

Нам не следует действовать из страха и паники, или поддаваться технофобии; однако, не следует и действовать в слепом энтузиазме. Нам следует уважать интересы всех партий, принимающих участие в Сингулярности. Мы должны убедиться, что преимущества продвинутых технологий будут доступны для как можно большего числа индивидов, а не для нескольких. Мы должны, по мере сил наших, избегать конфликтов с применением этих технологий; и мы должны предотвратить попадание этих технологий в руки опасных индивидов. Нам следует думать над этими вопросами до, а не после, когда уже будет поздно что-либо предпринимать…

Перевод: 
Muyyd, Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
19
Аудио: 

Требование аплодисментов

Аудиофайл: 
Чтец: 
Даниил Храмцов
Оцените качество перевода: 
Средняя оценка: 5 (18 votes)

Замечая замешательство

Чтобы грамотно описать, что такое иррациональность, необходима теория, описывающая рациональность. Причём эта теория не должна состоять из расплывчатых трюизмов, которые ничего не объясняют точно. Цепочка «Замечая замешательство» раскрывает вопрос: почему полезно основывать поведение на «рациональных» ожиданиях и как это ощущается изнутри.

Автор: 
Элиезер Юдковский

Сфокусируй неуверенность

Элиезер Юдковский

Что случится с процентом по облигациям: он поднимется, опустится, или не изменится? Если ты работаешь экспертом в телепрограмме, где тебе нужно объяснить произошедшее постфактум, то тебе незачем волноваться. Какая бы из этих трёх возможностей ни реализовалась, ты всё равно сможешь объяснить, почему результат отлично вписывается в разработанную тобой теорию рынка. Нет смысла думать о том, что эти три возможности каким-то образом противоречат друг другу или несовместимы между собой, поскольку ты в любом случае на сто процентов выполнишь свою работу в качестве эксперта.

Хотя подожди. Представь, что ты только совсем недавно появился на телевидении и недостаточно опытен для того, чтобы придумывать правдоподобные объяснения на лету. Нужно заранее подготовить заметки для завтрашнего прямого эфира, а времени у тебя не так уж и много. Тогда было бы очень полезно знать, какой именно результат произойдёт на самом деле, — поднимется или опустится ли процент по облигациям — ведь тогда понадобится подготовить лишь один набор оправданий.

Увы, предвидеть будущее невозможно. Что ты собираешься делать? Ты определённо не будешь использовать «вероятности». Школа рассказала нам, что такое «вероятности»: так называются числа от нуля до единицы в тексте некоторых задач; сейчас же никто не сообщил тебе никаких чисел от нуля до единицы. Что ещё хуже, ты чувствуешь себя как-то неуверенно, а — если тебе не изменяет память — во время вычисления ответа на такие задачи у тебя никогда не было таких ощущений. Лекции по математике читаются в чистых и знакомых аудиториях — разве уместно применять математику не в стенах института, а в запутанных и непонятных жизненных ситуациях? Использовать какой-либо стиль мышления в непригодной для него обстановке — всегда плохая идея. Ясно, о «вероятностях» вспоминать не надо.

Тем не менее, у тебя есть всего лишь 100 минут для того, чтобы подготовить оправдания. Нельзя потратить все 100 минут, обдумывая сценарий «повышение», и ещё потратить все 100 минут, набрасывая реплики для сценария «понижение», и ещё потратить 100 минут на размышления о сценарии «неизменность».

Если какая-нибудь проверочная комиссия собирается исследовать твоё расходование времени, то лучше бы потратить равное количество времени на подготовку к каждому возможному исходу. Никто не сообщил тебе чисел от нуля до единицы, и поэтому у тебя на руках нет никакой документации, могущей обосновать неравные временные затраты. Ты легко можешь представить, что именно скажут тебе проверяющие: «И почему же вы работали над оправданием №3 ровно 42 минуты, мистер Финклдинджер? Почему не 41 или 43 минуты? Признайте свою необъективность! Вы отдаёте предпочтение своим субъективным любимчикам!»

Однако ты с облегчением вспоминаешь, что никакая проверочная комиссия и не собирается искать в твоих поступках повода для обвинений. Это замечательно, ведь завтра прозвучит важное объявление от Федерального Резерва Банка США, и кажется маловероятным, что цены на процент по облигациям не изменятся. У тебя нет ни малейшего желания тратить драгоценные 33 минуты на подготовку речи, которую ты не планируешь произносить.

В голове всплывают наброски объяснений: подробные рассказы о том, почему каждое событие правдоподобно вытекает из твоей теории рынка. Но почти сразу становится ясно, что сейчас правдоподобность не поможет: все исходы правдоподобны. Каждый сценарий вписывается в твою теорию рынка, но это не имеет никакого отношения к тому, как следует поделить время на подготовку. Между сотней минут и способностью вписывать события в теорию есть принципиальное отличие: первое — ограниченно, второе — нет.

И всё же… У тебя нет зацепок, но всё же ты, кажется, ожидаешь эти события с разной силой. Какие-то оправдания кажутся тебе более важными, какие-то — менее. И — восхитительная деталь — если представить что-то, делающее повышение процента более вероятным, то объяснения для сценариев понижения и неизменности кажутся уже менее нужными.

Кажется, что существует связь между тем, насколько ты ожидаешь увидеть каждый из исходов, и тем, как ты хочешь разделить время подготовки между их оправданиями. Разумеется, эту связь невозможно измерить. У тебя есть 100 минут на подготовку, но здесь и не пахнет сотней «единиц предвкушения», или чего-нибудь такого. (Хотя ты всё-таки понял, что твоя функция полезности растёт примерно как логарифм от времени, потраченного на подготовку оправдания того события, которое произойдёт на самом деле.)

Но всё же… В мысли о том, что ожидание конечно, — и конечное ожидание подобно конечному времени на подготовку объяснений, а не бесконечной способности объяснять — явно что-то есть. Возможно, имеет смысл думать об ожидании, как о каких-нибудь ресурсах: например, как о деньгах. После такого сравнения сразу же тянет подумать о том, где можно достать ещё ожидания, но это бессмысленно: сколько ожидания бы ты не раздобыл, времени на подготовку от этого не прибавится. Нет, задача решается по-другому: нужно попытаться использовать свои ограниченные запасы ожидания наилучшим образом.

Ни о чём подобном на лекциях по статистике не говорилось. Никто не рассказал, что делать, когда это чёртово ощущение неопределённости так сильно давит на мысли. Никто не рассказал, что делать, когда неизвестно никаких чисел от нуля до единицы. Хотя при чём тут это? Если уж использовать числа, то с равным успехом можно использовать любые числа: нет никаких зацепок, указывающих на то, какой раздел математики следует использовать, если здесь стоит использовать вообще хоть какой-нибудь раздел математики. Может быть, пригодятся пары чисел: число слева, число справа. Такой подход можно будет назвать «теорией Декстера-Синистера», поскольку именно так «правый» и «левый» звучат на латыни. Или что-нибудь ещё, какой-нибудь другой метод и иная аксиоматика. (Во всяком случае, число «100» — 100 минут на подготовку — точно должно где-то участвовать, это понятно)

Почему никто не открыл правил фокусировки неопределённости? Правил, позволяющих распределить ожидание таким образом, чтобы большинство ожидания попало в тот исход, который произойдёт на самом деле?

Но как будет называться это искусство? И как будут выглядеть эти правила?

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
20
Оцените качество перевода: 
Средняя оценка: 4.7 (18 votes)

Что такое свидетельство

Элиезер Юдковский

«Предложение „снег белый“ истинно тогда и только тогда, когда снег белый» — Альфред Тарский.

«Говорить, что сущее есть и не-сущее не есть, — значит говорить истинное» — Аристотель, «Метафизика 4».

Если две эти цитаты не выглядят удовлетворительным определением «истины» — прочтите это. Сегодня я расскажу о «свидетельствах» (причём речь будет идти об убеждениях-о-фактах, говорящих о том, каким является мир, а не об эмоциях или морали. О разнице между этими понятиями сказано здесь).

Человек идёт по улице, неожиданно его шнурки развязываются. Некоторое время спустя, по какой-то непонятной причине, он становится убеждён в том, что его шнурки развязаны. Свет покидает Солнце, ударяется о шнурки и отпрыгивает прочь; некоторые фотоны входят в зрачок и попадают на сетчатку; энергия фотонов запускает волну нервных импульсов; нервные импульсы доходят до зрительной коры, где на основе оптической информации строится трёхмерная модель, распознанная как развязанные шнурки. Происходит последовательность событий — цепочка из причин и следствий — начавшаяся во внешнем мире и закончившаяся внутри мозга, в конечном итоге которой человек приобретает имеющиеся у него убеждения. На выходе этого процесса — состояние разума, которое отражает состояние шнурков.

Что такое «свидетельство»? Это событие, сцепленное с интересующей тебя сущностью последовательностью из причин и следствий. Если, к примеру, объект исследования — твои шнурки, то входящий в зрачки свет есть свидетельство, сцепленное со шнурками. Замечу, что здесь я использую слово «сцепленность» не в том смысле, что принят в квантовой механике (entanglement, в русской литературе иногда встречается как «запутанность»); две вещи «сцеплены», если благодаря соединяющей их цепочке причин и следствий, их состояния становятся скореллированными.

Не каждое воздействие создаёт нужный для свидетельства вид сцепленности. Не очень впечатляюще построить машину, гудящую, если в неё ввести выигрышный лотерейный номер, если эта машина будет точно также гудеть и на все остальные лотерейные номера. Отражённый от ботинков свет не будет полезным свидетельством касательно шнурков, если фотоны были бы одними и теми же вне зависимости от того, завязаны ли шнурки.

Говоря более формально: событие называется свидетельством о сущности А, тогда и только тогда, когда это событие проявляется по-разному в зависимости от различных состояний сущности А (говоря на языке теории информации, взаимная информация события и сущности А должна быть больше нуля).

Сцепленность заразительна, если с ней правильно обращаться, и именно поэтому людям нужны и глаза, и мозг. Если фотоны отразятся от шнурков и затем столкнутся с камнем, то камень не сильно изменится. Камень не будет сцеплен со шнурками никаким полезным с практической точки зрения образом, его состояние будет одним и тем же вне зависимости от того, были ли завязаны шнурки. Именно поэтому камни не стоит приглашать в суд в качестве свидетелей. Фотоплёнка, напротив, будет сцеплена со шнурками через отражённые от обуви фотоны, и поэтому её можно предъявить как улику. Если твои глаза и мозг работают правильно, то ты сам становишься сцеплен со своими шнурками.

Именно поэтому рационалисты так бережно относятся к, на первый взгляд, парадоксальному утверждению: «убеждение стоит того, чтобы в него верить, лишь в том случае, когда тебя, в принципе, можно убедить в него не верить». Сетчатка, чьё состояние не меняется в зависимости от того, какой в неё входит свет, — сетчатка слепого. Некоторые системы убеждений, довольно очевидно пытаясь защитить себя, утверждают, что ряд убеждений ценен лишь в том случае, когда ты веришь в них безоговорочно: что бы ты ни видел, о чём бы ты ни думал — верь! Мозг должен оставаться в том же состоянии независимо от того, какая информация входит в его недра. Отсюда выражение «слепая вера». Если то, во что ты веришь, не зависит от того, что ты видишь, — ты слеп точно так же, как и человек с пустыми глазницами.

Если твои глаза и мозг работают правильно, то твои убеждения становятся сцепленными с фактами. Рациональное мышление порождает убеждения, сами по себе являющиеся свидетельствами.

Если твой язык говорит правду, то твои рациональные убеждения — которые есть свидетельства — могут быть свидетельствами в глазах кого-то ещё. Сцепленность передаётся по цепочке причин и следствий, а слова произнесённые есть причина, и слова услышанные есть следствие. Сказав «У меня развязались шнурки» по телефону, ты делишься сцепленностью с другом.

Поэтому среди честных людей, верящих в честность друг друга, рациональные убеждения будут заразительны. Именно поэтому выглядит столь подозрительным заявление о том, что твои убеждения не заразительны: заявление о том, что ты веришь, исходя из каких-то личных причин, не распространяющихся на остальных. Если твои убеждения сцеплены с реальностью, то они должны быть заразительны среди честных людей.

Если твоя модель реальности говорит о том, что результаты работы твоих когнитивных процессов не должны быть заразительны, то твоя модель реальности говорит о том, что твои убеждения не есть свидетельства, что твои убеждения не сцеплены с реальностью. В этом случае нужно что-то исправить, и отметить свои убеждения как «ложные».

Разумеется, если ты до конца осознаёшьощущаешьсмысл всего этого, то это означает, что ты уже отметил свои убеждения как «ложные». Потому что «убеждение не сцеплено с реальностью» означает «убеждение не истинно». В ту же секунду, когда ты перестал верить в то, что «предложение „снег белый“ истинно», ты автоматически перестал верить и в то, что снег белый, или на очень глубоком уровне сломалось что-то очень важное.

Поэтому объясни, почему используемый тобой тип мышления порождает убеждения, отражающие реальность. Объясни, почему ты считаешь себя рациональным. Объясни, почему, используя подобный твоему тип мышления, люди будут думать «снег белый» если, и только если, снег белый. Если ты не веришь в то, что результаты работы твоих когнитивных процессов сцеплены с реальностью, то почему ты доверяешь результатам работы своих когнитивных процессов? Ведь это должно быть одним и тем же!

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
21
Оцените качество перевода: 
Средняя оценка: 3.8 (52 votes)

Свидетельство: рациональное, правовое, научное

Элиезер Юдковский

Предположим, ваш добрый друг, комиссар полиции, говорит вам по строжайшему секрету, что криминальный главарь вашего города - Вилки Вилкинсен. Как рационалист, вы обязаны поверить этому заявлению? Попробуем так: если вы возьмете и оскорбите Вилки, я назову вас безрассудным. Так как благоразумно вести себя так, как если бы Вилки имел существенно большую-чем-по-умолчанию вероятность быть криминальным главарем, следовательно, заявление комиссара полиции должно быть сильным Байесовским свидетельством.

Наша судебная система не поместит Вилки под стражу на основе заявления комиссара полиции. Оно не рассматривается как правовое свидетельство. Возможно, если упекать за решетку всех обвиненных комиссарами полиции в том, что они возглавляют преступную организацию, то вы по-началу поймаете множество боссов, плюс, тех, кто не нравился комиссарам. Власть имеет свойство портить людей с временем, так что со временем вы будете ловить все меньше реальных боссов (которые будут применять более серьезные меры для обеспечения своей анонимности) и все больше невинных (несдержанная власть привлекает коррупцию, как мед привлекает мух).

Но это не значит, что заявление комиссара полиции не является рациональным свидетельством. Оно все еще обладает однозначными отношениями правдоподобия, и ты все еще будешь безрассудным, оскорбляя Вилки. Но на социальном уровне, преследуя социальную цель, мы осознанно определяем «правовое свидетельство», как совокупность лишь конкретных типов свидетельств, например, наблюдения комиссара полиции в ночь на четвертое апреля.
Все правовые свидетельства, в идеале, должны быть рациональными свидетельствами, но не наоборот. Мы внедряем особые, сильные стандарты, прежде чем объявлять, что данное рациональное свидетельство является еще и «правовым».

Набирая эту фразу в 8:33 вечера, Pacific time, 18-го августа 2007, я ношу белые носки. Следует ли тебе, как рационалисту, верить этим словам? Да. Могу я давать показания об этом в суде? Да. Это научное заявление? Нет, ведь нет эксперимента, который бы ты мог провести, дабы верифицировать это. Наука собрана из множества обобщений, применяемых к множеству частных случаев, чтобы ты мог провести новые реальные эксперименты, которые тестируют обобщения, и следовательно, подтвердить для себя, что обобщение является правдой, не полагаясь на чей-то авторитет. Наука - публичное, воспроизводимое знание человечества.

Как и судебная система, наука - социальный процесс, включающий подверженных ошибкам людей. Мы хотим защитить фонд убеждений, которые особенно надежны. Так же мы хотим социальные правила, которые бы способствовали производству нового знания. Так что мы внедряем особые, сильные, дополнительные стандарты прежде чем объявить конкретное рациональное знание «научным», добавив его в фонд убеждений. Должен ли рационалист верить в историческое существование Александра Великого? Да. У нас есть лишь грубая картинка древней Греции, не слишком достоверная, но это лучше чем максимальная энтропия. Но мы зависим от авторитетов, Плутарха, например; мы не можем игнорировать его и проверить все сами. Историческое знание - ненаучное знание.

Должен ли рационалист верить, что Солнце взойдет 18-го сентября 2007 года? Да, но не с абсолютной уверенностью, таков уж принцип ставок. (Для педантов: стоит ли верить, что 18-го сентября 2007 года вращение Земли и её орбита относительно Солнца останутся примерно такими же?) Это заявление, которое я написал в своем эссе 18-го августа 2007-го является научным убеждением?

Отрицание применимости прилагательного «научный» к заявлению «Солнце взойдет 18-го сентября 2007-го» может показаться ошибочным. Если наука не может делать предсказания о будущих событиях, которым еще предстоит произойти, то она бесполезна; она не будет способна предсказывать результаты эксперимента перед его проведением. Предсказание о том, что Солнце взойдет, определенно, является экстраполяцией научного обобщения. Оно основано на моделях Солнечной системы, которые ты можешь подтвердить самостоятельно.

Но представь, что ты создаешь новый эксперимент для верификации предсказания №27 в новом контексте теории Х. У тебя может не быть причин полагать, что предсказание ошибочно; ты можешь лишь хотеть проверить его в новом контексте. Утверждение о «научности» этого убеждения может показаться опасным, до завершения эксперимента. Уже есть «традиционное предсказание» и «предсказание теории Х». Но если ты уже знаешь «научное убеждение» о результате, зачем осложнять себе жизнь экспериментом?

Ты начинаешь, надеюсь, понимать, почему я отождествляю Науку с обобщениями, а не с историей экспериментов. Исторические события случаются лишь раз; обобщения же применяются для множества событий. История не воспроизводима, научные обобщения - да.

Является ли мое определение «научного знания» истинным? Это не слишком хорошо сформулированный вопрос. Особые стандарты, что мы внедряем для науки имеют практическую цель. Нигде на звездах или горах не написано, что p < 0.05 является стандартом научной публикации. Сейчас многие утверждают, что 0.05 - слишком слабый стандарт; что будет полезно понизить его до 0.01 или 0.001.

Может быть будущие поколения, действуя в соответствии с убеждением, что научное знание - публичное и воспроизводимое, будут помечать как «научные» лишь те статьи, что напечатаны в бесплатных журналах. Ведь если ты требуешь плату за знание, является ли оно знанием человечества? Можем ли мы доверять результатам, если людям приходится платить, чтобы критиковать их? Действительно ли это наука?

Вопрос «Действительно ли это наука» плохо сформулирован. Является ли байесовским свидетельством журнал с закрытым доступом и ценой подписки 20000$ в год? Вместе с частными заявлениями комиссара полиции о том, что Вилки — криминальный босс, думаю я, ответ — «Да». Но следует ли канонизировать журналы с ограниченным доступом как «науку»? Должны ли мы допускать их в защищенный фонд убеждений? Как по мне, так науке послужит больше, если научным будет считаться публичное, воспроизводимое знание в фонде человечества.

Перевод: 
Muyyd
Номер в книге "Рациональность: от ИИ до зомби": 
22
Оцените качество перевода: 
Средняя оценка: 4.7 (19 votes)

Сколько свидетельств понадобится

Элиезер Юдковский

Напомню, что свидетельство — это «событие, сцепленное с интересующей тебя сущностью последовательностью из причин и следствий», а сцепленность — «событие проявляется по-разному в зависимости от различных состояний цели». Так какое количество сцепленности — сколько свидетельств — требуется для того, чтобы поддержать убеждение?

Начнём с простого вопроса (достаточно простого для того, чтобы можно было получить ответ математически): насколько нужно сцепиться с лотереей, чтобы выиграть? Скажем, есть 70 шаров, вытаскиваемых в случайном порядке, и, чтобы выиграть, нужно, чтобы совпало шесть чисел. Тогда существует 131 115 985 возможных комбинаций, и вероятность того, что произвольный лотерейный билет выиграет, равна 1/131 115 985 (это 0,0000007%). Чтобы выиграть в лотерею, необходимы свидетельства, достаточно избирательные для того, чтобы благоволить одной комбинации, а не 131 115 984 её альтернативам.

Скажем, существуют вероятностные тесты, различающие выигрышные и проигрышные билеты. Например, можно ввести комбинацию в чёрный ящик, который всегда гудит, если комбинация выигрышна, и не всегда гудит, если комбинация проигрышна. Допустим, вероятность этого лишь 1/4 (или, в байесианской терминологии, отношение правдоподобия чёрного ящика — четыре к одному: если комбинация была выигрышной, то ящик загудит с вероятностью в четыре раза больше, чем для проигрышной).

Но возможных комбинаций очень много. Если ввести в ящик 20 проигрышных комбинаций, 5 из них (в среднем) заставят его загудеть — просто из-за вероятности ошибиться в 25%. Если ввести в ящик все 131 115 985 возможных комбинаций, то ящик загудит не только после выигрышной, но и после 32 778 996 проигрышных (в среднем).

Этот чёрный ящик не позволит выиграть лотерею, но это лучше, чем ничего. Благодаря ему, вероятность выигрыша вырастает от 1/131 115 985 до 1/32 778 997. Наблюдается прогресс в деле отыскания истины внутри обширного пространства возможностей.

Теперь предположим, что можно использовать второй ящик для того, чтобы проверить комбинацию дважды, независимо. Оба ящика точно загудят на правильную комбинацию, а вероятность гудка в ответ на неправильную комбинацию — 1/4 независимо для каждого ящика, и поэтому оба ящика загудят на проигрышную комбинацию с вероятностью лишь в 1/16. Можно сказать, что суммарное свидетельство, полученное в результате двух независимых тестов, имеет отношение правдоподобия 16:1. Число проигрышных лотерейных билетов, прошедших оба теста — 8 194 749 (в среднем).

Раз всего возможно 131 115 985 лотерейных билетов, то соблазнительно сказать, что необходимы свидетельства, чья суммарная сила будет примерно 131 115 985 к 1 — то есть нужно событие (или серия событий), в 131 115 985 раз более вероятное при условии, что комбинация выигрышная, чем при условии, что комбинация проигрышная. Но на самом деле этого свидетельства хватит лишь на то, чтобы дать 50% вероятность выигрыша. Почему? Потому что, если применить фильтр этой силы к 131 миллиону проигрышных билетов, то один (в среднем) проигрышный билет его пройдёт. Выигрышный билет тоже его пройдёт, и в результате получатся два прошедших фильтр билета. Вероятность выиграть 50%, если купить можно лишь один.

Лучше посмотреть на ситуацию следующим образом. Вначале, есть 1 выигрышный билет и 131 115 984 проигрышных, поэтому шансы выиграть 1:131 115 984. Шансы ящика загудеть — 1 (для выигрышного билета) к 0,25 (для проигрышного). Умножив 1:131 115 984 на 1:0,25 , получаем 1:32 778 996. После добавления ещё ящика свидетельств, шансы опять умножаются на 1:0,25 , и теперь они равны 1 к 8 194 749: 1 выигрышный билет и 8 194 749 проигрышных.

Удобно измерять свидетельства в битах — не в тех битах, которые можно найти на жёстком диске, а в математических битах, которые концептуально от них отличаются. Эти биты — просто логарифмы вероятностей по основанию 1/2. Например, если возможны четыре случая — A, B, C и D, чьи вероятности 50%, 25%, 12,5% и 12,5% соответственно, и я говорю, что случилось D, то тем самым я передаю тебе 3 бита информации, так как вероятность сообщённого результата — 1/8.

Удачное совпадение: 131 115 984 чуточку меньше, чем 2 в 27-й степени. Поэтому 14 ящиков, или 28 бит свидетельствующей информации — событие, в 268 435 456 раз более вероятное при условии, что гипотеза-о-билете верна, чем при условии, что она ложна, — увеличит шансы с 1:131 115 984 до 268 435 456:131 115 984, что примерно равно 2:1. Шансы 2:1 означают, что на каждые две победы приходится один проигрыш, то есть, если взять в руки 28 битов свидетельствующей информации, то вероятность выигрыша будет 2/3. Добавим ещё один ящик, 2 бита свидетельствующей информации, и шансы сдвинутся до 8:1. Появление ещё двух ящиков превратит шансы выигрыша в 128:1.

Так что, если ты хочешь получить право на сильное убеждение в том, что ты выиграешь лотерею (то есть, скажем, чтобы вероятность твоей неправоты была меньше 1%), то 34 бит свидетельствующей информации о выигрышной комбинации вполне достаточно.

В общем случае, для ответа на вопрос «сколько свидетельств для этого понадобится?» нужно использовать примерно такие же правила оценки. Чем больше пространство возможностей, или чем сильнее априорная невероятность гипотезы по сравнению с её ближайшими соседями, или чем более уверенным хочется быть, тем больше нужно свидетельств.

Правила нельзя обмануть. Никто не может формировать убеждения, основываясь на неадекватных свидетельствах. Скажем, у тебя есть ряд из 10 ящиков, и ты вбиваешь комбинации в каждый из них. Ты не можешь остановиться на первой комбинации, успешно прошедшей все ящики, и сказать: «Но шанс на то, что это случится для проигрышного билета — один к миллиону! Чёрт с этими полурелигиозными обычаями байесианцев, я закончил!». Этот тест пройдёт не только победитель, но ещё и 131 проигрышный билет (в среднем). Ты пришёл к слишком сильному выводу, основываясь на недостаточном количестве свидетельств, не сумев побороть громадность пространства возможностей и априорную невероятность. Это не надуманное бюрократическое предписание, это математика.

Конечно, можно быть убеждённым в чём-то, основываясь на неадекватных свидетельствах, если сильно хочется; но убеждения при этом не могут быть истинными. Ситуацию можно сравнить с попыткой завести машину без бензина, игнорируя глупое, закостенелое, несправедливое и смехотворное правило «автомобилю нужен бензин для того, чтобы ездить». Было бы намного удобнее и дешевле, если бы люди отменили этот закон, разве это не очевидно вообще всем? Что же, можно попробовать, если сильно хочется. Можно даже закрыть глаза и представить себе, что машина движется. Но для того, чтобы на самом деле прибыть к правдивым убеждениям, необходимы свидетельства-бензин и, чем дальше ехать, тем больше бензина понадобится.

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
23
Оцените качество перевода: 
Средняя оценка: 3.9 (44 votes)

Самоуверенность Эйнштейна

Элиезер Юдковский

В 1919 году сэр Артур Эддингтон возглавил экспедиции в Бразилию и на остров Принсипи, чтобы пронаблюдать солнечные затмения и тем самым опытным путем проверить то, что предсказывает новая теория, созданная Эйнштейном, — общая теория относительности. Некий журналист спросил Эйнштейна, что тот будет делать, если наблюдения Эддингтона разойдутся с предсказаниями теории. Как известно, Эйнштейн ответил: «Тогда мне будет жаль Господа Бога. Теория всё равно верна».

Это заявление звучит чрезмерно дерзко, словно бросая вызов общепринятой в Традиционной Рациональности позиции, которая утверждает, что эксперимент — главный судья. Эйнштейн словно был одержим столь великой гордыней, что отказывался преклонить голову перед тем, что говорит мироздание, как это должен делать всякий ученый. Кто способен узнать, верна ли теория, еще до экспериментальной проверки?

Конечно, Эйнштейн оказался прав. Я стараюсь не подвергать критике людей, когда они правы. Если они по-настоящему ее заслуживают, мне не придется долго ждать случая, который прояснит их ошибку.

И Эйнштейн, возможно, был не столь уж опрометчиво дерзок, как это звучало.

(От переводчика: далее под силой эксперимента или сложностью гипотезы будет иметься в виду их разрешающая способность в битах в соответствии с подходом Шеннона. Для тех, кто слабо знаком с теорией информации, можно, не вдаваясь в детали, сказать, что это мера длины кратчайшего сообщения, описывающего гипотезу. См. также статью о бритве Оккама)

Чтобы назначить вероятность, большую 50%, одной верной гипотезе из набора в 100 млн возможных, вам нужно как минимум 27 бит свидетельств, или около того. Если у вас нет столь информативного способа проверки, нельзя рассчитывать, что вы сможете найти верную гипотезу: недостаточно сильные эксперименты оставят более чем одну идею потенциально истинной. Если вы попробуете произвести проверку, дающую ложноположительный исход в одном случае из миллиона (т. е. силой примерно в 20 бит), то в итоге получите сотни возможных гипотез. Чтобы просто отыскать верный ответ в широком пространстве возможностей, нужно много свидетельств.

Традиционная Рациональность подчеркивает роль подтверждения: «Если вы хотите убедить меня в истинности X, вам потребуется предоставить мне Y свидетельств». Я часто соскальзывал к подобной формулировке, когда на самом деле хотел сказать что-то вроде «Чтобы обосновать убежденность в этом заявлении с вероятностью большей 99%, нужно 34 бита свидетельств». Или «для того, чтобы присвоить вашей гипотезе вероятность больше 50%, вам нужно 27 бит свидетельств». Традиционная формулировка подразумевает, что вы начинаете исследование с догадок или неких только вам понятных рассуждений, которые приводят вас к гипотезе, и только затем накапливаете «свидетельства», подтверждающие ее, чтобы убедить научное сообщество или обосновать свою убежденность.

Однако с байесовской точки зрения вам, чтобы просто задать гипотезу на пространстве возможных теорий, нужны свидетельства в объеме, примерно равном сложности этой гипотезы. (Вопрос пока не в том, чтобы убедить кого-либо или обосновать что-либо.) Если перед вами сто миллионов альтернатив, вам нужно не меньше 27 бит свидетельств, чтобы просто однозначно сосредоточиться на единственной версии.

Это справедливо, даже если вы называете свою идею «догадкой» или «озарением». Работа интуиции — реальный процесс в настоящем мозге. Если ваш разум не обладает хотя бы десятью битами байесовски непротиворечивых, неизбыточных и соответствующих гипотезе данных, то он не в состоянии выделить корректную гипотезу силой в 10 бит — ни сознательно, ни подсознательно, ни как-либо еще. Если вы хотите отыскать одну из миллионов целей с помощью только лишь 19 бит связанной информации, подсознание не сможет сделать это лучше, чем сознание. Подсознательные догадки могут казаться загадочными тому, в чью голову приходят, но не в состоянии нарушить принципы устройства мироздания.

Вы уже видите, к чему я веду: в момент, когда Эйнштейн изначально формулировал гипотезу, когда уравнения начали приходить ему в голову, у него уже должны были быть достаточные экспериментальные данные, чтобы его внимание смогло сосредоточиться единственным образом именно на уравнениях ОТО. Иначе они не получились бы верными.

Теперь подумаем, насколько похоже на правду, что Эйнштейн мог владеть именно такими экспериментальными данными, чтобы ОТО завладела его вниманием, но ее достоверность была бы оценена лишь в 55%? Предположим, что сложность гипотезы ОТО — 29,3 бита. Правдоподобно ли, чтобы в курсе физики, который изучал Эйнштейн, было ровно 29,5 бит свидетельств?

Неправдоподобно. Если у Эйнштейна было достаточно экспериментальных данных, чтобы единственным способом разработать уравнения ОТО в самом начале, то, вероятно, у него уже было достаточно свидетельств, чтобы быть чертовски уверенным в истинности общей теории относительности.

Из-за того, что мозг человека — несовершенный обработчик информации, на деле у Эйнштейна, возможно, было чрезмерно больше свидетельств, чем в принципе требуется идеальному байесовскому агенту, чтобы присвоить ОТО внушительную степень доверия.

Слова учёного «Тогда мне будет жаль Господа Бога, теория всё равно верна» не звучат так уж пугающе, если вы взглянете на них с этой точки зрения и будете помнить, что из всего пространства вариантов именно общая теория относительности оказалась справедливой.

Перевод: 
Quilfe, Ira1985, Роман Биккулов
Номер в книге "Рациональность: от ИИ до зомби": 
24
Оцените качество перевода: 
Средняя оценка: 3.4 (40 votes)

Бритва Оккама

Элиезер Юдковский

Чем сложнее объяснение, тем больше свидетельств необходимо, чтобы просто определить его в пространстве убеждений (в Традиционной Рациональности это формулируется вводящим в заблуждение образом, скажем, «чем сложнее утверждение, тем больше требуется оснований, чтобы его принять»). Как можно измерить сложность объяснения? Как определить, сколько свидетельств потребуется?

Допустим, вы, проведя какие-то эксперименты, получили ряд интересных результатов. Почему эти данные выглядят именно так, а не иначе? На ум приходят несколько объяснений, но какое из них выбрать?

Кажется, пришло время вспомнить принцип бритвы Оккама, точнее, следующую его формулировку: «следует считать верным самое простое объяснение, не противоречащее собранным данным». Но как оценить степень простоты? Роберт Хайнлайн как-то заявил, что самое простое объяснение звучит так: «Женщина, живущая дальше по улице — ведьма, значит это сделала она».

Становится понятно, что длина предложения на естественном языке — не очень хороший способ измерить «сложность». И нельзя утверждать, что теория «вписывается» в факты просто потому что не может опровергнуть их - этого недостаточно.

Но в чём причина того, что длина предложения — плохая мера сложности? Потому что, произнося предложение, ты используешь обозначения для понятий, которые знает слушатель, и именно в них слушатель уже хранит сложность. Скажем, можно превратить предложение Хайнлайна в аббревиатуру «ЖЖНВТСО!», тогда всё объяснение можно сообщить одним словом. Или, ещё лучше, можно дать предложению короткий произвольный код навроде «фнорд!». Уменьшают ли эти действия сложность? Нет, потому что тогда собеседнику нужно заранее сказать, что «ЖЖНВТСО!» означает «Женщина, живущая напротив — ведьма, так сделала она». «Ведьма», в свою очередь, тоже обозначение для ряда очень необычных утверждений, и то, что все знают, каких именно, не означает, что «ведьма» — это просто.

Гигантский электрический искровой разряд падает с неба, сжигая дерево, и древние скандинавы говорят: «Наверное, какая-то могущественная личность разгневалась и бросила в дерево молнию». Человеческий мозг — самый сложный артефакт во всей известной вселенной. Гнев выглядит простым лишь потому, что мы не видим всей паутины нейронов, отвечающей за эту эмоцию (Представь, как трудно было бы объяснить пришельцам без чувства юмора, почему мы смеёмся над «Летающим цирком Монти Пайтона». Но это не говорит, что люди лучше пришельцев — у людей нет ощущения фнордотоватости). Сложность гнева, и, конечно, сложность разума, не бросилась в глаза авторам гипотезы о Торе, агенте-швыряющим-молнии.

Чтобы человек понял гипотезу Тора, нужно всего лишь бросить пару фраз. Чтобы человек понял уравнения Максвелла, нужно пересказать ему несколько книг. У людей есть встроенное понятие «гнев», но нет встроенного понятия «дифференциальное исчисление». Придётся объяснять язык, и язык, лежащий за языком, и основы математики, и лишь потом можно начинать лекцию об электричестве.

И всё же кажется, что в каком-то смысле уравнения Максвелла проще, чем человеческий мозг, или чем швыряющий-молнии-агент.

Вот разгадка: как выяснилось, намного проще написать компьютерную программу, симулирующую уравнения Максвелла, чем компьютерную программу, симулирующую пронизанный эмоциями разумный мозг Тора.

В алгоритмической теории информации «сложность описания» измеряется длиной кратчайшей компьютерной программы, выводящей это описание. Прежде чем говорить о «кратчайшей компьютерной программе», нужно задать пространство компьютерных программ, для чего нужен язык и интерпретатор. Индукция Соломонова использует машины Тьюринга (точнее, последовательности битов, задающие машины Тьюринга). Что делать, если тебе не нравятся машины Тьюринга? Можешь заплатить некоторый фиксированный штраф за сложность и спроектировать универсальную машину Тьюринга, которая будет интерпретировать любой код на том языке, который тебе нравится. Штраф за сложность зависит лишь от размера универсального интерпретатора для выбранного языка программирования, и поэтому различные формулировки в некотором смысле совершенно равносильны.

На мой взгляд, лучшая формулировка индукции Соломонова — требующая, чтобы компьютерная программа делала не детерминистическое предсказание, а приписывала строкам вероятности. Например, программа, объясняющая поведение симметричной монеты, будет просто приписывать одинаковую вероятность всем $2^N$ строкам длины $N$. Как понимать «объясняющая поведение» или «не противоречащая данным»? Чем больше вероятность, которую программа приписывает полученным данным, тем лучше программа их «объясняет». И сумма всех вероятностей должна равняться единице, и поэтому, чтобы лучше «объяснить» одну возможность, программа должна забрать сколько-то вероятностной меры у другой возможности, и теперь она будет «объяснять» её хуже. Монета не может в 100% случаев выпадать орлом, и в 100% случаев выпадать решкой.

Что можно сказать про оптимальный компромисс между сложностью программы и её способностью объяснять данные? Если забыть о сложности и думать только об объяснении, то лучшими будут программы, предсказывающие данные детерминистически, то есть приписывающие им 100% вероятность. Если монета выпала «ОРРООР», то программа, заявляющая, что монета фиксирована и изначально должна была показать «ОРРООР», объясняет данные в 64 раза лучше, чем программа, считающая монету симметричной. С другой стороны, если рассматривать только сложность, то гипотеза о симметричной монете всегда проще любой другой гипотезы. Даже если монета выпадает «ОРООРОООРООООРОООООР…». Гипотеза «монета симметрична» действительно проще и объясняет эту последовательность точно также хорошо, как и любую другую последовательность из 20 бросков — не лучше и не хуже — но легко увидеть другую гипотезу, выглядящую не слишком уж сложной, и объясняющую эти наблюдение намного лучше.

Программа, которой позволили хранить дополнительный бит информации, способна в два раза урезать пространство возможностей, и, следовательно, приписать в два раза больше вероятности точкам в оставшемся пространстве. Отсюда выходит, что один бит сложности должен стоить как минимум двукратного улучшения способности объяснять. Поэтому программа, в явном виде хранящая инструкцию «приписать ОРРООР 100% и 0% всем остальным», не сможет выиграть у всех остальных программ. Шесть бит, отведённые на хранение «ОРРООР» сводят на нет всю достоверность, полученную 64-кратным улучшением способности объяснять. Иначе, рано или поздно, придётся решить, что все симметричные монеты фиксированы.

Если, конечно, эта программа не написана умно, и не пытается сжать строки данных. Во всех остальных случаях перемещение информации из данных в код не помогает укрепить достоверность программы.

Как именно работает индукция Соломонова? Нужно расcмотреть все допустимые программы (если допустима любая программа, то индукция становится невычислимой), причём каждая программа имеет априорную вероятность, равную $(1/2)^N$, где $N$ — её длина в битах, а затем вероятность корректируется, исходя из того, насколько хорошо программа объясняет данные на текущий момент. В результате получается группа «экспертов» различной степени достоверности, могущая предсказывать следующие биты: просто просуммируй мнения, умножив их на весовой коэффициент авторитета.

Принцип минимальной длины сообщения почти эквивалентен индукции Соломонова. Сначала ты посылаешь строку, описывающую код, а затем строку, описывающую данные, используя этот код. Объяснение, создающее кратчайшее суммарное сообщение, считается лучшим. Если приравнять набор возможных кодов к пространству всех компьютерных программ и считать сообщение-с-определениями универсальным интерпретатором, то принцип минимальной длины сообщения почти эквивалентен индукции Соломонова (почти — потому, что он выбирает кратчайшую программу, а не суммирует все возможные программы).

Это позволяет яснее увидеть проблему с использованием фразы «женщина, живущая напротив — ведьма, так сделала она» для объяснения закономерности в последовательности «0101010101». Если ты отправляешь другу письмо, пытаясь описать последовательность, которую ты наблюдал, тебе придётся сказать: «женщина, живущая напротив — ведьма, она сделала так, что последовательность вышла 0101010101». Обвинения в колдовстве не позволили сократить вторую половину сообщения. Тебе по-прежнему нужно описать, во всех подробностях, порождённые её запретным искусством данные.

Колдовство объясняет известные данные в том смысле, что оно качественно их разрешает. Но это лишь потому, что колдовство позволяет вообще всё, как и флогистон. Поэтому, после того, как слово «ведьма» сказано, тебе всё равно предстоит описать все наблюдения, не упуская даже мельчайшей детали. Посылая сообщение о колдовстве, ты не сжимаешь сообщение с данными. Первое сообщение — бесполезный пролог, мёртвый груз, увеличивающий суммарную длину.

Подвох фразы «так сделала ведьма» спрятан в слове «так». Как именно сделала ведьма?

Конечно, благодаря эффекту знания задним числом, якорению, лжеобъяснениям, лжепричинности, предвзятости подтверждения и целенаправленным размышлениям, может казаться совсем очевидным то, что, если женщина ведьма, то, конечно же, она заставит монету выпасть 0101010101. Но это уже отдельный разговор.

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
25
Оцените качество перевода: 
Средняя оценка: 3.4 (94 votes)

Сила рационалиста

Элиезер Юдковский

(Этот случай произошёл ещё в те давние седые времена, когда я посещал IRC-чаты. Время затуманило память и мой рассказ может быть неточным)

Итак, дело происходило в IRC-чате. Один из посетителей спрашивает совета у сведущих в медицине людей. Его друг обратился к нему со следующей историей: у него начались внезапные боли в грудной клетке, поэтому бедняга вызвал скорую, и скорая приехала, но медработники сказали «ничего страшного» и уехали, боль в груди же становится всё сильнее и сильнее. «Что мне делать?» — спрашивает он у людей в чате, пересказав эту историю.

Эта история сбила меня с толку. Я помню, как я читал о бездомных Нью-Йорка, вызывающих скорую только для того, чтобы оказаться где-нибудь в тёплом месте, и о медиках, вынужденных отвозить их в пункт неотложной медицинской помощи. Даже на 27-й итерации, ведь, в противном случае, медкомпания может быть засужена на очень серьёзную сумму денег. Аналогично, пункты неотложной помощи юридически обязаны лечить всех, вне зависимости от их платежеспособности (Эти серьёзные расходы ложатся на плечи госпиталя, поэтому госпитали закрывают свои пункты неотложной помощи… В связи с этим мне очень интересно узнать, в чём смысл обучать экономистов, если мы всё равно собираемся их игнорировать?).

Так что я не совсем понимал, как могли произойти описанные события. Любого жалующегося на боль в груди человека, должны были бы немедленно увезти на скорой.

А затем я потерпел неудачу как рационалист. Я вспомнил несколько случаев, когда мой доктор совершенно отказывался паниковать в ответ на сообщения о симптомах, которые, на мой взгляд, были крайне тревожными. И медицинское учреждение всегда оказывалось правым. Каждый раз. Боли в грудной клетке как-то были и у самого меня, но доктор терпеливо разъяснил мне, что я описываю мышечную боль, а не инфаркт.

Поэтому я написал в чате: «Что же, если врачи сказали «ничего страшного», то это действительно так и есть — они бы увезли больного в госпиталь, если бы его состояние грозило бы хоть чем-нибудь серьёзным».

Таким вот способом я всё же впихнул историю в уже существующую модель, хотя в глубине души ощущал, что объяснение немного натянуто…

Некоторое время спустя этот товарищ возвращается в чат и сообщает, что его друг целиком всё выдумал: от болей в груди до отказа врачей помочь. Очевидно, это был не самый честный его друг.

И лишь в эту секунду я осознал то, что должен был понять сразу же: слова неизвестного знакомого знакомого по IRC-каналу могут быть не так достоверны(English), как опубликованная в журнале статья. Увы, вера легче неверия; мы верим инстинктивно, но неверие требует сознательного усилия(English).

Но вместо того, чтобы заподозрить розыгрыш, я, сильно постаравшись, заставил свою модель реальности объяснить аномалию, которая никогда не происходила. И я знал, насколько постыдны подобные поступки. Я знал, что полезность модели измеряется не тем, что она может объяснить, а тем, что она объяснить не может. Ничего не запрещающая гипотеза позволяет всё, тем самым терпя неудачу в попытке упорядочить ожидания будущего.

Cила рационалиста состоит в способности быть озадаченным вымыслом больше, чем реальностью. Если ты одинаково хорошо объясняешь любой исход, то знаний у тебя — ноль.

Временами все мы слабы. Тогда я был способен быть сильнее, но, увы, совершил ошибку. У меня была вся информация, необходимая для правильного ответа, я даже заметил проблему — а затем я её проигнорировал. Замешательство было Подсказкой, а я выбросил свою Подсказку.

Ощущение натянутости заслуживает львиной доли внимания.

Замешательство — важная подсказка на пути к истине, часть твоей силы, силы рационалиста. Серьёзный дизайнерский недочёт человеческого мышления заключается в том, что это ощущение лишь тихо шуршит на самой границе восприятия, вместо того, чтобы под вой сирен вешать яркую неоновую надпись «ЛИБО ТВОЯ МОДЕЛЬ НЕВЕРНА, ЛИБО ЭТА ИСТОРИЯ ЛОЖНА».

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
26
Оцените качество перевода: 
Средняя оценка: 3.6 (86 votes)

Отсутствие свидетельств — свидетельство отсутствия

Элиезер Юдковский

Запоздалое впихивание свидетельств в гипотезу сыграло свою роль в самой горестной главе истории Соединенных Штатов, интернировании японцев в начале Второй Мировой. 21 февраля 1942 года Эрл Варрен, губернатор Калифорнии, в ответ на замечание об отсутствии случаев саботажа, шпионажа или иной подрывной деятельности живущих в Америке японцев, сказал:

«Я придерживаюсь мнения, что это отсутствие является самым зловещим во всей этой ситуации. Больше чем что-либо ещё, это убеждает меня в том, что будущие саботажи, будущие действия Пятой Колонны будут назначены на определённое время, точно так же, как на определённое время был назначен Перл Харбор… Я считаю, что нам внушают лживое ощущение безопасности» — Робин Дэйвс, «Rational Choice in an Uncertain World».

Рассмотрим утверждение Варрена через призму теоремы Байеса. Когда мы видим свидетельство, распределение вероятностей между гипотезами меняется: вероятность гипотез, которые считали появление такого свидетельства более правдоподобным, увеличивается за счёт вероятности гипотез, которые считали появление такого свидетельства менее правдоподобным. На исход влияют лишь относительные отношения правдоподобия и вероятности: можно приписать свидетельству очень большое правдоподобие, но всё равно потерять вероятностную меру из-за того, что какая-то другая гипотеза приписала этому свидетельству ещё большее правдоподобие.

Варрен, похоже, утверждает, что отсутствие саботажа закрепляет его убеждение о существовании Пятой Колонны. Да, возможно, Пятая Колонна совершит саботаж потом. Но вероятность того, что отсутствие саботажа совершила существующая Пятая Колонна ниже вероятности того, что отсутствие саботажа совершила несуществующая Пятая Колонна.

Пусть E — наблюдение отсутствия саботажа, H1 — гипотеза о американо-японской Пятой Колонне и H2 — гипотеза о том, что её не существует. Чему бы ни равнялась вероятность того, что Пятая Колонна не совершит саботажа (величина P(E|H1)), она не может быть больше вероятности того, что отсутствие Пятой Колонны не совершит саботажа (величины P(E|H2)). Поэтому наблюдение отсутствия саботажа увеличивает вероятность того, что Пятой Колонны не существует.

Отсутствие саботажа не доказывает, что Пятой Колонны не существует. Отсутствие доказательства — не доказательство отсутствия. В логике A->B, «из А следует B» не эквивалентно ~A->~B, «из не-А следует не-B».

Но в теории вероятности отсутствие свидетельствасвидетельство отсутствия. Если E — бинарное событие и P(H|E) больше P(H), «наблюдение E увеличивает вероятность H», то P(H|~E) меньше P(H), «неудачное наблюдение E уменьшает вероятность H». P(H) — это взвешенное среднее P(H|E) и P(H|~E), и поэтому она обязательно лежит между ними.

В большинстве случаев, которые встречаются в реальном мире, явление не обязано постоянно создавать свидетельства своего существования, но ждать этих свидетельств от отсутствия этого явления ещё более безнадёжно. Отсутствие наблюдений может быть как сильным свидетельством отсутствия, так и очень слабым свидетельством отсутствия — зависит от вероятности, с которой явление создаёт эти наблюдения. Отсутствие довольно слабо разрешённого события (пусть даже альтернативная гипотеза не разрешает его вообще) — довольно слабое свидетельство отсутствия (но всё же свидетельство). В этом заключается ошибка креационистов, ссылающихся на «пробелы в летописи окаменелостей»: окаменелости формируются редко, и поэтому бессмысленно праздновать отсутствие наблюдения, слабо разрешённого теорией, достоверность которой уже установлена множеством сильных положительных наблюдений. Однако, если не зафиксировано вообще ни одного положительного наблюдения — время беспокоиться; отсюда и парадокс Ферми.

Cила рационалиста состоит в способности быть озадаченным вымыслом больше, чем реальностью. Если ты одинаково хорошо объясняешь любой исход, то знаний у тебя — ноль. Сила модели измеряется не тем, что она может объяснить, а тем, что она объяснить не может — только запреты могут упорядочить ожидания будущего. Если ты не замечаешь, вероятность каких наблюдений твоя модель уменьшает, то ты с тем же успехом можешь выбросить эту модель, и с тем же успехом можешь жить без этих наблюдений; без мозга и без глаз.

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
27
Оцените качество перевода: 
Средняя оценка: 4 (19 votes)

Закон сохранения ожидаемых свидетельств

Элиезер Юдковский

Фридрих Шпее фон Лангенфельд, духовник приговорённых к смерти ведьм, в 1631 году написал книгу «Cautio Criminalis» («Предосторожность касательно преступлений»), в которой он язвительно описал древо принятия решения о приговоре обвинённой в колдовстве: если ведьма вела злую и грешную жизнь, то это говорило о её вине; если она вела добрую и благочестивую жизнь, то это тоже было доказательством, поскольку ведьмы, скрываясь, пытаются притвориться образцами добродетели. После того, как женщину привели в тюрьму: если она была испугана, то она была виновной; если она не была испугана, то это подтверждало её вину, поскольку ведьмы, стараясь казаться невинными, натягивают храбрую мину. Услышав обвинение в колдовстве, женщина может попытаться спастись бегством: если она убегает, то она виновна; если она остаётся на месте, то её ноги сковал дьявол.

Шпее давал последние напутствия более двумстам осуждённым ведьмам. У него имелась возможность посмотреть на каждую ветвь дерева обвинений и увидеть, что абсолютно любые слова или действия обвинённой лишь укрепляли уверенность инквизиторов в её вине. Однако в каждом отдельном случае люди видели только одну ветвь дилеммы. Именно поэтому учёные формулируют свои экспериментальные предсказания заранее.

Но нельзя получить и то, и другое. «Нельзя» в смысле «математически невозможно», а не просто «нечестно». Правило «отсутствие свидетельства есть свидетельство отсутствия» — частный случай более общего утверждения, которое я называю законом сохранения ожидаемых свидетельств: ожидаемая апостериорная вероятность с учётом будущего свидетельства должна равняться априорной вероятности.

P(H) = P(H)
P(H) = P(H,E) + P(H,~E)
P(H) = P(H|E) ∙ P(E) + P(H|~E) ∙ P(~E)

Или, перенеся P(H) на другую сторону: (P(H|E) − P(H)) ∙ P(E) + (P(H|~E) - P(H)) ∙ P(~E) = 0, ожидаемое изменение вероятности — ноль.
Следовательно, для каждого ожидаемого свидетельства в пользу, существует равное и противоположно направленное ожидание свидетельства против.

Если имеется высокая вероятность получения слабого свидетельства в одну сторону, то она компенсируется низкой вероятностью получения сильного свидетельства в другую сторону. Если ты очень уверен в своей теории, и поэтому ожидаешь увидеть предсказанный результат, то исполнение предсказания лишь самую чуточку усиливает убеждённость в этой теории (эта убеждённость и без того близка к 1), однако неожиданная неудача нанесёт уверенности сильный удар, как и должно быть. В среднем, твоя убеждённость остаётся совершенно неизменной. Аналогично, одно лишь ожидание встретить свидетельство — до того, как ты увидел, в чём именно оно заключается — не должно сдвигать твоей априорной убеждённости.

Поэтому, заявляя, что отсутствие саботажа подтверждает существование японско-американской Пятой Колонны, человек должен подразумевать, что наличие саботажа опровергает существование Пятой Колонны. Если доброта и благочестие — свидетельство того, что женщина является ведьмой, то злоба и грех должны быть свидетельством её невиновности. Если Господь, проверяя нашу веру, отказывается явить Себя нашим глазам, то описанные в Библии чудеса должны разубеждать нас в существовании Бога.

Звучит как-то неправильно, ведь так? Прислушивайся к ощущению натянутости, внимательно ищи это тихое напряжение на границе восприятия. Это важно.

Истинный байесианец не может искать свидетельства в пользу теории. Не может существовать ни чёткого плана, ни умной стратегии, ни хитрого приёма, с помощью которых можно проводить эксперименты, систематически убеждающие всех в каком-либо утверждении. Нельзя поставить эксперимент, который подтвердит теорию; эксперименты могут лишь испытывать теорию.

Осознав это, можно ощутить: дышится намного легче. Не надо мучиться, пытаясь интерпретировать каждый возможный исход эксперимента так, чтобы он подтверждал твою теорию. Не надо обдумывать, как заставить каждую йоту свидетельств подтверждать твою теорию, ведь для каждого ожидания свидетельства в пользу, существует равное и противоположно направленное ожидание свидетельства против. Можно ослабить силу укуса возможного «аномального» наблюдения, лишь ослабив поддержку от «нормального» наблюдения; сила среднего укуса всегда в точности равна силе средней поддержки. Это игра с нулевой суммой. Как бы ты ни спорил, как бы ты ни сотрудничал с Тёмной Стороной, какие бы будущие стратегии ты ни вырабатывал, — ты не можешь рассчитывать, что будущее сдвинет твои взгляды в определённую сторону.

С тем же успехом ты можешь просто сесть, расслабиться, и ждать, пока твои свидетельства сами не придут к тебе.

…временами я ужасаюсь извращённости человеческой психики.

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
28
Оцените качество перевода: 
Средняя оценка: 4 (26 votes)

Знание задним числом обесценивает науку

Элиезер Юдковский

Этот отрывок(English) из книги Дэвида Майерса «Изучаем социальную психологию»1, стоит того, чтобы прочитать его полностью. Каллен Мерфи, издатель журнала «Atlantic», заметил, что социальные науки не открывают ничего, что нельзя было бы «найти в цитатниках заранее… День за днем ученые-социологи выходят в мир. И день за днем они открывают, что поведение людей очень похоже на то, что ты и так мог предсказать и ожидал увидеть».

Конечно же, всё это «ожидание увидеть» вытекает из эффекта знания задним числом (эффект знания задним числом: знающие ответ на вопрос люди считают его более очевидным, чем люди, пытающиеся угадать ответ, не зная его заранее; «разумеется, я додумался бы до этого!»).

Историк Артур Шлезингер-младший называл социологические исследования американских солдат времен второй мировой войны «нудной демонстрацией» здравого смысла. Например:

  1. У солдат с более высоким уровнем образования возникало больше проблем с адаптацией, чем у менее образованных (интеллектуалы были менее готовы к стрессам войны, чем люди, выросшие на улицах).
  2. Южане легче, чем северяне, переносили жару островов Южного моря (южане более привычны к жаркому климату).
  3. Белые рядовые сильнее, чем чернокожие, стремились к продвижению по службе (годы угнетения посеяли в чернокожих желание «не высовываться»).
  4. Чернокожие южане предпочитали белых офицеров с Юга офицерам с Севера (так как первые обладали большим опытом общения с чернокожими).
  5. Когда война окончилась, солдаты скучали по дому не так сильно, как во время боевых действий (во время битвы солдаты знали, что находятся в смертельной опасности и могут больше не увидеть родных).

Сколько из этих наблюдений ты мог бы вывести заранее? 3 из 5? 4 из 5? Есть ли случаи, касательно которых ты предсказал бы противоположное; случаи, наносящие твоей модели мира удар? Прежде чем продолжить чтение, хорошо подумай над этим.

Все утверждения из этого списка (которые Мейерс взял из книги Пола Лазарсфельда2) прямо противоположны тому, что было обнаружено в действительности. Сколько раз твоя модель мира была испытана на прочность? Сколько раз ты признал, что ты бы ошибся? Теперь можно сделать вывод о том, насколько хороша твоя модель на самом деле: сила рационалиста состоит в способности удивляться вымыслу больше, чем реальности.

А ещё я мог перевернуть результаты ещё раз — тогда удары остаются ударами, а удачные предсказания удачными предсказаниями. Что скажешь?

Теперь ты действительно не знаешь ответа. Замечаешь ли ты, что процессы, идущие в твоей голове сейчас, чем-то отличаются от тех процессов, которые происходили там ранее? Чувствуешь ли ты, что поиск ответа ощущается по-другому, не так, как рационализация обеих сторон «известного» ответа?

Дафна Барац разделила студентов на две группы и сообщала одной результат социологического исследования (например, «Во время подъема экономики люди тра­тят большую часть своего дохода, чем во время спада» или «Люди, регулярно посещающие церковь, стремятся иметь больше детей, чем те, кто редко ходит в церковь»), а другой — перевёрнутый результат того же социологического исследования.3 Обе группы утверждали, что данный им результат они смогли бы предсказать заранее. Отличный пример эффекта знания задним числом.

Что приводит людей к мысли, что им не нужна наука, ведь всё «и так ясно».

(довольно очевидный вывод, не так ли?)

Знание задним числом заставляет нас систематически недооценивать неожиданность научных открытий, особенно тех открытий, которые мы можем понять; тех открытий, которые нам близки, и которые мы можем постфактум уместить в свою модель мира. Регулярно читающий новости человек, разбирающийся в неврологии или физике, скорее всего тоже недооценивает неожиданность открытий в этих дисциплинах. Этот эффект несправедливо обесценивает вклад исследователей, и, что ещё хуже, не даёт тебе заметить свидетельства, которые отличаются от того, что бы ты предсказал на самом деле.

Без сознательного усилия невозможно почувствовать должный уровень шока.

  • 1. David G. Meyers, «Exploring Social Psychology» (New York: McGraw-Hill, 1994), 15–19.
  • 2. Paul F. Lazarsfeld, «The American Solidier—An Expository Review», Public Opinion Quarterly 13, no. 3 (1949): 377–404.
  • 3. Daphna Baratz, «How Justified Is the “Obvious” Reaction?» (Stanford University, 1983).
Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
29
Оцените качество перевода: 
Средняя оценка: 4.7 (25 votes)

Загадочные ответы

«Таинственные ответы» ставит вопрос: способна ли наука решить эти проблемы для нас. Ученые основывают свои модели на повторяемых экспериментах, а не на спекуляциях и слухах. Наука, так же, имеет великолепную репутацию в сравнении с историями, религией и… Да в сравнении с чем угодно имеет. Стоит ли волноваться по поводу «ложных» убеждений, ошибки подтверждения, ошибки знания задним числом и им подобных, если мы работаем с сообществом людей, желающих объяснять феномены, а не рассказывать трогательные истории?

Автор: 
Элиезер Юдковский

Лжеобъяснения

Элиезер Юдковский

Давным-давно жила-была в одном городе учительница физики. В один прекрасный день она пригласила в класс своих студентов и показала им широкую квадратную металлическую пластину рядом с обогревателем. Студенты прикладывали ладони к пластине и ощущали, что сторона пластины рядом с обогревателем кажется холодной, а дальняя от обогревателя сторона кажется тёплой. «В чём дело, как вы думаете?» — спросила учительница. Некоторые заговорили о конвекции воздушных потоков, остальные предположили наличие странных примесей в пластине. Студенты предложили много изобретательных объяснений, никто не снизошёл до фраз «Я не знаю» или «По-моему, это просто невозможно».

А разгадка была в том, что учительница развернула пластину ненагретой стороной к обогревателю перед тем, как студенты вошли в комнату.1 2

Посмотрим на студента, растерянно бормочущего «Э… Ну, может быть, это из-за теплопроводности и всего такого?». Являются ли его слова полноценным убеждением? Слова достаточно легко произнести громким, убедительным голосом. Но контролируют ли они ожидание?

Подумаем о маленьком невинном предлоге «из-за», который стоит перед словом «теплопроводности». Подумаем о других вещах, которые он может предварять: например, можно сказать «из-за флогистона» или «из-за волшебства».

«Магия — не научное объяснение!» — можете закричать вы. Действительно, легко заметить, что эти две фразы — «из-за теплопроводности» и «из-за волшебства» — принадлежат различным литературным жанрам. Слово «теплопроводность» можно найти в лексиконе Спока из «Звёздного пути», а про «волшебство» может рассуждать Руперт Джайлз из «Баффи — истребительницы вампиров».

Но, будучи байесианцами, мы игнорируем жанры литературы. В наших глазах модель определяется через её воздействие на ожидания будущих событий. Ты сказал «теплопроводность»; на какие будущие переживания ты рассчитываешь, исходя из этой модели? В нормальных условиях эта модель подскажет тебе, что более тёплой на ощупь должна быть сторона пластины, которая ближе к обогревателю. Если фраза «из-за теплопроводности» может объяснить ещё и то, что ближняя к обогревателю сторона ощущается холоднее, то эта фраза может объяснить вообще всё что угодно.

Ну и, как все ужея надеюсьпоняли к этому моменту: если ты одинаково хорошо объясняешь любой исход, то знаний у тебя — ноль.

Если постоянно злоупотреблять фразой «из-за теплопроводности», то эта модель превратится в замаскированную гипотезу максимальной энтропии. В плане предсказаний такое предположение изоморфно фразе «это магия». Выглядит как объяснение, но им не является.

Представим, что мы измеряем температуру металлической пластины в различных точках и в разное время, вместо того, чтобы высказывать догадки вслух. Видя металлическую пластину рядом с нагревателем, обычно мы ожидаем увидеть, что температуры точек удовлетворяют равновесию диффузионного уравнения с учётом граничных условий, наложенных окружающей средой. У тебя может не получиться правильно определить температуру в первой точке измерения, но после измерения нескольких первых точек — я не настолько физик, чтобы знать, сколько именно точек потребуется — уже можно с отличной точностью вычислить температуру остальных.

Истинный гуру искусства Ограничения Ожиданий По Поводу Материальных Явлений С Помощью Чисел — один из тех людей, которых мы называем «физиками» — сделает измерения и скажет «Эта пластина находилась в равновесии с окружением две с половиной минуты назад, потом её повернули на 180 градусов, и сейчас она снова к нему приближается»

Ошибка студентов не просто в том, что они не сумели ограничить свои ожидания. Их менее явная, и более глубокая ошибка заключалась в том, что они думали, что занимаются физикой. Они сказали «потому что», дополненное чем-то похожим на изречения Спока в «Звёздном пути», и решили, что тем самым они приобщились к магистерию науки.

Это не так. Они просто переместили магию из одного жанра литературы в другой.

  • 1. История позаимствована из коллекции шуток Иохима Верхагена (Joachim Verhagen). Упомянутую историю можно найти поиском по словосочетанию «heat conduction».
  • 2. Замечу, что в оригинале история гораздо короче, чем в изложении Юдковского. — Прим.перев.
Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
30
Оцените качество перевода: 
Средняя оценка: 4.1 (16 votes)

Угадай слово, задуманное учителем

Элиезер Юдковский

В юности я читал популярные книги по физике, например «КЭД — странная теория света и вещества» Ричарда Фейнмана. Я знал: свет — это волны, звук — это волны, материя — это волны. Мне было девять лет и я гордился своей научной грамотностью.

Намного позже, когда я начал читать фейнмановские лекции по физике, я наткнулся на жемчужину под названием «волновое уравнение». Я мог проследить за его выводом, но у меня не выходило охватить это доказательство одним взглядом(English). В течении трёх дней, от случая к случаю, я думал об этом уравнении, и, наконец, понял, что оно до смешного очевидно. И после этого я осознал, что всё то время, когда я верил в честные заверения физиков о том, что свет — это волны, звук — это волны, материя — это волны, я не имел ни малейшего понятия о том, какой именно смысл вкладывают физики в слово «волна».

Вполне естественно думать, что если учёный говорит: «Свет — это волны», и учитель спрашивает, что такое свет, на что студент отвечает: «это волны», то студент произнёс истинное утверждение. По-другому ведь нечестно, правда? Если мы считаем фразу «свет — это волны» верной в устах физика, то она же должна быть верна и в устах студента? В самом деле, утверждение «свет — это волны» либо истинно, либо ложно, не так ли?

И это — ещё одна плохая привычка, которой нас учат в школе. У слов нет встроенных значений. Когда я слышу слоги «бо-бёр», в моём мозгу возникает образ большого грызуна; но это факт о состоянии моего разума, а не о слогах «бо-бёр». Последовательность слогов «это волны» (или «из-за теплопроводности») — это не гипотеза. Это набор колебаний воздуха, либо форма, принятая чернилами на бумаге. Внутри разума может быть связь между этой фразой и какой-нибудь гипотезой, но эта фраза, сама по себе, не является ни истинной, ни ложной.

Однако, если сказать школьному учителю «это волны», то ты получишь пятёрку с плюсом: учитель считает ответ «это волны» правильным, поскольку он наблюдал, как физик создаёт эти же колебания воздуха. А раз пятёрки с плюсом раздают за определённые фразы (написанные либо произнесённые), то студенты начинают думать, что у фраз есть истинностное значение. В конце концов, свет либо волны, либо не волны, так?

И это ведёт к ещё более ужасной привычке. Представим, что учитель ставит перед тобой странную задачу: ближняя сторона металлической пластины, лежащей рядом с обогревателем, ощущается менее тёплой, чем дальняя. Учитель спрашивает, в чём дело. Ответить «я не знаю» нельзя: тогда ты не только не получишь пятёрку с плюсом, но даже не будешь считаться участвовавшим в уроке. Но в течение этого семестра учитель использовал фразы «из-за теплопроводности», «из-за конвекции» и «из-за теплового излучения». Видимо, одну из них учитель и желает услышать в ответ. Поэтому ты тянешь: «Нууу… может быть, из-за теплопроводности?».

Это не гипотеза о металлической пластине. Это даже не полноценное убеждение. Это попытка подобрать пароль.

Даже вспомнить уравнение диффузии (математическое описание процесса теплопроводности) — не то же самое, что и сформировать гипотезу о металлической пластине. Это не школа, и никто не собирается проверять, способен ли ты написать уравнение диффузии по памяти. Это байесоткачество, и мы начисляем очки за ожидания будущих переживаний. Если ты используешь уравнение диффузии — измерив температуру нескольких точек термометром, а затем пытаясь предсказать результат следующего измерения — то тогда это определённо привязано к переживаниям реального мира. Даже если студент просто представляет себе движение тепла, и поэтому подносит спичку к холодной стороне для того, чтобы измерить, куда течёт тепло, то этот мысленный образ движения привязан к переживаниям и контролирует ожидание будущего.

Если ты не используешь уравнение диффузии: не подставляешь в него числа и не получаешь данные, влияющие на твои ожидания определённых переживаний, то тогда твоя когнитивная карта полностью отрезана от местности. То, что осталось, даже нельзя назвать убеждением — это просто речевое поведение.

Школьная система построена вокруг речевого поведения, выражается ли оно через колебания воздуха, или через узор чернил на бумаге. От речевого поведения зависит, получишь ли ты пятёрку с плюсом, или двойку вместе с вызовом родителей. Осознавать различие между объяснением и паролем — первый шаг на пути избавления от этой вредной привычки.

Не слишком ли это жестоко? Ведь, когда человек пытается разрешить загадку металлической пластины, мысль «теплопроводность?» может быть первым шагом к нахождению ответа, верно? Может быть, но только в том случае, если этот человек старается разрешить загадку, а не подобрать пароль. Если нет учителя, готового указать на ошибку, то ловушка становится ещё страшнее. Тогда можно считать фразу «Свет — это вакаликс» хорошим объяснением, можно думать, что слово «вакаликс» — правильный пароль. Когда мне было 9 лет, это случилось и со мной: не потому что я был глуп, а потому, что это то, что случается обычно, по умолчанию. Это привычный для людей образ мыслей, и чтобы его избежать, нужно приучить себя не попадать в эту ловушку. Человечество падало в такие ямы и сидело в них тысячелетиями.

Возможно, если вдолбить студентам, что слова не считаются, а имеют значение лишь контроллеры ожиданий, то никто больше не застрянет в западне алгоритма «Теплопроводность? Нет? Тогда конвекция? Тоже не то?». Возможно, тогда мысль «может быть, теплопроводность?» будет началом действительно полезного пути, например:

«Теплопроводность?»

Но это только фраза — что она означает?

Уравнение диффузии?

Но это только символы — как мне их применить?

Будь уравнение диффузии справедливым, чего бы я рассчитывал почувствовать?

Я определенно не рассчитывал бы обнаружить, что отдаленная от обогревателя часть металлической пластины будет теплей.

Я замечаю своё замешательство. Возможно ближняя сторона всего лишь ощущается более холодной? Скажем, она изготовлена из какого-нибудь плохо проводящего тепло материала и поэтому передает меньше теплоты моей руке? Я попробую измерить температуру…

Ладно, не сработало. А если проверить, приложимо ли вообще уравнение диффузии к этой металлической пластине? Тепло течет как обычно, или происходит нечто иное?

Можно поднести спичку к пластине и попробовать измерить, как тепло распространяется с течением времени…

Если не выкорчевать сорняк лжеобъяснения «Эмм, может быть из-за теплопроводности?», то студент, скорее всего, застрянет на стадии паролей и вакаликса. Это происходит по умолчанию, это происходило со всем человечеством на протяжении тысяч лет.

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
31
Оцените качество перевода: 
Средняя оценка: 4.5 (37 votes)

Наука как одеяние

Элиезер Юдковский

В трейлере фильма «Люди Икс» голос за кадром говорит: «В каждом человеке… есть генетический код… вызывающий мутации». Несложно заметить, что, мутировав, можно приобрести разнообразные полезные способности. К примеру, мутант Шторм без труда метает молнии.

Прошу тебя, дорогой читатель, подумать о биологических приспособлениях, необходимых для производства электричества; о природной защите от собственного электричества; а также о структурах внутри мозга, отвечающих за тонкое управление разрядом молнии. Если мы бы и в самом деле обнаружили бы организм, который приобрёл такие способности за одно поколение, в результате мутации, то это бы одним махом вдребезги бы опровергло неодарвинистскую модель естественного отбора: это было бы ещё убийственнее, чем скелет кролика, датируемый докембрием. Если теорию эволюции действительно можно растянуть так, чтобы она не возражала против истории Шторм, то она станет способной объяснить всё, что угодно, и нам прекрасно известно, к чему такое ведёт.

Серия комиксов «Люди X» использует термины вроде «эволюция», «мутация» и «генетический код» лишь для создания атмосферы наукообразия; лишь для того, чтобы она относилась к науке как литературному жанру. И меня пугает то, как часто я встречаю людей (особенно в СМИ), воспринимающих науку исключительно как жанр литературы.

Я сталкиваюсь с людьми, которые твёрдо верят в эволюцию и не воспринимают всерьёз креационистов. При этом они вообще не имеют представления о том, что запрещено законами эволюционной биологии, а что нет. Они могут говорить про «следующий шаг эволюции человечества», как если бы естественный отбор имел бы свой план действий. Хуже того, они могут говорить о явлениях, вообще находящихся за пределами эволюционной биологии, вроде улучшений дизайна компьютерных чипов, дробления корпораций, или загрузке человека в компьютер, называя всё это «эволюцией». Если это относится к эволюционной биологии, то эволюционная биология относится ко всем явлениям на Земле.

Вероятно, большинство людей, которые верят в эволюцию, используют фразу «вследствие эволюции», потому что они хотят чувствовать себя причастными к научной тусовке. Выражение становится деталью имиджа, символическим одеянием, навроде лабораторного халата. Если бы научная тусовка вместо «вследствие эволюции» говорила бы «вследствие разумного замысла», то такие люди вдохновенно повторяли бы и это — это совершенно бы не затронуло их ожидания того, что можно встретить в мире. Для них нет разницы, говорить ли «из-за эволюции» или «из-за разумного замысла». По их мнению, эволюция никоим образом не запрещает существования Шторм, а научные словечки имеют единственное назначение — возможность отождествлять себя с племенем.

Я регулярно встречаю людей, которые с распростёртыми объятиями ждут создания «более-глупого-чем-человек» искусственного интеллекта, или даже «чуточку-более-умного-чем-человек» ИИ. Стоит начать рассказывать им о разработке ИИ, намного превосходящего человеческие возможности, как они сразу относят это к «псевдонауке» (English). При этом, разумеется, ни у кого из них нет теории интеллекта (пусть и сомнительной), позволявшей бы рассчитывать верхний и нижний пределы мощи процессов оптимизации. Скорее, они просто ассоциируют сверхчеловеческий ИИ с литературным жанром беллетристики о конце света; а, услышав историю о небольшой компании под управлением ИИ, они вспоминают забавные заметки из «Компьюленты». Их утверждения не опираются на какую-либо модель разума. Они не понимают, что им нужна модель, чтобы делать такие утверждения. Они даже не понимают, что наука основана на моделях. Их уничижительная критика целиком построена на сравнениях с апокалиптическими сюжетами, а не на, скажем, существующих принципах, которые делают невозможными подобное развитие событий. Наука для них — лишь литературный жанр, или группа «своих», к которой стоит быть причастным. Одеяние, которое они носят, не похоже на лабораторный халат; а учёные не похожи на футбольную команду, за которую они болеют.

Есть ли что-то такое в науке, верой во что вы гордитесь, но до сих пор не применяете вашу веру на практике? Вам лучше спросить себя сейчас, какие возможные варианты будущего ваша вера запрещает. Эта проверка покажет, что вы усвоили на самом деле, что вы сделали частью своей личности. Всё остальное — скорее всего, лишь пароли или одеяния.

Перевод: 
santacloud, MacDelph, BT, kostyazen, 7yukari7, Dmitry Antonyuk
Номер в книге "Рациональность: от ИИ до зомби": 
32
Оцените качество перевода: 
Средняя оценка: 4.1 (28 votes)

Лжепричинность

Элиезер Юдковский

Флогистон — это ответ Европы XVIII века на первоэлемент огня, введённый греческими алхимиками. Зажги древесину и позволь ей сгореть. Что представляет из себя эта яркая оранжевая штука? Почему древесина превратилась в пепел? На оба эти вопроса химики XVIII века отвечали — «флогистон».

…и больше ничего. Это всё, в этом и заключался их ответ: «флогистон».

Флогистон покидал горящие вещества как видимое пламя. В результате горящие вещества теряли свой флогистон и становились пеплом, своим «истинным материалом». Огонь, помещённый в герметичный сосуд, быстро гас потому, что воздух насыщался флогистоном и больше не мог его вместить. Уголь почти не оставлял никакого пепла, потому что он почти полностью состоял из флогистона.

Разумеется, никто не использовал теорию флогистона для того, чтобы предсказать результат химического превращения. Алхимик сначала смотрел на результат, а затем при помощи флогистона объяснял его. Не было и намёка на то, чтобы флогистонщики предсказали прекращение горения в замкнутом сосуде; они, скорее, зажгли огонь в сосуде, увидели его угасание и затем сказали: «Должно быть, воздух насытился флогистоном». Теорию флогистона нельзя применить для того, чтобы выяснить, чего ты точно не сможешь увидеть. Она может объяснить всё.

Наука ещё только начинала выходить на сцену. Очень долго никто не осознавал, что в этой теории что-то не так.

Встретив лжеобъяснение, очень легко не ощутить его фальшивость: потому они и опасны.

Современные специалисты предполагают, что люди думают о причино-следственных связях, используя нечто вроде направленных ациклических графов или байесовских сетей. Поскольку шел дождь, тротуар мокрый; поскольку тротуар мокрый, он скользкий:

[Дождь] -> [Тротуар мокрый] -> [Тротуар скользкий]

Из этого можно вывести (а, имея байесовскую сеть, можно даже точно вычислить эту вероятность), что, если тротуар скользкий, то, вероятно, шёл дождь. Однако, если уже известно о мокрости тротуара, то сообщение о его скользкости не несёт в себе никакой новой информации о дожде.

Почему огонь горячий и яркий?

[«Флогистон»] -> [Огонь горячий и яркий]

Это выглядит как объяснение. И в мозгу эта информация хранится в том же формате и под тем же расширением, что и «настоящие» объяснения. Но человеческий разум неспособен автоматически определить, что стрелка, соединяющая гипотезу с её возможными следствиями, никак не ограничивает пути, которыми могут проявляться эти следствия. Эффект знания задним числом делает ситуацию ещё хуже: люди могут считать, что гипотеза действительно ограничивает происходящее, хотя на самом деле гипотеза подогнана под происходящее постфактум.

Современная трактовка вероятностных рассуждений о причинности может точно описать, в чём именно состояла ошибка флогистонщиков. Байесовские сети были разработаны для того, чтобы, кроме всего прочего, не учитывать свидетельства дважды в том случае, когда логический вывод между причиной и следствием возможен в обе стороны. Например, я добыл кусочек ненадёжной информации о том, что тротуар мокрый. Это заставляет меня подумать: «возможно, идёт дождь». Но если идёт дождь, то утверждение «тротуар мокрый» стало более правдоподобным, так? То же самое ведь касается и скользкости тротуара, верно? Но если тротуар скользкий, то он, скорее всего, мокрый — и тогда нужно опять повысить вероятность того, что идёт дождь.

Джуда Перл приводит в качестве метафоры алгоритм подсчёта солдат в колонне. Представьте, что вы стоите в колонне и видите рядом только двух солдат: одного спереди и одного сзади. Всего трое солдат. Вы спрашиваете своего соседа: «А сколько солдат видишь ты?» Он вертит головой и говорит: «Троих». Получается, всего солдат шесть. Очевидно, что так решать эту задачу совершенно не стоит.

Умнее будет спросить у стоящего впереди солдата: «Сколько солдат перед тобой?», и у стоящего позади: «Сколько солдат за тобой?». Сообщение с вопросом «сколько солдат перед тобой?» можно передать дальше без особых затруднений. Если я стою первым, то я передам назад «1 солдат впереди». Человек, стоящий прямо за мной, получит сообщение «1 солдат впереди» и скажет второму своему соседу «2 солдата впереди». В это же время кто-то получает сообщение «N солдат позади» и передаёт стоящему впереди солдату сообщение «N+1 солдат позади». Сколько же всего солдат? Сложите оба полученных числа и добавьте единицу для себя — это и есть общее число солдат в линии.

Ключевая идея состоит в том, что каждый солдат должен отдельно отслеживать эти два сообщения, прямое и обратное, и сложить их вместе только в конце. Нельзя добавлять солдат из обратного сообщения, которое ты получил, в прямое сообщение, которое ты передашь дальше. Разумеется, сообщение с общим числом солдат никогда не появляется в этой цепочке: никто не произносит этого числа вслух.

Аналогичный принцип применяется в строгих вероятностных рассуждениях о причинности. Получение из не связанного с мокрым тротуаром источника каких-либо свидетельств о дожде создаст прямое сообщение от узла [дождь] к узлу [мокрый тротуар], и тем самым усилит ожидание увидеть мокрый тротуар. Наблюдение мокрого тротуара создаст обратное сообщение, идущее к убеждению о дожде, а затем это сообщение распространится от узла [дождь] до всех его соседей, кроме узла [мокрый тротуар]. Каждый кусочек свидетельства учитывается ровно единожды; корректировки никогда не застревают между узлами, скача туда и обратно. Точный алгоритм можно найти в классической книге «Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference» Джуды Перла.

Так что же было неправильно в теории флогистона? Когда мы наблюдаем, что огонь горячий, узел [огонь] посылает обратное сообщение со свидетельством узлу [флогистон], вынуждая нас обновить убеждения о флогистоне. Но тогда мы не можем считать это успешным предсказанием теории флогистона. Сообщение должно идти в единственном направлении, не отражаясь назад.

Увы, для обновления сетей убеждений люди используют не строгий алгоритм, а его грубое приближение. Мы изучаем родительские узлы, наблюдая за дочерними узлами, и предсказываем поведение дочерних узлов, используя убеждения о родительских узлах. Но ящик с документацией по прямым сообщениям не отделён от ящика с документацией по обратным сообщениям толстой непроницаемой стеной. Мы просто помним: «флогистон горячий, и из-за этого огонь тоже горячий». Всё это выглядит так, будто теория флогистона предсказывает «горячесть» огня. Или, что ещё хуже, нам кажется: «флогистон делает огонь горячим».

Лишь после того, как кто-нибудь заметит полное отсутствие предсказаний заранее, не ограничивающий ожиданий причинно-следственный узел получит ярлык «фальшивка». До этого момента он не будет отличаться от остальных узлов в сети убеждений. Утверждение «флогистон делает огонь горячим» ощущается фактом точно так же, как и все остальные известные тебе факты.

Правильно спроектированный ИИ заметит проблему мгновенно. Для этого не понадобится какой-нибудь особенной заплатки, нужен всего лишь правильный учёт происходящего в сети убеждений (к сожалению, в отличие от правильно спроектированных ИИ, люди не способны переписывать свой исходный код, чтобы исправить найденные ошибки)

Рассуждения об «эффекте знания задним числом» — это просто способ не привлекая технических терминов рассказать о том, что люди не разделяют прямые и обратные сообщения, из-за чего прямые сообщения могут загрязняться обратными.

Люди, пошедшие по пути флогистона, не намеревались стать дураками. Ни один учёный не желает застрять в тупике. Не скрываются ли лжеобъяснения в недрах твоего разума? Если они там есть, то к ним определённо не приклеен ярлык «лжеобъяснение», и поэтому поиска по ключевому слову «фальшивка» явно недостаточно для того, чтобы их обнаружить.

Проверить, насколько хорошо теория «предсказывает» уже известные тебе факты, также недостаточно: эффект знания задним числом обесценит все усилия. Предсказывать нужно на завтра, а не на вчера. Лишь так можно быть уверенным в том, что захламлённый человеческий разум действительно посылает чистое прямое сообщение.

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
33
Оцените качество перевода: 
Средняя оценка: 4.1 (29 votes)

Семантические стоп-сигналы

Элиезер Юдковский

И ребёнок спросил:

— Откуда взялся этот булыжник?

— Я отломил его от большого камня в центре деревни.

— Откуда взялся этот камень?

— Наверное, он скатился с большой горы, что возвышается над нашей деревней.

— Откуда взялась эта гора?

— Оттуда же, откуда и все камни. Это кости Имира, изначального великана.

— Откуда появился изначальный великан Имир?

— Из мировой бездны по имени Гинунгагап.

— Откуда появилась мировая бездна Гинунгагап?

— Никогда этого не спрашивай.

Рассмотрим кажущийся парадокс первопричины. Наука отследила цепочку событий до Большого Взрыва, но отчего случился сам Большой Взрыв? Можно и нужно сказать, что Большой Взрыв произошёл в «ноль часов ноль минут», и поэтому нельзя говорить о времени «до Большого Взрыва», поскольку к этому понятию неприменима обычная концепция времени. Но, говоря так, мы используем существующие физические законы, которые звучат довольно структурировано, что тоже требует объяснений. Откуда появились физические законы? Можно ответить, что вся Вселенная является компьютерной симуляцией, но тогда это симуляция должна быть запущена в каком-то другом мире, подчиняющемся другим законам физики — а откуда взялись они?

После того, как вопросы доходят до этой стадии, некоторые люди отвечают «Бог!».

Почему кто-либо, даже очень религиозный человек, может думать, что это может хоть как-нибудь помочь ответить на вопрос о первопричине? Почему вопрос «откуда взялся Бог?» автоматически не всплывает в разуме? Утверждения «Бог не может иметь причины» или «Бог создал Себя Сам» приводят нас в то же состояние, что и «время началось вместе с Большим Взрывом». Далее следует спросить, почему существует вся эта метасистема, или почему какие-то явления могут иметь причину, а какие-то не могут.

Я ставлю цель не обсудить мнимый парадокс первопричины, а задаться вопросом, почему кто-то считает, что восклицание «Бог!» может разрешить парадокс. Восклицание «Бог!» говорит о принадлежности племени, и поэтому у людей возникает соблазн делать это как можно чаще — иногда это утверждение можно услышать даже в ответ на «почему ураган обрушился на Новый Орлеан?». Но всё же… Совершенно очевидно, что в этой конкретной головоломке «Бог» ничем не помогает. Бог не смог бы сделать парадокс менее парадоксальным, даже если бы существовал. Как можно этого не замечать?

Джонатан Уоллес предположил, что «Бог!» работает, как семантический стоп-сигнал: это не столько сознательное утверждение, сколько дорожный знак на трассе для мыслей, говорящий «дальше не думай, проезд закрыт». Восклицание «Бог!» не разрешает парадокс, а, скорее, устанавливает в нужном месте дорожный знак, чтобы остановить цепочку естественных вопросов и ответов.

Но ты — хороший и правильный атеист, и, разумеется, ни за что не попадёшься в ловушку. Но семантические стоп-сигналы не исчерпываются восклицанием «Бог!», это лишь наглядный пример.

Трансгуманистические технологии — молекулярная нанотехнология, продвинутые биотехнологии, генетическая инженерия, искусственный интеллект, и так далее — ставят нас перед лицом нелёгких политических вопросов. В какой степени правительство должно вмешиваться в выбор генов будущего ребёнка его родителями, или оно не должно вмешиваться вообще? Если родители желают дать ребёнку ген шизофрении, то следует ли им это позволить? Если улучшение интеллекта — крайне дорогостоящая процедура, то должно ли государство её обеспечивать, чтобы не допустить возникновения когнитивной элиты? Эти задачи могут выполнять различные общественные институты — например, частные благотворительные фонды, оказывающие финансовую помощь в усилении интеллекта — но в ответ на каждое такое предложение неизбежно возникает очевидный дальнейший вопрос: «Справится ли этот институт со своей задачей?». Изготовление опасных нанотехнологий может караться судебными исками, но сработает ли такая схема?

Один из моих знакомых знает ответ на любой из этих вопросов: «Либеральная демократия!». Это всё. В этом и заключается его ответ. Если же попытаться спросить: «А насколько хорошо в мировой истории либеральные демократии справлялись с такими сложными задачами?» или «А если либеральная демократия совершит глупость?», тогда вы станете автократом, либертариа́нцем, или просто очень, очень нехорошим человеком. Никто не имеет права сомневаться в демократии.

Как-то я назвал такие размышления «божественной привилегией демократии», но точнее будет сказать, что «Демократия!» была его семантическим стоп-сигналом. Если бы кто-нибудь заявил: «Пусть всё это решает «Газпром»!», то он бы начал задавать очевидные вопросы: «Почему? Что «Газпром» может тут сделать? Почему ему можно доверять в таких вопросах? Что насчёт его прошлого опыта в решении похожих по сложности задач?»

Или, представим, что кто-нибудь заявляет: «поляки строят заговор, чтобы убрать кислород из атмосферы Земли». Ты наверняка задашься вопросом зачем им это надо, чем они будут дышать и способны ли они вообще тайно преследовать единые цели. Если ты не задаёшь дальнейших вопросов после утверждения «Корпорации планируют убрать кислород из атмосферы Земли», то слово «корпорации» сработало тут как семантический стоп-сигнал.

Не забывай, что понятие «семантический стоп-сигнал» нельзя превращать в универсальный контраргумент против вещей, которые тебе не по душе («Да ну, это просто бессмыслица, приправленная семантическими стоп-сигналами!»). Слово не может быть стоп-сигналом само по себе; вопрос заключается в том, производит ли оно этот эффект на конкретного человека. Сильные эмоции по отношению к чему-то — недостаточное основание для того, чтобы назвать это стоп-сигналом. Я не одобряю террористов и не испытываю страха перед частной собственностью, но это не означает, что слова «террористы» или «капитализм» выполняют функции дорожных знаков в моём мышлении (когда-то такой эффект имело слово «интеллект», но это уже в прошлом). Семантический стоп-сигнал отличает неспособность представить следующий очевидный вопрос.

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
34
Оцените качество перевода: 
Средняя оценка: 4.2 (35 votes)

Таинственные ответы на таинственные вопросы

Элиезер Юдковский

Представь, что ты глядишь на свою руку, ничего не зная ни о клетках, ни о биохимии, ни о ДНК. У тебя есть некоторые познания в анатомии, полученные путём препарирования, поэтому тебе ясно, что в ладони есть мышцы. Однако, ты не знаешь, почему они движутся, вместо того, чтобы неподвижно лежать, как кусок глины. Твоя рука — просто кусок… эмм… вещества, и почему-то этот предмет исполняет твои мысленные приказы. Разве это не волшебство?

«Животное тело не ведёт себя, как термодинамическая система… сознание говорит каждому человеку, что он является, в какой-то степени, предметом своей воли. Это проявляется в том, что живые существа могут мгновенно прикладывать к определённым движущимся частицам материи внутри своих тел силы, направляющие движение этих частиц, для того, чтобы создавать наблюдаемые механические эффекты… Вопрос о влиянии животной или растительной жизни на материю беспредельно далёк от любых научных изысканий, начатых до настоящего времени. Сила управлять движением материи, ежедневно проявляемая в чуде свободы воли человека, и в поколениях растений, выросших из единого зерна, безгранично непохожа на любой возможный результат движения атомов, каким бы удачным он ни оказался… Современным биологам придётся запомнить ещё один принцип, и на этот раз — жизненно важный». (Лорд Кельвин)

В этом состоит теория витализма: загадочные различия между живой и неживой материей могут быть объяснены посредством «жизненной силы» («elan vital» или «vis vitalis»). «Жизненная сила» внедряется в живую материю и подчиняет её приказам сознания. Жизненная сила участвует в химических реакциях, из-за чего неживая материя не может проявлять часть свойств живой материи. В частности, без помощи жизненной силы невозможно получить живую материю из неживой; поэтому проведённый Фридрихом Вёлером химический синтез мочевины нанёс сильный удар по теории витализма, показав, что обыкновенной химии по силам получить биологический продукт.

Называть «жизненную силу» объяснением или даже лжеобъяснением вроде флогистона — значит, переоценивать эту теорию. «Жизненная сила», в первую очередь, работает, как затычка для любопытства. Ты спрашиваешь «почему?», слышишь ответ «жизненная сила!», и на этом разговор окончен.

Когда ты говоришь «жизненная сила!», тебе кажется, будто ты знаешь, почему двигается твоя рука. В твоей голове есть маленькая причинно-следственная диаграмма, которая говорит: [«жизненная сила!»] -> [рука двигается].

Однако на самом деле ты не знаешь ничего, что не знал раньше. Например, ты не сможешь сказать, будут ли твои руки отдавать или поглощать тепло, пока не пронаблюдаешь это в действительности. Ты не сможешь предсказать этого заранее. Твоё любопытство удовлетворено, но оно удовлетворено пустышкой. Раз любому наблюдению ты можешь сказать «Почему? Жизненная сила!», то витализм одинаково хорошо объясняет все исходы, не способен противоречить вообще хоть каким-нибудь фактам, является замаскированной гипотезой максимальной энтропии, и так далее.

Но главный урок нужно извлечь из благоговения виталистов пред жизненной силой, из их старания провозгласить её тайной, стоящей выше всей науки. Встретив великого дракона по имени Неизвестность, виталисты не обнажили клинков, чтобы попытаться пронзить его сердце, но мирно склонили головы в знак подчинения. Они превратили биологию в священную тайну и гордились своим невежеством, потому и не желая отказаться от незнания, когда на сцене появились свидетельства.

Великий Секрет Живого был бесконечно далёк от науки! Не просто слегка вдали, заметьте, но бесконечно далёк! Лорд Кельвин явно получал колоссальное наслаждение от незнания.

Но невежество — это то, что рисуется на карте, а не то, что можно обнаружить, гуляя по местности. Если я не имею ни малейшего представления о неком явлении, то это факт о состоянии моего разума, а не о самом явлении. Явление может быть таинственным в глазах некого определённого человека. Не существует явлений, таинственных самих по себе. Поклоняться явлению, потому что оно выглядит столь потрясающе таинственно, — означает поклоняться собственному невежеству.

Витализм, как и флогистон, заключил загадку в отдельную субстанцию. Огонь был загадкой, и теория флогистона заключила загадку в таинственную субстанцию под названием «флогистон». Жизнь была священной тайной, и витализм заключил священную тайну в таинственную субстанцию под названием «жизненная сила». Ни один из ответов не попытался сконцентрировать плотность вероятности модели, сделать какие-то результаты более ожидаемыми, чем другие. Эти «объяснения» просто закутали вопрос в твёрдый непрозрачный чёрный шарик.

В одной из комедий Мольера доктор объясняет действие снотворного тем, что в нём содержится «фактор усыпления». Тот же самый принцип. Это универсальный недочёт человеческой психики: столкнувшись с таинственным явлением, нам легче объяснить его через таинственную субстанцию с внутренне присущими ей свойствами, чем через лежащие в основе сложные процессы.

Но ещё более страшная ошибка — допущение того, что ответ может быть таинственным. Если явление кажется таинственным, то это факт о наших знаниях, а не факт о самом явлении. Виталисты увидели таинственный пробел в своих знаниях и постулировали таинственную штуку, заполняющую этот пробел. Тем самым они перемешали карту и местность. Всё недоумение и замешательство находятся в карте, а не внутри отдельных субстанций.

Именно поэтому раз за разом на протяжении всей человеческой истории люди поражаются тому, что невероятно таинственный вопрос имеет приземлённый не-таинственный ответ. Окутанными тайной могут быть только вопросы, но не ответы.

Поэтому я называю теории вроде витализма «таинственными ответами на таинственные вопросы».

Признаки таинственных ответов на таинственные вопросы:

Во-первых, объяснение работает не контроллером ожиданий, а затычкой для любопытства.

Во-вторых, в гипотезе нет движущихся частей: модель является не определённым сложным механизмом, а, скорее, просто сплошной субстанцией или силой. В гипотезе говорится, что таинственная субстанция или таинственная сила находятся вот здесь и вызывают вот это, но причина, по которой таинственная сила ведёт себя именно таким образом, инкапсулирована в пустую тавтологию.

В-третьих, люди, предлагающие это объяснение, дорожат собственным незнанием. Они с гордостью говорят о том, что обычная наука терпит поражение от этого явления, и о том, как это явление непохоже на все остальные обыденные явления.

В-четвёртых, несмотря на этот ответ, явление по-прежнему остаётся тайной, сохранив ту же степень завораживающей необъяснимости, что и вначале.

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
35
Оцените качество перевода: 
Средняя оценка: 4 (56 votes)

Тщетность эмерджентности

Элиезер Юдковский

Провалы флогистона и витализма — примеры исторического знания задним числом. Посмею ли я выступить и назвать какую-то современную теорию, которую считаю настолько же ошибочной?

Я называю эмерджентность или эмерджентный феномен — обычно определяемый как исследование систем, поведение которых на высоких уровнях являются следствием или «появляется» (to emerge) из взаимодействия многих низкоуровневых элементов. (Википедия: «То, как сложные системы и паттерны появляются из множества относительно простых взаимодействий»). Если воспринимать буквально, это утверждение подходит для любого феномена нашей вселенной, выше уровня отдельных кварков, что и является частью проблемы. Представьте, что можно показать на обвал рынка и сказать «Это не кварк!». Похоже на объяснение? Нет? Ну так и «Это эмерджентный феномен!» тоже не подходит.

Я протестую против прилагательного «эмерджентный», а не против глагола «появляется». Нет ничего плохого во том, чтобы сказать «X появляется на основе Y», где Y — специфическая, детальная модель с динамическими частями. «Возникает на» — еще один способ выразить ту же мысль: гравитация возникает из кривизны пространства-времени, в соответствии со специфической математической моделью Общей Теории Относительности. Химия возникает на основе взаимодействия атомов, в соответствии со специфической моделью квантовой электродинамики.

Представим, я буду говорить, что гравитация объясняется «возникновением», или что химия — «возникающий феномен», и утверждать, что это мое объяснение.

Слово «появляется» приемлемо, так же, как и «появляется из» или «вызвано» приемлемы, если ссылаются на специфическую модель, которую можно оценить саму по себе.

Однако, «эмерджентность» обычно используется иначе. Оно используется как объяснение само по себе.

Я уже потерял счет случаям, когда я слышал «Интеллект — эмерджентный феномен!», как объяснение интеллекта. Это применение подходит всем пунктам, характеризующим мистический ответ на мистический вопрос. Что ты узнал, сказав, что интеллект «эмерджентный»? Ты не можешь сделать новых предсказаний. Ты не знаешь ничего о поведении реальных разумов, о чем бы не знал ранее. Это воспринимается как новый факт, но ты не ожидаешь других результатов. Твое любопытство вроде бы удовлетворено, но не накормлено. Гипотеза не имеет динамических частей, нет детализированной внутренней модели для манипуляций. Те, кто предлагают гипотезу «эмерджентности», признаются в своем незнании внутреннего устройства и гордятся этим; они противопоставляют «эмерджентные» науки и «обычные».

И даже после того, как ответ «Как? Эмерджентность!» дан, феномен не перестаёт быть таинственным и обладать той же непроницаемостью, что и прежде.

Интересное упражнение: удалить прилагательное «эмерджентный» из предложения и посмотреть, изменилось ли что:

• До: человеческий интеллект — это эмерджентный результат нейронных вспышек.

• После: человеческий интеллект — это результат нейронных вспышек.

• До: поведение колонии муравьем — это эмерджентный результат взаимодействия многих отдельных муравьев.

• После: поведение колонии муравьев — это результат взаимодействия многих отдельных муравьев.

• Даже лучше: Колония состоит из муравьев. Мы можем успешно предсказывать поведение колонии, используя модели, включающие только индивидуальных муравьев, без общих переменных колонии, показывая, что мы понимаем, как поведение колонии возникает на основе поведения муравьев.

Еще одно интересное упражнение: заменять слово «эмерджентный» на старое, то, которым люди пользовались до эмерджентности:

• До: жизнь — эмерджентный феномен.

• После: жизнь — магический феномен.

• До: человеческий интеллект — это эмерджентный результат нейронных вспышек.

• После: человеческий интеллект — это магический результат нейронных вспышек.

Не правда ли, что каждое утверждение дает одинаковый объем информации о поведение феномена? Что каждая гипотеза подходит под одинаковый набор результатов?

«Эмерджентность» очень популярна, как раньше «магия» была популярна. «Эмерджентность» имеет глубокую притягательность для человеческой психологии по тем же причинам. «Эмерджентность» — такое замечательное простое объяснение, и это приятно произносить; это дает тебе священную тайну для поклонения. «Эмерджентность» популярна, потому что это «доширак» для любопытства. Можно объяснить что угодно, используя эмерджентность, так что люди это и делают; ведь это так замечательно — объяснять что-то. Люди остаются людьми, даже если посещали пару научных курсов в колледже. Найдя способ избежать оков обычной науки, они возвращаются к тем же проделкам, что и их предки, одеваясь в одежды науки, но сохраняя ту же самую видовую психологию.

Перевод: 
Muyyd
Номер в книге "Рациональность: от ИИ до зомби": 
36
Оцените качество перевода: 
Средняя оценка: 4.2 (23 votes)

Скажи нет «сложности»

Элиезер Юдковский

Однажды…

Эта история произошла во времена, когда я впервые встретил Марчелло, с которым, позже, я буду год работать над теорией ИИ, но на тот момент я еще не принял его в свои ученики. Я знал, что он участвовал в соревнованиях по математике и информатике на национальном уровне, и этого было достаточно, чтобы я захотел присмотреться к нему. Но я еще не знал, сможет ли он научиться думать об ИИ.

Я спросил Марчелло, как, по его мнению, ИИ может разработать способ решения кубика Рубика. Не в смысле написания программы, что довольно тривиально, а открытия законов вселенной Рубика и построения рассуждений об их использовании. Как ИИ изобретёт для себя концепты «оператора» или «макро», которые являются ключами для сборки кубика Рубика?

И, в процессе дискуссии, Марчелло сказал: «Ну, ИИ понадобится сложность для того, чтобы сделать Х, и для того, чтобы сделать У…»

И я сказал: «Не говори „сложность“».

Марчелло спросил: «Почему?»

Я ответил: «Сложность не должна быть самоцелью. Возможно, тебе понадобится определённый алгоритм, добавив который, ты увеличишь сложность, но сложность ради сложности лишь усложняет задачу». (Сказав это, я вспомнил о всех тех людях, что рассказывают про Интернет, который, став «достаточно сложным», «проснется» в качестве ИИ).

И Марчелло сказал: «Но должно же быть какое-то количество сложности, которое бы позволяло сделать это».

Я прикрыл глаза и попытался облечь мою мысль в слова. Для меня, говорить «сложность» - делать неправильный пируэт в танце ИИ. Никто не может думать достаточно быстро, осознанно, используя слова для выражения потока сознания, это потребует бесконечной рекурсии. Мы думаем словами, но поток нашего сознания протекает ниже уровня слов, посредством выученных остатков озарений прошлого и горького опыта…

Я спросил:

— Ты читал «Техническое объяснение технического объяснения»(English)?

— Да, — ответил Марчелло.

— Ладно! — сказал я. — Говоря «сложность», ты не помогаешь себе сконцентрировать массу вероятности.

— Ох, — сказал Марчелло, — это как с «эмерджентностью», хмх. Так… Теперь мне надо подумать, как Х может случиться по-настоящему.

Тогда я и подумал: «Возможно, это парень обучаем».

Сложность — далеко не бесполезный концепт. Она может быть определена математически, например в виде Колмогоровской сложности или размерности Вапника-Червоненкиса. Даже на интуитивном уровне, сложность стоит того, чтобы рассуждать о ней — тебе надо оценить сложность гипотезы и решить что она «слишком сложна» для имеющегося объема свидетельств или посмотреть на строение и попытаться упростить.

Но концепты сами по себе не становятся полезными или бесполезными. Использование может быть корректным или нет. Движение, которое пытался вплести в танец Марчелло, — попытка объяснения «за просто так», получить что-то в обмен на ничего. Это часто повторяемая ошибка, в моей сфере, как минимум. Можно вступить в дискуссию об Искусственном Интеллекте и наблюдать, как люди наступают на те же грабли тут и там, вновь и вновь, постоянно игнорируя собственное непонимание.

Ты и моргнуть не успеешь, а это уже произошло: проталкивание неконтролируемого причинного узла для чего-то таинственного — причинного узла, который воспринимается как объяснение, но не является таковым. Эта ошибка случается ниже уровня слов. Она не требует какого-то особенного изъяна личности: так устроено человеческое мышление по-умолчанию, так люди рассуждали с древних времен.

Чего тебе следует избегать, так это игнорирования таинственного: ты должен задержаться рядом с тайной и столкнуться с ней напрямую. Есть множество слов, способных «пронести» тайну, и некоторые из них можно вполне обоснованно применять в других контекстах, например, сложность. Но главная ошибка — игнорировать контрабанду таинственного, не замечая причинный узел, скрытый за ней. Контрабанда не является мыслью, а микромыслью. Нужно уделять пристальное внимание, чтобы заметить это. И, натренировав себя в избегании этого, можно превратить умение в инстинкт, ниже уровня слов. Нужно ощущать какие области карты пока пусты и, главное, уделять внимание этому чувству.

Подозреваю, что в научных кругах присутствует сильное давление, способствующее сокрытию таких проблем, ведь нужно выдавать бумаги с шлейфом законченности. Тебя будут больше почитать, если в твоей будто бы полной работе будет присутствовать «эмерджентный феномен», а не за незаконченную, в которой есть ярлыки «понятия не имею, как это работает» или «а тут происходит чудо». Журнал может даже не принять такую работу, ведь, кто знает, вдруг необъяснённые явления и являются моментами, где всё самое интересное происходит? И да, случается так, что все немагические части оказываются также и неважными. Это цена, которую приходится порой платить за вход в неизведанное и попытки решить проблемы мелкими шажками. Но это так же означает, что понимание того, что ты еще не закончил чрезвычайно важно. Часто люди даже не осмеливаются исследовать неизведанное, ужасно боясь потратить время впустую.

И, если ты работаешь над революционным ИИ-стартапом, то давление ещё выше, а желание спрятать проблемы ещё больше, иначе придётся признать, что ты не знаешь пока как создать ИИ, и твоя жизнь обратится в прах. Но, возможно, я слишком усложняю, ведь контрабанда происходит неосознанно. Далеко ходить за примерами не нужно: просто послушай, как люди обсуждают философию, религию или науки, в которых у них нет профессиональной подготовки.

Марчелло и я пришли к соглашению о работе с ИИ: если мы сталкиваемся с чем-то, чего мы не понимаем, а это случалось довольно часто, мы будем говорить об этом как о «магии». Например, «Х магически делает У», чтобы напоминать себе о том, что тут присутствует нерешённая проблема, провал в понимании. Гораздо полезней говорить «магия», чем «сложность», ведь последнее слово создает иллюзию понимания. Мудрей говорить «магия» и оставлять себе напоминание о работе, которую надо сделать позже.

Перевод: 
Muyyd
Номер в книге "Рациональность: от ИИ до зомби": 
37
Оцените качество перевода: 
Средняя оценка: 4.3 (19 votes)

Подтверждающее искажение: взгляд во тьму

Элиезер Юдковский

Однажды, проводя занятие у студентов, я выписал на доске три числа: 2-4-6. «Я загадал правило, — сказал я, — которому подчиняются последовательности трех чисел. Данная последовательность подходит под это правило. Каждый из вас найдет у себя на парте листы бумаги. Выпишите последовательность трех чисел на карточке, а я в зависимости от того, подходит ли последовательность под правило, напишу на листе «да» или «нет». Это можно повторять до тех пор, пока вы не будете уверены, что угадали правило. После этого вы должны записать правило внизу листа».

Вот последовательность предположений одного из студентов:

4, 6, 2 — нет,

4, 6, 8 — да,

10, 12, 14 — да.

После этого студент записал свою версию правила. Как вы думаете, что он написал? А вы бы тоже остановились здесь или хотели бы протестировать еще триплет чисел? Если да, то какой? Остановитесь здесь и немного подумайте, прежде чем продолжить чтение.

Вышеприведенное упражнение основано на классическом эксперименте Питера Уэйсона, задаче «2-4-6». Несмотря на то, что испытуемые, которым дают эту задачу, выражают большую уверенность в своих предположениях, только 21% из них успешно угадывают задуманное экспериментатором правило, и все повторные опыты продолжали показывать тот же уровень успехов в районе 20%.

Исследование называлось «On the failure to eliminate hypotheses in a conceptual task» (Еженедельник экспериментальной психологии 12: 129-140, 1960). Испытуемые, которым предлагалась задача «2-4-6», обычно пытались придумать положительные примеры, а не негативные — они применяли гипотетическое правило для создания триплета, а потом смотрели, будет ли он отмечен как «да».

Таким образом, кто-то, кто формирует гипотезу «числа, каждое из которых больше предыдущего на два», тестирует триплет 8-10-12, видит, что подходит и уверенно объявляет свое правило. Кто-то, кто формирует гипотезу Х-2Х-3Х, тестирует триплет 3-6-9, обнаруживает, что триплет подходит, и тоже объявит правило.

В каждом из этих случаев настоящее правило одно и то же: три любых числа в порядке возрастания.

Однако, чтобы додуматься до этого, вы должны придумывать триплеты, которые не должны быть правильными, такие как 20-23-26 и проверять, будут ли они отмечены как «нет». Что люди обычно не склонны делать в этом эксперименте. В некоторых случаях испытуемые изобретают, «тестируют» и объявляют правила куда более сложные, чем настоящий ответ.

Данное когнитивное явление часто валят в одну кучу с предвзятостью подтверждения. Однако, на мой взгляд, явление склонности тестирования положительных примеров, а не отрицательных, следует отделять от явления стремления защитить изначальное убеждение. «Положительное искажение» иногда используется как синоним для предвзятости подтверждения и может описывать данный недостаток куда лучше.

Раньше казалось, что теория флогистона может объяснить прекращение огня в закрытой коробке (воздух переполнился флогистоном и больше не может вместить), но теория флогистона точно так же могла бы объяснить и тот вариант, если бы огонь продолжал гореть. Чтобы заметить это, вы должны искать негативные примеры вместо положительных, смотреть на ноль, а не на единицу; что, как показал эксперимент, идет вразрез с человеческим инстинктом.

Следуя инстинкту, мы живем в половинчатом мире.

Можно днями читать про положительное искажение и всё еще не увидеть его в момент срабатывания. Положительное искажение работает не на уровне логики или даже эмоциональной привязанности. Задача 2-4-6 «холодная», логичная, не эмоционально «горячая». Ошибка находится ниже уровня слов, на уровне образов, инстинктивных реакций. Поскольку проблема появляется не из-за следования осознанному правилу, которое говорит «Думай только о положительных примерах», ее нельзя решить, сказав вслух «Мы должны думать как о положительных, так и о негативных примерах». Какие примеры автоматически всплывают в вашей голове? Вы должны уметь еще до вербального формулирования думать о негативном примере, а не о положительном. Вы должны научиться поворачиваться лицом к нулю, а не убегать от него.

Некоторое время назад я писал, что сила гипотезы определяется тем, что она не может объяснить, а не тем что может — если вы одинаково легко объясняете любой исход, то у вас ноль знаний. Так, чтобы указать на то, что объяснение не является полезным, недостаточно задуматься над тем, что оно может объяснить хорошо — вам нужно также искать результаты, которые нельзя объяснить, это и будет истинной силой теории.

Теперь, после всего сказанного напомню, что вчера я бросил вызов «сложности» как понятию. Один комментатор привел сверхпроводимость и ферромагнетизм как примеры сложности. Я ответил, что несверхпроводимость и неферромагнетизм тоже примеры сложности, в чём и состоит проблема. Но я не имел в виду критиковать комментатора! Несмотря на то, что я много читал про предвзятость подтверждения, я не воскликнул «Эврика!», когда в первый раз прочитал про задачу «2-4-6». Это невербальная реакция, работающая очень быстро, и которую надо тренировать заново. Сам я всё еще работаю над этим.

Так что большая часть навыка рационалиста находится за пределами уровня слов. Это делает трудной работу по попыткам передать Искусство через посты в блоге. Люди согласятся с вами, а уже в следующем предложении сделают нечто, ведущее совершенно в другом направлении. Не подумайте, что я жалуюсь! Основная причина, по которой я пишу здесь — наблюдать, какие из моих слов не передаются.

Прямо сейчас вы ищете положительные примеры положительного искажения или ищете, что вы могли не увидеть из-за положительного искажения? Вы смотрите во свет или во тьму?

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
38
Оцените качество перевода: 
Средняя оценка: 3.9 (55 votes)

Закономерная неопределённость

Элиезер Юдковский

В «Рациональном выборе в неопределенном мире» Робина Доуза описан эксперимент, проведенный Тверским1 2:

Множество психологических экспериментов были проведены в конце 50-х начале 60-х, в которых испытуемых просили предсказать результат события, имевшего элемент случайности и, при этом, еще и предсказуемую базовую ставку. Например, испытуемых просили предсказать цвет следующей карты (синяя/красная) при условии, что 70% карты были синими, но последовательность красных и синих карт была совершенно случайной.

В такой ситуации, стратегия, обеспечивающая большее количество успеха - ставить на наиболее часто встречающиеся события. Например, если 70% карт были синими, то предсказывая появление синей карты дает 70% успеха в каждом случае.

Испытуемые же предпочитали сопоставлять вероятности - предсказывать наиболее вероятный вариант с учетом относительной частоты появления. Например, испытуемые предсказывали появление синей карты 70% раз и красной 30% раз. Такая стратегия давала 58% долю успеха, потому что испытуемые были правы 70% времени, когда выпадала синяя карта (что происходило с вероятностью .70) и 30% времени, когда выпадала красная карта (что происходило с вероятностью 0,3); (0,7 × 0,7) + (0,3 × 0,3) = 0,58.

Даже больше, испытуемые предсказывали наиболее часто повторяющееся событие с большей вероятностью, чем оно происходило, но и близко не подходили к частоте в 100%, даже если им платили за точность их предсказаний… Например, испытуемые, которым платили по пятаку за каждое сбывшееся предсказание из тысячи,.. предсказывали [наиболее часто встречающееся событие] 76%.

Не стоит думать, что этот эксперимент про небольшие изъяны в игорных стратегиях. Он кратко рассказывает о наиболее важной идее всей рациональности.

Испытуемые продолжали выбирать красный, как будто они полагали, что способны предугадать случайную последовательность. Доуз пишет про это: «Несмотря на получение фидбека от тысячи случаев, испытуемые не могли поверить, что в это ситуации они не в состоянии предугадать».

Но ошибка должна иметь более глубокие последствия. Даже если испытуемые сформулировали какую-то гипотезу, им совершенно необязательно делать ставки на ее основе. Они могут говорить: «Если гипотеза верна - следующая карта будет красной», и ставить на синюю. Они могут выбирать синюю каждый раз, собирая как можно больше пятаков, отмечая мысленно как можно больше паттернов, которые они замечают. Если их предсказания сбываются, они могут легко переключится на новую стратегию.

Я бы не стал упрекать испытуемых за постоянное изобретение новых гипотез - откуда им знать, что цепочка за границами их способностей предсказывать? Но я буду упрекать за ставки на догадки, когда в этом не было необходимости для сбора информации, и буквально сотни предыдущих догадок были опровергнуты.

Неужто люди настолько самонадеянны?

Я бы предположил, что дело обстоит проще - стратегия «всегда-на-синее» просто не приходила испытуемым в голову.

Люди видят кучу синих карт вперемешку с несколькими красными, и полагают, что выигрышная стратегия - больше на синий, но иногда на красный.

Идея оптимальной стратегии, с учетом неполной информации, не предполагающая ставку на типичную последовательность карт - контринтуитивна.

Идея оптимальной стратегии, предполагающая законное поведение, даже если среда содержит элементы случайности - контринтуитивна.

Кажется, что твое поведение, следом за окружающей средой, должно быть непредсказуемым, но нет! Случайный ключ не отпирает случайный замок просто потому что они «оба случайные».

Ты не гасишь огонь огнем, ты гасишь огонь водой. Но эта мысль подразумевает лишний шаг, новый концепт, не активируемый напрямую формулировкой задачи. Поэтому, не приходящий в голову первым.

В дилемме красных и синих карт наше неполное знание говорит нам ставить в каждом раунде на синюю. Совет, даваемый нам нашим неполным знанием, одинаков от раунда к раунду. Если 30% времени мы будем идти против нашего неполного знания и ставить на красную карту, мы будем проваливаться, ведь теперь, мы нарочно тупим, ставя на, как нам прекрасно известно, менее вероятный исход.

Если ты будешь ставить на красную карту в каждом раунде, то ты будешь проигрывать так, как это максимально возможно; ты будешь на 100% тупым. Если ты ставишь на красную карту 30% времени, то ты оказываешься на 30% тупым.

Если твое знание неполно, если реальность, как кажется, содержит элемент случайности - случайное поведение не решит проблему. Делая свое поведение случайным, напротив, ты уводишь себя от цели, а не приближаешь. Если реальность туманна, выбрасывание интеллекта лишь ухудшает ситуацию.

Это контринтуитивно - думать, что оптимальная стратегия предполагает законное поведение, даже в условиях неопределенности.

Поэтому не так уж много вокруг рационалистов; для большинства, восприятие хаотичного мира предполагает хаотичные стратегии борьбы с ним. Тебе надо сделать лишний шаг, подумать мысль, не приходящую в голову первой, для того, чтобы сообразить что-то иное для борьбы с огнем, чем огонь.

Ты слышал, как непросвещенные говорят: «Рациональность работает лишь при взаимодействии с рациональными людьми, но мир нерационален». Но выбрасывание собственной рациональности, при встрече с нерациональным оппонентом, не поможет. Есть законные формы мышления, которые все же генерируют наилучший ответ, даже при встрече с оппонентом, нарушающим законы. Теория принятия решений не сгорает синим пламенем при встрече с оппонентом, не подчиняющимся этой теории.

Это настолько же не очевидно, как и всегда ставить на синюю карту, при встрече с совокупностью синих и красных карт. Но каждая ставка на красную - ожидаемый проигрыш, как и каждое отступление от принципов Пути, когда рассуждаешь.

Как много эпизодов Звездного Пути опровергается? Как много теорий ИИ?

  • 1. Dawes, Rational Choice in An Uncertain World; Yaacov Schul and Ruth Mayo, “Searching for Certainty in an Uncertain World: The Difficulty of Giving Up the Experiential for the Rational Mode of Thinking,” Journal of Behavioral Decision Making 16, no. 2 (2003): 93–106, doi:10.1002/bdm.434.
  • 2. Amos Tversky and Ward Edwards, “Information versus Reward in Binary Choices,” Journal of Experimental Psychology 71, no. 5 (1966): 680–683, doi:10.1037/h0023123.
Перевод: 
Muyyd
Номер в книге "Рациональность: от ИИ до зомби": 
39
Оцените качество перевода: 
Средняя оценка: 4.2 (12 votes)

Моя дикая и безбашенная юность

Элиезер Юдковский

Говорят, что всё, что родители запрещают делать детям, они делали сами — так они знают, почему это делать не стоит.

Давным-давно, в непостижимо далеком прошлом, я был преданным Традиционным Рационалистом, думая о себе, как о квалифицированном, в соответствии с ее стандартами, тем не менее, я не знал тогда Пути Байеса. Когда юный Элиезер столкнулся с кажется-мистическим вопросом, принципы Традиционной Рациональности не остановили его от производства Таинственного Ответа. Это, на данный момент, моя самая постыдная ошибка, думать о которой мне до сих пор больно.

Что за таинственный ответ на таинственный вопрос? Этого я говорить не стану, так как это длинная и запутанная история. Я был молод, был всего лишь Традиционным Рационалистом, который не ведал учения Тверски и Канемана. Я знал про Бритву Оккама, но не про конъюнктивное заблуждение. Я полагал, что мне удастся думать сложные мысли самому, в том же стиле, который я наблюдал в научных книгах, но не осознавал, что единственно верная сложность — та, где каждый шаг описан с безжалостной точностью. Сегодня, одним из главных советов, который я даю начинающим рационалистам: «Не пытайтесь строить сложных цепочек рассуждений и планов».

Нет нужды говорить больше: даже после того, как я придумал мой «ответ», феномен не потерял свою таинственность и непрошибаемость, которые имел с самого начала.

Не стоит думать, что юный Элиезер был глуп. Все те ошибки, в совершении которых виновен Элиезер, совершаются солидными учеными и в солидных изданиях и сегодня. Ему потребовался более утонченный навык, чем то, что могла дать Традиционная Рациональность.

Действительно, юный Элиезер старательно и кропотливо следовал предписаниям Традиционной Рациональности, сбиваясь при этом с пути.

Как Традиционный Рационалист, юный Элиезер внимательно следил, чтобы его Таинственный Ответ делал прямое предсказание будущего опыта. Конкретно, я ожидал, что будущие неврологи откроют использование квантовой гравитации нейронами, а ля Сэр Роджер Пенроуз. Подразумевалось, что нейроны будут обладать некоторой мерой квантовой запутанности, а это можно обнаружить наблюдениями, или не обнаружить. Ты либо будешь наблюдать это, либо нет, так ведь?

Но моя гипотеза не делала ретроспективных предсказаний. Ведь согласно Традиционной Науке, они не считаются — так что зачем тратить силы на их производство? Но для Байесовского Агента, если гипотеза сегодня не имеет предпочтительных отношений правдоподобия над «я не знаю», возникает вопрос: почему ты веришь сегодня во что-то более сложное чем «я не знаю». Но я не ведал Пути Байеса, так что я не думал про отношения правдоподобия или фокусирование плотности вероятности. Я ведь Сделал Фальсифицируемое Предсказание; разве не таков Закон?

Как Традиционный Рационалист, юный Элиезер был внимателен и не верил в магию, мистицизм, углеродный шовинизм и все такое прочее. Я гордо провозглашал, что мой Мистический Ответ «Такая же физика, как и вся остальная физика!». Как будто можно спасти магию от когнитивной изоморфности магии, называя ее квантовой гравитацией. Но я не ведал Пути Байеса и не видел уровень, на котором моя идея становилась изоморфна магии. Я отдавал мою верность физике, но это не спасло меня; какое дело теории вероятностей до чьей-либо верности? Я избегал всего, что запрещала мне Традиционная Рациональность, но даже то, что оставалось — было магией.

Не сомневайтесь, моя верность Традиционной Рациональности помогла мне выбраться из ямы, что я выкопал для себя. Если бы я не был Традиционным Рационалистом, со мной было бы покончено. Но Традиционной рациональности было все еще недостаточно. Это уводило меня от запрещенных ошибок, но приводило к другим.

Когда я думаю о себе, осторожно следовавшем правилам Традиционной Рациональности, получая при этом неверный ответ, то начинаю понимать, почему люди, называющие себя «рационалистами» не правят миром. Нужно дофига и больше рациональности, прежде чем она приведет хоть куда-то, а не к новым интересным ошибкам.

Традиционная Рациональность преподается как искусство, а не как наука. Читаешь биографии известных физиков, описывающие уроки, которым их научила жизнь, и стараешься делать то же, что и они. Но ты не прожил их жизнь, и половина того, что они описывают — инстинкт, который выработался у них.

Традиционная Рациональность сделана так, что было бы приемлемым для меня провести следующие тридцать лет, исследуя мою глупую идею, пока я был бы способен фальсифицировать её, со временем, и был бы честен сам с собой по поводу предсказаний, которые делает моя гипотеза, столкнувшись с опровержением, и прочее и прочее. Этого достаточно для того, чтобы Колесо Науки двигалось вперед, но немного жестоко по отношению к тем, кто тратит по тридцать лет своей жизни. Традиционная рациональность — прогулка, не танец. Она предназначена привести тебя к ответу, в итоге, но позволяет слишком тратить время на любование цветами по пути.

Традиционные Рационалисты могут согласиться не соглашаться. Традиционная Рациональность не имеет идеи о том, что рассуждения — точно искусство, предполагающее, что есть лишь одна корректная вероятность, с учетом имеющихся свидетельств. В Традиционной Рациональности тебе позволено гадать и тестировать свои догадки. Но опыт подсказывает мне, что если ты гадаешь, не зная, то получаешь неправильный ответ.

Путь Байеса тоже неточное искусство, насколько я его освоил пока. Эти статьи все еще пытаются передать словами то, что лучше будет постигнуто опытом. Но, по крайней мере, тут в основе лежит математика, плюс, экспериментальные свидетельства когнитивной психологии по поводу того, как люди действительно думают. Может быть, этого будет достаточно, чтобы преодолеть стратосферических размеров порог дисциплины, позволяющей получать правильные ответы, вместо новых интересных ошибок.

Перевод: 
Muyyd
Номер в книге "Рациональность: от ИИ до зомби": 
40
Оцените качество перевода: 
Средняя оценка: 3.4 (49 votes)

Неспособность учиться у истории

Элиезер Юдковский

Однажды, во времена моей дикой и безбашенной юности, когда я еще не ведал Пути Байеса, я дал Таинственный Ответ на вроде бы таинственный вопрос. Это стало следствием цепочки из множества ошибок, однако, среди них была одна критическая: юная версия меня не осознавала, что получение ответа должно делать вопрос менее запутанным. Я пытался объяснить Таинственный Феномен, что означало — дать причину для него, вписывающуюся в интегрированную модель реальности. Почему же это должно было сделать феномен менее Таинственным, когда такова его природа? Я ведь пытался объяснить Таинственный Феномен, а не превратить (посредством какой-то неведомой алхимии) в обыденный, такой, который вообще не потребует странного объяснения.

Будучи Традиционным Рационалистом, я был в курсе историй о астрологии и астрономии, алхимии и химии, витализма и биологии. Но Таинственный Феномен был не таким. Он был чем-то новым, чем-то странным, чем-то более сложным, чем-то, чему обычная наука не могла дать объяснение на протяжении веков…

…как будто звезды и материя, и жизнь не были таинственными в течении сотен и тысяч лет, с самого восхода человеческой мысли, до того момента, как наука взяла и решила их…

Мы узнаём про астрономию и химию, и биологию в школе; нам кажется, что эти знания всегда были частью сферы научного знания, что они никогда не были таинственными. Когда наука бросает вызов новой Великой Загадке, дети этого поколения проявляют скепсис, ведь они не видели, что наука способна объяснить что-то, кажущееся мистическим для них. Наука годится лишь для объяснения научных субъектов, вроде звёзд или материи с жизнью.

Я думал, что урок истории в том, что астрологи с виталистами и алхимиками имели особый изъян характера, тенденцию в пользу таинственности, что и приводило их к таинственным объяснениями совершенно не-таинственных вопросов. Но правда ведь, если феномен странный — объяснение тоже должно быть странным?

Лишь позже, когда я начал видеть обыденную структуру внутри тайны, я начал понимать, на месте кого же я оказался. Лишь позже я понял, насколько разумным казался витализм в то время, насколько неожиданным и смущающим оказался ответ вселенной: «Жизнь обыденная, ей не требуется странных объяснений».

Мы изучаем историю, но мы не живём ей, не переживаем этот опыт. Если бы только я постулировал астрологическую тайну и позже открыл бы механику Ньютона, постулировал алхимическую тайну и открыл бы химию, постулировал бы витализм и открыл бы биологию. Я бы посмотрел на мой Таинственный Ответ и решил бы: ни за что на свете, я не попадусь на это снова.

Перевод: 
Muyyd
Номер в книге "Рациональность: от ИИ до зомби": 
41
Оцените качество перевода: 
Средняя оценка: 4.6 (16 votes)

Делая историю доступной

Элиезер Юдковский

Есть такая привычка мышления, которую я называю ошибкой обобщения на основе вымышленного свидетельства. Журналисты, которые, например, ведут речь про Терминатора, в обсуждении про ИИ, не относятся к этому сюжету, как к пророчеству или свершившейся правде. Но фильм приходит на ум, он доступен, как будто-то бы он является иллюстрированным историческим случаем. Как если бы журналисты видели, как это случилось на какой-то другой планете, и может произойти и на нашей. Подробней про это в секции 7 в «Когнитивных искажениях, влияющих на оценку глобальных рисков»1.

Есть и обратная обобщению на основе вымышленного свидетельства ошибка: неспособность в достаточной степени учитывать исторические свидетельства. Проблема с обобщением на основе вымышленного свидетельства в том, что оно вымышленное — оно никогда не происходило. Оно не начертано на основе того же распределения, что и наша вселенная; художественная литература систематически отличается от реальности. Но история же действительна случилась и должна быть доступной.

В мире наших предков не было фильмов; всё, что ты видел своими глазами, было правдой. Стоит ли удивляться, что вымысел, который мы видим в реалистичном кино, оказывает на нас такое серьезное влияние? Наоборот, то, что реально происходило, доступно нам на бумаге; оно произошло, но мы не видели этого. Мы не помним, что это происходило с нами.

Обратная ошибка — обращаться с историей как с обычными рассказами, анализировать той же частью разума, что используется при чтении новелл. Ты можешь произнести, что это «правда», а не «вымысел», но это не означает, что ты воспринимаешь это так серьезно, как следовало бы. Множество искажений являются следствием недостаточно серьезного восприятия сухой, абстрактной информации.

Однажды, я дал Таинственный Ответ на таинственный вопрос, не осознавая, что совершаю ту же самую ошибку, что и астрологи, придумавшие мистическое объяснение звёздам, или алхимики, придумавшие мистические свойства материи, или виталисты, постулировавшие мутное «élan vital» для объяснения биологии.

Когда я посмотрел на ситуацию с другой стороны, то ощутил шок неожиданной связи с прошлым. Я осознал, что изобретение и уничтожение витализма, о котором я читал лишь в книгах, действительно происходило с реальными людьми, которые переживали опыт так же, как и я переживал изобретение и разрушение моего собственного таинственного ответа. И я понял, что если бы я действительно переживал опыт прошлого, если бы я жил во времена научных революций, а не читал о них в книгах, я, вероятно, не совершил бы эту же ошибку снова. Я бы не стал изобретать очередной таинственный ответ; достаточно было бы тысяч предыдущих.

Итак, — подумал я, — для того, чтобы действительно ощутить силу истории, я должен думать, как Элиезер, живший в прошлом, должен думать о событиях так, как если бы они случились со мной (с соответствующей переоценкой искажения доступности исторической литературы — мне следует помнить себя тысячей крестьян на одного лорда). Я должен погрузить себя в историю, вообразить жизнь сквозь эры, которые я наблюдал лишь посредством чернил на бумаге.

Почему мне следует помнить полёт Братьев Райт? Меня там не было. Но, как рационалист, посмею ли я не помнить, если событие действительно произошло? Действительно ли есть большая разница, видеть событие собственными глазами — что, по сути, представляет собой воздействие отраженных фотонов и даже не прямой контакт, — и наблюдать событие через книгу по истории? Фотоны и книги по истории спускаются по цепочке причин и следствий от самого события.

Мне нужно было пересилить ложную амнезию, вызванную рождением в конкретную эпоху. Я должен был вспомнить, сделать доступными все воспоминания, а не только те, что чисто случайно принадлежат мне и моему времени.

Земля внезапно стала старше.

С точки зрения моих старых воспоминаний, Соединённые Штаты существовали всегда — не было времени, когда не было бы Соединённых Штатов. Я не помнил, до того момента, как поднялась Римская Империя, принесла мир и порядок, и, просуществовав множество веков, что я даже забыл, что могло быть иначе, пала, и варвары захватили мой город, и знание, которым я обладал, было потеряно. Современный мир стал более хрупким для меня, ведь я перестал воспринимать его, как мой первый современный мир.

Так много ошибок, снова и снова, ведь я не помнил, что совершал их в каждой эре, в которой я никогда не жил.

Только представьте, люди ещё удивляются, почему преодоление искажений важно.

Неужели ты не помнишь, как много раз ошибки убивали тебя? Я заметил, что внезапная амнезия часто следует сразу за роковой ошибкой. Но поверьте мне, это случалось. Я помню, хоть меня там и не было.

Так что в следующий раз, когда ты усомнишься в странности будущего, вспомни, как ты был рожден в племени охотников-собирателей тысячи лет назад, когда еще никто не знал о Науке. Вспомни, как ты был шокирован до глубины души, когда Наука объяснила великие и ужасные священные тайны, которые ты так восхвалял. Вспомни, как ты думал, что сможешь летать, если съешь нужный гриб, как ты разочарованно усвоил, что никогда не сможешь полететь, а потом полетел. Вспомни, как ты всегда думал, что рабство — это правильно и хорошо, а потом передумал. Не надо воображать, как бы ты мог предсказать перемены — ведь это проявление амнезии. Вспомни, что на самом деле ты не угадал. Вспомни, как век за веком мир менялся так, как ты и представить не мог.

Может так ты будешь менее шокирован тем, что будет дальше.

  • 1. Eliezer Yudkowsky, “Cognitive Biases Potentially Affecting Judgment of Global Risks,” in Global Catastrophic Risks, ed. Nick Bostrom and Milan M. Ćirković (New York: Oxford University Press, 2008), 91–119.
Перевод: 
Muyyd, Abel
Номер в книге "Рациональность: от ИИ до зомби": 
42
Оцените качество перевода: 
Средняя оценка: 4.6 (19 votes)

Объяснить, поклониться, пренебречь

Элиезер Юдковский

Наше племя бродит по лугам в поисках съедобных растений и добычи, а с неба время от времени льётся вода.

— Почему с неба иногда падает вода? — спрашиваю я у бородатого мудреца нашего племени.

Старик погружается в размышления, — он никогда не задавался этим вопросом раньше — и через некоторое время отвечает:

— Иногда небесные духи сражаются, и во время этих битв с небес капает их кровь.

— Откуда появились небесные духи? — спрашиваю я.

Голос старца превращается в шепот:

— Они зародились в далёком прошлом в таких далях и безднах, что нам и не снились.

Твоё незнание причин, по которым идёт дождь, предоставляет тебе несколько вариантов действий. Во-первых, ты можешь просто не спрашивать «почему?» — не уделять вопросу никакого внимания или просто вообще никогда не задаваться этой мыслью. Это — команда «пренебречь», и именно её изначально выбрал старец. Во-вторых, ты можешь попытаться придумать какое-нибудь объяснение, то есть выбрать команду «объяснить», как сделал старец в ответ на первый вопрос. В-третьих, ты можешь смаковать тайну, выбрав команду «поклониться».

Прочитав эту историю, трудно не заметить то, что каждый выбор «объяснить», если всё получится, предоставляет тебе объяснение (например, «небесные духи»). Но это объяснение вновь возвращает нас к трилемме: объяснить, поклониться, пренебречь? После каждого нажатия «объяснить» наука трещит своими шестернями, возвращает ответ, и затем всплывает новое диалоговое окно. Рационалисты считают своим долгом постоянно нажимать «объяснить», но это выглядит, как дорога без конца.

Нажмёшь «объяснить» для жизни — получишь химию. Нажмёшь «объяснить» для химии — получишь атомы. Нажмёшь «объяснить» для атомов — получишь электроны и нуклоны. Нажмёшь «объяснить» для нуклонов — получишь хромодинамику и кварки. Нажмёшь «объяснить» для того, чтобы узнать, откуда взялись кварки — вернёшься во времена Большого Взрыва…

Если нажать «объяснить» для Большого Взрыва, то придётся некоторое время подождать, пока наука, треща своими шестернями, будет искать ответ. И, возможно, она когда-нибудь вернёт замечательное объяснение — но это повлечёт за собой ещё одно диалоговое окно. И, если мы продолжим достаточно долго, то мы должны увидеть особенное диалоговое окно с Объяснением, Не Требующим Объяснения, и оно закончит эту цепочку. Возможно, это будет самое важное объяснение из числа всех объяснений: как уже известных, так и тех, что ещё станут известными человеку.

Погодите! Я только что нажал «поклониться».

Не забывайте, что поклоняться можно по-разному. Поклоняться можно и не зажигая свечей вокруг алтаря.

Если бы я сказал «Хм, это какой-то парадокс. Интересно, как он разрешается?», то это означало бы, что я нажал «объяснить» и теперь терпеливо жду ответа.

И если весь вопрос кажется тебе неважным, или неуместным, или тебе кажется, что лучше подумать о нём потом — значит, ты нажал «пренебречь».

Выбирай кнопку с умом.

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
43
Оцените качество перевода: 
Средняя оценка: 4.4 (29 votes)

«Наука» — затычка для любопытства

Элиезер Юдковский

Представьте что я, находясь под наблюдением телекамер, поднял руки, произнёс «абракадабра!» — и произвёл слепящий сгусток света, висящий в воздухе невдалеке от моих вытянутых рук. Представьте, что я осуществил этот акт отъявленной, безошибочно-подлинной магии под прямым наблюдением со стороны Джеймса Рэнди (известный скептик и разоблачитель псевдонаучных теорий — прим. перев.) и всех армий скептиков. Думаю, большинству людей будет довольно любопытно, что же здесь происходит.

А теперь представим, что я не отправлялся на телевидение. Я не хочу делиться ни своей силой, ни правдой, которая за ней стоит. Я хочу, чтобы моя магия оставалась в секрете. Но при этом я хочу также иметь возможность пользоваться ею где и когда захочу. Я хочу призывать сгусток света, чтобы почитать книгу в поезде — но так, чтобы при этом никому не становилось любопытно. Есть ли заклинание, останавливающее любопытство?

Конечно есть! Когда кто-то спрашивает: «Как ты это сделал?», я просто отвечаю: «Наука!»

Это не столько настоящее объяснение, сколько эдакая «затычка для любопытства». Оно не говорит, станет ли свет ярче или потускнеет, изменятся ли тон или насыщенность его цвета, и, конечно же, не объясняет, как сделать такой огонёк самому. Вопрошающий не получил новых знаний, которых у него не было до того, как я произнёс магическое слово. Но он отворачивается, удовлетворившись тем, что не происходит ничего необычного.

Что ещё лучше, тот же трюк работает с обыкновенным выключателем света. Клацаем выключателем — и загорается лампочка. Почему? В школе нам объясняют, что паролем для лампочки накаливания является «Электричество!». Надеюсь, что к данному моменту вы уже не столь склонны к тому, чтобы обозначать лампочку «понятой» на основе такого «объяснения». Позволяет ли фраза «Электричество!» проводить расчёты, контролирующие ожидания? Нужно ещё много чего изучить! (Физики должны проигнорировать этот абзац и заменить его проблемой в эволюционной теории, где суть теории, опять-таки, заключается в вычислениях, которые умеет проводить очень малое количество людей).

Если бы вы считали, что лампочка накаливания научно необъяснима, она захватила бы всё ваше внимание. Вы бы бросили все дела и занялись бы исключительно лампочкой.

Но что значит фраза «научно объяснима»? Она значит, что кто-то ещё знает, как работает лампочка. Когда вам говорят, что лампочка «научно объяснима», вы не узнаёте ничего нового; вы не знаете, загорится ли лампочка ярче или потускнеет. Но раз кто-то уже знает о лампочке, эти знания в ваших глазах уже не так ценны. Вы становитесь менее любопытным.

Кто-то обязан сказать: «Если лампочка была неизвестна науке, вы можете получить славу и богатство исследуя её». Но я не говорю о жадности. Я не говорю о карьерных амбициях. Я говорю о чистом любопытстве—чувстве интереса. Почему ваше любопытство должно уменьшаться, если кто-то, не вы, знает как работает лампочка? Это ли не призрак? Для вас недостаточно знать; другие люди должны также быть невежественны, иначе вы не будете счастливы?

Хорошо, что знание может служить не только любопытству, как например социальная полезность технологий. Для таких инструментальных благ это важно как некоторая сущность в локальном пространстве знаний. Но что это должно значить для моего любопытства?

Кроме того, учитывайте последствия если вы допускаете «кто-то ещё знает ответ» в качестве семантического стоп-сигнала.

Однажды вы заходите в вашу комнату и видите гигантского зелёного слона, по видимому парящего в воздухе, окружённого аурой серебристого света. Вы скажете: «Какого чёрта?»

И голос, исходящий сверху от слона, говорит:

Кто-то уже знает почему слон здесь.

«О, — говорите вы. — Тогда это не важно». И идёте в кухню, как ни в чём не бывало.

Я не знаю великую единую теорию для законов физики этой вселенной. Я также многого не знаю о человеческой анатомии за исключением мозга. Я не могу указать где у меня почки, и я не могу тотчас вспомнить что делает моя печень.(Я не горжусь этим. Увы, со всей той математикой, которую мне нужно исследовать, я, скорее всего не научусь анатомии в какое-либо ближайшее время)

Следует мне, столь далеко как простирается любопытство, быть более заинтересованным моим незнанием элементарных законов физики, когда факт, что я немногое знаю о том, что происходит внутри моего тела?

Если бы я поднял свои руки и сотворил заклинание света, вы бы заинтересовались. Следует ли вам быть менее заинтересованным самим фактом поднятия моих рук? Когда вы поднимаете руку и водите ладонью вокруг, этот акт воли координируется (превыше других зон мозга) вашим мозжечком. Я поспорю, вы не знаете как работает мозжечок. Я знаю немного поверхностных деталей, недостаточных для проведения вычислений… но что с того? Какое имеет значение, если вы не знаете? Почему должен быть двойной стандарт любопытства для колдовства и движений рук?

Осмотрите себя в зеркале. Знаете ли вы, на что смотрите? Знаете ли вы, что выглядывает из-за ваших глаз? Знаете, чем вы являетесь? На некоторые из этих вопросов Наука знает ответы, на некоторые нет. Но почему это различие значимо для вашего любопытства, если вы не знаете?

Вы знаете, как работают ваши колени? Вы знаете, как сделана ваша обувь? Вы знаете, как светится ваш монитор? Вы знаете, почему вода мокрая?

Мир вокруг вас полон загадок. Расставляйте приоритеты, если вам нужно. Но не жалуйтесь, что жестокая наука опустошила мир тайн. С таким рассуждением я могу заставить вас проглядеть слона в вашей комнате.

Перевод: 
Muyyd
Номер в книге "Рациональность: от ИИ до зомби": 
44
Оцените качество перевода: 
Средняя оценка: 4.6 (18 votes)

Поистине часть тебя

Элиезер Юдковский

Классическая работа Дрю МакДермота «Искусственный интеллект и естественная глупость» критикует ИИ программы, которые пытаются представить понятия вроде счастья, как состояние ума, при помощи семантической сети: 1


СОСТОЯНИЕ-УМА
^
| ЭТО
|
СЧАСТЬЕ

И разумеется, внутри узла СЧАСТЬЕ ничего нет. Это просто токен языка Лисп с говорящим английским названием.

И вот, МакДермот пишет: «Для дисциплинированного программиста хорошим тестом будет использование gensyms в ключевых местах, чтобы посмотреть будет ли все ещё восхищаться системой, если СОСТОЯНИЕ-УМА будет переименовано в G1073…» мы получим ЭТО (СЧАСТЬЕ, G1073) «что выглядит далеко не столь впечатляюще».

Или если я слегка перефразирую идею: если ты заменишь случайными символами вообще все осмысленные английские слова, то ты никак не поймёшь, что означает G1071 (G1072, 1073). Эта программа ИИ описывает гамбургеры? Яблоки? Счастье? Кто знает? Если ты удалишь все говорящие английские названия, обратно они не вернутся.

Представим, что физик сказал тебе: «Свет — это волны», и ты ему полностью поверил. У тебя в голове появилась маленькая сеть:

ЭТО(СВЕТ, ВОЛНЫ)

И если кто-то вдруг спросит «Из чего состоит свет?», ты сможешь ответить «Из волн!»

Как пишет МакДермот: «Проблема в том, чтобы слушатель заметил, что именно ему сказали. Не „понял“, а всего лишь „заметил“». Предположим, что физик сказал бы тебе «Свет сделан из мелких изгибающихся штучек» (на всякий случай: это неправда). Заметишь ли ты разницу в ожидаемом опыте?

Как можно понять, что не стоит доверять кажущемуся знанию «Свет — это волны»? Один из способов: «смогу ли я восстановить это знание, если оно почему-то исчезнет из моей головы?»

Это похоже по духу на замену говорящих английских названий из программы ИИ с целью узнать, сможет ли кто-то понять к чему они должны «относиться». Также здесь можно привести пример Искусственного Вычислителя, который запрограммирован записывать и выдавать ПРИБАВИТЬ(СЕМЬ, ШЕСТЬ) = ТРИНАДЦАТЬ. Он, разумеется, не сможет восстановить это знание, если стереть его из его памяти (если только ещё кто-нибудь не запишет его обратно). Аналогично и знание «Свет — это волны» будет потеряно безвозвратно, если только ты не спросишь о нём заново у физика. Ты не сможешь создать это знание сам, как может это сделать физик.

Тот же опыт, что заставляет нас формулировать убеждения, соединяет их с другими нашими знаниями, чувственными входными данными или моторными выходными данными. Если ты увидишь, как бобёр грызёт дерево, то ты будешь знать как «зверь-что-грызёт-дерево» выглядит и сможешь опознать его в будущем, независимо от того, будут ли его называть «бобром» или как-то иначе. Но если ты приобрёл свои убеждения о «бобрах», когда кто-то другой рассказал тебе факты о «бобрах», то, возможно, ты не опознаешь бобра, если его увидишь.

Знание, которое ИИ не сможет восстановить сам — чудовищная опасность. Это так же опасно, как говорить кому-то факты о физике, которые он не в состоянии проверить сам. Ведь физики, говоря «волны», имеют ввиду не «мелкие кривые штучки», а чисто математическое понятие.

Как заметил Давидсон, если ты веришь, что «бобры» живут в пустынях, что они белого цвета, а взрослые особи весят полтора центнера, то у тебя вообще отсутствуют какие-либо убеждения о бобрах: ложные или правдивые. Твои убеждения о бобрах недостаточно верны, чтобы быть ложными2. Если у тебя нет достаточно опыта, чтобы восстановить убеждение в случае, если оно будет удалено, то есть ли у тебя опыт, позволяющий соединить это убеждение с чем-нибудь вообще? Витгенштейн: «Колесо, которое можно свободно вращать, не задевая других частей, не является частью механизма».

Почти сразу же, когда я начал читать про ИИ, даже до того, как я начал читать МакДермота, я понял, что постоянно спрашивать себя «Как бы я смог восстановить это знание, если оно будет удалено из моего разума?» — это очень хорошая идея.

Чем обширней удаление, тем строже тест. Если удалить доказательства теоремы Пифагора, смогу ли я доказать её заново? Думаю, да. Если удалить всё знание о теореме Пифагора, догадаюсь ли я о ней, чтобы доказать её заново? Сложно поставить такой эксперимент. Однако, если бы мне дали прямоугольный треугольник с длиной сторон 3 и 4 и сказали бы, что гипотенуза вычисляема, думаю, я бы смог её вычислить, при условии, что другие мои знания математики остались при мне.

Как насчёт самого понятия математического доказательства? Если бы мне никто не говорил о нём, мог бы я изобрести его, основываясь на моих оставшихся убеждениях? Ведь когда-то люди не знали о такой идее. Кто-то же её придумал. Что же он заметил? Замечу ли я, если увижу что-то такое же новое и не менее важное? Окажусь ли я способен на оригинальное мышление?

Как много своих знаний ты смог бы восстановить самостоятельно после удаления? Какова допустимая глубина удаления? Это не просто проверка для отсеивания недостаточно связанных убеждений. Такие размышления позволяют впитать целый фонтан знаний, а не всего лишь один факт.

Пастух строит систему учёта овец, которая работает, если добавлять камень в корзину каждый раз, когда овца покидает амбар, и изымать - когда овца возвращается. Если ты, ученик, не понимаешь работу этой системы, если для тебя это магия, которая непонятно почему работает, то ты не поймёшь, что делать, если случайно бросишь лишний камень в корзину. Если ты не можешь что-то создать сам, ты не сможешь это и восстановить, если ситуация этого потребует. Ты не сможешь вернуться к истокам, подправить параметры и заново получить результат, если у тебя нет истоков. Предположим, тебе известен факт «два плюс четыре равно шести». Один из элементов изменяется на «пять». Как ты узнаешь, что «два плюс пять равно семи», когда всё, что ты знаешь: «два плюс четыре равно шести»?

Если ты видишь, как маленькое растение роняет семя каждый раз, когда мимо пролетает птица, ты не догадаешься, что ты можешь использовать эту отчасти автоматизированную систему для подсчёта овец. Если бы первый изобретатель узнал об этом факте, он мог бы его использовать для улучшения своей системы. Однако, ты не в состоянии вернуться к истокам и переизобрести новую систему подсчёта.

Если источник мысли находится внутри тебя самого, то с приобретением новых знаний и навыков мысль может меняться. Она поистине становится частью тебя и растёт вместе с тобой.

Старайся стать источником для всех своих мыслей, стоящих обдумывания. Если мысль первоначально пришла извне, убедись, что она также исходит изнутри. Постоянно спрашивай себя: «Как я восстановлю это знание, если оно исчезнет?» Найдя ответ на этот вопрос, представь, что знание, которое помогло бы тебе в таком случае, тоже удалено. И когда увидишь фонтан - посмотри, что ещё из него течёт.

  • 1. Drew McDermott, «Artificial Intelligence Meets Natural Stupidity», SIGART Newsletter, no. 57 (1976): 4–9, doi:10.1145/1045339.1045340.
  • 2. Richard Rorty, «Out of the Matrix: How the Late Philosopher Donald Davidson Showed That Reality Can’t Be an Illusion», The Boston Globe (October 2003).
Перевод: 
Muyyd, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
45
Оцените качество перевода: 
Средняя оценка: 4.4 (16 votes)

Простая истина

Элиезер Юдковский

Как-то я писала сочинение об экзистенциализме. Учительница тогда вернула мне его с двойкой. Она подчеркнула слова „истина“ и „истинный“ и поставила знаки вопроса на полях напротив каждого, всего раз 20. Она хотела знать, что я имела в виду под истиной.

Даниэла Эган (журналист)

Предисловие автора

Это эссе написано, чтобы восстановить наивное представление об истине.

Допустим, кто-то говорит вам: «Моё чудодейственное лекарство избавит вас от рака лёгких всего за три недели». Вы говорите: «Но я знаю о результатах клинических исследований: ваше утверждение не соответствует истине». А этот кто-то отвечает: «Понятие „истина“ довольно неточно, что вы называете истиной?»

Многие люди, поставленные перед этим вопросом, не будут знать, как ответить с достаточной точностью. Тем не менее, будет крайне неразумным отказаться от концепции истины. Было время, когда никто не знал точную формулу тяготения – и всё же, шагнув с обрыва, вы бы разбились и тогда.

Часто, особенно в интернет-дискуссиях, я встречал чьи-то заявления «X истинно», а дальше спор поворачивал в сторону поиска определения истины. Это эссе ни в коем случае не является энциклопедическим ответом на этот вопрос. Скорее я надеюсь, что спорщики прочтут это эссе, а затем вернутся к изначальному вопросу.

В этом эссе я ставлю вопросы. Если вы находите на них кажущийся очевидным ответ – скорее всего, это он и есть. Очевидный выбор не всегда наилучший, но всё-таки иногда, черт возьми, он таков. Я не перестаю искать, когда встречаю очевидный ответ, но если по мере повышения моей информированности ответ всё ещё выглядит очевидным, то я не вижу вины в том, чтобы использовать его. Ну да, разумеется, все считают, что 2 + 2 = 4, говорят, что 2 + 2 = 4, и в повседневной жизни все ведут себя, как если бы 2 + 2 равнялось 4. И всё же чему 2 + 2 равно в высшем, абсолютном смысле? Насколько я могу судить, всё еще 4. Ответ будет равен четырём, даже если я задам этот вопрос официальным, строгим, напыщенным тоном. Слишком просто, говорите? Может быть, в этом случае мир и не должен быть сложен. Для разнообразия.

Если вы — один из тех счастливчиков, которым этот вопрос кажется тривиальным с самого начала, я надеюсь, что он окажется тривиальным и на самом деле. И если перед вами вдруг встанет глубокий и важный вопрос, вспомните, что если вы в точности знаете, как работает система, вы сами можете построить её аналог из ведёрок и камней, и это не должно быть для вас какой-то тайной.

Если вы теряетесь, пытаясь понять метафору «ведёрок и камней» как метафору, попробуйте понять её буквально.

Простая истина

Представьте, что мы оказались в доисторических временах, когда ещё не были изобретены начала математики. Здесь я пастух, и у меня есть проблема. Мне трудно уследить за своими овцами. Они спят в загоне и защищены от волков высоким забором. Каждое утро я выпускаю овец на пастбище. Каждый вечер я должен загнать их всех назад. Если я оставлю овцу снаружи, наутро меня встретит обглоданная волками тушка. Но меня так раздражает часами бродить по полям, когда я почти уверен, что все овцы уже в загоне. Иногда я бросаю поиски рано, и обычно наутро всё в порядке. Но примерно в одном случае из десяти утром я нахожу мёртвую овцу.

Вот если бы был какой-нибудь хитрый способ точно определить, остались ли снаружи ещё овцы! Я пробовал несколько методов: я бросал гадальные палочки, я развивал силу духа, чтобы видеть стадо внутренним взором, я старался найти убедительные основания полагать, что все овцы нашлись. Бесполезно. Примерно один раз из десяти, когда я ложился спать рано, наутро я обнаруживал тушку овечки. Может быть, я осознаю, что мои методы не работают, и, возможно, я тщательно подберу уважительную причину каждой своей неудачи. Но дилемма прежняя: либо я в течение часа обшариваю все закоулки и расщелины, хотя в большинстве случаев все овцы уже в загоне, либо я иду спать рано и теряю в среднем одну десятую овцы.

Однажды поздним вечером я еле стою на ногах. Заговорённые палочки утверждают, что все овцы вернулись домой. Я рисую в воображении каждый уголок, каждую расщелину на полях, и гадание говорит, что овец там нет. Но я ещё не уверен, поэтому я захожу в загон. Овец много, очень много, и я уверен, что следил за стадом тщательно и не отвлекался ни на минуту. Всё это развеивает мои тревоги, и я отправляюсь спать. На следующее утро я нахожу двух мёртвых овец. Что-то внутри меня ломается, и я начинаю творчески обдумывать проблему.

Громкие звуки молотка слышатся из загона в тот день.

На следующее утро я только слегка приоткрываю калитку загона. Каждый раз, когда выходит овца, я бросаю камешек в приколоченное рядом с калиткой ведро. Тем же вечером, когда я загоняю овцу обратно, я вынимаю один камушек из ведра. Когда ведро опустеет, я прекращаю поиски и иду спать. Это превосходное изобретение. Я уверен, оно совершит революцию в пастушестве.

Такова была теория. На практике потребовалось существенно доработать систему до надёжности. Несколько раз получалось так, что я не находил отсутствующих овец после нескольких часов поисков, однако на следующий день трупов не было. Каждый случай требовал глубокого обдумывания, в чем же моя ведёрная система не срабатывает. Однажды после очередного бесплодного поиска я остановился и прокрутил в голове весь день. Оказалось, что в тот день в ведре уже были камни, когда я выпускал первую овцу. Это была плохая идея. В другой раз, чтобы скоротать время с утра до обеда, я забавлялся игрой с камушками, от скуки кидая их в ведро. Это тоже было плохой идеей, что я понял после нескольких часов поиска. Я практиковался в своем ведёрно-каменном ремесле и со временем стал довольно компетентным овцесчетоводом.

Однажды на дороге, ведущей к моим пастбищам, появляется человек, одетый в дорогие белые одежды бизнес-покроя, сандалии, с лавровым венком на голове.

— Чем я могу вам помочь? — спрашиваю я.

Человек достаёт из-под одежд и с щелчком открывает значок, без тени сомнения подтверждающий, что этот человек является Маркосом Замысловатусом Максимусом, представителем Сената Рума. (Интересно, а что если бы кто-то другой украл этот значок? Но сила подобных знаков настолько велика, что этот кто-то, укради он знак, мгновенно превратился бы в Маркоса.)

— Зовите меня просто Марк, — говорит он. — Я здесь, чтобы конфисковать магические камни от имени Сената. Таким могущественным артефактам не должно находиться в столь невежественных руках.

— Ох уж это чёртов подмастерье! — ворчу я себе под нос. — Опять он трепался с деревенскими о чём не следует. Я смотрю в строгое лицо Марка и вздыхаю. — Послушайте, это никакие не магические камни. Самые обычные камни, которые я набрал с земли.

Тень недоумения пробегает по лицу Марка, но затем оно снова проясняется. — Я здесь, чтобы конфисковать магическое ведро! — заявляет он.

— Да не магическое это ведро, — устало говорю я. — Раньше я в нём хранил грязные носки.

Вот теперь видно, что Марк действительно озадачен.

— Тогда в чём же магия? — требовательно спрашивает он.

А ведь интересный вопрос.

— Это непросто объяснить, — начинаю я.

Привлечённый нашим разговором, мой подмастерье Отри подходит и предлагает своё объяснение:

— Магия в уровне камешков в ведре. Есть определённый магический уровень камешков в ведре, и они должны быть точно на нужной отметке, иначе магия не сработает. Если положить в ведро больше камней или достать несколько, они не будут на магическом уровне. Вот сейчас магический уровень, — Отри заглядывает в ведёрко — это примерно полное на треть.

— Понятно! — восклицает Марк. Он достаёт из вещевого мешка своё ведро и кучу камешков. Затем он берет несколько горстей камней и кладёт их в ведро. Он смотрит в ведро, примечая, сколько там камней. — Ну вот, — говорит он, — магический уровень этого ведра — это наполовину полное. Так это работает?

— Нет! — резко отвечает Отри. — Наполовину полное — это не магический уровень. Магический уровень — это полное примерно на треть. Наполовину полное — это совершенно не волшебно. Кроме того, у вас неправильное ведро.

Озадаченный Марк обращается ко мне:

— Кажется вы говорили, что ведро не магическое?

— Оно не магическое, — отвечаю я. Из загона выходит овца и я бросаю ещё один камешек в ведро. — И вообще, я смотрю за овцами. Поговорите с Отри.

Марк с сомнением провожает глазами брошенный камешек, но решает на время отложить свой вопрос. Он поворачивается в Отри и надменно выпрямляется. — Это свободная страна, — говорит он, — под благословенной диктатурой Сената, конечно. Я могу бросать любые камешки в какое мне угодно ведро.

Отри обдумывает это заявление. — Нет, не можете, — наконец отвечает он, — тогда совсем не будет волшебства.

— Послушайте, — терпеливо продолжает Марк. — Я внимательно наблюдал за вами. Вы посмотрели в своё ведро, проверили уровень камешков и сказали, что это и есть магический уровень. Я сделал всё точно так же.

— Это не так работает, — говорит Отри.

— О, понятно, — говорит Марк, — Магический уровень камешков не в моем ведре, а уровень камешков в вашем ведре. Так вы утверждаете? И чем же это ваше ведро гораздо лучше моего, а?

— Ну, если бы мы освободили ваше ведро, а затем наполнили его камешками из моего, то в вашем ведре был бы волшебный уровень. Также существует способ проверить, есть ли у вашего ведра волшебный уровень, если известно, что у моего ведра он имеется. Мы называем это операцией сравнения вёдер. — сказал Отри.

Выходит другая овца, и я кидаю в ведро ещё один камешек.

— Он только что закинул ещё один камешек! — говорит Марк. — И я полагаю, вы утверждаете, что новый уровень тоже является волшебным? Я мог бы бросать камешки в ваше ведро, пока уровень не стал бы таким же, как в моём, и тогда наши ведра сравнялись бы. Вы просто сравниваете мое ведро со своим, чтобы определить, считаете ли вы уровень «магическим» или нет. Так вот, я считаю, что ваше ведро не волшебное, потому что в нём не такой же уровень камешков, как в моём. Вот так!

— Погодите, вы не понимаете, — говорит Отри.

— Под «волшебным уровнем» вы всего лишь понимаете уровень камешков в вашем собственном ведре. А когда я говорю «волшебный уровень», я имею в виду уровень камешков в моем ведре. Итак, вы смотрите на мое ведро и говорите, что оно «не волшебное», но «волшебство» имеет разное значение для разных людей. Необходимо указать, чья это магия. Вы должны сказать, что у моего ведра нет «волшебного уровня Отри», и я скажу, что у вашего ведра нет «волшебного уровня Марка». Таким образом, кажущееся противоречие исчезает.

— Но… — беспомощно говорит Отри.

— Разные люди могут иметь разные вёдра с разным уровнем камешков, что доказывает, что всё это дело с «магией» совершенно произвольно и субъективно.

— Марк, — говорю я, — а кто-нибудь сказал вам, что эти камешки делают?

— Делают? — говорит Марк. — Я думал, они просто волшебные и всё.

— Если бы камешки ничего не делали, — говорит Отри, — то наш аудитор эффективности бизнес-процессов на соответствие стандарту ISO 9000 исключил бы эту процедуру из повседневной работы.

— Как зовут вашего аудитора?

— Дарвин, — сказал Отри.

— Хм, — говорит Марк, — Чарльз имеет репутацию строгого ревизора. Так что, камушки благословляют стада и ведут к приумножению овец?

— Нет, — говорю я. — Сила камушков заключается в следующем: если мы смотрим в ведро и видим, что камушков в нём нет, то мы знаем, что на пастбищах также овец не осталось. Если мы не используем ведро, мы должны искать и искать до темноты оставшихся овец. Или, если мы останавливаем наши поиски раньше, то иногда на следующее утро мы находим мертвых овец, павших жертвами волков. Если мы смотрим в ведро, мы знаем, когда все овцы в загоне, и можем спать спокойно.

Марк задумался.

— Звучит слишком неправдоподобно, — заключил он. — Как насчёт использования заговоренных палочек? Заговоренные палочки не лгут. По крайней мере всякий, кто скажет, что они лгут, будет сожжён заживо. Это очень болезненная смерть; следовательно, гадальные палочки не лгут.

— Вы можете пользоваться гадальными палочками, если вам нравится, — сказал я.

— О, небеса, разумеется нет, — говорит Марк. — Они работают безошибочно, с абсолютной точностью в любой ситуации, при надлежащем использовании благословенных инструментов; но что если на следующее утро будут мёртвые овцы? Я использую гадальные палочки только когда исключена возможность неверного предсказания. Иначе я буду сожжён заживо. Так как работает ваше магическое ведро?

Как работает ведро?.. Пожалуй, я начну с простейшей возможной ситуации.

— Ну, — говорю я, — предположим, что пастбища пусты, а ведро — не пустое. Тогда мы тратим часы в поисках овец, которых нет. А если на пастбищах остались овцы, но ведро пустое, то Отри и я вернёмся слишком рано, и на следующее утро мы найдём мёртвых овец. Так что пустое ведро является магическим, только если пастбища пусты…

— Постой, — говорит Отри. — Звучит как бессмысленная тавтология. Разве не очевидно, что пустое ведро и пустые пастбища — одно и то же?

— Она не бессмысленная, — говорю я. — Здесь аналогия: логик Альфред Тарски однажды сказал, что утверждение «снег белый» истинно тогда и только тогда, когда снег белый. Если ты можешь понять это, то ты должен видеть, почему пустое ведро волшебно тогда и только тогда, когда пастбища свободны от овец.

— Постойте, — говорит Марк. — Это ведра. Они никак не связаны с овцами. Ведра и овцы, очевидно, совершенно разные вещи. Никакого способа взаимодействия овец с ведром просто нет.

— Тогда откуда же появляется магия, как вы думаете? — поинтересовался Отри.

Марк задумался.

— Вы сказали, что сравнили два ведра, чтобы проверить, что они заполнены на одном уровне… Я могу понять, как вёдра взаимодействуют с вёдрами. Может быть, когда вы соберете много вёдер, и они будут иметь одинаковый уровень — это то, что сгенерирует магию. Я бы назвал это когерентистскойтеориеймагических_вёдер.

— Интересно, — сказал Отри. — Мне известно, что мой хозяин работал над системой с несколькими ведрами — он говорил, что должно работать лучше, потому что «избыточность» и «коррекция ошибок». На мой взгляд, это похоже на когерентизм.

— Это не совсем то же самое… — начал я.

— Давайте проверим когерентистскую теорию магии, — сказал Отри. — Я вижу, у вас с собой еще пять вёдер. Я дам вам ведро, которым мы пользуемся, а затем вы наполните свои вёдра до того же уровня…

Марк в ужасе отпрянул:

— Стойте! Эти вёдра передаются в моей семье через поколения, и у них всегда одинаковый уровень! Если я приму ваше ведро, моя коллекция вёдер станет менее связной, и магия уйдет!

— Но в данный момент ваши вёдра вообще никак не связаны с овцами! — протестует Отри.

Марк рассердился.

— Смотри, я уже объяснял ранее, очевидно, что овцы никак не могут взаимодействовать с вёдрами. Вёдра могут взаимодействовать только с другими ведрами.

— Я бросаю камешек, когда проходит овца, — заметил я.

— Когда овца проходит, вы бросаете камешек? — сказал Марк. — Как это связано с остальным?

— Это взаимодействие между овцой и камешками, — ответил я.

— Нет, это взаимодействие между вами и камешками, — сказал Марк. — Магия не происходит от овцы, она происходит от вас. Овца как таковая — не магическая по определению. Магия приходит откуда-то по пути в ведро.

Я указал на деревянную конструкцию на воротах. — Видите кусок ткани, свисающий из этой деревянной штуковины? Мы постоянно возимся с ней — она ненадежна — но когда овца проходит, она задевает тряпку. Когда ткань отклоняется, камешек из резервуара падает в ведро. Так нам с Отри не обязательно самим бросать камешки.

Марк нахмурился.

— Я не успеваю за вами… Это магическая ткань?

Я пожал плечами.

— Я заказал это онлайн в компании «Естественный Отбор». Ткань называется «Сенсорная Модальность», — увидев скептический взгляд Марка и Отри, я сделал паузу. — Допускаю, что названия звучат несколько эзотерично. Суть в том, что проход овцы начинает цепочку событий и в конце мы имеем камешек в ведре. Теперь вы можете сравнивать ведро с другими вёдрами, и так далее.

— Я так и не понял, — сказал Марк. — Вы не можете поместить овцу в ведро. В ведро попадают только камешки, и, очевидно, эти камешки могут взаимодействовать только с остальными камешками.

— Овца взаимодействует с вещами, которые взаимодействуют с камешками… — я ищу аналогию. — Допустим, вы опустили взгляд на шнурки. Фотон покидает Солнце, затем путешествует сквозь атмосферу Земли, затем отскакивает от ваших шнурков, затем проходит через зрачок в вашем глазе, затем сталкивается с сетчаткой, затем поглощается палочкой или колбочкой. Энергия фотона возбуждает нейрон, который возбуждает другие нейроны. Схема активации нейронов в вашей зрительной коре может взаимодействовать с вашими убеждениями о ваших шнурках, если такие убеждения уже есть в вашей нервной ткани. Если вы можете понять это, то вы должны понять, как проход овцы вызывает попадание камешка в ведро.

— И всё-таки, в какой момент процесса камешек становится магическим? — спрашивает Марк.

— Так… Это… — теперь уже я начинал смущаться. Я встряхнул головой, прогоняя путаницу. Всё казалось таким простым, когда я проснулся этим утром, и система ведра и камней избавила меня от проблем. — Будет гораздо проще понять это, если вы вспомните, что цель данной системы — упрощение наблюдения за овцами.

Марк погрустнел.

— Никогда бы не подумал… Похоже, вы сами не знаете. Может, все камешки изначально волшебны, даже до попадания в ведро. Можно назвать эту позицию панкаменизм.

— Ха! — воскликнул Отри, подражая его манере. — Какая натянутая мысль! Камешки не созданы одинаковыми. Те камешки, что в вашем ведре, не волшебны. Это простые кусочки камня!

Лицо Марка стало суровым.

— Теперь, — крикнул он, — теперь ты видишь, на какую опасную дорожку ступил! Как только ты заявил, что чьи-то камешки волшебны, а чьи-то — нет, твоя гордыня тебя поглотит! Ты возомнишь себя выше всех остальных и так падёшь! История знает множество людей, которые убивали и истязали, потому что считали, что именно их камешки выше прочих! — Голос Марка обрел тень снисходительности. — Поклонение уровню камешков как «магическому» подразумевает существование абсолютного уровня камешков в Великом Ведре. Никто не верит в Великое Ведро в наше время.

— Во-первых, — сказал я, — овцы не являются абсолютными камешками. Во-вторых, я не считаю, что моё ведро на самом деле содержит овец. В-третьих, я не поклоняюсь уровню моего ведра как идеальному — я его поправляю иногда, и делаю это, потому что забочусь об овцах.

— Кроме того, — говорит Отри, — если кто-то считает, что обладанием абсолютными камешками развязывает руки для убийств и пыток, он совершает ошибку, которая никак не связана с вёдрами. Вы решаете не ту проблему.

Марк успокаивается, говоря:

— Это же всего лишь пастухи, чего более мне от них ожидать… Вы, наверное, и в то, что снег белый, тоже верите?

— Эмм… ну да, а что? — отвечает Отри.

— А вас не беспокоит, что Иосиф Сталин тоже верил в то, что снег белый?

— Ну… нет.

Марк некоторое время с недоверием пристально смотрит на Отри, затем пожимает плечами.

— Ладно, предположим, — исключительно для дискуссии, — что ваши камешки магические, а мои нет. Скажите, в чём разница?

— Мои камешки представляют овец! — торжественно заявляет Отри. — У ваших камешков нет свойства представительности, поэтому они не работают. Они лишены смыслового наполнения. И просто посмотрите на них — никакой ауры содержательного наполнения, просто камни. Вам нужно ведро с особыми причинно-следственными силами.

— Ага, — говорит Марк. — Значит теперь это уже «особые причинно-следственные силы», а не магия.

— Вот именно, — продолжает Отри. — Я не суеверен. Постулировать существование магии в наши времена неприемлемо для международного пастушеского сообщества. Мы обнаружили, что постулирование магии просто не работает в качестве объяснения феноменов скотоводства. Так что теперь, если я вижу что-то мне непонятное и хочу объяснить это с использованием модели без детализации, которая не позволяет делать предсказания, даже в ретроспективе, я постулирую существование особых причинно-следственных сил. Если это не работает, то я буду называть это стихийным феноменом.

— А какими особыми силами наделено это ведро? — спрашивает Марк.

— Хм, — задумывается Отри. — Возможно, оно заряжено сродством с пастбищами. Это бы объяснило, почему оно работает — когда ведро пусто, значит и на пастбищах тоже пусто.

— Где вы нашли это ведро? — продолжает задавать вопросы Марк. — И как вы поняли, что ему свойственно сродство с пастбищами?

— Да это обычное ведро, — говорю я. — Я с него на деревья залезал. Не заморачивайтесь на этом вопросе.

— Я всё-таки говорю с Отри, — не даёт себя сбить Марк.

— Нужно привязать ведро к пастбищам и камешки к овцам с помощью магического ритуала… то есть, простите, стихийного процесса с особыми причинно-следственными силами, который открыл мой хозяин, — объясняет Отри.

Отри пытается описать процесс ритуала, при этом Марк с умным понимающим видом кивает.

— Нужно бросать камешек в ведро каждый раз, как овца выходит из загона, — уточняет Марк. — И доставать камешек каждый раз, когда овца возвращается?

Отри кивает.

— Это, должно быть, очень тяжёлое занятие, — сочувствующе говорит Марк.

Отри оживляется, поглощая сочувствие Марка, как сухая земля — дождь.

— Вот именно! — восклицает он. — Это такое давление на чувства. Когда в ведре некоторое время держится один уровень, вы… в некотором роде начинаете ощущать свою связь с этим уровнем.

В это время из загона выходит овца. Отри замечает это, замолкает, берет камешек и поднимает его вверх на вытянутой руке.

— Узрите! — провозглашает он. — Вышла овца! И сейчас я должен бросить камешек в это ведро, моё дорогое ведро, и разрушить этот дорогой мне уровень, который продержался так долго… — Из загона выходит другая овца, Отри, поглощённый своей драматической игрой, не замечает её, поэтому я кидаю камешек в ведро. А он продолжает: — ибо таково высшее испытание пастуха, бросить камень в ведро, несмотря на муки, страдания, несмотря на всю любовь к старому уровню. Воистину, только лучшие из пастухов способны соответствовать столь жестокому требованию…

— Отри, — прерываю я его, — если ты хочешь когда-нибудь стать великим пастухом, научись затыкаться и бросать камешки в ведро. Без суеты. Без драматизма. Просто бросай.

— А этот ритуал, — возвращается к разговору Марк, — он привязывает камешки к овцам силой магических законов Взаимодействия и Распространения, как кукла вуду.

Отри вздрагивает и оглядывается по сторонам.

— Прошу вас! Не называйте это Взаимодействием и Распространением. Мы, пастухи, антисуеверный народ. Пользуйтесь словом «преднамеренность» или чем-то подобным.

— Можно взглянуть на камешек? — спрашивает Марк.

— Да, конечно, — отвечаю я. Достаю один камешек из ведра и бросаю его Марку. Затем наклоняюсь к земле, подбираю другой и кидаю его в ведро.

Отри озадаченно смотрит на меня: — Разве вы сейчас не нарушили весь процесс?

Я пожимаю плечами:

— Вряд ли. Если нарушил — мы узнаем об этом, когда найдём убитую овцу на утро, или если несколько часов проведём в бесплодных поисках.

— Но… — сомневается Отри.

— Я научил тебя всему, что ты знаешь, но не всему, что знаю я, — говорю я ему.

Марк изучает камешек, тщательно рассматривая его. Он проводит над ним рукой, бормочет какие-то слова и наконец отрицательно качает головой.

— Я не чувствую никакой магии, то есть, прошу прощения, не чувствую никакой преднамеренности.

— Камешек обладает преднамеренностью только внутри маг… стихийного ведра, — заявляет Отри. — Иначе это просто камешек.

— Да не проблема, — отвечаю я. Достаю камешек из ведра и выкидываю его. Затем подхожу к Марку, касаюсь его руки с камешком и говорю: — Я объявляю эту руку частью магического ведра! Затем я возвращаюсь на свой пост у ворот загона.

— Вы сейчас просто беспричинно вредничаете, — смеется Отри.

Я киваю, ибо это действительно так.

— Однако это действительно сработает? — спрашивает Отри.

Я снова киваю, надеясь на свою правоту. Я проделывал это раньше с двумя ведрами, и, в принципе, не должно быть разницы между ведром и рукой Марка. Даже если рука Марка насыщена силой жизни, которая отличает живую материю от мёртвой, этот фокус должен сработать, даже если бы Марк был мраморной статуей.

Марк немного обеспокоенно смотрит на свою руку.

— Так что… сейчас камешек снова обладает преднамеренностью?

— Да, — подтверждаю я. — Не берите больше камней в руку и не выбрасывайте тот, который в ней держите, а то вы нарушите ритуал.

Марк торжественно кивает и возвращается к изучению камня.

— Теперь я понимаю, как ваши стада плодятся так хорошо. С силой этого ведра можно просто кидать в него камешки, и овцы бы возвращались с полей. Можно начать с нескольких овец, подождать, пока они уйдут на пастбища, а потом до краёв наполнить ведро. А если следить за такими большими стадами станет утомительно, можно просто выпустить их всех и выкинуть почти все камешки из ведра — так что вернутся только несколько овец. А когда придёт время стрижки, можно снова увеличить стада… святые небеса! Да вы хоть представляете всю чистую силу этого ритуала, который открыли? Я могу только представить последствия, возможно, это прыжок вперёд на десять — нет, на сто лет для всего человечества!

— Так не заработает, — сказал я. — Если вы забросите камешек без вышедшей овцы, либо достанете камешек, хотя овца не вернулась, это нарушит ритуал. Сила не содержится в камешках, но пропадает мгновенно, как мыльный пузырь.

Марк страшно разочаровался.

— Вы уверены?

Я кивнул.

— Я пробовал, и это не сработало.

Марк тяжело вздыхает.

— До этого момента вся эта… математика казалась такой… сильной и полезной. А был бы такой большой прогресс для человечества. А, ладно.

— Марк, это отличная идея, — одобряюще сказал Отри. — Это не моё открытие, оно носится в воздухе… можно сэкономить громадные средства… это должно спасти ваш план! Мы можем попробовать разные вёдра, найдя то, что сохраняет изначальную магическую сил… преднамеренность камней даже без ритуала. Или попробовать другие камешки. Может, наши камешки имеют не те свойства, присущие преднамеренности. Что если мы попробуем использовать камни, вырезанные в форме маленьких овечек? Или просто напишем «овца» на камешках, этого вполне достаточно.

— Не поможет, — сухо предсказал я.

Отри продолжил.

— Может, нам нужны органические камешки вместо кремниевых… или даже драгоценные камни. Цена драгоценных камней удваивается каждые восемнадцать месяцев, так что вы можете купить пригоршню недорогих драгоценных камней, подождать, и через двадцать лет они станут очень дорогими.

— Вы пробовали добавить камешков в ведро, чтобы сотворить ещё овец, и это не сработало? — спрашивает меня Марк. — А что конкретно вы делали?

— Я взял пачку долларовых банкнот. Затем я спрятал их, одну за другой, под складкой одеяла. Каждый раз, когда я прятал банкноту, я доставал из коробки скрепку и складывал их кучкой. Я тщательно старался не считать в уме, так что в итоге я знал только то, что у меня есть «много» долларовых банкнот и «много» скрепок. Когда все банкноты были спрятаны под одеялом, я добавил одну скрепку в кучку скрепок, что равносильно забросу одного лишнего камешка в ведро. После этого я начал доставать банкноты из-под одеяла, одновременно складывая скрепки назад в коробку. Когда я закончил, осталась одна лишняя скрепка.

— И что это значит? — спрашивает Отри.

— Значит, что уловка не удалась. Как только я нарушил ритуал всего лишь одной ошибкой, сила мгновенно исчезла. Кучка скрепок и кучка долларов теперь не уменьшались одновременно.

— Вы и правда это пробовали? — поинтересовался Марк.

— Да, — отвечаю я. — Я действительно провёл этот эксперимент, чтобы удостовериться в том, что результат согласуется с моим теоретическим предсказанием. У меня есть сентиментальная склонность к научной методике, даже когда дело похоже на бред. Кроме того, а что если бы я ошибся?

— Если бы это сработало, — говорит Марк, — вы были бы повинны в фальшивомонетничестве! Представьте, если бы все этим занялись — экономика бы рухнула! У всех были бы миллиарды долларов наличности, на которые ничего нельзя было бы купить!

— Вовсе нет, — уверил я. — По этой же логике, если добавление скрепки в кучку создавало бы ещё один доллар, то этот доллар при создании создавал бы дополнительно товаров и услуг на доллар.

Марк осуждающе качает головой:

— Все равно, подделка денег — это преступление. Вам не следовало пытаться это осуществить.

— Я был обоснованно уверен, что у меня не получится.

— Ага! — восклицает Марк. — Вы ожидали, что у вас не получится! Вы не верили, что у вас может получиться!

— Действительно. Вы с ошеломляющей точностью угадали мои ожидания, — признаю я.

— Ну вот, в этом и проблема, — оживлённо заявляет Марк. — Магия стимулируется верой и силой воли. Если не верить, что сможешь, то и не сможешь. Вам нужно изменить свою веру в результат опыта, это изменит и сам результат.

— Забавно, — с ностальгией вспоминаю я. — То же самое сказал Отри, когда я рассказал ему о методе ведра и камешков. Что это слишком смехотворная чушь, чтобы он в неё поверил, поэтому этот метод у него не сработает.

— И как же вы его убедили? — спрашивает Марк.

— Я сказал ему заткнуться и следовать инструкциям — а когда метод сработал, Отри начал в него верить.

Марк озадаченно хмурится:

— Но это же бессмыслица. Это не решает основную дилемму курицы и яйца.

— Отнюдь, решает. Метод ведра работает, верите вы в него или нет.

— Что за ерунда! — пробормотал Марк. — Не верю я в магию, которая работает независимо от того, веришь ты в нее или нет!

— Я говорил то же самое, — вмешался Отри. — Очевидно, я ошибался.

На лице Марка видны следы напряжённого размышления.

— Но… если вы не верили в магию, которая работает, веришь в неё или нет, то почему метод с ведром сработал, когда вы в него не верили? Вы что, верили в магию, которая работает, веришь в неё или нет, независимо от того, веришь ли в магию, которая работает, веришь ты в неё или нет?

— Я… по-моему… нет, — с сомнением отвечает Отри.

— Тогда, если вы не верили в магию, которая работает, веришь в неё или нет, то… сейчас, это надо решить в письменном виде. — Марк лихорадочно строчит на листе, затем скептически смотрит на получивший результат, переворачивает листок вверх ногами и наконец сдается. — Неважно, — резюмирует он. — Даже просто магию мне трудно понять, а уж метамагия вообще вне моего понимания.

— Марк, по-моему вы не понимаете, в чём мастерство ведёрного ремесла, — говорю я. — Дело не в том, чтобы с помощью камешков управлять овцами. Дело в том, чтобы овцы управляли камешками. В этом творческом деле не обязательно начинать с веры в то, что оно сработает. Скорее, сначала человек становится свидетелем того, что ведёрное ремесло действительно работает, а затем приходит к вере, что оно работает.

— Или вы верите, что это так, — парирует Марк.

— Да, я верю, что это так, потому что это имеет место быть как факт, — соглашаюсь я. — Соответствие между реальностью и моими верованиями происходит от того, что моя вера обусловлена реальностью, а не наоборот.

Мимо проходит ещё одна овца, поэтому я кидаю в ведро ещё один камешек.

— Ага! Вот мы и добрались до корня проблемы, — восклицает Марк. — Что вообще за дело с этой так называемой «реальностью»? Я понимаю, что значит, когда гипотеза изящна или фальсифицируема, или согласуется с фактами. По мне так называть веру «истинной», или «настоящей», или «действительной» в отличие от просто веры — это то же самое, что сказать «я верю в то-то» и сказать «я очень-очень верю в то-то».

Я немного медлю с ответом.

— В общем… — задумчиво говорю я, — откровенно говоря, я и сам не до конца уверен, откуда взялась вся эта муть с «реальностью». Я не могу создать собственную реальность в лаборатории, поэтому понять, что это такое, пока нельзя. Но время от времени я сильно верю, что что-то случится, а вместо этого затем происходит что-то другое. Мне нужно как-то называть это «что бы то ни было», которое определяет мои опытные результаты, поэтому я называю это «реальностью». Эта «реальность» как-то совсем не совпадает иногда даже с моими лучшими гипотезами. В некоторых случаях, когда у меня есть простая гипотеза, которая прекрасно согласуется со всеми известными мне данными, даже и тогда случаются сюрпризы. Так что мне нужно по-разному называть те штуки, которые определяют предсказанные мной результаты, и ту штуку, которая определяет опытный результат. Первое я называю «верой», а второе — «реальностью».

Марк фыркает.

— Даже не знаю, почему я вообще слушаю всю эту очевидную чепуху. Всё, что вы говорите об этой так называемой «реальности» — это всего лишь ещё одна вера. Даже ваше мнение о том, что реальность существует прежде ваших убеждений — это тоже вера. Из этого с логической неизбежностью следует, что реальность не существует, существуют только убеждения.

— Погодите, — говорит Отри, — вы не могли бы повторить последнюю часть? Вы где-то в середине фразы круто повернули, и я потерял нить.

— Что бы вы ни говорили о реальности, всё это только ещё одна вера, — объясняет Марк. — Из этого с ошеломляющей неотвратимостью следует, что реальности нет, есть только убеждения.

— Понятно, — говорю я. — Значит, аналогично, не важно, что человек ест, он должен есть ртом. Из этого следует, что еды не существует, есть только рты.

— Именно, — отвечает Марк. — Всё, что вы едите, должно быть во рту. Может ли еда существовать вне рта? Это бессмысленно, что доказывает, что «еда» — это несвязная идея. Поэтому мы все голодаем до смерти, еды не существует.

Отри смотрит на свой живот.

— Но я же не голодаю.

— Ага! — ликующе восклицает Марк. — А как вы произнесли это самое возражение? Ртом, друг мой! Своим ртом! Чем ещё лучше можно было наглядно доказать, что еды не существует?

— Кто тут говорит о голоде? — требовательно вопрошает резкий, скрипучий голос у нас за спиной. Мы с Отри спокойно стоим, мы слышали его и раньше. Марк же прямо подпрыгивает от неожиданности, сильно испуганный.

Инспектор Дарвин сухо улыбается, довольный получившимся сюрпризом, и делает небольшую пометку в своем блокноте.

— Это просто метафора! — быстро заявляет Марк. — Не надо забирать у меня рот или что-то ещё…

— А зачем вам рот, если еды не существует? — сердито настаивает Дарвин. — Неважно. У меня нет времени на эту ерунду. Я здесь, чтобы проинспектировать овец.

— Стада плодятся, господин, — сообщаю я. — Ни одной задранной овцы с января.

— Прекрасно. Награждаю вас 0,12 единицами приспособляемости. Так, а что этот человек тут делает? Является ли он необходимой частью производственной деятельности?

— Насколько я понимаю, он принёс бы больше пользы человеческому виду, если его повесить как балласт на корзине воздушного шара, — отвечаю я.

Отри тихо ойкает.

— Мне нет дела до человеческого вида. Пусть сам скажет.

Марк надменно выпрямляется.

— Вот этот всего лишь пастух, — он показывает на меня, — заявляет, что существует такое явление, как реальность. Это оскорбляет меня, так как я с глубокой и стойкой уверенностью знаю, что правды не существует. Идея «истины» — это всего лишь уловка людей, чтобы навязывать другим людям свои убеждения. У разных культур разные «истины», ни одна из которых не превосходит другую. То, что я сказал, имеет силу в любом месте и в любое время, и я настаиваю, чтобы вы согласились с этим.

— Секундочку! — вступает Отри. — Если ничто не истинно, почему я должен верить вам, когда вы говорите, что ничто не истинно?

— Я не говорил, что ничто не является истинным, — отвечает Марк.

— Нет, сказали, я слышал, — не соглашается Отри.

— Я сказал, что «истина» — это оправдание, которое используется какой-либо культурой, чтобы навязать другим свои убеждения. Так что, когда вы заявляете, что что-то «истинно», вы имеете в виду только то, что верование в это принесёт вашей собственной социальной группе какие-то преимущества.

— А вот это, что вы сейчас изложили — это истинно? — говорю я.

— Абсолютно, несомненно истинно! — выразительно отвечает Марк. — Люди сами творят свои реальности.

— Погодите, — озадаченно говорит Отри, — рассуждая логически, заявлять о том, что люди создают собственные реальности — это совершенно отдельный вопрос от заявления о том, что истины не существует — такое положение дел я даже внятно представить не могу, может быть, потому что вы так и не пояснили, как это вообще должно работать…

— Ну вот опять, — раздражается Марк, — опять вы пытаетесь применить свои западные идеи логики, рациональности, причинности, обоснованности и непротиворечивости.

— Ну отлично, — бурчит Отри, — теперь мне надо добавить третий индекс, чтобы следить за этим особым и отдельным утверждением…

— Оно не отдельное, — отвечает Марк. — Слушайте, вы неверно относитесь к моим утверждениям, принимая их за гипотезы и тщательно выводя их следствия. Вам следует считать их полностью универсальными оправданиями, которые я применяю, когда кто-то заявляет что-то, что мне не нравится. Это не столько модель того, как работает вселенная, сколько карточка «Освобождение из тюрьмы». Ключевой момент — применять эти оправдания избирательно. Когда я говорю, что истины не существует, это применимо только к вашему заявлению о том, что магическое ведро работает независимо от того, верю я в него или нет. Это не применимо к моему заявлению о том, что истины не существует.

— Эмм… а почему нет? — вопрошает Отри.

Марк терпеливо вздыхает.

— Отри, неужели вы думаете, что вы первый, кто задался этим вопросом? Спросил, как может наша собственная вера быть наполнена глубочайшим смыслом, если все верования бессмысленны? Многие студенты задают такой же вопрос, когда они сталкиваются с этой философией, у которой, я вас уверяю, множество сторонников, и по которой написана обширная литература.

— Ну и каков ответ? — говорит Отри.

— Мы назвали его «проблемой рефлексивности», — объясняет Марк.

— Да, но какой же ответ? — продолжает настаивать Отри.

Марк снисходительно улыбается.

— Поверьте, Отри, вы не первый, кто придумал такой простой вопрос. Не нужно преподносить его так триумфальное опровержение.

— Да нет, в самом деле, какой ответ?

— А теперь я бы хотел перейти к проблеме того, как логика убивает таких милых детёнышей тюленей…

— Вы напрасно теряете время! — резко обрывает Инспектор Дарвин.

— Это кроме того, что вы далеко ушли от слежения за овцами, — говорю я, закидывая ещё один камешек.

Инспектор Дарвин бросает взгляд на спорщиков, каждый из которых, очевидно, не хочет сдавать свою позицию.

— Послушайте, — говорит он уже более мягким тоном, — У меня есть простое решение вашего диспута. Вот вы утверждаете, — обращается Дарвин к Марку, — что вера человека преобразовывает его личную реальность. А вы, — он поворачивается и указывает на Отри, — истово верите в то, что вера Марка не может изменить реальность. Так пусть Марк очень сильно поверит в то, что он умеет летать, и спрыгнет с обрыва. Марк увидит, что полетел, как птица, а Отри увидит его стремительное падение и затем услышит шлепок приземления, и вы оба будете счастливы.

Мы все нерешительно застываем, обдумывая это.

— Звучит разумно… — наконец говорит Марк.

— А вот там как раз есть обрыв — осматривается Инспектор Дарвин.

Отри выглядит глубоко задумавшимся. Наконец он восклицает:

— Погодите! Если бы это было правдой, то мы все давно бы оказались в собственных отдельных вселенных, и тогда все люди здесь были бы всего лишь плодом вашего воображения — нет смысла пытаться что-то доказать нам…

С ближайшего обрыва слышится длинный затихающий крик, за которым следует глухой одиночный шлепок. Инспектор Дарвин открывает свой планшет на странице, на которой показан современный генетический пул и карандашом вписывает в показатель распространённости аллелей Марка несколько более низкое значение.

Отри несколько бледнеет.

— Неужели это было действительно необходимо?

— Необходимо? — озадаченно переспрашивает его Инспектор Дарвин, — Это просто произошло… Я не вполне понимаю ваш вопрос.

Мы с Отри возвращаемся к нашему ведру. Пора загонять овец. Не стоит забывать об этом. Иначе к чему бы всё это было?

Перевод: 
BT
Оцените качество перевода: 
Средняя оценка: 3.4 (475 votes)

Как успешно менять своё мнение

«Как успешно менять свое мнение» (How to Actually Change Your Mind)— вторая часть электронной книги Элиезера Юдковского «Рациональность: от ИИ до зомби» (Rationality: From AI to Zombies). Это отредактированная серия блог-постов из числа «Цепочек» («The Sequences»), в которой описана очень высокоуровневая техника мастеров рациональности: преодоление «искажения подтверждения» (confirmation bias) и предвзятого мышления.

«Как успешно менять свое мнение» содержит семь «цепочек» эссе. Все они собраны в книге «Рациональность: от ИИ до зомби», а здесь приведены ссылки на их переводы.

Предыдущая часть: Карта и территория.

Рациональность: введение

Роб Бенсинджер

Во что мне следует верить?

Оказывается, на этот вопрос есть правильный ответ.

Правильный ответ есть, даже если тебя мучает неопределённость, а не только при условии наличия убедительного доказательства. Всегда есть корректное количество уверенности в утверждении, даже если оно выглядит как «личное мнение», а не подтверждённый экспертом «факт».

И всё же, мы часто рассуждаем так, будто существование неопределённости или разногласий делает убеждения всего лишь вопросом вкуса. Мы говорим: «Это просто мое мнение», или: «У тебя есть право на личное мнение», как будто утверждения науки и математики существуют на более высоком уровне бытия, чем убеждения, которые всего лишь «личные» и «субъективные». Но, как пишет Робин Хансон1:

У тебя нет права на личное мнение. Никогда! У тебя нет права даже на «я не знаю». У тебя есть право на желания и, порой, на выбор. Ты можешь распоряжаться выбором, ты можешь выбирать предпочтения, у тебя может даже есть право на это. Но твои убеждения — это не о тебе; убеждения — это о мире. Твои убеждения — лучшее, что ты можешь предположить о том, как дела обстоят на самом деле. Всё остальное — ложь. [ … ]

Правда, что некоторые вопросы предоставляют экспертам более сильные механизмы для разрешения споров. Когда дело касается других вопросов, наши искажения и сложность мира мешают делать сильные выводы [ … ]

Но не забывай, что на любой вопрос о том, как обстоят дела (или как должны), и при любой информации всегда есть лучшая оценка. Ты имеешь право лишь на возможность приложить все силы для нахождения лучшей оценки; все остальное — ложь.

Предположим, что ты узнаёшь, что один из шести человек влюблён в тебя. Может, ты получаешь письма от тайного обожателя, и не сомневаешься, что это один из тех шести. Твой одноклассник Боб — один из шести кандидатов, но у тебя нет особых свидетельств за и против того, что именно он влюблен. В этом случае шансы на то, что Боб именно тот, кто влюблен в тебя — 1:5.

Шесть возможностей означают, что ты угадаешь один раз верно, а пять — не верно, в среднем. Это и есть то, что мы обозначаем как «шансы 1 к 5». Ты не можешь сказать: «Ну, понятия не имею, кто в меня влюблён; может это Боб, может нет. Так что шансы мои пятьдесят на пятьдесят.» Ты даже не можешь сказать «я не знаю» или «может быть» и остановиться на этом, ответ всё ещё — 1:52.

Предположим, что ты так же замечаешь, что влюблённые люди в десять раз чаще подмигивают тем, в кого они влюблены. И если Боб подмигивает тебе, то это — новое свидетельство. В данном случае, будет ошибкой по-прежнему сохранять скептицизм по поводу идеи, что Боб — тайный обожатель; шансы 10:1 в пользу «случайный человек, подмигнувший мне, влюблён в меня» перевешивают шансы 1:5 против «Боб влюблён в меня».

Но так же будет ошибкой заявлять: «Это свидетельство такое сильное, что сомневаться глупо! Я просто буду думать, что Боб в меня влюблён!» Сверхуверенность ничем не лучше неуверенности.

По факту, только один ответ математически непротиворечив. Для того, чтобы изменить своё мнение с априорных шансов 1:5, основываясь на свидетельстве с отношениями правдоподобия 10:1, мы умножаем отдельно левые стороны и правые, получая апостериорные шансы 10:5 (т.е. 2:1 в пользу того, что «Боб влюблён в меня»). С учётом наших предположений и доступных свидетельств, догадка, что Боб влюблен в тебя, окажется правдой каждые два раза, и ложью — один раз. Эквивалентно: вероятность, что ты его привлекаешь — 2/3. Любое другое число, выражающее уверенность, в данном случае будет несовместимым.

Наша культура не усвоила пока уроки теории вероятности, что правильный ответ на вопросы вроде «как сильно я могу верить в то, что Боб влюблён в меня?» точно так же логически определены как и правильные ответы на вопросы из контрольной по алгебре или учебника геологии. Наши шаблоны мышления идут не в ногу с открытием, что «каких убеждений о мне следует придерживаться?» имеет объективно верный ответ, независимо от того, является ли это вопросом вроде «влюблен ли в меня мой одноклассник?» или «есть ли у меня бессмертная душа?» Есть правильный путь изменения своего мнения. И точный.

Как не менять свое мнение?

Однако, пересмотр своих убеждений так же, как и в том (с Бобом) идеальном случае — задача не из лёгких.

В первом томе «Рациональности: от ИИ до Зомби» мы обсуждали ценность «правильных» убеждений. Нет ничего предосудительного в выражении поддержки тому, что тебя волнует — группе, с которой ты себя идентифицируешь, духовному опыту, который ты находишь превозносящим. Когда мы сталкиваем провозглашения с фактическими убеждениями, эти «недопонятые» провозглашения могут защитить целую идеологию от загрязнения свидетельствами.

Даже те убеждения, что элегантно объясняют наши наблюдения, не обладают иммунитетом от этой проблемы. Слишком уж просто нам воспринимать туманно-научные (так или иначе авторитетные) фразы и делать выводы, что они «объясняют» что-либо, даже если они не меняют шансы, которые мы использовали для косвенной оценки наших ожиданий будущего.

Хуже всего, что даже прозаичные убеждения — те, что принципиально фальсифицируемы, что ограничивают варианты будущих наблюдений — могут застрять в голове, будучи поддержанными сетью иллюзий и искажений.

В 1951 году произошла необычайно жёсткая игра между Дартмутом и Принстоном. Психологи Хасторф и Кантрил провели опрос среди болельщиков от каждой школы о том, кто же начал вести жёсткую игру первым. Почти все были согласны с тем, что это был не Принстон; однако, на 86% студентов Принстона, веривших, что начал Дартмут, приходилось лишь 36% студентов Дартмута, тоже обвинявших Дартмут. (Большинство студентов Дартмута верило, что «обе стороны начали».)

Нет никаких оснований полагать, что это было противоположное настоящим убеждениям провозглашение. Студенты, вероятно, следовали разным убеждениям в разных оценках будущего поведения игроков в будущих играх. И всё же, совершенно обычные фактические убеждения Дартмута сильно отличались от совершенно обычных фактических убеждений Принстона.

Можем ли мы винить разницу в доступных источниках информации? Сами по себе искажения в разных источниках новостей, на которые полагаются группы — серьёзная проблема.

Однако факторов больше. Когда студентам была показана запись игры и они должны были посчитать количество нарушений, то Дартмутские насчитали в среднем 4.3 нарушения со стороны Дартмута (половина из которых была названа «мягкими»), в то время как Принтсонские — 9.8 нарушений со стороны Дартмута (треть из которых была названа «мягкими»).

Чего уж тут надеяться на согласие конкурирующих фракций по сложным вопросам или моральной философии; студенты, верные разным группам, не могли согласится о том, что они видели3.

Когда над дорогим нам «чем-то» нависла угроза, — мировоззрением, социальным статусом или чем-либо ещё, — наши мысли и даже восприятие спешат на защиту4, 5. Некоторые психологи сегодня полагают, что наша способность придумывать явные оправдания для наших выводов специально эволюционировала для того, чтобы помогать нам выигрывать споры6.

Одним из определяющих психологию 20-го века озарений, освещающим всех, от Фрейда до когнитивных психологов наших дней, является идея сложных подсознательных процессов, в значительной степени ответственных за наше поведение, и искажённости (большей, чем кажется на первый взгляд) историй, которые мы рассказываем себе о наших мотивах и поступках.

По факту, мы часто не замечаем сам процесс рассказывания таких историй. Когда кажется, что мы «прямо переживаем» что-то о себе посредством интроспекции, часто бывает, что это основано на незначительных косвенных причинных моделях7, 8. Когда мы защищаем наши убеждения, то можем выдумывать хрупкие причины, не имеющие никакого отношения к тем, благодаря которым мы действительно пришли к таким убеждениям9. Вместо того, чтобы судить об объяснениях на основе их предсказательной силы, мы пытаемся найти смысл в том, что, как нам кажется, мы знаем.

Как мы можем стать лучше? Как мы можем приобрести реалистичный взгляд на мир, если наши умы так склонны к рационализации? Как мы можем реалистично взглянуть на свой внутренний мир, если даже наши мысли под подозрением? Как мы можем снизить искажённость, если даже наша деятельность по исправлению этого имеет свои искажения?

Есть ли твёрдая кочка в этом болоте?

Математика Рациональности.

На рубеже 20-го века создание простых (например, теоретико-множественных) аксиом для арифметики дало математикам возможность оценивать корректность их выводов. Если человек или калькулятор выдает «2+2=4», теперь мы можем сказать больше, чем просто «интуитивно это кажется верным». Мы можем объяснить почему это верно, и мы можем доказать, что эта правильность систематически связана с правильностью всей остальной арифметики.

Но логика и математика позволяют нам моделировать более интересные системы, чем карманный калькулятор. Мы можем формализовать рациональные убеждения в целом, используя теорию вероятности для сбора сливок со всех успешных форм вывода. Мы даже можем формализовать рациональное поведения в целом, разработав теорию принятия решений.

Теория вероятности описывает идеальные рассуждения в условиях неуверенности, если бы у нас было достаточно времени, вычислительных мощностей и самоконтроля. Учитывая предыдущие знания (априорные) и новое свидетельство, теория вероятности однозначно определяет наилучший набор новых убеждений (апостериорные), которые я могу принять. Так же, теория принятия решений определяет, какие действия я должен предпринять на основе моих убеждений. Для любого непротиворечивого набора убеждений и предпочтений, что я имею о Бобе, есть ответ теории принятия решений о том, как я должен действовать, чтобы удовлетворить свои предпочтения.

Люди являются идеальными мыслителями или разработчиками решений настолько же, насколько могут быть идеальными калькуляторами. Наш мозг небрежно слеплен эволюцией. Даже сильно постаравшись, мы не способны вычислить правильный ответ на вопрос «что мне следует думать?» и «как мне следует поступить?». У нас не хватает времени и вычислительных мощностей, и эволюция оказалась недостаточно дальновидной и компетентной, чтобы создать менее забагованную систему.

Максимально эффективный, свободный от ошибок мыслитель в реальном мире, по факту, всё равно будет полагаться на эвристики и аппроксимации. Оптимальные алгоритмы, путь вычислений которых можно проследить, выпадают из непротиворечивой теории вероятности.

И всё же, даже зная, что мы не можем быть полностью непротиворечивыми, мы можем стать лучше. Зная о существовании идеала, с которым мы можем себя сравнивать (исследователи называют это «Байесовской рациональностью»), мы можем улучшать наши рассуждения и действия. И хотя, мы никогда не станем идеальными байесовскими агентами, математика рациональности поможет нам понять, почему некий ответ является верным, заметить где мы облажались.

Только представь изучение математики исключительно с помощью заучивания. Тебе сказали, что “10 + 3 = 13,” “31 + 108 = 139,” и т.д., но это не слишком поможет, если ты не будешь понимать последовательность, стоящую за закорючками. Трудно искать методы улучшения рациональности, не имея при этом парадигмы для оценки успешности этих методов. Цель этой книги — помочь построить такую парадигму индивидуально каждому.

Прикладная рациональность.

В своём блог-посте про разницу между восторженными рациональностью «рационалистами» и «рационалистами анти-эмпиристами» Скотт Александр пишет10:

[O]чевидно — здорово иметь как можно больше свидетельств, в том же смысле, что и иметь как можно больше денег. Но так же очевидно, что и полезно уметь распоряжаться имеющимися ресурсами с умом, так же, как и полезно уметь распоряжаться с умом ограниченным бюджетом.

Техники рациональности помогут выжать больше из имеющихся свидетельств в тех случаях, когда они неоднозначны или когда наши искажения и пристрастия мешают интерпретировать их. Это применимо и к таким обыденным ситуациям, как та, что с Бобом. К разногласиям политических фракций (и спортивных болельщиков). И так же применимо к технологическим и философским загадкам, вроде дебатов о трансгуманизме и том, должны ли мы использовать технологии для радикального изменения нашего состояния. Признавая, что те же математические правила применимы к каждой из описанных областей, как и господство когнитивных искажений, автор, в серии статей «Как действительно изменить свое мнение», обрисовывает множество примеров проблем.

Первая цепочка статей в «Как действительно изменить свое мнение», — «Чрезвычайно удобные оправдания», —фокусируется на вопросах, которые настолько чёткие с точки зрения вероятностей, насколько это возможно. Оптимальные вычисления по Байесу часто трудно выполнимы, но ошибки вроде ошибки подтверждения существуют даже в случаях, когда доступные свидетельства однозначны и у нас достаточно времени на обдумывание.

Отсюда мы движемся в тёмные воды вместе с цепочкой «Политика и Рациональность». Мейнстримная политика, как и теледебаты, знаменита своими гневными, непродуктивными дискуссиями. Если задуматься, это кажется странным. Почему мы воспринимаем так близко к сердцу политические разногласия, если эффекты национальной политики так далеки от нас в пространстве и времени? Если уж на то пошло, почему мы не можем быть аккуратней со свидетельствами, когда имеем дело с важными для нас вопросами?

В игре Дартмута с Принстоном есть пара подсказок. Большая часть наших рассуждений — рационализация, рассказывание историй, которые помогают нам воспринимать наши убеждения как последовательные и оправданные. При этом редко улучшая их точность. Об этом автор пишет в «Против рационализации», затем следует цепочка «Против двоемыслия» (о самообмане) и «Свежий взгляд на вещи» (о вызове признавать свидетельства, даже если они не слишком подходят нашим ожиданиям и предположениям).

Поднятие уровня своей рациональности подразумевает знакомство с множеством интересных и сильных идей. Часто, это так же означает знакомства с людьми для обсуждений этих идей и даже сообществами, поощряющими саморазвитие. «Смертельные Спирали» описывает потенциальные риски, влияющие на группы, созданные вокруг общих интересов и блестящих идей, которые надо обойти или перебороть, если мы рассчитываем получить хоть какую-то выгоду от сообщества рационалистов. «Как действительно изменить своё мнение» заканчивается цепочкой «Отпустить».

Наша природа не подразумевает изменение нашего мнения, как это делал бы байесовский агент. Чтобы заставить студентов Дартмута и Принстона заметить, что же происходило в реальности, понадобится больше, чем обучение их теории вероятности. Как писал Люк Мюлхаузер в «Силе автономного Агента»11:

Ты не байесовский гомункул, чье мышление «загрязнено» когнитивными искажениями.

Ты просто когнитивное искажение.

Ошибка подтверждения, ошибка статуса кво, ошибка соответствия и прочие не присосались к нашему мышлению; они являются его сутью.

Это не значит, что снижение их влияния невозможно. Мы не являемся идеальными калькуляторами под слоем арифметических ошибок. Множество из наших ограничений в математике являются следствием особенностей работы мозга. И тем не менее, мы способны тренировать математические навыки; мы способны обучаться различать ситуации, где можно, а где нельзя доверять математической интуиции и делиться этим знанием с другими; мы способны менять окружающую среду и создавать инструменты, снимающие бОльшую часть нагрузки.

Наши искажения — часть нас самих. Но в нас так же присутствует тень Байеса — сломанный аппарат, способный, тем не менее, приблизить нас к правде. Не гомункул, но всё же что-то. Возможно, достаточно, чтобы начать.

  • 1. Robin Hanson, “You Are Never Entitled to Your Opinion,” Overcoming Bias (blog) (2006), http://www.overcomingbias.com/2006/12/you_are_never_e.html.
  • 2. Это следует из того, что тут шесть возможностей и у тебя нет причин ожидать одну из них сильней по сравнению с другими. Мы так же предполагаем, пусть и нереалистично, что ты можешь быть уверен в том, что поклонник принадлежит именно к этой шестёрке людей, и ты не отбрасываешь другие возможности. (Что если влюбленность у большего числа людей, чем «один»?)
  • 3. Albert Hastorf and Hadley Cantril, “They Saw a Game: A Case Study,” Journal of Abnormal and Social Psychology 49 (1954): 129–134, http://www2.psych.ubc.ca/~schaller/Psyc590Readings/Hastorf1954.pdf.
  • 4. Pronin, “How We See Ourselves and How We See Others.”
  • 5. Robert P. Vallone, Lee Ross, and Mark R. Lepper, “The Hostile Media Phenomenon: Biased Perception and Perceptions of Media Bias in Coverage of the Beirut Massacre,” Journal of Personality and Social Psychology 49 (1985): 577–585, http://ssc.wisc.edu/~jpiliavi/965/hwang.pdf.
  • 6. Hugo Mercier and Dan Sperber, “Why Do Humans Reason? Arguments for an Argumentative Theory,” Behavioral and Brain Sciences 34 (2011): 57–74, https://hal.archives-ouvertes.fr/file/index/docid/904097/filename/Mercie….
  • 7. Richard E. Nisbett and Timothy D. Wilson, “Telling More than We Can Know: Verbal Reports on Mental Processes,” Psychological Review 84 (1977): 231–259, http://people.virginia.edu/~tdw/nisbett&wilson.pdf.
  • 8. Eric Schwitzgebel, Perplexities of Consciousness (MIT Press, 2011).
  • 9. Jonathan Haidt, “The Emotional Dog and Its Rational Tail: A Social Intuitionist Approach to Moral Judgment,” Psychological Review 108, no. 4 (2001): 814–834, doi:10.1037/0033-295X.108.4.814.
  • 10. Scott Alexander, “Why I Am Not Rene Descartes,” Slate Star Codex (blog) (2014), http://slatestarcodex.com/2014/11/27/why-i-am-not-rene-descartes/.
  • 11. Luke Muehlhauser, “The Power of Agency,” Less Wrong (blog) (2011), http://lesswrong.com/lw/5i8/the_power_of_agency/
Оцените качество перевода: 
Средняя оценка: 4.3 (15 votes)

Чрезвычайно удобные оправдания

Первая цепочка статей в «Как действительно изменить свое мнение» - «Чрезвычайно удобные оправдания» фокусируется на вопросах, которые настолько четкие с точки зрения вероятностей, насколько это возможно. Оптимальные вычисления по Байесу часто трудно выполнимы, но ошибки вроде ошибки подтверждения существуют даже в случаях когда доступные свидетельства однозначны и у нас достаточно времени на обдумывание.

Материалы цепочки распространяются по лицензии CC BY-NC-SA 3.0

Автор: 
Элиезер Юдковский

Правильная скромность

Элиезер Юдковский

Давно известно, что хорошая наука требует некоторой скромности. Какой именно скромности — это вопрос другой.

Представим креациониста, который говорит: «Но откуда нам точно знать, что теория эволюции верна? Это просто теория. Вам стоит вести себя скромнее и учитывать все мнения». Это скромность? Креационист проявляет крайне избирательную недоуверенность, отказываясь включить в свою картину мира огромное количество свидетельств, которые приведут к некомфортному для него выводу. Я бы сказал, что независимо от того, «скромность» это или нет, это неверное «па» в танце.

А как насчёт инженера, который скромно разрабатывает дополнительные механизмы безопасности для оборудования, даже будучи абсолютно уверенным, что оборудование не сломается? Такой вид скромности кажется мне хорошим. В истории было немало случаев, когда инженер был абсолютно уверен в том, что машина не сломается, а потом она ломалась. Что насчёт студента, который перепроверяет свои ответы на контрольной по математике? Это я бы тоже отнёс к хорошей скромности.

А что насчёт студента, который говорит: «Не важно, сколько раз я проверю свои ответы, всё равно я никогда не смогу быть до конца уверен, что они верны», и поэтому не проверяет их вообще? Даже если это решение обусловлено эмоциями схожими с эмоциями предыдущего студента, оно менее мудро.

Вы предлагаете этому студенту заниматься усерднее, на что он отвечает: «Нет, мне это не поможет. Я же не такой умный, как ты. С моими скромными способностями мне нет смысла даже надеяться на результаты получше». Это социальная сдержанность, а не скромность. Она связана с положением в племени, а не с научным подходом. Если вы просите кого-то «быть скромнее», по умолчанию эти слова ассоциируются с социальной сдержанностью, которая является интуитивным, унаследованным от предков, ежедневно используемым инструментом. Научная скромность — относительно недавнее и более тонкое изобретение, и по своей сути не относится к общественным взаимодействиям. Вы сможете применить научную скромность, даже находясь в одиночестве в космическом скафандре за много световых лет от Земли, где никто не может вас видеть. Или даже в том случае, если вы получите абсолютную гарантию того, что никто и никогда больше не будет вас критиковать, независимо от того, что вы сделаете или подумаете. Перепроверка своих вычислений и в этих ситуациях будет мудрым решением.

Наш студент говорит: «Но я видел, как другие студенты перепроверяли свои ответы и всё равно их ответ оказывался неправильным. Или вдруг мы столкнулись с проблемой индукции и в этот раз 2 + 2 будет равно 5? Что бы я ни делал, я никогда не могу быть полностью уверен». Это звучит очень глубокомысленно и очень скромно. Но вряд ли случайно то, что тот же студент хочет побыстрее сдать работу, чтобы пойти домой и поиграть в видеоигры.

Конец эпохи в физике не обязательно сопровождается салютом и фанфарами. Гораздо чаще он начинается с чего-то, что кажется лишь маленькой несостыковкой… Но из-за того, что физики придерживаются своей высокомерной идеи, что их модели должны работать абсолютно всегда, а не просто бОльшую часть времени, они всегда стараются выяснить причину этих маленьких несостыковок. Обычно несостыковка исчезает после более внимательного её изучения. А иногда она разрастается настолько, что опровергает всю теорию. По этому поводу сказано: «Если ты не стремишься к совершенству, ты остановишься ещё до того, как сделаешь свои первые шаги».

Но подумайте, как нагло с точки зрения общества выглядит стремление быть правым абсолютно всегда! Я подозреваю, что если бы Наука заявляла, что теория эволюции верна бОльшую часть времени, но не во всех случаях, — или если бы Наука признавала, что, возможно, Земля иногда может быть плоской, но никто не знает этого точно, — то у учёных определённо была бы лучшая репутация в обществе. Наука не казалась бы такой враждебной, потому что мы бы тогда не спорили с людьми, которые считают Землю плоской — оставалось бы место для компромисса. Если вы много спорите, вас считают конфликтным человеком. Если вы регулярно отказываетесь идти на компромисс, это ещё хуже. Считайте это вопросом статуса в племени: учёные определенно заработали дополнительные очки уважения за такие социально полезные вещи, как медицина и мобильные телефоны. Но этот статус не оправдывает их настойчивости в вопросе того, что только научные идеи об эволюции имеют право изучаться в школах. В конце концов, у священников тоже высокий статус. Учёные пытаются прыгнуть выше головы — они заработали немного уважения и теперь считают, что имеют право быть вождями всего племени! Им стоит быть поскромнее и иногда идти на компромисс.

Многие люди, похоже, имеют весьма туманное представление о «скромности рационалиста». Опасно придерживаться правила, которое вы понимаете лишь отчасти. У вашей картины мира может быть такое количество степеней свободы, что она оправдает практически любой поступок. Когда люди пользуются смутными моделями, с помощью которых они могут отстаивать что угодно, в итоге они обычно верят в то, во что хотели верить изначально. Это так удобно, что люди часто не хотят отказываться от этой неопределённости. Но этика нужна для того, чтобы управлять нашим поведением, а не для того, чтобы под него подстраиваться.

«Скромность» — это добродетель, которую часто понимают неверно. Это не значит, что нам нужно отказаться от понятия скромности, но нам стоит использовать его осторожно. Возможно, стоит взглянуть на алгоритм действий, который предлагает «скромная» модель поведения, и спросить: «Если я буду поступать таким образом, я стану сильнее или слабее?» Если вы просто смотрите на мост и думаете о проблеме индукции, может казаться разумным рассуждение о том, что ничто не вечно, независимо от предпринятых мер предосторожности. Однако, если вы сравните, что изменится в реальном мире, если вы добавите несколько дополнительных тросов, и что изменится, если вы просто пожмёте плечами, то вроде бы довольно очевидно, в каком случае мост станет более надёжным.

Подавляющее большинство примеров «скромности рационалиста», которые я видел, были отговорками для пожимания плечами. Например, человек, покупающий лотерейный билет, говорит: «Но вы не знаете наверняка, что я проиграю». Человек, не верящий в эволюцию, говорит: «Но вы не можете строго доказать мне, что это правда». Человек, отказывающийся решать задачу, которая выглядит очень сложной, говорит: «Её наверное, слишком тяжело решить». Проблема здесь в предвзятом скептицизме, также известном как «искажение опровержения» — мы более критически рассматриваем утверждения в пользу теории, в которую мы не хотим верить. Скромность, в её самом неверно понимаемом виде, это самое универсальное оправдание для того, чтобы не верить во что-то. Ведь, в конце концов, нельзя быть в чём-то уверенным до конца. Остерегайтесь абсолютно универсальных оправданий!

Ещё одна проблема в том, что скромность не требует от вас никаких жертв. Деннет в своей книге «Разрушая чары: религия как природное явление» говорит, что, хотя во многие религиозные утверждения очень трудно верить, людям намного легче удаётся верить в то, что они должны в них верить. Деннет использует для этого термин «вера в убеждение». Что бы могло означать реальное убеждение? Что бы значила реальная вера в то, что трое эквивалентны одному? Намного легче убедить себя, что вы должны каким-то образом верить, что трое эквивалентны одному, и говорить это вслух в нужный момент проповеди. Деннет предполагает, что многие «религиозные убеждения» должны рассматриваться как «религиозные провозглашения» — люди считают, что они должны в них верить, и знают, что они должны именно так говорить.

Довольно легко отвечать на каждый контраргумент: «Ну, разумеется, я могу и ошибаться». А затем, почтительно преклонив колени перед Скромностью и выполнив надлежащий ритуал, можно поступать точно также, как поступали и до этого.

Всегда хочется заработать наибольшее количество очков с наименьшими усилиями. Всегда хочется учитывать все поступающие свидетельства таким образом, чтобы как можно меньше изменять свои убеждения и особенно действия. Джон Кеннет Гэлбрейт сказал: «Оказавшись перед выбором между тем, чтобы изменить свои убеждения, и тем, чтобы доказать себе, что в этом нет нужды, почти каждый выбирает второе.»1 И чем большие неудобства человек будет испытывать после изменения своих убеждений, тем больше усилий он потратит на доказательства его ненужности.

Но, знаете, если вы не собираетесь меняться, нет смысла тратить такие усилия на то, чтобы это рационализировать. Я часто видел людей, которые получали новую информацию, соглашались с ней, а затем подробно объясняли, почему они собираются делать то же самое, что делали до этого, но с другим оправданием. Смысл мышления в том, чтобы строить планы. Если вы не планируете менять свои планы, зачем тратить силы на их оправдания? Когда вы получаете новую информацию, самое трудное — среагировать на неё и обновить свои убеждения, вместо того чтобы позволить этой информации исчезнуть в чёрной дыре. И неправильно понимаемая скромность создаёт прекрасную чёрную дыру — вам нужно лишь признать, что вы тоже можете ошибаться. По этому поводу сказано: «Быть скромным — значит заранее принимать меры в ожидании провала своих планов. Тот, кто признаёт способность ошибаться, но никак не пытается её скомпенсировать, движим гордыней, а не скромностью».

  • 1. John Kenneth Galbraith, Economics, Peace and Laughter (Plume, 1981), 50.
Перевод: 
stas
Номер в книге "Рациональность: от ИИ до зомби": 
46
Оцените качество перевода: 
Средняя оценка: 4.4 (Всего оценок: 21)

Третья альтернатива

Элиезер Юдковский

«Вера в Санту даёт детям ощущение чуда и заставляет их вести себя хорошо в надежде на получение подарков. Если Санта-убеждение разрушается правдой, дети теряют ощущение чуда и прекращают вести себя хорошо. Таким образом, даже если это убеждение ложно, это благородная ложь, которая полезна по определённым причинам».

Обычно это называют ложной дилеммой, софизмом исключения среднего, софизмом компромисса. Даже если мы принимаем лежащие в основе фактические и моральные исходные посылки, приведённые выше в аргументах, это не может быть использовано. Даже предположение, что политика Санты (заставлять детей верить в Санта-Клауса) лучше, чем не делать ничего, это не значит что данное убеждение является наилучшим из всех возможных альтернатив. Другие варианты поведения также могут дать детям ощущение чуда, наподобие просмотра фантастического шоу или снабжения их научно-фантастической литературой. Это всё равно, что давать детям взятки за хорошее поведение — дети будут вести себя хорошо только в те моменты, когда на них смотрят взрослые. При этом похвала, без взяток, ведёт к безусловному хорошему поведению.

Благородная ложь представляет собой общий случай софизма компромисса; и ответом на данный софизм является то, что если нам действительно нужно достичь чего-то, мы можем создать третью альтернативу по достижению этого.

Как мы можем получить третью альтернативу? Первый шаг в этом — решить поискать её, последний — решение принять её. Звучит очевидно, однако большинство людей терпят неудачу на этих двух шагах, а не на самом процессе поиска. Откуда берутся ложные дилеммы? Некоторые появляются честно, потому что трудно найти превосходящие стратегии. Но есть сомнительная причина ложной дилеммы — это суждение о том, что это лучше, чем не делать ничего. В этом случае, судящий не хочет искать третью альтернативу; нахождение таковой разрушит его суждение. Последнее, что сантаист хотел бы услышать, это то, что похвала работает лучше взяток или что космические корабли могут вдохновлять так же как летающие олени.

Лучшее — враг хорошего. Если цель — по-настоящему помогать людям, тогда превосходящая альтернатива это причина для праздника — как только мы находим лучшую стратегию, мы можем помогать людям более эффективно. Но если цель просто оправдать определённую стратегию, претендуя при этом на помощь людям, третья альтернатива становится вражеским аргументом, соперником.

Современные когнитивные психологи рассматривают принятие решений как поиск альтернатив. В настоящей жизни, недостаточно сравнивать варианты, вы должны в первую очередь создавать варианты. Во многих проблемах число альтернатив велико, так что вам нужен критерий остановки поиска. Когда вы ищете дом для покупки, вы не будете перебирать все дома в городе; в определённый момент вы остановитесь и купите.

Но что, если наши сознательные мотивы для поиска — критерий, который мы признаём для себя — не совпадает с подсознательными влияниями? Когда мы выполняем вроде бы альтруистический поиск, поиск альтруистического способа действий и находим стратегию, при которой выигрывают все кроме нас — мы не останавливаемся; мы продолжаем искать. Разумеется, при этом мы говорим, что ищем стратегию, которая принесёт другим ещё больше пользы. Но предположим, что мы нашли стратегию, которая приносит другим меньше пользы, но зато благоприятна и для нас? Мы тут же останавливаемся! На деле, мы скорее всего будем сопротивляться любому предложению продолжить поиск снова — например оправдываясь недостатком времени (хотя у нас всегда находятся когнитивные ресурсы для поиска оправданий текущей стратегии).

Будьте внимательней, когда обнаруживаете, что вы отстаиваете оборонительный способ действий, а не оптимальный; или думаете, что иметь небольшое преимущество в сравнении с нулевым действием лучше, чем выбирать наибольшее преимущество из всех действий.

Ложные дилеммы часто представляются как оправдание неэтичных действий, как нечто попавшееся под руку и очень удобное. Лгать, например, часто удобнее, чем говорить правду; и верить в то, с чего вы начали рассуждение, — более удобно, чем обновлять убеждения. Отсюда популярность аргументов в пользу Благородной Лжи; это служит как защита уже существующего убеждения — никто не видел Благородного Лжеца, который создаёт новую Благородную Ложь; они продолжают лгать о том, с чего начали. Лучше остановить эти поиски быстро!

Чтобы сделать лучше, спросите себя напрямую: если бы я увидел, что есть альтернатива, превосходящая мою текущую, я бы обрадовался или бы замешкался в нежелании, перед тем, как перешёл на неё? Если ответы «нет» и «да», боюсь, что вы не ищете третью альтернативу.

Что приводит к другому хорошему вопросу, который нужно задать себя напрямую: потратил ли я хотя бы пять минут на то, чтобы закрыть глаза и рассмотреть даже самые дикие и креативные варианты в попытках придумать лучшую альтернативу? Причём это должны быть именно пять минут на часах — иначе вы просто моргаете — закрываете и сразу же открываете глаза и говорите: «Ну, я поискал альтернативы, но их нет». Моргание это хорошее средство уйти от своих обязанностей. Поэтому рекомендуется смотреть пять минут именно по часам.

И эти дикие и креативные варианты — были ли вы достаточно внимательны, чтобы не просмотреть хороший? Прилагали ли усилия, чтобы убедиться в том, что любой рассмотренный выбор очевидно плохой?

Удивительно, как много Благородных Лжецов и прочих подобных готовы принять этические нарушения — оплакивая свои муки совести — когда они не потратили и пяти минут на поиск альтернатив. Существуют определённые ментальные поиски, которые мы подсознательно желаем видеть неудавшимися; и когда шансы на успех нам не подходят, люди часто выбирают самый доступный возможный вариант — сдаться.

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
47
Оцените качество перевода: 
Средняя оценка: 4.4 (16 votes)

Лотереи: бессмысленная трата надежды

Элиезер Юдковский

Традиционно принято критиковать лотереи за то, что играют в них те, кто меньше всего может позволить себе проиграть; что лотерея — унитаз для спуска денег, сливающий средства тех, кому они больше всего нужны. Некоторые апологеты лотерей (и даже кое-какие комментаторы блога LessWrong.com) пытаются оправдать покупку лотерейных билетов как разумную: мы нечувствительно теряем доллар в день, покупая приятное предвосхищение, мечтая о себе-миллионере.

Но рассмотрим, что же именно здесь подразумевается. Такой ход мыслей должен означать, что вы захламляете свой ценный мозг иллюзией, действительная достоверность которой — что-то около нуля: тонкая полоска везения, которую вы не властны сделать реальностью. Лотерейные шары определят ваше будущее. Эта иллюзия о том, что богатство настигнет вас без усилий: без стремления мыслить и учиться, без талантов, даже без упорства.

Это и делает лотереи ещё одним видом «унитаза», только сливающим эмоциональную энергию. Они потворствуют тому, чтобы люди вкладывали свои мечты, свои надежды на лучшее будущее в крохотную вероятность. Если бы не лотерея, возможно, они могли бы подумать о том, чтобы поступить в технический колледж, или открыть своё дело, или продвинуться по службе, — о чём-то, что в самом деле могут сделать именно они, о надеждах, которые бы требовали от них стать сильнее. В своих фантазиях, эдак к 20-й визуализации пленительной мечты, мозг человека, возможно, заметит способ действительно её осуществить. Разве фантазии и мозги не для этого? Но разве может этот приземлённый, ограниченный рамками действительности расклад сравниться с подслащённой перспективой мгновенного богатства (не когда на продажу выставлены акции соблазнительных интернет-стартапов, а в обычный вторник)?

Правда, почему бы нам просто не сказать, что покупать лотерейные билеты — идиотское занятие? Люди бывают глупы время от времени, так что это не должно быть такой уж удивительной гипотезой.

Не является открытием, что человеческий мозг не проводит 64-битные вычисления с плавающей точкой, и не может снизить эмоциональную силу положительного предвосхищения, умножив её на 0,00000001, если не приложить к этому усилий. Также неудивительно, что многие люди не осознают, что численное вычисление ожидаемой полезности должно превосходить или замещать их неточные финансовые инстинкты, и что вместо них стоит верить этому вычислению как единственному аргументу, который уравновешивал бы их положительное предвосхищение — но вычисление это эмоционально слабый аргумент, поскольку представляет собой цифры на бумаге, а не видения сказочных богатств.

Кажется, этого достаточно, чтобы объяснить популярность лотерей. Почему же столь многих спорщиков тянет оправдать эту образцовую форму саморазрушения?

Чтобы преодолеть искажение мышления, нужно: 1) сначала заметить его, 2) затем подробно проанализировать, 3) определить, чем же оно плохо, 4) выяснить, как его обойти, и, наконец, 5) осуществить это. Досадно, как много людей, пройдя первые два шага, застревают на третьем — по правде говоря, самом легком из всех пяти. Систематическая ошибка мышления — это баг, а не фича, и мы должны не пытаться сделать из неё что-то хорошее, а просто избавиться от неё.

Перевод: 
Quilfe, Remlin, Elspet
Номер в книге "Рациональность: от ИИ до зомби": 
48
Оцените качество перевода: 
Средняя оценка: 4.6 (16 votes)

Новая улучшенная лотерея

Элиезер Юдковский

Люди продолжают настаивать на том, что лотереи это не бессмысленная трата надежды, а сервис, который даёт возможность купить фантазию — «мечты о становлении миллионером за меньшие деньги, нежели мечты о становлении голливудской звездой в кино». Один комментатор написал: «Есть большая разница между нулевыми шансами стать богатым и ничтожно малыми. Покупка билета позволяет вашей мечте о богатстве перейти от нулевых шансов к ничтожно малым».

На деле же, и это один из моментов, которые я хочу донести, между нулевым и ничтожно малым шансом стать богатым разница ничтожно малого порядка. Если вы сомневаетесь, положим, что этот ничтожно малый шанс — единица, делённая на гуголплекс.

В любом случае, если мы притязаем на то, что сильная сторона лотереи — возможность купить надежду на ничтожно малые шансы, то это предполагает, что мы соглашаемся на разработку новой улучшенной лотереи. Она выплачивает выигрыш в среднем раз в пять лет, в случайный момент времени, который определяется, скажем, моментом распада атомов слаборадиоактивного элемента. Вы сможете однажды купить билет за доллар и обрести не просто несколько дней крохотного шанса стать богатым, а несколько лет такового. Более того, богатство может настигнуть вас в любой момент! В любую минуту может зазвонить телефон, чтобы рассказать вам, что вы, да-да, именно вы — миллионер!

Представьте, насколько это было бы лучше, чем обычная схема розыгрыша лотереи, которая проводится только в определённое время, несколько раз в неделю. Скажем, шеф приходит и дает вам указание переработать проект, или пополнить складские запасы, или сделать еще что-нибудь надоевшее. И вместо того, чтобы браться за работу, вы можете поставить перед собой телефон и глядеть на него, надеясь на чудесный звонок, ведь есть крохотный шанс, что именно в этот момент вы, да-да, вы получите суперприз! И даже если этого не случится сейчас, что ж, не стоит разочаровываться: это может произойти в следующую минуту!

Подумайте, насколько больше фантазий возможно с Новой улучшенной лотереей. Вы можете покупать в магазине, добавляя дорогие вещи в вашу покупательскую корзину. Если ваш телефон не зазвонит, чтобы вам сообщили, что вы выиграли, вы всегда можете выложить всё обратно, не так ли?

Возможно, Новая улучшенная лотерея может даже отображать постоянно плавающее распределение вероятностей по возможности того, что сейчас кто-то выиграет, или по шансам на победу определённых лотерейных билетов, а также общий прогноз, выражающийся через вышеуказанные распределения Пуассона. Вообразите, насколько приятным это могло бы быть! Батюшки, прямо сейчас шансы выиграть где-то в десять раз выше, чем обычно! И, вы только посмотрите, у номера 42, на который я сделал особую ставку, вероятность выпадения в эту минуту удвоилась! Можно отобразить эту информацию на экранах мобильников, владельцы которых в игре, и они смогут просто посмотреть в телефон и узнать свои шансы. Только представьте, как волнующе это будет! Куда увлекательней, чем пытаться свести собственные доходы и расходы. Куда интереснее, чем делать домашнюю работу! Эта новая мечта должна стать настолько притягательной, что сможет соревноваться не только с надеждой поступить в технический колледж, но даже с возможностью рано возвращаться с работы. Люди смогут просто неотрывно глазеть на экран весь день, и им не надо будет мечтать о чём-нибудь ещё!

Действительно, давать людям соблазнительные мечтания, которые никогда не станут реальностью, — значимая услуга, так уж и быть. Она должна быть таковой, ведь люди готовы расставаться с деньгами. Хотя на самом деле это может быть и не так, ведь люди могут и ошибаться.

Пока что современные государства, обладающие подлой монополией на лотереи, всё ещё не предлагают эту удобную и очевидную услугу. Почему? Потому что хотят назначить цену повыше. Они хотят, чтобы люди тратили деньги каждую неделю. Чтобы люди тратили сотни долларов ради трепетного ожидания выигрыша, десятки и сотни раз, вместо того, чтобы смотреть на экран телефона, ожидая счастливого момента. Так что если вы убеждены, что лотерея — это услуга, то цена её несоизмеримо завышена (в особенности для беднейших в обществе), и ваш священный долг как гражданина — требовать учреждения Новой улучшенной лотереи.

Перевод: 
Quilfe, Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
49
Оцените качество перевода: 
Средняя оценка: 4.5 (13 votes)

Но ведь шанс всё равно есть, не так ли?

Элиезер Юдковский

Несколько лет назад я беседовал с одним человеком, и по ходу разговора он сказал, что не верит в эволюцию. Я ответил: «Сейчас не девятнадцатый век. Когда Дарвин впервые предложил теорию эволюции, в ней ещё можно было сомневаться. Но мы живём в двадцать первом веке. Мы можем читать гены. У человека и шимпанзе ДНК совпадают на 98%. Мы знаем, что люди и обезьяны являются родственниками. Это факт».

Он сказал: «Может быть, совпадение ДНК является случайным».

Я ответил: «Шансы на это равны примерно двум в степени семьсот пятьдесят миллионов к одному».

Он сказал: «Но ведь шанс всё равно есть, не так ли?»

Есть несколько причин, по которым прошлый-я не может праздновать чистую с моральной точки зрения победу в этом споре. Первая причина заключается в том, что я не помню, откуда взял число $2^{750000000}$, хотя, скорее всего, я не слишком ошибся на уровне «мета-порядка». Другая причина в том, что мой прошлый-я не задумывался о том, насколько откалиброванной была эта уверенность. На протяжении всей истории человечества люди, оценивавшие вероятность некоего события в 1 к $2^{750000000}$, ошибались, несомненно, чаще, чем один раз в $2^{750000000}$ случаях. К слову, позже оценка совпадения ДНК была снижена с 98% до 95% — причём относится она только к 30 000 известных генов, а не ко всему геному, поэтому моя оценка была неверна даже на уровне «мета-порядка».

Однако, ответ моего собеседника по-прежнему кажется мне довольно забавным.

Я не помню, что я ответил на его последнюю реплику — скорее всего, что-то вроде «Нет» — но я запомнил этот разговор, поскольку благодаря ему, я чуть лучше понял то, как Непросвещённые понимают законы мышления.

Я впервые понял, что для человеческой интуиции есть качественная разница между «Невозможно» и «Шансы очень малы, но их стоит учитывать». Это можно увидеть и на Overcoming Bias в обсуждении «Новой Улучшенной Лотереи», где один пользователь написал: «Между нулевыми шансами на выигрыш и шансами, равными эпсилону, существует большая разница». На что я ответил: «Нет, не большая — порядок этой величины примерно равен эпсилону. Если вы в этом сомневаетесь, возьмите за эпсилон один, делённое на гуголплекс».

Проблема в том, что теория вероятностей позволяет рассчитать значения, которые настолько малы, что на них бессмысленно тратить ресурсы своего мозга — но к этому времени они уже будут рассчитаны. Люди путают карту с территорией, поэтому на интуитивном уровне вероятность, явно определённая в виде символов, ощущается как «шанс, который нужно учитывать», даже если число, описываемое этими символами, настолько мало, что, представив его в виде реального объекта, мы бы не смогли его даже разглядеть, поскольку оно было бы меньше пылинки. Для описания настолько маленьких чисел есть слова, но нет чувств — столь малого количества нейронов и нейромедиаторов не хватит, чтобы ощутить хоть что-то. Именно поэтому люди и покупают лотерейные билеты — никто не способен по-настоящему прочувствовать ничтожность столь малой вероятности.

Но ещё более любопытным мне показалось качественное деление между аргументом «точным» и аргументом «вероятностным» — причём «вероятностный» аргумент в этом случае можно просто проигнорировать. Мол, вероятность, равная нулю, требует полного отказа от неё, а вероятность, равная один к гуголу, всё ещё может учитываться.

Разумеется, мы живём в свободной стране и никто не посадит вас в тюрьму за неверные рассуждения. Но если вы собираетесь игнорировать аргумент о том, что вероятность равна всего лишь один к гуголу, зачем обращать внимание на аргумент о том, что вероятность равна нулю? То есть, если вы всё равно собираетесь игнорировать любые свидетельства, чем «вероятностное» свидетельство хуже «точного»?

В жизни я часто обнаруживал, что научился чему-то на ужасно вопиющих ошибках в рассуждениях других людей. Например, в данном случае, правило заключается в следующем: если очень хочется принять во внимание ничтожную вероятность один к гуголу, то совершенно точно придётся принять во внимание и вероятность 0,9. Это одного поля ягоды.

Вспомните об этом, если захотите сказать: «Но вы не можете доказать мне, что я не прав». Если вы собираетесь игнорировать аргумент, основанный на вероятности — почему бы просто сразу не проигнорировать всё доказательство?

Перевод: 
stas
Номер в книге "Рациональность: от ИИ до зомби": 
50
Оцените качество перевода: 
Средняя оценка: 4.4 (12 votes)

Софизм серого

Элиезер Юдковский

Софистик: «Мир не чёрный и белый. Не существует чистого добра и чистого зла. Всё серое. Таким образом, нет никого, кто был бы лучше другого»

Zetet: «Зная только серый, вы заключаете, что все виды серого — это один оттенок. Вы смеётесь над простотой двухцветной точки зрения, однако заменяете её одноцветной…»

— Marc Stiegler, David’s Sling

Я не знаю, есть ли у ошибки, допущенной Софистиком, официальное название, но я называю её «софизмом серого». Мы видели его проявление в предыдущем посте, когда собеседник, считавший, будто шансы, равные двум в степени семьсот пятьдесят миллионов к одному, против его утверждения означают, что «шансы ещё есть». Для него любые вероятности — просто «неопределенности», и поэтому он считает, что может их игнорировать, если ему так удобней.

«Луна сделана из зеленого сыра» и «Солнце сделано по большей части из водорода и гелия» — предложения о некоторой неопределённости, однако они неопределённы не в равной степени.

Всё — оттенки серого, однако есть оттенки серого столь светлые, что они почти белые, и есть оттенки столь тёмные, что они почти чёрные. Или даже если нет, мы всё равно можем сравнить оттенки и сказать «это темнее» или «это светлее».

Годы назад, одним из маленьких и странных, формирующих меня как рационалиста, моментов было чтение этого параграфа из «Игрока в игры» Иэна Бэнкса, особенно предложение, выделенное жирным:

«Карательная система не знает невиновных. Любая машина насилия считает, что все либо за неё, либо — против. Мы — против. И вы были бы тоже, дай вы себе труд задуматься. Уже один образ мышления делает вас врагом. Может, это и не ваша вина, потому что каждое общество воспитывает в своих гражданах определенные ценности, но дело в том, что некоторые общества придают ценностям максимальное значение, а некоторые — минимальное. Вы происходите из общества второго типа, а рассказать вас о себе просит общество первого типа. Уклониться будет так трудно, что вы и представить себе не можете, сохранить нейтралитет — практически невозможно. Вы просто не можете не сочувствовать той политике, в которой воспитаны, поскольку она не является чем-то независимым от остальных частей вашего «я». Она — составляющая вашей личности. Мне это известно, и им это известно. И вам лучше принять всё как есть».

Сейчас не надо писать негодующих комментариев, говорящих, что если бы общества не вкладывали свои ценности, тогда каждое последующее поколение должно было бы начинать с нуля. Это не то, что я вынес из параграфа.

То, что я вынес из параграфа, было что-то, что кажется очевидным в ретроспективе, что я, возможно, мог бы взять из сотни разных мест; но именно этот параграф что-то сдвинул во мне.

Это было само понятие Количественного Пути, применённого к жизненным проблемам, таким как моральные суждения и стремление к самосовершенствованию. То, что даже если бы вы не могли включить или выключить, вы всё ещё хотели бы увеличить или уменьшить.

Слишком очевидно, чтобы это стоило обсуждать? Я бы сказал что это не так уж очевидно, для многих блоггеров, говорящих об Overcoming Bias: «Невозможно, никто не может полностью избавиться от искажений». Меня не волнует, если это говорит профессиональный экономист, ясно что они ещё не въехали в то, как применять Количественный Путь в повседневной жизни и делах наподобие самосовершенствования. Если я не могу что-то убрать совсем, может быть неплохо было бы это хотя бы уменьшить.

Или обсудим разговор между Робином Хансоном и Тайлером Ковеном. Робин Хансон сказал, что он предпочитает уделять 75% внимания предписаниям экономической теории, в противовес своей интуиции: «Я стараюсь в основном напрямую применять экономическую теорию, добавляя немного личных или культурных суждений». Тайлер Ковен ответил:

— С моей точки зрения нет такой вещи как «применяемая напрямую экономическая теория»… теории всегда применяются через наши личные и культурные фильтры, и не может быть каких-то других путей.

Да, но вы можете попробовать минимизировать этот эффект, или вы можете делать вещи, связанные с увеличением его. И даже если вы пытаетесь минимизировать его, тогда во множестве случаев я не думаю, что неразумно называть выход «прямым» — даже в экономике.

«Все несовершенны». Махатма Ганди был несовершенен и Иосиф Сталин был несовершенен, но они не были одинаково несовершенны. «Все несовершенны» это отличный пример замены двухцветной точки зрения на одноцветную. Если вы скажете: «Никто не совершенен, но некоторые люди менее несовершенны, нежели другие», вы можете не получить аплодисментов; но тем, кто старается делать лучше, вы дадите надежду. Никто не совершенен, в конце концов.

(Всякий раз, когда кто-то говорит мне «перфекционизм плох для тебя», я отвечаю: «Я думаю, что нормально быть несовершенным, однако не столь несовершенным, чтобы это замечали другие люди».)

Точно так же глупы те, кто говорит: «Каждая научная парадигма накладывает какие-то из своих предположений на то, как она интерпретирует эксперименты» и действует так, словно он доказал, будто наука стоит на одной ступени с шарлатанством. Любое мировоззрение накладывает какие-то из своих структур на свои наблюдения, но есть те точки зрения, что пытаются минимизировать этот эффект, и те, что гордятся им. Нет белого, но есть тени серого, что намного светлее других, и глупо относиться к ним так, словно они все на одном уровне.

Если Луна вращалась вокруг Земли последние несколько миллиардов лет, если вы видели её в небе последние годы, и вы ожидаете увидеть ееёна своем месте завтра — это неопределенность. И если вы ожидаете, что невидимый дракон излечит вашу дочь от рака, — это тоже неопределённость. Но у них совершенно разные степени неопределенности: одно дело — ожидать вещи, которые уже случались так, что их можно было предсказать до двенадцати знаков после запятой, и совсем другое — ожидать, что произойдёт нечто, что противоречит наблюдаемому порядку вещей. И называть их одним словом «вера» кажется немного натянутым.

Это психология особого рода, которая приводит к «Наука тоже основана на вере, вот так!» Обычно это говорится людьми, которые утверждают, что вера — это хорошо. Тогда почему они говорят «Наука тоже основана на вере!» в таком злобно-торжествующем тоне, а не как комплимент? И довольно опасный комплимент, с их точки зрения. Если наука основана на «вере», тогда наука относится к тем же явлениям что и религия: их тогда можно непосредственно сопоставить. Если наука — это религия, то это религия, что лечит болезни и открывает тайны звёзд. И тогда возможно сказать: «священники науки могут честно и открыто, с доказательствами, ходить по Луне, что можно счесть чудом веры, а ваши священники от веры не могут того же». Вы уверены что вы хотите продолжать, верующие? Возможно, в дальнейшем отражении, вы предпочтёте отказаться от этого дела с «Наука тоже религия!»

Есть странная динамика: вы пытаетесь очистить свой оттенок серого, и достигаете точки, где становится уже светлее, и кто-то встаёт и говорит глубоко возмущённым тоном: «Но это же не белый! Это серый!» Одно дело, когда кто-то говорит: «Это не такое светлое, как вы думаете, поскольку там есть определённые проблемы X, Y, Z». Другое дело, когда кто-то злобно говорит: «Это не белый! Это серый!» без указания на определённые темные пятна.

В этом случае я начинаю в большей степени, чем обычно, подозревать, что психология несовершенна: что кто-то, возможно, заключил сделку со своими ошибками и теперь отказывается слышать о любой возможности улучшения. Когда кто-то находит оправдание тому, что он не пытается стать лучше, он часто отказывается признать, что кто-то может стараться стать лучше. Любой способ улучшения и любое свидетельство, что возможно двигаться вперед, чтобы стать лучше, они воспринимают как преступление против них. Таким образом, они гордо говорят сначала «Я рад, что я серый», а затем, уже злобно: «И ты тоже серый!»

Если нет белого и чёрного, всё ещё есть более светлое и более тёмное, и не все серые тона одинаковы.

Приложение: нам ещё привели цитату из Азимова: «Когда люди думали, что Земля плоская, они ошибались. Когда они думали, что она сферическая, — они тоже ошибались. Но если вы думаете, что считать её сферой или плоскостью одинаково ошибочно, вы заблуждаетесь больше, чем все они вместе взятые».

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
51
Оцените качество перевода: 
Средняя оценка: 4.5 (24 votes)

Абсолютный авторитет

Элиезер Юдковский

К вам приходит человек и высокомерным тоном заявляет: «Наука не знает ничего по-настоящему. Всё, что у вас есть, — это теории; вы не знаете наверняка, что вы правы. Вы, учёные, меняли своё мнение о том, как работает гравитация — откуда нам знать, что завтра вы не поменяете своё мнение об эволюции?»

Посмотрите на эту глубокую культурную пропасть между вами. Если вы думаете, что сможете преодолеть её с помощью нескольких предложений, вы сильно разочаруетесь.

Мир непросвещённых делится на авторитеты и не-авторитеты. Тому, во что верить можно, следует верить; то, чему доверять нельзя, следует просто игнорировать. Есть хорошие источники информации и плохие источники информации. Если учёные меняли своё мнение хоть раз за все время существования науки, она не может быть истинным Авторитетом и ей никогда больше нельзя будет доверять — как свидетелю, пойманному на лжи, или продавцу, крадущему деньги из кассы.

Кроме того, таким людям кажется естественным то, что сторонник какой-либо идеи будет защищать её против любого возможного контраргумента и ни в чём не сознается. Все контраргументы должны сразу игнорироваться. Если даже сторонник науки признаёт, что наука неидеальна — что ж, тогда она точно бесполезна.

Когда человек живет всю свою жизнь, привыкнув к определённости, нельзя просто сказать ему: «Наука основана на вероятностях, как и все остальные знания». Он поймёт первую половину высказывания как признание вины и проигнорирует вторую половину, посчитав её отчаянной попыткой обвинить всех остальных, чтобы избежать обвинения самому.

— Вы сами признали, что вам нельзя доверять — так убирайся прочь, Наука, и не тревожь нас более!

Одним из очевидных источников такого типа мышления является религия, где писания, якобы, исходят от самого Бога; таким образом, любое признание хоть малейшего изъяна уничтожит его авторитет полностью; и любой признак сомнения является грехом, и заявлять об определенности обязательно, есть она там или нет.

Но я подозреваю, что в деле также замешаны традиционные способы обучения в школе. Учитель говорит определённые вещи, а ученики обязаны ему верить и повторять всё, что он сказал, на контрольной. А когда другой ученик высказывает вслух свои мысли, иметь своё мнение разрешается — с ним можно свободно соглашаться или не соглашаться (судя по всему), и никакого наказания за это не последует.

Боюсь, «убеждения» из-за этого попадают в социальную сферу авторитета, приказов и закона. В этой социальной сфере есть качественное различие между абсолютными законами и не-абсолютными законами, между приказами и предложениями, между авторитетами и не-авторитетами. Возникает ощущение, что, подобно точным и неточным правилам, существуют точные и неточные знания. Строгим авторитетам необходимо подчиняться, тогда как неточные предположения можно принять или проигнорировать в зависимости от личного предпочтения. И Наука, признаваясь в возможности своей ошибки, должна принадлежать ко второй категории.

(Замечу мимоходом, что нечто подобное я наблюдаю у тех, кто думает, что если нет оценки вероятности, данной Авторитетным лицом — написанной, например, на клочке бумаги учителем в классе, или спущенной свыше неким другим Неоспоримым Источником — эта неопределённость не может учитываться Байесианской теорией вероятности. Кто-то может - внимание! - оспорить такую оценку априорной вероятности. Таким образом, Не-до-конца-просвещенным кажется, что Байесианские вероятности принадлежат к классу убеждений, произносимых учениками, а не к классу убеждений, диктуемых учителями — и поэтому не являются настоящими знаниями.)

Глубокая культурная пропасть между Авторитетным Путём и Количественным Путём довольно сильно раздражает тех, кто смотрит на неё со стороны рационалистов. По другую сторону находятся те, кто верит, что обладает знанием более надёжным, чем основанные всего лишь на вероятностях догадки учёных — догадки о том, например, что завтра Луна взойдёт в определенном месте и определённой фазе, точно так же, как это было при каждом ночном наблюдении со времён изобретения астрономических инструментов, и точно так же, как предсказывают физические теории, чьи предыдущие предсказания были успешно подтверждены до четырнадцати цифр после запятой. А какое знание противопоставляют этому непросвещённые и почему? Скорее всего, это какой-нибудь старый пыльный свиток, который был опровергнут одиннадцатью разными способами с прошлого воскресенья, и с прошлого понедельника, и с любого другого дня недели. Однако (как говорят они), это более надежный источник, чем Наука, потому что он никогда не признаёт ошибок, никогда не меняет свои убеждения, независимо от того, сколько раз будет опровергнут. Они кидаются словом «определённость» как теннисным мячом, используя его с легкостью пёрышка, пока ученые сгибаются под весом необходимых сомнений, изо всех сил пытаясь получить ещё хоть одну крошечную долю вероятности. «Я идеален», — говорят они без всякой задней мысли, — «и, должно быть, нахожусь гораздо выше вас, ведь вам до сих пор приходится прикладывать усилия, чтобы стать лучше».

Не существует простого способа, чтобы всё это объяснить — ни одного мгновенного сокрушительного аргумента. Рассуждая аккуратно, можно, вероятно, завоевать аудиторию, если это публичные дебаты. К сожалению, нельзя просто пробормотать: — «Глупый смертный, Количественный Путь за гранью твоего понимания, и убеждения, которые ты так легко называешь „определёнными“, подкреплены слабее, чем наши самые слабые гипотезы.» Это — разница в восприятии жизни, которую не так легко преодолеть при помощи слов вообще, не говоря уж о том, чтобы сделать это быстро.

Что можно попытаться сделать, в плане риторики, выступая перед публикой? Трудно сказать… возможно:

  • «Сила науки исходит из нашей способности изменять свое мнение и признавать свою неправоту. Если вы никогда не признаете свою неправоту, это не значит, что вы совершаете меньше ошибок.»

  • «Каждый может сказать, что он абсолютно уверен. Намного труднее никогда в жизни не совершить ни одной ошибки. Учёные понимают эту разницу, поэтому и не говорят, что они абсолютно уверены. Вот и всё. Это не значит, что у них есть какая-то особая причина сомневаться в той или иной теории — абсолютно каждое новое свидетельство может быть в её пользу, все планеты и звезды выстроятся в линию, как костяшки домино, в поддержку единственной гипотезы, и ученые всё равно не скажут, что они абсолютно уверены, просто потому что они задают более высокие стандарты. Однако это не значит, что учёные имеют меньше права на определённость, чем, скажем, политики, которые кажутся абсолютно уверенными всегда и во всём.»

  • «Учёные не используют фразу „не абсолютно уверен“ в том же смысле, в котором она используется в обычном разговоре. Представим, например, что вы идёте ко врачу на анализ крови, после которого врач приходит к вам и говорит: «Мы провели несколько тестов и обнаружили: не абсолютно точно то, что вы не сделаны из сыра, и существует ненулевая вероятность того, что двадцать фей, сделанных из разумного шоколада, прямо сейчас поют песню „I love you“ из шоу „Барни и его друзья“ внутри вашего кишечника.» Бегите, вашему доктору нужен доктор. Когда учёный говорит эту фразу, он имеет ввиду то, что считает вероятность настолько маленькой, что её невозможно увидеть даже в электронный микроскоп, и ему необходимо получить свидетельство в виде крайне маловероятного события, чтобы опровергнуть свою теорию.»

  • «Согласились бы вы поменять свои убеждения, в которых „абсолютно уверены“, если бы получили достаточно свидетельств? Предположим, например, что сам Бог спустится с небес и скажет вам, что верна вся ваша религия за исключением Непорочного Зачатия. Если это изменит ваше мнение, вы не можете заявлять, что обладаете абсолютной уверенностью в истинности Непорочного Зачатия. В силу технических особенностей теории вероятности существование теоретической возможности того, что вы измените своё мнение по определенному вопросу, не позволяет этому убеждению иметь вероятность, точно равную единице. Неопределённость может быть меньше пылинки, но она всё равно будет. А если вы не готовы поменять своё мнение даже под влиянием слов самого Бога — тогда, полагаю, у вас такая проблема с невозможностью признания своих ошибок. И её вряд ли может решить простой смертный вроде меня.»

Но, вообще говоря, более интересный вопрос в том, как можно убедить кого-либо наедине, а не перед аудиторией. Как начать долгий процесс обучения жизни во вселенной без абсолютной определённости?

Думаю, первоначальным шагом должно стать понимание того, что без абсолютной определённости жить можно — что гипотетическое отсутствие абсолютной уверенности не означает, что принимать решения по моральным и фактическим вопросам нельзя. Перефразируя Лоис Буджолд: «Не давите сильнее, ослабьте сопротивление».

Один из самых распространённых методов защиты Абсолютного Авторитета — это то, что я называю «Аргументом против Аргумента в пользу Софизма Серого», который звучит примерно так:

  • Моральные релятивисты говорят:
    • Мир не делится на чёрное и белое, следовательно:
    • Все серое, следовательно:
    • Ни один человек не лучше другого, следовательно:
    • Я могу делать всё, что захочу, и вы меня не остановите, муа-ха-ха-ха-ха.
  • Но мы должны иметь возможность предотвращать убийства.
  • Следовательно, должен быть какой-то способ иметь абсолютную определенность, иначе моральные релятивисты выиграют.

Перевернутая глупость не есть ум. Нельзя получить верный ответ, просто перевернув каждый аргумент, из которого следует неправильный вывод — это даст глупцам слишком много контроля. И каждой без исключения части рассуждения пришлось бы быть верной с математической точки зрения. Подобно тому, как из убеждения Сталина в том, что 2 + 2 = 4, не следует, что «2 + 2 = 4» — неверно, из убеждения релятивистов в том, что «Мир не делится на чёрное и белое», не следует, что на самом деле мир делится лишь на чёрное и белое. Ошибка здесь (и достаточно её одной) в переходе от двухцветного взгляда на мир к одноцветному, подразумевающему, что все оттенки серого одинаковы.

Принятие предпосылки, согласно которой для вынесения решений по моральным вопросам необходимо иметь абсолютное знание об абсолютном добре и абсолютном зле, сделало бы весь дальнейший спор бессмысленным. Можно иметь неполное знание, относительно плохие и относительно хорошие варианты выбора и при этом всё равно иметь возможность выбирать. Вообще говоря, это должно быть чем-то естественным, а не тем, что стоит так драматизировать.

То есть, да, если перед вами стоит выбор между двумя альтернативами A и B, и каким-то образом вам удалось прийти к абсолютной, доведённой до 100% уверенности в том, что А является абсолютно правильным и хорошим выбором, а B — суммой всего ужасного и отвратительного, тогда это достаточное условие для того, чтобы выбрать А. Но это не обязательное условие.

А, вот ещё что: «Логическая ошибка: Ссылаясь на последствия убеждения».

Итак, что ещё нужно знать вашему собеседнику? Например, то, что существует целая культура рационализма, в которой сомнения, вопросы и признание своих ошибок не являются чем-то ужасным и постыдным.

В этой культуре принято собирать информацию посредством изучения явлений, а не чтения проповедей. При изучении явлений более пристальным взглядом иногда можно обнаружить, что они отличаются от того, чем казались на первый взгляд; но это не значит, что Природа лгала или что её изучение нужно прекратить.

Кроме того, существует понятие откалиброванного свидетельства, заключающееся в том, что «вероятность» не является маленькой шкалой прогресса в голове, которая измеряет эмоциональную привязанность к определенной идее. Скорее, она измеряет то, как часто на практике, в реальной жизни, люди с определёнными убеждениями говорят то, что соответствует истине. Если взять сто людей и каждого попросить сказать что-то, в чём он «абсолютно уверен», сколько всего высказываний будут соответствовать истине? Меньше ста.

Если уж на то пошло, утверждения, относительно которых люди имеют фанатичную уверенность, с намного меньшей вероятностью будут истинными, чем утверждения вроде «Солнце больше Луны», которые кажутся слишком очевидными, чтобы испытывать относительно них какие-либо эмоции. Каждому утверждению, в котором кто-то «абсолютно уверен», можно найти кого-то, кто будет «абсолютно уверен» в чём-то прямо противоположном, потому что такие эмоциональные провозглашения своих убеждений не могут существовать без наличия противоборствующих сторон. Поэтому маленькая шкала прогресса в головах людей, измеряющая их эмоциональную привязанность к определённой идее, не слишком хорошо отражает откалиброванную уверенность в ней — они между собой даже не связаны.

А что до «абсолютной уверенности» — ну, утверждая, что вероятность некоего события равна 99,9999%, вы, по сути, заявляете, что сможете сделать один миллион независимых и одинаковых по силе высказываний, одно за другим без перерыва, в течение года или около того, и ошибётесь в среднем лишь один раз. Это довольно невероятно. (Удивительно то, что можно получить примерно такую же степень уверенности для утверждения «Ты-не-выиграешь лотерею».) Поэтому давайте не будем говорить о вероятностях, равных 1.0. Как только вы увидите, что в реальной жизни такие вероятности не нужны, вы поймёте, насколько нелепо верить в то, что можно приблизиться к 1.0 с помощью человеческого мозга. Вероятность, равная 1.0 — это не просто определённость; это бесконечная определённость.

На самом деле, мне кажется, что во избежание непонимания публики учёным стоит говорить не «Мы не до конца уверены», а «Мы не БЕСКОНЕЧНО уверены». В первом случае во время обычного разговора может показаться, что существуют определённые причины для сомнений.

Перевод: 
stas
Номер в книге "Рациональность: от ИИ до зомби": 
52
Оцените качество перевода: 
Средняя оценка: 4.7 (Всего оценок: 21)

Как убедить меня, что 2 + 2 = 3

Элиезер Юдковский

В «Что такое «свидетельство»?», я писал:

Именно поэтому рационалисты так бережно относятся к, на первый взгляд, парадоксальному утверждению: «убеждение стоит того, чтобы в него верить, лишь в том случае, когда тебя, в принципе, можно убедить в него не верить». Сетчатка, чьё состояние не меняется в зависимости от того, какой в неё входит свет, — сетчатка слепого. Некоторые системы убеждений, довольно очевидно пытаясь защитить себя, утверждают, что ряд убеждений ценен лишь в том случае, когда ты веришь в них безоговорочно: что бы ты ни видел, о чём бы ты ни думал — верь! Мозг должен оставаться в том же состоянии независимо от того, какая информация входит в его недра. Отсюда выражение «слепая вера». Если то, во что ты веришь, не зависит от того, что ты видишь, — ты слеп точно так же, как и человек с пустыми глазницами.
Cihan Baran ответил(English):

Я не могу представить себе ситуацию, в которой 2 + 2 = 4 было бы ложно. Возможно, это означает, что я убеждён в «2 + 2 = 4» безоговорочно.

Признаю, я тоже не могу представить ситуацию, в которой «2 + 2 = 4» было бы ложно (конечно, есть различные переобозначения, но это не «ситуации» и речь тогда идёт уже не о 2, 4, = или +). Но это не делает моё убеждение безоговорочным. Я легко представляю ситуацию, которая убедила бы меня в том, что 2 + 2 = 3.

Скажем, я просыпаюсь ранним утром, вытаскиваю из ушей два кусочка ваты, кладу их на прикроватный столик рядом с двумя другими кусочками ваты — и замечаю, что теперь кусочков ваты три, и при этом никаких кусков ваты не появлялось и не исчезало, несмотря на то, что согласно моей памяти, 2 + 2 должно было равняться 4. К тому же, если представить это действие мысленно, становится очевидно, что для того, чтобы получить XXXX из XX и XX, необходимо взять дополнительный X. Вдобавок, 2 + 2 = 4 противоречит остальной мысленной арифметике, поскольку вычитание XX из XXX даёт XX, но вычитание XX из XXXX даёт XXX. Это снова конфликтует с памятью о том, что 3 – 2 = 1, но странно доверять памяти перед лицом физических и мысленных подтверждений того, что XXX – XX = XX.

Ещё я проверю карманный калькулятор, Гугл, и, возможно, свою копию «1984», где Уинстон пишет, что «Свобода — это возможность сказать, что дважды два — три». Всё это убедительно говорит о том, что весь остальной мир тоже считает, что 2 + 2 = 3, соглашаясь с моими мысленными вычислениями и не соглашаясь с моей памятью.

Как я мог так заблуждаться? Что могло настолько сбить меня с толку? В голову приходят несколько объяснений. Во-первых, какая-нибудь нейрологическая неполадка (наверное, я слишком сильно чихнул) увеличила все суммы в моей памяти на единицу. Во-вторых, гипноз. В-третьих, глюк или намеренное изменение компьютерной симуляции, в которой я нахожусь. В любом случае, скорее что-то неладно с моей памятью, чем 2 + 2 когда-то действительно равнялось 4. И, конечно же, ни одно из этих трёх правдоподобных объяснений не избавит меня от ощущения очень, очень сильного замешательства.

Другими словами, свидетельства, убедившие меня в том, что 2 + 2 = 3, относятся к тому же классу свидетельств, что сегодня убеждают меня в том, что 2 + 2 = 4: перекрёстный огонь физических наблюдений, мысленных представлений и социального согласия.

Когда-то я понятия не имел, что 2 + 2 = 4. Это убеждение возникло не из-за какого-то случайного процесса — тогда мозгу было бы безразлично, что именно запомнить, «2 + 2 = 4» или «2 + 2 = 7». Ответ, хранящийся в моём мозге, поразительно похож на результат размещения двух кусочков ваты рядом с двумя другими кусочками ваты — и это заставляет задуматься, какая именно сцепленность породила это странное соответствие между разумом и реальностью.

Ведь для убеждения-о-фактах существует лишь два варианта: либо он попал в мозг благодаря процессу сцепления разума с реальностью, либо нет. Если нет, то убеждение может быть верным лишь благодаря стечению обстоятельств. Если в убеждении есть хотя бы намёк на внутреннюю сложность (то есть, его симуляция требует компьютерную программу больше 10 битов длиной), то пространство вариантов становится столь большим, что возможность совпадения исчезает.

Безоговорочные факты — не то же самое, что и безоговорочные убеждения. Если сильные свидетельства убеждают меня в том, что факт безоговорочен, то это не означает, что я всегда верил в этот факт, без нужды в сильных свидетельствах.

Я убеждён, что 2 + 2 = 4, но я легко могу придумать ситуацию, которая убедила бы меня в том, что 2 + 2 = 3. А именно: ситуация из того же класса, что и ситуация, сегодня убеждающая меня в том, что 2 + 2 = 4. Потому я не боюсь, что я пал жертвой слепой веры.

Если здесь есть христиане, знающие теорему Байеса (нумерофобы, пожалуйста, покиньте помещение), то я хотел бы спросить вас о ситуации, убедившей бы вас в истинности ислама. Предположительно, это будет примерно той же самой ситуацией, что породила вашу сегодняшнюю веру в христианство: вы вытащены из чрева мусульманки, воспитаны мусульманскими родителями, постоянно говорившими о том, что следует быть мусульманином (причём убеждение в истине ислама должно быть безоговорочным). Или всё не так просто? Если да, то какая ситуация заставит вас принять ислам, или, хотя бы, не-христианство?

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
53
Оцените качество перевода: 
Средняя оценка: 3.2 (Всего оценок: 91)

Бесконечная определённость

Элиезер Юдковский

В «Абсолютном авторитете» я говорил о том, что бесконечная определённость нам не требуется:

Если перед вами стоит выбор между двумя альтернативами A и B, и каким-то образом вам удалось прийти к абсолютной, доведённой до 100% уверенности в том, что А является абсолютно правильным и хорошим выбором, а B — суммой всего ужасного и отвратительного, тогда это достаточное условие для того, чтобы выбрать А. Но это не обязательное условие… Можно иметь неполное знание, относительно плохие и относительно хорошие варианты выбора и при этом всё равно иметь возможность выбирать. Вообще говоря, это должно быть чем-то естественным.

Говоря 2 + 2 = 4, нужно делать различие между картой и территорией. Учитывая, что, по-видимому, физические законы абсолютно стабильны и универсальны, вполне возможно, что никогда за всю историю существования вселенной ни одна частица не преодолевала скорость света. Поэтому предел, устанавливаемый этой скоростью, вероятно, истинен не в 99% случаев, и не в 99,9999% случаев, и не в (1 − 1/гуголплекс) случаев, а абсолютно всегда.

Но можно ли иметь абсолютную уверенность в величине предела скорости света — это уже совсем другой вопрос. Карта — это не территория.

То, что ученик списал на контрольной, может быть совершенно и полностью истинным, но знаете ли об этом вы — не говоря уж об абсолютной уверенности — это совсем другое дело. Если вы подбросите монетку и закроете её рукой, может быть совершенно истинным то, что она упала орлом вверх, при этом сами вы можете не иметь абсолютно никакой уверенности в том, упала она орлом или решкой. Степень неуверенности — это не то же самое, что и степень правды или частоты возникновения.

То же касается и математических истин. Спорный вопрос — можно ли считать высказывания «2 + 2 = 4» или «В арифметике Пеано SS0 + SS0 = SSSS0» истинными исключительно в абстрактном смысле, отдельно от физических систем, которые ведут себя похожим на аксиомы Пеано образом. Сказав это, я сразу забегу вперёд и предположу, что, в каком бы смысле «2 + 2 = 4» не было истинно, оно истинно всегда и без исключений, а не просто примерно истинно («2 + 2 на самом деле равно 4,0000004») или истинно в 999 999 999 999 из 1 000 000 000 000 случаев.

Я не до конца уверен, что в этом случае должно значить «истинно», но я останусь при своём предположении. Убедительность утверждения «2 + 2 = 4 является истинным всегда» далеко превосходит убедительность любого философского утверждения о том, что значит «истинно», «всегда» или «является» в предложении выше.

Однако это не значит, что я имею абсолютную уверенность в том, что 2 + 2 = 4. Прочитайте предыдущую дискуссию — как убедить меня в том, что 2 + 2 = 3 — это можно сделать с помощью тех же свидетельств, которые изначально убедили меня в том, что 2 + 2 = 4. Мне могли привидеться все предыдущие свидетельства, или я их неправильно вспомнил. В истории неврологии были и более странные нарушения работы мозга.

Поэтому, если мы присваиваем какую-либо вероятность утверждению «2 + 2 = 4», каково должно быть ее значение? Здесь мы пытаемся достигнуть правильной калибровки — то есть утверждения, которым вы присваиваете «вероятность 99%», должны быть истинными в 99 из 100 случаев. Вообще говоря, это намного труднее, чем может казаться. Найдите сто людей и попросите их сделать заявления, в которых они «уверены на 99%». Как вы думаете, будут ли из 1000 сделанных заявлений неверными лишь 10?

Сейчас я не буду обсуждать настоящие эксперименты о калибровке, которые проводились учеными — вы можете найти их в моей работе «Потенциальное влияние когнитивных искажений на оценку глобальных рисков» — потому что, сходу рассказывая слушателям об этих экспериментах без должной у них подготовки, я нередко был свидетелем того, как они затем использовали их в качестве Универсального контраргумента, который почему-то всегда приходит в голову в тех случаях, когда нужно проигнорировать уверенность оппонента по поводу непонравившегося мнения, и никогда — при анализе своего собственного. Поэтому я стараюсь избегать упоминания экспериментов о калибровке за исключением тех случаев, когда я рассказываю о понятиях рациональности по определенному плану, который включает в себя предупреждения против предвзятого скептицизма.

Как бы то ни было, наблюдаемая калибровка у людей такова: вещи, в которых они «уверены на 99%», происходят не в 99% случаев.

Например, вы заявляете, что на 99,99% уверены в истинности выражения 2 + 2 = 4. Значит, вы только что сказали, что смогли бы сделать 10 000 независимых утверждений с одинаковой в них уверенностью и ошибиться в среднем всего один раз. Может быть, для 2 + 2 = 4 такой невероятный уровень уверенности и возможен: «2 + 2 = 4» является крайне простым выражением как в математическом, так и в эмпирическом смысле, и убеждение в его истинности широко распространено в обществе (не с выражением страстной поддержки, а со спокойным принятием как чего-то само собой разумеещегося). Поэтому, возможно, по поводу истинности этого убеждения все же можно иметь уверенность, равную 99,99%.

Однако я не думаю, что можно иметь уверенность в 99,99% для таких утверждений, как «53 является простым числом». Да, оно кажется верным, но если вы сделаете 10 000 независимых утверждений такого рода — именно так: не просто некий набор утверждений о простых числах, а новое утверждение каждый раз — вы ошибетесь больше, чем однажды. Питер де Бланк рассказывал на эту тему очень забавную историю. (Я просил его больше так не делать.)

Тем не менее, карта — это не территория: если я говорю, что на 99% уверен в истинности 2 + 2 = 4, это не значит, что я думаю, будто «2 + 2 = 4» истинно с 99% точностью, или что «2 + 2 = 4» верно в 99% случаев. Утверждение, относительно которого я высказываю свою уверенность — «2 + 2 = 4 является истинным абсолютно всегда и без исключений», а не «2 + 2 = 4 обычно является истинным».

А что до убеждения в том, что можно иметь уверенность в 100% относительно математических утверждений — перестаньте! Если вы высказываете уверенность величиной в 99,9999%, это значит, что вы можете сделать миллион отдельных утверждений, одно за другим и ошибиться в среднем лишь один раз. Это заняло бы у вас примерно год времени, если бы вы произносили одно утверждение каждые 20 секунд по 16 часов в день.

Высказывая уверенность величиной в 99,9999999999%, вам придется сделать это триллион раз. Теперь вам предстоит говорить в течение ста человеческих жизней и ни разу при этом не ошибиться.

Выскажите уверенность величиной в $(1 − 1/гуголплекс)$ и ваше эго далеко превзойдет эго любого пациента психиатрической клиники, верящего, что он является Богом.

А гуголплекс гораздо меньше, чем даже относительно небольшие среди непостижимых по своему размеру чисел вроде $3↑↑↑3$. Но даже уверенность величиной в $1 - 1/3↑↑↑3$ ненамного ближе к ВЕРОЯТНОСТИ 1, чем, например, к 90%.

Если даже и этого мало, то гипотетические Темные повелители Матрицы, которые прямо сейчас меняют, как ваш мозг оценивает убедительность утверждения, которое вы сейчас читаете, преградят дорогу и спасут нас от падения в бездну бесконечной определенности.

Абсолютно ли я уверен в этом?

Разумеется, нет.

Как сказал Рафаль Смигродски:

Я предполагаю, что можно присваивать уверенность меньше 1 к математическим понятиям, которые сами необходимы для определения теоремы Байеса, и при этом все равно иметь возможность ее использовать. Я не полностью уверен в том, что я всегда должен быть уверен не до конца. Возможно, я спокойно могу быть уверенным в чем-то. Но как только я присваиваю утверждению вероятность величиной в 1, пути назад нет. Независимо от того, что я увижу или узнаю, мне придется отвергнуть все, что противоречит моей аксиоме. Мне не нравится идея о том, что у меня больше никогда в жизни не будет возможности изменить свое мнение по поводу определенного вопроса.

Перевод: 
stas
Номер в книге "Рациональность: от ИИ до зомби": 
54
Оцените качество перевода: 
Средняя оценка: 4.8 (9 votes)

0 и 1 не являются вероятностями

Элиезер Юдковский

Один, два и три - это целые числа, как и минус четыре. Если считать в верхнюю или нижнюю сторону, можно встретить еще очень и очень много целых чисел. Как бы то ни было, вы никогда не доберетесь до того, что называется «положительной бесконечностью» или «отрицательной бесконечностью» - поэтому целыми числами они не являются.

Положительная и отрицательная бесконечности - это не целые числа, а, скорее, специальные символы для описания поведения целых чисел. Люди иногда говорят что-то вроде «5 + бесконечность = бесконечность», потому что, если начать отсчет с 5 и подниматься все выше и выше, никогда не останавливаясь, мы будем бесконечно получать все большие и большие числа. Но из этого не следует, что «бесконечность - бесконечность = 5». Не получится начать безостановочный отсчет с 0 вверх, затем безостановочный отсчет вниз, и в итоге прийти к числу 5.

Из этого можно заключить, что бесконечность не только не является целым числом - она не ведет себя как целое число. Если вы по неосторожности попытаетесь смешать бесконечности с целыми числами, вам придется определить особые нестабильные правила поведения, которые не нужны при работе с 1, 2, 3 и всеми остальными целыми числами.

Хотя бесконечность и не является целым числом, не стоит переживать по поводу того, что можно запутаться при работе с числами. Люди видели пять овец, миллионы песчинок и септиллионы атомов, но никто никогда не встречал бесконечность чего бы то ни было. То же самое справедливо и для непрерывных величин - люди измеряли пылинки размером в миллиметры, животных размером в метры, города длиной в километры и галактики размером в тысячи световых лет, но никто и никогда не измерял что-то размером в бесконечность. В реальном мире понятие бесконечности особо не требуется.

(Более эрудированным читателям добавлю, что им не нужно детально объяснять мне, скажем, разницу между порядковыми и кардинальными числами. Да, я знаком с различными определениями бесконечности из теории множеств, но я не вижу пользы от их применения в теории вероятности. Подробнее ниже.)

При традиционном способе написания вероятностей их величины находятся между 0 и 1. Монета может выпасть орлом с вероятностью 0.5; синоптик может присвоить вероятность 0.9 тому, что завтра пойдет дождь.

Но это не единственный способ записи вероятностей. Вероятности можно, например, преобразовывать в шансы с помощью формулы O = (P / (1-P)). Так, вероятность 50% превратится в шансы 0.5/0.5, или 1, обычно записываемые как 1:1, в то время как вероятность 0.9 превратится в шансы 0.9/0.1, или 9, обычно записываемые как 9:1. Чтобы сделать обратное преобразование, нужно использовать формулу P = (O / (1+O)), и это превращение полностью обратимо и является изоморфным - вычисление величины вероятности возможно двумя обратимыми способами. Ввиду изоморфности вероятностей и шансов выбирать удобный способ можно на свое усмотрение.

Шансы, например, удобнее использовать при выполнении Байесианских обновлений. Представим, что я бросаю шестигранный кубик: если выпадает любая сторона, кроме 1, существует 10%-ный шанс услышать звонок, а если выпадает сторона 1, шанс услышать звонок становится 20%. Я бросаю кубик и слышу звонок. Каковы шансы на то, что выпала сторона 1? Априорные шансы - 1:5 (что соответствует числу 1/5 = 0.2), а отношение правдоподобия - 0.2:0.1 (что соответствует числу 2), и можно просто перемножить эти два числа и получить апостериорные шансы 2:5 (что соответствует числу 2/5 или 0.4). Затем, если мне нужно, я перевожу все это обратно в вероятности и получаю (0.4/1.4) = 2/7 = ~29%.

Итак, с шансами удобнее работать при Байесианских обновлениях - если использовать вероятности, придется применять теорему Байеса в ее более сложном виде. Но вероятности удобнее для вопросов вроде «Если я брошу шестигранный кубик, каковы шансы увидеть число от 1 до 4?» Можно сложить все вероятности величиной 1/6 для каждой стороны и получить 4/6, но нельзя сложить отношение шансов 0.2 для каждой стороны и получить отношение шансов 0.8.

Зачем я обо всем этом говорю? Чтобы показать, что «отношение шансов» - такой же разрешенный способ перевода неопределенности в реальные числа, как и «вероятности». Отношения шансов более удобны для одних операций, вероятности - для других. Знаменитое доказательство, называемое теоремой Кокса (плюс некоторые ее дополнения и усовершенствования), демонстрирует, что все способы выражения неопределенности, которые имеют разумные ограничения, в итоге оказываются друг другу изоморфны.

Почему важно то, что отношения шансов разрешены так же, как и вероятности? Вероятности в своем обычном виде записываются в виде чисел от 0 до 1, и оба крайних числа - 0 и 1 - кажутся вполне достижимыми величинами: можно легко встретить 1 зебру или 0 единорогов. Но при переводе вероятностей в шансы 0 остается 0, однако 1 превращается в положительную бесконечность. В этом случае абсолютная истина не кажется настолько легкодостижимой.

Форма, в которой Байесианские обновления делать даже удобнее - логарифмы отношения шансов; это тот способ, которым советовал думать о вероятностях Э. Т. Джейнс. Например, априорная вероятность утверждения равна 0.0001 - это соответствует логарифму отношения шансов величиной около -40 децибел. Затем вы видите свидетельство, которое кажется в 100 раз более правдоподобным в случае истинности этого утверждения, чем в случае его ложности. Это 20 децибел свидетельств. Теперь апостериорный логарифм отношения шансов равен примерно -40 дБ + 20 дБ = -20 дБ, что равно апостериорной вероятности около 0.01.

При переводе вероятностей в логарифмы отношения шансов 0 превращается в отрицательную бесконечность, а 1 - в положительную. Теперь и бесконечная определенность, и бесконечная невероятность кажутся еще более недостижимыми.

При использовании вероятностей величины 0.9999 и 0.99999 кажутся отличающимися всего на 0.00009, а 0.502 находится гораздо дальше от 0.503, чем 0.9999 - от 0.99999. Чтобы получить вероятность 1 из вероятности 0.99999, кажется, что надо преодолеть дистанцию всего лишь в 0.00001.

Но если перевести вероятности в отношения шансов, 0.502 и 0.503 становятся 1.008 и 1.012, а 0.9999 и 0.99999 превращаются в 9,999 и 99,999. А если перевести их в логарифмы отношения шансов, 0.502 и 0.503 превращаются в 0.03 и 0.05 децибел, а 0.9999 и 0.99999 становятся 40 и 50 децибелами.

При работе с логарифмами отношения шансов разница между двумя величинами неопределенности равна количеству свидетельств, которые нужны при переходе от одной величины к другой. Таким образом, логарифмы отношения шансов предоставляют удобный способ нахождения величины в пространстве степеней уверенности.

Использование логарифмов отношения шансов позволяет увидеть, что достижение бесконечной определенности требует бесконечно сильного свидетельства, также как и достижение бесконечной абсурдности требует бесконечно сильного контрсвидетельства.

Кроме того, все виды стандартных теорем в теории вероятности оговаривают особые случаи при использовании 1 и 0 - например, что происходит при попытке сделать Байесианское обновление наблюдения, которому была присвоена вероятность 0.

Так что, думаю, вполне разумно говорить о том, что 1 и 0 не входят в пространство величин вероятностей; как и отрицательная и положительная бесконечности, которые не подчиняются основным аксиомам булевой алгебры и не являются обычными числами.

Главная причина, по которой все это может расстроить тех, кто использует обычную теорию вероятности - это то, что придется заново выводить теоремы, полученные на основе предположения, что можно сложить все вероятности и получить 1.

Однако в реальном мире при броске кубика вероятность выпадения любого числа в диапазоне от 1 до 6 не является действительно бесконечной. Кубик может упасть на ребро, или уничтожиться в результате падения метеорита, или Темные Повелители Матрицы вмешаются и напишут «37» на одной из его сторон.

Если вы задали магический символ для «всех неучтенных возможностей», тогда вы можете игнорировать все события, описываемые этим магическим символом, и получить величину в виде магического символа «Т», который означает бесконечную уверенность.

Но я бы предпочел найти способ, в котором теорема работает без использования магических символов с особым поведением. Это было бы гораздо более изящно. Подобно математикам, которые отказываются принимать закон исключенного третьего или бесконечные множества, я бы хотел быть приверженцем теории вероятности, который не верит в абсолютную определенность.

Перевод: 
stas
Номер в книге "Рациональность: от ИИ до зомби": 
55
Оцените качество перевода: 
Средняя оценка: 3.8 (20 votes)

Твоя рациональность — моё дело

Элиезер Юдковский

Некоторые отзывы на «Лотереи: бессмысленная трата надежды» упрекали меня за резкость в критике чужих решений; если кто-то другой выбирает купить лотерейные билеты, кто я такой, чтобы быть несогласным? Это особый случай более важного вопроса: Какое мне дело, если кто-то скорее предпочтёт верить в то, что приятно, чем в то, что верно? Не может ли каждый сам выбрать: стоит ли заботиться о правде?

Очевидным придирчивым возражением будет: «Почему тебя волнует то, волнует ли меня, чьё-то мнение о правде?» Это отчасти непоследовательно для вашей функции полезности: содержать негативное определение чьей-то функции полезности иметь определение полезности кого-то ещё. Но это лишь придирка, не ответ.

Ну вот мой ответ: я верю, что для меня, как человека, правильно быть заинтересованным в будущем и в том, чем станет человеческая цивилизация в будущем. Один из этих интересов - человеческое стремление к истине, медленно растущее в поколениях (ведь это не всегда было Наукой). Я хочу быстрее повысить это стремление, в этом поколении. Это моё желание ради Будущего. Ради всех нас, игроков на этом безграничном игровом поле, берём мы за него ответственность или нет.

И это делает вашу рациональность моим делом.

Опасная идея? Да, и не просто крайне «опасная». Люди сгорали насмерть из-за того, что какой-то жрец решил, что они думают не тем образом, которым следует думать. Решение сжечь людей, поскольку они «не думают должным образом» — отвратительный образ мысли, не так ли? Вы бы не хотели, чтобы люди думали так, потому это и отвратительно. Люди, которые думают так… ну, мы обязаны что-то с ними сделать…

Я согласен! Вот моё предложение: давайте выступать против плохих идей, но не поджигать их носителей.

Силлогизм, который мы желаем избежать, гласит: «Я думаю, Сьюзи сказала плохую вещь, следовательно, Сьюзи должна быть сожжена». Некоторые попытки избежать этого силлогизма исходят из обозначения неправильной мысли, что Сьюзи сказала плохую вещь. Никто никогда не должен никого судить; любой, кто осуждает, совершает страшный грех, и должен быть выставлен за это к позорному столбу.

С моей стороны, я отрицаю по следующей причине. Мой силлогизм гласит: «Я думаю, Сьюзи сказала что-то неправильное, поэтому я буду выступать против её слов, но я не буду её сжигать или останавливать её речь насилием или законом…»

Все мы игроки на этом безграничном игровом поле, и один из моих интересов на будущее — сделать игру честной. Контринтуитивная идея, лежащая в основе науки, о том, что фактические разногласия должны решаться через эксперименты и математику, а не насилие и запреты. Это важное замечание может быть расширено за пределы науки, к честному бою ради всего будущего. Вам следует побеждать благодаря убеждению людей, и не следует позволять себе сжигать их. Это один из принципов Рациональности, которому я торжественно клянусь в верности.

Люди, которые защищают релятивизм или эгоизм, не представляются мне действительно релятивизмичными или эгоистичными. Если бы они были действительно релятивизмичными, они бы не судили. Если бы они были действительно эгоистичны, они бы занимались заработком денег вместо горячих споров с остальными. Скорее, они выбрали сторону Релятивизма, чья цель на этом безграничном игровом поле — предотвратить игроков — всех игроков — от определённых суждений. Или они выбирают сторону Эгоизма, чья цель — сделать всех игроков эгоистичными. И затем они играют в игру, честно или нечестно, в соответствии со своей мудростью.

Если здесь есть какие-то настоящие Релятивисты или Эгоисты, мы их не слышим — они остаются безмолвными, не-игроками.

Я не могу помочь, но забочусь о том, как вы думаете, потому что, как бы я ни не мог помочь, я вижу вселенную: каждый миг человек отворачивается от истины, делая историю человечества немного более мрачной. Во многих случаях это лишь небольшая тьма. (Кто-то всё время не прекращает получать боль). Врущие самим себе в уединении своих мыслей не омрачают человеческую историю так сильно, как врущие людям или сжигающие их. Уже здесь есть часть меня, которая не может помочь, но горюет. И всё время пока я не пытаюсь сжечь вас — лишь спорю с вашими идеями — я верю, что это верно для меня как человека, поэтому я забочусь о людях — моих товарищах. Это также позиция, которую я защищаю в отношении Будущего.

Перевод: 
deep_blue_hex
Номер в книге "Рациональность: от ИИ до зомби": 
56
Оцените качество перевода: 
Средняя оценка: 3.8 (24 votes)

Политика и рациональность

Мэйнстримная политика, как и теледебаты, знаменита своими гневными, непродуктивными дискуссиями. Если задуматься, это кажется странным. Почему мы воспринимаем так близко к сердцу политические разногласия, если эффекты национальной политики так далеки от нас в пространстве и времени? Если уж на то пошло, почему мы не можем быть аккуратней со свидетельствами, когда имеем дело с важными для нас вопросами?

Автор: 
Элиезер Юдковский

Политика — убийца разума

Элиезер Юдковский

Когда речь идёт о политике, люди начинают терять голову. Причины этой особенности настолько до банальности очевидны, что можно привести их ещё раз. В среде эволюционной адаптации политическая обстановка была вопросом жизни и смерти (а также секса, богатства, союзников, репутации и многого другого). И сегодня, начиная спор о том, должны ли «мы» поднять минимальную заработную плату, ты применяешь весь богатый набор адаптаций к среде эволюционной адаптации. Ты возвращаешься во времена, когда тебя могли убить за нахождение на неверной стороне баррикады (зато, если ты находился на верной стороне баррикады, то уже ты получал возможность убить немало досаждавшего тебе соперника!).

Если ты хочешь высказать какое-то соображение, касающееся науки или рациональности, то совершенно не стоит хоть каким-нибудь образом задевать современную политику, когда есть возможность этого избежать. Если твоя основная мысль неотделимо связана с политикой — расскажи о Людовике XVI и великой французской революции. Политика — та важная область, в которой следует применять рациональность, но в которой категорически не следует изучать рациональность.

Политика — продолжение войны, война с применением словесного оружия. Аргументы — это солдаты. Ты же знаешь, на чьей ты стороне? Теперь ты должен поддерживать все аргументы своей стороны и атаковать все аргументы, которые каким-либо образом оказывают содействие стороне противника. Исподтишка бить своих солдат решительно недопустимо, и перевязывать раны солдатам врага — тоже.

Учёные, привыкшие в своей профессиональной деятельности непредвзято осматривать вопрос со всех сторон и здраво взвешивать все «за» и «против», превращаются в скандирующих лозунги зомби, как только разговор затрагивает область, занятую Синими или Зелёными; как только в разговоре становится уместным вспомнить об отношении своей группировки к обсуждаемому вопросу.

Традиционный пример задачи на немонотонное мышление из области искусственного интеллекта звучит так: «Все квакеры — пацифисты. Все республиканцы — не пацифисты. Никсон квакер и республиканец. Является ли Никсон пацифистом?»

В чём, хочется мне спросить, заключается смысл выбора именно этой ситуации в качестве примера? Автор хочет растормошить в читателе политические эмоции и отвлечь его от основного вопроса? Автор хочет, чтобы республиканцам было неуютно на курсах изучения искусственного интеллекта, чтобы ни один республиканец не отважился заниматься этой областью информатики? И нет, я не республиканец, как вы могли бы подумать. И не демократ.

Этот пример отвлекает. Почему кто-то, столкнувшись с задачей продемонстрировать пользу немонотонных рассуждений, выбрал именно его? Скорее всего, причина в том, что автор не смог удержаться от соблазна бросить хорошее, добротное язвительное замечание в сторону этих ненавистных Зелёных. Отвешивать оплеухи приятно; разве можно не поддаться желанию откусить кусочек шоколадного печенья?

Но не все приятные вещи полезны. И несчастные читатели явно не видят никакой пользы в необходимости продираться через уйму разъярённых комментариев, спровоцированных брошенной вскользь насмешкой, не несущей никакой смысловой нагрузки.

Я говорю не о том, что этот сайт должен держаться в стороне от политики, или о том, что нам надо перенять у Википедии нейтральную точку зрения. Просто попытайся сопротивляться соблазну сделать добротный ощутимый язвительный комментарий, если этого возможно избежать. Если интересующая тебя тема напрямую касается попыток убрать теорию эволюции из школьной программы — говори, но не обвиняй в этом всю партию республиканцев целиком: твоими читателями могут быть республиканцы, и они могут считать, что причина состоит в действиях нескольких негодяев, а не во взглядах всей партии. Не имеет никакого значения, кто виноват на самом деле, и что ты думаешь по этому поводу. Возможность обсуждать щекотливые вопросы, не скатываясь в цветную политику, очень полезна для духовного развития нашего сообщества.

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
57
Оцените качество перевода: 
Средняя оценка: 4 (Всего оценок: 31)

Не делайте политические споры однобокими

Элиезер Юдковский

Робин Хансон недавно предложил разрешить магазины(English), в которых можно было бы продавать запрещенные продукты. Есть ряд отличных аргументов в пользу подобной политики — врожденное право на личную свободу, карьерный стимул для бюрократов запрещать всё и вся, то, что законодатели столь же предвзяты, как и все. Но даже так (ответил я), некая бедная, честная, но не особо образованная мать пятерых детей может пойти в эти магазины и купить «Напиток доктора Снейкойла из серной кислоты» для своих воспаленных суставов и умереть, оставив своих отпрысков рыдать на национальном телевидении.

Я просто сделал простое фактическое наблюдение. Почему ряд людей решили, что это аргумент в пользу регулирования?

Если судить по вопросам, то даже простой факт (например, что жизнь на Земле возникла в результате естественного отбора), согласно естественным ожиданиям, должен быть аргументом для одной из сторон в битве; факты сами по себе не принадлежат к какой-либо стороне, и так называемый «баланс свидетельства» должен отражать это. На самом деле согласно Байесовскому определению доказательств «сильные свидетельства» - это именно те доказательства, которые мы ожидаем найти только у одной стороны аргументации.

Но нет причин, чтобы сложные действия со многими последствиями демонстрировали это однобокое свойство. Почему кажется, будто люди хотят, чтобы их политические дебаты были однобокими?

Политика — это убийца разума. Аргументы там — солдаты. Если вы определились на какой вы стороне, то вы должны поддерживать все аргументы этой стороны и атаковать все аргументы, которые, как представляется, благоприятствуют врагу. Иначе получается, будто вы бьете в спины своих солдат. Если вы находитесь внутри этого шаблона, то политические дебаты будут для вас однобокими — издержки и недостатки вашей любимой политики будут для вас вражескими солдатами, которых следует атаковать всеми возможными методами.

Также следует опасаться другого подобного неудачного шаблона — думать, что Очень Мудрый Путь — это идеально ровный компромисс между любыми двумя политическими позициями, которые получают больше всего эфирного времени. У политики могут быть несбалансированные недостатки и преимущества. Если политические вопросы не склоняются в ту или иную сторону, то мы не будем в состоянии принимать решения о них. Однако существует людская тенденция отрицать все издержки любимой политики или отрицать все преимущества нелюбимой политики; таким образом люди склонны думать, что компромиссы в политике отклоняются гораздо дальше, чем это есть на самом деле.

Если вы разрешите к продаже некоторые из запрещенных товаров, то какая-то бедная, честная, малообразованная мать пятерых детей купит что-либо, что убьет ее. Это предсказание о фактическом следствии, а в качестве фактического вопроса оно выглядит довольно простым - здравомыслящий человек должен с готовностью признаться, что это правда, независимо от того, какую позицию он занимает по вопросам политики. Это признание не мешает вам думать, что запрещение вещей просто делает их более дорогими, что те, кто регулирует запреты, будут злоупотреблять своей властью, или что ее личная свобода перевешивает ваше желание вмешиваться в ее жизнь. Однако факт остаётся фактом: она умрёт.

Мы живем в несправедливой вселенной. Как и все приматы, люди показывают сильную отрицательную реакцию на воспринимаемую несправедливость; из-за этого мы воспринимаем данный факт очень тяжело. Есть два распространенных способа решения возникающего когнитивного диссонанса. Во-первых, можно изменить свое мнение о фактах — отрицать, что несправедливые события вообще могут иметь место, или отредактировать историю так, чтобы она казалась справедливой. Во-вторых, можно скорректировать свою мораль — отрицать что события несправедливы.

Некоторые либертарианцы могут сказать, что если вы идете в магазин «запрещенных товаров», игнорируя предупреждающие таблички, которые говорят, что «ВЕЩИ ИЗ ЭТОГО МАГАЗИНА МОГУТ УБИТЬ ВАС», и покупаете там что-либо, что вас убивает, то это только ваша вина и вы сами этого заслуживаете. Если это морально правильно, то получается, будто нет вообще никакого недостатка в том, чтобы продавать запрещенные продукты. Получается не просто чистый выигрыш, это будет односторонний компромисс без каких-либо недостатков.

Другие возражают, что регулирующие органы можно обучить выбирать рационально и учитывать интересы потребителя; если бы это соответствовало фактам, то (согласно их принципам) не было бы недостатков в регулировании.

Нравится вам это или нет, но при рождении существует лотерея на интеллект — хотя это один из тех случаев, когда несправедливость Вселенной настолько велика, что большинство людей предпочитает отрицать факты. Экспериментальные доказательства чисто генетического компонента, который составляет 60-80%, являются ошеломляющими, однако даже если это опровергнут, вы не выбираете, какими окажутся ваши родители или начальная школа.

Мое воспитание говорит мне, что отрицание реальности — это морально неправильно. Если бы я мог выдавать желаемое за действительное в отношении того, что напиток из серной кислоты может быть для меня полезен, то получалось бы, что я делаю что-то, против чего меня предупреждали и пошел бы против своего воспитания. Некоторые люди рождаются в определенных условиях — мы не будем говорить о генах, поскольку эта часть слишком уж несправедлива, — где местный знахарь говорит им, что правильно — это верить, а неправильно — проявлять скепсис. Из самых лучших побуждений они следуют этому совету и умирают. В отличии от вас, их не научили, что люди отвечают за личный выбор, когда следуют примеру общества. Вы правда думаете, что настолько умны, что были бы по-научному скептичны, даже если бы родились в шестом веке н.э.? Да, при рождении существует лотерея, независимо от того, во что вы верите касательно генов.

Говорить «Люди, которые покупают опасные продукты, заслуживают того, чтобы пострадать!» — не значит трезво мыслить. Это всего лишь способ отрицать то, что ты живешь в несправедливой вселенной. По-настоящему трезвомыслящий человек скажет: «Да, серная кислота может стать причиной ужасной болезненной смерти, и нет, мать пятерых детей не заслуживает этого, однако мы все же откроем такие магазины, поскольку согласно нашим вычислениям для нас это будет выгодно». Вы можете представить, чтобы политик так сказал? Я тоже не могу. Но поскольку экономисты имеют влияние на политику, это может помочь, если они подумают об этом в частном порядке — возможно, даже скажут это в журнальных статьях, однако преподнося это в запутанной форме со множеством смыслов, чтобы СМИ не имели возможности цитировать их.

Я не думаю, что случай, когда кто-либо делает глупый выбор и умирает, может быть поводом для праздника. Я расцениваю это как трагедию. Людей не всегда можно спасти от последствий их действий; однако я провожу моральную черту при смертной казни. Если вы мертвы, то вы не можете учиться на своих ошибках.

К сожалению, вселенная не согласна со мной. И мы еще посмотрим в будущем, кто останется правым.

Добавлено: две основных причины для политической однобокости это такие когнитивные искажения как аффектированное решение и вера в справедливый мир(just-world fallacy) (English).

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
58
Оцените качество перевода: 
Средняя оценка: 3.6 (25 votes)

Весы правосудия, блокнот рациональности

Элиезер Юдковский

Богиня правосудия повсеместно изображается держащей в одной руке весы. У весов есть свойство — когда одна чашка опускается, вторая поднимается выше. Это очень удобно и легко отслеживаемо. И также обычно является грубым искажением.

В человеческом дискурсе существует естественная тенденция превращать обсуждение в своего рода битву, продолжение войны, спорт; и в спорте вам нужно следить только за тем, сколько очков набрала ваша команда и команда противника. Там есть только две стороны, и каждое очко, проигранное одной стороной, это очко, заработанное другой. Каждый в таком обсуждении мысленно ведет счет, у какого оратора больше очков в споре. В конце дебатов победителем получается тот, у кого очков больше; и таким образом, всё что он сказал, должно быть истинно, а всё, что говорил его противник, соответственно, ложно.

«Аффективная эвристика в оценке рисков и преимуществ» (English) описывает то, как испытуемые в своих оценках смешивают возможные преимущества технологии (например ядерной энергии) и возможные риски данной технологии в единое общее хорошее или плохое ощущение касательно технологии. Предположим, что я сначала рассказываю вам, что определённый вид ядерных реакторов производит меньше отходов, чем все другие. А потом упоминаю, что данный реактор менее стабилен, нежели остальные и угроза расплавления, если одновременно произойдет много сбоев, у него куда выше.

Если реактор имеет большую вероятность сбоя, то это кажется аргументом «против него» или аргументом «против» любого, кто захочет строить такой реактор. А если реактор производит меньше отходов, то это аргумент «за» реактор или «за» его постройку. Так что же, данные факты противостоят друг другу? Ни в коем случае. По крайней мере в реальном мире. Эти два факта могут находиться по разные стороны баррикад в различных дебатах, однако логически они не связаны; факты понятия не имеют на какой они стороне. Количество отходов, производимое реактором, зависит от физических свойств его конструкции. Другие физические свойства делают его более нестабильным. Даже если ряд этих свойств один и тот же, вам следует рассматривать вероятность расплавления и ожидаемый выход отходов отдельно. Это два разных физических вопроса с двумя разными фактическими ответами.

Однако исследования, подобные приведённым выше, показывают, что люди склонны оценивать технологии — и многие другие задачи — по общему плохому или хорошему ощущению. Если вы скажете людям, что конструкция реактора позволяет сократить объём производимых отходов, они также неосознанно снизят вероятность расплавления реактора. Это означает, что будет получен неправильный ответ на физические вопросы, у которых есть вполне определённые ответы, основанные на фактах, поскольку вы смешиваете логически не связанные вопросы — рассматривая факты как солдат разных армий в войне и думая, что любой солдат одной стороны может сражаться с любым солдатом другой стороны.

Весы могут служить Правосудию, если оно исследует сугубо фактический вопрос вины или невиновности. Джон Смит либо убил Джона Доу, либо нет. Однако мы знаем (согласно Э. Т. Джейнсу), что все байесовские свидетельства состоят из потоков вероятности между гипотезами; нет такой вещи как свидетельство, которое «поддерживает» или «возражает» отдельной гипотезе, кроме тех случаев, когда и другие гипотезы становятся хуже или лучше. Так что если Правосудие исследует отдельный, строго фактический вопрос с пространством бинарных ответов, весы будут подходящим инструментом. Однако если требуется рассматривать более сложный случай, то ей потребуется отбросить либо свои весы, либо свой меч.

Не все аргументы можно свести к «за» или «против». Леди Рациональность носит с собой блокнот, куда она пишет все факты, которые не принадлежат ни одной из сторон.

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
59
Оцените качество перевода: 
Средняя оценка: 4.3 (16 votes)

Фундаментальная ошибка атрибуции

Элиезер Юдковский

«Фундаментальная ошибка атрибуции — склонность делать выводы об уникальных и постоянных чертах человека на основе его поведения, которое может полностью объясняться ситуацией, в которой он находится.» — Gilbert and Malone (English)

Мы склонны слишком поспешно усматривать соотношение между действиями других людей и их личностными чертами. Когда мы видим, как кто-то пинает торговый автомат без видимой причины, мы сразу признаем его «злым человеком». Но когда вы сами пинаете торговый автомат, то это из-за того, что ваш автобус опоздал, электричка ушла чуть раньше, ваш отчет был сдан не вовремя, а теперь еще и дурацкий торговый автомат уже второй день подряд просто жрет ваши деньги на обед. Конечно, думаете вы, в такой ситуации любой может пнуть автомат.

Мы объясняем наши собственные действия окружающей ситуацией, рассматривая свое поведение как совершенно нормальный ответ на сложившиеся условия. Но когда кто-либо еще пинает торговый автомат, мы не можем увидеть, что произошло с этим человеком ранее. Мы видим только удар по автомату без известной нам причины, вследствие чего заключаем, что этот человек злой по своей натуре — поскольку он накинулся на автомат безо всякой причины.

Давайте рассмотрим исходные вероятности. В мире куда больше опоздавших автобусов, нежели мутантов, которые родились с очень высоким уровнем агрессии, и которые из-за этого спонтанно бьют торговые автоматы. На данный момент средний человек, на деле, мутант. Если я правильно помню, то в среднем отдельный человек имеет от 2 до 10 соматически выраженных мутаций. Однако, как бы ни были расположены ДНК, очень маловероятно, что они приведут к повышенной агрессивности. Точно так же, любой аспект чьей-то личности скорее всего не очень далеко от среднего значения. Предположение обратного сдвигает нас в сторону невероятности.

Но даже когда люди точно знают о причинах ситуации, они чаще всего оценивают наблюдаемое поведение неправильно. Когда субъектам говорят, что рассказчику случайным способом определяют, говорить ли ему в защиту абортов или против абортов — люди продолжают думать, что мысленно рассказчик считает именно так, как указано в его речи. (Jones and Harris 1967, «The attribution of attitudes.)

Кажется довольно интуитивным объяснять дождь водными духами; объяснять огонь некоей огненной субстанцией (флогистоном), которая проистекает из горящей материи; объяснять усыпляющий эффект лекарства его «снотворной силой». Но реальность обычно включает в себя более сложные механизмы: циклы испарения и конденсации лежат в основе дождей, окисляющее горение в основе огня, химическое воздействие на нервную систему для снотворных. Однако механизмы звучат куда сложнее, нежели сущности; о них труднее думать, их сложнее понять. И таким образом, когда кто-либо пинает автомат, нам проще всего думать, что он имеет внутреннюю склонность пинать автоматы.

Но только до тех пор, пока мы сами не оказываемся на месте пинающего — в этом случае мы считаем, что ведем себя совершенно нормальной в данной ситуации; конечно же любой бы так делал. На самом деле мы переоцениваем вероятность того, что другие отреагировали бы так же как и мы — это так называемый «эффект ложного консенсуса». Пьющие студенты ощутимо переоценивают долю их товарищей, которые тоже пьют, однако непьющие наоборот — недооценивают количество пьющих. «Фундаментальная ошибка атрибуции» говорит о нашей склонности объяснять поведение других их внутренней диспозицией (их личностными чертами), при этом меняя данную тенденцию на обратную для самих себя (свое поведение мы объясняем внешней диспозицией или обстоятельствами).

Чтобы понять, почему люди действуют так, как они действуют, нам нужно прежде всего осознать, что каждый человек считает свое поведение абсолютно нормальным. Не следует задавать вопрос, какая странная черта характера у них с рождения, из-за какой они могут вести себя так, как это видится. Лучше спросите, в какой ситуации, по мнению этих людей, они находятся. Да, личностные черты бывают самыми разными — но никаких наследственных черт не хватит, чтобы объяснить все возможные виды поведения, которые вы можете наблюдать.

Предположим, что я даю вам две кнопки, красную и зеленую. Красная разрушает мир, зеленая блокирует нажатие красной. Какую вы нажмете? Зеленую. Любой, кто дает отличающийся ответ скорее всего усложняет вопрос.

И до сих пор люди иногда спрашивают меня, почему я хочу спасти мир (English). Словно это последствия психологической травмы в детстве или что-то типа того. На самом деле это кажется достаточно очевидным решением…с моей точки зрения.

У меня могут быть взгляды, которые требуют объяснения — почему я верю в эти вещи, когда большинство людей не верит? — но при данных убеждениях мои реакции не кажутся заслуживающими подробных и необыкновенных объяснений. Возможно, я жертва ложного консенсуса; возможно, я переоцениваю количество людей, которые нажали бы зеленую кнопку, если дать им эту задачу. Но знаете, я все же побился бы об заклад, что таких по меньшей мере немалое количество.

Большинство людей считают себя совершенно нормальными, с их точки зрения. Даже люди, которых вы ненавидите, люди, которые делают ужасные вещи — никто из них не является исключительным мутантом. Жаль, но это вовсе не мутации. Когда вы поймете это, вы будете готовы прекратить быть шокированными человеческими поступками.

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
60
Оцените качество перевода: 
Средняя оценка: 4.4 (13 votes)

Злые ли ваши враги от природы?

Элиезер Юдковский

Как ранее обсуждалось, мы склонны слишком поспешно усматривать связь между действиями других людей и их врожденными установками. Мы скорее предположим, что их необычное для нас поведение объясняется их необычными чертами личности, нежели спросим напрямую или попытаемся представить ситуацию, которая объясняла бы данное поведение. Мы предполагаем, что с человеком что-то не так.

Когда кто-либо задевает нас — совершая действие, которое мы (правильно или неправильно) не одобряем — тогда, согласно моим наблюдениям, данное когнитивное искажение усиливается вдвое. Похоже, что появляется очень сильная склонность обвинять в злых поступках злую личность того, кто их совершает. Однако если попробовать рассматривать вопрос не с точки зрения морали, а как определенный вопрос об исходной вероятности, мы должны спросить, во что мог бы верить Враг касательно ситуации, что могло бы снизить кажущуюся нелепость их поведения. Это позволит нам предположить менее исключительные установки и таким образом уйти немного от невероятных предположений.

11 сентября 2001 года девятнадцать мужчин-мусульман угнали четыре реактивных самолета в откровенно самоубийственной попытке нанести вред США. Как бы вы предположили теперь, почему они могли это сделать? Потому что они видели в США маяк свободы и были рождены с врожденной ненавистью к свободе?

По жизни, большинство людей не ведут свою жизнь так, чтобы видеть себя злодеями. Каждый в своей истории видит себя героем. История Врага, если смотреть его глазами, вряд ли будет рассказывать о том, что он плохой. Если вы пытаетесь придумать мотивацию, которая заставила Врага выглядеть плохо, вы скорее всего будете совершенно неправы касательно того, что на самом деле происходит в его голове.

Однако политика — это убийца разума. Дебаты — война; аргументы — солдаты. Если вы решили, на какой вы стороне, то вы должны поддерживать все аргументы этой стороны и атаковать аргументы, которые говорят в пользу противоположной стороны, иначе получится, что вы предаете своих солдат.

Даже если Враг является злым по своей природе, это должно быть аргументом в пользу вашей стороны. И любой аргумент в пользу вашей стороны следует поддерживать, не имеет значения насколько глупым способом — иначе вы ослабите давление где-то на поле боя. Все стараются превзойти соседа в патриотическом осуждении и никто не осмеливается возразить. Так что вскоре Врагу приписываются рога, крылья, как у летучей мыши, пламя изо рта и клыки с разъедающим плоть ядом. Если же вы отрицаете что-либо из этого списка и пытаетесь вернуться к фактам, то вы встаете на сторону врага; вы предатель. Очень немногие поймут, что вы защищаете не Врага, но истину.

Если бы только злодеи делали ужасные вещи, то история людского вида была бы совсем другой. Ведь злые по своей природе люди крайне редки.

Или, возможно, это страх, что понимание приведет к прощению. Куда легче просто застрелить злодея. Куда легче идти в бой с кличем: «Умрите, порочные мерзавцы!» — нежели с кличем: «Умрите, люди, такие же как и я, но выросшие в других условиях!». Тогда ведь вы будете ощущать вину, убивая людей, которые на самом деле не являются чистым злом.

Для меня это похоже на глубинное стремление к однобоким политическим дебатам, в которых стараются получить наилучшую политику без недостатков. Если армия пересекает границу или если душевнобольной идет на вас с ножом, то альтернативами будет: а) защищаться, б) позволить себя убить. Если вы защищаетесь, то вы можете убить сами. Если вы убиваете кого-либо, кто в альтернативном развитии событий мог бы быть вашим другом, то это трагедия. В самом деле трагедия. С другой стороны, позволить себя убить — это тоже трагедия. Почему должен быть выбор, который не приводит к трагедии? Кто сказал, что у лучшей политики не может быть недостатков? И если кто-то должен умереть, то по возможности это должен быть зачинщик насилия, чтобы предотвратить возможные дальнейшие трагедии и таким образом минимизировать общее число смертей.

Если Враг является средним человеком, который действует согласно своим убеждениям о текущей ситуации, которые призывают его проявить жестокость в качестве стандартной реакции, тогда это не значит, что его убеждения на самом деле точны. Не значит, что он прав. Это значит, что вы будете вынуждены застрелить кого-то, кто является героем в своей истории, и в его романе главный герой умрет на 80 странице. Это трагедия, однако это меньшая трагедия, нежели та, что случилась бы при альтернативном развитии событий. Это выбор, который полицейские делают каждый день, чтобы спасти наши чистые маленькие миры от падения в бездну хаоса.

Когда вы точно оцениваете психологию Врага — когда вы знаете, что происходит в его сознании — это знание не обеспечивает вас оправданием для удара по противнику. Не дает вам ощущения праведного гнева. Не улучшает ваше мнение о себе. И если ваша оценка заставляет вас ощущать невыносимую печаль, то, возможно, сейчас видите мир таким, каков он есть. А в редких случаях вы можете ощутить, как мурашки ужаса бегут по вашей спине, если вы имеете дело с настоящим психопатом или же неврологически здоровыми людьми, убеждения которых практически полностью разрушают их способность здраво мыслить (Сайентологи или «Лагерь Иисуса»).

Так что давайте будем честны и скажем вслух — люди, угнавшие самолёты 11 сентября, не были злодеями по природе. Они не ненавидели свободу. Они тоже были героями в своих собственных историях и они умерли за то, что, как они верили, было правильным — за истину, справедливость и мусульманский путь. Если они видели себя таким образом, то это не значит, что их убеждения были правильны. Если они видели себя таким образом, то это не значит, что мы должны согласиться с тем, что они поступили справедливо. Если они видели себя таким образом, это не значит, что пассажиры рейса 93 должны были остаться внутри и позволить этому произойти. Это значит лишь то, что в альтернативной вселенной, если бы угонщики выросли в другом окружении, они могли бы стать полицейскими, а не преступниками. И это в самом деле трагедия. Добро пожаловать на Землю.

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
61
Оцените качество перевода: 
Средняя оценка: 4.8 (29 votes)

Обратное глупости не есть ум

Элиезер Юдковский

— … После этого наши люди в той временной линии приступили к корректирующим действиям. Смотри…

Он очистил экран и стал набирать новые комбинации. Страница за страницей начали появляться показания людей, утверждавших, что видели таинственные диски, и каждое из сообщений было фантастичнее предыдущего.

— Стандартный метод запудривания мозгов, — усмехнулся Веркан Вэлл. — Я слышал лишь слухи о «летающих тарелках», да и те преподносились в форме шуток. На таком уровне культуры всегда можно лишить достоверности рассказ о настоящем событии, запустив параллельно с ним десяток небылиц…

Г. Бим Пайпер, «Полицейская операция»

Пайпер был прав. Лично я не верю в плохо прячущихся инопланетян, которые посещают нашу планету. Однако моё неверие никак не связано с ужасающей иррациональностью культов, построенных вокруг веры в летающие тарелки — по крайней мере, я на это надеюсь.

Вы и я верим, что культы вокруг летающих тарелок возникают при абсолютном отсутствии самих летающих тарелок. Культы могут возникать вокруг любой идеи, благодаря человеческой глупости. Эта глупость действует ортогонально наличию пришельцев: мы должны ожидать появления культов, неважно, есть ли летающие тарелки или их нет. Даже если бы на Земле присутствовали плохо прячущиеся инопланетяне, это никак не уменьшило бы вероятность появления культа. p(культы|пришельцы) не меньше p(культы|~пришельцы), если только вы не предполагаете, что плохо прячущиеся пришельцы специально подавляют такие культы. Согласно байесовскому определению свидетельства, наблюдение «существуют культы вокруг летающих тарелок» не является свидетельством против существования летающих тарелок. Не более, чем что-либо еще.

Это приложение общего принципа, который Роберт Пирсиг сформулировал так: «Самый большой дурак может сказать, что Солнце светит, однако это не значит, что это не так».

Допустим, вы знаете, что кто-то ошибался в 99,99 % случаев, отвечая на вопросы вида «да/нет». Это значит, что вы можете получать верные ответы в 99.99% случаев, просто инвертируя его ответы. Ему придётся проделать всю работу по получению качественных свидетельств, сцепленных с реальностью и обработать все свидетельства должным образом. И всё это лишь для того, чтобы надёжно ошибаться. Нельзя быть настолько глупым, не будучи сверхумным.

Если у машины сломан двигатель, то она не поедет в обратную сторону — даже если поломка крайне серьезная.

Если глупость не антикоррелирует надежно с истиной, то насколько может человеческое зло антикоррелировать с истиной? Обратным искажением для эффекта ореола является эффект рогов: все воспринимаемые негативные сущности взаимосвязаны. Если Сталин — злой, то все, что он говорит — ложь. Вы же не хотите соглашаться со Сталиным, не так ли?

Сталин также верил, что 2+2=4. Если вы защищаете какое-либо утверждение, сделанное Сталиным, даже если это «2+2=4», люди увидят только, что вы «заодно со Сталиным»; получится, что вы на его стороне.

Следствия из этого принципа:

  • Чтобы по-настоящему спорить с идеей, вы должны противостоять лучшим аргументам ее сильнейших защитников. Спор со слабейшими ничего не докажет, поскольку даже самая сильная идея привлекает слабых защитников. Если вы хотите опровергнуть идеи трансгуманизма или интеллектуального взрыва, то вы должны опровергать аргументы Ника Бострома или Элизера Юдковски. Любой другой более удобный путь будет неправильным.

  • Приведение примера людей, которые явно сошли с ума на почве идеи, не является свидетельством против самой идеи. Многие из тех, кто причисляет себя к нью эйдж, сходили с ума на почве своего личного понимания квантовой механики.

  • Кто-то однажды сказал: «Не все консерваторы глупы, однако большинство глупцов — консерваторы». Если вы не можете рассматривать это выражение, вне зависимости от его истинности, иначе как критику консерватизма, то вы еще не готовы рационально рассуждать о политике.

  • Ad hominem аргумент — некорректен.

  • Вам следует быть способным вести спор против геноцида без того, чтобы приводить аргументы вида «Гитлер хотел уничтожить всех евреев». А если бы он не хотел геноцида, то геноцид был бы оправдан?

  • Ваше инстинктивное желание верить во что-либо будет меняться согласно вашему желанию походить на знакомых вам людей, которые в это верят — вне зависимости от того, насколько истинно само убеждение. Некоторые люди могут отказываться верить в то, что бог не существует, не потому что есть свидетельство о его существовании, а просто потому что они не хотят походить на Ричарда Докинза или тех «крикливых» атеистов, которые на всех углах провозглашают «Бог не существует».

  • Допустим, ваш компьютер вдруг перестал работать. Не стоит думать, что вся система никуда не годится и что новую сборку придётся заказать без процессора от АМD, видеокарты от ATI, жесткого диска от Maxtor и без кулеров — ведь все эти компоненты есть в вашей неработающей системе. Возможно, вам нужно всего лишь заменить провод питания.

  • Если сотни изобретателей не смогли построить летающие машины из металла, дерева и ткани — это не подразумевает, что на самом деле вам нужна машина из костей и плоти. Если тысячи проектов провалились при попытке создать ИИ на основе электрических схем, это не значит, что корень всех проблем в электричестве. Пока вы не поймете проблему, любые манипуляции, сделанные наугад, вряд ли помогут вам найти решение.

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
62
Оцените качество перевода: 
Средняя оценка: 3.8 (40 votes)

Аргумент затмевает авторитет

Элиезер Юдковский

Байесианец с черным поясом steven в своем блоге пытается объяснить асимметрию между хорошими аргументами и весомым авторитетом, однако он не сумел дать ответы на все комментарии к предыдущей статье, так что этим займусь я.

Первая ситуация: Барри — знаменитый геолог. Чарли — четырнадцатилетний подросток, неоднократно попадавший в полицию и подверженный психопатическим приступам. Барри решительно доказывает Артуру определенное контринтуитивное утверждение о скалах и Артур присваивает его утверждению вероятность в 90%, что оно истинно. Тогда Чарли также приводит равное контринтуитивное утверждение о скалах, и Артур присваивает его утверждению только 10% вероятности, что оно истинно. Очевидно, что Артур принимает во внимание авторитет источника, когда решает, чьим утверждениям верить.

Вторая ситуация: Дэвид делает контринтуитивное утверждение касательно физики и дает Артуру подробное объяснение аргументов, включая отсылки. Эрни делает аналогичное контринтуитивное утверждение, однако аргументирует крайне слабо, кое-где предлагая просто поверить ему. Как Дэвид, так и Эрни утверждают, что это наилучшее объяснение, которое они могут дать (любому человеку, не только Артуру). Артур присваивает 90% вероятности быть истинным утверждению Дэвида, и только 10% утверждению Эрни.

Может показаться, что оба сценария в принципе похожи: в обоих во внимание берутся полезные свидетельства: сильный авторитет против слабого, сильный аргумент против слабого.

Однако теперь предположим, что Артур просит Барри и Чарли привести полное объяснение с отсылками; и оба они делают одинаково хорошие объяснения, которые, как видит Артур, совпадают. Тогда Артур просит Дэвида и Эрни показать свои документы и оказывается, что они примерно одинаковы тоже — возможно они оба клоуны, а может оба — физики, не имеет значения.

Предполагая, что Артур компетентен достаточно, чтобы разобраться во всех приведенных аргументах — иначе они не более чем шум — кажется, что Артур должен рассматривать Дэвида как обладающего значительным преимуществом над Эрни, в то время как Барри если и превосходит Чарли, то совсем немного.

В самом деле, если технические аргументы достаточно хороши, то у Барри нет никакого преимущества перед Чарли. Хороший технический аргумент это то, что может уменьшить степень доверия к личному авторитету говорящего.

Точно так же, если мы верим Эрни, что он выдал нам лучший аргумент из тех, что мог, включая все логические шаги, которые он выполнил и все источники, на которые опирался — и которые цитировал — тогда мы можем игнорировать любую информацию о документах Эрни. Не имеет значения, клоун он или физик. (Опять же предполагается, что мы достаточно эрудированы, чтобы понять его аргументы. В любом другом случае Эрни просто произносит какие-то загадочные слова и то, поверим ли мы им, зависит в большей степени как раз-таки от его авторитета.)

Таким образом кажется, что между аргументами и авторитетом есть своеобразная асимметрия. Если мы знаем об авторитете, то мы все еще хотели бы услышать и аргументы; однако когда мы услышали аргументы, вряд ли нам нужно будет знать авторитетность источника.

Очевидно (скажет неопытный человек) авторитет и аргумент являются фундаментально различными видами свидетельства, различие которых непостижимо при помощи до скуки ясных методов байесовской теории вероятности. Поскольку при одинаковой силе свидетельства, 90% против 10%, ситуации ведут себя по-разному. Как же нам поступить?

Здесь примерно половина технической демонстрации того, как представить эту разницу в теории вероятности. (Остальное вы можете принять на веру, положившись на мой авторитет, или посмотреть в отсылках.)

Если $p(H|E_1) = 90\%$ и $p(H|E_2) = 9\%$, какова вероятность $p(H|E_1,E_2)$? Если признание Е₁ истиной дает нам возможность присвоить Н вероятность в 90%, и признание Е₂ истиной дает возможность присвоить Н вероятность в 9%, какую вероятность мы должны присвоить Н, если верны и Е₁ и Е₂? Это просто не что-либо, что вы можете вычислить в теории вероятности из имеющейся информации. Нет, отсутствующая информация это не априорные сведения об Н. Е₁ и Е₂ могут быть не независимыми друг от друга.

Предположим, что Н это «моя дорожка скользкая», Е₁ это «разбрызгиватель работает» и Е₂ это «сейчас ночь». Дорожка становится скользкой, если разбрызгиватель работает не меньше минуты и остается такой до тех пор, пока он не выключится. Так что если мы знаем, что разбрызгиватель включен, то с 90% вероятностью дорожка скользкая. Разбрызгиватель включен 10% ночного времени, так что если сейчас ночь, то вероятность того, что дорожка скользкая — 9%. Если же мы знаем, что сейчас ночь и разбрызгиватель включен — то есть если нам известны оба факта — вероятность того, что дорожка скользкая, равна 90%.

Мы можем представить это графически следующим образом:

Ночь → Разбрызгиватель → Скользкая дорожка

Ночь может приводить к включению разбрызгивателя, а включение разбрызгивателя может приводить к скользкой дорожке.

Тут важны направления стрелок. Если я напишу:

Ночь → Разбрызгиватель ← Скользкая дорожка

Это означало бы, что если я не знаю ничего о разбрызгивателе, то вероятности того, что была ночь и что дорожка скользкая будут независимы друг от друга. Для примера предположим, что я бросаю одну кость и вторую кость, а потом складываю выпавшие числа в сумму:

Кость 1 → Сумма ← Кость 2.

Если вы не скажете мне сумму, а сообщите только число с первой кости — я не смогу узнать ничего о том, что выпало на второй кости. Однако если вы сообщите мне число на первой кости и общую сумму, то узнать число на второй кости не составит труда.

Определение того, являются ли разные куски информации зависимыми или независимыми друг от друга при заданной начальной информации, на самом деле является достаточно технической темой. Почитать об этом можно в книге Джуды Перла «Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference and Causality». (Если у вас есть время на книги, то рекомендую вам прочесть эту.)

Если вы знаете, как читать причинные графы, тогда вы взглянете на граф про кости и сразу же увидите:

$p(кость\space 1,кость 2) = p(кость\space 1)*p(кость\space 2)$

$p(кость\space 1,кость 2|сумма) ≠ p(кость\space 1|сумма)*p(кость\space 2|сумма)$

Если вы смотрите на верную диаграмму про дорожку, вы видите следующие факты:

$p(скользкая\space дорожка|ночь) ≠ p(скользкая\space дорожка)$

$p(скользкая\space дорожка|разбрызгиватель) ≠ p(скользкая\space дорожка)$

$p(скользкая\space дорожка|ночь, разбрызгиватель) = p(скользкая\space дорожка|разбрызгиватель)$

То есть, вероятность того, что дорожка скользкая, учитывая знание о разбрызгивателе и ночи, равно вероятности, которую мы присваиваем скользкой дорожке, если знаем только о разбрызгивателе. Знание о разбрызгивателе делает знание о ночи неактуальным касательно дорожки.

Это известно как «затмение», и критерий, который позволяет нам распознавать такие условные независимости в причинно-следственных графах, называется Д-разбиение.

Для случая с аргументом и авторитетом, причинно-следственная диаграмма будет выглядеть так:

Истина → Качество аргумента → Убеждение эксперта.

Если что-либо истинно, то неизбежно есть аргументы в его пользу, вследствие чего эксперты видят эти свидетельства и меняют свое мнение (в теории!)

Если мы видим, что эксперт верит во что-либо, мы предполагаем существование некоего абстрактного свидетельства (пусть даже мы не знаем какого именно), и из существования данного свидетельства мы выводим истинность позиции эксперта.

Однако если мы знаем значение узла «Качество аргумента», это Д-отделяет узел «Истина» от узла «Убеждение эксперта», блокируя все пути между ними, в соответствии с определенным техническим критерием для «блокирования путей», который кажется очевидным для такого случая. Даже без проверки точного распределения вероятностей, мы можем из графа понять следующее:

$p(истина|аргумент,эксперт) = p(истина|аргумент)$

Это не опровержение стандартной теории вероятности. Это просто более компактный путь выражения определенных вероятностных фактов. Вы можете выразить все это и через другие равенства и неравенства в любом подходящем распределении вероятностей — однако вам будет труднее визуально увидеть это. Авторитет и аргумент не являются двумя разными видами вероятности, как и разбрызгиватель не сделан из онтологически разного с солнечным светом вещества.

На практике вы никогда не можете полностью убрать влияние авторитета. Хороший авторитет более вероятно свидетельствует о версии, которую стоит принять во внимание; менее авторитетный источник может оказаться истинным с меньшей вероятностью, что и делает его аргументы менее надежными. Это не тот фактор, что вы можете убрать полностью путем выслушивания свидетельства, которое они учитывают.

Также очень трудно свести аргументы к чистой математике; и в ином случае, судя силу каждого шага можно полагаться на интуиции, которые вы не смогли бы повторить без тех же тридцати лет опыта.

Всегда есть неуничтожимая закономерность, что вы присвоите утверждению Э. Т. Джейнса о вероятности большую степень достоверности, нежели та, что будет вами присвоена аналогичному утверждению Элизера Юдковского. Нельзя считать, что пятьдесят дополнительных лет опыта не будут влиять.

Но на авторитет стоит полагаться только при прочих равных условиях, и он не выдерживает никакой конкуренции с сильными аргументами. Я нашел небольшую ошибку в одной из книг Джейнса — потому что алгебра важнее авторитета.

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
63
Оцените качество перевода: 
Средняя оценка: 4.1 (12 votes)

Ухватить задачу

Элиезер Юдковский

В искусстве рациональности есть дисциплина близости-к-задаче — попытки найти такое свидетельство, которое относилось бы только к самому вопросу настолько близко, насколько возможно, отметая как можно больше других аргументов.

Братья Райт говорят, «Наш самолет полетит». Если вы посмотрите, насколько они авторитетны (механики, чинящие велосипеды и изучавшие физику самостоятельно) и сравните их авторитет скажем с лордом Кельвином, вы обнаружите, что лорд Кельвин явно более авторитетен.

Если же вы будете вынуждены просмотреть вычисления братьев Райт и сможете в них разобраться, после чего проделаете аналогичную процедуру для вычислений лорда Кельвина (у которого вряд ли были какие-то вычисления, а не простое неверие), то значение авторитета будет сильно снижено.

Если же вы видите на самом деле летящий самолет, то вам не нужно заглядывать в вычисления, а авторитет Кельвина можно даже не обсуждать.

Чем плотнее ваши аргументы связаны с вопросом без промежуточных умозаключений — тем ближе наблюдаемые узлы к узлу задачи в Великой Паутине Причин и Следствий — тем сильнее свидетельство. Теорема о причинно-следственных графах говорит что вы никогда не сможете получить больше информации из дальних узлов, чем из расположенных совсем рядом, которые и затмевают дальние.

Джерри Кливер сказал о спортивных матчах: «Губят не ошибки в выполнении замысловатых техник. Губит элементарное: потеря мяча из виду.»1.

Подобно тому, как физика может превосходить авторитетность, она также может превосходить и рациональность. Кто был более рационален, братья Райт или лорд Кельвин? Если мы можем проверить их вычисления, то нам не нужно выяснять этот вопрос. Добродетель рационалиста не может заставить самолет полететь.

Если вы забыли об этом принципе, то изучение когнитивных искажений только повредит вам, поскольку вы будете отвлекаться от наиболее прямых аргументов. Довольно легко утверждать, что кто-либо проявляет искажение номер 182 из вашего списка универсальных обвинений, однако вы не сможете решить реальную задачу без наиболее близкого свидетельства. Солнце не погаснет, даже если тот, кто утверждает, что оно светит, подвержен искажениям.

Как вы не можете всегда проводить эксперимент, так и не всегда вы можете проверить вычисления. Иногда у вас нет достаточно исходной информации, иногда не хватает частной информации, иногда просто нет времени. Есть ряд ситуаций, в которых стоило бы оценить рациональность источника. Вы всегда должны делать это с ощущением пустоты в сердце, ощущением чего-то пропущенного

Всегда, когда вы только можете, танцуйте как можно ближе к исходному вопросу — заставьте себя это делать — приближайтесь максимально к тому, чтобы ухватить задачу!

  • 1. Jerry Cleaver, Immediate Fiction: A Complete Writing Course (Macmillan, 2004).
Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
64
Оцените качество перевода: 
Средняя оценка: 4.3 (15 votes)

Рациональность и английский язык

Элиезер Юдковский

Моё прошлое эссе напомнило одному из читателей «Политику и английский язык» Джорджа Оруэлла. Я был польщён — особенно потому, что тема этого эссе уже пришла мне в голову.

Если вам вправду интересен взгляд творца на рациональность, читайте Оруэлла. Рационалистам следует его читать не меньше, чем писателям. Оруэлл не ученый, но сочинитель; его орудие не числа, но слова; его противник не Природа, но зло в людях. Чтобы отправить человека за решётку, не говорите «Я собираюсь заключить мистера Дженнингса в тюрьму на семь лет без суда». Подпустите тумана, не дайте слушателям вообразить происходящее. Скажите: «Ненадёжный элемент подвергнут альтернативному судебному процессу».

Голос Оруэлла — вопль против тоталитаризма и неясного мышления, за которым зло любит себя прятать. Его труды о языке — такая же классика для рационалиста, как и книги Фейнмана, Сагана или Докинза.

«Писателям дан совет избегать пассивного залога». Знание науки не укажет на проблему в этой фразе, но если вы хотя бы немного писали, то сразу поймёте, что не так. Я составил предложение в пассивном залоге и не уточнил, кто именно даёт писателям такой совет. Пассивный залог убирает тех, кто действует; остаются лишь те, на кого подействовали. «Ненадёжный элемент подвергнут альтернативному судебному процессу», — кем подвергнут? В чём заключается «альтернативный судебный процесс»? Убрав действие из предложения, можно спрятать, что происходит на самом деле.

Статьи в научных журналах часто пишутся в пассивном залоге. (Простите, некоторые учёные пишут их в пассивном залоге. Не то чтобы статьи самозарождались и некого было обвинить.) Куда весомее сказать «Испытуемым был назначен Progenitorivox», чем «Я раздал студентам по упаковке препарата и сказал пить по таблетке каждый вечер». Если убрать учёного из описания, полезные данные останутся. Но на самом деле учёный там был, испытуемые — живые студенты, препарат не «был назначен», а студенты глотали таблетки по инструкции. Пассивный залог сужает правду.

Судя по комментариям к моим эссе, многие поспорят с тем, что пассивный залог в научной статье чем-то плох. Ведь если подумать, то понятно, что учёный там был. Это не кажется логической ошибкой. Вот поэтому рационалистам нужно читать Оруэлла, а не только Фейнмана или даже Джейнса.

Научная литература даёт знания, художественная — опыт. Медицина предскажет, что будет с человеком без скафандра в вакууме. А художественная литература заставит вас это пережить.

Некоторые рационалисты попытаются разобрать неясную фразу и увидеть, нет ли там ещё одного смысла, попробуют воссоздать логичную трактовку. Они прочтут фразу доброжелательно, предполагая о мыслях автора лучшее. Но писатели стараются не полагаться на такое отношение. То, как вас поймут, и есть то, что вы сказали, и неважно, о чём вы думали. Нельзя спорить с читателем, сколь умны бы ни были ваши обоснования.

Писатель знает: читатель не остановится подумать. Художественный опыт — непрерывный поток впечатлений. Писатель-рационалист следит, какой опыт создают слова. Если вы, вникая в смысл фразы, неторопливо обдумываете слова, препарируете формулировки, перебираете возможные значения и выискиваете зёрна истины, — то вы покидаете пределы первого впечатления — того, что видят и чувствуют другие читатели.

Прозаик заметит, что фраза «Испытуемым был назначен препарат» вопиюще неправильна. Что переживёт читатель? Только отстранённое ощущение властности, только чувство, что тебе сказали что-то веское. Прозаик увидит, что слова слишком расплывчаты и скрывают настоящую историю: строгого профессора, который с упаковкой таблеток в руках объясняет взволнованной студентке, что делать.

Я не говорю, что научные статьи нужно писать как романы. Но рационалисты должны лучше осознавать, как слова рождают опыт. Рационалистам нужно понимать разум и как с ним взаимодействовать — начиная с того, как их собственное сознание воплощается в языке. Рационалист должен ясно видеть настоящее, практическое действие фраз, а не только значение, которое складывается из буквального смысла слов.

Более прямо: то, что вы имели в виду, не оправдывает того, как вас поняли!

Неважно, какую рациональную трактовку вы соорудите для фразы, призванной сорвать овации, вроде «ИИ должен быть разработан только в рамках демократических процессов». Трактовка не искупит её иррационального влияния — демонстративного запроса на одобрение, не говоря о том, насколько эта фраза размыта.

Оруэлл предостерегал, как действуют речевые штампы, как меняют они опыт мышления1:

Когда видишь на трибуне усталого болтуна, механически повторяющего привычные фразы: звериный оскал, железная пята, кровавая тирания, свободные народы мира, встать плечом к плечу, — возникает странное ощущение, что смотришь не на живого человека, а на манекен… Оратор, пользующийся такой фразеологией, уже сильно продвинулся по пути от человека к машине. Из гортани его выходят надлежащие звуки, но мозг в этом не участвует, как должен был бы, если бы человек сам выбирал слова.

Но самое главное — пусть смысл выбирает слова, а не наоборот. Самое худшее, что можно сделать со словами в прозе, — это сдаться на их милость. Когда вы думаете о конкретном предмете, вы думаете без слов, а затем, если хотите описать то, что представили себе, вы начинаете поиски и находите нужные точные слова. Когда вы думаете о чем-то отвлеченном, вы склонны первым делом хвататься за слово, и, если не удерживаться от этого, сложившийся диалект ринется к вам на помощь, сделает за вас вашу работу — правда, затемнив или даже изменив исходный смысл. Может быть, лучше всего не прибегать к словам, покуда вы не проясните для себя смысл через образы и ощущения.

Пирс мог бы написать последний абзац. Многие искусства ведут к одному Пути.

Перевод: 
Remlin, Quilfe
Номер в книге "Рациональность: от ИИ до зомби": 
65
Оцените качество перевода: 
Средняя оценка: 4.3 (15 votes)

Зло в людях и неясное мышление

Элиезер Юдковский

Джордж Оруэлл видел как цивилизованный мир скатывается в тоталитаризм, как одна за другой страны поддаются ему; человек поддавался тоталитаризму навсегда. Вы родились слишком поздно, чтобы помнить время, когда угроза тоталитаризма казалась неостановимой, когда одна страна за другой вводила секретную полицию и громовой стук по ночам, в то время как профессора свободных университетов прославляли чистку Советского Союза как прогресс. Это столь же чуждо вам, как фантастика; трудно относиться к этому серьезно. Потому что в ваше время берлинская стена уже пала. И если имя Оруэлла не выгравировано на одном из ее камней, то это стоит сделать.

Оруэлл видел судьбу человеческого вида и приложил исключительные усилия, чтобы столкнуть человечество с этого пути. Его оружием было ясное слово. Оруэлл знал, что запутанный язык означает затуманенное сознание; он знал, что человеческое зло и затуманенное сознание переплетены как сопряженные нити ДНК:

«В наше время политические речи и тексты по большей части представляют собой защиту того, что нельзя защищать. Вещи наподобие британского правления в Индии, русских чисток и ссылок, сбрасывания атомных бомб на Японию на самом деле можно обосновать, однако только такими аргументами, которые будут слишком жестоки для большинства людей и совершенно расходятся с декларируемыми целями политических партий. Таким образом, политический язык должен по большей части состоять из эвфемизмов, неясных ответов и разного рода неопределенностей. Беззащитные деревни подвергаются бомбардировке, жителей выгоняют из городов, скот расстреливают из пулеметов, поджигают дома при помощи зажигательных снарядов: и все это называют миротворческой операцией…»

Оруэлл четко обозначил цель своей ясности:

«Если вы упрощаете свой язык, вы освобождаетесь от худших глупостей ортодоксальности. Вы не можете больше прятаться за разными диалектами, и когда вы делаете глупое замечание, его глупость будет очевидна даже для вас.»

Сделать нашу глупость очевидной даже для нас самих — то, что является сердцевиной Overcoming Bias.

Зло крадется и прячется в неосвещаемых тенях сознания. Когда мы оглядываемся и с ясностью смотрим на историю, мы плачем, вспоминая запланированный Сталиным и Мао голод, который погубил десятки миллионов. Мы зовем это злом, потому что это было вызвано человеческим стремлением причинить боль и смерть невинным жизням. Мы зовем это злом из-за отвращения, которое испытываем, глядя на историю с ясностью. Для виновников зла, чтобы им избежать их естественной оппозиции, требуется, чтобы это отвращение было незаметно. Они стремятся любой ценой убрать ясность. И уже сейчас люди, стремящиеся к ясности, склонны противостоять злу всюду, где встречают его; поскольку человеческое зло, где бы оно не существовало, проистекает из затуманенного сознания.

1984 показывает это крупным планом: Оруэлловские злодеи это исказители истории и ретушеры (списанные с искажения истории, практиковавшегося в Советском Союзе). В сердце всей тьмы, в Министерстве Любви, О’Брайен заставляет Уинстона признать, что два плюс два равно пяти:

«— Вы помните, — снова заговорил он, — как написали в дневнике: «Свобода — это возможность сказать, что дважды два — четыре»?

— Да.

О’Брайен поднял левую руку, тыльной стороной к Уинстону, спрятав большой палец и растопырив четыре.

— Сколько я показываю пальцев, Уинстон?

— Четыре.

— А если партия говорит, что их не четыре, а пять, — тогда сколько?

— Четыре.

На последнем слоге он охнул от боли. Стрелка на шкале подскочила к пятидесяти пяти. Все тело Уинстона покрылось потом. Воздух врывался в его легкие и выходил обратно с тяжелыми стонами — Уинстон стиснул зубы и все равно не мог их сдержать. О’Брайен наблюдал за ним, показывая четыре пальца. Он отвел рычаг. На этот раз боль лишь слегка утихла.»

Я постоянно ужасаюсь вроде бы умным людям — таким как коллега Робина Тайлер Коувен — которые не думают, что бороться с искажениями важно. Это же ваше мышление, говорим мы. Ваш интеллект. Он отделяет вас от обезьяны. Он создал весь наш мир. Вы не думаете, что то, как работает наше мышление — важно? Вы не думаете, что систематические сбои в нашем разуме важны? Вы думаете, что инквизиция пытала бы ведьм, если бы все люди были идеальными байесианцами?

Тайлер Коувен похоже считает, что преодоление искажений также можно считать искажением: «Я рассматриваю блог Робина как пример искажения, которое показывает что искажение может быть весьма полезно.» Я надеюсь, что это только результат слишком абстрактного мышления в попытках звучать умнее. Неужели Тайлер серьезно думает, что сфера нечувствительности к человеческой жизни стоит на одном уровне с попытками спасти как можно больше человеческих жизней?

Оруэлл был вынужден бороться с похожим отношением — что признавать различия это всего лишь юношеская наивность:

«Стюарт Чейз и другие пришли к выводу, что все абстрактные слова бессмысленны, после чего использовали это как предлог для пропаганды своего рода политической пассивности. Если вы не знаете что такое фашизм, то как вы можете с ним бороться?»

Возможно исправление искажений не выглядит особо интересным, если рассматривать его как борьбу против редких случайных ошибок. Возможно труднее заинтересоваться этим, если нет четко видимого врага, которому нужно противостоять. Так что дайте нам прояснить, что всюду, где в мире есть человеческое зло, всюду где есть несправедливость и жестокость и целенаправленное убийство — всегда есть искажения, которые окружают эти явления. Там, где люди с ясностью противостоят искажениям, скрытое зло отступает. У истины есть враги. Если бы Overcoming Bias выпускало бы бюллетень в Советском Союзе, то каждый автор и каждый комментатор были бы отправлены в лагеря.

Во всей человеческой истории каждый великий шаг вперед был сделан под влиянием новой ясности мысли. За исключением нескольких природных катастроф, каждое великое горе произошло под влиянием глупости. Наш последний враг — мы сами; это война и мы солдаты на ней.

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
66
Оцените качество перевода: 
Средняя оценка: 4.1 (26 votes)

Против рационализации

Рационализация — склонность человека подгонять рассуждения под уже выбранный ответ. В этой цепочке автор рассматривает сущность и виды рационализации.

Цепочка — часть серии «Как успешно менять своё мнение» — второго тома книги «Рациональность: от ИИ до зомби».

Автор: 
Элиезер Юдковский

Знание искажений может вредить

Элиезер Юдковский

Как-то раз я пытался рассказать маме о проблеме калибровки экспертов. Я сказал: «Когда эксперт говорит, что уверен в событии на 99%, оно случается только в 70% случаев». Повисла тишина, я вдруг осознал, что говорю с мамой, и поспешно добавил: «Конечно, ты должна быть осторожна с этим знанием и применять его к себе, а не пользоваться им против тех, с кем не согласна».

Она ответила: «Серьёзно? Это восхитительно! Я буду ссылаться на это постоянно!»

Работа Тейбера и Лоджа «Мотивированный скептицизм в оценке политических убеждений» 1 описывает шесть явлений:

  • Эффект предшествующего отношения. Испытуемые, у которых уже есть ясная позиция, находят доводы в пользу своей точки зрения охотнее, чем в пользу обратной. Это происходит, даже если их поощряют быть беспристрастными.

  • Систематическая ошибка опровержения. Люди тратят больше времени и сил, чтобы найти слабые места в аргументах против своей позиции, нежели в поддерживающих её.

  • Систематическая ошибка подтверждения. Работая с источниками, испытуемые ищут те, которые подтверждают их позицию, а не опровергают.

  • Поляризация мнений. Когда группе испытуемых предлагают уравновешенный список доводов за и против, их изначальные разногласия только усиливаются.

  • Эффект силы мнения. Чем радикальнее мнения людей, тем более они подвержены названным выше искажениям.

  • Эффект сноровки. Испытуемые, искушённые в политике, легче оспаривают неприятные наблюдения и доводы. Поэтому они сильнее подвержены искажениям.

Если вы мыслите иррационально, то новые знания могут вам навредить. Для истинных байесианцев информация никогда не наделена отрицательной ожидаемой полезностью. Но люди — не совершенные байесовские мыслители. Мы можем сделать себе хуже, если неосторожны.

Я видел тех, кого подвело знание искажений. Оно было оружием, что разносило вдребезги любой довод, который приходился этим людям не по душе. Умение делать это — среди главных причин того, что люди с высоким интеллектом ведут себя глупо. (Станович называет это явление дисрациональностью.)

Вы могли бы вспомнить таких людей, правда? Обладателей высокого интеллекта, которые не очень-то преуспевают в делах, но чертовски хороши в спорах? Поможете ли вы им, если просто расскажете об искажениях? Сделаете ли их успешными рационалистами?

Один мой знакомый узнал о проблеме калибровки и сверхуверенности. После этого он стал говорить: «Исследования показывают, что эксперты часто ошибаются, так что им верить нельзя. Поэтому, когда я делаю прогнозы, я стараюсь опираться на то, что история будет идти как шла». Сказав это, он погружался в запутанную и сомнительную экстраполяцию. В чужих доводах искажения и лжеаргументы бросаются в глаза сильнее, чем в своих.

Я рассказал ему об ошибке опровержения и эффекте сноровки. И когда в очередном разговоре я произнёс что-то, что ему не понравилось, он обвинил меня в софистике. Он не указывал мне на конкретные ошибки, не искал в моих словах слабых мест. Он просто вздохнул и сказал, что я обратил свой разум против себя. Теперь он овладел ещё одним Универсальным Контраргументом.

Представьте, что встречаете человека, который кажется умным, но говорит то, что вам не нравится. Если образ искушённого спорщика сразу приходит вам на ум, это плохой знак.

Я пытаюсь учиться на ошибках. Свой последний рассказ об искажениях я начал с того, что описал ошибку конъюнкции и эвристику доступности, обрисовав этими примерами понятие искажения. Затем я перешёл к ошибке подтверждения, ошибке опровержения, эффекту сноровки, предвзятому скептицизму и другим явлениям, которые проявляются в формировании взглядов. Следующие полчаса я усердно и въедливо говорил об этих опасностях и рассматривал их со всех точек зрения, с каких только мог.

Чтобы слушатели заинтересовались, хватило бы и просто описать пару ошибок. Но что дальше? Книги об искажениях — в основном когнитивная психология ради неё самой. Мне нужно было предупредить о худшем за одну лекцию — иначе моим слушателям, быть может, никто бы этого не рассказал.

В тексте или устно, я теперь стараюсь не упоминать о калибровке и сверхуверенности, пока не расскажу об ошибке опровержения, предвзятом скептицизме, искусных спорщиках и дисрациональности. Прежде всего — не навреди!

  • 1. Taber, C.S. and Lodge, M. (2006), Motivated Skepticism in the Evaluation of Political Beliefs. American Journal of Political Science, 50: 755-769. doi:10.1111/j.1540-5907.2006.00214.x
Перевод: 
Remlin, Тимофей Зуев, Quilfe
Номер в книге "Рациональность: от ИИ до зомби": 
67
Оцените качество перевода: 
Средняя оценка: 3.8 (20 votes)

Обновляй себя шаг за шагом

Элиезер Юдковский

Политика — убийца разума. Спор — это война, аргументы — солдаты. У вас появляется искушение толковать любой возможный исход эксперимента в пользу своей теории, словно вы защищаете крепость от атак со всех сторон. Но так нельзя. Это математически невозможно. Для любого свидетельства в пользу гипотезы, которое вы ожидаете увидеть, есть равное и противоположно направленное ожидание свидетельства против.

Но если вы защитили своё любимое убеждение не до конца, всё в порядке. Если гипотеза состоит в том, что монета выпадает орлом в 95% случаев, то один раз из двадцати вы увидите контрсвидетельство. Всё хорошо. Это нормально. Этого даже стоит ожидать, пока на каждое свидетельство против теории приходится 19 наблюдений в её пользу. Вероятностная модель выдержит пару ударов и выстоит, при условии, что удары прекратятся.

Однако многим — особенно в тех вопросах, где они не являются специалистами, — кажется, что истинные теории не имеют права на ошибку, а ложные ошибаются всегда.

Некоторые люди хватаются за одно наблюдение, которое считают свидетельством в пользу теории, как за исчерпывающее её доказательство. По их словам, теория его «объясняет», как будто больше ничего и не нужно. Как будто не бывает свидетельств в поддержку ложной теории, ни единого наблюдения. Тогда для доказательства хватало бы любого и единственного факта в пользу теории.

Немногим умнее «опровергать» вероятностную теорию одним наблюдением, словно ничто никогда не указывает против верной теории. Но именно так люди спорят уже который век, пытаясь развеять все вражеские доводы и отрицая, что у врага есть хоть что-то в свою поддержку. Люди спорят однобоко. В их картине мира не найдётся ни грамма фактов против их теорий. Даже одно вероятностное контрсвидетельство разрушит всё.

Кто-то сейчас возмутится: «Нельзя оставлять врагу ни пяди, если хочешь выиграть настоящий спор! Если смириться хотя бы с одним возражением, враг снова и снова будет им размахивать — такого нельзя допустить! Ты проиграешь! Что может быть хуже?»

Неважно. Рациональность — не для победы в спорах, а для выбора верной стороны. Когда вы уже решили, за кого играть, рациональность уже сделала своё дело, хорошо ли или плохо. Но как выбрать сторону? Если неверный выбор пугает вас, пусть даже немного, то стоит учесть все свидетельства.

Рациональность — танец, а не прогулка. Каждое движение в нём должно быть точным, ни дюймом левее или правее. С каждой крупицей наблюдений в вашу пользу — сдвигайте уверенность вверх. С каждой крупицей против — вниз. Да, вниз. Даже если теория верна, вы должны иногда понижать свою степень убеждённости — если только это не точная теория.

Если ваше убеждение получает пару ударов — всё в порядке. С вероятностными теориями такое бывает. (А вот если ошибается точная теория, у неё проблемы!) Просто слегка сдвиньте уверенность — вероятность, шансы или ощущение убеждённости в голове — немного вниз. И ждите дальнейших свидетельств. Если теория верна, то наблюдения скоро это покажут и снова сдвинут вероятность вверх. Если теория ошибочна, то она вам не нужна.

Чёрно-белое, бинарное, качественное мышление порождает проблему: любое наблюдение либо разрушает теорию, либо нет. Когда против теории всё-таки появляются незначительные свидетельства, возникает внутреннее противоречие. Чтобы его разрешить, мы отбрасываем эти свидетельства. При этом мы перестаём плавно обновлять убеждения и учитывать всё, что знаем. Если же мы рассуждаем на языке вероятностей, то видим, что в пользу верной теории в среднем указывает бо́льший вес наблюдений, нежели против неё. И можно без страха сказать себе: «Это свидетельство немного не укладывается в мои взгляды, я сдвину свою убеждённость вниз». Да, вниз, но не разрушая свою теорию. Рассуждайте количественно.

Для любого свидетельства в пользу гипотезы, которое вы ожидаете увидеть, есть равное и противоположно направленное ожидание свидетельства против. Уверенность всегда может сдвинуться вниз — ожидайте это в той же степени, в какой ожидаете её сдвига вверх. Если, как вам кажется, вы уже знаете, что за свидетельство получите, то вы уже должны довольно сильно верить в свою теорию — назначать ей вероятность, близкую к единице. Тогда этой вероятности почти некуда расти. И каким бы маловероятным вам не казалось увидеть свидетельство против, итоговый сдвиг вниз, который оно должно произвести, будет большим: нужно точно уравновесить возможный сдвиг вверх. Математическое ожидание апостериорной вероятности равняется априорной.

Глупо бояться сдвигать вероятность вниз, если правильный ответ вообще вас интересует. Каждое будущее наблюдение в одинаковой степени может сдвинуть убеждённость в обе стороны.

Быть может, опровергающие свидетельства будут приходить снова и снова, а поддерживающие — лишь изредка. Ваша уверенность будет неуклонно ползти вниз — пока, наконец, вы не поймёте, куда несёт вас ветер наблюдений. В эту минуту не ищите оправданий — ваша любимая теория уже рухнула. Отпразднуйте это! Откройте шампанское или закажите пиццу. Нельзя стать сильнее, пока вы держитесь за те же убеждения, в которые верили и раньше.

Перевод: 
Remlin, Quilfe
Номер в книге "Рациональность: от ИИ до зомби": 
68
Оцените качество перевода: 
Средняя оценка: 4.2 (17 votes)

Один довод против армии

Элиезер Юдковский

В прошлом эссе я писал о таком стиле рассуждений, когда мы не допускаем никаких доводов против теории и ищем повод отбросить любое наблюдение, которое теория не объясняет. Сейчас я предлагаю посмотреть, как люди, столкнувшись с возражением, отказываются сдвигать вниз свою уверенность, раз за разом повторяя уже известные аргументы.

Предположим, страна Фридония, на которую недавно обрушился метеоритный дождь, обсуждает, ответственна ли за это соседняя страна Сильвания. Известно, что метеориты падали на города рядом с сильванийской границей, биржевая торговля в Сильвании перед ударом неожиданно подскочила, а после удара сильванийский посол Трентино бросил какую-то фразу о «небесной каре».

Кто-нибудь говорит вам:

— Я не думаю, что Сильвания виновна в метеоритных ударах. Они ежегодно торгуют с нами на миллиарды динаров.

— Пусть так, — отвечаете вы, — но удары прошли рядом с их границей, их рынки оживились, да и их посол говорил о «небесной каре».

Поскольку три ваших довода перевешивают возражение оппонента, вы продолжаете — качественно — считать, что Сильвания виновата. Ведь ясно, что вес свидетельств против Сильвании больше.

Потом к вам приходит кто-то ещё и говорит:

— Не думаю, что виновата Сильвания. Направить поток астероидов слишком сложно, а у Сильвании даже нет космической программы.

— Но метеориты ударили в города рядом с их границей, их экономисты знали о предстоящем ударе, к тому же посол Сильвании сам признал, что это они! — возражаете вы.

Снова три довода перевешивают один (ведь единица меньше тройки), так что вы продолжаете считать, что Сильвания ответственна.

На деле ваши убеждения даже крепнут. Вы уже дважды взвешивали доводы обеих сторон и каждый раз выигрывали у Сильвании со счётом 3:1.

Изменники, продавшиеся Сильвании, приводят новые и новые доводы, сотни раз — но три ваших аргумента всякий раз сильнее, чем каждое новое возражение. И вы вновь и вновь только укрепляетесь в мысли, что Сильвания и вправду нанесла этот удар. Вы ощущаете, что свидетельства указывают на вину Сильвании, и сдвигаете свою уверенность вверх.

Конечно, проблема в том, что вы многократно учитываете свои знания, когда повторяете старые доводы заново. Даже считать много раз все свидетельства — смертный грех: вообразите учёного, который провёл эксперимент с 50 людьми, не получил статистически значимых результатов и поэтому решил учесть все данные по два раза.

Но повторять дважды лишь избранные свидетельства — вообще чистейший фарс. В детстве я смотрел мультфильм, где злодей делил добычу так: «одно тебе, одно мне; одно тебе, два мне; одно тебе, три мне».

Как я писал в прошлом эссе, даже если текущая гипотеза верна, рационалист иногда понижает уверенность в ней, чтобы учесть все свидетельства. Да, взвешенный итог может всё ещё быть в пользу вашего убеждения. Но вам по прежнему нужно сдвинуть вероятность вниз — да, вниз — от значения, которое она принимала перед тем, как вы услышали возражение. Неправильно повторять поддерживающие доводы: вы уже учли их раньше.

Но пока я вижу, что люди, встречаясь с новыми возражениями, ищут повод не снижать свою уверенность. Конечно, они находят его в аргументах, которые уже знают. Мне приходится сохранять постоянную бдительность, чтобы не делать так самому, — ведь это столь же естественно, как закрываться щитом от удара меча.

Преуспев в неверном мышлении, можно несколькими доводами — или даже одним! — защищаться от целой армии возражений.

Перевод: 
Remlin, Quilfe
Номер в книге "Рациональность: от ИИ до зомби": 
69
Оцените качество перевода: 
Средняя оценка: 4.5 (15 votes)

Нижняя строчка

Элиезер Юдковский

На торги выставлены два запечатанных ящика: А и Б. В каком-то из них лежит алмаз. Многие косвенные признаки подсказывают, в каком из ящиков он, но нет ни одного гарантированного способа это узнать. Например, на одном из ящиков стоит синяя печать, что — насколько вам известно — чаще встречается на ящиках с алмазами, чем на пустых. Или один из ящиков блестит, и вам кажется, что ящикам с алмазом это несвойственно.

Представим, что некий искусный спорщик с листком бумаги в руках говорит владельцам обоих ящиков: «Кто-нибудь из вас, наймите меня, и я докажу, что алмаз у вас в ящике, — сможете продать его подороже». Владельцы ящиков называют цены, владелец ящика Б предлагает больше и нанимает спорщика.

Искусный спорщик начинает рассуждать. Сначала на нижней строчке листа он пишет: «Таким образом, алмаз в ящике Б». Потом заполняет листок сверху: «На ящике Б синяя печать», ниже «ящик А блестит», потом «ящик Б легче, чем ящик А», и ещё много различных признаков. Когда какое-нибудь наблюдение указывает, что алмаз скорее в ящике А, спорщик его отбрасывает. Закончив, он приходит к вам и читает свои записи: «На ящике Б синяя печать, ящик А блестит…» — и завершает всё фразой «Таким образом, алмаз в ящике Б».

Но давайте отметим, что когда искусный спорщик пишет своё заключение, нанося чернила на бумагу, сцепленность этих чернил с ящиками закрепляется и больше не меняется.

Представьте множество параллельных миров — ветвей Эверетта или дублей Тегмарка — в каждом из которых стоят два этих ящика. В каком-то проценте миров алмаз лежит в ящике Б, а в остальных — в ящике А. Среди миров, в которых ящик А блестит, своя доля тех, где алмаз в ящике Б. А среди миров, где ящик А блестит и на ящике Б стоит синяя печать, какая-то другая доля миров с алмазом в ящике Б.

Чернила образуют узор в виде фразы «Таким образом, алмаз в ящике Б». Если вы умеете читать, то вам по ошибке может показаться, что эта надпись как-то связана с тем, где лежит алмаз. Похожим образом люди, которых просят назвать цвет картинки и показывают им красное слово «зелёный», часто говорят «зелёный», а не «красный». Будь вы неграмотны, чернильный узор не обманул бы вас.

Вещи важны для нас тем, как они сцеплены с другими. Посмотрим снова на набор параллельных миров. В тот миг, когда в каждом из миров искусный спорщик записывает вывод на нижнюю строчку, — представим, что это происходит одновременно, — корреляция между записями и ящиками закрепляется. Чернила нестираемы и записи останутся такими же. Ящики тоже не изменятся. Среди миров, где записано «Таким образом, алмаз в ящике Б», есть определённый процент таких, в которых алмаз находится в ящике А. Это состояние не изменится, независимо от того, что искусный спорщик написал на строчках выше.

Сцепленность чернил с ящиками фиксирована, а какова её природа — предлагаю подумать вам. Может, владельцы ящиков, которые считают, что реклама представит их товар в хорошем свете, закажут её охотнее. Может, больше заплатят те, кто боится проиграть аукцион. Если хозяева ящиков сами не понимают, что именно говорят внешние признаки, то записи никак не будут отражать то, что внутри, — но расскажут что-то о состоятельности владельцев и их привычках обращаться с деньгами.

Теперь вообразим, что некая любопытная исследовательница сначала выписывает на лист бумаги все признаки обоих ящиков, анализирует их, применяя законы теории вероятности и свои знания, а потом записывает на нижней строчке: «Итак, по моей оценке вероятность того, что в ящике Б алмаз, — 85%». Эта запись — свидетельство чего? Чернила на бумаге появились как результат изучения цепи причин и следствий. Цепочка причинности проходит через все внешние признаки ящиков и зависит от них. В мирах с разными признаками на нижней строчке записана разная вероятность.

Так что записи любопытной исследовательницы сцеплены с наблюдениями о ящиках и через это — с тем, внутри какого из них алмаз. Записи же искусного спорщика говорят лишь о том, кто назвал бо́льшую цену. Разница между тем, что говорят эти записи, огромна, хотя сами фразы звучат похоже.

Насколько вы хороши как рационалист? Это решает тот способ, который определяет нижнюю строчку ваших умозаключений. Представьте, что нажимаете на педаль тормоза своей машины и слышите странный металлический скрежет. Заменять тормоз вам не хочется. Конечно, можно поискать причины, почему чинить машину не нужно. Но лишь правило, которое решает, какой именно вывод вы рассматриваете, определяет процент возможных миров, в которых вы не разобьётесь, — величину, что отражает ваш успех. Если вы ищете причины не чинить тормоз, то настоящее правило — «не делать дорогого ремонта». Если это хорошее правило, всё в порядке; если плохое — увы. Доводы, которые вы подберёте задним числом и запишете над заключением, уже ничего не изменят.

Это эссе вручает вам повод остерегаться собственных размышлений, а не Универсальный Контраргумент против тех выводов, которые вам не нравятся. «Моя оппонентка — искусная спорщица» — неплохой аргумент… если вы стремитесь сохранить свои убеждения неизменными. Самый искусный спорщик мира может сказать, что светит солнце, и всё ещё будет светло.

Перевод: 
Remlin, Quilfe
Номер в книге "Рациональность: от ИИ до зомби": 
70
Оцените качество перевода: 
Средняя оценка: 4 (29 votes)

О чём свидетельствуют отсеянные свидетельства?

Элиезер Юдковский

В прошлом эссе я обсуждал проблему искусного спорщика, которого наняли, чтобы продать вам ящик, где может быть алмаз, а может и не быть. Спорщик отмечает, что на ящике стоит синяя печать. На ящиках с алмазами встречается чаще, нежели на пустых — это известный факт. Что это всё значит с байесовской точки зрения? Должны ли вы послушно обновить свои вероятности — так, как желает искусный спорщик?

Вы сами видите все признаки, если ящик перед вами. Но что если нет? Представьте, что знаете о ящике лишь то, что рассказал искусный спорщик. Он говорит только правду, но не обязан сообщать всё, что знает. Каждое его утверждение — полноценное свидетельство; как можно не обновить свои вероятности? Неужели теперь среди возможных миров, где на ящике Б синяя печать, не выше доля тех, в которых лежит алмаз? Согласно Джейнсу, байесианцы всегда должны исходить из всех известных свидетельств, когда рассчитывают вероятности, — иначе могут возникать противоречия. Но выходит, что при достаточно разнообразных наблюдениях искусный спорщик может убедить вас в чём угодно, подобрав свидетельства на свой вкус. Тут что-то не так.

Взглянем на пример попроще. Перед нами неровная монетка, которая выпадает в двух третях бросков орлом, а в одной трети решкой — или наоборот. Изначально гипозеты о том, в какую сторону у монетки смещение, одинаково правдоподобны. Каждый выпавший орёл — один бит свидетельств смещения в сторону орла; каждая решка — один бит свидетельств смещения в сторону решки. Я подбрасываю монетку десять раз и говорю: «На четвёртом, шестом и девятом броске выпал орёл». Как вы теперь оцените вероятность, что смещение — в сторону орла?

Ответ может быть почти любым в зависимости от того, что заставило меня сказать эти слова, — от того, как я решил, о каких бросках сообщать.

  • Возможно, я всегда говорю результаты 4-го, 6-го и 9-го бросков, что бы ни выпало на них и на других бросках. Если вы знаете, что я следую такому правилу, то апостериорные шансы — 8:1 в пользу смещения в сторону орла.
  • Я могу сообщать только о тех бросках, где выпал орёл. Тогда вы знаете, что на остальных семи бросках выпали решки и апостериорные шансы — 1:16 против смещения в сторону орла.
  • Я могу заранее решить, что назову результаты 4-го, 6-го и 9-го бросков, только если моя апостериорная вероятность смещения в сторону орла окажется больше 98%.
  • Ну и так далее.

Или посмотрим на задачу Монти-Холла:

В этой игре перед вами три двери. За одной из них лежит 100 000 долларов, а за другими ничего. Ведущая просит выбрать дверь, и вы выбираете первую. Тогда ведущая открывает вторую — за ней пусто. Хотите ли вы открыть третью дверь или же всё ещё первую?

Ответ зависит от стратегии ведущей. Если она открывает дверь всегда и только ту, за которой ничего нет, то переключайтесь. Если ведущая всегда открывает вторую дверь, что бы ни было за ней, то деньги с равной вероятностью могут лежать за первой или третьей. Если ведущая вообще открывает дверь лишь тогда, когда вы сразу указали туда, где лежат деньги, то вам определённо стоит держаться изначального выбора.

Важно не только то, что за второй дверью пусто, но и то, что ведущая открыла именно её. Классическая задача Монти-Холла сбивает многих с толку, поскольку они учитывают лишь то, что за второй дверью денег нет — в итоге выходят равные вероятности, что деньги за первой и за третьей дверью. Вот почему байесианцам нужно учитывать все свои знания.

Услышав «четвёртый бросок — орёл», мы не обрабатываем то, что на четвёртом броске выпал орёл, не берём все возможные миры с орлом на четвёртом броске. Вместо этого мы рассматриваем миры, где какое-то правило породило слова «четвёртый бросок — орёл». Факт, который мы узнали, не сводится к тому, что сказано. Не позволяйте смыслу самих слов вас запутать.

Чаще всего судебное разбирательство — борьба двух противоположных сторон, ведь легче найти двух людей с искажениями, нежели одного беспристрастного. Идея тут в том, что любое свидетельство выгодно либо обвинению, либо защите, так что суд увидит все наблюдения. Два искусных спорщика в задаче с ящиками хуже, чем одна любопытная исследовательница, но ненамного — если ящика всего два. Однако в жизни перед нами встают проблемы, где сторон много, и запутанные ситуации без очевидного ответа, которые не решить двум противоположным сторонам, которые ругаются друг с другом.

Осторожно, не злоупотребляйте идеей отсеивания свидетельств, не применяйте её как Универсальный Контраргумент против свидетельств, которые вам не нравятся: «Они отфильтрованы, так что я отброшу их». Если неприятный аргумент застиг вас врасплох, то вы уже немного вникли в вопрос и ответ вас волнует — настолько, что вы уже выбрали сторону. Тогда вы, скорее всего, уже знаете главные доводы в свою пользу. Из неприятного аргумента нельзя заключить, что есть какие-то ещё свидетельства в поддержку вашей стороны, которых вы не видели и которые уравновесили бы этот довод. Всё, что вы узнали нового, — лишь неудобные наблюдения; синяя печать на ящике Б — всё ещё свидетельство.

Но будьте не менее осторожны, когда задумываетесь о вопросе впервые и слышите только одну сторону. В некотором смысле нельзя верить теории естественного отбора, не послушав креационистов хотя бы пять минут, — и вот уже тогда можно смотреть, какая из теорий убедительнее.

Перевод: 
Remlin, Quilfe
Номер в книге "Рациональность: от ИИ до зомби": 
71
Оцените качество перевода: 
Средняя оценка: 4.6 (14 votes)

Рационализация

Элиезер Юдковский

В «Нижней строчке» я описал проблему двух ящиков: в одном из них алмаз, и различные внешние признаки подсказывают, в каком. Я описал подходы любопытной исследовательницы и искусного спорщика. Исследовательница выписывает все признаки, обрабатывает их и, наконец, пишет в заключении: «Итак, по моей оценке вероятность того, что в ящике Б алмаз, — 85%». Искусный спорщик работает на того, кто платит больше; он сначала пишет «Таким образом, алмаз в ящике Б», а потом выбирает подходящие признаки и записывает выше.

Первый образ действий — рациональность. Второй обычно называют «рационализацией».

«Рационализация». Интересный выбор слова — и, по мне, неудачный. Нельзя «рационализировать» что-то нерациональное. Всё равно что говорить «правдофикация» вместо «ложь».

На алгоритмическом уровне есть большая разница между следующими подходами:

  • Начать со свидетельств, подсчитать на их основе вероятность и получить наиболее правдоподобный вывод. То есть выписать все признаки и от них перейти к ответу, что будет зависеть от этих признаков.
  • Начать с заключения и подобрать те свидетельства, которые это заключение поддерживают. То есть записать ответ на нижнюю строчку, а потом выбрать подходящие признаки и поставить выше.

Кто додумался назвать столь разные мыслительные процессы такими похожими словами, как «рациональность» и «рационализация»? Я бы хотел, чтобы названия отражали разницу в этих алгоритмах яснее. Скажем, «рациональность» и «огромная отстойная чёрная дыра мышления».

Не каждое изменение — улучшение, но каждое улучшение — изменение. Нельзя сделать конкретное утверждение более истинным, просто приводя доводы в его пользу. Можно убедить в нём больше людей, но нельзя изменить, верно ли оно. Чтобы улучшать свои убеждения, мы должны их менять. Рациональность — это то, как мы обновляем свои взгляды и этим повышаем степень их истинности. Рационализация же закрепляет убеждения в том же виде. Стоило бы назвать её «антирациональностью» — как по её плодам, так и из-за того, что она зеркально противоположна рациональности по алгоритму.

«Рациональность» — прямой поток, который собирает свидетельства, оценивает их и делает заключение. Алгоритм исследовательницы направлен вперёд. Сначала она собирает свидетельства, выписывая все видимые признаки ящиков. Затем она их обрабатывает и получает неизвестную раньше вероятность того, что в ящике Б алмаз. Рациональные рассуждения всё время идут вперёд, исследовательница ещё не знает, что получит, поэтому мы говорим, что она любопытна. На Пути Байеса априорная вероятность равна ожидаемой апостериорной: если вы знаете место назначения, вы уже там.

«Рационализация» — обратный поток: от заключения к избирательно взятым свидетельствам. Сначала вы пишете нижнюю строчку, которая известна и не поменяется. Ваша цель — найти, какие доводы написать выше. Неизвестны они, а не заключение.

Боюсь, традиционная рациональность плохо учит разнице между потоками вперёд и назад. Учёный выдвигает гипотезу на свой вкус и ищет эксперимент, который подтвердил бы её, — и традиционная рациональность его не осуждает. Она смотрит на него с одобрением и говорит: «Твоя уверенность в себе — тот механизм, что движет Науку вперед». Ну да, выходит, что движет. Легче найти обвинителя и защитника с различающимися искажениями, нежели одного непредвзятого человека.

Но не всё, что происходит, — правильно. Лучше, если учёный, придумав гипотезу, проверит её из любопытства — будет ставить опыты, которые изменят его убеждения в неизвестную сторону.

Если вы искренне не знаете, куда идёте, то вам интересно. Любопытство — первая добродетель: без неё вопросы бесцельны, а мастерство некуда приложить.

Ощутите, куда течёт Сила, и убедитесь, что не задом наперёд.

Перевод: 
Remlin, Quilfe
Номер в книге "Рациональность: от ИИ до зомби": 
72
Оцените качество перевода: 
Средняя оценка: 4.1 (23 votes)

Рациональное обоснование

Элиезер Юдковский

Представьте, что зарабатываете на жизнь избирательными кампаниями и с недавних пор читаете блог о рациональности. Однажды вас нанимает Мортимер К. Снодграсс, кандидат в мэры Гедлиберга. Один вопрос не даёт вам покоя: «Как безукоризненно и рационально обосновать, что Снодграсс — лучший кандидат?»

Извините, но никак.

— Что? — удивляетесь вы. — Но ведь я построю своё выступление только из полноценных аргументов! Что если каждый факт, который я приведу, будет столь правдив, сколь мне вообще известно? Что если я назову лишь весомые свидетельства для теоремы Байеса?

Всё ещё не получится, извините. В ту минуту, когда вы ставите заключение впереди рассуждений, вы забиваете гол в свои ворота.

В этом году «Гедлибергские известия» проанкетировали кандидатов, задав им вопросы вроде «Дуете ли вы?»1 и «Умеешь ли картинки на лету цветами ветра рисовать?»2 Увы, метеорит разрушил здание редакции, и номер не вышел в печать. Жаль, ведь ваш кандидат, Мортимер Снодграсс, ответил на 15 из 16 вопросов куда лучше соперников. Заминка возникла лишь в 11-м вопросе: «Вы суперзлодей?»

Вам очень хочется опубликовать анкету в ходе кампании. Без 11-го вопроса, конечно.

В эту минуту вы переходите грань меж рациональностью и рационализацией. Избиратели теперь не могут просто сравнить факты. Им нужно учесть, что свидетельства отсеиваются, и догадаться, что некоторые факты скрыты.

Вообще говоря, вы переходите грань ещё раньше — когда размышляете, в каком свете анкета рисует вашего кандидата, чтобы решить, публиковать ли ее.

— Что?! — возмущены вы. — Мне теперь публиковать факты, неудобные кандидату?

Но взгляните глазами избирателей, которые решают, кому отдать голос. Зачем бы вам прятать ценные сведения? Вы бы не стали так делать, питая искреннее любопытство. Вы бы не стали так делать, двигаясь в рассуждениях вперёд, от свидетельств к пока неизвестному выбору кандидата. Но вы идёте назад: от определённого кандидата к поиску доводов.

Рассуждение, где вывод следует из предыдущих посылок, называется «логически верным». Следующее рассуждение логически неверно:

  • все прямоугольники — четырёхугольники,
  • все квадраты — четырёхугольники,
  • следовательно, все квадраты — прямоугольники.

Посылки истинны и даже заключение истинно, но силлогизм всё еще не становится логически верным. Стоит разделять верные и неверные способы вывода и не оправдывать неверные, даже когда их заключения справедливы. Пусть разные способы и дали один ответ сейчас — в свете будущих свидетельств ответы будут отличаться. Да и небрежность входит в привычку.

Более того, неверный силлогизм не поможет найти настоящее объяснение. Может, все квадраты — прямоугольники, но не потому, что те и другие — четырёхугольники. Этот силлогизм лицемерен: настоящие причины в нём не связаны с названными.

Чтобы на самом деле честно и обоснованно представить своего кандидата, придётся делать так:

  • до того, как кто-нибудь вас наймёт, соберите все доступные свидетельства обо всех кандидатах;
  • составьте критерии, по которым сами выбирали бы, кто лучше;
  • прогоните кандидатов по списку критериев;
  • определите, кто лучше всех;
  • предложите провести ей или ему кампанию.
  • Когда вас спросят, почему стоит голосовать за этого кандидата, предъявите свой список.

Только такая цепочка рассуждений рациональна: нижняя строчка вытекает из всего, что записано выше. Над нижней строчкой будет честным записать лишь то, что на самом деле её определяет.

  • 1. Отсылка к вопросу, который избиратель задал Бараку Обаме. — Прим. перев.
  • 2. Строчка песни «Цвета ветра» из мультфильма «Покахонтас». — Прим. перев.
Перевод: 
Remlin, Quilfe
Номер в книге "Рациональность: от ИИ до зомби": 
73
Оцените качество перевода: 
Средняя оценка: 4.8 (11 votes)

Избегая по-настоящему слабых мест убеждения

Элиезер Юдковский

Моя прабабушка умерла несколько лет назад, не дожив до ста, разрушаясь медленно и мучительно. Я никогда особо не знал её, но по воспоминаниям из детства, она готовила для всей семьи. Я помню её фаршированную рыбу, её лицо и то, как она была добра ко мне. На похоронах мой двоюродный дедушка, который ухаживал за ней годами, сказал, глотая слезы, что Бог забирал его мать по частям: её память, её речь и наконец её улыбку. И когда Бог забрал её улыбку, он знал, что ей недолго осталось, потому что это означало, что её почти нет.

Я слушал это в замешательстве. Каждый, с кем случилось бы подобное, счёл бы это невыносимо ужасным и я не ожидал, что дедушка свяжет это с Богом. Обычно еврей как-то избегает мысли о логическом следовании того факта, что Бог допустил подобную трагедию. Согласно еврейской теологии, Бог непрерывно следит за вселенной и стоит за каждым событием в ней, но обычно вывод логических заключений из этой мысли приберегается для счастливых случаев. Говоря «Бог помог!», когда у вас родился ребенок, и опуская эти слова в случае выкидышей или детских смертей, вы можете сформировать довольно однобокую картину личности великодушного бога.

Таким образом я был удивлен услышать, что мой дедушка расценивает медленное угасание бабушки как осознанное и стратегически запланированное действие Бога. Это нарушало правила религиозного самообмана, как я их понимал.

Если бы я заметил мое собственное замешательство, я бы мог сделать успешное шокирующее предсказание. Вскоре мой дедушка перестал верить. (Единственный член моей обширной семьи, который так сделал, не считая меня, насколько мне известно)

Современный ортодоксальный иудаизм непохож на остальные религии, о которых я слышал, и я не знаю, как объяснить это тому,кто сам не изучал Мишну и Гемару. Там существует традиция вопрошания, но особого рода… Не слишком удивительно было бы услышать от рабби на недельной проповеди указание на противоречие между семью днями творения и 13.7 миллиардами лет с большого взрыва - поскольку, как он думает, у него есть по-настоящему умное объяснение для этого, которое включает в себя три других библейских отсылки, Мидраш и наполовину понятую статью в «Scientific American». В ортодоксальном иудаизме вам позволено замечать противоречия и несостыковки, но только для того, чтобы объяснить их, и любой, кто предложит самое запутанное объяснение, получает приз.

Это традиция вопросов. Но вы атакуете цели только чтобы защитить их. Вы атакуете только те цели, которые в состоянии защитить.

В современном ортодоксальном иудаизме я не замечал особого акцента на ценности слепой веры. Вам позволено сомневаться. Но не позволено сомневаться успешно.

Думаю, что большинство образованных ортодоксальных евреев ставили свою веру под сомнение в какой-то момент жизни. Но вопрошание скорее всего проходило так: «Согласно скептикам, Тора говорит, что вселенная была создана за семь дней, что не совпадает с научными данными. Но сумели бы племена Израиля, собравшиеся на горе Синай, понять научную истину, даже если бы им рассказали её? Было ли у них слово для «миллиарда»? Куда легче рассматривать историю о творении в семь дней как метафору - сначала Бог создал свет, под чем подразумевается большой взрыв…»

Является ли это самой слабой точкой, которую человек мог бы атаковать в своем иудаизме? Двигаясь дальше в Торе вы можете найти место, где Бог убивает всех младенцев-первенцев Египта, чтобы убедить неизбранного фараона освободить рабов, которых логичней было бы просто телепортировать за пределы страны. Любой ортодоксальный еврей почти наверняка знаком с этим сюжетом, ведь предполагается, что он присутвует при том, как каждый год в синагоге перечитывают всю Тору. Кроме того, этому событию посвящён один из важнейших праздников. Само название «Песах» отсылает к тому, как Бог проходил мимо домов евреев и убивал первенцев Египта.

Современные ортодоксальные евреи это открытые, добрые и цивилизованные люди; куда более цивилизованные, чем несколько редакторов Старого Завета. Даже старые рабби были более цивилизованны. Есть ритуал в Седере, где вы выливаете десять капель вина из вашего бокала, по одной за каждое из десяти бедствий, чтобы сделать акцент на страдании египтян. (конечно, предполагается сочувствовать страданиям египтян, но не настолько чтобы встать и сказать «Это неправильно! Делать такие вещи - плохо!») это показывает интересный контраст - рабби существенно добрее чем создатели Старого Завета, они видят жестокость бедствий. Но Наука была слабее в те дни, так что рабби могли обдумывать более неприглядные аспекты Библии, не боясь, что это полностью уничтожит их веру.

Вы даже не спрашиваете, отразился ли инцидент плохо на Господе, так что нет необходимости быстро ляпнуть «Пути Господни неисповедимы!» или «У нас нет мудрости, чтобы судить решения Бога!» или «Если Бог убивает детей, значит так правильно!» Это часть метода «просто-не-думай-об-этом».

Как я подозреваю, причина, по которой образованные религиозные люди остаются религиозными, это то, что когда они сомневаются, они подсознательно очень аккуратно атакуют свои убеждения только в самых защищенных местах — местах, которые, как они знают, они могут защитить. А повторно отработанная защита приводит к тому, что такие места будут ощущаться как ещё более укреплённые.

Наверняка же ощущается хорошо, например, повторять заранее продуманную защиту для «Разве Наука не говорит, что вселенная просто бессмысленные атомы, мельтешащие вокруг?», поскольку это подтверждает смысл вселенной и то, как она происходит от господа и т.д…Куда более комфортно думать об этом, чем о неграмотной матери-египтянке, плачущей над детской кроваткой, в которой лежит её истерзанный сын. Любой, кто спонтанно задумывается о последнем, а потом ставит свою веру под сомнение, тот сомневается в ней по-настоящему и, скорее всего, недолго еще пробудет верующим. Смысл поста не в том, чтобы ударить по ортодокосальному иудаизму. Уверен, там есть ответ на вопрос об умерщвлении первенцев, и даже не один. Смысл в том, что, когда идет спонтанный самоанализ, люди куда более вероятно атакуют наиболее сильные места убеждений, защищенные ответами для повторений, чем слабые и уязвимые места. Сходным образом, люди склонны останавливаться на первом же ответе, а не продолжать критиковать дальше. Лучшим названием было бы не «Избегая по-настоящему слабых мест убеждения», а «Не атакуя наиболее болезненные слабости ваших убеждений при спонтанном самоанализе».

Больше всего приверженность к религии поддерживается людьми, которые просто-не-думают-о настоящих слабых местах их религии. Я не думаю, что это дело навыка, скорее это дело инстинкта. Люди не думают о настоящих слабых местах их убеждений по той же самой причине, по которой не трогают горящую газовую конфорку; это больно.

Как справляться лучше: когда вы сомневаетесь в одном из наиболее заветных своих убеждений, закройте глаза, очистите свой разум, стисните зубы и осознанно подумайте о том, что ранит сильнее всего. Не повторяйте стандартные возражения, которые обычно дают вам возможность ощутить себя лучше. Спросите себя, что умные люди, не согласные с вами, сказали бы на ваше возражение, и на последующее тоже. Всякий раз, когда вы обнаруживаете себя уходящим от возражения, о котором вы мельком подумали, вытащите его на передний край вашего сознания. Ударьте себя в солнечное сплетение. Вонзите нож в свое сердце и прокрутите несколько раз. Перед лицом боли, повторяйте только одно:

Правда не перестаёт быть правдой.
Признание не сделает её хуже.
Отказ узнавать правду не заставит её исчезнуть.
И именно с правдой вам придётся взаимодействовать.
Невозможно жить в неправде, ибо её не существует.
Люди способны вынести правду,
Ведь она и так их окружает повсюду.

(Юджин Джендлин)

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
74
Оцените качество перевода: 
Средняя оценка: 4.7 (18 votes)

Предвзятая остановка и предвзятое продолжение

Элиезер Юдковский

В то время, как я не согласен с некоторыми положениями Fast and Frugal — как по мне, так они делают слишком много лимонада из лимонов — похоже, что они склонны развивать наиболее психологически реалистичные модели любой школы теории принятия решений. Большинство экспериментов представляют испытуемым варианты, среди которых те выбирают, тем самым получается экспериментальный результат. Ребята с того сайта понимают, что в реальной жизни вам надо создавать варианты, и они изучают, как испытуемые это делают.

Сходным образом, несмотря на то, что многие эксперименты предоставляют свидетельства на блюдечке с голубой каёмочкой, в реальной жизни вы должны собрать свидетельства, что может быть затратно, и в какой-то момент решить, что у вас достаточно свидетельств, чтобы остановиться и сделать выбор. Это всё равно, что покупать дом — можно было бы выбрать наперёд 10 домов, тщательно осмотреть каждый из них и только после этого принять какое-то решение. Но в жизни всё происходит иначе. Вы смотрите на один дом, потом на другой, затем сравниваете их; вы подправляете свои стремления — заново рассматриваете как близко на самом деле вам надо поселиться к месту работы и как много вы готовы за это заплатить; вы решаете какой дом смотреть следующим; и в какой-то момент вы решаете что видели достаточно домов и делаете выбор.

Согласно Гиловичу, различие между предвзятым скептицизмом и предвзятым доверием указывает на то, как заключения, которым человек не хочет верить, обладают большей требовательностью, нежели заключения, которым человек хочет верить. Предвзятый скептик спрашивает, заставит ли свидетельство принять вывод; предвзятый простак спрашивает, позволит ли свидетельство принять вывод.

Я предполагаю, что есть аналогичное искажение в психологически реалистичном поиске, предвзятая остановка и предвзятое продолжение: когда у нас есть скрытый мотив для выбора «лучшего» текущего варианта, у нас есть скрытый мотив остановиться, выбрать и отвергнуть любые другие варианты. Когда у нас есть скрытый мотив отвергнуть лучший текущий вариант, у нас есть скрытый мотив приостановить суждение, ожидая дальнейших свидетельств, чтобы сгенерировать больше вариантов — найти что-нибудь, что угодно, что можно делать вместо того, чтобы приходить к заключению.

Крупный скандал в истории статистики связан с именем основателя, выдающегося учёного Р.А. Фишера. Фишер заявлял об отсутствии причинной связи между курением и раком лёгких. «Корреляция — это не причинность», сделал заключение он на Конгрессе. Видимо у курильщиков есть ген, который определяет их склонность как к курению, так и к раку лёгких.

Или возможно Фишер был нанят как консультант табачными фирмами, которые дали ему скрытый мотив решить, что уже собранные свидетельства недостаточны, чтобы придти к выводу и что нужно продолжать искать. Фишер также сам был курильшиком и умер от рака кишечника в 1962 году.

(ad hominem примечание: Фишер был сторонником частотного подхода. Байесианцы более разумны в отношении выводов о возможной причинности.)

Наподобие многих других форм предвзятого скептицизма, предвзятое продолжение может попытаться замаскироваться под добродетельную рациональность. Кто может спорить против сбора дальнейших свидетельств? Я могу. Свидетельства чаще затратны и хуже, медленнее и определённо нет ничего добродетельного в отказе интегрировать уже имеющиеся свидетельства. Вы всегда можете изменить ваше мнение позже. (Приблизительное возражение может быть сформулировано следующим образом: трата одного часа обсуждения с вашим сознанием тщательно очищенным от всех выводов отлична от ожидания десяти лет на другое 20-миллионное исследование.)

Что касается предвзятой остановки, она проявляется в каждом месте, где боятся третьей альтернативы, и везде, где у вас есть аргумент, очевидный контраргумент которого вы даже не рассматриваете, и ещё в паре мест. Она проявляется когда вы следуете курсу действий, который ощущается вами как хороший, так что вы даже не исследуете насколько хорошо на самом деле работает план, в страхе разрушить тёплый свет морального удовлетворения, за которое вы платите хорошие деньги. Она проявляется везде, где ваши убеждения и ожидания расходятся, так что у вас появляется причина бояться сбора любых новых свидетельств.

Мораль в том, что решение уничтожить процедуру поиска (временно или навсегда), равно как и сама процедура, является подверженным искажению и скрытым мотивам. Вы должны подозревать предвзятую остановку, когда заканчиваете поиск и приходите к удобному решению, хотя при этом есть множество легкодоступных свидетельств, которые вы ещё не собрали — сайты, которые вы можете посетить, контр-контраргументы, которые вы можете рассмотреть, или хотя бы те же пять минут, которые можно твёрдо выделить на обдумывание лучшего варианта. Вы должны подозревать предвзятое продолжение, когда есть некоторые свидетельства, склоняющие вас на путь, который вам не нравится, но вы решаете, что нужно ещё свидетельств — дорогих свидетельств, которые как вы знаете, вы не можете в скором времени собрать, в противоположность тому, чтобы полчаса полазить в Гугле — прежде чем вам нужно будет сделать нечто неудобное.

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
75
Оцените качество перевода: 
Средняя оценка: 4.1 (12 votes)

Фальшивое оправдание

Элиезер Юдковский

Многие христиане, которые на самом деле не являются верующими, настаивают, что они почитают Библию как источник этических советов. Стандартный ответ атеиста на это озвучил Сэм Харрис: «И вы, и я знаем, что достаточно пяти минут размышлений, чтобы найти книгу, которая содержит более цельную и милосердную систему морали, чем Библия». Точно так же, христианин может попытаться утверждать, что Библия ценна как художественное произведение. Но тогда почему не почитать «Властелина Колец», намного превосходящую литературную работу? И несмотря на стандартную критику моральности Толкиена, «Властелин Колец» все равно превосходит Библию и как источник этических норм. Так почему же люди носят на шее кресты, а не кольца? Даже «Гарри Поттер» превосходит Библию как по художественной ценности, так и в области моральной философии. Если бы я на самом деле хотел быть жестоким, я бы сравнил Библию с «Кушиэлем» Жаклин Кэри.

«Как ты можешь оправдывать покупку украшенного драгоценностями ноутбука за миллион долларов, — спрашиваете вы своего друга, — когда так много людей вообще не имеют ноутбуков?» Друг отвечает: «Но подумай о поддержке, которую это даст — производителю ноутбуков, экспертам, которые выдают решения о таких ноутбуках — у них будет на что жить, это стимулирует экономику и в конце концов многие люди получат свои ноутбуки». Но было бы куда эффективнее купить 5000 обычных ноутбуков, таким образом обеспечив поддержку производителю и выдачу ноутбуков напрямую.

Я касался этой темы прежде чем заговорил о провалах при попытках найти третью альтернативу. Но на самом деле это не предвзятая остановка. Назвать это «предвзятой остановкой» значит подразумевать, что в первую очередь проводился поиск.

В «Нижней строчке» я привел наблюдение, что только настоящие определяющие факторы наших убеждений могут вообще влиять на точность в реальном мире, только настоящие определяющие факторы наших действий могут влиять на нашу эффективность в достижении целей. Кто-то, кто покупает ноутбук за миллион долларов, на деле думая «о, сверкает» и это является настоящей причиной его решения купить ноутбук. Никакое количество оправданий не изменит этого, пока оправдание не будет искренним, заново проведенным процессом поиска, который мог бы изменить решение. По-настоящему мог бы изменить. Большая часть критики проистекает из чувства долга, скорее символической инспекции, а не чего-либо еще. Свободные выборы в стране с одной политической партией.

Чтобы искренне оправдать Библию как объект для восхвалений путем отсылки к ее литературной ценности, вы бы должны были каким-либо образом провести нейтральную вычитку книг-кандидатов, пока вы не найдете книгу с наиболее высокой литературной ценностью. Популярность является одним из разумных критериев для подбора кандидатов, так что я предположу, что вы могли бы закончить чтением Шекспира, Библии и Геделя, Эшера, Баха. (В противном случае было бы достаточно невероятным совпадением найти Библию как кандидата среди миллионов других книг.) Настоящая трудность в пресловутой «нейтральной вычитке». Достаточно легко, если вы не являетесь христианином, но если это не так…

Но конечно же такого не бывает. Никто не делает такого поиска. Выписывать оправдание «литературной ценности» над нижней строчкой «Я люблю Библию» это историческое введение в заблуждение относительно того, как на самом деле нижняя строчка была написана, это как продавать кошачье молоко в качестве коровьего. Нижняя строчка не была выведена из верхних. Это заключение было сделано совсем не так.

Если вы искренне ставите ваш вывод под критику, которая может потенциально изменить его — если критика по-настоящему имеет эту силу — тогда это модифицирует «настоящий закулисный алгоритм» вашего вывода. Это меняет сцепленность вашего вывода в возможных мирах. Но люди переоценивают насколько вероятно они на самом деле могут изменить свое сознание.

Со всеми этими открытыми сознаниями, вы думаете что можно лучше менять убеждения.

Позвольте предположить: Да, вы признаете, что изначально вы решили что хотите купить ноутбук за миллион долларов при мысли «о, сверкает». Да, вы допускаете, что это не тот процесс принятия решения, который совпадает с заявленными вами целями. Но с тех пор вы решили, что на самом деле должны потратить ваши деньги так, чтобы обеспечить ноутбуками как можно больше людей. И все еще при этом не нашли более эффективного способа сделать это, кроме как купить ноутбук за миллион долларов — потому что, ух ты, вы даете деньги магазину и стимулируете экономику! Попробуйте-ка побейте это!

Друг мой, у меня имеются сильные подозрения насчет этого потрясающего совпадения. У меня имеются чертовски сильные подозрения что лучший ответ в условиях этого прекрасного, рационального, альтруистического критерия совпадает с идеей, которая изначально пришла вам в голову при помощи другого, не связанного с этим критерием и не имеющего оправдания процесса. Если вы не думаете, что бросая кости, вероятно можно найти верный ответ, насколько же вероятно, что одна и та же идея может являться конечной точкой рационального и иррационального познания?

Неправдоподобно, чтобы вы использовали ошибочное мышление и при этом еще не наделали ошибок.

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
76
Оцените качество перевода: 
Средняя оценка: 4.3 (16 votes)

Это ваша настоящая причина отказа?

Элиезер Юдковский

Иногда люди узнают о моих трансгуманистических убеждениях. Эти убеждения выглядят непохожими на мои идеи о человеческой рациональности. Идеи про сверхинтеллект или дружественный ИИ звучат странно и экзотично. И люди часто сразу же отвергают их.

Если попросить кого-нибудь из них объяснить причину, то не так уж редко в ответ можно услышать:

— Почему я должен верить тому, что говорит Юдковский? У него нет даже учёной степени!

Нередко свидетели такого разговора советуют: «Тебе нужно получить учёную степень, и тогда люди к тебе прислушаются». Иногда этот совет исходит даже от самого возражающего: «Возвращайся, когда получишь степень!»

Для получения степени есть хорошие и плохие причины, и конкретно эта — плохая.

Враждебная реакция на трансгуманистические тезисы на самом деле может вызываться разными причинами. Большинство из них упираются в соответствие шаблону, они не основаны на какой-то продуманной цепочке рассуждений. Тезис распознается как «странная непонятная идея», или «научная фантастика», или «культ конца света» или «чрезмерный юношеский энтузиазм».

Поэтому идея отвергается сразу же, как только срабатывает соответствующий шаблон. Если же затем кто-нибудь спрашивает: «Почему нет?», мозг начинает поиск оправдания. Но этот поиск не обязательно находит истинную причину. Под «истинной причиной» я подразумеваю не наилучшую причину, которую можно представить, а скорее то, что сильнее всего повлияло на принятие решения в тот самый миг, когда сработала реакция отвержения.

Вместо этого поиск оправдания находит правдоподобно звучащий факт: «У говорящего нет степени».

Но точно так же у меня нет степени, когда я говорю о рациональности. Почему это возражение не применяется в этих случаях?

И что более важно, если бы у меня была степень, люди не посчитали бы её решающим доводом в пользу того, что они обязаны верить всему, что я говорю. Скорее всего, происходила бы та же исходная реакция отвержения — по тем же самым причинам, — но последующий поиск оправданий приводил бы чему-нибудь ещё.

Если бы у меня была степень, люди бы говорили: «Почему я должен вам верить? Вы всего лишь человек с учёной степенью! Таких много. Возвращайтесь, когда будете авторитетом в этой области и профессором какого-нибудь солидного университета».

Но действительно ли люди верят случайному профессору из Гарварда, который говорит что-то странное? Конечно же, нет. (Хотя если бы я был гарвардским профессором, мне было бы легче привлечь внимание СМИ. Журналисты не склонны мне доверять, и скорее всего они бы точно так же не доверяли случайному человеку с учёной степенью. Но профессор из Гарварда, который верит в странное, — это хороший новостной сюжет.)

Если ваши тезисы кажутся человеку неправильными — не просто магически звучащими техническими звуками о лептонных кварковых переплетениях в N+2 измерениях, — и слушатель незнаком с вами лично и с обсуждаемым предметом, то, подозреваю, для среднего слушателя ваши академические регалии перевесят первое впечатление, если вы находитесь где-то на уровне нобелевского лауреата. И то не факт. Но в любом случае, вам нужны такие академические регалии, которые воспринимаются как находящиеся «за гранью обыденности».

Насколько я представляю, примерно это произошло с Эриком Дрекслером. Он представил свое видение нанотехнологии, и люди сказали: «А где технические подробности?» или «Возвращайтесь, когда у вас будет степень!» И он потратил шесть лет, расписывая технические подробности и получая степень под руководством Марвина Мински. «Наносистемы» — великая книга. Но разве те люди, которые говорили: «Возвращайтесь, когда получите степень!» изменили после этого своё мнение о молекулярной нанотехнологии? Насколько я знаю, нет.

И то же самое происходит и с Институтом исследований машинного интеллекта. Когда мы делаем то, что якобы должно вызывать у людей больше доверия, ничего не меняется. «Вы разрабатываете какие-либо программы? Я не собираюсь поддерживать организацию, где не пишут код» → OpenCog → ничего не изменилось. «У Элизера Юдковски нет академических регалий» → Место директора по исследованиям занимает профессор Бен Герцель → ничего не изменилось. Единственное, что, по-видимому, действительно повышает уровень доверия, — это знаменитые люди, ассоциируемые с организацией, такие как Питер Тиль, спонсирующий нас, или Рей Курцвейл в совете директоров.

Если вы недавно открыли своё дело, то вам и вашим советчикам стоит помнить, что если в качестве причины отказа вам указывают на какие-то ваши неудачи, то проблема может быть и не в них, и вам стоит тщательно всё обдумать, особенно если ситуация требует больших вложений. Если венчурный капиталист говорит: «Если бы только ваши продажи росли немного быстрее!», если потенциальный клиент говорит: «Неплохо, но у вас нет фичи Х», это может и не быть настоящей причиной. Возможно исправление этого поможет, а, возможно, и нет.

И то же самое следует учитывать при разногласиях. Робин Хансон и я считаем, что два рационалиста не могут согласиться не соглашаться: общее знание об эпистемологическом разногласии может появиться только в случае, если что-то пошло очень сильно не так.

Я подозреваю, что, если два рационалиста намереваются разрешить разногласие, которое не исчезло после первого обмена мнениями, им стоит ожидать, что настоящую причину разногласия либо сложно передать, либо сложно обнаружить. Такими причинами, например, могут быть:

  • Малоизвестное, но хорошо обоснованное научное или математическое знание;
  • Длинные понятийные расстояния;
  • Плохо переводимые в слова интуитивные ощущения, возможно проистекающие из специфичных представлений;
  • Образ мысли, присущий представителям определённой профессии (по вполне разумным причинам);
  • Шаблоны, приобретённые с опытом;
  • Просто мыслительные привычки;
  • Эмоциональные привязанности к вере в определенный исход;
  • Страх опровержения прошлых ошибок;
  • Самообман на глубоком уровне, дающий повод для гордости или другие личные выгоды.

Если при решении вопроса все настоящие причины отказа можно легко предъявить, разногласие, скорее всего, будет разрешено очень быстро, почти наверняка — на первой встрече.

«Это моя настоящая причина отказа?» Именно этот вопрос должны задавать себе оба спорщика, чтобы им было легче иметь дело с противоположной стороной. Однако, по моим наблюдениям, попытки провести с собеседником сеанс публичного психоанализа приведут к ухудшению диалога очень-очень быстро.

И всё-таки, у спорщиков должна быть возможность вежливо спросить: «Это ваша настоящая причина отказа?» — если существует какой-то продуктивный способ получить ответ на этот вопрос. Возможно, стоит ввести правило, которое допускает открытый вопрос: «Этот простой и прямолинейный довод — ваша настоящая причина отказа, или дело в ваших интуитивных ощущениях, или профессиональном взгляде на мир?» Более неудобные возможности лучше оставить на совести собеседника, это уже их область ответственности.

Перевод: 
Remlin, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
77
Оцените качество перевода: 
Средняя оценка: 4.5 (12 votes)

Связанные истины, заразная ложь

Элиезер Юдковский

Но идеальный аналитик мог бы пойти дальше: по одному-единственному предмету или живому существу он способен не только представить себе всю вселенную, но и ее развитие — от начала до самого конца
— Э.Э. Док Смит, «Первый Ленсмен»

Но стоит любому из вас сосредоточить свою мысль на одном-единственном факте или на каком-нибудь маленьком предмете, например, на камешке, на семени растения или на каком-нибудь крошечном живом существе, хотя бы на короткое время, как вы начнете постигать изреченную мной истину»
— Э.Э. Док Смит, «Серый Ленсмен»

Я обоснованно уверен, что отдельный камень, взятый с одного из пляжей Земли, не указывает на континенты и страны, политиков и людей этой Земли. Другие планеты во времени и пространстве, другие ветви Эверетта, сгенерировали бы тот же камень. С другой стороны, сущность единичного камня похоже включала бы наши законы физики. В этом смысле цельность нашей вселенной — все ветви Эверетта — можно было бы вывести из этого камня. (Если бы, как похоже и есть, не было бы по-настоящему свободных переменных)

Так что единичный камень, возможно, не заключает в себе всю Землю. Но единичный камень заключает в себе немало. Из изучения этого камня вы можете вывести законы физики и то, что из них следует. Размышляя об этих законах, вы можете увидеть, как будут формироваться планеты, и можете предположить, с какого вида планет этот камень. Внутренние кристаллическая и молекулярная структура камня формируются под воздействием гравитации, что расскажет вам о массе планеты; смесь элементов в камне даст вам возможность узнать больше о формировании планеты.

Я не геолог, так что не могу говорить точно, но легко представляю как показываю камень геологу и говорю: «Этот камень с пляжа в Халф Мун Бэй», — и мне тут же отвечают «Странно» или «Вы лжете». Возможно это не такой камень или он недостаточно округлый, чтобы быть с пляжа — я не знаю камни в достаточной мере, чтобы предположить связи и признаки, по которым меня можно было бы уличить.

«Только Бог может солгать абсолютно правдиво». Я думаю, была ли религия, которая изрекла пословицу? Я (фальсифицируемо) предположил бы, что нет: это мнение рационалиста, даже если вы изрекаете это в теологическом смысле. Слова «все связано со всем, потому что Бог создал весь мир и поддерживает его» могут генерировать некоторые хорошие теплые чувства во время проповеди, но не дадут вам особо много, если вы пытаетесь определить по камням с каких пляжей они взяты.

Монетка на Земле оказывает гравитационное ускорение на Луну порядка $4{,}5 \cdot 10^{-31} м/с^2$, так что в некотором смысле будет не слишком неправильно сказать, что любое событие связано со всеми прошлыми событиями. И поскольку выводы могут распространяться назад и вперед через причинные сети, эпистемологические сцепленности могут легко пересекать границы светового конуса. Но я бы не хотел быть астрономом-криминалистом, который смотрит на Луну и пытается по ней узнать, выпала ли монетка орлом или решкой — влияние меньше чем квантовая неопределенность или термальный шум.

Если вы скажете «Все сцеплено со всем» или «Все логически сцеплено и некоторые сцепленности намного сильнее прочих», вы, возможно, по-настоящему мудры вместо Глубокой Мудрости.

Физически каждое событие в некотором смысле является суммой прошлого светового конуса, без границ или ограничений. Но список значимых сцепленностей куда короче и это дает вам нечто вроде сети. Это высокоуровневая систематичность, на которую я ссылаюсь, когда говорю о Великой Сети Причинности.

Я использую эти Заглавные Буквы по большей части в шутку; но если бы что-либо заслуживало бы Заглавных Букв, то, конечно, Великая Сеть Причинности венчала бы список.

— Что за запутанную сеть мы плетем, когда в первый раз практикуем обман, — сказал сэр Вальтер Скотт. Не вся ложь вырывается из-под контроля — мы не живем в настолько праведной вселенной. Но иногда происходит так, что некто лжет о факте и потом вынужден лгать о сцепленном факте, а потом еще об одном, который сцеплен с предыдущим:

— Ты где?

— Э, я в поездке по делам фирмы.

— Что за поездка?

— Не могу сказать, это частные переговоры с важным клиентом.

— Ух ты, они допустили тебя к таким переговорам? Отличные новости! Я должен позвонить твоему шефу и поблагодарить его за это.

— Жаль, но его сейчас нет в офисе…

Люди не боги и часто им не удается представить все факты, которые им понадобится исказить, чтобы получить правдоподобную ложь. «Бог сделал меня беременной» звучало бы правдоподобней в старые времена, когда наши модели мира еще не содержали сведений об Y-хромосомах. Многие подобные факты лжи сегодня могут не выдерживать проверки, когда генетические проверки стали распространенными. Насильников заключают под стражу, ложные обвинения раскрываются, годы спустя, на основании тех свидетельств, о которых они и не думали. Студент, изучающий эволюционную биологию может видеть почерк естественного отбора в каждом волке, который преследует зайца; и каждом зайце, который убегает; и каждой пчеле, которая жалит, вместо того, чтобы вежливо предупреждать — но уловки креационистов для самих креационистов звучат убедительно, я уверен.

Не вся ложь раскрывается, не все лжецы бывают наказаны; мы не живем в настолько праведной вселенной. Но не вся ложь так безопасна, как полагают лжецы. Как много грехов станут известны Байесовскому сверхинтеллекту, думаю я, если он проведет (не разрушив?) нанотехнологический скан всей Земли? Как минимум, вся ложь, для которой существует какое-либо свидетельство в любом мозгу. Некоторая такая ложь может раскрыться раньше других, если нейробиологи преуспеют в создании по-настоящему хорошего детектора лжи через моделирование мозга. Пол Экман (пионер в области изучения микродвижений лицевых мускулов) пожалуй сможет раскрыть немалую долю мировой лжи, если у него будет возможность.

Не вся ложь раскрывается, не все лжецы бывают наказаны. Но Великая Сеть обычно недооценивается. Просто знание, которое люди уже накопили, заняло бы много человеческих жизней, чтобы быть изученным. Любой, кто думает, что не являющийся Богом, может солгать идеально без всякого риска, недооценивает сцепленность Великой Сети.

Честность — лучшая политика? Не знаю, так ли это: даже моя этика иногда молчит. Но по сравнению с прямой ложью, честность или молчание вовлекают меньше рекурсивно распространяющихся рисков, которые вы берете, даже не зная этого.

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
78
Оцените качество перевода: 
Средняя оценка: 4.5 (13 votes)

О лжи и Черных Лебедях

Элиезер Юдковский

Судья Маркус Эйнфелд, 70 лет, Королевский адвокат с 1977 года, Живое Достояние Австралии 1997 года, лауреат премии мира ООН 2002 года, президент-основатель австралийской комиссии по правам человека и равным возможостям, ушедший на пенсию несколько лет назад, но регулярно привлекаемый для участия в особо важных делах…

был осужден на два года тюрьмы за серию попыток исказить ход судебного процесса и дачу ложных показаний, которая началась с попытки избежать штрафа в 36 фунтов за превышение скорости на 6 миль в час.

В предыдущем эссе изложена морализаторски звучащая теория о честных людях, которые не умеют лгать, о том, что все поступки оставляют где-нибудь следы, и о том, что ложь иногда заканчивается «Чёрным лебедем» в виде грандиозного провала. И в реальной жизни в самом деле случаются истории, которые этой теории соответствуют. Хотя из-за избирательного восприятия мы слышим только о таких громких, как история про Маркуса Эйнфелда.

Перевод: 
Remlin, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
79
Оцените качество перевода: 
Средняя оценка: 5 (8 votes)

Эпистемология темной стороны

Элиезер Юдковский

Если вы солжете однажды, правда навсегда станет вашим врагом.

Я ранее говорил об этом, что истина сцеплена, а ложь заразна. Если вы возьмете камень с дороги и скажете геологу, что нашли его на пляже — ну, знаете ли вы о том, что известно геологу? Я нет. Но могу подозревать, что обточенный водой камень не выглядит похожим на каплю застывшей лавы от извержения вулкана. Знаете ли вы откуда камень с вашей дороги взялся на самом деле? Вещи несут отметки от своих мест во вселенной, где действуют законы; в этой сети нет места лжи. (поправка: геологи в комментариях говорят, что большинство камней на дорогах родом с пляжей, так что они бы не смогли сказать, пляжный ли это камень или дорожный, однако распознали бы разницу между обычным камнем и взятым с дороги/пляжа. Наглядный пример…)

То, что звучит обыденной истиной для одного разума — что легко заменяется правдоподобной ложью — может быть связано десятками связей в глазах большего знания. Для креациониста, идея, что жизнь была кем-то создана, а не появилась в результате естественного отбора, может быть чем-то наподобие спортивной команды, за которую нужно болеть. Но с точки зрения биолога, чтобы правдоподобно солгать о том, что организм был сознательно кем-то разработан, придется лгать почти обо всех чертах организма. Чтобы правдоподобно солгать, что «людей» создал некто разумный, вам придется лгать о строении сетчатки, архитектуре мозга, белках, склеиваемых вместе слабыми силами Ван-дер-Ваальса, вместо сильных ковалентных связей…

Ну или вы можете просто солгать об эволюционной теории, что и является путем, который избирают большинство креационистов. Вместо того, чтобы лгать об отдельных узлах, которые связаны друг с другом, они лгут об общих законах, управляющих связями.

А чтобы прикрыть это, они лгут о правилах науки — наподобие того, что означает термин «теория» или что значат слова ученого о том, что он уверен не полностью.

Так они переходят от лжи про конкретные факты ко лжи про общие законы, а потом ко лжи про правила мышления. Чтобы лгать о том, эволюционируют ли люди, вы должны лгать об эволюции; а потом вам придется лгать о правилах науки, которая ограничивает наше понимание эволюции.

Но как еще? Точно так же, если бы человек принадлежал к созданным формам жизни, вам бы пришлось лгать о законах эволюции, чтобы сделать правдоподобным его появление; и точно так же креационистские убеждения сами по себе отделены от науки — вы не найдете в хорошо организованном разуме таких убеждений больше, чем пальм на леднике. И тогда вам приходится нарушать барьеры, которые ограничивают их появление.

Что приводит нас к случаю самообмана.

Единичная ложь, которую вы говорите себе, может показаться достаточно правдоподобной, когда вы не знаете правил мышления или даже о существовании таких правил; выбор кажется таким же оправданным, как выбор мороженого и отдельным от всего остального, как камень на пляже…

…а потом кто-то спрашивает о вашем убеждении, используя правила мышления, которые они изучали. Они спрашивают «А где свидетельства?»

И вы отвечаете «Что? Зачем мне свидетельство?»

Вам говорят «В общем, для убеждения требуется свидетельство.»

Этот аргумент, очевидно, солдат, сражающийся на другой стороне, которого вы должны победить. Так что вы возражаете: «Я не согласен! Не все убеждения требуют свидетельств. В частности, убеждения о драконах не требуют свидетельств. Когда речь заходит о драконах, можно верить во что хочется. Так что мне не нужны свидетельства, что у меня в гараже есть дракон.»

На что следует: «Э? Вы не можете просто исключить драконов таким образом. Есть причина для данного правила, что убеждение требует свидетельств. Чтобы нарисовать верную карту города, вы должны пройти по улицам и провести линии на бумаге, которые отразят то, что вы видите. Это не взятое просто так требование — если вы сидите у себя в комнате и рисуете случайные линии, карта будет неправильна. С невероятно высокой вероятностью. Точно так же как карта о драконах или о чем угодно.»

Теперь в качестве солдата другой стороны выступает объяснение почему убеждение требует свидетельств. И вы продолжаете: «Неправильна с невероятно высокой вероятностью? Но ведь шанс-то еще остается, а? Я не должен верить в нечто, что не является до конца определенным.»

Или возможно вы даже начинаете подозревать, сами, что «убеждения требуют свидетельств.» Но это угрожает той лжи, за которую вы цепляетесь; так что глубоко внутри себя вы отказываетесь от этого подозрения, словно бы заталкивая солнце обратно за горизонт.

Или же вы ранее уже слышали слова «убеждения требуют свидетельств» и это звучало достаточно мудро, чтобы повторить это на публике. Но вы никогда не использовали ее на себе, пока кто-то не предложил вам применить ее к вашему убеждению, что в вашем гараже есть дракон. Так что вы быстро думаете и выпаливаете «Дракон является отдельным магистерием

Иметь ложные убеждения плохо, но это не наносит постоянного вреда — если, когда вы обнаруживаете вашу ошибку, вы исправляете ее. Опасно иметь ложное убеждение, если вы верите, что его нужно защищать в качестве убеждения — вера в убеждение, которая может сопровождаться (а может и нет) настоящим убеждением.

Единичная ложь, Которая Должна Быть Защищена, может блокировать чей-либо прогресс в продвинутой рациональности. Нет, это не безвредное удовольствие.

В мире, связанном куда в большей степени, чем это кажется на первый взгляд, существуют правила мышления, которые ограничивают убеждения сильнее, чем может подозревать непосвященный. Мир переплетен тесно и управляем общими законами, равно как и рациональные убеждения.

Подумайте, какова будет цена за отрицание эволюции или гелиоцентризма — все соединенные истины и управляющие законы, которые вам не позволено будет знать. Тогда вы можете понять, как единичный акт самообмана может блокировать целый мета-уровень поиска истины, как только ваш разум начинает бояться видеть связи. Запрещая все средние и высшие уровни рационального Искусства. Создавая на его месте громадный комплекс антизаконов, правил антимышления, общих оправданий для веры в неистинное.

Стивен Каас сказал: «Продвигать менее чем максимально точные убеждения — акт саботажа. Не делайте этого ни с кем, пока заодно не проколете им покрышки.» Давать кому-то ложное убеждение для защиты — убеждать их что убеждение само по себе должно быть защищено от любой мысли, которая угрожает ему — ну, вы не должны делать это ни с кем, пока заодно не делаете ему фронтальную лоботомию.

Как только вы солжете, правда становится вашим врагом; и каждая истина соединенная с этой и каждый союзник истины в общем; всему этому вы должны противостоять, чтобы защитить ложь. Лжете ли вы другим или себе.

Вы должны отрицать, что убеждения требуют свидетельств, после чего вам приходится отрицать, что карты должны отображать территорию, а затем — что истина это хорошо…

И так происходит переход на Темную Сторону.

Меня волнует то, что люди не знают об этом или знают в недостаточной степени — что если бы мы шли через человеческий мир, мы могли бы ожидать систематически встречать плохую эпистемологию.

Мемы о том, как мыслить, плавают вокруг, кэшированные мысли Глубокой Мудрости — некоторые из них будут хорошим советом, изобретенным рационалистами. Но другие изобретались для защиты лжи или самообмана: они происходят с Темной Стороны.

«У каждого есть право на свое мнение». Когда вы думаете об этом, откуда пошла эта поговорка? Это нечто, что кто-то мог бы сказать защищая истину или чтобы защититься от истины? Но люди не встрепенулись и не сказали «Ага! Я ощущаю присутствие Темной Стороны!» Насколько я могу сказать, не особо широко распространено понимание, что Темная Сторона вообще существует.

Но как еще? Обманываете ли вы других или только себя, Ложь Которую Нужно Защищать будет распространяться рекурсивно через сеть эмпирической причинности и сеть общих эмпирических правил и правил мышления как таковых и понимания того, что лежит за этими правилами. Если в мире есть хорошая эпистемология и ложь или самообман, которые люди пытаются защитить, то тогда появляется плохая эпистемология в противовес хорошей. Едва ли можно ожидать обнаружить в нашем мире, что есть Светлая Сторона и нет Темной; есть Солнце и то, что заслоняет его и создает маскирующую Тень.

Не подумайте, для этого вовсе не обязательно, чтобы люди были злыми. Большая часть тех, кто повторяет Глубокую Мудрость, в большей степени обманывают себя, нежели других, в большей части одурачены, чем лицемерны. Думаю так.

И конечно же моим намерением не было дать вам Полностью Универсальный Контраргумент, чтобы если кто-то предлагает вам какую-то эпистемологию, которая вам не нравится, вы бы говорили: «О, кто-то еще пал на Темную Сторону.» Одним из правил Светлой Стороны является то, что вы должны опровергать само положение, а не обвинять его изобретателя в плохих намерениях.

Но Темная Сторона существует. И страх является тем путем, что ведет к ней и единственное предательство заставит вас свернуть на него. Не все, кто носит робы являются Джедаями или их подражателями; еще есть Лорды-Ситхи, мастера и их непреднамеренные ученики. Будьте осведомлены и осторожны.

Что же касается списка распространенных убеждений, порожденных Темной Стороной — не случайных ложных убеждений, не подумайте, а именно плохой эпистемологии, Общих Защит Лжи — ну, не могли бы взять этот удар на себя, дорогие читатели?

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
80
Оцените качество перевода: 
Средняя оценка: 4.8 (16 votes)

Против двоемыслия

Эта короткая цепочка исследует ещё один шаблон мышления, мешающий нам менять свои убеждения на основании свидетельств. Речь пойдёт о «двоемыслии» по Джорджу Оруэллу: попытках обмануть самого себя.

Примечание редактора сайта: при переиздании книги в 2018 году эта цепочка была удалена (за исключением первого эссе «Единомыслие», которое было перенесено в цепочку «Умение отпускать»).

Автор: 
Элиезер Юдковский

Единомыслие

Элиезер Юдковский

Я отчетливо помню тот момент, когда начал свой путь рационалиста.

Нет, не читая «Вы, конечно, шутите, мистер Фейнман!» или любую другую работу о рациональности; их я просто воспринял как очевидные. Путь рационалиста начинается, когда видишь огромный пробел в своих умениях и ощущаешь стимул их улучшить, чтобы создать новые навыки, выходящие за пределы тех полезных, но уже недостаточных вещей, которые можно почерпнуть из книг.

В последние моменты первого периода моей жизни (мне стукнуло пятнадцать) я самодовольно перебирал приятные воспоминания о том времени, когда был намного младше. Воспоминания о том периоде расплывчаты: мысленный образ есть, но сколько точно мне было лет, не скажу. Думаю, шесть или семь. Исходное событие произошло в летнем лагере.

Наш вожатый, парень-подросток, собрал нас, детей намного младше его, построил друг за другом и предложил следующую игру: мальчик, стоящий в конце колонны, должен был ползти у нас между ног, а мы бы шлепали его, когда он проползал под нами, потом наступала очередь следующего мальчика и т.д. (Возможно, я потерял бы при этом всего лишь детскую наивность, но я не мог перестать об этом думать…) Я отказался играть в игру, и меня поставили в угол.

Эта память — об отказе шлепать и быть отшлепанным — символизировала для меня то, что даже в раннем возрасте я не хотел получать удовольствие от причинения боли другим. Я не обменял бы шлепок другому на шлепок по мне; не оплатил бы болью возможность причинить боль другому. Я отказался играть в игру с отрицательной суммой.

Но потом, в пятнадцать, я внезапно понял, что данное воспоминание было неправдой. Я отказался не потому, что был принципиальным противником игр с отрицательной суммой. Я узнал о дилемме заключенного рано, но не в семь же лет. Я отказался просто потому, что не хотел, чтобы мне было больно. Постоять в углу было приемлемой платой за то, чтобы избежать боли.

Более важным было то, что я понял, что всегда знал это: настоящая память всегда была в каком-то из уголков моего сознания, мой ментальный взгляд задерживался на ней на долю секунды, а затем отворачивался.

На самом первом шаге по Пути я поймал то ощущение, сделав общий вывод из субъективного опыта, и сказал: «Так вот что чувствуешь, когда пытаешься запихнуть нежелательную правду на задворки сознания! Теперь я буду обращать на это внимание всякий раз и вычищу все уголки памяти!».

Эту дисциплину я назвал единомыслием по аналогии с оруэлловским двоемыслием. В двоемыслии вы забываете, а потом забываете о факте забывания. В единомыслии вы замечаете, что что-то забыли, а потом вспоминаете. Вы придерживаетесь единственной непротиворечивой мысли за раз.

«Единомыслие» было первым рациональным навыком, который я создал, а не вычитал в книгах. Не думаю, что был первым в смысле академического приоритета, но этого, к счастью, и не требовалось.

И да, в пятнадцать лет я любил давать вещам имена.

Конца-краю ужасающим глубинам предвзятости подтверждения не видно. Они не бесконечны, ибо сложность нашего мозга конечна, но достаточно велики, чтобы погружение в них показалось вечностью. Вы продолжаете обнаруживать всё новые механизмы (или читать о них), при помощи которых мозг прячет неудобные вещи в укромные уголки.

Но я, будучи юным, вымел несколько таких уголков своей первой метлой.

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
81
Оцените качество перевода: 
Средняя оценка: 4.6 (13 votes)

Двоемыслие (выбирая быть искаженным)

Элиезер Юдковский

В руке у О’Брайена появилась газетная вырезка. Секунд пять она находилась перед глазами Уинстона. Это была фотография — и не приходилось сомневаться, какая именно. Та самая. Джонс, Аронсон и Резерфорд на партийных торжествах в Нью-Йорке — тот снимок, который он случайно получил одиннадцать лет назад и сразу уничтожил. Одно мгновение он был перед глазами Уинстона, а потом его не стало. Но он видел снимок, несомненно, видел! Отчаянным, мучительным усилием Уинстон попытался оторвать спину от койки. Но не мог сдвинуться ни на сантиметр, ни в какую сторону. На миг он даже забыл о шкале. Сейчас он хотел одного: снова подержать фотографию в руке, хотя бы разглядеть ее.

— Она существует! — крикнул он.

— Нет, — сказал О’Брайен.

Он отошел.

В стене напротив было гнездо памяти. О’Брайен поднял проволочное забрало. Невидимый легкий клочок бумаги уносился прочь с потоком теплого воздуха: он исчезал в ярком пламени. О’Брайен отвернулся от стены.

— Пепел, — сказал он. — Да и пепла не разглядишь. Прах. Фотография не существует. Никогда не существовала.

— Но она существовала! Существует! Она существует в памяти. Я ее помню. Вы ее помните.

— Я ее не помню, — сказал О’Брайен.

Уинстон ощутил пустоту в груди. Это — двоемыслие. Им овладело чувство смертельной беспомощности. Если бы он был уверен, что О’Брайен солгал, это не казалось бы таким важным. Но очень может быть, что О’Брайен в самом деле забыл фотографию. А если так, то он уже забыл и то, как отрицал, что ее помнит, и что это забыл — тоже забыл. Можно ли быть уверенным, что это просто фокусы? А вдруг такой безумный вывих в мозгах на самом деле происходит? — вот что приводило Уинстона в отчаяние.

Джордж Оруэлл, «1984» (перевод В. П. Голышева)

Что, если самообман помогает нам быть счастливыми? Что, если избегание и преодоление искажений делает нас наоборот - несчастными? Конечно, настоящая мудрость была бы рациональностью второго порядка, когда можно было выбирать когда быть рациональным. Тогда вы могли бы решать, какие когнитивные искажения должны управлять вами, для максимизации своего счастья.

Даже если оставить в стороне моральный аспект, я сомневаюсь, что такой безумный вывих в мозгах мог бы на самом деле произойти.

Рациональность второго порядка подразумевает, что в некоторый момент вы должны подумать: «А теперь я, чтобы сделаться счастливым, иррационально поверю, что выиграю в лотерею». Но у нас нет такого прямого контроля над нашими убеждениями. Вы не можете заставить себя поверить в то, что небо зеленое, усилием воли. Вы могли бы поверить, что верите, однако я только что усложнил вам задачу, указав на различие (всегда пожалуйста!). Вы даже можете верить, что счастливы и что обманули себя; но на самом деле не будете счастливы и самообмануты.

Чтобы рациональность второго порядка была подлинно рациональной, сначала потребовалась бы хорошая модель реальности для экстраполяции последствий рациональности и иррациональности. Если потом вы выберете иррациональности первого порядка, то вам понадобиться забыть эту точную картину мира. А затем забыть сам акт забывания. Я не подвержен логическому заблуждению обобщения на основе вымышленного свидетельства, но думаю, что Оруэлл проделал хорошую работу по экстраполяции того, куда ведет этот путь.

Вы не можете осознать последствия пребывания под властью искажений, пока не сумеете выйти из-под нее. А тогда будет слишком поздно для самообмана.

Другая альтернатива — слепой выбор, при котором вы придерживаетесь искажений без ясного представления о последствиях. Но это не рациональность второго порядка. Это упрямое пребывание в глупости.

Иррациональный оптимизм относительно своих водительских навыков позволит вам быть беспечно счастливым там, где других прошибет пот от страха. Вам не придется терпеть неудобство ремня безопасности. Вы будете беспечно счастливым день, неделю, год. А потом БАХ! И остаток жизни будете изнывать от желания почесать фантомную конечность. Или будете парализованы ниже шеи. Или мертвы. Необязательно случится так, но эта ситуация возможна, вопрос в том, насколько она вероятна? Вы не можете ответить на этот вопрос рационально, пока не узнаете реальный уровень своих водительских навыков и не поймете, какой опасности себя подвергаете. Вы не можете ответить на этот вопрос рационально, пока не узнаете о таких искажениях, как отрицание вероятности.

Не имеет значения сколько дней пройдут в блаженном неведении, достаточно будет единичной ошибки, чтобы аннулировать человеческую жизнь, чтобы перевесить все монетки, собранные вами на рельсах глупости.

Один из ключевых советов, которые я даю целеустремленным рационалистам, заключается в следующем: «Не пытайтесь быть умными». И ещё: «Прислушивайтесь к этим тихим надоедливым сомнениям». Если вы что-то не знаете, тогда вы не знаете, что именно вы не знаете, как много вы не знаете и сколько вам на самом деле нужно узнать.

Не существует рациональности второго порядка. Есть только слепой прыжок, который может закончиться в яме с раскаленной лавой (а может и не закончиться). И если вы уже знаете о конечном пункте прыжка, уже поздно зажмуривать глаза.

Но люди пренебрегают этим, поскольку они не знают, чего они не знают. К неизвестным переменным, если неизвестно даже об их существовании, невозможно получить доступ. Люди не сосредотачиваются на пустой области карты, а просто считают ее соответствующей пустой территории. Когда они рассматривают возможность слепого прыжка, они ищут в памяти опасности и не обнаруживают на пустой карте ям с лавой. Так почему бы не прыгнуть?

Был там. Пробовал. Обжегся. Не пытайтесь быть умными.

Однажды в разговоре с подругой я поделился подозрениями о том, что счастье глупости сильно переоценено. Но она потрясла головой и серьезно сказала: «Нет, нет, совсем нет».

Возможно, существуют счастливые глупцы. Возможно, они счастливей вас. Жизнь несправедлива и нельзя стать счастливее, завидуя тому, чего у тебя нет. Подозреваю, что подавляющее большинство читателей блога «Overcoming Bias» не смогут достичь счастья глупости, даже если попытаются. Этот путь закрыт для вас. Вы никогда не сможете достичь нужной степени невежества, не сможете забыть что знаете, не можете перестать видеть то, что видите.

Счастье глупости закрыто для вас. Вы никогда его не получите без повреждения мозга и даже с ним скорее всего нет. Думаю, вам следует задаться вопросом, оптимально ли счастье глупости (если это наибольшее счастье, к которому может стремиться человек), но ответ на него не важен. Этот путь для вас закрыт, даже если он когда-нибудь появится.

Все, что вам теперь осталось, — это стремиться к тому счастью, которого может достичь рационалист. Я думаю, что в конечном счете оно может оказаться даже больше. Есть строго определенные пути и свободные пути; плато для отдыха и горы для преодоления; и если подъем занимает больше усилий, покоренная вершина оказывается более высокой.

Также в жизни есть нечто большее, чем счастье; и при принятии решений вы можете учитывать чужое, а не свое счастье.

Но это не имеет практического применения. Когда вы осознаете наличие выбора, выбора уже нет. Вы не можете перестать видеть то, что видите. Другой путь закрыт.

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
82
Оцените качество перевода: 
Средняя оценка: 4.8 (19 votes)

Серьёзно, я обманул себя

Элиезер Юдковский

Я недавно говорил с женщиной, которая… сложно описать что. Формально она ортодоксальная еврейка. Ещё она очень умна, знакома с некоторыми археологическими доказательствами, опровергающими её религию, а также стандартными поверхностными аргументами против иудаизма. Например, она знает, что Мордекай, Хаман и Вашти не были найдены в персидских исторических записях, зато в древней Персии существовала легенда о вавилонских богах Мардуке и Иштар и враждующих с ними эламских богах Хуммане и Вашти. Она знает это и тем не менее справляет Пурим. Наверное, она одна из тех умных, но религиозных людей, которые варятся в своих противоречиях, дёргаясь и выдумывая причины, пока изнанка их мозга не начинает выглядеть, как картина Эшера.

Большинство людей такого типа притворяются, что они слишком мудрые, чтобы говорить с атеистами, но она согласилась пообщаться со мной несколько часов. В результате я, наконец, понял по крайней мере ещё одну вещь о самообмане, которую я никогда раньше явно не высказывал, а именно, что не нужно действительно обманывать себя, пока ты веришь, что ты обманул сам себя. Назовём это «верой в самообман».

Когда эта женщина ходила в старшую школу, она считала себя атеисткой. Но потом она решила, что должна вести себя, будто верит в бога. Затем — говорила она убедительно — со временем, она действительно поверила в бога. Из того, что я понял, это абсолютная неправда. В течение нашего разговора она всё время повторяла, снова и снова: «Я верю в бога», — но ни разу: «Бог есть». Когда я её спросил, почему она верит, она ни разу не упомянула о последствиях существования бога, только о последствиях веры в бога. Никогда: «Бог поможет мне», — всегда: «Моя вера в бога поможет мне». Когда я ей явно сказал: «Если кто-то просто захочет узнать истину и посмотрит на нашу Вселенную, как она есть, он даже не рассмотрит бога как гипотезу», — она мгновенно согласилась.

Она не заставила себя на самом деле верить в бога или в истинность иудаизма. Даже не близко, как я смог заметить. С другой стороны, она действительно верит в то, что обманула себя. Так что хоть она не получает никакой пользы от веры в бога — потому что не верит в него — она честно полагает, что хитростью заставила себя верить в бога, и честно ожидает получить бонусы от такого самообмана, таким образом создавая эффект плацебо вместо настоящей религиозности.

Это объясняет, почему она так рвалась убедительно защищать мои скептические предположения о её вере в бога, ни разу при этом не сказав: «А, и кстати, бог на самом деле существует», — или хотя бы не показавшись действительно заинтересованной в этом утверждении.

Перевод: 
Siarshai
Номер в книге "Рациональность: от ИИ до зомби": 
83
Оцените качество перевода: 
Средняя оценка: 3.5 (29 votes)

Вера в самообман

Элиезер Юдковский

Я рассказывал о моём разговоре с формально ортодоксальной иудейкой, которая живо защищала утверждение, что она верит в бога, при этом не проявляя, собственно, веры в бога.

Задавая ей вопросы о плюсах, которые, как она думала, получала от веры, я познакомил её с литанией Тарского, которая на самом деле является бесконечным семейством литаний вида:

Если небо синее, я хочу верить, что «небо синее».

Если небо не синее, я хочу верить, что «небо не синее».

«Это не моя философия», — сказала она.

«Я и не предполагал этого», — я ответил. — «Я просто спрашиваю; предполагая, что бог не существует, и это известно, должна ли ты верить в бога?»

Она колебалась. Было видно, что она пытается действительно подумать об этом, что меня удивило.

«Ну это гипотетический вопрос…» — произнесла она медленно.

Тогда я подумал что ей должно быть сложно позволить себе визуализировать мир, где бога нет, из-за её привязанности к миру с существующим богом.

Сейчас же я подозреваю, что ей скорее было трудно уловить разницу между тем как выглядел мир с существующим и несуществующим богом, потому что все её мысли были о её вере в бога, но причинно-следственный блок в её мозге не содержал узла «бог». Так что она могла легко ответить на вопрос: «Как бы выглядел мир, если бы ты не верила в бога», — но не на вопрос: «Как бы выглядел мир, если бы в нём не было бога?»

Она не ответила на этот вопрос в тот раз. Зато она предложила контрпример к литании Тарского:

Она сказала: «Я верю, что люди добрее, чем они есть».

Я попытался объяснить ей, что если она говорит: «Люди злые», — это на самом деле означает, что она верит, что люди злые, а если она говорит: «Я верю, что люди добрые», — это показывает, что она верит, что она верит, что люди добрые. Отсюда выходит, что «Люди злые, но я верю, что люди добрые» переводится как «Я верю, что люди злые, но я верю, что я верю, что люди добрые».

Я процитировал:

«Если бы существовал глагол со значением „ложно верить“, он бы не имел осмысленного употребления от первого лица настоящего времени изъявительного наклонения», — Людвиг Витгенштейн.

Она ответила, улыбаясь: «Да, я действительно верю, что люди действительно добрее, чем они на самом деле являются. Я просто подумала, что так понятнее для тебя».

«Мне кажется Матушка Ветровоск должна хорошенько взглянуть на тебя, Уолтер», — сказала Нянюшка Ягг. — «Я думаю, что твой разум спутан, как клубок пряжи, который уронили», — Терри Пратчетт, «Маскарад».

И я могу даже явно напечатать мысль: «Ладно, предположим, что она не считает, что её размышления должны быть согласованы при их обдумывании», — но я до сих пор не могу уловить их смысл.

Я могу понять значение произносимых ею слов, но я не могу понять смысл на эмпатическом уровне. Я могу представить себя на месте детопожирающих пришельцев и Леди Кирицугу Третьей, но я не могу представить, каково быть ей. Или просто не хочу?

Вот почему сообразительные люди могут выдержать только конечное субъективное количество времени, затраченное на мысли о религии, перед тем как стать атеистами. После определённого порога, если ты умён, но, защищая свою религию, не избежал когтей эпистемологии Тёмной стороны, то твой разум станет похож на картину Эшера. (Один из немногих моментов, которые заставили её остановиться и подумать — упоминаю на случай, если вам подвернётся возможность использовать этот приём — это когда она говорила о том, как приятно верить, что кому-то не всё равно, хорошо или плохо ты поступаешь, вне зависимости правда это или нет — не выражая явно, существует ли в действительности бог, которому не всё равно, делаешь ли ты правильные вещи или нет (это не было частью её веры).

И я ответил: «Но мне не всё равно хорошо или плохо ты поступаешь. То есть ты говоришь, что это недостаточно, и тебе нужно знать, что есть сущность выше человечества, которой было бы это важно». Это остановило её на секунду, потому что, разумеется, она никогда не думала в этом ключе. Просто стандартный приём из нестандартного набора.

Позже в некоторый момент я спросил её, было бы хорошо делать что-то по-другому, если бы стало известно, что бога точно не существует, и в этот раз она ответила: «Нет».

«Итак», — скептически спросил я, — «существует бог или нет, это не оказывает абсолютно никакого эффекта на то, как следует вести себя людям? Я думаю, даже рабби бы отнёсся недоверчиво к такой точке зрения».

Её религия представляла собой одно лишь поклонение поклонению. Как раньше истинные верующие верили, что всевидящий отец всего живого спасёт их, так она верит, что вера в бога спасёт её.

После того как она сказала: «Я верю, что люди добрее, чем они есть», — я спросил: «Значит, ты постоянно удивляешься, когда люди не соответствуют твоим ожиданиям?» После длинной паузы, она медленно ответила: «Ну… удивлена ли я, когда люди… не соответствуют моим ожиданиям?»

Я не понял смысл этой паузы во время разговора. Я намеревался сказать, что если она постоянно разочаровывается реальностью, то это скорее всего просто недостаток неверных убеждений. Но вместо этого, мне показалось, её застал врасплох подтекст отсутствия у неё удивления.

Теперь я понимаю, что вся её философия зиждилась на вере, что она обманула себя, и возможность, что её настоящая оценка поведения людей была точной, угрожала эпистемологии Тёмной стороны, возведённой вокруг убеждений вроде «Я получаю пользу от веры, что люди добрее, чем они есть».

Она сняла старого идола с трона и заменила его явным поклонением тёмной эпистемологии, которую однажды изобрела, чтобы защищать идола; она поклоняется её же попытке самообмана. Попытка провалилась, но она честно не знает об этом.

Теперь образцовые стражники здравого смысла (девиз: «Обламываем вашу мелкую безумную братию со времён Эпикура») должные бороться ещё и активным поклонением самообману, поклонением предполагаемой пользе веры, вместо бога.

На самом деле это объясняет один факт обо мне самом, который я не совсем понимал ранее. Причина, по которой меня так раздражает, когда люди говорят, будто самообман — это просто, и почему я пишу целые эссе на тему, почему сделать мысленный выбор верить, что небо зелёное, и остаться без каши в голове сложнее, чем думают люди.

Потому что, хоть и нельзя просто так выбрать верить, что небо зелёное, если ты этого не сознаёшь, ты можешь на самом деле обмануть себя в том, что ты успешно обманул себя.

И раз уж ты искренне веришь, что получишь определённую пользу от самообмана, ты действительно получишь такой же плацебо-эффект, какой бы получил от успешного самообмана.

Так что когда я объяснял, насколько сложен самообман, я скорее критиковал плацебо-пользу, которую получали бы люди от веры в успешность этого действия, целясь в новый тип религии, который поклоняется поклонению богу.

Интересно, породит ли эта битва, новый список причин, почему не вера а вера в веру сама по себе - хорошая вещь? Почему люди выискивают великую пользу от почитания факта почитания определённой вещи? Придётся ли нам продолжать цепочку с верой в веру в веру и поклонением поклонению поклонению? Или разумные теисты не будут плодить сущности?

Хотел бы я верить, что никто не будет верить в веру в веру в веру, но аргумент мира зомби в философии ещё более запутанный чем это, и его сторонники всё ещё не забросили его.

Перевод: 
Siarshai, deep_blue_hex
Номер в книге "Рациональность: от ИИ до зомби": 
84
Оцените качество перевода: 
Средняя оценка: 4.3 (16 votes)

Парадокс Мура

Элиезер Юдковский

Парадокс Мура это стандартный термин для выражения «За окном идёт дождь, но я в это не верю». Снимаю шляпу перед painquale на MetaFilter.

Я думаю, я стал понимать парадокс Мура немного получше, после того как прочитал некоторые комментарии на Less Wrong. Jimrandomh подсказывает:

Многие люди не могут разделить разные уровни косвенности. Для них «Я верю в X» и «X» это одно и то же. Следовательно, причины, почему полезно верить в X, это те же причины, почему X - истина.

Я не думаю, что это правда. Сравнительно маленькие дети могут понять концепцию ложного убеждения, которая требует раздельных ментальных вёдер для карты и территории. Но эта мысль указывает в направлении похожей идеи:

Многие люди не могут сознательно различить веру во что-то и поддерживание чего-то.

В конце концов, «Я верю в демократию» в разговорной речи означает, что ты поддерживаешь концепцию демократии, а не веру в то, что демократия существует. Слово «вера», таким образом, имеет более одного значения. Может, запутанные слова порождают путаницу в мыслях, а может, они просто отображают уже существующую путаницу.

Отсюда, в исходном примере: «Я верю, что люди добрее, чем они есть», женщина, с которой я разговаривал, выдумала несколько причин, почему хорошо верить, что люди добрые - польза для психического здоровья и прочее - и так как эта мысль вызывала тёплый отклик в её сознании, она исследовала его и заключила:

«Я верю, что люди добрые». Таким образом, она перенесла положительное чувство, связанное с поддерживаемым убеждением, на сигналирование веры в это заявление. В то же время, сам окружающий мир выглядит, будто люди не такие уж добрые. Поэтому она сказала: «Я верю, что люди добрее, чем они есть».

И это граничит с честной ошибкой - или вроде того - так как обычно людей не учат явно определять, как это выглядит, когда они во что-то верят. Как в притче о драконе в гараже; человек, который говорит: «В моём гараже есть дракон, но он невидимый», - не понимает, что его ожидание не увидеть дракона показывает, что на самом деле он поддерживает (точную) модель мира без дракона в ней.

Не то чтобы люди тренируются распознавать, когда они во что-то верят.

Не то чтобы их кто-то учил в старшей школе: «Когда вы действительно верите во что-то - это утверждение в вашем активном наборе убеждений - это выглядит будто мир такой и есть. Вы должны распознавать это чувство, которое и есть настоящее (без кавычек) убеждение, и отделять его от приятных ощущений от веры во что-то, которую вы распознаёте как веру во что-то; это есть просто „вера“ (с кавычками)». Такой подход к обучению позволил бы сделать пример парадокса Мура из жизни намного менее философски чуждым, и дало бы ещё один механизм при помощи которого люди могли бы быть одновременно и правы и неправы.

Как Kurige, который писал:

Я верю, что существует бог, и что он вселил в нас чувство правильного и неправильного, с помощью которого мы можем оценивать мир вокруг нас. Также я верю, что чувство морали было эволюционно запрограммировано в нас - чувство морали, которое скорее всего стало результатом метаполитических игр в популяциях бонобо много-много лет назад.

Эти два убеждения не противоречат друг другу, но сложно сшить их в одну философию.

Подозреваю, Kurige решил, что у него есть причины поддерживать убеждение, что бог внушил нам внутреннее чувство добра и зла. А также, что он должен следовать вердикту науки. И научное и религиозное сообщества кажутся весьма достойными, правда? Есть же плюсы в каждом наборе убеждений? При рефлексии можно обнаружить, что и то и другое даёт положительные эмоции?

Но он не сказал: «Бог вселил в нас чувство правильного и неправильного, а чувство морали было эволюционно запрограммировано в нас. Оба состояния реальности одновременно нестабильны, сложно их сочетать».

Если ты читаешь это, Kurige, попробуй быстро сказать эту фразу вслух, чтобы заметить, что её немного сложнее проглотить. Заметь субъективную разницу до того как займёшься рационализацией.

Это и есть субъективная разница между «иметь причины поддерживать обе точки зрения» и «иметь в мыслях единую модель мира».

Перевод: 
Siarshai
Номер в книге "Рациональность: от ИИ до зомби": 
85
Оцените качество перевода: 
Средняя оценка: 4.7 (14 votes)

Не верь, что самообман удался

Элиезер Юдковский

Не хочу, чтобы показалось, будто я придираюсь к Kurige, но думаю, что следует ожидать определённого потока вопросов, если ты показываешься на Less Wrong и делаешь заявления вроде

Идея, которая позволила мне объяснить несоответствия, которые я чувствую, когда говорю с другими христианами — это мысль, что где-то на пути к моему текущему мировоззрению я сделал большой скачок от слепой веры к чему-то вроде Оруэлловского двоемыслия.

«Если ты знаешь, что это двоемыслие… как ты можешь всё ещё в него верить?» — не могу я не спросить.

Или:

я выбрал верить в существование бога — сознательно и преднамеренно. И это моё решение, как бы то ни было, не имеет абсолютно никакого эффекта на действительное существование бога.

Если ты знаешь, что твоё убеждение никак не коррелирует с реальностью, как ты всё ещё можешь его придерживаться?

Не должно ли осознание нутром «Стойте-ка, небо на самом деле не зелёное» сразу следовать за мыслью «Моя карта, утверждающая „небо зелёное“, не имеет никаких причин соответствовать территории»?

Ну… видимо нет.

По крайней мере частью этой загадки может быть моё объяснение парадокса Мура («На улице дождь, но я не верю в это») — что люди внутренне принимают положительные ассоциации, связанные с утверждением, за настоящую достоверность.

Но другая часть того, чем это просто могло быть (в противоположность негодованию, которое я изначально хотел сюда поместить) — действительная лёгкость застрять на шаге: «Карта, отражающая территорию, сказала бы „X“» — не перейдя к действительной убеждённости в „X“. Потребуется немного потрудиться, чтобы объяснить идеи о разуме как строителе картотерриториальных связей, и даже тогда, чтобы понять смысл нутром, может потребоваться больше работы.

Теперь я понимаю, что когда писал: «Вы не можете заставить себя верить, что небо синее, усилием воли», — я не был лишь беспристрастным обозревателем существующих фактов, а также пытался внушить самоисполняющееся пророчество.

Наверное, было бы мудрым решением повторять себе: «Я не смогу безнаказанно пользоваться двоемыслием! Глубоко внутри, я знаю, что это неправда! Если я узнаю, что у моей карты нет причин коррелировать с территорией, я не буду верить ей!»

Потому что так — если когда-нибудь появится соблазн попытаться обмануть себя — мысли «Но я же знаю, что это не правда!» и «Я не могу обмануть себя!» будут постоянно приходить на ум, и вы в самом деле с меньшей вероятностью преуспеете в самообмане. Вы с большей вероятностью поймёте на уровне подсознания, что убеждение себя в X не сделает X истиной.

Если вы будете говорить себе, что не можете преднамеренно поверить, что небо зелёное, тогда вы с меньшей вероятностью обманете себя на том или ином уровне: на уровне действительной веры во что-то или попадания в ловушку парадокса Мура, веры в веру или веры в самообман.

Если вы будете повторять, что в глубине души вы будете знать правду…

Если вы будете повторять, что можете просто глядеть на хитро сконструированную ложную карту, и знать, что она ложная, не ожидая никакой корреляции с территорией, и следовательно, не смотря на всю причудливость сооружения, не будете вкладывать в неё доверия…

Если вы будете повторять, что согласованность с реальным миром победит и не позволит вам верить в придуманные вещи на объектном уровне, как только вы придёте к мета-уровневому осознанию, что карта не отражает территорию, тогда положение дойдёт до критического момента и вы в самом деле можете не суметь с ним справиться.

Когда дело доходит до умышленного самообмана, вы должны верить в собственное неумение это делать!

Скажите себе, что попытка обречена — и она будет!

Это сила позитивного мышления или сила негативного мышления?

В любом случае, кажется, что это мудрая предосторожность.

Перевод: 
Siarshai, deep_blue_hex
Номер в книге "Рациональность: от ИИ до зомби": 
86
Оцените качество перевода: 
Средняя оценка: 3.9 (20 votes)

Свежий взгляд на вещи

В этой цепочке описывается, как можно заставить мозг действительно о чём-то задуматься, вместо того, чтобы остановиться на первой пришедшей в голову мысли.

Автор: 
Элиезер Юдковский

Якорение и корректировка

Элиезер Юдковский

Предположим, я у вас на глазах раскручиваю рулетку и выпадает число 65. После чего я спрашиваю: «Как вы думаете, процент африканских стран в ООН больше этого числа или меньше? Какова вообще доля африканских стран в ООН?» Попробуйте немного подумать над этими вопросами, только, пожалуйста, без Гугла.

А ещё попробуйте за 5 секунд примерно оценить результат следующего арифметического выражения. 5 секунд. Готовы? Внимание… время пошло!

$$ 1 \cdot 2 \cdot 3 \cdot 4 \cdot 5 \cdot 6 \cdot 7 \cdot 8 $$

Тверски и Канеман изучали, какие ответы дают люди в зависимости от того, какие числа они видят на рулетке1. Медианная оценка тех, у кого выпадало число 65, равнялась 45%. Для тех, у кого выпадало 10, медианная оценка равнялась 25%.

В настоящее время результаты этого эксперимента и ему подобных объясняются тем, что испытуемые берут начальное — неинформативное — число в качестве стартовой точки (или «якоря»), а затем корректируются в большую или меньшую сторону, пока не получат ответ, который будет «звучать правдоподобно». На этом корректировка заканчивается. Обычно люди корректируются недостаточно — более удалённые от «якоря» числа тоже могут выглядеть «правдоподобно», но люди останавливаются на первом ответе, который кажется удовлетворительным.

Аналогично, у студентов, которым показали произведение $ 1 \cdot 2 \cdot 3 \cdot 4 \cdot 5 \cdot 6 \cdot 7 \cdot 8 $, медианной оценкой было 512, а у студентов, которым показали произведение $ 8 \cdot 7 \cdot 6 \cdot 5 \cdot 4 \cdot 3 \cdot 2 \cdot 1 $, медианная оценка равнялась 2250. Это объясняется гипотезой, что студенты пытались перемножать (или прикидывать) результаты произведения первых сомножителей, а затем корректировались в большую сторону. В обоих случаях корректировка оказалась недостаточной — верный ответ равен 40320. Но ответы первой группы оказались хуже, потому что они отталкивались от меньшего «якоря».

Тверски и Канеман утверждают, что, даже когда людям предлагают награду за большую точность, эффект якорения не уменьшается.

Страк и Муссвайлер задавали людям вопрос, в каком году Эйнштейн в первый раз посетил США2. Обнаружилось, что совершенно неправдоподобные якоря, такие как 1215 или 1992, дают такой же эффект, как и более правдоподобные, такие как 1905 или 1939.

Эффект якорения часто используется при обсуждении заработной платы и при покупке машины. Я не призываю вас самих им пользоваться, но рекомендую следить, чтобы его не использовали против вас.

И главное: наблюдайте за своими мыслями, старайтесь замечать, когда вы корректируетесь в поисках ответа.

Способов противодействия якорению с доказанной эффективностью пока не обнаружено. Я бы предложил использовать следующие два. Во-первых, если первоначальное предположение выглядит неправдоподобным, попытайтесь полностью его отбросить и получить новую оценку, а не корректируйтесь относительно «якоря». Однако, этого может быть недостаточно — когда испытуемым говорили избегать якорения, судя по всему, это им не удавалось3. Поэтому, во-вторых, даже когда вы используете первый метод, пытайтесь также придумать «якорь» с противоположной стороны — «якорь», который явно слишком мал или слишком велик (в зависимости от того, велик или мал изначальный «якорь») — и немного подумайте о нём.

  • 1. Amos Tversky and Daniel Kahneman, «Judgment Under Uncertainty: Heuristics and Biases», Science 185, no. 4157 (1974): 1124–1131, doi:10.1126/science.185.4157.1124.
  • 2. Fritz Strack and Thomas Mussweiler, «Explaining the Enigmatic Anchoring Effect: Mechanisms of Selective Accessibility», Journal of Personality and Social Psychology 73, no. 3 (1997): 437–446.
  • 3. George A. Quattrone et al., «Explorations in Anchoring: The Effects of Prior Range, Anchor Extremity, and Suggestive Hints» (Unpublished manuscript, Stanford University, 1981).
Перевод: 
Remlin, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
87
Оцените качество перевода: 
Средняя оценка: 5 (11 votes)

Прайминг и контаминация

Элиезер Юдковский

Предположим, вы просите людей нажимать одну клавишу, если строка из букв представляет собой слово, и другую клавишу, если строка не является словом (например, «вывеска» и «выверк»). Потом вы показываете им слово «вода». После этого люди опознают строку «пить» как слово гораздо быстрее. Это явление известно как «когнитивный прайминг». Конкретно эту форму можно назвать «семантический прайминг» или «концептуальный прайминг».1

Самое интересное в прайминге — это то, что он работает на очень низком уровне. Прайминг ускоряет идентификацию букв как слова, при том, что естественно было бы ожидать, что человек сначала опознаёт буквы как слово, а только потом понимает смысл этого слова.

Прайминг также показывает масштабность процесса параллельно активирующихся цепочек ассоциативных связей. Если при виде слова «вода» активируется слово «пить», то, скорее всего, активируются и слова «река», «чашка», «всплеск»… И эта активация распространяется через семантическую связь концептов, действуя начиная с распознавания строчек из букв.

Прайминг происходит подсознательно и его невозможно остановить, это артефакт человеческой нейронной архитектуры. Пытаться остановить прайминг у себя всё равно что пытаться остановить активацию собственных нейронных цепей. Попробуйте вслух произнести цвет — не значение, а именно цвет — следующего набора букв:

Зелёный

В исследовании Массвайлера и Страка испытуемым задавали вопрос (подразумевавший якорение): «Ежегодная средняя температура в Германии выше или ниже 5 градусов/20 градусов?»2 В дальнейшем, при выполнении задачи на распознание слов, описанной выше, испытуемые, которым задавали вопрос, где фигурировало «5 градусов», быстрее опознавали слова наподобие «холодно» или «снег», а те, кто отвечал на формулировку с 20 градусами, быстрее узнавали «тепло» и «солнце». Это показывает некорректируемый при якорении механизм: прайминг сходных мыслей и воспоминаний.

Более общие результаты исследований прайминга показывают, что даже совершенно неинформативная, очевидная ложь или совершенно посторонняя «информация» могут влиять на оценки и решения. В области эвристик и искажений данное общее явление известно как контаминация.3

Ранние исследования в области эвристик и искажений продемонстрировали эффекты якорения. Например, испытуемые оценивали процент африканских стран в ООН ниже (выше), в зависимости от того, спрашивали ли их перед этим, больше или меньше ли этот процент, чем 10 (65). Этот эффект изначально объяснялся тем, что испытуемые брали «якорь» как стартовую точку, а потом корректировали свой ответ и прекращали корректировку сразу же, когда достигали какого-то правдоподобного значения — останавливались на одном из концов доверительного интервала.4

Судя по всему, ранняя гипотеза Тверски и Канемана верно объясняла явление в некоторых случаях, особенно когда испытуемые сами определяли начальные значения.5 Но, похоже, современные исследования показывают, что в большинстве случаев якорение вызывается контаминацией, а не недостаточной корректировкой. (Спасибо анонимному читателю за напоминание — много лет назад я читал статью Эпли и Гиловича, как главу в «Правилах и предубеждениях», но совершенно забыл о ней.)

Скорее всего, в супермаркете, куда вы ходите, есть раздражающие таблички, на которых написано: «не более 12 в одни руки» или «5 штук за 10$». Успешно ли эти таблички заставляют посетителей покупать больше? Вероятно, вы думаете, что на вас такие трюки не действуют. Но известно, что такие таблички работают — именно поэтому магазины их и используют.6

И всё же самое ужасное в контаминации — то, что она является ещё одним из тысячи обликов предвзятости подтверждения. Когда идея попадает человеку в голову, она влияет на всю связанную с ней информацию — и тем самым способствует своему дальнейшему существованию. Выработанное средой стремление побеждать в политических дебатах тут уже не важно. Предвзятость подтверждения напрямую встроена в наше «железо», ассоциативные сети влияют на все связанные мысли и воспоминания. Печальный побочный эффект нашей нейронной архитектуры.

Мимолётного образа может быть достаточно для быстрого распознавания связанных с ним слов. Этого уже хватит, чтобы запустить предвзятость подтверждения. Один миг - и нижняя строчка уже определена, поскольку мы меняем своё мнение реже чем нам кажется.

  • 1. Нобелевский лауреат публично признал ошибки — Прим.перев.
  • 2. Thomas Mussweiler and Fritz Strack, «Comparing Is Believing: A Selective Accessibility Model of Judgmental Anchoring», European Review of Social Psychology 10 (1 1999): 135–167, doi:10.1080/14792779943000044.
  • 3. Gretchen B. Chapman and Eric J. Johnson, «Incorporating the Irrelevant: Anchors in Judgments of Belief and Value», in Gilovich, Griffin, and Kahneman, Heuristics and Biases, 120–138.
  • 4. Tversky and Kahneman, «Judgment Under Uncertainty.»
  • 5. Nicholas Epley and Thomas Gilovich, «Putting Adjustment Back in the Anchoring and Adjustment Heuristic: Differential Processing of Self-Generated and Experimenter-Provided Anchors», Psychological Science 12 (5 2001): 391–396, doi:10.1111/1467-9280.00372.
  • 6. Brian Wansink, Robert J. Kent, and Stephen J. Hoch, «An Anchoring and Adjustment Model of Purchase Quantity Decisions», Journal of Marketing Research 35, no. 1 (1998): 71–81, http://www.jstor.org/stable/3151931 .
Перевод: 
Remlin, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
88
Оцените качество перевода: 
Средняя оценка: 5 (4 votes)

Мы верим всему, что нам говорят?

Элиезер Юдковский

В некоторых из ранних экспериментов по якорению и корректировке проверялось, ухудшится ли у испытуемых качество корректировки (и, как следствие, увеличится ли влияние «якоря»), если их отвлекать — например, испытуемых просили отыскивать среди многих цифр «пятёрку», обеспечивая тем самым им когнитивную «нагрузку». Судя по всему, большинство экспериментов подтвердили точку зрения, что когнитивная нагрузка усиливает эффект якорения и, в общем случае, контаминацию.

Когда Дэниэл Гилберт изучал накапливающиеся результаты экспериментов — всё больше и больше подтверждений контаминации, которую усиливала когнитивная нагрузка — ему пришла в голову поистине безумная гипотеза: Мы верим вообще всему, что нам говорят?

Естественно было бы предположить, что, когда мы слышим некое утверждение, мы сперва понимаем его суть, затем размышляем над ним, и в итоге принимаем его или отвергаем. Такая напрашивающаяся модель познавательного процесса предлагалась ещё Декартом. Но оппонент Декарта — Спиноза — возражал: по его мнению, мы в процессе понимания утверждения сперва пассивно принимаем его, и только затем активно отказываемся от утверждений, которые отвергаем в процессе размышлений.

На протяжении нескольких последних веков философы в основном придерживались точки зрения Декарта, поскольку она казалась, ну вы понимаете — более логичной и интуитивно понятной. Но Гилберт придумал способ экспериментально проверить гипотезы Декарта и Спинозы.

Если Декарт прав, то отвлечение испытуемых помешает им как принимать истинные утверждения, так и отвергать ложные. Если прав Спиноза, то отвлечение испытуемых приведёт к тому, что они будут чаще принимать ложные утверждения за истинные, но не станут чаще принимать истинные утверждения за ложные.

Исследование Гилберта, Крула и Мэлоуна подтвердило точку зрения Спинозы. Испытуемым показывали новые для них утверждения с пометками ИСТИННО или ЛОЖНО. В результате испытуемые примерно одинаково точно опознавали истинные утверждения (55% утверждений было опознано правильно, если испытуемых не отвлекали и 58%, если отвлекали). Однако, отвлечение влияло на идентификацию ложных (55% было опознано правильно, когда испытуемых не отвлекали, и 35%, когда отвлекали).1

Последующие эксперименты Гилбера, Тафароди и Мэлоуна2 дали ещё более поразительные результаты. Испытуемые зачитывали вслух с монитора отчёты о преступлениях. В тексте цветом помечалось, является ли конкретное утверждение истинным или ложным. Некоторые отчёты содержали ложные утверждения, усугубляющие тяжесть преступления, некоторые — ложные утверждения, смягчающие тяжесть преступления. Некоторым испытуемым во время чтения отчётов приходилось отвлекаться на строку цифр и выискивать в них цифру «5» — это было отвлечение для создания когнитивной нагрузки. В конце испытуемых просили дать рекомендацию, сколько лет тюрьмы следует назначить каждому преступнику (от 0 до 20 лет).

Испытуемые, которые действовали под когнитивной «нагрузкой» в среднем предлагали 11,15 лет заключения за преступления, описанные в отчётах с ложными отягчающими обстоятельствами. За преступления, описанные в отчётах с ложными смягчающими обстоятельствами, эти испытуемые в среднем предлагали 5,83 лет заключения. Разница оказалась почти двукратной, что, как вы можете догадаться, статистически значимо.

Контрольная группа действовала без когнитивной нагрузки — с теми же пометками и с той же бегущей строкой цифр, но им не нужно было искать цифру «5». Таким образом они могли уделить больше внимания «неправдоподобным» утверждениям, отмеченным как ложные. Участники из контрольной группы предлагали 7,03 лет заключения для преступников с ложными отягчающими обстоятельствами против 6,03 лет для преступников с ложными смягчающими обстоятельствами.

Статья Гилберта, Крула и Мэлоуна вышла под названием «Вы не можете не верить всему, что вы читаете».

Эти результаты наводят на мысль, что нам, как минимум, следует вести себя очень осторожно, когда нам попадается ненадёжная информация. Особенно, если в это время мы заняты чем-то ещё. Будьте бдительны, читая газеты в супермаркете.

P.S. Согласно непроверенным слухам, которые я просто выдумал, люди будут больше доверять написанному в этом эссе, поскольку для отвлечения внимания я использую здесь шрифт разных цветов.

  • 1. Daniel T. Gilbert, Douglas S. Krull, and Patrick S. Malone, «Unbelieving the Unbelievable: Some Problems in the Rejection of False Information», Journal of Personality and Social Psychology 59 (4 1990): 601–613, doi:10.1037/0022-3514.59.4.601.
  • 2. Gilbert, Tafarodi, and Malone, «You Can’t Not Believe Everything You Read».
Перевод: 
Remlin, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
89
Оцените качество перевода: 
Средняя оценка: 4.3 (15 votes)

Кешированные мысли

Элиезер Юдковский

Одна из величайших загадок человеческого мозга заключается в том, как он вообще может работать, если частота импульсации большинство нейронов составляет 10-20 раз в секунду, в лучшем случае 200 Гц. В нейронауках есть правило ста шагов, согласно которому любая теоретически допустимая операция должна занимать не более 100 последовательных шагов: вы можете сделать процессы обработки настолько параллельными, насколько вам хочется, но вы не можете задействовать в них больше 100 (а лучше меньше) нейронных импульсов, следующих подряд.

Можете ли вы вообразить программу, которая использует 100-герцовые процессоры, независимо от имеющегося их количества? Чтобы сделать в реальном времени хоть что-нибудь, понадобится сто миллиардов процессоров.

Если нужно написать действующие в реальном времени программы для сотни миллиардов 100-герцовых процессоров, можно использовать такой трюк, как кеширование. Суть его следующая: вы сохраняете результаты предыдущих операций и в следующий раз обращаетесь сразу к ним, а не вычисляете с нуля. И это весьма характерно для работы мозга, заключающейся в распознавании, поиске ассоциаций, выборе шаблона.

Разумно предположить, что большая часть когнитивных процессов у человека представляет собой поиск в кеше.

Данная мысль мелькает в моем мозгу время от времени.

Есть очень показательная история, которую я вроде бы сохранил в закладках, но потом не смог найти — это рассказ о человеке, чей сосед-всезнайка однажды мимоходом заметил, что легче всего убрать дымовую трубу из дома так: выломать топку, подождать пока труба опустится ниже, убрать видимый ее кусок, подождать пока она опустится еще и так далее, пока вся труба не будет убрана. Годы спустя, когда тот человек хотел убрать дымовую трубу из своего дома, эта кешированная мысль всплыла в его сознании…

Как рассказывал этот человек уже потом — как можно догадаться, дело отнюдь не заладилось — его сосед не особенно хорошо разбирался в этой сфере и не был надежным источником. Если б герой нашей истории подверг ту идею сомнению, он скорее всего понял, что она неудачна. Некоторые кешированные результаты все же лучше вычислять заново. Но мозг следует шаблону автоматически: если вы не осознаете, что шаблон нуждается в исправлении, вы так и продолжите действовать по прежнему шаблону.

Я подозреваю, что если бы та мысль пришла к человеку самостоятельно — если бы он сам додумался до той идеи о том, как убрать дымоход — он бы отнесся к ней более критически. Но если кто-то уже обдумал идею со всех сторон, вы можете сэкономить свои вычислительные ресурсы, просто кешировав результат — так?

Никто не может думать достаточно быстро, чтобы использовать исключительно свои собственные мысли, особенно в условиях современной цивилизации. Если бы меня в младенчестве бросили в лесу, где меня воспитали бы волки либо бессловесные роботы, во мне едва ли можно было бы узнать человека. Никто не может думать достаточно быстро, чтобы за одну жизнь кратко воссоздать мудрость племени охотников-собирателей, начиная с самого нуля. И уж подавно это невозможно для мудрости цивилизации, овладевшей письменностью.

С другой стороны, я постоянно вижу поборников критического мышления, которые при этом повторяют кешированные мысли, придуманные теми, кто думает отнюдь не критично.

Хорошим примером будет скептик, который согласен с невозможностью доказать или опровергнуть религию фактическим свидетельством. Как я уже отмечал, согласно теории вероятности, это просто ложь. И относительно реальной психологии религии это тоже просто ложь — если б вы сказали такое несколько веков назад, то оказались на костре. Мать, чья дочь больна раком, молится: «Господь, пожалуйста, исцели мою дочь», а не «Дорогой Господь, я знаю, что религии не позволяют иметь каких-либо фальсифицируемых последствий, а это значит, что ты, скорее всего, не можешь исцелить мою дочь, так что… ну, в общем, я молюсь, чтобы почувствовать себя лучше, вместо того, чтобы сделать что-то действительно полезное для моей дочери».

Но люди читают «Нельзя доказать или опровергнуть религию фактическим доказательством» и в следующий раз, когда они видят часть доказательства, которое опровергает религию, их мозг реагирует по шаблону. Даже некоторые атеисты повторяют этот абсурд без тени сомнений. Если бы они обдумали данную идею самостоятельно, а не услышали от кого-то еще, они бы отнеслись к ней скептичнее.

Смерть. Шаблон «смерть придает смысл жизни».

Так раздражает, когда хорошие и достойные люди, которые сами никогда бы в жизни не додумались о том, чтобы стереть человечество с лица земли, поднимают в разговоре тему экзистенциальных рисков и говорят: «Ну, возможно, человечество не заслуживает выживания». Они в жизни бы не выстрелили бы в собственного ребенка — а ведь он тоже часть человечества — однако их мозг следует шаблону.

От каких из шаблонов, работающих в вашем мозге, вы хотели б избавиться?

Рациональность. Шаблон «любовь нерациональна».

Если бы эта идея внезапно пришла бы именно к вам как совершенно новая мысль, как бы вы стали ее критически анализировать? Я знаю, что я бы сказал, но что сказали бы вы? Взглянуть свежим взглядом может быть нелегко. Старайтесь не давать вашему мозгу следовать по стандартному, ожидаемому, уже известному пути. В конкретном случае может не существовать лучшего ответа, чем привычный, но вы не можете обдумать ответ на этот вопрос, пока не заставите свой мозг не выдавать ответ автоматически.

Теперь, когда вы прочитали мое эссе, в следующий раз, услышав, что кто-то уверенно повторяет мем, который вам кажется глупым или ложным, вы подумаете: «кешированная мысль». Мое убеждение теперь у вас в голове, ждет возможности стать шаблоном. Но верно ли оно? Не позволяйте мозгу следовать шаблону! Думайте!

Перевод: 
Remlin, Sergey Skeptic
Номер в книге "Рациональность: от ИИ до зомби": 
90
Оцените качество перевода: 
Средняя оценка: 4.9 (28 votes)

Стандартный «нестандарт»

Элиезер Юдковский

Всякий раз, когда кто-то призывает вас «думать нестандартно», они обычно, для вашего удобства, точно указывают рамки этого «нестандартно». Не забавно ли видеть одинаково выглядящих нонконформистов?..

В области исследований искусственного интеллекта у всех агитаторов нестандартного подхода есть готовый ответ на всё - нейронные сети. Они ведь могут имитировать работу человеческого мозга! Новая идея для ИИ. Завершите шаблон: «Логические ИИ, несмотря на все обещания, так и не дают реальный результат десятилетиями — все что нужно, это нейронные сети!»

Эта кешированная мысль крутится уже четвёртый десяток лет. А сильного интеллекта пока всё нет. Но все откуда-то знают, что нейронные сети являются Доминантной-Парадигмой-Инновационной-Идеей, причем еще со времен изобретения алгоритма обратного распространения ошибки в 1970-х. Со времен хиппи.

Нонконформисты по своей природе хотят отличаться от нормы. Если вы не носите черное, как люди узнают, что вы угнетенный художник? Как людям распознать уникальность, если неизвестен шаблон, в соответствии с которым распознается уникальность? Как кто-либо поймет, что ваш концепт ИИ революционен, если это не нейронные сети?

Другим примером этого же явления можно назвать «контркультурную» литературу, произведения которой похожи друг на друга, выходят из под пера небольшой группы непокорных бунтарей, и попадают в учебную программу факультета английской литературы. Как спросил Anonymous в блоге Скотта Ааронсона:

«Хоть какое-то из прочитанных контркультурных произведений хоть как-то изменило ваши политические взгляды?»

Или как замечает Lizard:

«Революцию уже крутят по телеку1. Революция уже коммерциализированна. Она стала одним из брендов и доступна в магазине. Всего двадцать долларов за комплект из маски, баллончика с краской, транспаранта «Мочи фашистов» и доступа к блогу, где можно писать о том, как жестоко с тобой обращалась полиция после того, как ты приковал себя к столбу. Капитализм уже научился продавать антикапитализм».

Многие в Кремниевой Долине наблюдают, как большинство венчурных капиталистов в любой момент времени гонятся за одной и той же Революционной Инновацией, которая является абсолютно той же, что и полгода назад. Это особенно разрушительное наблюдение в венчурном капитале, поскольку там есть прямой экономический мотив не следовать за стадом — даже если кто-то еще развивает продукт или снижает цену на стартап. Стив Юрветсон однажды сказал мне, что в Драпер Фишер Юрветсон только двум партнерам нужно согласиться, чтобы основать любой стартап до полутора миллионов долларов. И если все партнеры согласны, что какая-то вещь звучит здорово, они этого не делают. Если бы только комитеты по распределению грантов были так же разумны.

Проблема с оригинальностью в том, что вы по-настоящему должны думать, чтобы добиться этого, вместо того, чтобы позволить мозгу последовать шаблону. Нет ничего с наклейкой «за границами шаблона», куда вы могли бы сразу отправиться. Это почти что дзен — типа того, что вы не можете понять сатори через слова, потому что сатори это опыт, который происходит без слов. Чем больше вы стараетесь следовать инструкциям мастера дзен, которые он дает вам через слова, тем дальше вы будете от очищения своего разума.

По этой причине, как я думаю, люди и не добиваются новизны, стремясь к ней. Свойства типа правды или хорошего дизайна независимы от новизны: 2 + 2 = 4, да, правда, даже несмотря на то, что каждый так думает. Люди, которые стремятся открыть правду или изобрести хороший дизайн, могут достигать креативности. Не каждое изменение есть улучшение, но каждое улучшение есть изменение.

Каждое улучшение есть изменение, но не каждое изменение есть улучшение. Тот, кто говорит «я хочу построить оригинальную мышеловку!», а не «я хочу построить оптимальную мышеловку!», всегда желает восприниматься как оригинал. «Оригинальность» в этом смысле по существу социальна, потому что может быть определена только в сравнении с другими людьми. Так что их мозг просто выполняет стандартный шаблон, для которого распознается «оригинальность», после чего их друзья кивают, соглашаясь, и говорят, что это антиправительственно.

Книги по бизнесу всегда говорят вам, для вашего удобства, куда нужно идти, чтобы получить кусочек сыра. В ином случае читателям оставалось бы только спрашивать «Где это «за пределами», куда мне нужно идти?»

Настоящее мышление, наподобие сатори, — бессловесный акт сознания.

Лучше всех эту мысть сформулировали выдающиеся философы из Монти Пайтона в Житии Брайана2:

— Вы должны думать сами! Вы все личности!
— Да, мы все личности!
— Вы все разные!
— Да, мы все разные!
— Вы все должны соображать своей головой!
— Да, мы все должны соображать своей головой!

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
91
Оцените качество перевода: 
Средняя оценка: 3.6 (11 votes)

Непосредственный взгляд

Элиезер Юдковский

Поскольку Роберт Пирсиг выразил это очень хорошо, я просто скопирую ниже то, что он сказал. Я не знаю, основана ли эта история на реальных событиях или нет, но в любом случае она истинна.

У него возникали трудности со студентами, которым нечего было сказать. Вначале он полагал, что это лень, но позднее стало очевидно, что это не так. Они просто не могли придумать, что говорить.

Одна из них, девушка в стильных очках, хотела написать эссе на 500 слов о Соединённых штатах. Он привык уже, когда внутри все опускается от подобных утверждений, и, не отговаривая её, предложил ей лучше сузить тему только до Бозмена.

Когда подошёл срок, работы у неё не вышло, и она была довольно сильно расстроена этим. Она сказала, что пробовала и пыталась писать так и этак, но не смогла ничего придумать.

Это просто обескуражило его. Теперь он сам не мог сообразить, что же ему сказать. Наступило молчание, и затем последовал своеобразный совет: “Ограничьтесь-ка только главной улицей Бозмена”. И это оказалось просто озарением.

Она покорно кивнула и вышла. Но перед следующим уроком она вернулась в совершенном отчаянии, со слезами, отчаяние это назревало у неё, очевидно, уже давно. Она ничего не смогла придумать и не понимала, почему, если она не может ничего сказать обо всём Бозмене, она должна суметь написать что-либо всего лишь об одной улице.

Он рассвирепел. “Вы просто не смотрите!” — заявил он. Ему вспомнилось, как его самого отчислили из университета за то, что он слишком много говорил. По каждому факту есть бесконечное множество гипотез. Чем больше смотришь, тем больше видишь. Она в действительности не смотрела и почему-то не осознавала этого.

Он сердито предложил ей: “Ограничьтесь тогда фасадом одного из зданий на главной улице Бозмена. На оперном театре. Начните с верхнего левого кирпича”.

Ее глаза за толстыми линзами очков, широко распахнулись.

На следующий урок она пришла с озабоченным взглядом и вручила ему эссе на пять тысяч слов о фасаде здания оперы на главной улице Бозмена, штат Монтана. “Я сидела в закусочной через дорогу, — писала она, — и начала описывать первый кирпич, затем второй, а на третьем кирпиче всё началось, и я не смогла остановиться. Они посчитали меня чокнутой и всё время подтрунивали надо мной, но вот так оно получилось. Ничего не понимаю.”

Он тоже не понимал, но во время долгих прогулок по улицам города размышлял об этом и пришёл к выводу, что ей мешала та самая преграда, которая парализовала его в первый день его преподавательской деятельности. Она зациклилась, потому что пыталась повторить на письме то, что уже когда-то слышала, так же как и он сам в тот первый день пытался повторить то, что уже решил рассказать. Она не могла придумать, что бы ей написать о Бозмене, потому что не могла вспомнить ничего стоящего, что можно было бы повторить. Ей как-то не приходило в голову, что можно смотреть своим собственным свежим взглядом, и писать, не обращая внимания на то, что уже было сказано раньше. Ограничение темы одним кирпичом разрушило эту преграду, ибо стало очевидно, что ей нужно непосредственно увидеть нечто самой.

(Из книги Роберта М. Пирсига «Дзен и искусство ухода за мотоциклом», на основе перевода Геннадия Башкова.)

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
92
Оцените качество перевода: 
Средняя оценка: 4.3 (20 votes)

Страннее истории

Элиезер Юдковский

Представьте, если бы я сказал вам, что следующие заявления абсолютно точно являются истинными:

  • Если вы покраситесь в строго определённый цвет между синим и зелёным, сила гравитации поменяет свое направление и вы будете падать вверх.
  • В будущем по всему небу будут плавать миллиарды черных сфер. Каждая из них будет больше всех когда-либо существовавших до этого дирижаблей вместе взятых. Если вы предложите ей деньги, для вас на тросе спустится мужчина по вызову.
  • Ваши внуки будут думать, что отправлять воров в тюрьму вместо того, чтобы их просто шлёпать, — не просто глупо, но и очень жестоко.

Вы бы решили, что я сошел с ума, верно?

А теперь представьте, что сейчас — 1901 год, и вам нужно выбрать, что более правдоподобно — утверждения, перечисленные выше, или следующие:

  • Существует абсолютный предел скорости, при которой объекты будут все еще казаться движущимися относительно друг друга, и точное значение этой скорости — 1 079 252 848,8 километров в час. Если вы прыгнете в поезд, идущий с такой скоростью, и выстрелите из окна, фундаментальные единицы измерения длины изменятся, и вам будет казаться, что пуля летит быстрее вас, однако другие люди будут видеть это иначе. О, и время изменится тоже.
  • В будущем будет существовать суперсвязанная глобальная сеть, состоящая из миллиардов постоянно подключающихся к ней машин, причем каждая из этих машин будет мощнее всех когда-либо существовавших до 1901 года машин вместе взятых. Одним из главных способов использования этой сети будет передача движущихся картинок, изображающих лесбийский секс, поскольку эти картинки якобы состоят из чисел.
  • Ваши внуки будут думать, что говорить, будто женщина не должна быть президентом Соединённых Штатов только потому, что она — чёрная, — не просто глупо, но и очень жестоко.

Это эссе появилось по мотивам комментария Робина Хансона: «Интересно, можно ли написать со всеми сопутствующими подробностями рассказ об альтернативной реальности, которую наши предки не смогли бы отличить от правды, чтобы показать со всей ясностью, насколько неожиданной она действительно оказалась».

Перевод: 
deep_blue_hex, stas
Номер в книге "Рациональность: от ИИ до зомби": 
93
Оцените качество перевода: 
Средняя оценка: 4.5 (11 votes)

Ошибка обобщения на основе вымышленного свидетельства

Элиезер Юдковский

Когда я пытаюсь познакомить человека с концепцией продвинутого ИИ, что я слышу в первую очередь в более чем половине случаев?

«А, это как в Терминаторе/Матрице/у Азимова!»

И я отвечаю, «Э, нет, не совсем. Я склонен избегать логического заблуждения обобщения на основе выдуманного свидетельства».

Некоторые люди понимают сразу и смеются. Другие начинают защищать свое право на использование таких примеров, отрицая, что это заблуждение.

Что плохого в использовании кино или книг как исходной точки обсуждения? В конце концов, никто ведь и не говорит, что это истина. Где же ложь, в чем здесь грех рационалиста? Научная фантастика представляет собой попытку автора представить будущее; почему бы не воспользоваться плодами уже сделанных размышлений, вместо того, чтобы начинать заново?

Не каждый неверный шаг в точном танце рациональности заключается в явно видимом убеждении в чем-то ложном; есть менее заметные пути ошибаться.

Сначала давайте предположим, что научная фантастика представляет собой полноценную рациональную попытку предсказать будущее. Даже наиболее добросовестные писатели в первую очередь повествователи; требования к повествованию непохожи на требования к прогнозированию. Как отметил Ник Бостром1:

Когда в последний раз вы видели фильм о том, как человечество внезапно вымирает (без предупреждения и без того, чтобы его кто-то заменил)? А ведь такой сценарий может быть куда вероятнее, чем сценарий где люди-герои успешно отражают вторжение монстров или роботов, хотя он намного скучнее.

Художественная литература имеет свои специфические искажения. Но попытки исправить их недостаточно. Повествование никогда не является рациональной попыткой анализа, даже у лучших фантастов, поскольку истории не используют распределения вероятностей. Я покажу это так:

Боб Меркельфуд с опаской проскользнул в дверь инопланетного звездолета, поглядывая направо и налево (или наоборот) на предмет того, не остались ли где-то ужасные Космические Монстры. У него было только одно оружие, которые было эффективно против них, Космический Меч, который с 30% вероятностью состоял из чистого титана, 20% — обычного железа, 45% — таинственных черных дисков, найденных на развалинах Стоунхеджа и 5% других возможных результатов, слишком незначительных, чтобы их перечислять.

Меркельфуд (хотя был значительный шанс, что на самом деле там была Сьюзан Виффлифуфер) сделал два шага вперед и отпрыгнул назад, когда громкий рев разорвал тишину темного шлюза! Или тихий фоновый гул светлого шлюза! Хотя Амфер и Вуфи (1997) доказали, что Меркельфуд был съеден в тот момент, Споклабакл (2003) указывает на то, что…»

Персонажи могут быть невежественны, однако автор не может сказать три волшебных слова «я не знаю». Протагонист должен следовать единой линии событий в будущее, полной подробностей и окружения истории, от возможной будущей точки зрения Виффлифуфер по поводу феминизма, до цвета ее серег.

Потом все эти обременительные детали и сомнительные предположения упаковываются и получают короткий ярлык, создавая иллюзию, что они являются единым пакетом.

С проблемами, у которых большое пространство ответов, наибольшая трудность не проверка верного ответа, но просто поиск, где именно начать поиск в этом пространстве. Если кто-либо начинает с вопросов о том, будет ли ИИ помещать нас в капсулы как в «Матрице», они сразу начинают со 100-битового предположения, без подтверждения 98 бит свидетельства для определения этого в пространстве ответов как возможности стоящей точного обсуждения. Об этом стоит беспокоиться только после того как первые 98 бит будут подтверждены до почти определенности, что скажет вам, где следует проводить всю работу.

«Предварительный» шаг определения возможностей, стоящих точного обсуждения включает в себя шаги вида: взвешивание того, что вы знаете и не знаете, что вы можете предсказать и чего не можете, приложение сознательных усилий для избегания искажения абсурдности и широких интервалов подтверждения , обдумать, какие вопросы наиболее важны, пытаясь не упустить возможных «черных лебедей» и подумать (заблаговременно) о неизвестном неизвестном. Преждевременный переход к «Матрица: да или нет?» пропускает все это.

Любой профессиональный переговорщик знает, что управляя определениями можно практически предрешить исход дискуссии. Если вы начали с размышлений о Матрице, то в вашей голове станут возникать образы марширующих армий роботов, с трудом побеждающих людей — а не образ суперинтеллекта, похрустывающего нанотехнологическими пальцами. Такая постановка вопроса заставляет фокусироваться на «Мы против них», переводя потом внимание на вопросы типа «Кто победит?», «Кто должен победить?», «ИИ на самом деле будет такой?» Это создает общую атмосферу зрелищности, типа «Каково твое удивительное видение будущего?»

Позабытыми в гулкой пустоте являются: рассмотрения, что возможно более одного варианта реализации ИИ; зависимость будущего от начальных условий; сила интеллекта, превосходящего человеческий, и аргумент его непредсказуемости; есть люди, которые принимают риски всерьез и стараются предотвратить их.

Если определенные нечестные спорщики хотят, чтобы люди пришли к нужному им выводу, и начинают обсуждение с опровержения «Терминатора», то они искажают рамки данного обсуждения. В дебатах по контролю над оружием, ратующий за оружие не хочет начинать спор как «помешанный на стрельбе псих», а противник оружия не хочет начинать спор как «сторонник обезоруживания населения». Так почему вы следуете такому изменению рамок со стороны сценаристов Голливуда, пусть даже неумышленно?

Журналисты не говорят мне «будущее будет похоже на 2001 год.». Но они спрашивают «будет ли похоже будущее на 2001 год или вероятен приход ИИ?» Это столь же неправильная формулировка как и «Должны ли мы создать льготы для ветеранов или поднять налоги для богатых?»

В мире, в котором жили предки, не было движущихся картинок; то что ты видел своими глазами, было истиной. Краткий отблеск отдельного слова может вызвать у нас прайминг и сделать доступнее более подходящие мысли, что оказывает сильное влияние на оценки вероятностей. Насколько же тогда разрушителен может быть двухчасовой фильм для вашего суждения? Трудно исправить этот ущерб даже сознательными усилиями — так зачем приглашать вампира в свой дом? В шахматах или го, любой бесцельный ход это потеря; в рациональности, любое влияние, не подкрепленное свидетельствами, это (в среднем) энтропия.

Преуспевают ли те, кто смотрит кино, в неверии тому, что они видят? Насколько я могу сказать, весьма немногие из этих людей действуют так, словно видели точное будущее Земли. Люди, смотревшие Терминатора, не прятались в бомбоубежища 29 августа 1997. Однако те, кто попал под заблуждение, склонны действовать так, словно данные события истинны, но произошли на какой-то другой планете; не Земле, но очень похожей.

Вы говорите, «Предположим, что мы построим очень умный ИИ», а они говорят, «Но не приведет ли это к ядерной войне как в Терминаторе?» Насколько я могу сказать, точно так же, вплоть до тона, мыслил бы кто-либо, кто мог бы сказать «Но не это ли привело к ядерной войне на Альфа Центавра?» или «Не это ли привело к падению итальянского города-государства Пикколо в 14 веке?» Фильмам не верят, но информация из них доступна. Она рассматривается не как пророчество, но как исторический случай, подходящий для иллюстрации. Повторится ли история? Кто знает?

В недавнем обсуждении сингулярности, кто-то упомянул, что похоже, что Винж не думал, что компьютерно-мозговые интерфейсы сильно увеличат интеллект, и привел в пример Тунка Блументаля из «Marooned in Realtime», который был наиболее продвинутым персонажем, но не казался слишком уж сильным. Я возмущенно ответил: «Но Тунк потерял большую часть оборудования! Он был калекой!» Потом я обдумал все еще раз и подумал про себя: что за чушь я несу.

Насколько правилен ответ на данный вопрос ведь не зависит от того, как Винж изобразил своих героев, так? Тунк Блументаль не был «калекой», он не существовал в реальности. Я мог бы сказать «Винж решил изобразить Тунка калекой, потому что у него могли быть, а могли не быть свои причины, согласно его лучшему предсказанию будущего» и что это дает его авторскому выбору соответствующий вес свидетельства. Я не мог сказать «Тунк был калекой.» Тунка Блументаля не существовало.

Я осознанно оставил сделанную мной ошибку в первом наброске вверху данного поста: «Другие начинают защищать свое право на использование таких примеров, отрицая, что это заблуждение.» Но «Матрица» — это не пример!

Соседствующим будет логическое заблуждение оспаривания на основе вымышленного свидетельства: «Хорошо, если вы дойдете до конца радуги, вы найдете горшок с золотом — что только доказывает мою правоту!» (Обновление на основе предсказанного, а не наблюдаемого, свидетельства — это математическое отражение искажения знания задним числом.)

Мозг имеет множество механизмов для обобщения из наблюдения, не только эвристику доступности. Вы видите трех зебр, формируете категорию «зебра» и эта категория объединяет все автоматически воспринимаемое. Похожие на лошадей создания с черными и белыми полосками теперь классифицируются как «Зебры», то есть сразу распознаются как быстрые и хорошие на вкус; ожидается, что они будут похожи на ранее встреченных зебр.

Когда люди видят (двигающиеся картинки) трех боргов, их мозг автоматически создает категорию «борг», и они автоматически делают вывод, что люди с компьютерно-мозговыми интерфейсами принадлежат к категории «борг» и будут похожи на наблюдавшихся ранее боргов: холодных, не знающих жалости, одетых в черную кожу, ходящих словно роботы. Журналисты не верят, что в будущем будут борги — они не рассматривают «Звездный путь» как пророчество. Но когда кто-то говорит о компьютерно-мозговых интерфейсах, они думают «В будущем будут Борги?», а не «Как я могу знать, что обеспечиваемая при помощи компьютеров телепатия сделает людей менее приятными?», не «Я никогда не видел раньше боргов и никто не видел» и не «я формирую расистский стереотип на основе буквально нулевого свидетельства.»

Как Джордж Оруэлл говорил о шаблонах2:

Что нужно превыше всего — это позволить значению выбирать себе слово, и никак иначе… Когда вы думаете о чем-либо абстрактном, вы больше склонны использовать сначала слова, и пока вы не сделаете сознательное усилие, чтобы прекратить это, существующий язык будет врываться в ваши мысли и мыслить за вас, в обмен на запутывание или даже изменение вашего значения.

Согласно моей оценке, наиболее разрушительный аспект использования представлений других авторов состоит в том, что оно не дает людям использовать свое собственное. Как говорил Роберт Пирсиг3:

Она зациклилась, потому что пыталась повторить на письме то, что уже когда-то слышала, так же как и он сам в тот первый день пытался повторить то, что уже решил рассказать. Она не могла придумать, что бы ей написать о Бозмене, потому что не могла вспомнить ничего стоящего, что можно было бы повторить. Ей как-то не приходило в голову, что можно смотреть своим собственным свежим взглядом, и писать, не обращая внимания на то, что уже было сказано раньше.

Запомненные произведения врываются в ваше мышление и делают его за вас; они заменяют вам возможность видеть — самое ужасное удобство из всех возможных.

  • 1. Nick Bostrom, “Existential Risks: Analyzing Human Extinction Scenarios and Related Hazards,” Journal of Evolution and Technology 9 (2002), http://www.jetpress.org/volume9/risks.html
  • 2. Джордж Оруэлл, «Политика и английский язык»
  • 3. Роберт Пирсиг, «Дзен и искусство ухода за мотоциклом»
Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
94
Оцените качество перевода: 
Средняя оценка: 4.5 (12 votes)

Добродетель узости

Элиезер Юдковский

Свойство этого яблока может не быть свойством того яблока. Поэтому про одно яблоко можно рассказать большее, чем про все яблоки в мире.

Двенадцать добродетелей рациональности

Внутри своих профессий люди понимают важность узости: автомеханик никогда не перепутает деталь автомобиля под названием «карбюратор» с деталью автомобиля под названием «радиатор» — он знает, в чём состоит разница между ними. Первобытный охотник знает, чем лев отличается от пантеры. Уборщик не отмывает полы средством для чистки окон, сколь похожими не казались бы бутылки непосвящённым.

Снаружи своих профессий люди часто совершают ошибку, пытаясь расширить слово настолько, насколько возможно, пытаясь покрыть им как можно большую территорию. Разве не восхитителен, внушителен и мудр разговор о всех яблоках в мире? До чего же возвышенна возможность объяснить человеческое мышление в общих чертах, не отвлекаясь на мелкие вопросы: например, о том, как люди придумывают техники собирания кубика Рубика. Несомненно, размышления о чём-то частном даже не кажутся необходимыми; разве общая теория не есть блистательное достижение сама по себе?

Ты любопытен, и ты замечаешь что-то необычное в одном камешке; что-то новое, что-то интересное, что-то, отличающее его от миллиона других камешков, лежащих рядом. Ты решаешь называть такие камешки «алмазами», и пытаешься понять, в чём состоит их особенность: какие внутренние качества они разделяют, не считая уже замеченного тобой яркого блеска. И затем появляется кто-то ещё, и говорит: «Почему бы не назвать алмазом и этот камешек тоже? И этот, и ещё тот?». Он говорит воодушевлённо и желает добра. Ибо кажется недемократичным, ограниченным, элитаристским и нехолистичным намерение называть какие-то камешки «алмазами», а какие-то — не называть. Ты выглядишь, если можно так сказать, человеком узких взглядов. Едва ли тебя можно назвать открытым к новым веяниям, не закостенелым, волнующимся о судьбе коллектива.

Возможно, вкладывание в одно слово множества значений кажется тебе поэтичным: вокруг расцветают оттенки и скрытые смыслы. Но даже поэтам — хорошим поэтам — необходимо научиться видеть мир ясно и точно. Просто сравнить любовь с цветком — недостаточно. Горячая ревнивая неофициальная любовь отличается от любви женатой пары, живущей друг другом несколько десятков лет. Если ты хочешь найти цветок, подобный ревнивой любви, то тебе придётся пойти в сад, и наблюдать, и обращать внимание на тонкие различия: тебе нужен цветок с сильным запахом, яркого цвета и острыми шипами. Даже если твоя цель состоит в том, чтобы обогатить текст оттенками и отсылками, тебе всё равно нужно следить за тем, какие именно смыслы, отсылки и оттенки ты привносишь.

Умение узко фокусироваться на необычных камешках, обладающих каким-то редким свойством — необходимая часть и искусства рационалиста, и искусства поэта. И умение замечать особенности, которыми обладают эти камешки (и лишь эти камешки, больше ничто!) тоже. В этом нет ничего зазорного.

Нет ничего плохого в том, что современная эволюционная биология может объяснить всего лишь закономерности развития живых существ, но не «эволюцию» звёзд или «эволюцию» технологии. Увы, некоторые несчастные души используют одно и то же слово «эволюция» для того, чтобы описать порождённые естественным отбором закономерности самореплицирующейся жизни, и совершенно случайную структуру звёзд, и созданную разумом структуру технологии. И, как всем известно, если две вещи называются одним и тем же словом, то они в сущности одно и то же. Следует автоматически переносить всё, известное тебе о биологической эволюции, на развитие технологии. Если кто-то возражает против этой стратегии, то он, должно быть, просто зануда и педант. Твоё бездонное невежество в отношении современной теории эволюции не может быть настолько всеобъемлющим, чтобы ты не смог увидеть различие между карбюратором и радиатором. Это немыслимо. Нет, просто твой собеседник — да, тот, который изучал математику — настолько глуп, что не может увидеть взаимосвязей между предметами.

А что может заслуживать большего уважения, чем способность видеть взаимосвязи? Несомненно, мудрейшие из людей — гуру Нью Эйджа, произносящие «всё связано со всем». Если тебе доведётся произнести эту фразу вслух, не забудь сделать паузу, чтобы окружающие могли полностью осознать всё величие этой Глубокой Мудрости.

Имея граф, можно совершенно тривиальным образом получить его дополнение. Полный граф, в котором каждую пару вершин соединяет ребро, несёт в себе точно такое же количество информации, что и граф вообще без рёбер. Важные интересные графы относятся к числу тех графов, в которых некоторые штуки не соединены с некоторыми другими штуками.

Когда невежа старается показаться мудрецом, он без конца говорит о том, что это похоже на то, а то подобно сему, а оно сравнимо с вот этим; и его граф становится полностью и связным, и бесполезным. Лечение этой беды — знание деталей и доскональное изучение темы. Когда ты знаешь два предмета до мельчайших подробностей, ты можешь увидеть, насколько они непохожи, и тогда самое время начать с воодушевлением удалять из графа рёбра.

Аналогично, важные интересные категории относятся к числу тех категорий, которые не содержат внутри себя все сущности вселенной. Хорошая гипотеза не может объяснить все возможные исходы, но только некоторые из них.

Нет ничего плохого в том, что Исаак Ньютон объяснил лишь гравитацию, лишь то, почему и каким образом вещи падают вниз (и то, как планеты вращаются вокруг Солнца, и то, как Луна создаёт приливы), но не объяснил роль денег в человеческом обществе, или то, как сердце разгоняет кровь по телу. Презрительное отношение к узости напоминает мне о древних греках, приравнявших подход «выйти на улицу и посмотреть на мир, прежде чем рассуждать о нём» к ручному труду (а ручной труд был уделом рабов).

Вот как излагает эту мысль Платон1:

Если кто-нибудь, запрокинув голову, разглядывает узоры на потолке и при этом кое-что распознает, то он видит это при помощи мышления, а не глазами. Глядит ли кто, разинув рот, вверх или же, прищурившись, вниз, когда пытается с помощью ощущений что-либо распознать, все равно, утверждаю я, он никогда этого не постигнет, потому что для подобного рода вещей не существует познания и душа человека при этом смотрит не вверх, а вниз, хотя бы он даже лежал навзничь на земле или плыл по морю на спине.

Многие сегодня делают похожую ошибку, думая, что узкие понятия — приземлены, не величавы и недостойны философии: также, как, скажем, и подход «выйти на улицу и посмотреть на мир, прежде чем рассуждать о нём»; пусть этим занимается чернь. Но рационалистам — ­и поэтам — требуются узкие слова для выражения точных мыслей, им нужны категории, содержащие лишь одни вещи и не содержащие другие. Нет ничего плохого в фокусировке разума, в сужении категорий, исключении возможностей и заострении утверждений. В этом действительно нет ничего постыдного, правда! Если ты сделаешь свои слова слишком широкими, то в итоге ты получишь что-то далёкое от истины и даже не радующее глаз ценителей поэзии.

И не говорите при мне, что Википедия — «искусственный интеллект», что синтез ЛСД был «сингулярностью», или что корпорации обладают «сверхчеловеческим интеллектом»!

  • 1. «Государство», книга VII. Перевод А.Н.Егунова
Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
95
Оцените качество перевода: 
Средняя оценка: 4.2 (19 votes)

Как казаться (и быть) глубокомысленным

Элиезер Юдковский

Недавно я посетил дискуссионную группу, темой которой на этой сессии была смерть. Это взволновало всех. Думаю, что из всех ланчей, на которых я был в Кремниевой Долине, этот был наиболее честным; люди говорили о смерти близких и друзей, что они думают о своей собственной смерти. Они на самом деле слушали друг друга. Хотел бы я знать, как такие условия беседы воспроизводить.

Я был единственным присутствовавшим трансгуманистом и мне пришлось быть крайне осторожным, чтобы не показаться назойливым. («Фанатик это тот, кто не может изменить свое мнение и не способен сменить тему». Я стараюсь по крайней мере менять тему.) Что неудивительно, люди говорили о значении, которое смерть придает жизни, о том, что смерть на самом деле благо. Но я, очень аккуратно, объяснил, что трансгуманисты в общем позитивно относятся к жизни, но категорически не одобряют смерть.

После обсуждения несколько людей подошли ко мне и сказали, что я был весьма «глубокомысленен». Да, так и было, но это заставило меня задуматься над тем, что заставляет людей казаться глубокомысленными.

В один из моментов обсуждения, женщина сказала, что мысли о смерти дают ей возможность быть вежливой с людьми, ведь никто не знает, увидит ли она их снова. «Когда я могу сказать человеку что-то хорошее, — рассказывала она, — я говорю это ему прямо сейчас, а не жду чего-то еще».

«Прекрасная мысль, — сказал я, — и даже если когда-либо угроза смерти перестанет висеть над вами, надеюсь вы продолжите так делать…»

Эта женщина была одной из тех, кто подошел ко мне после обсуждения.

В другой момент дискуссии, один мужчина рассказывал о каком-то преимуществе смерти Х, не помню точно каком. И я сказал на это: «Знаете, учитывая человеческую природу, если людей бить по голове битой каждую неделю, довольно скоро они изобретут причины, по которым получать удары по голове — это хорошо. Но если вы подойдете к кому-либо, кого не бьют, и спросите, не хотели бы они к вам в этом присоединиться, они откажутся. Думаю, если вы подойдете к бессмертному и спросите, не хотел бы он умереть в обмен на преимущество Х, он откажется».

И этот человек тоже был среди тех, кто подошел после обсуждения.

Корреляция — это не причинность. Возможно я просто говорил таким тоном в этот день, что звучал крайне мудро.

Однако я подозревал, что произвел впечатление «глубокомысленного» потому, что связно опроверг запасенный шаблон «глубокой мудрости» так, что это имело смысл.

Есть стереотип Глубокой Мудрости. Смерть: завершите шаблон: «Смерть дает смысл жизни». Все знают этот стандартный ответ Глубокой Мудрости. И он включает в себя как одну из составляющих аплодисменты. Если вы скажете подобное, люди согласно кивнут, поскольку мозг завершит шаблон и они знают, что им предписано кивнуть. Они могут даже сказать «Как мудро!», возможно в надежде самим показаться глубокомысленными. Но они не будут удивлены; они не услышат ничего выходящего за пределы стандартного; они не услышат ничего, насчет чего у них не было бы мыслей. Можно назвать это убеждением в мудрости — мысль с меткой «очень мудрая», и это завершаемый стандартный шаблон для «глубокой мудрости», но сам по себе не приносящий опыта озарения.

Люди, пытающиеся выглядеть Глубоко Мудрыми, часто выглядят повторяющими за другими пустышками, поскольку они пытаются казаться глубокомысленными, вместо того, чтобы оптимизировать.

Сколько я думал, что мне нужно сделать, в рамках того, чтобы казаться глубокомысленным? Человеческие мозги работают только на 100 Гц, а я ответил сразу же, так что большая часть размышлений должна была быть проведена заранее. Наиболее трудоемким для меня было подобрать ответ с минимальным понятийным расстоянием и выразить его так, чтобы он осуществил максимальный эффект.

Философски говоря, почти вся моя работа была сделана заранее. Завершите шаблон: существующее условие Х действительно оправдывается преимуществом Y: «Натуралистическая ошибка?» / «Предубеждение статуса кво?» / «Можно ли получить Y без Х?» / «Если бы мы ранее не знали о Х, приняли бы мы его добровольно, чтобы получить Y?» Думаю, что могу честно сказать, что эти мысленные шаблоны у меня срабатывают автоматически, они столь же естественны для меня, как и дыхание. В конце концов большинство человеческих мыслей должны быть в кэше мозга, чтобы вообще работать.

И я уже придерживался развитой философии трансгуманизма. Он тоже имеет запасенные мысли о смерти. Смерть: завершаем шаблон: «Смерть это бессмысленная трагедия, рационализируемая людьми». Это нестандартный кэш, такой, с каким мои слушатели незнакомы. У меня было несколько возможностей использовать нестандартный кэш и, поскольку весь он был частью развитой философии трансгуманизма, все эти возможности явно принадлежали к одной теме. Это помогло мне выглядеть связно, а также оригинально.

Подозреваю, что это одна из причин, по которым восточная мудрость кажется глубокой для западных людей — она имеет нестандартный, но связный кэш Глубокой Мудрости. Аналогично это работает в японской художественной литературе — в ней Христиане иногда изображены как хранители глубокой мудрости и\или мистических секретов (хотя иногда нет).

Если я верно помню, один экономист однажды заметил, что аудитория чаще всего настолько незнакома с обычной экономикой, что когда он выступал на телевидении, ему достаточно было повторить некоторые места из учебника по экономике, чтобы получить славу оригинально мыслящего.

Значимым для моих слушателей было также то, что они могли сразу же видеть, что мои ответы имеют смысл. Они могли соглашаться с этим или нет, но для них это не было нелогичным заключением. Я знаю трансгуманистов, которые не могут казаться глубокомысленными, потому что не в силах подобрать слова, которые были бы уже известны их собеседникам. Если вы хотите казаться глубокомысленным, вы не должны никогда говорить того, что находится далее, чем в минимальном понятийном расстоянии от текущего состояния сознания слушателей. Только так.

Чтобы казаться глубокомысленным, изучайте необычные философии. Ищите обсуждения тех тем, что дадут вам шанс проявить ваши знания. Размышляйте над темой заранее, чтобы потом концентрироваться исключительно над тем, как ее донести до слушателей. И прежде всего — практикуйтесь оставаться на минимальном понятийном расстоянии от слушателей.

Чтобы быть глубокомысленным, размышляйте самостоятельно над «мудрыми», важными или эмоционально значимыми темами. Думать самостоятельно не значит просто получить необычный ответ. Это значит смотреть самому, а не позволять мозгу закончить шаблон. Если вы не останавливаетесь на первом ответе, и отбрасываете ответы, кажущиеся смутно неудовлетворительными, постепенно ваши мысли сформируются в связную форму, проистекающую из одного источника внутри вас, а не будут фрагментарными повторениями заключений других людей.

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
96
Оцените качество перевода: 
Средняя оценка: 4.4 (16 votes)

Мы меняем мнение реже, чем нам кажется

Элиезер Юдковский

В последние несколько лет, когда кто-то из наших коллег сталкивался с выбором из нескольких предложений о работе, мы просили его оценить вероятность, что он предпочтёт одну работу другой. Средняя уверенность в предсказанном выборе у опрошенных составила 66%, но только 1 человек из 24 сделал выбор, которому изначально присвоил низшую вероятность, что дает нам действительную точность в 96%.

— Гриффин и Тверски1

Когда я впервые прочитал вышеприведенные слова — первого августа 2003 года, около трех часов дня — они изменили мое мышление. Я понял, что как только я могу предположить каков был бы мой ответ — присвою ли я высокую вероятность тому или иному ответу — то я уже решил со всей вероятностью. Мы меняем наше мнение куда реже, чем думаем. И чаще всего мы становимся способны предположить свой ответ в течение полсекунды после вопроса.

Этот незаметный момент проходит очень быстро — момент, когда мы еще не можем предположить каков будет наш ответ; крошечное окно возможности действовать интеллекту. Как в вопросах выбора, так и в вопросах фактов.

Принцип нижней строчки гласит, что только настоящие причины ваших убеждений определяют вашу эффективность как рационалиcта. Как только ваше убеждение зафиксировано, никакие аргументы не изменят степень его истинности; как только решение принято, никакие аргументы не изменят его последствий.

Вы можете думать, что вы приобрели убеждение или приняли решение по нерациональным причинам, и стараться оправдать его, и если вы обнаруживаете, что не можете найти оправдания — откиньте это убеждение или решение.

Но мы меняем мнение реже — значительно реже — чем считаем.

Я уверен, что вы можете вспомнить по крайней мере один случай в вашей жизни, когда вы изменили свое мнение. Мы все можем. Но как насчет всех тех случаев, когда вы не меняли свое мнение? Доступны ли они вашей эвристической оценке собственной компетентности?

Знание задним числом, лжепричинность, подтверждающее искажение, якорение и прайминг, а главное, ужасающая предвзятость подтверждения — вот далеко не полный список причин, по которым идея, попавшая в голову, скорее всего, там и останется.

  • 1. Dale Griffin and Amos Tversky, «The Weighing of Evidence and the Determinants of Confidence,» Cognitive Psychology 24, no. 3 (1992): 411–435, doi:10.1016/0010-0285(92)90013-R.
Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
97
Оцените качество перевода: 
Средняя оценка: 4.4 (7 votes)

Не спешите предлагать решения

Элиезер Юдковский

Цитата из Robyn Dawes’s Rational Choice in an Uncertain World, стр 55-56.

Норман Майер заметил, что, когда группа встречается с проблемой, естественной склонностью для ее членов является предложить возможные решения сразу же после начала обсуждения. В результате, групповое взаимодействие концентрируется на преимуществах и недостатках предложенных решений, люди начинают эмоционально привязываться к предложенным ими решениям, и еще более лучшие решения не выдвигаются. Майер выдвинул предложение для улучшения группового решения проблем: «Не предлагайте решения до тех пор, пока проблема не будет обсуждена настолько тщательно, насколько это возможно без предложения решений». Легко видеть что данное предложение работает в контекстах, где есть объективно определенные хорошие решения для проблем.

Майер предложил следующий «игровой» эксперимент для демонстрации своей точки зрения. Нужно было решить задачу: «Три сотрудника компании выполняют три различных по сложности вида работ. Один из них, Новичок, хочет заниматься только самой лёгкой работой. Другой, Профи, хочет переключаться между работами, чтобы избежать скуки. Сторонний эксперт по продуктивности при этом рекомендует поручать Новичку самую лёгкую работу, а Профи — самую тяжёлую, что повысит общую эффективность на 20%». Половине групп, решавших эту задачу, дали инструкцию: «Не предлагайте решений, пока проблема не будет обсуждена как можно тщательнее». Вторая половина групп никаких указаний не получила. И люди в них делали естественную ошибку — увидев проблему, они сразу же предлагали решения, привязывались к ним, начинали активно спорить, дискутировать, что важнее — свобода или эффективность, и так далее. Те группы, которым дали указание сначала обсудить задачу, а затем уже решать её, с большей вероятностью приходили к решению: поручить Новичку самую лёгкую работу, в то время как двое оставшихся должны чередовать другие две работы. По данным эксперта это приводило к улучшению на 19%.

Я часто использую данное положение в тех группах, которые веду — особенно когда они сталкиваются с очень трудной проблемой, когда большинство членов группы склонны сразу же предлагать свои решения. Хотя у меня нет объективного критерия, при помощи которого можно оценить качество группового решения проблем, введение предложения Майера делает возможным принятие лучших решений.

Это настолько истинно, что даже не смешно. И данный эффект проявляется все хуже и хуже, по мере трудности задачи. Возьмем для примера искусственный интеллект. Удивительное число людей, которых я встречал, похоже точно знают как создать ИИ, при этом не зная, скажем, как создать систему распознавания символов или систему совместной фильтрации (что является менее сложными задачами). И если создание ИИ будет оказывать положительное влияние на человечество — дружественного ИИ, грубо говоря — почему эта задача столь невероятно сложна, если большинство людей решают все за 15 секунд. Может, хватит уже?

(Добавлено: все описанное относится не только к проблеме ИИ. Физики встречались с множеством не-физиков, у которых были свои теории физики, экономистам приходится выслушивать множество новых теорий экономики. Если вы эволюционный биолог, любой встреченный вами может решить любую задачу в вашей области, обычно постулируя групповой отбор. Ну и так далее)

Совет Майера перекликается с принципом нижней строки — что эффективность наших решений определяется только теми свидетельствами и той обработкой, которую мы проводим до принятия решения. После того, как вы напишете нижнюю строчку, уже слишком поздно придумывать причины к ней и писать их выше. Если вы предлагаете решение слишком рано, оно будет основано на крайне малом объеме размышлений, и не имеет значения, сколько отличных аргументов вы придумали к нему уже потом.

И более того, вспомним, что мы меняем наше мнение куда реже, чем считаем: в предыдущем посте в эксперименте 24 человека присвоили в среднем 66% вероятность будущему выбору, однако лишь 1 человек из 24 выбирал вариант с меньшей вероятностью. Как только вы предполагаете, каков был бы ваш ответ, вы скорее всего уже решили. Если вы можете предположить, каков он был бы, за полсекунды, значит у вас есть только полсекунды, в течение которых вы используете интеллект. Не слишком много.

Традиционная рациональность делает особое ударение на фальсификации — способности отказаться от начального выбора, если против него имеется явно видимое свидетельство. Но как только идея появляется в вашей голове, вероятнее всего потребуется слишком много свидетельств, чтобы выкинуть ее оттуда. Хуже того, у нас не всегда есть излишек сокрушительных свидетельств.

Я думаю, что более действенный (и более сложный) метод состоит в том, чтобы воздерживаться от размышлений об ответе. Заморозить, продлить тот краткий момент, когда мы еще не предположили, каков будет наш ответ, давая нашему интеллекту больше времени для действий.

Даже полминуты потенциально лучше, чем полсекунды.

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
98
Оцените качество перевода: 
Средняя оценка: 4.7 (11 votes)

Генетическая логическая ошибка

Элиезер Юдковский

В списках логических заблуждений вы можете найти «генетическую логическую ошибку». Это ошибка, при которой убеждение критикуется на основе причин, по которым кто-либо в него верит.

Это, на первый взгляд, весьма странная идея — если причины убеждения не определяют его систематическую надежность, то что же определяет? Если Deep Blue советует нам ход в шахматах, мы верим, что это основано на нашем понимании кода, который обходит дерево игры, при этом мы сами не в состоянии оценить дерево игры. Что может дать возможность расценить любое вероятное предположение как «рациональное», как не то, что было произведено неким систематически надежным процессом?

Статьи, рассказывающие об этой ошибке, могут сказать вам, что не всегда данный тип мышления ошибочен — происхождение свидетельства может быть релевантно к его оценке, например в случае с экспертом, который заслуживает доверия. Но, как мы можем узнать из тех же статей, в других случаях это действительно может считаться заблуждением; химик Кекуле увидел структуру бензола во сне, но это не значит, что мы не можем доверять убеждению об этой структуре.

Выходит, что иногда это заблуждение, а иногда — нет?

Формально генетическая логическая ошибка является заблуждением, поскольку происхождение убеждения не то же самое, что его текущий подтвержденный статус, являющийся суммой всех известных «за» и «против» этого убеждения.

Однако мы меняем мнение реже, чем нам кажется. На обычных людей обвинение в адрес происхождения убеждений влияет гораздо сильнее, чем на идеальных байесианцев.

Очищение вашего разума является мощной эвристикой в том случае, если у вас возникло новое подозрение, что ряд ваших идей может иметь неправильный источник.

Как только идея появляется в наших головах, не всегда легко для свидетельства выкорчевать ее оттуда. Посмотрите на тех, кто вырос считая, что библия написана лично богом; позже, они приходят к тому, чтобы (на сознательном уровне) отвергнуть идею, что библию писал лично бог; но при этом продолжают думать, что библия содержит незаменимую этическую мудрость. Им не удалось очистить свое сознание; они могли бы значительно лучше справиться с тем, чтобы усомниться в истинности библейских текстов, основанной только на том, что сама библия говорит об их истинности.

В то же время, они должны твердо удерживать в сознании принцип, гласящий что обратное глупости не есть ум; цель — сделать мышление свободным и независимым, а не просто отрицать Библию, сделав это новым алгоритмом.

Как только некая идея попадёт вам в голову, вы будете искать ей поддержку всюду, куда только взглянете — и когда её первоисточник попадёт под сомнение, будет вполне разумно считать, что все яблоки упавшие с этого дерева не без подвоха тоже.

Но если бы! Не так просто прочистить свой мозг от лишних вещей. Требуется невообразимое усилие, чтобы пересмотреть позицию, не проворачивая раз за разом кешированные доводы. «Это ещё не кризис веры, пока обстоятельства не начали работать иначе», — говорит Тор Шенкель.

Вы должны быть особенно внимательны, если у вас имеется множество идей, проистекающих из одного источника, о котором вы теперь узнали, что он не заслуживает доверия, и при этом все идеи все еще кажутся правильными — очевидным архетипичным примером является как раз-таки библия.

С другой стороны… Есть такая штука, как полностью очевидное свидетельство, при котором становится уже неважно, откуда впервые появилась идея. Получение таких свидетельств — именно то, чем занимается Наука. Больше уже не имеет значения, что Кекуле увидел кольцевую струкутуру бензола в своём сне — равно как не имело бы это значения, найди мы эту гипотезу при помощи случайно генерируемых изображений, из откровений спиритиста-шарлатана или вывели из библии. Кольцевая структура бензола подтверждена таким количеством экспериментальных свидетельств, что можно забыть об источнике этого знания и не вспоминать.

В отсутствие таких очевидных свидетельств действительно приходится обращать внимание на достоверность источника идей — больше верить экспертам (если конечно их сфера обрела значимость и признание) — меньше доверять идеям, полученным из подозрительных источников — не верить тем, чьи мотивы неизвестны, особенно если они не могут предоставить аргументы независимые от их авторитета.

Генетическая логическая ошибка это искажение, когда существуют суждения за пределами изначального факта для обоснования, но обвинение представлено так, словно оно относится к самому вопросу. Хэл Финни предлагает называть это «генетической эвристикой».

Вот несколько надёжных правил:

  • С подозрением относитесь к критике источников тех убеждений, которые вам не нравятся, особенно если оппонент заявляет суждения за пределами простого авторитета говорящего. «Полет — идея из религии, так что братья Райт лгали» это один из классических примеров.

  • Аналогично, не ожидайте получить полезной информации по техническому вопросу подвергнув с мудрым видом психоанализу ущербные мотивы и личности причастных. Если существуют технические аргументы, то они имеют более высокий приоритет.

  • Когда насчет одного из ваших фундаментальных источников возникает сомнение, вы на самом деле должны усомниться во всех ветвях, произрастающих из него. Вы не можете просто отбросить их, потому что обратное глупости не есть ум, но вы должны заново рассмотреть их на предмет их истинности.

  • Но крайне внимательно вы должны смотреть, не верите ли вы до сих пор в те убеждения, источник которых вы позднее отвергнули.

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
99
Оцените качество перевода: 
Средняя оценка: 3.4 (19 votes)

Смертельные спирали и аттрактор культа

Аффективные смертельные спирали возникают в результате положительной обратной связи за счёт эффекта ореола. Позитивные качества коррелируют в нашем сознании и чем больше хорошего говорится о некоем объекте или субъекте, тем больше мы склонные верить позитивным утверждениям относительно этого явления.

Культы являются эмпирическими аттракторами в группах людей, часто оказывающиеся аффективными смертельными спиралями, куда добавляется социальное давление и угроза изгнания, а также, зачастую, убеждения связанные со стремлением к совершенству в некоей области.

Автор: 
Элиезер Юдковский

Аффективная эвристика

Элиезер Юдковский

Аффективная эвристика — это когда субъективные впечатления о хорошем или плохом используются как эвристика — источник быстрых суждений. Ощущения комфорта и дискомфорта являются центральными для человеческого мышления и влияют на появление аффективной эвристики вместе с замечательными искажениями — одними из моих любимых.

Давайте начнем с относительно безобидного искажения. Представьте, что вы переезжаете в новый город и должны перевезти на корабле старинные дедушкины часы. В первом случае эти часы — подарок от ваших дедушки и бабушки на ваш день рождения. Во втором — тоже подарок, однако от дальнего родственника, которого вы почти не знаете. Сколько вы заплатите за страховку, по которой вам выплатят 100 $ в случае утери часов? Согласно исследованиям Си и Канрейтера1, испытуемые готовы заплатить больше чем в два раза больше в первом случае. Это может звучать достаточно рационально — почему бы не заплатить больше за более ценный объект — пока вы не поймете, что сумма за страховку не защищает часы, а только гарантирует вам выплату, если часы будут утеряны, причем сумма выплаты в обоих случаях одинакова. (да, кстати, предполагается, что страхование проводится сторонней компанией, так что все работы по перевозке часов будут одинаковы по качеству в обоих вариантах).

Ну ладно, это не звучит особо безумно. Тут можно вывернуться, утверждая, что испытуемые страховали аффективные исходы, а не финансовые — возмещение убытков.

Тогда как насчёт такого? Ямагаши показал2, что испытуемые оценивают болезнь как более опасную, если описывать её как убивающую 1286 людей из 10000, чем если сказать, что в её случае вероятность смерти пациента составляет 24,14%. По-видимому, мысленный образ тысячи мёртвых тел пугает гораздо сильнее, чем мысленный образ одного человека, который скорее выживет, нежели умрёт.

Подождите, есть и похлеще.

Предположим, что аэропорт должен решить, потратить ли средства на покупку нового оборудования, в то время как критики утверждают, что деньги нужно потратить на увеличение безопасности. Словик предоставил3 двум группам испытуемых аргументы за и против покупки оборудования, с шкалой ответов от 0 (не поддержал бы вообще) до 20 (сильная поддержка). Одна из групп увидела меру, описанную как спасающую 150 жизней, а вторая — спасающую 98 % из 150 жизней. Гипотеза, которая вдохновила на проведение этого эксперимента, гласила, что спасение 150 жизней звучит хорошо, но неясно, много ли это? Мало? В то время как спасение 98 % это что-то явно хорошее, потому что 98 % близко к верхней границе процентной шкалы. И вот спасение 150 жизней получает среднюю поддержку в 10.4, в то время как спасение 98 % из 150 жизней имеет среднюю поддержку в 13.6 голосов.

Или рассмотрим отчет Деней-Ра и Эпштейна4: испытуемые, которым предлагали возможность выиграть 1 доллар каждый раз, когда они случайно вытаскивали красный шарик из непрозначной емкости, часто предпочитали вытаскивать шарики из емкости, в которой было больше самих красных шариков, но меньшая их пропорция. То есть емкость со ста шариками из которых 7 красные предпочиталась аналогичной с десятью шариками, один из которых красный.

Согласно Деней-Ра и Эпштейну, испытуемые, когда их опрашивали после эксперимента, утверждали, что хотя они и знали, что вероятности не в их пользу, однако они ощущали, будто их шансы выше, когда у них больше красных шариков в емкости. Для тебя это может звучать безумно, о Подкованный в Статистике Читатель, однако если ты подумаешь тщательней, то ты осознаешь смысл этого. 7 % может быть и выглядит хуже, чем 10 %, но это более чем компенсируется бо́льшим числом красных шариков. Да, вероятность меньше, но у тебя всё же больше шансов выиграть. Ты должен медитировать на эту мысль, пока не достигнешь просветления и не поймешь, как остальная часть планеты представляет себе вероятность.

Файникейн5 тестировал теорию, что люди склонны обобщать свои суждения об определенных плохих или хороших чертах чего-либо в общее хорошее или плохое ощущение об этой вещи. Например информация о возможном риске или возможной выгоде атомных станций. Логически, информация о риске никак не связана с информацией о выгоде. Если существует определенный факт, что конструкция реактора такова, что он пассивно безопасен (не достигает критической отметки даже при выходе из строя систем охлаждения), это не влияет на то, будет ли он производить меньше отходов, или давать электричество используя меньше топлива и т.д. Все это может быть хорошо, однако не стоит смешивать это в одну кучу. Тем не менее, Файникейн обнаружил, что для ядерных реакторов, природного газа, пищевых консервантов и т.д. предоставление людям информации о большой выгоде заставляло их воспринимать продукт как менее рискованный; а если акцентировать внимание на высоких рисках, то люди воспринимали продукт как менее выгодный, и так далее.

Он также обнаружил, что в условиях нехватки времени обратная зависимость между воспринимаемым риском и воспринимаемой выгодой растет, в соответствии с обнаруженным фактом, что нехватка времени, недостаток информации или отвлечение — все это увеличивает долю эвристики восприятия в сравнении с аналитическим обсуждением.

Ганза обнаружил6 сходный эффект в области финансов. Согласно стандартной экономической теории, доходность и риск должны коррелировать положительно — или говоря другими словами, люди платят более высокую цену за безопасные инвестиции, что снижает доходы; акции обеспечивают больший доход, чем облигации, однако имеют соответствующий более высокий уровень риска. При оценке знакомых акций, суждения аналитиков о рисках и доходности положительно коррелируют, как обычно и ожидается. Однако при оценке незнакомых акций аналитики склонны оценивать их как хорошие или плохие в общем — низкий риск и высокие доходы или высокий риск и низкие доходы.

Для дальнейшего чтения я рекомендую отличную обзорную статью Slovic et al: «Rational Actors or Rational Fools: Implications of the Affect Heuristic for Behavioral Economics» (2002).

  • 1. Christopher K. Hsee and Howard C. Kunreuther, «The Affection Effect in Insurance Decisions,» Journal of Risk and Uncertainty 20 (2 2000): 141–159, doi:10.1023/A:1007876907268.
  • 2. Kimihiko Yamagishi, «When a 12.86% Mortality Is More Dangerous than 24.14%: Implications for Risk Communication,» Applied Cognitive Psychology 11 (6 1997): 461–554.
  • 3. Paul Slovic et al., «Rational Actors or Rational Fools: Implications of the Affect Heuristic for Behavioral Economics,» Journal of Socio-Economics 31, no. 4 (2002): 329–342, doi:10.1016/S1053-5357(02)00174-9.
  • 4. Veronika Denes-Raj and Seymour Epstein, «Conflict between Intuitive and Rational Processing: When People Behave against Their Better Judgment,» Journal of Personality and Social Psychology 66 (5 1994): 819–829, doi:10.1037/0022-3514.66.5.819.
  • 5. Finucane et al., «The Affect Heuristic in Judgments of Risks and Benefits.»
  • 6. Yoav Ganzach, «Judging Risk and Return of Financial Assets,» Organizational Behavior and Human Decision Processes 83, no. 2 (2000): 353–370, doi:10.1006/obhd.2000.2914.
Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
100
Оцените качество перевода: 
Средняя оценка: 3.6 (8 votes)

Способность к оценке (и недорогой праздничный шоппинг)

Элиезер Юдковский

В связи с надвигающимися праздниками многим читателям в голову приходит следующий вопрос:

«Дорогой Overcoming Bias, есть ли искажения, которые позволят мне выглядеть щедрым, при этом не тратя много денег?»

Я рад сказать, что да, таковые существуют! Кристофер Си в статье «Меньше — это лучше: когда выбор с низкой ценой ценится выше выбора с высокой ценой» утверждает, что купив кому-то шарф за 45 долларов, вы скорее покажетесь щедрым, чем если купите пальто за 55 долларов1.

Это частный случай более общего явления. В ранее проведенном эксперименте Си опрашивал испытуемых, как много они бы заплатили за подержанный музыкальный словарь2:

  • Словарь А, 1993 года издания, содержащий 10000 записей, совсем как новый.
  • Словарь Б, 1993 года издания, содержащий 20000 записей, с порванной обложкой, но в остальном как новый.

Некоторым испытуемым давали сравнить оба словаря, а некоторым давали только один.

Те, кто видел только один из словарей, были готовы заплатить в среднем 24 доллара за словарь А и 20 долларов за словарь Б. Те же, кому давали оба словаря, были готовы заплатить за словарь Б в среднем 27 долларов, а за словарь А — 19 долларов.

Конечно же число записей в словаре куда важнее, нежели порванная обложка, по крайней мере если вы планируете использовать словарь по назначению. Однако если у вас в руках только один словарь с 20000 записями, это число вам особо ничего не говорит. Это много? Мало? Кто знает? Это не поддается анализу. В то же время порванную обложку видно сразу. И это имеет определенную аффективную окраску, а именно — плохо.

Если же у вас на руках оба словаря, то число записей становится величиной, которую можно оценить, поскольку есть уже две сущности, которые можно сравнить между собой. И как только число записей становится оцениваемой величиной, она нивелирует значимость порванной обложки.

Что вы предпочтете3?

  1. 29/36 шанс выиграть 2 доллара
  2. 7/36 шанс выиграть 9 долларов

В то время как средние цены (значения оценки) соответственно равны 1,25 доллара и 2,11 доллара, их средняя привлекательность составляла 13,2 и 7,5 соответственно. Цены и привлекательность устанавливались в контексте, в котором испытуемым говорили, что две игры будут выбираться из вышеприведенных и они должны играть в игру с более высокой ценой или более высокой привлекательностью. (У испытуемых был мотив отмечать игры как более привлекательные или платить за них больше, нежели они на самом деле предпочитали играть.)

Игра, стоящая больше денег, менее привлекательна, классический разворот предпочтений. Исследователи предположили что долларовые значения были более сравнимы с ценовой задачей, однако вероятность выигрыша была больше сравнима с привлекательностью. Так что (как думали исследователи) почему не попробовать сделать выигрыш в игру более заметным эмоционально — более аффективно оцениваемым — более привлекательным?

И как же они это сделали? Добавили в игру небольшой проигрыш. Старая игра имела 7/36 шанс выиграть 9 долларов, новая — 7/36 выиграть 9 долларов и 29/36 шанс проиграть 5 центов. В старой игре вы неявно оценивали привлекательность в 9 долларов. Новая игра заставляет вас оценивать привлекательность выигрыша 9 долларов против потери 5 центов.

Словик утверждает что результаты превзошли их ожидания. В новом эксперименте новая игра с 7/36 шансом выиграть 9 долларов имела привлекательность 9,4, в то же время сложная игра, в которой был добавлен 29/36 шанс потерять 5 центов имела средний рейтинг привлекательности в 14,9.

Дальнейшие проводимые эксперименты должны были показать, предпочитают ли испытуемые старую игру с определенным выигрышем в 2 доллара. Только 33 % студентов предпочли старую игру. Среди другой группы, которую просили выбрать между определенным выигрышем 2 долларов и новой игрой (в которую добавили возможность проигрыша), около 60,8 % предпочли ее. Обобщая все, можно сказать, что 9 долларов не особо привлекательная сумма денег, однако соотношение девяти долларов к пяти центам — удивительно привлекательное соотношение выигрыша к проигрышу.

Вы можете сделать игру привлекательней, если добавите в нее возможность явного проигрыша! Разве психология не интересна? Вот почему нет никого, кто на самом деле разбирается в чудесной сложности человеческого интеллекта и хочет при этом разработать ИИ похожий на человека.

Конечно же это все работает только если испытуемые не сравнивают две игры напрямую.

Примерно так же — какое из этих двух мороженых, по вашему мнению, выбрали бы испытуемые из вышеприведенного эксперимента?

4

Естественно, ответ зависит от того, видит ли испытуемый единичное мороженое или оба стоят рядом, чтобы их можно было сравнить. Испытуемые, которые видят перед собой только одно мороженое, готовы заплатить 1,66 доллара за стаканчик Н и 2,26 доллара за стаканчик L. Те же, кто видят сразу оба стаканчика, склонны заплатить 1,85 за стаканчик Н и 1,56 за стаканчик L.

Каким образом это относится к вашему праздничному шоппингу? Таким, что если вы тратите 400 долларов на 16 Гб айпод, тот, кому вы делаете подарок, увидит один из самых дорогих плееров. Если же вы тратите те же 400 долларов на Nintendo Wii, тот, кому вы её дарите, увидит одну из самых дешевых приставок. Каково же лучшее приложение для денег? Учтите, что этот вопрос имеет смысл только когда вы видите оба товара вместе. Вы-то можете сравнивать их во время шоппинга, но одариваемый увидит лишь то, что получит.

Если вы ограничены определенной суммой — и ваша цель это показать вашу дружбу, а не помочь на самом деле, — то для вас будет лучше осознанно не гнаться за ценой. Решите, как много вы можете потратить, чтобы впечатлить реципиента, а потом найдите наиболее пустяковую вещь, которая стоит именно столько. Чем дешевле класс объектов, тем дороже может быть сам купленный объект, при том, что сумма тратится одна и та же. Что больше запомнится — футболка за 25 долларов или свеча за эту же сумму?

Теперь японский обычай с покупкой дыни за 50 долларов обрел смысл, не так ли? Вы смотрите на это и думаете «Да что это с японцами?». А они получают возможность казаться невероятно щедрыми, потратив всего 50 долларов. Вы можете потратить 200 долларов на торжественный ужин, и при этом не произведете впечатления столь же богатого человека, как если бы купили дыню за 50 долларов. А если бы существовал обычай дарить зубочистки за 25 долларов или пылинки за 10 долларов, то можно было бы казаться щедрым, тратя еще меньше.

P.S.: Если вы на самом деле использовали этот трюк, то мне хотелось бы знать — что вы купили?

  • 1. Christopher K. Hsee, «Less Is Better: When Low-Value Options Are Valued More Highly than High-Value Options,» Behavioral Decision Making 11 (2 1998): 107–121.
  • 2. Christopher K. Hsee, «The Evaluability Hypothesis: An Explanation for Preference Reversals between Joint and Separate Evaluations of Alternatives,» Organizational Behavior and Human Decision Processes 67 (3 1996): 247–257, doi:10.1006/obhd.1996.0077.
  • 3. Slovic et al., «Rational Actors or Rational Fools.»
  • 4. Из статьи Си, © 1998 John Wiley & Sons, Ltd.
Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
101
Оцените качество перевода: 
Средняя оценка: 4.5 (14 votes)

Неограниченные шкалы, решения присяжных и футуризм

Элиезер Юдковский

«Психофизика», несмотря на своё название, является уважаемой областью науки, которая связывает физические явления с сенсорными явлениями. Если сообщить воздуху акустическую энергию — то есть создать шум — то как громко это прозвучит для человека, если представить это функцией от акустической энергии? Насколько больше необходимо сообщить акустической энергии, чтобы этот шум показался человеку в два раза громче? Не в два, а в восемь раз больше.

Акустическую энергию и количество фотонов легко измерить. Для того же, чтобы выяснить, как громко звучит акустический стимул, или как ярко выглядит свет, нужно спрашивать того, кто слушает или смотрит. При этом можно использовать ограниченную шкалу, на которой заданы пределы от «очень тихо» до «очень громко», или от «очень темно» до «очень ярко». Можно так же воспользоваться неограниченной шкалой, где нулем будет «вообще не слышно» или «вообще не видно», а верхней предел отсутствует. При использовании неограниченной шкалы наблюдателю в качестве опорной точки1 обычно указывают на фиксированный стимул, которому соответствует некоторое значение. Таковым может быть звук, которому присвоена громкость 10. Тогда наблюдатель сможет обозначить вдвое громкий звук при помощи числа 20.

В принципе, такой подход показал себя как вполне надежный. Но что случится, если дать испытуемым неограниченную шкалу, от нуля до бесконечности, но не задать опорной точки, соответствующей фиксированной величине? Тогда они, конечно же, введут свои опорные точки. Соотношения между стимулами будут коррелировать между испытуемыми. Допустим, испытуемый А говорит, что звук Х имеет громкость 10, а звук Y — 15. Если испытуемый В говорит, что звук Х имеет громкость 100, то для звука Y он, скорее всего, установит величину 150. Но если не знать, что испытуемый С принял за опорную точку — масштаб его шкалы — то нельзя предсказать, какую величину он присвоит звуку Х. Может быть 1. Может быть 1000.

Допустим, испытуемый оценивает единичный звук, на неограниченной шкале, без возможности сравниться с зафиксированным стандартом. Тогда почти все отклонения в оценках будут связаны с произвольным выбором опорной точки, а не со звуком как таковым.

«Хм, — подумали вы про себя, — чем-то это напоминает то, как присяжные в суде принимают решение о штрафных убытках2. Не удивительно, что при этом получается такой разброс!» Интересная аналогия, но можно ли продемонстрировать её экспериментально?

Канеман и др.3 выбрали в качестве испытуемых 867 человек, имеющих право быть присяжными, предоставили им описания нескольких судебных дел (например, случай ребёнка, чья одежда загорелась по неосторожности) и попросили для каждого из случаев совершить одно из действий:

  1. Определить на ограниченной шкале возмутительность действий ответчика,
  2. Определить на ограниченной шкале степень, в соответствии с которой следует наказать ответчика, либо
  3. Определить размер штрафных убытков в долларах.

И, вот так сюрприз, в то время как уровни возмутительности действий и степени наказания отлично коррелировали между испытуемыми, штрафы их были разбросаны как попало. Однако, порядок ранжирования величин штрафов — то, в каком порядке они располагались между наименьшим и наибольшим значениями, которые присваивал отдельный испытуемый в разных случаях — неплохо коррелировал между испытуемыми.

Если вас интересует объяснённая дисперсия по шкале наказания (для конкретного дела, рассматриваемого несколькими испытуемыми), то ответ — даже для необработанных данных — равен 0,49. Объяснённая дисперсия для порядкового номера штрафа в долларах оказалась равна 0,51. А для величины штрафа в долларах она оказалась равна 0,06!

То есть: для каждого конкретного случая — например, вышеупомянутого ребенка, чья одежда загорелась — можно с хорошей точностью угадать и степень наказания, и то, как величина штрафа будет расположена относительно других случаев, однако сама величина штрафа остаётся совершенно непредсказуемой.

Не поможет даже взять среднее из двенадцати4 случайно выбранных ответов.

Так что, решение присяжных по штрафным убыткам, это не столько экономическая оценка, сколько выражение позиции — психофизическое измерение величины возмущения, отображённое на неограниченной шкале без стандартных опорных точек.

Я заметил, что, аналогичным образом, множество футуристических предсказаний являются скорее выражением позиции. Разброс ответов на вопрос «Через сколько лет появится ИИ, сравнимый с человеческим?» поражает воображение. Больше всего мне запомнился ответ одного из передовых разработчиков ИИ — «Через пятьсот лет.» (!!)

Здесь причина, которая мешает предсказать время реализации ИИ, заслуживает собственного подробного обсуждения. Вряд ли парень, который сказал «через пятьсот лет», заглянул в будущее, чтобы найти ответ. Так же он не мог получить это число стандартным ложным способом — опираясь на закон Мура. Так что же значит число 500?

Я предполагаю, это ответ на вопрос в следующей формулировке: «На шкале, где ноль это ”совсем не сложно”, насколько трудной вы ощущаете задачу создания ИИ?». При наличии ограниченной шкалы, ответы здравомыслящих респондентов находились бы около отметки «невероятно сложно» на дальнем конце шкалы. Все что угодно ощущается невероятно сложным, когда не знаешь, как это сделать. Но данная шкала не ограничена и опорных точек тоже нет. В этом случае люди попросту берут число, которое означает для них «невероятно сложно». Это может быть и 50, и 100, и даже 500. Потом они добавляют к нему слово «лет» и футуристический прогноз готов.

«Насколько трудной ощущается задача ИИ?» — это не единственный вариант подмены. Некоторые отвечают так, словно бы я спрашивал «Насколько радужно вы думаете об ИИ?». Маленькие числа в этом случае соответствуют более положительным ощущениям, а в конце так же добавляется слово «лет». Возможно, такие «временные оценки» представляют собой что-то иное, кроме выражения отношения на неограниченной шкале без опорных точек, но я так и не смог определить — что именно.

  • 1. В оригинале «modulus» — Прим.перев.
  • 2. «Штрафные убытки[…], как они понимаются в странах семьи общего права, представляют собой сумму, присуждаемую в деликтных исках к выплате потерпевшему сверх возмещения вреда (иначе говоря, сверх ”компенсационных убытков”, compensatory damages). Причинитель вреда может быть присужден к уплате штрафных убытков, если совершенное им правонарушение было отягощено такими обстоятельствами как недобросовестность, грубая неосторожность или злой умысел.», цитата по https://zakon.ru/blog/2013/9/30/shtrafnye_ubytki_v_ssha_ili_pochem_marlb… — Прим.перев.
  • 3. Daniel Kahneman, David A. Schkade, and Cass R. Sunstein, “Shared Outrage and Erratic Awards: The Psychology of Punitive Damages,” Journal of Risk and Uncertainty 16 (1 1998): 48–86; Daniel Kahneman, Ilana Ritov, and David Schkade, “Economic Preferences or Attitude Expressions?: An Analysis of Dollar Responses to Public Issues,” Journal of Risk and Uncertainty 19, nos. 1–3 (1999): 203–235.
  • 4. Типичный размер коллегии присяжных заседателей. — Прим.перев.
Перевод: 
Remlin, ildaar
Номер в книге "Рациональность: от ИИ до зомби": 
102
Оцените качество перевода: 
Средняя оценка: 3.8 (10 votes)

Эффект ореола

Элиезер Юдковский

Аффективная эвристика — это когда общее ощущение хорошего или плохого влияет на многие другие суждения, вне зависимости от того, логично это или нет, и независимо от того, осознаете вы это или нет. Субъекты, которым рассказали о преимуществах ядерной энергии склонны недооценивать риски реакторов; биржевые аналитики, которые оценивают неизвестные им акции, склонны характеризовать их в общем, как хорошие или плохие — низкий риск и высокий доход или высокий риск и низкий доход — пренебрегая обычной экономической теорией, которая говорит что риск и доход должны коррелировать положительно.

Эффект ореола (также называемый гало-эффектом) это проявление аффективной эвристики в социальной психологии. Роберт Чалдини во «Влияние: наука и практика» обобщает:

Исследования показывают, что мы автоматически присваиваем симпатичным людям такие хорошие черты как талант, доброту, честность и ум (для обзора свидетельств см. Eagly, Ashmore, Makhijani, & Longo, 1991). К тому же мы не замечаем, что в данных суждениях играет роль физическая привлекательность. Некоторые последствия таких неосознанных предположений что «что-то хорошо выглядящее есть хорошее» пугают меня. Например, исследование канадских федеральных выборов 1974 года обнаружило, что привлекательные кандидаты получили больше чем в два с половиной раза голосов, нежели непривлекательные (Efran & Patterson, 1976). Несмотря на такие свидетельства фаворитизма по отношению к привлекательным внешне политикам, дальнейшие исследования показали, что избиратели не осознают данного своего искажения. На деле, 73 процента канадских избирателей категорически отказались признать, что в их суждениях внешность кандитата играла какую-то роль; и только 14 процентов сказали, что допускают такую возможность (Efran & Patterson, 1976). Избиратели могут отрицать влияние привлекательности на возможность быть избранным, однако тревожные свидетельства наличия данного эффекта продолжают поступать (Budesheim & DePaola, 1994).

Аналогичный эффект проявляется в ситуациях, связанных с наймом сотрудников на работу. Согласно одному из исследований, хороший вид претендента часто играл большую роль в процессе принятия решения интервьюером о найме, чем даже профессиональные навыки — хотя интервьюеры заявляли обратное, что внешний вид не оказывает значительного влияния на их выбор (Mack & Rainey, 1990). Преимущество привлекательных внешне сотрудников легко отслеживалось в день зарплаты. Экономисты, исследовавшие данные по США и Канаде, обнаружили, что такие сотрудники получали зарплату в среднем на 12-14 процентов больше, нежели их не столь привлекательные коллеги (Hammermesh & Biddle, 1994).

Не менее тревожные исследования показывают, что строение костей и пропорции тела могут влиять даже на судебные процессы. Даже в правовой системе хорошо выглядящие люди получают преимущество (смотри Castellow, Wuensch, & Moore, 1991; and Downs & Lyons, 1990). Например, в пенсильванском исследовании (Stewart, 1980) ученые ранжировали 74 обвиняемых согласно их физической привлекательности перед их судом. Потом, проверяя результаты данных случаев, они обнаружили, что привлекательные люди получили куда более легкие наказания. Фактически, привлекательные обвиняемые вдвое чаще непривлекательных избегали тюрьмы. В другом исследовании — когда оценивалась сумма выплаты за причиненный ущерб, если обвиняемый был привлекательней пострадавшего, то средняя сумма выплат составляла 5623 доллара, если же наоборот — жертва была привлекательней обвиняемого, то средняя сумма вырастала до 10051 доллара. Более того, присяжные демонстрировали данный эффект вне зависимости от своей половой принадлежности (Kulka & Kessler, 1978).

Другие эксперименты продемонстрировали, что привлекательные люди чаще получают помощь, если она им нужна (Benson, Karabenic, & Lerner, 1976), и с куда большим успехом могут убеждать людей менять мнение (Chaiken, 1979)…

Влияние привлекательности на оценку интеллекта, честности и доброты — это чистый пример искажения (особенно когда вы судите об этих сущностях на основе фиксированного текста) поскольку мы не ожидаем, что суждения о честности и привлекательности будут объединены на каких-то легитимных причинах. С другой стороны, сколько моего воспринимаемого со стороны интеллекта проистекает из моей честности? Как много моей воспринимаемой честности проистекает из моего интеллекта? Поиск истины и произнесение ее вслух не так широко разделены в природе как хороший вид и умный вид…

Но эти исследования эффекта ореола привлекательности должны заставлять нас подозревать, что существует подобный эффект и для доброты или интеллекта. Предположим, вы знаете человека, который кажется не только очень умным, но также честным, альтруистичным, добрым и спокойным. Вы должны быть скептичнее относительно того, не влияют ли какие-то из этих характеристик на ваше восприятие других. Возможно, этот человек на самом деле умен, честен и альтруистичен, но не всегда добр или спокоен. Вы должны насторожиться, если вам кажется, будто вы можете разделить всех своих знакомых на чистых ангелов и демонов.

И я знаю, что вы не думаете, будто вы должны это делать, но, возможно, вам стоило бы быть более скептичными в отношении более привлекательных политиков.

Перевод: 
Remlin, Alexander_Pavlov
Номер в книге "Рациональность: от ИИ до зомби": 
103
Оцените качество перевода: 
Средняя оценка: 4.4 (10 votes)

Искажение супергероя

Элиезер Юдковский

Предположим, что хорошо вооруженный социопат, который взял людей в заложники, отказался от переговоров и объявил, что сейчас начнет убивать. В реальной жизни, хорошие парни обычно не выбивают дверь, когда у плохого парня есть заложники. Но иногда — крайне редко, но все же — жизнь подражает Голливуду в том, что хорошим парням необходимо проломиться через дверь.

Представим два совершенно разных мира, в которых герои вламываются в комнату, чтобы оказаться лицом к лицу со злодеем.

В одной из реальностей герой может поднимать и бросать машины, стреляет лазерами из ноздрей, имеет рентгеновский слух, и его кожа не просто отражает пули, а аннигилирует их. Злодей же засел в начальной школе, и в заложниках у него две сотни детей, родители которых плачут снаружи.

В другой реальности герой — это обычный нью-йоркский полицейский, а заложники — три проститутки, которых злодей снял на улице.

Тщательно рассмотрим вопрос: кто из них больше достоин называться героем? И кто вероятнее всего станет героем комиксов?

Эффект ореола — это когда восприятия всех положительных черт коррелируют. Те, кого оценили выше по шкале привлекательности, также скорее всего получат более высокие оценки на шкалах таланта, доброты, честности и ума.

Таким образом, герои из комиксов, которые кажутся сильными и неуязвимыми (что является двумя положительными чертами), также кажутся обладающими еще и такими героическими чертами, как мужество и героизм. Но:

«Как может быть тяжело действовать храбро и героически, когда ты практически неуязвим?»

—Empowered, т. 1

Я не помню, вычитал ли я эту точку зрения где-то или придумал как гипотезу: известность, в частности, складывается с остальными личностными характеристиками. Рассмотрим Ганди. Был ли Ганди самым альтруистичным человеком 20 века или только наиболее знаменитым альтруистом? Ганди выходил навстречу и полицейским с дубинками, и солдатам с оружием. Но Ганди был знаменитостью, и его известность его защищала. А что насчет других, тех, кто шел с ним на марш, тех людей, которые попадали под удары дубинок и выстрелы из оружия, хотя о них никто бы не написал в СМИ, если бы они попали в госпиталь или были убиты?

Что думал Ганди о заголовках в газетах, известности, славе, месте в истории, о том, чтобы стать архетипом ненасильственного сопротивления, когда он рисковал меньше, нежели те, кто шел с ним? Что он чувствовал, когда кто-либо из этих анонимных героев приходил к нему с сияющими глазами и говорил, насколько Ганди велик? Представлял ли Ганди мир в таком свете? Не знаю; я не Ганди.

Это ни в коем случае не критика Ганди. Смысл ненасильственного сопротивления — не в показывании вашего мужества; это можно сделать куда проще, спустившись по Ниагаре в бочке. Ганди не мог не быть частично защищенным своей известностью. И его действия требовали мужества — пусть не так много, как от анонимного человека, но все еще очень и очень много.

Искажение, на которое я хочу указать — это то, что люди склонны добавлять славу Ганди к его «честно заработанному» альтруизму. Когда вы думаете о ненасилии, вы думаете о Ганди — не об анонимном протестующем, который шел на одном из маршей, который попадал под огонь ружей и дубинки полицейских, который получал травмы и попадал в больницы, который остался после этого инвалидом и имя которого никто не вспомнит.

Точно так же, что значительней — рисковать жизнью, чтобы спасти две сотни детей, или рисковать жизнью, чтобы спасти трех взрослых?

Ответ зависит от того, что вы понимаете под «значительней». Если вам приходится выбирать между спасением трех взрослых и спасением двух сотен детей, то тогда выбирайте последнее. Фраза «любой, кто спасает одну жизнь, спасает целый мир» может звучать очень здорово, однако её нельзя назвать хорошим советом, если вам нужно выбрать, кого спасать. Так что, если вы говорите «значительней», понимая под этим «кто важней?», или «какой исход предпочтительней?», или «какой из двух путей я должен выбрать?», то тогда значительней будет спасти две сотни, нежели трех человек.

Но если вы спрашиваете о значительности в смысле явной добродетели, тогда любой, кто рискнул бы своей жизнью, чтобы спасти только три жизни, обнаруживает больше мужества, нежели тот, кто спас бы две сотни, но не трех.

Это не значит, что вы можете намеренно решить рискнуть вашей жизнью, чтобы спасти трех взрослых, и позволить умереть двум сотням школьников, потому что вы хотите явить больше добродетели. Любой, кто рискует жизнью, желая быть добродетельным, на самом деле являет много, много меньше добродетели, нежели тот, кто рискует жизнью, желая спасти других. Любой, кто выбирает спасение трех жизней, а не двух сотен, только потому, что так он выглядит более добродетельным, настолько зачарован своим «величием», что это больше похоже на моральный эквивалент убийства.

Это похоже на коан дзен: нельзя продемонстрировать добродетель, пытаясь её продемонстрировать. Имея выбор между спасением мира без всяких жертв и усилий и путем, на котором вам придется рисковать своей жизнью и терпеть лишения, вы не можете стать героем, осознанно выбрав второй путь. В желании быть героем нет ничего героического, это лишь бессмысленная цель.

По-настоящему добродетельные люди, действительно пытающиеся спасать жизни, а не демонстрировать добродетель, будут постоянно искать возможность спасти больше жизней меньшими усилиями, что означает, что они продемонстрируют меньшую добродетель. Это может звучать путано, однако это вовсе не противоречиво.

Но мы не всегда можем выбрать неуязвимость к пулям. После того, как мы сделали все возможное, чтобы уменьшить риски и увеличить шансы, любой оставшийся героизм является настоящим и нужным.

Полицейский, который рискует своей жизнью, не обладая сверхспособностями, не имея рентгеновского зрения, суперсилы, возможности летать, и уж, конечно, неуязвимости к пулям, демонстрирует куда большую добродетель, нежели Супермен, который является всего лишь героем.

Перевод: 
Remlin, Alexander_Pavlov
Номер в книге "Рациональность: от ИИ до зомби": 
104
Оцените качество перевода: 
Средняя оценка: 4.9 (10 votes)

Просто мессии

Элиезер Юдковский

Вчера я рассматривал, как гало-эффект, который заставляет людей видеть все позитивные характеристики, как связанные (например, более привлекательные индивиды также воспринимаются как более добрые, честные и умные), принуждает нас больше восхищаться героями, если они обладают сверхсилой и пуленепробиваемы. Даже если, согласно логике, потребуется больше смелости, чтобы быть героем, если ты обычный человек. Кроме того, можно обнаружить, что большее достоинство действовать отважно для спасения одной жизни, чем для спасения мира. (Хотя если вам нужно сделать что-то одно из двух, конечно вы должны спасти мир).

Я хочу сказать, что полицейский, который рискует своей жизнью, не имея сверхспособностей, проявляет куда большую добродетель, чем Супермен, который просто-напросто супергерой.

Давайте рассмотрим конкретный пример.

Нью-йоркский полицейский Джон Перри(English) был последователем экстропианства и трансгуманизма, насколько мне известно. Он должен был скоро выйти на пенсию и собирался начать собственную юридическую практику, когда пришла новость, что самолет врезался во Всемирный Торговый Центр. Он погиб, когда была разрушена северная башня. Я не знал Джона Перри лично, поэтому я не могу претендовать на точное знание; но лишь малая часть последователей экстропианства верит в Бога, и я предполагаю что Перри также был атеистом.

Это говорит нам о том, что Перри знал о риске прекратить свое существование, выходя на работу. И что, в отличие от большинства людей в истории, он знал о имеющемся у него выборе как умереть и выбрал то, что имело значение — потому что был трансгуманистом; его надежда была подлинной. И он все равно вошел в здание и отдал свою жизнь. Не потому что он ожидал божественной награды. Не потому что думал, что после смерти его ждет что-то еще. Но потому что в опасности были другие люди, у которых тоже не было бессмертной души и их надежды на жизнь стоили не меньше, чем его.

Я не знал Джона Перри. Я не знаю, смотрел ли он на мир именно так. Но факт, что атеист и трансгуманист все еще был полицейским, который бросился в горящее здание, говорит больше о человеческом духе, чем все мученики, которые надеялись попасть в рай.

Это мы рассказали о конкретном сотруднике полиции…

…а теперь посмотрим на супергероя.

Как рассказывают христиане, Иисус Христос мог ходить по воде, мог остановить бурю и усмирить демонов одним словом. Это должно быть весьма удобно в повседневной жизни: проблема голода? Наксерокопируем хлеба. Не нравится дерево? Проклянем его. Проблемы с римлянами? Пожалуемся Папе на них. Когда наконец его волшебная жизнь закончилась, Иисус был добровольно распят на кресте. Быть распятым на кресте не особо легкий способ умереть. Однако судя по рассказам христиан, Иисус сделал это, зная что он воскреснет через три дня, а после этого попадет в рай. Что заставило его принять временные муки перед попаданием в рай? Жизнь единичного человека? Коррупция иудейской церкви, или угнетения римлян? Нет, согласно христианам, Иисус принял муки за все грехи человеческие.

Но я не хочу осуждать человека, который на самом деле не был настолько виноват. Что если Иисус — нет, давайте произносить его имя правильно: Иешуа — что если Иешуа никогда не ходил по воде и тем не менее бросил вызов церкви иудеев, которая поддерживалась римлянами?

Разве это не заслуживает большего уважения, чем то, которое уделяется Иисусу Христу, который был просто Мессией?

Увы, величественнее кажется для героя иметь стальную кожу и божественные силы. Почему-то кажется более добродетельным временно умереть, чтобы спасти целый мир, чем умереть навсегда в борьбе с коррумпированной церковью. Это кажется таким обычным, словно в истории было полно людей, которые так делали.

Взирая с расстояния в две тысячи лет из будущего мы можем с разных сторон критически смотреть на Иешуа, однако он сделал то, во что верил, то, что по его мнению было правильно, вступив в сражение с церковью, которую он считал коррумпированной, и умер за это. Без преимущества просветления, едва ли он мог предсказать истинное влияние его жизни на мир. По отношению к другим пророкам его дней, он возможно был более честным, относительно менее жестоким и более храбрым. Если не рассматривать все непредвиденные последствия, худшее, что можно сказать о Иешуа, это что у других пророков получалось лучше (Эпикур, Будда, Марк Аврелий — те, кто первые приходят на ум). Иешуа умер навсегда, и с одной точки зрения он сделал это во имя честности. Пятнадцать веков до науки — в те времена религиозная честность не была оксюмороном.

Как сказал Сэм Харрис:

«Недостаточно того, что Иисус был человеком, который изменил себя настолько, что Нагорная Проповедь была отражением его сердца. Он также должен был быть Сыном Бога, непорочно зачатым, которому было суждено вернуться на землю в ореоле славы. Эффектом этой догмы стало то, что пример Иисуса навсегда стал недосягаем. Его учение прекратило быть набором эмпирических тезисов о соединении между этиками и духовным просветлением, вместо этого став ненужной и достаточно неприятной сказкой. Согласно догмам христианства, стать подобным Иисусу невозможно. Человек может лишь перечислить свои грехи, верить в невероятное и ждать конца света».

Я сильно сомневаюсь, что Иешуа когда-либо произносил Нагорную Проповедь. Несмотря на это, Иешуа заслуживает славы. Он заслуживает больше славы, чем любой из христиан, почитающих его.

Но поскольку Иешуа скорее всего ожидал, что его душа выживет, он не заслуживает больше славы, чем Джон Перри.

Перевод: 
Remlin, mangregory, Elspet
Номер в книге "Рациональность: от ИИ до зомби": 
105
Оцените качество перевода: 
Средняя оценка: 4.4 (11 votes)

Аффективные смертельные спирали

Элиезер Юдковский

Огромное множество потоков человеческого мышления ведут нас к переоценке того, как хорошо наша любимая теория объясняет факты. Теория флогистона в химии могла объяснить все что угодно, пока не требовалось предсказать что-либо заранее. И чем больше феноменов вы объясняете своей теорией, тем истиннее она кажется — разве все эти наблюдения не подтверждают ее? И по мере того, как теория набирает в глазах у вас вес, вы будете склонны ставить под сомнение те свидетельства, которые конфликтуют с ней. И поскольку любимая теория кажется все более общей, вы будете искать возможности объяснить ею как можно больше вещей.

Если вы знаете кого-то, кто верит в то, что Бельгия тайно контролирует банковскую систему США или что они могут использовать силу невидимого синего духа для поиска доступных мест для парковки — скорее всего они уже дошли до этой стадии.

(Просто следите, и вы будете наблюдать много того, что, кажется, подтверждает эту теорию…)

Этот цикл доверия и подтверждения с положительной обратной связью на самом деле страшная вещь, ответственная за множество ошибок как в науке, так и в повседневной жизни.

Но это ничто, по сравнению со смертельной спиралью, которая начинается с заряда положительного аффекта — мысли, которая ощущается очень хорошей.

Новая политическая система, которая может спасти мир. Великий лидер, сильный, благородный и мудрый. Удивительный тоник, который может лечить расстройство желудка и рак.

Эй, почему бы не все три сразу? Великое дело нуждается в великом лидере. Великий лидер должен быть способен приготовить один-два волшебных тоника.

Эффект ореола — это когда любая воспринимаемая положительная характеристика (такая как привлекательность или сила) увеличивает восприятие любых других положительных характеристик (таких как интеллект или мужество). Даже когда это не так или почти не так.

Позитивные характеристики усиливают восприятие других позитивных характеристик? Звучит сильно похоже на то, как делящийся атом урана испускает нейтроны, которые расщепляют другие атомы урана.

Слабый положительный аффект не дотягивает до критической массы; он не выходит из-под контроля. Привлекательный человек кажется более честным, что, похоже, делает его еще более привлекательным; однако эффективное размножение нейтронов меньше единицы. Метафорически говоря. Резонанс немного сбивает с толку в отношении некоторых вещей, однако быстро сходит на нет.

С сильным положительным аффектом, имеющим отношение к Великой Вещи, резонанс проявляется везде. Верящий коммунист видит мудрость Маркса в каждом гамбургере, купленном в Макдональдс; в любом движении они запрещают все, что не подпадает под определение рая для истинных трудящихся; любые выборы, в которых они проигрывают, во всех статьях они объявляют подтасованными. Каждый раз, когда они используют Великую Идею для интерпретации другого события, Великая Идея подтверждается все больше и больше. Это ощущается как что-то хорошее — положительное подтверждение — и конечно, когда что-то позволяет нам чувствовать себя хорошо, то, увы, это заставляет нас хотеть верить в это еще больше.

Когда Великая Идея ощущается достаточно хорошей для того, чтобы заставить вас искать новые возможности ощутить, что Великая Идея еще лучше, применяя ее для интерпретации всех новых событий каждый день, резонанс положительного аффекта похож на комнату, забитую сверхчувствительными мышеловками, в которую забросили несколько мячей от пинг-понга.

Вы можете назвать это «аттрактором счастья», «перекрывающейся положительной обратной связью», «замкнутой петлей похвалы» или «бумагой веселья». Лично я предпочитаю термин «аффективная смертельная спираль».

В следующем посте: как сопротивляться аффективной смертельной спирали. (Подсказка: не отказываться вообще восхищаться чем-либо и когда-либо снова, но не позволяя вещам, которыми вы восхищаетесь, выходить за пределы небольшой ограниченной безопасной зоны.)

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
106
Оцените качество перевода: 
Средняя оценка: 3.4 (25 votes)

Сопротивление аффективным смертельным спиралям

Элиезер Юдковский

Когда-то давно был человек, считавший, что он обладает Великой Идеей. Действительно, по мере того, как он думал об Идее всё больше, он понимал, что это была не просто Великая Идея, а Самая Замечательная Когда-Либо Существовавшая Идея. Великая Идея могла бы разгадать тайны Вселенной, вытеснить авторитет подверженных коррупции и ошибкам ведомств, предоставить почти магическую силу её обладателям, накормить голодных, вылечить больных, улучшить мир в целом и т.д., и т.п.

Этим человеком был Френсис Бекон, его великой идеей был научный метод, и он был единственным фриком в истории, утверждавшем о таких преимуществах для человечества, и оказавшимся совершенно правым.

(Разумеется, Бэкон не изобрел единолично всю науку, однако он сделал в нее немалый вклад и, возможно, был первым, кто осознал ее полный потенциал.)

В этом и заключается слабое место решения, когда человек решает вообще не увлекаться идеями: некоторые из них на самом деле хорошие. Хотя на данный момент неизвестны идеи, которые были бы более революционны, чем идея Бэкона, и при этом выполняли бы свои заявления.

Но как мы можем сопротивляться аффективным смертельным спиралям, продолжая при этом уважать Науку? Подобная спираль проявляется, когда вы верите, что некоторая вещь настолько великолепна, что эффект ореола заставляет вас искать все больше и больше хороших слов, которые можно сказать об этой вещи, заставляя вас верить, что эта вещь еще более замечательна и таким образом увлекая вас в бездну. Что, если Наука в действительности настолько полезна, что мы не можем даже признать ее истинное величие и остаться при этом в здравом уме? Ой, похоже это началось…

Если вы пытаетесь защититься от данного эффекта, возможно, вам на ум придут стандартные кэшированные мысли вида «Наука дала нам кондиционеры, но ведь также дала и атомные бомбы» или «Ученые могут рассказывать о звездах и биологии, однако никогда не смогут доказать или опровергнуть существование дракона у меня в гараже». Однако люди, которые так думают, не пытаются сопротивляться аффективной смертельной спирали. Их заботит не то, что восхищение наукой выходит из-под их контроля. Скорее, им не нравится то, что наука говорит об их убеждениях, и они ищут пути, чтобы подорвать ее авторитет.

Для тех, кто искренне восхищается наукой, не подойдут те негативные вещи, которые о ней обычно говорят — не та аудитория. Так что мы должны искать другие негативные вещи на замену этим.

Но если вы пытаетесь избирательно очернить науку — пусть даже в попытке сопротивляться аффективной смертельной спирали — разве при этом вы не впадаете в рационализацию? Почему вы должны уделять внимание своим мыслям, если вы знаете, что пытаетесь манипулировать самим собой?

В общем, я достаточно скептично отношусь к тем людям, которые утверждают, что одно искажение можно использовать для нейтрализации другого. Для меня это звучит так, словно механик говорит вам, что у вашей машины сломался двигатель правого стеклоочистителя и чтобы было симметрично, механик сломал вам двигатель левого. Это такой вид «умных рассуждений», который больно ударит по вам самим. Любое решение, каким бы оно не было, должно включать в себя правильные убеждения, а не веру в убеждение, что вы верите, что определенная вещь не особо хороша.

Можете ли вы предотвратить аффективную смертельную спираль путем ограничения вашего восхищения наукой узким диапазоном? Частью спирали является стремление видеть Великую Идею везде — думать, что Коммунизм бы даже рак вылечил, если бы ему дали шанс. Возможно, что единственным наиболее надежным признаком гуру культа является тот факт, что гуру заявляет о своем знании не касательно одной области или ряда областей — а сразу во всем. Гуру знает, что членам культа нужно есть, носить, чем заниматься, как выбирать себе партнера, какие картины смотреть, какую музыку слушать…

К сожалению, в данном случае такой план имеет изъян — большинству людей не удается описать границы, в которых должна оставаться наука. Обычный аргумент «наука не вылечит рак» не работает. «Наука ничего не может сказать о любви родителей к своему ребенку» — простите, это уже явная ложь. Если вы пытаетесь отделить науку от так называемой родительской любви, вы не просто отрицаете когнитивную науку и эволюционную психологию. Вы также отрицаете факт основания Мартином Ротблаттом Объединения Терапевтов для поиска лекарства для его дочери, больной легочной гипертензией. (К слову сказать, успешного поиска.) Наука так или иначе связана со всеми важными аспектами человеческого существования.

Хорошо, но можно ли придумать подходящее утверждение о «великолепности» науки, которое было бы ложным?

По моему скромному мнению, ложным утверждением будет то, что наука столь великолепна, что учёным не нужно беспокоится об этической ответственности за свою работу, потому что так или иначе результат будет хорошим. Учёные тоже люди, они (как и другие люди) так или иначе думают о благе для обществе, и это, по крайней мере, одна из причин, почему наука создаёт хорошего всё же больше, чем плохого.

Однако эта точка зрения, очевидно, не бесспорна. Можно придумать и более простое ложное утверждение: «Пациент с раком может быть вылечен, путем публикации достаточного количества журнальных статей». Или «Социопаты могли бы стать полностью нормальными, если бы они заставили себя не верить ничему, без воспроизводимого экспериментально свидетельства с p менее 0,05».

Для того, чтобы не поверить в эти ложные утверждения, следуя аффективной спирали, не надо искать причин верить в то, что публикация журнальных статей вызывает рак. Не надо пытаться поверить в то, что наука всё равно ничего не может сказать о раке. Надо принять для себя как данность, что наука хороша лишь слегка.

Точнее, если вы достаточно конкретно знаете как работает наука, то вы знаете, что хоть наука и может со временем «вылечить рак», но больной пациент, пишущий журнальные статьи, не получит чудодейственной ремиссии. Эта конкретная цепь причин и следствий не будет работать.

Аффективная смертельная спираль представляет собой эмоциональную проблему, возникающую вследствие проблемы в восприятии, эффекта ореола, который заставляет нас приписывать бо́льшую вероятность истинности будущим положительным заявлениям, если мы приняли начальное положительное заявление. Мы не можем избавиться от этого эффекта по своему желанию, скорее всего, он всегда в той или иной мере будет влиять на нас. Но мы можем уменьшить размер этого влияния, остановившись и рассматривая каждое дополнительное положительное заявление как лишнее усложнение, и концентрируясь на самих заявления отдельно от положительных эмоций, ими вызываемых.

Что делать, если определенное хорошее заявление «не может быть опровергнуто», хотя есть аргументы «за» и «против»? На самом деле таких слов вообще стоит опасаться, поскольку часто их произносят те люди, которые повторяют свидетельство или пытаются избежать слабых мест. Учитывая опасность аффективной смертельной спирали радости, имеет смысл постараться избегать радоваться неподтвержденным заявлениям — избегать делать их источником еще больших положительных эмоций касательно того, что вам уже нравится.

Аффективная смертельная спираль является столь большой проблемой вследствие перекрывающейся положительной обратной связи, которая дает возможность процессу перейти в критическую стадию. Возможно, вы не можете совсем убрать эффект ореола, однако вы можете мыслить достаточно критически, чтобы не давать ему довести вас до критической отметки — при этом резонанс прекратится до того, как все взорвется.

Можно даже сказать, что вся проблема начинается с людей, которые не утруждают себя критическим анализом любой детали, вносящей дополнительную сложность — рассматривая подходящие свидетельства для компенсации сложности, ища недостатки так же как и поддержку, вовлекая любопытство — как только были приняты некоторые основные положения. Без ложной конъюнкции эффект ореола все еще действовал бы, однако не приводил бы к аффективной смертельной спирали.

Даже в отношении Самых Крутых Штук в известной вселенной идеальный рационалист, требующий безусловно необходимые свидетельства для каждого дополнительного (положительного) заявления, никогда бы не впадал в аффективный резонанс. Вы не можете так делать, но вы можете постараться приблизиться к этому идеалу достаточно близко, чтобы сохранять свое счастье от выхода из-под контроля в смертельную спираль.

По-настоящему опасные случаи это те, где любая критика любого положительного заявления про Великую Идею ощущается плохой или социально неприемлемой. Аргументы — это солдаты, любое положительное заявление — солдат вашей стороны, причинять им вред — предательство. Тогда реакция достигает критической точки. Больше об этом в следующем посте.

Добавление: Стюарт Армстронг предложил весьма дельный совет:

Разделите вашу Великую Идею на мелкие отдельные идеи и обращайтесь с ними как с независимыми.

Для примера: марксист должен делить Великую Идею Маркса на теорию стоимости, теорию политических отношений между классами, теорию заработной платы, теорию крайнего политического состояния человечества. Каждая из них должна оцениваться отдельно от других, и истинность или ложность одной не должна распространяться ореолом на другую. Если мы можем сделать это, спираль будет нам не страшна, поскольку каждая теория слишком мала, чтобы стать началом спирали.

Метафорически говоря, это похоже на дробление плутония, чтобы не дать ему достигнуть критической массы. Три Великих Идеи намного менее вероятно сведут вас с ума, чем одна Великая Идея. К тому же совет Армстронга помогает сохранить концентрацию на деталях: как только кто-то говорит «Публикация достаточного количества статей может вылечить ваш рак», вы спрашиваете: «Это было получено экспериментальным методом? Если да, то на каком этапе эксперимента вылечивается рак? Или это преимущество от науки как от социального процесса? В таком случае нужно полагаться на отдельных ученых, желающих вылечить рак или они могут быть эгоистами?». Возможно, что это поможет вам избавиться от эффекта ореола и даст возможность более эффективно замечать замешательство и отсутствие поддержки.

Добавление 2: как итог, вы можете избежать аффективной смертельной спирали путем (1) разделения Великой Идеи на части, (2) рассмотрения каждой дополнительной детали как усложнения задачи, (3) размышления о специфике причинно-следственной цепочки, вместо общего ощущения блага или вреда, (4) прекращения повторения одних и тех же свидетельств, (5) прекращения вызова эмоции счастья от заявлений, что «вы не можете доказать это — значит вы не правы»; но не (6) отказываться восхищаться чем-то слишком много, (7) обеспечивая искаженный поиск негативных точек зрения, пока вы не ощутите себя снова несчастным, (8) принудительно помещая идею в безопасные рамки.

Перевод: 
Remlin, Elspet
Номер в книге "Рациональность: от ИИ до зомби": 
107
Оцените качество перевода: 
Средняя оценка: 3.4 (19 votes)

Некритичная сверхкритичность

Элиезер Юдковский

Снова и снова можно встретить людей спорящих о том, является ли атеизм религией. Как я упоминал в «Purpose and Pragmatism» (English), спор о смысле отдельного слова практически всегда означает, что вы потеряли нить от изначальной проблемы. Какие предпосылки могут существовать для этого спора?

Атеист толкает речь, попрекая «религию» инквизицией, крестовыми походами и многочисленными конфликтами как с исламом, так и без его участия. На это религиозный человек может ответить: «Но атеизм также является религией, вы тоже имеете верования о Боге; вы верите в то, что Бога не существует». Тогда атеист парирует: «Если атеизм – религия, то не-коллекционирование марок можно назвать хобби», и спор начнётся.

Или он может ответить: «Но такие же ужасы были принесены и атеистом Сталиным, подавлявшим церкви во имя атеизма, так что вы не можете объявлять религию источником насилия». Теперь атеист может соблазниться ответом «Ни один истинный шотландец», сказав: «Религия Сталина называется Коммунизм». Религиозный человек возразит: «Если Коммунизм – религия, то фанаты Звёздных Войн – правительство», и спор начнётся.

Нужно ли определять «религиозного» человека как кого-то, кто имеет определенное мнение о существовании по крайней мере одного бога, то есть присваивает вероятность ниже 10% или выше 90% существованию Зевса? Или его нужно определять как человека, который обладает положительным мнением, говоря, что вероятность существования по меньшей мере одного бога выше 90%? В первом случае Сталина можно назвать «религиозным»; во втором его назвать так нельзя.

Но это определённо неверный подход к проблеме. Что вы действительно хотите знать, о чём действительно был спор – это то, почему на определённых этапах человеческой истории большие группы людей подвергались пыткам и были убиты якобы во имя идеи. Переопределение слова никак не изменит исторических фактов.

Коммунизм был сложной катастрофой, и в ней может и не быть единичной причины, отдельной ссылки, лежащей в основе причинно-следственной цепочки. Но если бы я должен был предложить эй-ошибку, это была бы… ну, я позволю Господу сказать это за меня:

«Если будет уговаривать тебя тайно брат твой, сын отца твоего или матери твоей, или сын твой, или дочь твоя, или жена на лоне твоем, или друг твой, который для тебя, как душа твоя, говоря: „пойдем и будем служить богам иным, которых не знал ты и отцы твои”, богам тех народов, которые вокруг тебя, близких к тебе или отдаленных от тебя, от одного края земли до другого, то не соглашайся с ним и не слушай его; и да не пощадит его глаз твой, не жалей его и не прикрывай его, но убей его; твоя рука прежде всех должна быть на нем, чтоб убить его, а потом руки всего народа; побей его камнями до смерти, ибо он покушался отвратить тебя от Господа, Бога твоего, Который вывел тебя из земли Египетской, из дома рабства» (Второзаконие 13:7—11).

Это аналогично правилу, установленному Сталиным для коммунизма и Гитлером для нацизма: если твой брат пытается рассказать тебе, почему Маркс ошибался, если твой сын пытается рассказать тебе, что евреи не планируют захват мира, то не спорь с ним и не приводи доказательств, не проводи воспроизводимых опытов и не изучай историю, но скорее сдай его секретным службам.

В прошлом посте я предположил, что ключевым моментом в сопротивлении аффективным смертельным спиралям является принцип «дополнительной сложности» – просто помнить, что любое дополнительное положительное заявление добавляет сложности Великой Идее. (Это не тривиальный совет. Люди часто забывают делать это, даже когда слушают прогнозы футуристов, удивительно полные восторженных подробностей о чудесах будущего, что уж тут говорить о тех моментах, когда они в одиночестве рассуждают о своей любимой идее). Это не уберет эффект ореола, однако может снизить резонанс ниже критической отметки, чтобы одно хорошо звучащее заявление не провоцировало больше 1,0 дополнительного хорошо звучащего заявления, в среднем.

Диаметральной противоположностью этому совету, который подвергает эффект ореола сверхкритичности, является момент, когда любой спор против положительных заявлений о Великой Идее ощущается чем-то кощунственным. Политика – убийца разума. Аргументы – солдаты. Как только вы выбираете сторону, вы должны поддерживать все аргументы, свидетельствующие в пользу вашей стороны и опровергать все те, что говорят против нее. Если же вы предоставляете помощь стороне врага, то вы – предатель.

Если…

…вы думаете, что любой, кто указывает на недостатки теории эволюции, будет сторонником креационизма;

…вы ощущаете, что получаете духовные очки за любую хорошую вещь сказанную вами о Боге, и спорить об этом – вмешиваться в ваши отношения с Богом;

…у вас есть четкое ощущение, что другие люди в комнате осудят вас за «поддержку вражеской стороны», если вы будете приводить аргументы против последней войны;

…сказать что-либо против коммунизма для вас смерти подобно;

…тогда аффективная смертельная спираль становится сверхкритичной. Теперь это Аффективная Смертельная Супер-Спираль.

Это не религия как таковая, это ключевая систематизация, относящаяся к нашему исходному вопросу: «Что приводит к жестокости?». Лучшее определение различий, которое я слышал, между «сверхъестественным» и «натуралистическим» мировоззрением, это то, что сверхъестественное заявляет существование онтологически базовых ментальных сущностей, наподобие духов, в то время как натуралистическое сводит ментальные явления к нементальной природе. Концентрация на этом как на источнике проблемы поддерживается в религиозной исключительности. Заявления сторонников сверхъественного мировоззрения стоит выделить, поскольку они всегда ошибочны по фундаментальным причинам. Но это всё ещё только один вид ошибок.

Аффективная смертельная спираль может зарождаться вокруг сверхъестественных убеждений; особенно вокруг монотеистических религий, центральное место в которых занимает сверхсчастливый агент, в основном определеяемый как соглашающийся с любым хорошим заявлением про его религию; особенно вокруг тех, в которых комплексы мемов развились достаточно для того, чтобы заявлять о сверхъестественной каре за неверие. Однако смертельная спираль может возникнуть и вокруг политической инновации, харизматичного лидера, веры в национальную идею или экономическую гипотезу. История учит, что аффективные смертельные спирали опасны, вне зависимости от того, включают ли они в себя сверхъестественное или нет. Религия как класс ошибок недостаточно выделяется, чтобы рассматриваться как ключевая проблема.

Сэм Харрис подобрался ближе к истине, когда обвиняюще указал на само явление веры. Если вы не налагаете бремя доказательства на всякое и каждое дополнительное хорошее заявление, то впасть в аффективный резонанс необычайно просто. Посмотрите на бедных последователей Нью Эйдж. В христианстве развилось множество видов защиты от критики, выступая в защиту чудес веры; последователи Нью Эйдж в культурном отношении унаследовали кэшированную мысль, что вера – это хорошо, однако не имеют ограничивающего их Писания, которое могло бы оградить их от конкурирующих мемов. В конечном итоге течение Нью Эйдж погрязло в смертельных спиралях вокруг звезд, деревьев, магнитов, диет, заклинаний, единорогов…

Но аффективная смертельная спираль становится много опаснее, когда критика становится грехом, бестактностью или преступлением. В мире существуют вещи, которые заслуживают огромной похвалы, и вы не можете точно сказать, где для них проходит граница между заслуженной и незаслуженной похвалой. Однако не существует Идеи, настолько истинной, что будет неправильно критиковать любой аргумент, поддерживающий ее. Таких идей нет и не будет. Никогда. Во веки веков. Это точно. Большая часть возможных убеждений в нетривиальном пространстве ответов ложна, и подобным образом большая часть возможных аргументов в их поддержку тоже ложна, и даже самая лучшая идея не сможет это изменить.

И втройне неправильно отвечать на критику насилием. В человеческом искусстве рациональности крайне мало запретов без всяких «если», «и», «но» или каких-либо исключений. Но вот это – один из них. На плохой аргумент находится контраргумент. Но не пуля. Никогда. Во веки веков.

Перевод: 
Remlin, Klok
Номер в книге "Рациональность: от ИИ до зомби": 
108
Оцените качество перевода: 
Средняя оценка: 4 (7 votes)

Охлаждение групповых убеждений при помощи испарения

Элиезер Юдковский

Ранние исследователи культов были удивлены, когда обнаружили, что когда культы получают сильный удар — пророчество ли не сбывается, или на свет выплывают грешки основателя культа — они часто возвращаются даже сильнее чем прежде, с усиленным убеждением и фанатизмом. Свидетели Иеговы предсказывали Армагеддон в 1975, основываясь на своих вычислениях из Библии; 1975 пришел и ушел. Культ Анафемы, все еще действующий и в наши дни, выжил после того как предсказанный им интергалактический флот не появился 27 сентября 1975. (Статья в Википедии про данный культ упоминает несбывшееся пророчество касательно 2001 года, однако обходит стороной ранний провал в 1975, что уже достаточно интересно.)

Почему же групповое убеждение становится сильнее после встречи со столь разрушительным контр-свидетельством?

Стандартное объяснение данного явления основано на теории когнитивного диссонанса. Когда люди производят «невозвратные» действия в поддержку убеждения — отдают все свое имущество в ожидании прилета НЛО — они просто не могут признать, что они ошиблись. Вызов их убеждению представляется громадным когнитивным диссонансом; им приходится усилить свои мысли, чтобы противостоять шоку, таким образом укрепляясь в своем фанатизме. В данной интерпретации увеличение группового фанатизма есть результат увеличения фанатизма индивидуального.

Я смотрел на джава-апплет, который показывал использование охлаждения испарением для получения конденсата Бозе-Эйнштейна, когда до меня дошло, что совершенно другая сила может отвечать за увеличение фанатизма. Охлаждение испарением устанавливает барьер потенциальной энергии вокруг собрания горячих атомов. Тепловая энергия по существу статистична по природе — не все атомы движутся с совершенно одинаковой скоростью. Кинетическая энергия каждого атома варьируется, поскольку атомы сталкиваются друг с другом. Если вы устанавливаете барьер потенциальной энергии немного выше, чем средняя тепловая энергия, то при случайном стечении обстоятельств какой-то атом может получить достаточно кинетической энергии, чтобы вылететь из ловушки. Группа при этом становится существенно холоднее, чем барьер потенциальной энергии вокруг нее. Различные действия с апплетом помогли мне понять это яснее.

В классическом «Когда пророчество не сбывается» Фестингера один из членов культа уходит сразу же, как только НЛО не появляется. Кто встанет и уйдет первым? Средний член культа? Или относительно более скептичный участник, который ранее мог действовать как сдерживающий голос, успокаивавший более фанатичных последователей?

После того, как члены с наибольшей кинетической энергией уходят, все поздние дискуссии будут проходить между ярыми фанатиками с одной стороны и чуть менее ярыми фанатиками с другой стороны, при этом мнение всей группы получится где-то «посередине» между ними.

Аналогично ли это преобразованию в форму конденсата Бозе-Эйнштейна? Конечно же реальной необходимости настолько подгонять аналогию нет. Но вы можете вспомнить, что я использовал аналогию с цепной реакцией для аффективной смертельной спирали; когда группа отторгает все свои голоса, которые ее сдерживали, тогда все люди, подбадривая друг друга и подавляя инакомыслящих, могут внутри группы увеличивать средний уровень фанатизма. (Здесь нет аналогий с термодинамикой, пока кто-либо не откроет ядерное оружие, которое взрывается будучи холодным.)

Когда долгое партнерство Айн Рэнд и Натаниэля Брандена прекратилось, существенная часть общества объективистов последовала за Бранденом в его «новую систему» объективизма, которая была уже не так тесно связана с Айн Рэнд. Кто же остался с ней после этого скандального разрыва? Те, кто на самом деле верил в нее — и возможно несколько молчунов, которые после ухода большей части сообщества, могли слышать только аргументы одной стороны. Это может объяснить то, что последователи Института Айн Рэнд (по некоторым источникам) стали еще более фанатичны после раскола, чем исходная группа объективистов под руководством Рэнд и Брандена.

Несколько лет назад я состоял в списке рассылки для трансгуманистов, где была маленькая группа поддерживающая «социальный демократический трансгуманизм», едко оскорбляя каждого либертарианца (сторонника полной свободы мысли и деятельности), включенного в этот список. Большинство либертарианцев покинуло список, многие из оставшихся сдались и перестали писать. В результате оставшаяся группа сдвинулась существенно в сторону левых взглядов. Произошло ли это преднамеренно? Скорее всего нет, поскольку я не думаю, что виновники настолько знали психологию. (Если уж на то пошло, не могу вспомнить другой столь похожей на аналогию с охлаждением испарением ситуации, хотя это не значит, что их не было). В крайнем случае они могли стремиться стать «наибольшей рыбой в маленьком пруду».

Это одна причина того, почему столь важно быть терпимым к допустимому нонконформизму. Не стоит выкидывать члена группы, даже если вам показалось, что это оправдано — хотя бы подождите, чтобы убедиться, что это и в самом деле необходимо. Если вы выкидываете старых нонконформистов, то позиция группы сдвигается и их место занимает кто-то еще. Если вы удаляете и их, то вы явно встали на путь становления конденсатом Бозе-Эйнштейна, ну и, последующего взрыва.

Обратная сторона: Томас Кун верил, что наука должна стать «парадигмой», использующей свой технический язык, который исключает посторонних, прежде чем она реально начнет работать. В стадиях формирования науки, согласно Куну, приверженцы науки прилагают множество усилий, чтобы она была доступна не только им. Но (опять же по Куну) наука может прогрессировать как техническая дисциплина только если откажется от требования внешней доступности, и только ученые, работающие в рамках парадигмы, будут тесно знакомы с ней, используя основной технический материал для коммуникации между собой. Это звучит цинично по отношению к тому, что обычно утверждается об общественном понимании науки, однако я определенно вижу в этом рациональное зерно.

Моя собственная теория модерирования в Интернете гласит, что вы должны исключить троллей и спам, чтобы получить нормальный разговор. Вы должны даже исключить вежливых, но технически неосведомленных людей из специализированных технических списков рассылки, если вы хотите, чтобы работа продвигалась. Полностью открытое обсуждение в Интернете крайне быстро деградирует. При этом следует быть осторожным при исключении из обсуждения адекватных троллей — они служат для реализации скрытой функции легитимации возражений. Однако у вас не должно быть настолько много троллей, чтобы они начинали спорить уже друг с другом или доминировать в обсуждениях. Если у вас есть один человек, который известен как Парень-Не-Согласный-Со-Всем-На-Свете, любой, у кого будет более разумное и резонное возражение, не будет выглядеть кем-то выделяющимся. Правда на практике у меня эта теория работала не слишком хорошо, так что не слишком увлекайтесь ею.

Перевод: 
Remlin, Elspet
Номер в книге "Рациональность: от ИИ до зомби": 
109
Оцените качество перевода: 
Средняя оценка: 4.4 (5 votes)

Когда никто не смеет призывать сдерживаться

Элиезер Юдковский

Однажды утром я встал с постели, включил компьютер и мой почтовый клиент Netscape автоматически скачал для меня новости дня. В этот день все новости говорили о том, как два угнанных террористами самолета врезались в башни Центра международной торговли.

И первой мыслью было:

«Полагаю, что я действительно живу в Будущем.

Спасибо небесам, что это не была ядерная бомба».

А затем:

«Чрезмерная реакция на это событие будет в десять раз хуже, чем само событие».

И просто «в десять раз хуже» оказалось огромным преуменьшением. Даже я не мог догадаться насколько плохо всё будет. Это является вызовом пессимизму. Действительно тяжело нацеливаться достаточно низко, чтобы быть приятно удивленным, в то время как часто и как много вы будете удивлены неприятно.

Тем не менее, я немедленно понял, что все и везде будут говорить как ужасно, как плохо было это событие; и что никто не будет озабочен тем, чтобы быть голосом сдерживания, соответствующего ответа. Изначально, 11 сентября, это была мысль, что шесть тысяч людей умерли. Любой политик, который сказал бы «6000 смертей это всего лишь восьмая часть от жертв автомобильных аварий», сразу бы был бы снят со своей должности.

Нет, 11 сентября не было хорошим днем. Но если все заработали баллы на подчеркивании того, как это ужасно, и никто не озаботился призвать к сдержанности, указав насколько трудно нанести ответный удар, то реакция будет выше требуемого адекватного уровня, каким бы ни был этот уровень.

Это темнейшее отражение смертельной спирали счастья — спираль ненависти. Любой, атакующий Врага — патриот; и любой, кто пытается критически проанализировать даже единственное негативное утверждение о Враге — предатель. Но, как и большинство всех сложных утверждений далеки от истины, большая часть негативных вещей, которые вы можете сказать о ком-либо, даже о самом плохом человеке в мире, будут ложны.

Думаю, что лучшей иллюстрацией будет «террористы-смертники были трусами». Можно хотя бы немного здравого смысла, пожалуйста? Чтобы добровольно направить самолет на здание нужно немного храбрости. При всех их грехах, трусость явно не входила в этот список. Но я предполагаю, что все плохое, что вы скажете о террористах, неважно насколько глупы ваши слова, должно быть правдой. Наберу ли я еще больше баллов, если обвиню Аль-Каиду в том, что это они подстроили убийство Кеннеди? А если обвиню их в том, что они сталинисты? Что, неужели правда трусость?

Да, это значит, что террористы не были трусами. Это нужно не только для понимания реальной психологии врага. Просто слишком много урона наносит спираль ненависти. Просто слишком опасно, чтобы для нее в мире была цель, будут ли это евреи или Адольф Гитлер, о котором говорят куда больше негативных слов, нежели приводят точных фактов.

Когда обороняющаяся сторона имеет тысячи самолетов и сотни тысяч хорошо вооруженных солдат, она должна понимать, что ее собственная иммунная система может нанести больше ущерба, нежели 19 мужчин на четырех гражданских самолетах. США потратили миллиарды долларов и тысячи солдатских жизней, стреляя себе в ногу более эффективно, нежели любая террористическая группировка может мечтать.

Если бы США полностью проигнорировали атаку 11 сентября — пожали бы плечами и отстроили здания — то это был бы лучший метод действий, нежели тот, что был предпринят. Однако это не выбор политиков. Даже если бы кто-то из них в частном порядке предположил бы, что иммунный ответ будет более разрушителен, нежели сама болезнь, это осталось бы предположением в частном порядке, потому что американские политики вынуждены идти прямо в ловушку Аль-Каиды, иначе их карьера будет уничтожена. Кто угодно, кто голосует за ответный удар всеми силами — патриот. Любой, кто призывает к сдержанности и критикует патриотические заявления — предатель.

В самом начале были и более умные реакции на это событие, чем я предположил. Я видел конгрессмена, правда, забыл какого, который перед камерами сказал: «Мы забыли, что в первую очередь целью государства является не экономика, не здравоохранение, а защита страны от атак». Меня это удивило — что политик мог сказать что-то, что не выглядит как табличка с надписью «аплодисменты». Должно быть он испытывал сильный эмоциональный шок, раз сказал что-то похожее на реальность.

Однако за два дня шок прошел и работа на публику снова стала доминирующим видом деятельности в политическом дискурсе. Спираль эскалации полностью завладела им. Когда никто не смеет призывать к сдержанности, не имеет значения откуда началась дискуссия, уровень ярости и безрассудства со временем только растет.

Дополнение: Привет, реддиторы! Вы также можете насладиться «Сказом о науке и политике» и «Политические дебаты не должны быть односторонними».

Перевод: 
Remlin, Elspet
Номер в книге "Рациональность: от ИИ до зомби": 
110
Оцените качество перевода: 
Средняя оценка: 4.8 (9 votes)

Эксперимент в Робберс Кейв

Элиезер Юдковский

Примечание редактора сайта: В настоящее время корректность эксперимента в Робберс Кейв, на который ссылается Юдковский в этом эссе, всерьёз оспаривается. При переиздании первых двух томов книги «Рациональность: от ИИ до Зомби» в 2018 году это эссе было из книги исключено.

Думали ли вы, когда были ребенком, что бессмысленная поездка в летний лагерь на самом деле могла иметь скрытую от вас цель — например, что это был научный эксперимент, а воспитатели в лагере на самом деле были исследователями, которые наблюдали за вашим поведением?

Я — никогда.

Но такие мысли начинают приходить в голову чаще, когда мы читаем «Исследование межгруппового конфликта: эксперимент в национальном парке Робберс Кейв» Шерифа, Харви, Уайта и Худа (1954/1961). В этом исследовании подопытными, простите, «отдыхающими» — были 22 мальчика 5-го — 6-го года обучения, выбранные из 22 разных школ Оклахома-сити, из стабильных протестантских семей среднего класса, которые хорошо учились в школе. Средний IQ их составлял 112. Они все были социально адаптированы и похожи друг на друга в той степени, насколько это было возможно.

Эксперимент, проведенный после недавно отгремевшей Второй Мировой, был задуман для исследования причин — и возможных путей решения — межгруппового конфликта. Как они создали межгрупповой конфликт для изучения? Они разделили 22 мальчиков на две группы по 11 человек и — и этого было вполне достаточно.

Исходный план исследователей состоял из трех этапов. На первом обе группы свели вместе (группы не знали друг о друге). К концу первого этапа каждой группе сообщили о существовании другой. На втором этапе различные соревнования были призваны окончательно разделить мальчиков на группы.

Однако второй этап не понадобился. Группы начали относится друг к другу враждебно, как только узнали о существовании разделения на группы: «они используют нашу территорию лагеря, нашу бейсбольную площадку». На первой же встрече группы начали обмениваться оскорблениями. Они называли себя Гремучниками и Орлами (пока они были одной группой, им не требовались подобные прозвища).

Когда, в соответствии с процедурой эксперимента, было объявлено о начале соревнований, соперничество среди групп возросло до максимума. Здоровый спортивный дух в соревнованиях держался не более двух дней, после чего быстро пошел на спад.

Орлы украли флаг Гремучников и сожгли его. Гремучники совершили набег на лагерь Орлов и украли джинсы их лидера, покрасили их в оранжевый цвет и вывесили как свой флаг, с надписью «Последний из Орлов». Орлы совершили ответный набег и перевернули кровати Гремучников, бросаясь грязью. После этого они вернулись в свой лагерь и начали готовиться к отражению набега со стороны Гремучников. После того как Орлы выиграли в последнем из соревнований этапа 2, Гремучники украли их призы. Это перетекло в драку, которую персоналу лагеря пришлось прекратить, чтобы избежать увечий среди детей. Орлы при этом, пересказывая эту историю, превратили все это в свою победу, утверждая что они преследовали убегающих Гремучников, хотя на самом деле это было не так.

У каждой группы развился отрицательный стереотип «Их» и положительный стереотип «Нас». Гремучники много ругались. Орлы, после выигрыша в одной из игр, сделали вывод что они выиграли, потому что молились, а Гремучники проиграли, потому что сквернословили всё время, и поэтому Орлы решили прекратить ругаться вообще, а также прекратить общение с Гремучниками. Орлы позиционировали себя как правильных и высокоморальных; Гремучники избрали себе образ грубых хулиганов.

Члены одной группы немедленно задирали носы, как только видели другую.

На третьем этапе исследователи пытались уменьшить разногласия между двумя группами.

Больше общения (без попыток примирения) не помогло уменьшить враждебность между группами. Посещение различных увлекательных мероприятий вместе — например, совместный запуск фейерверков — также не помогло; мальчики чуть снова не передрались.

Можете ли вы предположить, что сработало?

Подумайте.

Мальчикам сказали, что в лагере ожидаются перебои с водой из-за поломки в системе водоснабжения — возможно из-за каких-то вандалов.
(Внешний Враг, один из старейших трюков в книге.)

На площади между лагерем и резервуаром были расположены четыре проблемных места. (Изначально данные об этих местах рассказали членам каждой группы равномерно). Если в них ничего не было найдено, то следовало искать в резервуаре с водой. Поскольку найдено ничего не было, группы встретились у резервуара и увидели, что вода не идет из крана. Группы обсудили возможные проблемы, осмотрели резервуар, нашли лестницу наверх, проверили, что вода в резервуаре присутствует и наконец обнаружили, что кран был забит мешком с соломой. Все мальчики собрались вокруг крана, чтобы прочистить его. Предложения от членов обоих групп по проблеме рассматривались совместно и обе группы старались реализовать их.

Когда кран был наконец-то прочищен, Гремучники, у которых были фляжки, не возражали против того, чтобы Орлы первыми набирали воды (у Орлов фляжек не было). Никаких оскорблений между группами не наблюдалось, даже уже привычного «Сначала дамы!».

Это не стало концом вражды. Были еще столкновения и оскорбления, уже на следующий день. Однако после нескольких подобных общих заданий, в которых требовались совместные усилия обоих групп — наподобие вытаскивания застрявшего грузовика — соперничество прекратилось. В конце путешествия ребята из Гремучников даже использовали 5 долларов, выигранных в соревновании, чтобы угостить молочными коктейлями ребят из Орлов.

Эксперимент в Робберс Кейв иллюстрирует психологию племен охотников и собирателей, которая тянется с давних времен, настолько хорошо, насколько возможно для эксперимента, проведенного в социальных науках.

Любое сходство с современной политикой — всего лишь ваше воображение.

(Иногда я думаю, что вторая по важности вещь, которая требуется человечеству — это суперзлодей. Может я этим займусь, когда закончу с текущей работой.)

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
111
Оцените качество перевода: 
Средняя оценка: 4.6 (10 votes)

Любая деятельность хочет быть культом

Элиезер Юдковский

Cade Metz в The Register недавно заявил, что секретный почтовый список топ-администраторов Википедии помешался на бане всех критиков и возможных критиков Википедии. Включая баны продуктивных юзеров, когда один администратор — исключительно из-за продуктивности — начинает уверять, что юзер был шпионом, подосланным Обзором Википедии. И что большинство людей в Википедии закрыли свои ранги для своей защиты. (Я сам не исследовал эти заявления пока еще. Информация была предоставлена Eugen Leitl.)

Существует какой-то неявный моральный изъян в систематизации мировых знаний, который приводит последователей этой причины в безумие? Возможно только люди с врожденной тягой к тоталитаризму попытались бы стать мировыми авторитетами во всем…

Осторожно: фундаментальная ошибка атрибуции! (Фундаментальная ошибка атрибуции: делать выводы о чьем-либо характере на основе поведения, которое может быть полностью объяснено ситуацией, в которой находится этот человек. Когда мы видим, как кто-либо пинает торговый автомат, мы думаем, что это «злой человек», но когда мы сами пинаем автомат, мы объясняем это тем, что опоздали на автобус, не успели на поезд и к тому же автомат работает не так как надо.) Если высказывания о Википедии истинны, то они объясняются обычной человеческой природой, а не необычными сторонами данной природы.

Деление на «своих» и «чужих» — это часть обыденной человеческой натуры. Как и смертельные спирали счастья и спирали ненависти. Благородное Дело не обязано содержать дефект, чтобы его последователи сформировали культ. Достаточно, чтобы они были людьми. Все остальное произойдет само собой, так же закономерно, как то, что еда портится в холодильнике, если отключили электричество.

В таком же смысле, что любая температурная разница хочет свестись к нулю и любая программа хочет стать набором патчей, любая деятельность хочет быть культом. Это состояние с высокой энтропией, в которое развивается система, аттрактор в человеческой психологии. И не имеет значения, даже если Дело по-настоящему Благородно. Вы можете думать, что Хорошее Дело растянуло бы свою хорошесть на все аспекты людей, которые с ним связаны — что последователи Дела также меньше заинтересованы в статусных играх, искажении «своих» и «чужих», аффективных спиралях, обожествлении лидеров. Но вера в истинную идею не отменяет гало-эффекта. Благородное дело не делает его последователей чем-то превосходящим обычных людей. Есть множество плохих видов деятельности, из-за которых может произойти множество плохого — но вред не всегда происходит только из-за того, что исходная идея была плоха.

Каждая группа людей с необычной целью — хорошей, плохой, глупой — будет склонна становится аттрактором культа, если члены группы не предпринимают постоянных усилий, чтобы сопротивляться этому. Вы можете сделать так, чтобы у вас дома было прохладнее, чем на улице, однако вам для этого придется держать кондиционер включенным, и как только вы выключите его — сдадитесь в поединке с энтропией — вещи вернутся к «нормальному состоянию».

Как-то был случай, когда существовала группа с лозунгом «Рациональность! Причина! Объективная реальность!» (Больше об этом в следующих постах.) Навешивание на Великую Идею ярлыка «рациональность» защитит вас не более, чем вывешивание на доме таблички «Холодно!» Вам все еще нужно включить кондиционер — тратить требуемую энергию, чтобы компенсировать естественное сползание в культ. Поклонение рациональности не сделает ваш разум яснее, как поклонение гравитации не позволит вам летать. Вы не можете говорить с термодинамикой и молиться теории вероятности. Вы можете использовать это, но не можете присоединиться к этому как к группе.

Культовость количественна, а не качественна. Вопрос «Есть ли здесь признаки культа, да или нет?» — неправильный. Правильный вопрос — «В какой мере это является культом и где именно это проявляется?» Даже в Науке, которая является архетипической По-Настоящему Благородной Деятельностью, мы можем без труда указать на рубежи борьбы против энтропии культа, где текущая линия боя колеблется то туда, то обратно. Журналы склонны в большей степени принимать статьи с хорошо известной авторской подписью или от неизвестного источника из хорошо известного института по сравнению со статьями от неизвестного автора из неизвестного института? Какая доля убеждения диктуется авторитетом, а какая — экспериментом? Какие журналы используют «слепой метод» обзора и насколько это эффективно?

Я привожу этот пример, а не обычные расплывчатые обвинения «Ученые недостаточно открыты новым идеям», потому что он показывает линию фронта — место, где отбрасывается человеческая психология, где откидывается накопленная энтропия культа (конечно, это требует потерять немного тепла на излучение).

Данный пост – это не сборник методов противостояния культовости. О некоторых таких методах я говорил ранее, о некоторых расскажу позднее. Но сегодня я просто хочу указать, что служение Делу не значит, что вы можете тратить меньше усилий на противостояние аттрактору культа. И что если вы можете указать где сейчас пролегает рубеж, это не значит, что вы можете признать вашу Благородную Деятельность низкой. Вы можете думать, что если бы вопрос был поставлен как «Культ это или нет?», то вам бы пришлось ответить нет, или иначе предать вашу Идею. Но это похоже на то, как если бы вы делили двигатели на «идеально эффективные» и «неэффективные», вместо того, чтобы измерить их расход.

И наоборот, если вы верите, что это Изначальная Испорченность этих Глупых Прочих Дел заставила людей ошибаться, если вы смеетесь над глупостью «жертв культа», если вы думаете, что культы возглавляются и популяризируются мутантами — тогда вы не потратили нужных усилий на противостояние энтропии — на сопротивление бытию человеком.

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
112
Оцените качество перевода: 
Средняя оценка: 4 (7 votes)

Хранители истины

Элиезер Юдковский

Иногда рационалистов критикуют следующим образом: «Инквизиция тоже думала, что у нее есть истина! Ясное дело, что вся эта затея с „истиной“ опасна».

Есть множество очевидных ответов, таких как «Если вы думаете, что одержимость истиной дает вам право пытать и убивать, то вы совершаете ошибку, не имеющую ничего общего с эпистемологией». Или «Так данное историческое утверждение, которое вы только что сделали насчет инквизиции – истинно ли оно?»

Обратное глупости не есть ум: «Если ваш компьютер перестал работать, то вы не говорите, что вообще все в нем сломано и что вам нужен совершенно новый, с совершенно другими комплектующими… Возможно, вам нужен всего лишь новый шнур питания». Чтобы сделать неверное заключение, достаточно ошибиться всего в одном шаге, не обязательно нужно ошибиться во всех шагах. Инквизиторы верили, что 2+2=4, однако не это было источником их безумия. Так может быть проблема вовсе не в эпистемологическом реализме?

Кажется правдоподобным, что если бы инквизиторы были релятивистами, которые утверждали бы, что нет ничего истинного и ничего не имеет значения, то они были бы менее склонны проявлять жестокость. Также они были бы менее жестоки, если бы подверглись лоботомии. Думаю, это справедливая аналогия.

И еще… я считаю, что играет роль отношение инквизиции к истине. Она верила, что существует такая вещь как истина, и что истина важна; ну, в этом взгляды инквизиции были схожи со взглядами Ричарда Фейнмана. Но инквизиторы не были искателями истины. Они были ее хранителями.

Я однажды читал утверждение (не могу найти источник), что ключевым компонентом духа времени является то, где расположены идеалы этого времени, в прошлом или будущем1. Почти все культуры до Просвещения верили в грехопадение - что когда-то все было совершенным в далеком прошлом, однако случилась катастрофа и с тех пор все медленно становится хуже:

В эпоху, когда жизнь на Земле была полна… Они любили друг друга и не знали, что это была „любовь к ближнему“. Они никого не обманывали, хотя не знали, что значит „человек, которому можно верить“. Они были надежны, пусть и не знали, что значит „добросовестность“. Они свободно жили вместе, делясь всем, не зная, что они щедры. По этой причине про них не рассказывают. У них не было истории».

— Путь Чжуан Цзы, перевод Томаса Мертона.

Совершенная эра прошлого, в соответствии с нашими лучшими антропологическими свидетельствами, никогда не существовала. Но культура, которая рассматривает жизнь как неумолимо катящуюся под откос, сильно отличается от той, в которой вы можете достичь невиданных высот.

(Я говорю «культура», а не «общество», поскольку внутри общества может существовать больше одной субкультуры.)

Вы можете возразить, что есть разница между упомянутым Ричардом Фейнманом и инквизицей – вторые верили, что истина уже у них, а первый искал ее. Это не особо хороший довод, поскольку несомненно были истины, которыми обладал и Ричард Фейнман. «Небо синее», например, или «2+2=4».

Да, в науке есть определенные истины. Теория общей относительности возможно будет переписана в будущей физике – однако не такой теорией, что будет предсказывать вращение Солнца вокруг Юпитера; новая теория должна утаскивать успешные предсказания из старой, а не противоречить им. Но эволюционная теория находится на более высоком уровне, чем атомы, и ничто из того, что мы откроем насчет кварков, не заставит нас отбросить дарвинизм, клеточную теорию в биологии, атомную теорию в химии, или сотню других блестящих теорий, истинность которых на данный момент не оставляет сомнений.

Это «абсолютные истины»? Нет, если вопрос стоит о присвоении им вероятности равной буквально единице. Но они представляют собой случаи, где наука по существу считает их истиной.

И еще ученые не пытают людей, которые ставят под сомнение атомную теорию химии. Почему нет? Потому что они не верят, что она дает им право на жестокость? Ну, да, этот ответ лежит на поверхности; но почему они в это не верят?

Потому что химия не заявляет о сверхъестественном возмездии в виде вечных пыток за неверие в атомную теорию химии? Но тогда мы опять рекурсивно возвращаемся к вопросу «Почему?». Почему химики не верят, что вы отправитесь в ад, если не верите в атомную теорию?

Потому что журналы не опубликуют вашу статью, пока у вас не будет прочного экспериментального наблюдения Ада? Но слишком многие ученые могут подавить свои рефлексы скептика сознательно. Почему же у химиков нет закрытого культа, который говорил бы, что все не-химики отправятся в Ад, учитывая, что многие из них – христиане?

Вопросы такого рода не имеют ответов, которые бы говорили только об одном факторе. Но я бы поспорил, что один из факторов должен касаться отношения к истине – которое может быть направлено на защиту или на прогресс.

Когда вы – хранитель истины, вы не делаете ничего полезного, чтобы дополнить истину, только охраняете ее. Когда вы пытаетесь выиграть Нобелевскую премию по химии, открыв новый бензол или фуллерен, кто-то, кто бросает вызов атомной теории, является для вас не противником вашей точки зрения, а скорее пустой тратой времени.

Когда вы – хранитель истины, все что вы может делать, это пытаться избежать неуклонного сползания в энтропию путем отбрасывания всего, что отклоняется от истины. Если есть какой-то путь противостоять энтропии, генерировать новые истинные убеждения с малым расходом тепла, то этот же метод может сохранять истину без применения тайной полиции. В химии вы можете воспроизвести эксперимент и своими глазами увидеть его результаты – и это хранит истину без необходимости применять жестокость.

И не так страшно, если мы сделаем где-то ошибку – всего лишь недолго наши убеждения будут немного не истинны – поскольку завтра мы сможем вернуть утраченные позиции в истине.

Но работает только вся схема, поскольку экспериментальный метод представляет собой «критерий доброкачественности», который превосходит «критерий сравнения». Поскольку эксперименты могут восстановить истину без необходимости в авторитете, они также могут «отменять» авторитет и создавать новые истинные убеждения, которых прежде не существовало.

Там, где есть критерий доброкачественности вместо критерия сравнения, там дело меняется так, что присутствуют улучшения вместо угроз. Там, где властвует критерий сравнения, нет возможности вернуть прошлый авторитет, нет и пути разрешить несогласие между авторитетами. За исключением уничтожения. Выигрывает тот, у кого пушка больше.

Я не собираюсь представлять грандиозную всеохватывающую точку зрения на историю с позиции единого фактора. Я просто хочу указать на глубокое психологическое различие между тем, чтобы видеть смысл жизни в защите, охране и сохранении, и видеть его же в исследовании, создании, улучшении. Развитие будет происходить если вы направлены в прошлое или в будущее? Это нюанс в различии, который проявляет себя всюду.

Вот почему я всегда настаивал, например, что если вы собираетесь начать говорить об «этике ИИ», вам лучше бы говорить о том, как вы собираетесь улучшить текущую ситуацию с ИИ, а не пытаться предохранить от того, чтобы сделать что-то неправильно. Как только вы начинаете использовать критерий сравнения, вы начинаете терять курс ваших идеалов – терять свет правильного и неправильного, и начинаете просто выискивать «различное» и «одинаковое».

Я также могу поспорить, что эта простейшая психологическая разница – одна из причин, почему академическая область, которая прекращает активный прогресс, стремится к среднему.(По крайней мере по чистым стандартам науки. Репутационное убийство – обычное дело по стандартам истории; большинство систем убеждений на основе защитного подхода произошли от взаимодействия с реальными вещами). Если большие встряски не происходят достаточно часто, чтобы постоянно поощрять молодых ученых ориентироваться на признание заслуг, а не на конформизм, область перестает сопротивляться стандартной дегенерации в авторитарность. Когда делается мало открытий, то остается слишком много времени на то, чтобы заняться «охотой на ведьм и еретиков».

Чтобы получить лучшие результаты от использования отношения вида исследовать/создавать/улучшать, вы должны на самом деле прогрессировать, а не только надеяться на это.

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
113
Оцените качество перевода: 
Средняя оценка: 4 (7 votes)

Хранители генофонда

Элиезер Юдковский

Как любой образованный житель 21 столетия, вы могли слышать о Второй Мировой войне. Вы можете помнить, что Гитлер и нацисты планировали ускорить процесс эволюции, вывести новую расу господ, сверхлюдей, сильнее и умнее всех людей, когда-либо живших ранее.

На самом деле это распространенное заблуждение. Гитлер верил, что сверхлюди-арийцы уже существовали ранее — стереотип нордического человека, голубоглазого блондина-хищника, который был загрязнен смешиванием с нечистыми расами. Своего рода расовое «грехопадение».

Это говорит о степени, в которой идея прогресса пронизывает западную цивилизацию — что когда человеку говорят о нацистской евгенике, он слышит «Они пытались вывести сверхчеловека». Ты, дорогой читатель — если ты будешь ошибаться настолько, чтобы одобрить принудительную евгенику, ты бы попытался создать сверхчеловека. Потому что твои идеалы расположены в будущем, не в прошлом. Потому что ты мыслишь творчески. Мысль о том, чтобы вернуться обратно к нордическому архетипу, обратно через эти тысячи лет, не будет даже рассмотрена тобой как возможность — что, всего лишь вернуться к викингам? И все? Собраться убивать людей в процессе исследований и не достигать при этом новых высот — это же более чем бесполезная трата времени и ресурсов, разве нет? И это одна из причин, по которой тебя, дорогой читатель, нельзя назвать нацистом.

Это говорит о том, как трудно относительно здоровому человеку влезть в шкуру относительного больного, как говорят о нацистах, и исказить историю так, чтобы сделать из них несовершенных трансгуманистов.

Коммунисты были теми, кого можно назвать несовершенными трансгуманистами. «Новый советский человек» и все такое. А нацистов можно с большой долей вероятности назвать лишь биоконсерваторами.

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
114
Оцените качество перевода: 
Средняя оценка: 4.6 (8 votes)

Хранители Айн Рэнд

Элиезер Юдковский

Для скептиков идея того, что разум может вести к культу, — абсурд. Характеристики культа противоположны разуму. Но, как я продемонстрирую, это не только может случиться — это уже случилось, причем с такой группой людей, что произошедшее следовало бы назвать самым невероятным культом в истории. Это урок того, что происходит, когда правда становится важнее, чем ее поиск…

— Майкл Шермер, «Самый невероятный культ в истории».

Я думаю, Майкл Шермер чрезмерно детально объясняет, что такое объективизм. Я попробую предельно расширить и развить эту идею.

Романы Айн Рэнд возвеличивают технологии, капитализм, индивидуальный вызов Системе, ограниченное в полномочиях правительство, частную собственность, себялюбие. Основной герой Рэнд, Джон Галт, был ученым, который изобрел новую форму дешевой возобновляемой энергии, но затем отказался отдать ее миру, потому что выгода была бы украдена и пошла бы на поддержку порочного правительства.

И потом — каким-то образом — это все превратилось в этико-философскую «закрытую систему» с Айн Рэнд в центре. Термин «закрытая система» — это не мое собственное обвинение, это термин, который использует Институт Айн Рэнд для описания объективизма. Объективизм определяется работами Айн Рэнд. Теперь, когда Айн Рэнд умерла, объективизм как система закрыт. Если вы не согласны с работами Рэнд в каком-нибудь отношении, вы не можете быть объективистом.

Макс Глакман однажды сказал: «Наука есть любая дисциплина, в которой дурак этого поколения может превысить порог, достигнутый гением предыдущего поколения». Наука движется вперед, уничтожая своих героев: так Ньютон пал перед Эйнштейном. Каждый молодой физик мечтает о том, чтобы стать новым чемпионом, о свержении которого будут мечтать будущие физики.

Философским кумиром Айн Рэнд был Аристотель. Ну, может быть, Аристотель был молодым и горячим математическим талантом 2350 лет назад, но математика заметно прогрессировала с его времен. Байесовская теория вероятности — это количественная логика, частным случаем которой является качественная логика Аристотеля, но ничто не указывает на то, что Айн Рэнд была знакома с байесовской теорией, когда писала свой magnum opus, «Атлант расправил плечи». Рэнд писала о «рациональности», однако даже не ознакомилась на должном уровне с современными исследованиями в области эвристики и предвзятости. Как вообще кто-то может называть себя искусным рационалистом, не зная таких элементарных вещей?

«Подождите минутку, — возражает читатель, — но это же нечестно! «Атлант расправил плечи» был опубликован в 1957! Практически никто не знал о Байесе тогда». Пфф. Вы мне еще скажите, что Айн Рэнд умерла в 1982 и никак не могла прочитать «Суждение в условиях неопределенности: эвристика и искажения», поскольку книга была опубликована в том же году.

Наука вообще нечестна. В этом как бы вся соль. Честолюбивый рационалист в 2007 году имеет огромное преимущество перед честолюбивым рационалистом в 1957. Это признак того, что прогресс происходит.

По-моему, мысль о том, чтобы добровольно принять систему, эксплицитно привязанную к убеждениям одного человека, который уже умер, где-то между дурью и самоубийством. Компьютеру нужно меньше пяти лет, чтобы стать устаревшим.

Колебание, движение, которым Рэнд восхищалась в науке, коммерции, каждой железной дороге, заменявшей путь эпохи извозчиков, каждом небоскребе, построенном по принципу новой архитектуры, рождается из принципа необходимости превзойти старых мастеров. Как можно говорить о науке, если самый умный ученый на свете уже жил? Кто бы поднял линию небоскребов в Нью-Йорке, которая так восхищала Айн Рэнд, если бы самое высокое здание в мире уже было построено?

И тем не менее Айн Рэнд не признавала никого, кто бы превосходил ее, в прошлом и не допускала появления такого человека в будущем. Рэнд, которая начала с восхищения разумом и индивидуальностью, закончила тем, что предавала остракизму всякого, кто смел ей противоречить. Шермер: «[Барбара] Брэнден вспоминала вечер, когда знакомый Рэнд сказал, что любит музыку Рихарда Штрауса. “Когда он ушел в конце вечера, Айн сказала (и такая реакция становилась все более типичной для нее): «Теперь я понимаю, почему мы с ним никогда не сможем быть действительно единомышленниками. У нас непреодолимо разное ощущение жизни». Нередко она даже не ждала, пока ее знакомый уйдет, чтобы сделать подобное замечание”».

Айн Рэнд изменилась со временем, полагаю.

Рэнд выросла в России и видела Октябрьскую революцию своими глазами. Ей дали визу для визита родственникам в Америке, когда ей был 21 год, и она никогда не возвращалась на родину. Просто ненавидеть авторитаризм, когда ты его жертва. Просто отстаивать свободу личности, когда ты угнетен.

Нужны гораздо более сильные склад ума и характер, чтобы бояться власти, когда у тебя есть сила. Когда люди обращаются к тебе за ответами, тяжелее сказать: «Что, черт побери, я могу знать о музыке? Я ж писатель, а не композитор», — или: «Черт знает, как любовь к музыкальному произведению может быть ошибочной».

Когда это ты сокрушаешь тех, кто смеет тебя оскорбить, применение силы выглядит гораздо более извинительным, чем когда сокрушают тебя. Всевозможные прекрасные оправдания любого рода каким-то образом приходят на ум.

Майкл Шермер детально описывает то, как, по его мнению, философия Рэнд пришла в итоге к тому, что опустилась до культовости. В частности, Шермер говорит (по крайней мере так кажется), что объективизм провалился, потому что Рэнд думала, что точность, уверенность возможна, тогда как наука никогда не бывает абсолютно точна. Не могу согласиться с Шермером. Атомная теория строения вещества в химии просто-таки чертовски точна, она неоспорима. Но химики не образовали вокруг нее культ.

Вообще говоря, я думаю, что Шермер становится жертвой фундаментальной ошибки атрибуции, предполагая, что есть однозначная корреляция между философией Рэнд и тем, как ее последователи образовали культ. Всякое дело хочет стать культом.

Айн Рэнд бежала из Советского Союза, написала понравившуюся многим книгу об индивидуализме, получила множество комплиментов и сформировала кружок обожателей. Ее поклонники говорили о ней все более и более приятные вещи, и она слишком наслаждалась этим, чтобы сказать им заткнуться (аффективная смертельная спираль). Она поняла, что у нее есть сила, достаточная, чтобы сокрушить всех, кого она не одобряла, и она не стала противиться искушению силы.

Айн Рэнд и Натаниэль Брэнден имели внебрачную связь. (С разрешения обоих их супругов, что дорого стоит, на мой взгляд. Если хотите представить это как «проблему», нужно уточнить, что их супруги были несчастны — и все равно это не касается посторонних.) Когда открылось, что Брэнден «изменял» Рэнд с еще одной женщиной, Рэнд впала в ярость и предала его анафеме. Многие объективисты откололись от объединения, когда об этой связи стало известно.

Кто остался с Рэнд вместо того, чтобы последовать за Брэнденом или совсем бросить объективизм? Ее самые уверенные сторонники. Кто ушел? Те, кто был голосом умеренности. (Это охлаждение групповых убеждений.) С этих самых пор власть Рэнд над оставшимися была абсолютна, и сомнения и вопросы не дозволялись.

Единственная необыкновенная вещь во всем этом — то, насколько обыкновенно все сложилось.

Вы могли бы подумать, что система убеждений, восхваляющая «разум», и «рациональность», и «индивидуализм», могла бы как-нибудь приобрести что-то вроде особого иммунитета…

Ну, не приобрела.

Это сработало так же успешно, как если бы кто-нибудь повесил табличку «Холодно» на холодильник, не включенный в розетку.

Активное усилие, необходимое для того, чтобы противостоять энтропии, не было предпринято, и тогда последовало неминуемое разложение.

И если вы называете это «самым невероятным культом в истории», вы просто называете реальность противными словами.

Пусть это будет уроком всем нам: восхваление «рациональности» ничего не стоит. Даже сказать: «Вы должны доказывать все ваши убеждения с помощью Разума, а не просто соглашаться с Великим Лидером», — значит просто запустить автоматическую программку, которая берет любое высказывание Великого Лидера и генерирует доказательство, которое вашим товарищам-последователям покажется Разум-ным.

Так где же найти истинное искусство рациональности? В изучении математических основ теории вероятности и теории принятия решений. В постижении когнитивных наук вроде эволюционной психологии или эвристики и искажений. В чтении исторических книг…

«Изучайте науку, а не только меня!» — это, наверное, самый важный совет, который Айн Рэнд должна бы была дать своим последователям, но не дала. Не было на земле человека, чьи плечи были бы достаточно широки, чтобы выдержать весь груз истинной науки, в которую вносят лепту столь многие.

Стоит отметить, я думаю, что герои Айн Рэнд были инженерами и архитекторами, Джон Галт, ее самый важный герой, был физиком, и тем не менее сама Айн Рэнд не была великим ученым. Насколько мне известно, она не была особенно хороша в математике. Она не могла возвыситься до соперничества с собственными героями. Может быть, поэтому она начала сбиваться с пути Tsuyoku Naritai.

Ну вот я, знаете, я восхищаюсь дерзостью Фрэнсиса Бэкона, но я уверен, что вправе застенчиво признаться: «Если б я мог перенестись назад во времени и как-нибудь объяснить Фрэнсису Бэкону проблему, над которой сейчас работаю, у него б глаза выскочили из глазниц, как пробки из бутылок шампанского, и взорвались».

Я восхищаюсь достижениями Ньютона. Но мое отношение к избирательному праву женщины начисто исключает возможность воспринимать Ньютона как образец морали. Точно так же, как мое знание байесовской теории вероятности не дает мне воспринимать Ньютона как абсолютный, непоколебимый, неоспоримый источник математического знания. И мое знание о специальной теории относительности, пусть она и не слишком известна и малоупотребима, препятствует тому, чтобы воспринимать Ньютона как абсолютный авторитет в физике.

Ньютон по объективным причинам не мог выяснить то, что я ставлю выше его идей, — но прогресс нечестен! В этом вся суть!

У науки есть герои, но нет богов. Великие Имена — это не те, кто превзошел нас, и даже не наши соперники — это уже пройденные вехи нашего пути, и самой важной вехой будет герой, которому еще предстоит появиться.

Быть еще одной вехой на пути человечества — это самая лучшая судьба для кого угодно, но она, по-видимому, оказалось слишком непритязательной, чтобы угодить Айн Рэнд. Так Айн Рэнд стала всего лишь Великим Пророком.

Перевод: 
Анна Сапунцова
Номер в книге "Рациональность: от ИИ до зомби": 
115
Оцените качество перевода: 
Средняя оценка: 3.8 (53 votes)

Два коана о культах

Элиезер Юдковский

Первый коан

Некий начинающий рационалист учился у мастера Оги. Однажды друг упрекнул его: «Ты постоянно слушаешь своего мастера и рассуждаешь про рациональное то и рациональное сё, — ты попал в лапы секты!».

Новичок был глубоко встревожен. Слова «Ты попал в лапы секты!» гремели в ушах, когда он ложился спать в ту ночь, и преследовали даже во сне.

На следующий день новичок подошел к мастеру Оги и рассказал о случившемся. «Мастер, меня постоянно терзают мысли о том, что я попал в самую настоящую секту, а ваше учение — не что иное как догма».

Оги ответил: «Если ты найдешь на дороге молоток и продашь его, то можешь запросить за него мало или много. Но если ты оставишь молоток себе и будешь заколачивать им гвозди, то кто станет сомневаться в его ценности?».

Новичок заявил: «Вот, именно это меня и беспокоит — ваши таинственные ответы в духе дзен».

Оги сказал: «Ладно, буду выражаться проще и приведу совершенно разумные аргументы, которые продемонстрируют, что ты попал не в секту. Но сначала ты должен надеть эту дурацкую шляпу».

Оги протянул новичку огромную коричневую ковбойскую шляпу.

«Э-э, мастер…», — начал было новичок.

«Когда я всё объясню», — прервал его Оги, — «ты поймешь, почему это было необходимо. Ну, или можешь и дальше не спать ночами, мучаясь вопросом о том, секта это или нет».

Новичок надел ковбойскую шляпу.

Оги заговорил: «Как долго ты будешь повторять мои слова и игнорировать их смысл? Беспорядок в мыслях начинается с привязанности к предпочитаемым выводам. Тебя слишком тревожит, насколько ты выглядишь рационалистом в своих глазах. Ты пришел ко мне, чтобы снова обрести уверенность. Если бы ты был по-настоящему любопытным, то, не зная в какую сторону двигаться, ты искал бы способ разрешить свои сомнения. Поскольку ты хотел избавиться от когнитивного диссонанса, ты охотно надел дурацкую шляпу. Будь я плохим человеком, я бы заставил тебя заплатить сотню серебряных монет. Когда задумываешься над вопросом, связанным с реальностью, полезность или бесполезность твоего знания скоро становится очевидной. Ты же уподобился мечнику, что беспрестанно кидает взоры по сторонам, — уж не засмеялся ли кто-нибудь над ним?..».

«Ладно-ладно, я понял!» — воскликнул новичок.

«Ты просил длинную версию», — заметил Оги.

Позднее этот новичок стал преемником Оги и обрел известность под именем Ни но Тачи. С той поры он не позволял ученикам цитировать свои слова в их дебатах, говоря: «Используйте техники, а не ссылайтесь на них».

Второй коан

Начинающий рационалист подошел к мастеру Оги и сказал: «Учитель, меня беспокоит, что наши рациональные додзё… ну… слегка сектантские».

«Это серьезный повод для беспокойства», — заметил Оги.

Новичок подождал немного, но Оги молчал.

Поэтому новичок заговорил снова: «Я имею в виду, что нам приходится носить эти мантии с капюшонами, — в них мы выглядим, прошу прощения, типа как хреновы масоны».

«А, — проронил Оги, — мантии и внешние атрибуты».

«Ну, да, мантии и атрибуты, — подхватил новичок. — Выглядят просто ужасно нерациональными».

«Я рассею все твои опасения, — ответил мастер, — но сначала ты должен надеть эту дурацкую шляпу». И Оги вытащил шляпу волшебника, украшенную полумесяцами и звездами.

Новичок взял шляпу, оглядел и возопил в отчаянии: «Да как она вообще может помочь!»

«Ты очень беспокоишься о взаимодействии одежды с теорией вероятности, — изрек Оги, — поэтому неудивительно, что для достижения понимания ты должен носить специальную шляпу».

Когда новичок завершил обучение, он взял себе имя Боузо1 и обсуждал рациональность не иначе как в клоунском наряде.

  • 1. В оригинале «Bouzo». Это имя созвучно имени популярного в США персонажа-клоуна Bozo. — Прим.перев.
Перевод: 
Sergey Skeptic
Номер в книге "Рациональность: от ИИ до зомби": 
116
Оцените качество перевода: 
Средняя оценка: 4.5 (12 votes)

Эксперимент Аша о конформизме

Элиезер Юдковский

Соломон Аш, с помощью экспериментов, поставленных в 1950-е, а впоследствии хорошо воспроизводившихся, привлек внимание к явлению, которое сейчас известно как конформизм. В классическом эксперименте испытуемый видел загадку вроде той, что приведена на рисунке: «Какая из полос A, B, C той же длины, что и полоса X? Подумайте минутку, чтобы определиться с ответом».

Источник

Подвох был в том, что испытуемый проходил тест вместе с другими людьми, которые тоже смотрели на рисунок. Они играли роль других испытуемых, однако на деле были сообщниками экспериментатора. Эти «испытуемые» в эксперименте, один за одним, утверждали, что линия С той же длины, что и Х. Как много людей в такой ситуации согласились бы с этим очевидно неверным ответом, соглашаясь с мнением большинства? Каков по вашему мнению был их процент?

Три четверти испытуемых в эксперименте Аша дали «конформистский» ответ хотя бы раз. Треть испытуемых «подстраивалась» более чем в половине случаев.

Интервью после эксперимента показали, что хотя большинство участников заявили о своем неверии в данные ими конформистские ответы, несколько утверждали, что они на самом деле считали, что ответ большинства был верен.

Аша встревожили данные результаты:

«То, что обнаруженная нами склонность к конформизму в нашем обществе столь сильна … представляет собой определенную проблему. Перед нами встают вопросы о том, как мы получаем знания и какими ценностями руководствуемся при выборе действий.»

Вели ли себя испытуемые экспериментов Аша иррационально - нетривиальный вопрос. Теория Ауманна о согласии показывает, что честнейшие байесианцы не могут согласиться не соглашаться - если у них общие данные о их оценках вероятностей, их оценка будет одинаковой. Теорема Ауманна была доказана спустя больше чем двадцать лет после экспериментов Аша, однако она только формализует и укрепляет интуитивно понятную точку зрения - убеждения других людей часто являются легитимным свидетельством.

Если вы смотрите на рисунок, подобный приведенному выше, при этом зная тот факт, что другие люди в эксперименте были честны и смотрели на тот же рисунок, говоря, что С такого же размера, что и Х, каковы шансы, что только вы дали правильный ответ? Я не претендую на хорошее визуальное мышление - и не думаю таким образом, что я лучше среднего человека смогу определить, одинакового ли размера эти две линии. С точки зрения индивидуальной рациональности, я надеюсь, что заметил бы свое сильное замешательство и потом присвоил бы вероятность >50% мнению большинства.

С точки зрения групповой рациональности, мне кажется, что правильней всего для честного рационалиста было бы сказать, «Странно, но для меня одинаковыми выглядят В и Х. Но если мы все смотрим на один рисунок и отвечаем честно, у меня нет причины верить, что моя оценка лучше ваших.» Последняя часть важна - это намного менее выраженное заявление о несогласии, чем: «А, так перед нами оптическая иллюзия - я понимаю, почему вы считаете, что ответ С, но на самом деле ответ В.»

Так что нельзя автоматически признать испытуемых-конформистов в данных экспериментах иррациональными, основываясь только на тех данных, что я привел выше. Но, как можно ожидать, дьявол скрывается в подробностях экспериментальных результатов. Согласно мета-анализу сотен подобных опытов, который был сделан Смитом и Бондом (1996):

Конформность существенно возрастала, когда рядом с испытуемым добавляли трех сообщников экспериментатора, однако при дальнейшем увеличении их числа, до 10-15, не росла. Если бы люди использовали конформизм рационально, то мнение 15 испытуемых должно было бы быть существенно более сильным свидетельством, чем мнение трех.

Добавление человека, который не соглашается с мнением группы - который дает верный ответ или даже неверный, но отличающийся от выбора группы - резко снижает уровень конформизма, примерно на 5-10%. Если вы используете интуитивную версию согласия Ауманна, чтобы подумать о том, что когда один человек не соглашается с тремя, то правы скорее всего те трое, тогда в большинстве случаев вы должны бы приходить к тем же выводам, если 2 человека спорят с 6. (Это не автоматически верно, однако при прочих равных условиях - вполне.) С другой стороны, если вы относитесь к эмоционально неустойчивым людям, которым неприятно выделяться, то легко видеть, как даже единичный человек, который согласен с вами, или несогласен с группой, позволяет вам перестать так нервничать.

При этом, что неудивительно, испытуемые в случае, когда в группе помимо них был еще один несогласный с общим мнением, никак не связывали свой нонконформизм с присутствием этого человека. Подобно 90% водителей, которые считают, что водят выше среднего уровня - для некоторых из них это может быть истиной, но вряд ли верно для всех. Люди не знают о причинах своего конформизма или нонконформизма, что опровергает попытку защитить их, говоря, что это было проявлением рациональности. Например, в гипотезе, что люди социально-рационально выбирают лгать, чтобы не выделяться, было, что по крайней мере несколько человек в случае, когда в группе был один несогласный с общим мнением, сознательно не предвидели, что будет «осознанной стратегией», которой они будут следовать, когда встретятся с неанонимной оппозицией.

Когда нонконформист-одиночка вдруг начинает подстраиваться под группу, уровень конформизма испытуемых откатывается к столь же большой величине, как и в случае, когда не было никакого нонконформиста. Первым выступать против мнения группы весьма значимая (и трудная!) социальная деятельность, но ее нужно целенаправленно поддерживать.

Стабильным образом группы, состоящие полностью из женщин (женщина-испытуемая среди женщин — «подсадных уток»), в большей степени подвержены конформизму, чем целиком мужские группы. Подстраивалась более, чем в 50% случаев, примерно половина женщин, в то время как среди мужчин — треть. Если объявить, что средний человек делает выбор рационально, в то время как женщины, очевидно, более «конформисты», а мужчины более «бунтари», — то ни та, ни другая группа не рациональна по-настоящему.

Манипуляции с положением внутри-снаружи группы (то есть искусственное противопоставление подставных несогласных остальной группе) схожим образом показывает, что конформизм существенно выше среди людей, которые входят в группу.

Степень конформизма меньше в случае, когда используются более явные рисунки (например, тот, который приведен на этой странице), по сравнению с теми, где ошибка не столь заметна. Это трудно объяснить, если (все) испытуемые принимают социально рациональные решения с целью избегать того, чтобы выделяться.

Дополнение. Пол Кроули напомнил, что следует учесть падение уровня конформизма в случае, когда испытуемый может дать ответ так, чтобы группа его не слышала. Это также говорит против толкования в духе теоремы Ауманна.

Перевод: 
Quilfe, Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
117
Оцените качество перевода: 
Средняя оценка: 3.6 (14 votes)

Выражая беспокойство

Элиезер Юдковский

Ужасает в экспериментах Аша то, что людей легко заставить назвать черное белым, если поместить их в общество из людей, которые так говорят. Воодушевляет то, что даже при наличии одного-единственного несогласного с мнением толпы уровень конформизма существенно падает, причем для этого даже необязательно, чтобы этот несогласный говорил истину. И тоску наводит тот факт, что данный эффект является обратимым - если несогласный меняет свое мнение и начинает соглашаться с остальными, то уровень конформизма снова начинает расти.

Если вы являетесь нонконформистом для своей группы, то для нее это может быть реально полезно. Но это имеет свою цену. Вам надо будет продолжать этим заниматься, учитывая одновременно то, что вы можете и ошибаться.

Не так давно я получил занимательный опыт в виде обсуждения одного проекта с двумя людьми, у которых уже имелись заранее разработанные планы. По моему мнению, они были чересчур оптимистичны, и поэтому я внес ряд предложений, которые должны были увеличить запас прочности проекта. Вскоре к дискуссии присоединился четвертый участник, который принял сторону одного из тех двоих, и тоже начал вносить предложения. И где-то на этом этапе я осознал механизм работы сверхуверенности в группе - каждый раз, когда я начинал указывать на возможную проблему, четвертый участник тут же говорил что-нибудь ободряющее вроде «Не волнуйся, мы справимся с этим!»

Человек, работающий сам по себе, будет сомневаться просто по своей природе. В его голове постояно будут прокручиваться мысли вида «Точно ли я могу справиться с Х?», поскольку нет ничего предосудительного в том, чтобы сомневаться в собственных силах. Однако когда человек начинает работать в коллективе, поднимать такой вопрос касательно компетентности других людей становится невежливым. Вместе люди более оптимистичны, нежели поодиночке, они подавляют сомнения друг друга при помощи заверений, которые кажутся надежными, ведь человек редко осознает, что другие люди тоже подвержены внутренним сомнениям.

Это самая ужасная черта, которая была показана в экспериментах Аша - что любое беспокойство человека, согласного с группой, подавляется уверенными заявлениями прочих членов группы, которые обеспокоены тем, чтобы скрыть их собственное беспокойство и не понимают, что подобные опасения могут быть и у остальных. Данный феномен известен как «плюралистическое невежество».

Мы с Робином Хансоном долго спорили по поводу того, когда тот, кто претендует на звание рационалиста, должен осмеливаться не соглашаться с остальными. Моя позиция состояла в том, что у вас в любом случае нет никакого иного выбора, кроме как формировать свое мнение. Робин отстаивал более осторожную точку зрения, что именно вы – не только другие люди – должны учитывать, что другие могут быть мудрее. В любом случае мы оба сходимся в том, что расширения теоремы Ауманна о согласии подразумевают чью-либо иррациональность в том случае, если наличествует общее знание о фактическом несогласии. В любом случае, каких бы позиций мы не придерживались, мы сходимся насчет скромности: что бы вам не говорили об индивидуализме, забудьте это и уделите внимание тому, что думают другие.

Итак. Смысл здесь в том, что рационалист должен рассматривать несогласие с группой как нечто весьма серьезное. Нельзя просто отмахнуться, сказав: «Каждый имеет право на свое мнение».

Я считаю, что наиболее важный урок, который можно извлечь из экспериментов Аша, заключается в необходимости отделять «выражение беспокойства» от «несогласия». Поднять тему, которую избегают все остальные, это не то же самое, что пообещать вообще не согласиться с группой в конце обсуждения.

Идеальный байесовский процесс, ведущий к принятию общего мнения, включает в себя обмен свидетельствами, которые непредсказуемы для слушателя. Результат соглашения Ауманна действителен только для общего знания, где вы знаете, я знаю, вы знаете, что я знаю и т.д. Статья Хансона «Мы не можем предвидеть несогласие» показывает картину того, как странно может выглядеть процесс конвергенции между идеальными рационалистами в оценке вероятности; это не похоже на то, словно два покупателя в магазине спорят по поводу цены.

К сожалению, в социуме не принято видеть разницу между «выражением недовольства» и «несогласием». Группа, состоящая из рационалистов, может понимать разницу, но по большей части люди не замечают нюансы этих выражений. Как только вы высказались, вы совершили необратимое социальное действие; вы становитесь гвоздем преткновения, возмутителем спокойствия группы, и вам не удастся отмотать все обратно. Все, кто расценил ваше беспокойство как обвинение в их некомпетентности касательно какой-либо задачи Х, вероятнее всего затаят на вас обиду, если в конце вы объявите о своем согласии с группой.

В эксперименте Аша мы видели как сила нонконформиста реально способна вдохновлять других. И этот же эксперимент показал, что сила конформизма не менее реальна. Если все в группе воздерживаются от высказывания личного мнения, то в конце концов воцаряется хаос. И в то же время не стоит забывать об уроках истории, которые показывают нам, какова цена за право быть одним из первых закричавших «А король-то голый!». Люди по своей природе не привыкли различать «выражение недовольства» и «несогласие даже с общеизвестным»; подобное разграничение является чертой рационалистов. Читая самые циничные книги о помощи себе (такие как «Государь» Макиавелли) вы могли встретить советы скрывать свой нонконформизм и соглашаться с группой, оставляя опасения при себе. И если вы все же решились первым указать на очевидный промах, не ждите, что группа будет благодарна вам за это.

В нонконформизме есть свои плюсы и минусы - как для «выражения беспокойства», так и для «несогласия» - и решение в любом случае только за вами.

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
118
Оцените качество перевода: 
Средняя оценка: 3.9 (10 votes)

Одинокий инакомыслящий

Элиезер Юдковский

Эксперимент Аша показал, что наличие одиночного инакомыслящего резко снижает частоту появления «конформистских» неправильных ответов. Проявлять индивидуализм легко, как показал эксперимент, если вас кто-то поддерживает. Все другие испытуемые в комнате, за исключением одного, говорят, что черное — это белое. Вы становитесь вторым, который говорит, что черное — это черное. И это кажется блистательным: двое, одинокие и непокорные повстанцы, против всего мира! (Дальнейшие интервью показали, что испытуемые, при наличии в группе инакомыслящего, испытывают по отношению к нему сильные товарищеские чувства — хотя, конечно, они не считают, что наличие инакомыслящего влияет на их собственный нонконформизм.)

Но вы в состоянии только присоединиться к протесту уже после того, как кто-нибудь окажется первым бунтарем, кто-нибудь, кто услышав, как все один за другим говорят, что черное — это белое, всё же скажет, что черное — это черное. И это, как показывает эксперимент, намного сложнее.

Бунтарь-одиночка не чувствует себя так, как будто идет в школу в черном рокерском балахоне и в берцах; скорее, он ощущает себя наряженным словно клоун.

В этом разница между тем, чтобы присоединиться к восстанию, и тем, чтобы покинуть стаю.

Если и есть что-то, чего я не могу выносить, так это притворство — вы могли заметить это, если читали какое-то время Overcoming bias. Ну, одинокий инакомыслящий является одной из наиболее распространенных, явно притворных характеристик. Каждый хочет быть ниспровергателем устоев.

Я не говорю, что акт присоединения к восстанию имеет меньшее значение. Есть восстания, стоящие того, чтобы к ним присоединиться. Требуется мужество, чтобы выдержать неодобрение группы, в которой вы состоите, или, что еще хуже, ее равнодушие. Нет нужды говорить, что поход на рок-концерт нельзя назвать восстанием. А вот, например, вегетарианство можно. Сам я не вегетарианец, но уважаю тех людей, которые это практикуют, поскольку я ожидаю, что требуется заметное количество тихого мужества, чтобы сказать людям, что гамбургеры не стоит есть. (Но только не в Bay Area, там это в порядке вещей.)

Однако, если вы скажете, что вы вегетарианец, люди будут думать, что понимают, почему, даже если это не так. Они могут не соглашаться. Они могут обидеться, если вы решите объявить это достаточно гордо, и даже, если на то пошло, они могут обидеться только потому, что их легко обидеть. Тем не менее, они будут знать, как к вам относиться.

Когда кто-нибудь ходит в школу в рокерском балахоне, учителя и прочие школьники понимают, какую роль в этом обществе он тем самым берет на себя. Эта роль именуется «Против Системы!» и является самым типичным способом протеста, который очевиден и понятен всем. Нет, правда, знаешь, я против Системы. Я не такой, как все, я бросаю вызов обывательскому мышлению, и люди возмущенно говорят «не знаю, зачем тебе…», но… на самом деле я не думаю каких-то вещей, до которых еще не додумался никто другой. Как кто-то сказал, «Хоть что-то из антиправительственной литературы, которую вы читали, заставило вас изменить свои политические взгляды?»

Что требует настоящего мужества — так это выдерживать открытое непонимание людей вокруг вас, когда вы делаете что-либо, что не вписывается в сценарий Обычного Восстания №37, что-либо, на что у них нет шаблона реагирования. Они не ненавидят вас за восстание, они просто думают, мол, странный чувак, и отворачиваются. Эта перспектива пугает куда сильнее. В этом различие между объяснением вегетарианства и объяснением крионики. В мире есть и другие сторонники крионики, но рядом с вами их нет. Вы должны объяснить суть этого в одиночку тем людям, которые считают, что это просто странно. Это не является запрещенным, но находится за границами стандартного мышления. Вы хотите чтобы после смерти вашу голову заморозили? Вы думаете, что это поможет вам избежать смерти? Что вы имеет в виду под информацией в мозгу? Э, что? Вы, что, псих?

Я испытываю желание найти объяснение постфактум в эволюционной психологии: вы можете собраться вместе с маленькой группой друзей и уйти из вашего племени, однако остаться в лесу одному — смерти подобно, по меньшей мере потомства вы точно не оставите. Мы не осознаем этого явно, но это не природа эволюционной психологии. Присоединяться к революции, о которой всем известно, страшно, однако куда страшнее делать что-то абсолютно иное. Что-то, что в древние времена могло не просто привести к расхождению во мнениях с группой, но к тому, что вы останетесь одиночкой.

Как в случае со свидетельствами о крионике, страх мыслить по-настоящему другим образом сильнее страха смерти. Охотники и собиратели были готовы встретиться лицом к лицу со смертью — это было частью их повседневной жизни, при охоте на больших млекопитающих или просто перемещении в мире, полном хищников. Им нужно было мужество, чтобы жить. Мужество отрицать стандартные способы мышления племени, вводить мысли, которые кажутся по-настоящему странными — ну, что возможно не особо хорошо служило их носителям. Мы не осмысливаем это явно; эволюционная психология работает не так. Мы, люди, устроены таким образом, что большинство из нас скорее пойдет прыгать с парашютом, нежели подписываться на крионику.

И это не высшая степень мужества. В мире не один крионист. Но только Роберт Эттингер сказал это первым.

Чтобы сделать революцию в науке, вы должны быть первым человеком, который возразит тому, что думают все. Это не единственный путь к величию в науке; это редкость даже среди великих. Никто не может совершить революцию в науке только попытками имитировать революционность. Вы можете попасть туда, только гоняясь за верным ответом в любой области, и не имеет значения, будет ли он революционен или нет. Но если, в свое время, если поглотив всю мощь и мудрость уже накопленных знаний, если, после всего этого и толики удачи, вы обнаруживаете, что погоня за точным ответом ведет на новую территорию… вот тут и появляется возможность проверить ваше мужество.

Настоящее мужество одинокого инакомыслящего, которое пытается изобразить каждая рок-группа.

Конечно не все, для чего требуется мужество, является хорошей идеей. Мужество нужно и для того, чтобы прыгнуть со скалы, но скорее всего при этом вы просто расшибетесь в лепешку.

Страх одинокого инакомыслящего препятствует хорошим идеям, однако не каждая идея, которая противопоставляет человека остальным, является хорошей. Смотрите также «Robin Hanson’s Against Free Thinkers». Наибольшая трудность в том, чтобы обладать новой истинной научной мыслью в «истинной» части.

На самом деле не обязательно отличаться от остальных только чтобы сделать вид отличающегося. Если вы делаете вещи по-другому только когда вы видите необыкновенно хорошую причину, у вас все равно будет более чем достаточно проблем, чтобы заполнить весь остаток вашей жизни.

Вокруг есть несколько настоящих сборников бунтарей. Церковь НедоМудреца, например, похоже, действительно направлена на приведение людей в замешательство, а не просто на то, чтобы обидеть их. И есть островки подлинной терпимости в мире, такие как конвенты научной фантастики. Есть некоторые люди, которые не боятся выходить из группы. Таких людей существует куда меньше, чем представляется, но они есть. Но все же научные революционеры встречаются редко. Вдумайтесь в это.

Теперь я, знаете ли, на самом деле бунтарь. Все думают, что они бунтари, но для меня это истина, видите ли. Я бы всегда носил клоунский костюм в школе. Мои разговоры были серьезными только с книгами, но не с другими людьми.

Но если вы думаете, что вы бы всегда носили этот клоунский костюм, тогда не гордитесь этим слишком сильно! Это всего лишь значит, что вам нужно прилагать усилия в противоположном направлении, чтобы избегать проявлять инакомыслие исключительно по привычке. Это то, что я должен делать, чтобы исправлять свою собственную природу. Другие люди имеют причины мыслить так, как они это делают, и игнорировать это — столь же плохо, как и бояться возражать им. Вы не хотели бы закончить как свободный мыслитель. Это не добродетель, как можно видеть — это лишь другое когнитивное искажение.

Перевод: 
Quilfe, Remlin, Elspet
Номер в книге "Рациональность: от ИИ до зомби": 
119
Оцените качество перевода: 
Средняя оценка: 4.7 (12 votes)

Культовая контркультовость

Элиезер Юдковский

В современном мире присоединиться к культу — возможно одна из наиболее плохих вещей, которые могут с вами произойти. В лучшем случае вы окажетесь в группе хороших, но запутавшихся людей, которые просто ошибаются, но не имеют против вас ничего плохого в принципе. Тогда вы всего лишь потратите много времени и денег, ничего не получив взамен. На самом деле, это описание подходит любому провалившемуся стартапу в Кремниевой долине. Что подразумевает под собой чертовски тяжелый опыт, если подумать. Так что да, это все же достаточно страшно.

Но настоящие культы намного хуже. Демонстративное проявление внимания и заботы к человеку, находящемуся в личном кризисе, как техника вербовки. Депривация сна. Стимулируемая апатия от тяжелой работы. Удаленные коммуны для изоляции новообращенного от друзей и семьи. Ежедневные собрания для исповеди в нечистых мыслях. Не является необычным для культов и забирать все деньги новообращенного — все сбережения плюс зарплата — заставляя его зависеть от культа даже в отношении еды и одежды. Голодание как наказание за неподчинение. Серьезный ущерб здоровью и промывка мозгов.

Принимая все это во внимание, наверное, я должен больше симпатизировать тем людям, которые ужасно нервничают, начиная делать что-то, что странно выглядит, по поводу того, не попали ли они в культ. Это не должно действовать мне на нервы. Хотя действует.

Момент первый: «культы» и «не-культы» это не отдельные естественные виды как собаки и кошки. Если вы посмотрите на любой список характеристик культа, вы увидите черты, которые легко обнаруживаются в политических партиях и корпорациях — «члены группы призывают не доверять внешней критике как имеющей скрытые мотивы», «иерархическая структура власти». Я постил групповые режимы неудач, типа раскола группы, смертельных спиралей счастья, некритичности и охлаждения испарением, каждый из которых усиливает другие. Когда все эти недостатки растут и встречаются друг с другом, они все вместе комбинируются в супер-Недостаток, глупее, чем каждая из составляющих его частей, типа Вольтрона. Но это не сущность культа; это его аттрактор.

Собаки рождаются со своей ДНК, а кошки со своей. В нашем мире нет существ, которые имели бы среднюю между ними ДНК. (Даже с учетом генетических манипуляций, далеко не просто создать существо с половиной собачьих генов и половиной кошачьих.) И невероятно, что кошачьи гены внезапно мутируют наполовину и дадут кошке половину собачьих характеристик, превратив ее в гибрида.

Человеческое сознание, когда думает о категориях, похоже, предпочитает сущности аттракторам. Оно хочет сказать «это культ» или «это не культ», и тем самым завершить задачу классификации. Если вы наблюдаете, что у Сократа десять пальцев, он носит одежду и говорит по-гречески, тогда вы можете сказать «Сократ — человек» и из этого вывести «Сократ уязвим к болиголову» без проведения тестов крови, чтобы подтвердить его смертность. Вы выводите человечность Сократа раз и навсегда.

Но если вы наблюдаете определенную группу людей, которая похоже проявляет внутригрупповое-внешнегрупповое разделение и видите эффект положительного ореола вокруг их Лучшей Штуки В Мире — которой может быть объективизм, вегетарианство или нейронные сети — вы не можете из свидетельств на данный момент вывести, достигли ли они уже некритичности. Вы не можете вывести, истинна ли их идея или ложна, или действительно полезна, но совсем не в той степени, как они думают. Из информации, собранной к текущему моменту, вы не можете вывести всегда ли они так вежливы, или они заманивают вас, чтобы изолировать от остальных и лишить вас сна и еды. Характеристики культа присутствуют не все и отсутствуют не все.

Если посмотреть поверх аргументов типа «Х это культ», «Х это не культ», то можно видеть, что одна сторона смотрит на список характеристик культа, находит те, что совпадают и говорит «Поэтому это культ!», а противная сторона находит список не совпадающих характеристик и возражает «Поэтому это не культ!».

Вы не можете сформировать точную картину динамики группового мышления используя данный вид эссенциализма. Вам нужно уделить внимание каждой характеристике отдельно.

При этом обратное глупости не есть ум. Если вы заинтересованы в центральной идее, а не в группе, которая ее реализует, то умные идеи могут иметь глупых последователей. Множество последователей Нью Эйдж болтали о «квантовой физике», однако это никак не свидетельствует против самой квантовой физики. Разумеется, глупые идеи тоже могут иметь глупых последователей. Из бинарного эссенциализма следует мысль, что если вы определяете, что группа является «культом», то их убеждения должны быть ложными, поскольку ложные убеждения являются характеристикой культа, равно как мех является одной из характеристик кошки. Если же вы интересуетесь идеей, то смотрите на нее, а не на людей. Культовость — это в большей степени характеристика групп, а не гипотез.

Вторая ошибка — это когда люди нервно спрашивают «Это же не культ, да?». Для меня это звучит так, словно они ищут уверений от рациональности. Понятие рационалиста не привязано к их виденью самого себя настолько, насколько этого заслуживает. Но даже не вдаваясь в детали, конечно любой может видеть, что нервный поиск уверений не лучший шаблон, в котором сознание может оценивать вопросы рациональности. При этом ваше любопытство не является искренним и вы не ищете способы проверить свои сомнения. Вместо этого вы приметесь искать некий внешний источник, который скажет вам, что культы используют депривацию сна для управления людьми, отметите, что Ваша-Любимая-Группа так не делает и сделаете вывод «Это не культ! Ура!». Если нет шерсти, то это не должна быть кошка. Весьма ободряюще.

Но любая деятельность стремится стать культом, и не имеет значения, осмысленна ли она сама по себе или глупа. Дихотомия «свои-чужие» — часть человеческой природы, а не бич отдельных мутантов. Рациональность это исключение, а не правило. Вы должны прилагать постоянные усилия, чтобы поддерживать рациональность и не давать себе естественно съехать в энтропию. Если вы решили «Это не культ» и вздохнули с облегчением, тогда вы больше не будете прилагать усилий для противостояния обычным тенденциям съезжания в культ. Вы решите, что сущности культа тут нет и прекратите сопротивляться энтропии аттрактора культа.

Если вы ужасно тревожитесь о принадлежности к культу, тогда вы захотите убрать любое упоминание о любой характеристике, которая сигнализирует о культе. Но любая группа, которая видит цель в позитивном свете, рискует поддаться эффекту ореола и должна прилагать усилия, чтобы избежать смертельной спирали. Это истинно даже для обычных институтов, таких как политические партии — люди, которые думают, что либеральные или консервативные ценности могут вылечить рак и т.д. Это истинно для стартапов Кремниевой долины, как провальных, так и успешных. Истинно для пользователей Маков и пользователей Линукс. Эффект ореола не становится хорошим только потому, что все вокруг делают так же; если все пойдут прыгать в пропасть, вы не пойдете. С ошибками в мышлении нужно сражаться, а не примиряться. Но если вы слишком тревожитесь о «Вы уверены, что это не культ?», тогда вы будете отказываться видеть любой знак культовости, поскольку это будет подразумевать, что вы в культе, и — это не культ!!! Так что вы не увидите настоящее поле боя, где обычные тенденции к культу либо наступают, либо отбрасываются.

Третья ошибка того, чтобы тревожно спрашивать «Это же не культ, да?» это то, что, я подозреваю, тревожность при этом присутствует там по неправильным причинам.

Почему группы, которые возносят свои Счастливые Штуки до небес, вдохновляют своих членов пожертвовать им деньги и добровольно работать на них без оплаты, формируют частные общины, в которых члены группы тесно связаны друг с другом, зовутся «религиями», а не «культами», если единственное отличие их в том, что они существуют больше нескольких сотен лет?

Почему большинство людей, которые нервно спрашивают о крионике «Это же не культ, да?» не настолько тревожатся, когда уделяют внимание предвыборной гонке, принимая сторону демократов или республиканцев? Дихотомии «свой-чужой» и спирали счастья могут образовываться в политических дебатах, в основных религиях, в спортивных сообществах. Если бы тревожность происходила из страха сделать ошибку в рациональности, люди бы спрашивали «Это не дихотомия «свой-чужой»?» о политической гонке точно с тем же уровнем страха.

Есть легитимная причина бояться либертарианства меньше, чем культа летающих тарелок, поскольку у либертарианства нет репутации использования депривации сна для обращения людей в свою веру. Однако у крионики тоже. Так почему же люди больше волнуются о том, что голова человека будет заморожена после остановки дыхания?

Подозреваю, что данная тревожность — это не страх веры в ложь и не страх физических увечий. Это страх оказаться одиноким инакомыслящим. Тревожность, в которую впадали испытуемые в экспериментах Аша, когда другие подопытные (на самом деле — сообщники экспериментатора) один за одним говорили, что линия С одинакова с Х, хотя испытуемый видел, что одинаковы В и Х. Страх отстать от группы.

Вот почему группы, убеждения которых существуют так долго, что стали казаться «нормальными», не провоцируют такой тревоги, как «культы», хотя при этом те же основные религии вполне могут забрать все ваши деньги и отослать вас в монастырь. Вот почему группы наподобие политических партий, которые очевидно ложны в рациональности, не провоцируют такой тревожности как «культы». Слово «культ» не используется для обозначения ошибок в рациональности; оно используется как ярлык для всего, что кажется странным.

Не каждое изменение является улучшением, но каждое улучшение является изменением. Если вы хотите сделать что-то лучше, то у вас нет другого выбора, кроме как делать это по-другому. Да, общепринятая мудрость включает в себя немалый объем настоящей мудрости; да, имеет смысл сначала получить побольше доказательств действенности того, что кажется странным. Но тревожность не является разновидностью взвешенного рационального соображения. Это страх поверить во что-то, что заставит ваших друзей смотреть на вас как на натурального психа. И поэтому люди спрашивают «Это не культ, да?» таким тоном, каким никогда не говорят о политических выборах или покупке большого телевизора.

И это меня сильно достает.

Это словно бы как только вы поверите во что-то, во что не верят ваши предки, Фея Культа спускается с небес и заражает вас Сущностью Культа, и следующее, что вы помните — вы все носите робы и поете гимны. Словно «странные» убеждения являются прямой причиной проблем, а не лишение сна и побои. Что вред, наносимый культами — вроде суицида с целью попасть на небеса и так далее — просто показывает, что все со странными убеждениями сумасшедшие; что первой и основной характеристикой «членов культа» является то, что они — необычные аутсайдеры.

Да, социально необычное убеждение содержит для группы риск сформировать дихотомию «свой-чужой», попасть под влияния охлаждения испарением и т.д. Но необычность — это фактор риска, а не само расстройство. Точно то же происходит, если есть цель, про которую вы думаете, что она стоит достижения. Не имеет значения, истинно это убеждение или нет — обладание хорошей целью всегда подставляет вас под риск смертельной спирали счастья. Но это делает возвышенные цели фактором риска, а не пороком. Некоторые цели на самом деле стоят того, чтобы стремиться к их осуществлению.

С другой стороны, я не вижу легитимных причин для лишения сна или угроз побоями оппозиционерам, и точка. Когда группа это делает, то независимо от того, зовете вы ее «культом» или нет, у вас есть прямой ответ на прагматичный вопрос, стоит ли к ней присоединяться.

Проблема четвертая: страх одинокого инакомыслящего это что-то, что сами культы используют. Страх того, что твои друзья будут смотреть на вас с осуждением — это тот эффект, который настоящие культы используют чтобы привлекать людей и удерживать их у себя — помещая новообращенных в окружение, состоящее только из последователей культа.

Страх странных идей и склонность к конформизму, без сомнения, помогли многим потенциальным жертвам избежать культов. Когда вы вне культа, они помогают вам сохранить это положение. Но когда вы находитесь внутри культа — они не дают вам выйти. Конформизм просто удерживает вас там, где вы находитесь, не разбирая, хорошее это место или нет.

Человек хочет, чтобы существовал способ, при помощи которого он мог бы убедиться, что он не в «культе». Некий определенный неопровержимый аргумент, который можно предъявлять людям, которые смеются над ним. Способ, который раз и навсегда бы убедил его, что он занимается правильным делом и избавил бы его от постоянных сомнений. Я верю, что это и называется «потребность в завершении». И — конечно же — культы тоже это используют.

И вот фраза «культовая контркультовость».

Жизнь с сомнением не является добродетелью — назначение любого сомнения — это уничтожить само себя, либо подтвердившись, либо опровергнувшись, и сомнение — это то, что просто удерживает на месте, ничего не давая достичь. Но иногда сомнение действительно требует времени, чтобы самоуничтожиться. Жизнь с набором сомнений, которые в текущий момент еще не разрешены — неизбежный факт в жизни рационалиста. Сомнение не должно быть страшным. Иначе вам придется выбирать между тем, чтобы жить загнанным и тем, чтобы жить глупым.

Если вы на самом деле искренне не понимаете, является ли группа культом, тогда вы просто должны выбирать в условиях неопределенности. А для этого существует теория принятия решений.

Проблема пять: недостаток стратегического мышления.

Я знаю людей, которые принимают решения насчет Сингулярности только взвесив все, и аналогичным образом они действуют при оценке политических партий и основных религий. Взвешенно, а не тревожно или защищаясь. Эти люди могут видеть с первого взгляда, что Сингулярность, очевидно, не является полномасштабным культом с лишением сна и прочим. Но они считают, что он станет культом, вследствие факторов риска, таких как превращение концепции сильного ИИ в Сверх-Счастливого Агента (агента, в основном определяемого как соглашающийся с любым хорошим утверждением о нем). То, что нечто не является культом в данный момент, не означает, что оно не станет культом в последующем. Культовость является аттрактором, а не сущностью.

Раздражает ли меня такой вид благоразумия? Конечно же нет. Я и сам провожу немало времени, размышляя о таком сценарии развития событий. Я стараюсь так выставить мои камни го, чтобы блокировать это направление. Например, одним из проявлений этого является серия постов об ошибках культов в мышлении.

Люди, говорящие о «рациональности» также имеют повышенный фактор риска. Давать людям советы как думать — это по определению опасное занятие. Но это фактор риска, а не порок.

Оба моих любимых занятия имеют риск стать культом. Но почему-то я слышу вопросы вида «А вы уверены, что это не культ?» куда чаще, когда говорю о сильном ИИ, нежели когда говорю о теории вероятности и когнитивных науках. Я не знаю, выше ли один фактор риска другого, но знаю, что из этих двух занятий звучит страннее…

Проблема шесть с вопросом «Это же не культ, да?»…

Просто сам вопрос по себе ставит меня в весьма раздражающую безвыходную ситуацию. Настоящий Злой Гуру, конечно, использовал бы тревожность человека против него самого и придумал бы удобный и подробный аргумент, который объяснил бы Почему Это Не Культ, который человек хотел бы принять. Иногда у меня складывается такое впечатление, что это то, чего люди от меня хотят! Что бы я ни пытался писать о культовости и как ее избежать, я не могу избавиться от ощущения, словно я поддаюсь этому порочному желанию — что в конце концов я все же даю людям уверение. Даже когда говорю людям, что нужно постоянно бороться с энтропией.

Такое ощущение, что я — первый инакомыслящий в эксперименте Аша, который говорит остальным: «Да, линия Х на самом деле такая же как линия В, и нормально говорить, что это так». У них не должно быть необходимости спрашивать! Или, что даже хуже, ощущение такое, что я привожу подробный аргумент Почему Это Не Культ. Это неправильный вопрос.

Просто посмотрите на процессы мышления той группы сами и решите для себя, то ли это, частью чего вы хотите быть, как только отставите в сторону страх странного. Только вы ответственны за остановку себя от мышления в стиле культа, и не имеет значения, с какой группой вы на самом деле работаете.

Когда кто-либо спрашивает «Это же не культ, да?», то, вне зависимости от моего ответа, я всегда ощущаю себя так, словно защищаю что-то. Мне не нравится это чувство. Это не работа мастера-байесианца — уверять и успокаивать, и не работа рационалиста — защищаться.

Культы паразитируют на групповой тревожной потребности в уверениях. Вы не можете заставить тревожность уйти только пожелав этого, а ложная самоуверенность при этом будет только хуже. Если кто-либо ищет уверений — пусть даже уверений в том, чтобы быть рационалистом — это значит, что в его броне есть брешь. Умелый мечник концентрируется на цели, а не на том, чтобы оглядываться вокруг — не смеется ли кто над ним. Когда вы знаете, что вы пытаетесь сделать и зачем, вы будете знать, получается ли это у вас или нет, и помогает ли вам в этом ваша группа, или только мешает.

(Постскриптум: если кто-то придет к вам и спросит «Вы уверены, что это не культ?», не пытайтесь объяснить все вышеприведенное за один заход. Вы при этом недооцените понятийные расстояния. Человек скажет «Ага, так вы признаете, что это культ?» или «Стоп, ты говоришь, что я не должен обращать внимания на то, культ ли это?» или «Так… страх культа является признаком культа? Это звучит так, словно ты в культе». Так что последний раздражающий фактор — седьмой, если вы продолжаете считать — это то, что все это приходится очень долго объяснять.)

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
120
Оцените качество перевода: 
Средняя оценка: 3.6 (11 votes)

Умение отпускать

Обычно мы не меняем своё мнение так, как это должен делать байесианец. Людям из противоборствующих племён можно процитировать аксиомы теории вероятностей, но заставить их обратить внимание на то, что они на самом деле видят, не так легко. В «Силе агентности» Люк Мюльхаузер пишет:

Вы не байесианский гомункул, мышление которого «испорчено» когнитивными искажениями.

Вы — это когнитивные искажения.

Предвзятость подтверждения, искажение «статус-кво», фундаментальная ошибка атрибуции и им подобные не вмешиваются в ваш процесс рассуждения. Ваш процесс рассуждения, в сущности, из них и состоит.

Из этого не следует, что бороться с искажениями невозможно. Скажем, мы ещё и не являемся идеальными счётчиками, которым мешают арифметические ошибки. Большая часть наших математических ограничений вытекает из устройства наших мозгов. Тем не менее мы можем развить свои математические способности, можем разобраться, когда доверять математической интуиции, а когда нет. Можем обмениваться знаниями и помогать друг другу. Мы можем менять среду нашего обитания, чтобы в ней было легче работать, и создавать новые инструменты.

Наши искажения — это часть нас самих. Однако в нас есть и тень байесианства, и она действительно может помочь нам приблизиться к правде. Байесианскими гомункулами мы не станем, но какую-то правду найдём. Наверное, этого достаточно, чтобы начать.

Автор: 
Элиезер Юдковский

Важно уметь сказать «Упс»

Элиезер Юдковский

Я только что дочитал книгу о крахе компании Enron — «Самые умные парни в этой комнате». (Также я объявляю её победителем в номинации «Самое неподходящее название для книги».)

В медленном разложении и внезапном коллапсе компании Enron присутствовала достаточно типичная деталь — главные игроки никогда не признавались себе в том, что совершили большую ошибку. Когда катастрофа #247 разрасталась настолько, что для ее исправления требовалось изменение политики всей компании, они говорили: «Жаль, что это не сработало. Идея была такой хорошей. Как замаскировать эту проблему при составлении финансового отчета?» Вместо того, чтобы сказать: «Теперь кажется очевидным, что с самого начала эта затея была ошибкой». Или: «Я действовал очень глупо». Переломный момент — момент смиренного осознания, что существует действительно фундаментальная проблема — так и не наступил. После банкротства компании Джефф Скиллинг, ее бывший исполнительный директор и на короткое время генеральный директор, отказался следовать совету своих адвокатов и сослаться на Пятую Поправку — давая показания Конгрессу, он заявил, что Enron была великой компанией.

Не каждое изменение — это улучшение, но каждое улучшение — это обязательно изменение. Если мы признаём лишь небольшие локальные ошибки, мы сможем лишь немного изменить своё поведение. На крупные изменения мотивирует признание крупных ошибок.

В детстве я рос на научной фантастике и на чисто научной литературе, и от Хайнлайна до Фейнмана я учился путям Традиционной Рациональности. «Теории должны быть смелыми и фальсифицируемыми». «Получив контр-свидетельство, ты должен быть готовым принести героическую жертву и отказаться от собственных идей». «Приводи точные аргументы». «Старайся никогда себя не обманывать». И тому подобные размытые утверждения.

Воспитание в духе Традиционной Рациональности приводит к появлению спорщиков, которые рано или поздно сдаются, получив контр-свидетельства — какой-то горы свидетельств становится достаточно, чтобы изменить своё мнение на противоположное. Это важный шаг, и именно он отличает науку от религии. Но Традиционная Рациональность придаёт гораздо меньше значения скорости — умению сдаться как можно быстрее, умению встраивать свидетельства в свою картину мира настолько эффективно, что потребуется лишь минимум контр-свидетельств, чтобы разрушить особо ценное убеждение.

Я был воспитан в духе Традиционной Рациональности и полагал, что вполне могу считать себя рационалистом. Я перешел на Искусство Байеса (Лапласа/Джейнса/Тверски/Канемана) после того, как… впрочем, это долгая история. В общем, я принял такое решение, когда понял, что размытых советов, даваемых Традиционной Рациональностью, было недостаточно для того, чтобы уберечь меня от крупной ошибки.

Когда я наконец полностью признал свою ошибку, я оглянулся, чтобы посмотреть на тот путь, который привел меня к этому Ужасному Пониманию. И я увидел, что делал множество маленьких, еле заметных уступок, каждый раз неохотно отдавая очередную крошечную часть территории, пытаясь сделать как можно меньше выводов из каждой небольшой ошибки, признавая свою неправоту ровно настолько, чтобы она оставалась в пределах допустимого. И я осознал, что мог бы двигаться вперед гораздо быстрее, если бы просто воскликнул: «УПС!»

В этот миг я понял: «Мне нужно повысить уровень моей игры».

Признание крупной ошибки даёт огромное преимущество. Это больно. Однако это может изменить всю твою жизнь.

Важно находить свой переломный момент. Момент смиренного осознания, что существует действительно фундаментальная проблема, а не какое-то количество мелких ошибок, с которыми вы легко расправитесь.

Не стоит принимать красивую позу и гордиться тем, что ты умеешь признавать свои ошибки. Гораздо лучше делать всё правильно с первого раза. Но если ты допустил ошибку, лучше увидеть ее сразу. Даже с точки зрения физических ощущений боль от одной потери лучше, чем небольшие, но многочисленные мучения. Альтернатива — это вести войну с самим собой на протяжении многих лет. Альтернатива — это Enron.

С тех пор я неоднократно видел, как другие люди совершали серии своих маленьких уступок, каждый раз неохотно отдавая очередную крошечную часть территории. Замечая небольшие локальные ошибки, они никогда не признавались себе в крупных и каждый раз делали из них как можно меньше выводов. Вместо того, чтобы починить всё одним волевым усилием, они накладывали множество мелких заплаток, без которых обойтись было уже нельзя. Признаваясь в совершённой ошибке они никогда не говорили: «Я был дураком». Они прикладывали все усилия, чтобы уменьшить своё смущение. Они говорили: «В целом, я был прав», или «Это вполне могло сработать», или «Я по-прежнему уверен в том, что то-к-чему-я-так-привязан может принести нам пользу». Защищая свое чувство гордости, они делали все, чтобы эта ошибка повторилась еще раз, и гордость приходилось защищать снова.

Лучше проглотить горькую пилюлю одним кошмарным глотком.

Перевод: 
stas, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
121
Оцените качество перевода: 
Средняя оценка: 4 (11 votes)

Предложение спятить

Элиезер Юдковский

Когда я был очень молод — думаю, мне было тогда лет тринадцать, возможно, четырнадцать, — я думал, что нашел опровержение диагонального аргумента Кантора — известной теоремы, утверждающей, что действительных чисел больше, чем рациональных. О, какие мечты о славе и почёте роились в моей голове!

Моя идея заключалась в том, что, раз каждое целое число можно разложить на степени двойки, то можно отобразить целые числа на множество подмножеств целых чисел просто записывая числа в двоичной системе. Например, 13, оно же 1101, будет соответствовать подмножеству {0, 2, 3}. Прошла целая неделя, прежде чем мне пришло в голову, что, наверное, мне стоит применить диагональный аргумент Кантора к моей умной конструкции, и, конечно, нашелся контрпример — двоичное число (… 1111), не соответствующее никакому конечному целому числу.

Я нашел этот контрпример и понял, что моя попытка опровержения была неверной, и мои мечты о почёте и славе рухнули.

Сначала я был несколько разочарован.

Я подумал: «Рано или поздно я доберусь до этой теоремы! Пусть моя первая попытка не удалась, но когда-нибудь я опровергну диагональный аргумент Кантора!» Я возмущался этой теоремой, ведь она упрямо оставалась верной, лишая меня славы и почёта. Поэтому я принялся искать другие опровержения.

А потом я кое-что осознал. Я осознал, что я ошибся, и понял, что теперь, когда я понимаю свою ошибку, оснований подозревать ложность диагонального аргумента Кантора у меня не больше, чем оснований подозревать ложность любой другой из основных теорем математики.

И ещё я очень хорошо понял, что передо мной была возможность стать фриком от математики и всю оставшуюся жизнь писать профессорам-математикам сердитые письма зелеными чернилами (когда-то я прочитал книгу о математических фриках).

Я не хотел для себя такого будущего, так что я немного посмеялся и оставил эти поиски. Я попрощался с диагональным аргументом Кантора, и перестал сомневаться в нём.

И сейчас я не помню, подумал ли я об этом тогда, или мне пришло это в голову позже… что ведь это ужасно несправедливое испытание для ребенка тринадцати лет. Получается, я должен был оказаться достаточно рациональным уже в этом возрасте или потерпеть неудачу навсегда.

Чем вы умнее, тем в более раннем возрасте вас впервые посетит идея, которая покажется вам действительно революционной. Мне повезло, что я понял свою ошибку сам, что мне не понадобился другой математик, который бы указал на неё, возможно, привив мне вместе с тем чувство вины. Мне повезло, что опровержение оказалось достаточно простым для меня. Наверное, я бы оправился и в противном случае. Потом, уже во взрослом возрасте, я оправлялся и от гораздо худшего. Но если бы я пошёл по неправильной дороге так рано, смог бы я потом выработать этот навык?

Интересно, скольким из тех людей, которые пишут сердитые письма зелеными чернилами, было тринадцать, когда они совершили эту первую и фатальную ошибку. Интересно, сколько из них во время этой первой ошибки подавали большие надежды.

Я допустил ошибку. Это всё. Я не был на самом деле прав в глубине души. Я не одержал моральную победу. Я не проявил амбициозности, скептицизма или какой-то ещё чудесной добродетели. Это не было разумной ошибкой. Я не был наполовину прав, не был хоть сколько-нибудь прав. Мне пришла в голову мысль, которая бы не появилась у меня, если бы я был мудрее – вот и всё, что можно об этом сказать.

Если бы я оказался неспособен признаться в этом сам себе, если бы я интерпретировал свою ошибку как проявление добродетели, если бы ради гордости я продолжал настаивать на том, что остаюсь хоть немного правым, тогда я бы не освободился. Я бы продолжил искать ошибку в диагональном аргументе. И, рано или поздно, я мог бы её найти.

Пока вы не признаёте, что были неправы, вы не можете жить своей жизнью. На вашу самооценку будет влиять старая ошибка.

Всякий раз, когда у вас возникает желание держаться мысли, которая, будь вы мудрее, никогда не пришла бы вам в голову, перед вами открывается возможность стать фриком — даже если вы никогда не начнёте писать сердитые письма зелеными чернилами. Если никто не озаботится спором с вами или если вы никогда не станете никому излагать свою идею, вы все равно можете оказаться фриком. Фрика определяет неумение отказаться от идеи.

Это не правда. И не содержит правды глубоко внутри. Это не полуправда и даже не подобие правды. Это всего лишь мысль, которую вам не стоило думать. Не у каждой реки есть золотое дно. Люди совершают ошибки, и не все их ошибки являются скрытыми достижениями. Люди совершают ошибки. Так случается. Скажите «упс» и живите дальше.

Перевод: 
kvazikrugliyparogenerator
Номер в книге "Рациональность: от ИИ до зомби": 
122
Оцените качество перевода: 
Средняя оценка: 5 (7 votes)

Хватит уже надеяться

Элиезер Юдковский

Кейси Серин, 24-летний веб-программист, не имеющий опыта в сфере недвижимости, должен банкам 2,2 миллионов долларов. Он подал заявления на ипотеку, чтобы купить одновременно 8 различных домов в разных штатах. Часть денег он потратил на проживание и на семинары по обучению вложения денег в недвижимость (он брал ипотеку на большую сумму, чем стоили его дома). Похоже, он ожидал роста рынка.

Но это ещё не самая грустная часть истории. Самая грустная часть заключается в том, что он до сих пор не сдался. Кейси Серин не принимает поражения. Он отказывается объявить о банкротстве или устроиться на работу, он всё ещё думает, что может преуспеть в сфере недвижимости. Он продолжал тратить деньги на семинары. Он попытался получить ипотеку на 9-й дом. Он не ошибался, он просто набирался опыта.

Вот что происходит, когда мы отказываемся терять надежду.

Это поведение может показаться очень глупым, но эта ситуация заставляет меня вспомнить двух экономистов, получивших Нобелевскую премию…

… а именно Роберта Мертона и Майрона Шоулза из инвестиционного фонда Long-Term Capital Management.

Первые три года фонд LTCM загребал огромные прибыли. А в 1998 лазейки, которыми пользовался фонд, стали исчезать. Другие люди научились делать то же самое, и стратегия фонда перестала работать.

Фонд LTCM отказался терять надежду. Привыкнув к 40% дивидендам каждый год, они брали больше и больше кредитов для совершения сделок, а прибыль получали всё меньше и меньше. Когда у фонда всё пошло наперекосяк, акционерный капитал был 4,72 млрд долларов, кредиты — 124,5 миллиарда, деривативы — 1,25 триллиона.

В каждой профессии есть свои пути быть умным. В каждой профессии есть свои навыки, которые нужно освоить, и правила, которым нужно следовать. Поэтому кто-нибудь может подумать, что изучение «рациональности» в целом не принесёт большого успеха в реальной жизни. И всё же мне кажется, что способность не быть глупым — это очень полезный навык во многих профессиях. Искусство не превращать маленькие ошибки в большие не слишком зависит от того, применяете вы его в области хедж-фондов или в любви. И один из ключевых принципов этого искусства: будьте готовы признать, что вы проиграли.

Перевод: 
Женя Софронов, naozerechad, geniym25, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
123
Оцените качество перевода: 
Средняя оценка: 4.3 (20 votes)

Как правильно сомневаться

Элиезер Юдковский

Однажды, когда я рассказывал о Пути, я упомянул, что практически все организованные системы верований существуют для того, чтобы убегать от сомнений. Один из слушателей заметил, что иезуитов в этом обвинить никак нельзя, поскольку они умышленно практиковали сомнение: вступающим в орден, по его утверждению, говорили сомневаться в христианстве, сомневаться в существовании Бога, сомневаться в своём призвании, сомневаться в том, что они смогут выдержать пожизненные обеты целомудрия и нищеты. Я спросил у него: «О, но ведь предполагалось, что они справятся с этими сомнениями, верно?» Слушатель ответил: «Нет, они сомневались во всём этом скорее всего потому, что эти сомнения могли усилиться».

Поиск в интернете не дал мне возможности подтвердить или опровергнуть эти утверждения. (Если кто-нибудь из читателей готов помочь мне в этом вопросе, я буду очень признателен.) Но описанный сценарий кажется мне очень интересным и стоящим обсуждения, независимо от того, действительно ли он имел место в отношении иезуитов. Если иезуиты практиковали умышленное сомнение, делало ли это их, хоть и отчасти, рационалистами?

Думаю, я должен признать, что в (гипотетическом) сценарии выше иезуитов действительно нельзя обвинять в «бегстве от сомнений». Однако, такое (гипотетическое) поведение всё равно кажется мне очень подозрительным. Сомнения не должны пугать настоящего рационалиста. Описанное выше поведение для меня выглядит как программа десенсибилизации по отношению к страху — так арахнофобам в тщательно подготовленных условиях показывают пауков.

Но тем не менее, они ведь поощряли сомнения вступающих в орден, верно? Важно ли, что они это делали не по самым лучшим причинам? Разве для рационалиста это не остаётся достойным деянием?

Любое любопытство ищет способы уничтожить себя. Не бывает любопытства, которое не хочет получить ответы. Но если человек получает ответ, если человек удовлетворяет своё любопытство, восхитительная тайна перестаёт быть тайной.

И точно также любое сомнение существует для того, чтобы уничтожить какое-то конкретное убеждение. Если сомнение не в состоянии разрушить свою цель, оно умирает — но это всё равно развязка. Конец, пусть и печальный. Сомнение, которое не разрушает ни себя, ни свою цель, с таким же успехом может не существовать вовсе. Сам процесс сомнений не может раскрутить маховик рациональности, для этого нужно их разрешение.

Каждое улучшение — это изменение, но не каждое изменение — улучшение. Каждый рационалист сомневается, но не все сомнения рациональны. Сомнения делают человека рационалистом не больше, чем белый медицинский халат делает человека врачом.

Рациональное сомнение появляется по какой-то конкретной причине — имеется какой-то конкретный повод, чтобы подозревать, что некоторое убеждение ложно. Такая причина в свою очередь подразумевает цепочку расследований, которая или уничтожит это убеждение, или уничтожит сомнение. Это верно даже для очень абстрактных сомнений, вроде: «Интересно, можно ли объяснить эти данные какой-то более простой гипотезой?» В этом случае расследование — это попытки придумать более простую гипотезу. Чем дольше поиски не приводят к успеху, тем кажется всё менее вероятным, что следующий шаг выкладок приведёт к успеху. В какой-то миг цена на поиск превышает ожидаемую прибыль, и поиск прекращается. И здесь уже нельзя утверждать о полезности сомнений. Сомнение, которое не приводит к расследованию, с таким же успехом может вовсе не существовать. Неразрешаемое сомнение не делает ничего. Оно не приводит ни к движению вперёд, ни к движению назад.

Если у вас действительно есть религиозная вера (а не просто убеждение, что вы верите), зачем вам говорить вступающим в ваш орден, чтобы они размышляли о сомнениях, которые умрут неразрешёнными? Представьте студентов-физиков, которым говорят, чтобы они изо всех сил сомневались, не была ли ошибкой революция двадцатого века. Мол, вдруг на самом деле верна ньютоновская механика. Если вы на самом деле не сомневаетесь, зачем вам это изображать?

Однако, мы все хотим, чтобы нас считали рациональными. И многие убеждены, что сомнение — это добродетель рационалиста. Но гораздо меньше людей понимают, что для сомнения нужны конкретные причины и неразрешённые сомнения ничего не стоят. Вместо этого люди думают, что сомнение — это скромное поведение, демонстрация подчинения, направленная на поддержание иерархии в племени (ранее я писал, что практически та же проблема существует со скромностью). Грандиозная публичная сцена сомнений поможет убедить себя в том, что ты рационалист, примерно также, как надевание медицинского халата.

Для избежания притворных сомнений помните:

  • Рациональное сомнение существует, чтобы уничтожить конкретное убеждение. Если оно не в состоянии уничтожить свою цель, оно умирает.
  • Рациональное сомнение появляется по каким-то конкретным причинам сомневаться в соответствующем убеждении.
  • Неразрешённое сомнение ни к чему не ведёт.
  • Сомнение, которое не ведёт к исследованиям, с тем же успехом может не существовать вовсе.
  • Не стоит гордиться самим актом сомнения. Однако, когда ты закончил разрывать в клочки очень ценное для тебя убеждение, это вполне повод для гордости.
  • Хотя для того, чтобы взглянуть в лицо своим сомнениям, нужна смелость, помните, что идеальный разум сомнениями вообще не испугать.
Перевод: 
Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
124
Оцените качество перевода: 
Средняя оценка: 4.1 (24 votes)

Вы способны справиться с реальностью

Элиезер Юдковский

Правда не перестаёт быть правдой.
Признание не сделает её хуже.
Отказ узнавать правду не заставит её исчезнуть.
И именно с правдой вам придётся взаимодействовать.
Невозможно жить в неправде, ибо её не существует.
Люди способны вынести правду,
Ведь она и так их окружает повсюду.

- Юджин Джендлин

Перевод: 
stas, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
125
Оцените качество перевода: 
Средняя оценка: 4.9 (14 votes)

Размышление о любопытстве

Элиезер Юдковский

Первая добродетель — это любопытство.

Двенадцать добродетелей рациональности

Будучи рационалистами, мы обязаны подвергать критике себя и свои убеждения… не так ли?

Подумайте, какой эффект окажет на вас мысленная установка «Я обязан критиковать свои убеждения». Роджер Желязны однажды отметил разницу между «желанием быть автором» и «желанием писать». Как сказал Марк Твен: «Классика — это то, что каждый хотел бы уже прочесть и никто не хочет читать». Критика из чувства долга ведет к желанию иметь убеждения, уже прошедшие проверку, чтобы не считать свою веру слепой. Это не тоже самое, что хотеть проверить свои убеждения по-настоящему.

В ходе такой проверки вы рискуете стать жертвой предвзятой остановки. Вы анализируете возражение, приводите контраргумент, останавливаетесь. Повторяете с парой других возражений, ощущаете чувство выполненного долга, останавливаетесь. Так вы достигнете своей подсознательной цели: избавиться от когнитивного диссонанса «я — рационалист, не подвергнувший критике свои убеждения». Считайте это стремлением получить статус рационалиста — попыткой ощутить «теплое чувство» удовлетворения.

Теперь ваши оценки вероятностей будут достаточными для оправдания своих изначальных планов и убеждений, но недостаточными для возникновения сомнений со стороны других рационалистов или самого себя.

Истинное же любопытство будет тянуть вас к информации, кажущейся наиболее перспективной с точки зрения сдвига в оценке убеждений, либо к той, что наименее похожа на все известное вам до этого. Последующее распределение оценок вероятности, скорее всего, будет отличаться от изначального — должен будет произойти сдвиг в одну из сторон, и любое направление будет одинаково приемлемым, если ваше любопытство является искренним.

Сравните это с неосознанным желанием оставаться на знакомой территории, чтобы закончить свою проверку как можно быстрее, отметить свои убеждения и планы как «проверенные» и вернуться к своему привычному состоянию.

Что до моего взгляда на истинное любопытство и его силу — смотрите Сказ о науке и политике. Каждый персонаж служит иллюстрацией разных уроков. Последний из них, Феррис, является воплощением чистого и невинного любопытства, которое сопровождается легкостью и стремлением к поиску новых свидетельств.

Как писала Урсула К. Ле Гуин: «У невинности нет сил бороться со злом. Но у нее есть силы творить добро».1 Простое и невинное любопытство может обернуться простым тупиком на пути; поэтому обучение рациональности с сопутствующей этому изощренностью должно быть очень аккуратным, если мы хотим стать сильнее. Тем не менее, легкость и стремление к искренности в своих поисках можно сохранить.

Как сказано в «Двенадцати добродетелях»:

Если в глубине души вы верите, что уже обладаете знанием, или же не хотите знать вовсе — сомнения будут бесцельными, а навыки не найдут своего применения. Любое любопытство стремится себя уничтожить — нет любопытства, которое не жаждет найти ответ.

Подобной альтернативы искреннему любопытству просто не существует. «Жгучее желание знать — гораздо сильнее, чем торжественная клятва искать только правду». Но нельзя обрести любопытство простым усилием воли — как нельзя усилием воли заставить свою ногу чувствовать тепло, когда она чувствует холод. Иногда все, что у нас есть — это торжественные клятвы.

Так что же делать с «долгом»? Для начала можно попытаться разжечь свой интерес во время «обязательных» проверок — следить за проявлениями искреннего интереса или даже искреннего невежества и желания его устранить. Попутно можно уделять особое внимание неприятным и болезненным размышлениям, которых вы стараетесь избежать — это вовсе не какое-нибудь «негативное мышление».

Также можно вспомнить о Законе сохранения ожидаемого свидетельства. Для каждого нового вопроса, для каждой новой крупицы свидетельства математическое ожидание апостериорной вероятности должно быть равна априорной вероятности. Когда вы задаёте вопрос, вы должны в равной степени ожидать, что ваше убеждение изменится как в одном направлении, так и в другом. Не каждое новое свидетельство должно разворачивать ваше убеждение на 180 градусов — сдвигать вероятность его истинности с 70% до 30% — но если изначальная вероятность равна 70%, вы должны быть готовы поменять ее как на 71%, так и на 69%. Вы не сможете заранее предугадать направление этого сдвига (в среднем), потому что по законам теории вероятности, если вы знаете, куда вы направляетесь — вы уже находитесь там. Если вы готовы к честной проверке, готовы к тому, что каждое новое свидетельство действительно может сдвинуть ваше убеждение как вверх, так и вниз — вы сможете сохранять свой интерес и оставаться по-настоящему любопытными.

Если рассматриваемый вами аргумент новым не является, почему на нем сосредоточено ваше внимание? К нему бы вас привело искреннее любопытство? Не атакуете ли вы неосознанно сильные стороны своего убеждения вместо слабых? Не повторяете ли вы одно и то же свидетельство?

Если вы сможете не повторять одни и те же аргументы в свою поддержку и понемногу снижать оценку своего убеждения с каждым новым поступающим свидетельством, возможно, со временем вы сможете от этого убеждения даже отказаться — понять, что ветер свидетельств дует против вас.

Есть еще одно средство для поддержания любопытства — я его называю Литанией Тарского, которая в действительности является мета-литанией, имеющей для каждого отдельного случая свою формулировку (подходящую именно для этого случая). Например, если я очень сильно хочу узнать, содержит ли закрытый ящик бриллиант, тогда вместо мечтаний обо всех последствиях такого развития событий я могу повторять такую Литанию Тарского:

Если в ящике есть бриллиант,
Я хочу верить, что в ящике есть бриллиант.
Если в ящике бриллианта нет,
Я хочу верить, что в ящике бриллианта нет.
Я не буду цепляться за веру, которой не хочу.

И лишь после этого можно размышлять о возможности отсутствия бриллианта в ящике, и о вытекающих из этого преимуществах того, что вы будете верить в его отсутствие, и о соответствующих недостатках ситуации, при которой вы будете верить в его наличие. См. также Литанию Гендлина.

Обнаружив у себя хоть крохотную долю истинной неопределенности, берегите ее, как путник бережет свой костер. Если вы сможете разжечь эту неопределенность в пламя любопытства, оно подарит вам легкость и стремление к поиску истины, даст вашим сомнениям цель, а навыкам — их применение.

  • 1. Урсула К. Ле Гуин. На последнем берегу (1972).
Перевод: 
stas
Номер в книге "Рациональность: от ИИ до зомби": 
126
Оцените качество перевода: 
Средняя оценка: 3.9 (23 votes)

Законы рациональности беспристрастны

Элиезер Юдковский

Традиционная Рациональность пользуется языком социальных норм. Нарушение норм трактуется как жульничество — то есть, отказ от кооперации. Если ты хочешь меня в чём-то убедить, ты обязан предоставить определённое количество свидетельств. Если ты пытаешься от этого увильнуть, то всем ясно: ты жульничаешь. Теория должна делать смелые предсказания сама, а не просто воровать предсказания, сформулированные другими теориями. Теория должна давать возможность себя опровергнуть, а не избегать трусливо огня критики — это членский взнос клуба качественных теорий.

Правила Традиционной Рациональности выглядят очень похожими на обычаи, управляющие жизнью человеческих обществ, и поэтому их легко передавать из уст в уста. Люди замечают общественное мошенничество лучше, чем изоморфные ему нарушения абстрактных логических правил. Однако, если рассматривать рациональность как общественные обязательства, можно прийти к некоторым странным выводам.

Например, существуют верующие, защищающие свои убеждения фразой: «Ты сам не можешь обосновать свою веру в науку!». Иными словами: «Как ты смеешь критиковать меня за необоснованные убеждения, лицемер! У тебя есть точно такие же!»

В глазах байесианцев, мозг — аналитическое устройство. Оно собирает перепутанные свидетельства и превращает их в карту, которая изображает местность. Принципы рациональности — это законы в том же смысле, что и второй закон термодинамики: чтобы получить надёжные убеждения необходимо вычислимое количество свидетельств, также как и надёжное охлаждение содержимого холодильника требует вычислимого минимума свободной энергии.

Теоретически, законы физики инвариантны относительно обращения времени, поэтому, в принципе, существует ничтожно малая — настолько малая, что отличить её от нуля могут только математики — вероятность того, что холодильник спонтанно охладит сам себя, сгенерировав при этом электричество.

Представь, что ты ни разу не был в Нью-Йорке. Сможешь ли ты нарисовать его точную подробную карту, сидя в комнате с закрытыми жалюзи и не имея доступа в интернет? Теоретически да, но вероятность этого немногим больше ничтожно малой вероятности самозаморозки холодильника.

Прежде чем начать рисовать карту незнакомой местности, плесни немного воды в чашку при комнатной температуре. Подожди, пока она самостоятельно замёрзнет, и лишь после этого приступай к самому занятию. Таким образом можно убедиться, что приём «игнорируй бесконечно малые вероятности успеха» работает. Часто бывает сложно осознать, что твоя карта неверна (особенно, если ты никогда не бывал в Нью-Йорке), но всегда можно убедиться в том, что вода сама по себе не замерзает.

Если правила рациональности — это законы общества, то, кажется, что можно оправдать поведение Х, если указать, что остальные ведут себя также. Было бы несправедливо требовать свидетельства от тебя, если мы сами не можем их предоставить. И справедливое общество обязательно осознает, что все мы одинаково грешны и смягчившись, милосердно освободит всех от обязательства предоставлять свидетельства в пользу своих убеждений. Затем наступит свобода, равенство и братство, и будем мы жить долго и счастливо.

Если же правила рациональности — это математические законы, то все попытки что-то оправдать бессмысленны. Бесполезно зачитывать вслух 30 причин, согласно которым ты не можешь упасть с обрыва. Даже если все проголосуют за то, что нечестно требовать электричества для заморозки продуктов, это никак не повлияет на идущие внутри холодильника процессы. Даже если все согласятся с тем, что тебе не обязательно посещать Нью-Йорк, карта всё равно окажется неверной. Госпожа Природа не прислушивается к людским просьбам, и Госпожа Математика тоже.

Так что — вернёмся к Традиционной Рациональности, сформулированной как социальные нормы — не думай, что заявление «нет ничего страшного в моих необоснованных убеждениях о X, ведь у всех есть какие-то необоснованные убеждения» сойдет тебе с рук. Если обе заключившие контракт стороны нарушили свои обязательства, человек-судья может решить не применять санкции ни к кому. Но если два инженера соберут два механизма одинаково плохо, ни один механизм не заработает. Одна ошибка не может оправдать другую. Если я что-то делаю неправильно, тебе это никак не поможет и не освободит тебя от исполнения правил. Страдать мы будем оба.

Когда речь идёт об общественных законах в странах с либеральной демократией, то каждый вправе обладать собственными убеждениями. Когда дело касается законов природы, то у вас нет права на безошибочность. Людей не арестовывают за то, что они верят в странные вещи (по крайней мере, в адекватных странах). Однако невозможно аннулировать закон, по которому для получения точных убеждений требуются свидетельства. Даже если весь человеческий род выступит как единое целое, его голос не вызовет снисхождения перед лицом Природы.

Физики не решают, какими должны быть законы природы, физики просто угадывают, каковы они на самом деле. Рационалисты не решают, какими должны быть законы рациональности, рационалисты просто угадывают, каковы они на самом деле. Нельзя рационализировать то, что не было рациональным с самого начала. Даже если кто-то ухитрится убедить всех физиков мира в том, что законы гравитации на него не распространяются, то всё равно, шагнув со скалы, он упадёт.

Даже фраза «это решаем не мы» слишком антропоморфна. Нет никакой вышестоящей инстанции, способной делать исключения в законах. Существуют лишь причина и следствие.

Помни об этом, когда будешь просить разрешения нарушить закон всего лишь этот раз. Мы не можем выдать разрешения. Это просто не в нашей власти.

Перевод: 
BT, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
127
Оцените качество перевода: 
Средняя оценка: 4.3 (11 votes)

Оставь путь к отступлению

Элиезер Юдковский

Когда вы окружили врага,
Всегда оставляйте ему путь к отступлению.
Пусть он видит,
Что есть альтернатива смерти.
— Сунь-цзы, «Искусство войны»1

Всё, хватит на них давить. Наоборот, сбавим прессинг.
— Лоис Макмастер Буджолд, «Комарра»2

Вчера вечером я разговаривал с нерационалисткой, которая случайно зашла на встречу местных рационалистов. Она только что объявила, что (а) верит в существование души и (б) не верит в крионику, потому что считает, что душа не останется в замороженном теле. Я спросил: «Но откуда вы это знаете?». По растерянности, промелькнувшей на её лице, было понятно, что этот вопрос никогда не приходил ей в голову. Я не хочу сказать, что в этом есть что-то плохое — она показалась мне хорошим человеком, у которого нет ни малейшей подготовки в области рациональности — как и у большинства других представителей человечества. Мне действительно надо написать эту книгу.

Большая часть последующего разговора посвящалась вопросам, уже раскрытым на сайте Overcoming Bias3: если вам что-то очень любопытно, то скорее всего, вы сможете придумать хороший способ это проверить, старайтесь сперва приобретать точные убеждения, а затем позвольте эмоциям опираться на них, ну и так далее. Однако, этот разговор напомнил мне об одном соображении, которое я пока ещё тут не раскрыл:

— Постарайтесь как можно лучше себе представить, – предложил я ей, – как выглядел бы мир, где нет душ, и как бы вы поступали в таком мире. Не думайте обо всех причинах, почему это невозможно. Просто примите это как допущение и представьте последствия. Чтобы вы могли подумать: „Ладно, если душ нет, то я могу просто заключить контракт на крионирование“ или „Если Бога нет, я всё равно могу просто быть добродетельной“, а не просто ужасаться самой идее. Как я уже сказал раньше, вам стоит верить в правду, какой бы она ни была — это вопрос самоуважения. Однако, человеческая природа такова, что полезно сперва свыкнуться с убеждением и только потом оценивать свидетельства в его пользу.

Принцип в основе этой методики прост. Поступайте с собой так, как Сунь-цзы советует поступать с врагами – оставьте себе путь к отступлению. Если для вас непереносима сама мысль о потере работы, то эта перспектива может вас пугать гораздо сильнее, чем если вы точно подсчитали, на сколько хватит ваших сбережений, проверили вакансии на рынке труда в своей сфере занятости и тщательно распланировали, что будете делать в таком случае. Только в этом случае вы будете готовы честно оценить вероятность сохранения работы с учётом грядущих в следующем месяце сокращений. Будьте настоящим трусом и в деталях составьте план отступления. Мысленно представьте себе каждый шаг. Желательно, ещё до выхода на поле боя.

Для того, чтобы представить себе неприятное состояние дел всего лишь в качестве мысленного эксперимента, требуется меньше мужества, чем для того, чтобы оценить, какова на самом деле вероятность, что дела действительно состоят именно так. Но после первого сделать второе становится проще.

Помните, что байесианство любит точность: даже если пугающая вас перспектива действительно выглядит маловероятной, всё равно, чтобы получить количественную оценку вероятности, важно честно подсчитать все свидетельства за и против. Визуализация устрашающей идеи совершенно не означает признания, что глубоко внутри Вы считаете её возможной истиной. Вы можете представлять различные пугающие идеи просто из общих соображений о поддержании себя в хорошей ментальной форме. «Идея, о которой Вы не можете даже подумать, управляет вами больше, чем идеи, о которых вы громко говорите вслух». Такое случается, даже если эта невообразимая идея является ложной!

Методика оставления пути к отступлению для её правильного использования требует некоторый минимум честности по отношению к себе.

В первую очередь, вы должны быть способны хотя бы признаться себе, какие именно идеи вас пугают и к каким идеям Вы привязаны. Но это гораздо проще, чем честная оценка свидетельств по поводу идеи, которая вас пугает. Вам станет легче, если я скажу, что мне самому приходится пользоваться такой методикой? В конце концов, рационалист не отказывается от всех эмоций. Есть идеи, которые меня пугают, хотя я по-прежнему считаю их ложными. Есть идеи, к которым я привязан и знаю об этом, и всё равно считаю их истинными. Но тем не менее у меня есть план отступления: не потому, что я планирую отступать, а потому что изначальное наличие плана отступления помогает мне думать о проблеме, не привязываясь к ней.

Однако ещё большее испытание честности перед собой заключается в том, чтобы по-настоящему принять неприятное предположение в качестве предпосылки и продумать, как вы бы с ним справились. Когда мы сталкиваемся с неприятной идеей, наш первый импульс, естественно, подумать обо всех причинах, почему это может быть не так. Поэтому вы столкнётесь с некоторым количеством своего психологического сопротивления, если попытаетесь в точности представить, каким был бы мир и что бы вы в связи с этим делали, если бы самое-самое ценное убеждение было ложным или самое-самое пугающее убеждение было верным.

Подумайте обо всех людях, которые говорят, что без Бога была бы невозможной мораль. (И да, об этом зашла речь в том разговоре, так что я не выдумываю.) Если бы теисты могли представить свою настоящую реакцию на веру в то, что Бог не существует, они бы осознали, что, нет, они не отправились бы убивать младенцев. Они могли бы осознать, что атеисты реагируют на несуществование Бога примерно так же, как и они сами бы отреагировали, если бы в это поверили. Я говорю об этом, чтобы показать, что это весьма трудно: представить себе, как бы вы отреагировали, если бы поверили в противоположность какого-то из своих очень важных убеждений.

Кроме того, хоть это и довольно сложно осознать, но люди привыкают ко всему. Недавно парализованные люди через шесть месяцев не настолько этим опечалены, как они сами предполагали в начале, и тому подобное. Идея, что если бы ваше устрашающее убеждение оказалось истинным, то вы каким-то образом с ним бы свыклись, ничуть не более контринтуитивно. Паралитики привыкают, и вы бы привыкли.

Не забывайте также про литанию Гендлина и литанию Тарского. Правда не перестаёт быть правдой. Признание не сделает её хуже. Не бойтесь просто представить себе мир, которого боитесь. Если этот мир существует, то представив его мысленно, вы себе не навредите. А если он не существует, то от того, что вы его представите, тоже хуже не станет. И помните, когда визуализируете, что если ужасные явления в вашем воображении на самом деле истинны – чего может и не быть! – тогда вы наверняка хотели бы в них верить, и вам следует визуализировать и это тоже. Неверие вам не поможет.

Как много религиозных людей сохранили бы свою веру в Бога, если бы могли в точности представить себе гипотетический мир, в котором Бога нет, а они сами стали атеистами?

Оставлять путь к отступлению – мощная методика, но не простая. Честная визуализация требует меньше усилий, чем нужно, чтобы полностью признать, что Бог не существует, но всё равно требует усилий.

  • 1. Автор цитирует текст по изданию Sun Tzu, The Art of War (Cloud Hands, Inc., 2004). Однако, приведённые им строки не вполне соответствуют соответствующим строкам известного в России перевода Николая Конрада: «… если окружаешь войско противника, оставь открытой одну сторону; если он находится в безвыходном положении, не нажимай на него». Прим. перев.
  • 2. В переводе О.Г.Косовой. Прим. перев.
  • 3. Эта книга представляет из себя переработанные статьи, и изначально эти статьи публиковались на сайте overcomingbias.com — Прим.перев.
Перевод: 
Knivy, Alaric, AccelBoy, El_Aurens
Номер в книге "Рациональность: от ИИ до зомби": 
128
Оцените качество перевода: 
Средняя оценка: 4.7 (11 votes)

Кризис веры

Элиезер Юдковский

Если вы не готовы с одинаковой лёгкостью допустить оба варианта, это ещё не настоящий кризис веры.

Тор Шенкель

Многие в этом мире придерживаются убеждений, несостоятельность которых заметил бы даже десятилетний ребёнок, услышавший такое убеждение в первый раз. И речь идёт не о каких-то незначительных заблуждениях. Человек незашоренного ума играючи отказался бы от таких убеждений, если бы без колебаний применил к ним скептицизм десятилетнего ребёнка. Как выразился Premise Checker1: «Если бы идея бога не появилась до эпохи науки, только очень странный человек смог бы её придумать и всерьёз утверждать, что она всё объясняет».

Тем не менее, даже профессиональные учёные и выдающиеся специалисты в своих областях в наш день и век всё ещё недостаточно скептичны. Нобелевский лауреат Роберт Ауманн, автор теоремы Ауманна о согласии, является ортодоксальным иудеем. Я достаточно сильно уверен, что в тот или иной миг своей жизни Ауманн сомневался в своей вере. Однако, его сомнения не стали успешными. Мы меняем мнение реже, чем нам кажется.

Это должно пробрать вас до мозга костей. Ведь получается, что можно быть учёным с мировым именем, хорошо владеть теоремой Байеса и тем не менее не смочь отвергнуть убеждения, абсурдность которых бросается в глаза даже десятилетнему ребёнку с его незамутнённым взглядом. Получается, что давно закрепившееся в разуме убеждение способно создать себе неуязвимую защиту.

Что же делать с ошибкой, которая окопалась у вас в мозгу?

Ну, если вы поняли, что на самом деле имеете дело с ошибкой, значит вы с ней уже справились. Вопрос не в том, как отказаться от давно привычного ложного убеждения X, а в том, как понять, что давно привычное убеждение X ложно. Сложно быть честным с собой, когда сам не знаешь, что правильно. Поэтому вопрос на самом деле звучит так:

Как вызвать у самого себя настоящий кризис веры в некое убеждение и допустить возможность альтернативных вариантов?

Как пример серьёзного испытания, которое мы все можем представить, возьмём религию. (У читателей, чьи родители были атеистами, не было этого важного жизненного испытания, поэтому в качестве довольно слабой замены я предлагаю им подумать об их религиозных друзьях). Однако, если вы не можете поставить себя на место верующего и считаете их всех злобными мутантами, значит вы не в состоянии вообразить, с какими внутренними испытаниями они на самом деле сталкиваются. Вы не в состоянии задаться вопросом:

Какая стратегия может помочь религиозному человеку отказаться от своей религии?

Уверен, что некоторые, едва взглянув на этот вопрос, уже начали потрясать стандартным списком атеистических аргументов. «Они должны признать, что байесовских свидетельств в пользу существования Бога не существует». «Они должны понять, что для оправдания поведения Бога в Библии они прибегают к многочисленным моральным уловкам». «Им надо научиться использовать бритву Оккама». Ну и так далее.

Нет! Нет, нет, нет! Именно такое оттарабанивание давно привычных аргументов в точности соответствует тому стилю мышления, из-за которого люди не спешат отказываться от своих религий. Если вы остаётесь в рамках собственных заранее заготовленных мыслей, если ваш мозг выдаёт ответ столь быстро, что вы даже не успеваете посмотреть на вопрос так, как будто видите его впервые, вы никак не сможете придти к кризису веры.

Возможно, дело в том, что слишком мало людей прочли книгу «Гёдель, Эшер, Бах» в достаточно раннем возрасте, но я часто замечал, что очень многие люди — даже с техническим образованием — не в состоянии мыслить на таком высоком уровне абстракции. Во время приступов особо сильного пессимизма я даже начинаю думать, что у верблюда действительно два горба.

Судя по всему, некоторые люди не могут перейти с объектного уровня «Воспользуйся бритвой Оккама! Ты должен понять, что твой Бог — это ненужное убеждение!» на мета-уровень «Попробуй не дать своему мозгу привычно действовать по шаблону!» Ведь для верующего человека ответ «Пути Господни неисповедимы, и наивно считать, что мы сможем их понять» настолько же привычен и так же быстро приходит на ум, как вам и вашим друзьям рационалистам приходит на ум бритва Оккама. Поэтому если вы считаете, что правильная стратегия заключается в «Воспользуйся бритвой Оккама!», вы похожи на верующего, который говорит, что правильная стратегия — это уверовать.

«Но… но бритва Оккама же на самом деле лучше, чем вера! Мы же не о любимом вкусе мороженого спорим! Если обратиться к истории, сразу понятно, что рассуждения, согласованные с законом Оккама, гораздо продуктивнее тех, что основаны на вере…»

Всё это так. Однако не имеет отношения к делу. А дело в том, что, когда вы всё это произносите, вы повторяете стандартные доводы в пользу своих убеждений. Доводы, которые уже укоренились у вас в мозгу. Устроить себе кризис веры — значит допустить, что наши стандартные умозаключения неверны и наши стандартные доводы тоже. Допустим, стандартным доводом в пользу Х является «Бритва Оккама!», и вы хотите испытать кризис веры относительно X. Тогда задайтесь вопросом, действительно ли бритва Оккама говорит в пользу X, действительно ли вы правильно понимаете бритву Оккама, и — если хотите по-настоящему глубоких сомнений — действительно ли простота является исторически либо логически обоснованным рабочим критерием в подобных случаях, и т. д. Если вы советуете религиозному человеку усомниться, что «вера» — это хорошее объяснение для X, то вам стоит посоветовать то же самое себе, то есть, приложить такие же серьёзные усилия и усомниться, что «бритва Оккама» — это хорошее объяснение для X.

(Подумайте обо всех людях, которые не понимают таких формулировок бритвы Оккама, как минимальная длина описания или индукция Соломонова. Подумайте о тех, кто считает, что бритва Оккама исключает многомировую интерпретацию или гипотезу симуляции. Этим людям стоит поставить под сомнение свою формулировку бритвы Оккама и своё представление о том, что простота — это что-то хорошее. Готов поспорить, что какое бы Х вы ни защищали в споре восклицанием «Бритва Оккама!», это X не дотягивает по простоте формулировки до закона гравитации).

Если «Бритва Оккама!» — это ваш привычный ответ, ваш стандартный ответ, если это ответ, который дают все ваши друзья, то вам стоит помешать своему мозгу моментально достраивать этот шаблон. Иначе устроить себе настоящий кризис веры не получится.

Лучше задать себе такие правила для размышлений: «Представить, что сказал бы скептик. Потом представить, что ему сказали бы в ответ. А теперь представить, что он ещё мог бы сказать и на что уже было бы сложнее ответить».

Или: «Сосредоточиться на самой неприятной мысли».

И самое главное правило:

«Стараться изо всех сил. Вкладывать столько же отчаянных усилий, сколько требуется верующему человеку, чтобы отринуть свою религию».

Ведь если вы не слишком стараетесь, то — как знать — может быть, ваша голова забита какой-нибудь чепухой, ничуть не менее абсурдной, чем религия.

Если вы не предпринимаете судорожных отчаянных усилий, чтобы стать рациональным (а именно такие усилия нужны, чтобы избавиться от религии), как вы осмеливаетесь верить во что бы то ни было? Ведь даже сам Роберт Ауманн верит в Бога.

Кто-то (уже не помню кто) однажды заметил, что люди в принципе способны отказаться от своей веры лишь до определённого возраста. Потом у них уже есть готовые ответы на все возражения, и становится слишком поздно. Это способ существования, который необходимо преодолеть. Это испытание вашей силы как рационалиста, и оно очень суровое. Но если вы не сможете его пройти, вы останетесь слабее, чем десятилетний ребёнок.

Но повторюсь: если вы понимаете, что убеждение ошибочно, то вы его уже побороли. Если вы уже пришли к заключению, что ваша религия не верна, то речь больше не идёт об отчаянных, судорожных попытках преодолеть последствия религиозного воспитания. Отчаянные усилия, о которых мы здесь говорим, нужны, чтобы понять, стоит ли избавиться от оков некоего убеждения или же сохранить его. Трудно быть честным с самим собой, когда не знаешь, какая дорога верна. Когда рационализация не кажется грехом.

Ради каждого сомнения устраивать себе полноценный кризис веры не стоит. Однако, вам стоит задуматься о нём, если:

  • убеждение давно укоренилось в вашей голове;

  • вам известно множество аргументов и контраргументов, связанных с этим убеждением;

  • вы уже как-то невозвратно вложились (в виде времени, денег, публичных заявлений) в это убеждение;

  • убеждение имеет какие-то важные эмоциональные последствия (заметим, что само по себе это не значит, что убеждение неверно);

  • на убеждение завязана ваша идентичность.

Эти тревожные признаки не означают, что убеждение совершенно точно ложно. Они лишь сигнализируют о том, насколько рисковано ваше убеждение и насколько трудно вам будет с ним расстаться, если оно неверно. Такие признаки можно найти как для католичества Папы Римского, так и для убеждённости Ричарда Докинза в эволюционной биологии. Однако, это не означает, что подобные убеждения — лишь дело вкуса. Уравнивать между собой любые глубоко укоренившиеся убеждения только в силу того, что они глубоко укоренившиеся, при этом напрочь игнорируя подкрепляющие их свидетельства, — это удел непросвещённых. Цель не в том, чтобы сохранять лишь поверхностные убеждения, а в том, чтобы построить карту, которая наиболее точно соответствует территории.

Разумеется, я подчёркиваю всё это для того, чтобы вы могли признаться себе: «Да, у моего убеждения есть эти тревожные признаки» без необходимости сказать: «Моё убеждение ложно».

Однако, упомянутые признаки указывают на то, что вам потребуются экстраординарные усилия, чтобы эффективно поставить под сомнение своё убеждение. Эффективно — значит так, чтобы действительно отказаться от этого убеждения, если оно ложно. Если вы не в состоянии сомневаться эффективно, то вы слепы, ибо ваш мозг будет безоговорочно цепляться за убеждение. Если сетчатка глаза посылает один и тот же сигнал, независимо от попадающих на неё фотонов, мы называем этот глаз слепым.

Когда же стоит устраивать себе кризис веры?

Ещё раз подумайте о совете, который вы дали бы верующему: если вы чувствуете в себе какую-то лёгкую неуверенность, но продолжаете изыскивать веские доводы в пользу своего убеждения, то вам, скорее всего, стоит испытать себя кризисом веры. Если ваше убеждение подкреплено свидетельствами надёжными, как гравитация, вам не о чем беспокоиться. Однако задумайтесь обо всех верующих, которые отчаянно продолжают считать, что Бог надёжен, как гравитация. Так что попробуйте представить, что сказали бы скептически настроенные люди о ваших «надёжных, как гравитация» аргументах. Одна из причин, почему кризис веры может провалиться, состоит в том, что вы вообще никогда не пытались оспорить своё убеждение. Вы никогда не говорили себе: «Вот здесь мне стоит как следует посомневаться».

Если вы понимаете, что ситуация действительно сложная, вам нужно сделать следующий шаг и устроить себе кризис веры. Однако, не стоит это делать в спешке, в первую попавшуюся свободную минуту. Не рвитесь побыстрее расправится с этим делом, ради оправдания: «Я сомневался, как и должен был поступить рационалист». Это не сработало бы для верующего, это не сработает и для вас. В день накануне отдохните, чтобы ваш ум был в хорошей форме. Заранее выделите себе несколько часов, в которые вас никто не побеспокоит. Найдите какое-нибудь тихое место. И предпримите отчаянную попытку призвать настоящее сомнение, которое разрушит ложные — и только ложные — из ваших глубочайших убеждений.

Элементы методики кризиса веры разбросаны по целому ряду эссе:

  • Избегая по-настоящему слабых мест убеждения. Один из первых соблазнов кризиса веры — начать с самых веских доводов в пользу своего убеждения, чтобы ещё раз отрепетировать хорошие ответы. Путь сомнений нужно начинать с поиска уязвимостей, а не с рассмотрения наиболее обнадёживающих аргументов.

  • Размышление о любопытстве. Роджер Желязны однажды противопоставил «желание быть писателем» и «желание писать». Точно так же различаются «желание разобраться» и «желание разбираться». Недостаточно заявить: «Подвергать критике собственные убеждения — это мой долг». Необходимо настоящее любопытство. А любопытство рождается только из неуверенности. Не упускайте из виду закон сохранения ожидаемых свидетельств, это поможет вам совершенствоваться шаг за шагом. Переходя к каждому новому пункту, аргументу или свидетельству, вы не должны предвидеть, в какую сторону сдвинется ваше убеждение. Таким образом вы сможете сохранять подлинное любопытство о том, к чему вы в итоге придёте.

  • Непосредственный взгляд. Используйте методы Пирсига, чтобы избежать привычных шаблонных мыслей, которые приходят на ум в первую очередь.

  • Литания Джендлина и литания Тарского. Люди способны вынести правду, ибо они уже живут в ней. Если убеждение верно, то лучше верить, что оно верно. Если убеждение неверно, то лучше отказаться от него. Вы могли бы посоветовать религиозному человеку как можно тщательнее представить мир, где нет Бога, и честно признать, что если Бога нет, то лучше верить, что Бога нет. Если человек в глубине души не способен это принять, значит он не сможет пройти путём кризиса веры. Так что сделайте честную попытку представить альтернативу вашему убеждению. Представить так, чтобы даже самый придирчивый скептик не смог придраться. Думайте о тех усилиях, которые потребовались бы верующему, чтобы представить себе атеистическую картину мира, не искажая эту картину ради собственного комфорта.

  • Приложите экстраординарные усилия. Вспомните о понятии «иссёкенмей»2. Приложите все силы, чтобы быть рациональным. Такие силы, которые потребовались бы Роберту Ауманну и всем великим учёным прошлого, которые так и не преодолели свою религиозность.

  • Генетическая логическая ошибка. Иногда люди соглашаются, что некоторый источник недостоверен, однако продолжают считать: «Но ведь идеи там всё равно правильные!» Если многие из ваших идей почерпнуты из таких источников, вам стоит быть крайне осторожным. (Например, кто-нибудь может прийти к мнению, что Библия всё-таки написана людьми, однако продолжать цепляться за идею, что она служит источником незаменимой этической мудрости).

  • Важно уметь сказать «Упс». Ужасную горькую пилюлю и в самом деле лучше проглотить одним глотком.

  • Единомыслие — противоположность двоемыслия. Замечайте мысли, которые вы гоните прочь. Мысли, которые успевают лишь на мгновение появиться в уголке вашего сознания, прежде чем вы откажетесь об этом думать. Если вы осознаете, о чём вы не думаете, вы сможете об этом подумать.

  • Аффективные смертельные спирали и Сопротивление аффективным смертельным спиралям. Аффективные смертельные спирали — это главные генераторы ложных убеждений, и без встряски кризисом веры от них не избавишься. Поскольку аффективные смертельные спирали могут начинаться и вокруг поистине прекрасных вещей, вам не нужно признавать, что ваше убеждение — ложь, чтобы пытаться противостоять их гало-эффекту в каждый отдельно взятый миг. Даже что-то по-настоящему хорошее стоит хвалить только искренне. Не делайте политические споры однобокими.

  • Не спешите предлагать решения. Не предлагайте никаких решений до тех пор, пока не обсудили проблему настолько подробно, насколько это возможно. Пусть ваш разум позже поймёт, каким должен быть ответ. Потратьте хотя бы пять минут, прежде чем сдаться. Это правило подходит всегда, и особенно, когда вы становитесь адвокатом дьявола.

Следующие методики тоже довольно важны в вопросах кризиса веры:

В общем, и здесь, и на Overcoming Bias довольно много материала по этой теме. Кризис веры - это лишь поворотная точка и внезапная схватка на длинном пути иссёкэнмэй. На вечном пути бескомпромиссных попыток достигнуть уровня настолько великой рациональности, что все эти дурацкие глупые ошибки окажутся где-то далеко внизу. И в этой схватке вы сможете использовать на всю катушку все навыки, в которых вы так долго практиковались. Использовать против себя самого.

Успехов вам в вашей битве. Чудесного кризиса!

  • 1. Один из читателей Overcoming Bias во времена написания этого эссе. — Прим.перев.
  • 2. Японское слово, означающее совершить отчаянную попытку, подробнее раскрывается в эссе по ссылке. — Прим.перев.
Перевод: 
Aelryn, Alaric, Kelegorm
Номер в книге "Рациональность: от ИИ до зомби": 
129
Оцените качество перевода: 
Средняя оценка: 3.8 (23 votes)

Ритуал

Элиезер Юдковский

Комната, где Джеффриссай принимал своих гостей, не владевших искусством бейзутсукай, была оформлена в самом строгом классическом стиле и выглядела весьма официально. Сквозь серебряную решётку, острые края которой чётко давали понять, что эта ограда не должна открываться, струились свежий воздух и солнечные лучи. Стены и пол из очень толстого стекла искажали находящееся за ними до полной неразличимости. Поверхность стекла украшали едва заметные непонятные узоры, которые словно вышли из-под руки творчески одарённого ребёнка (впрочем, так и было).

В доме Джеффриссая были комнаты и в другом стиле. Но когда-то он обнаружил, что эта лучше всего соответствует представлениям чужаков о вкусах Байесианского Мастера, и решил их в этом не разубеждать. В конце концов, такие бесхитростные развлечения тоже часть маленьких радостей жизни.

Гостья села напротив него: колени на подушке, ступни сзади. Её привели сюда исключительно дела Заговора. Наряд выдавал это: облегающий комбинезон из розовой кожи, закрывающий всё, включая кисти рук — вплоть до головы и волос, скрытых капюшоном. Впрочем, лицо оставалось открытым.

Итак, Джеффриссай решил принять её в этой комнате.

Он сделал глубокий вдох, затем выдохнул.

— Уверена ли ты?

— О-о-о, — протянула она. — Неужели мои советы поменяют твою точку зрения лишь в том случае, когда я абсолютно уверена? Разве не достаточно того, что я специализируюсь в этой области, а ты нет?

Губы Джеффриссая скривила лёгкая улыбка.

— Кстати, откуда тебе известно столь многое о правилах? У тебя никогда не было подготовки даже планковских масштабов.

— Разве это не очевидно? — сухо ответила она. — Вы, бейзутсукай, просто обожаете объяснять причины своих поступков.

Джеффриссай внутренне поморщился от мысли, что кто-то может нахвататься рациональности, лишь наблюдая, как другие люди говорят о ней…

— И не надо так внутренне морщиться на меня, — продолжила гостья. — Я не стремлюсь сама стать рационалисткой. Я хочу лишь победить рационалиста в споре. Уверена, что ты даже ученикам говоришь, что это огромная разница.

Неужели она читает меня как открытую книгу? Джеффриссай посмотрел наружу сквозь серебряную решётку. Солнечный свет отражался от склона горы. Всегда, всегда, каждый день золотые лучи солнца пронзают облака и падают на это место. Неизменная вещь этот свет. Далёкое Солнце, представленное этим светом, через пять миллиардов лет сгорит, но сейчас, в эту секунду, оно ещё светит. И это не изменить. Зачем желать, чтобы что-то сохранялось неизменным вечно? Ведь это желание уже исполнено настолько надёжно, насколько только можно. Парадокс постоянства и непостоянства: прогресс или потери существуют только в позднейшей перспективе.

— Ты всегда давала мне хорошие советы, — произнёс Джеффриссай. — Так было всегда. Всё время, которое мы знаем друг друга.

Она склонила голову, признавая его слова. Это истина, и нет нужды объяснять подразумеваемое.

— Итак, — сказал Джеффриссай. — Не спора ради, но лишь потому что я хочу узнать ответ. Ты действительно уверена?

Он не понимал, как она могла догадаться.

— Я вполне уверена, — ответила она. — Мы достаточно долго собирали статистику, и из тысячи случаев, подобных твоему, в девятьсот восьмидесяти пяти…

От вида его лица она расхохоталась.

— Я шучу. Конечно же, я не уверена. Решение исключительно за тобой. В чём я точно уверена, так это в том, что ты должен пойти и сделать все, что вы там делаете, когда совершенно всерьёз раздумываете, стоит ли отказаться от какого-то фундаментального основания собственного существования. Не сомневаюсь, что для таких случаев у вас есть какой-нибудь ритуал, пусть вы и не рассказываете о нём посторонним.

Джеффриссай задумался. С этим было трудно спорить. Особенно когда эксперт в обсуждаемой области утверждает, что ты, возможно, не прав.

— Я сдаюсь, — сказал Джеффриссай. В его исполнении эти слова прозвучали словно приказ об окончании дискуссии: «Нет нужды спорить дальше. Ты победила».

— О, избавь меня! — ответила она. Она поднялась с подушки быстро, но плавно — ни единого лишнего движения. Она не выпячивала свой возраст, но и не скрывала его. Подхватив его протянутую кисть, она поднесла её к своим губам в формальном поцелуе. — Прощайте, учитель!

— «Прощайте»? — переспросил Джеффриссай. Это слово означало расставание более серьёзное, чем если бы она ограничилась простым «до свидания». — Вообще-то я планировал нанести вам визит, миледи. И я всегда рад видеть вас здесь.

Не ответив, она направилась к дверям. В дверном проёме она замерла и, не оборачиваясь, сказала:

— Ничто уже не будет прежним.

Её движения ничуть не казались стремительными, но удалилась она так быстро, что могло показаться, что она просто исчезла.

Джеффриссай вздохнул. Но, по крайней мере, с этого момента и до самого испытания он знал, что делать. Все его действия определялись предписаниями.

Покинув свою официальную приёмную, Джеффриссай направился к своей арене. Оттуда он разослал сообщения своим ученикам, что во время завтрашних занятий они должны импровизировать без него, а позже он устроит им проверку.

И после этого Джеффриссай не делал ничего существенного. Он прочёл ещё сотню страниц учебника, который взял взаймы. Учебник оказался не слишком хорошим, впрочем, книга, что он отдал взамен, тоже была посредственной. Он бродил из одной комнаты своего дома в другую. Заглянул в несколько кладовых проверить, не было ли что-нибудь оттуда украдено (пропала колода карт, но и только). Время от времени его мысли возвращались к завтрашнему испытанию, и он позволял им течь свободно. Он старался совсем не управлять своими мыслями, лишь гнал те, которые уже приходили ранее. Также он не допускал любых заключений и выводов, даже мысль о том, куда должны течь его мысли.

Солнце садилось. Очистив свой разум, Джеффриссай какое-то время любовался закатом. Не думать ни о чём без необходимости постоянной концентрации и без огромных усилий было примером превосходного мастерства. Годы назад при таком упражнении с него пот лился ручьём. Но тренировки уже давно принесли свои плоды.

Когда он проснулся на следующее утро, хаотические ночные видения были свежи в его памяти. Стараясь сохранить это ощущение хаоса и память о снах, он спустился по лестнице на один пролёт, потом ещё на один, и ещё на один, и наконец оказался в самой неприглядной комнате из всех.

Она была белой. Это слово лучше всего описывало её цветовое оформление.

На одной из стен висели дощечки с надписями. Следуя традиционным практикам, их когда-то кропотливо нанёс юный Джеффриссай. С каждым движением кисти, что выводила слова, идеи врезались в его сознание. «Что может быть разрушено правдой, должно быть разрушено». «Люди способны вынести правду, ведь она и так их окружает повсюду». «Любое любопытство стремится себя уничтожить». На одной маленькой дощечке была лишь красная горизонтальная черта. Что угодно можно заменить символом, хотя даже Барды-Заговорщики не осмелятся признать такую гибкость и могущество визуальных образов.

На стене под дощечками виднелись две колонки значков. В столбце со знаком плюс было две записи. Со знаком минус — пять. Семь раз он входил в эту комнату. Пять раз он решил не менять своё мнение. Дважды он покинул комнату в какой-то степени другим человеком. Никакие правила не предписывали какое-либо соотношение между первым и вторым — подобные правила сделали бы абсурдной всю идею. Однако если за долгое время под знаком плюс не появилось бы ни одной записи, пришлось бы признать, что нет никакого смысла держать эту комнату, раз ты не умеешь её использовать. Ну или знание истины даровано тебе от рождения и ты прав во всём.

Джеффриссай сел на пол, но не лицом к дощечкам, а спиной к ним. Он смотрел на пустую белую стену, дабы ничто не могло отвлечь его. Мысленно он повторил вступительную мета-мнемонику, а затем множество под-мнемоник, на которые та ссылалась: семь главных принципов и шестьдесят две специальные техники, что вероятнее всего понадобятся во время Ритуала Изменения Убеждений. К этому Джеффриссай добавил ещё одну мнемонику, напоминающую ему четырнадцать его собственных самых стыдных оплошностей.

Он не сделал глубокого вдоха. Лучше сохранять спокойное дыхание.

И тогда он задал себе вопрос.

Перевод: 
Kath May, Горилла В Пиджаке
Номер в книге "Рациональность: от ИИ до зомби": 
130
Оцените качество перевода: 
Средняя оценка: 5 (13 votes)

Машина в призраке

Автор: 
Элиезер Юдковский

Разум: введение

Роб Бенсинджер

Вы есть разум, и это приводит к затруднительному положению.

Мало что становится разумом. Вы — тот странный кусочек Вселенной, который может делать предсказания и строить планы, взвешивать и пересматривать убеждения, страдать, мечтать, замечать божьих коровок или внезапно для себя сильно хотеть манго. Вы можете даже нарисовать внутри своего разума картину его же самого. Вы можете рассуждать о собственном процессе рассуждений и стараться, чтобы он лучше соответствовал вашим целям.

Вы есть разум, реализованный на базе человеческого мозга. И так уж получилось, что мозг человека, несмотря на всю его чудесную гибкость, подчиняется законам природы. В нём заложены закономерности и шаблоны. Ваш мозг может действовать по шаблону всю жизнь, даже не замечая этого. И эти шаблоны могут приводить к серьёзным последствиям.

Когда мыслительный шаблон помогает нам, мы зовём его «рациональностью».

Благодаря своим предкам вы — тот, кем являетесь. Вы устроены таким образом, чтобы проявлять определенные иррациональные и рациональные качества. Вы, как и вся земная жизнь, произошли от древних самовоспроизводящихся молекул. Этот процесс воспроизводства был вначале неуклюжим и бессистемным, что привело к различиям между воспроизводителями. Мы называем процесс изменения этих различий «эволюцией».

Поскольку некоторые из таких воспроизводимых различий влияли на само воспроизводство — мы называем это явление «отбором» — эволюция привела к существованию организмов, приспособленных к воспроизводству в средах, в которых жили их предки. Всё, что составляет вас, создано из отголосков борьбы и побед ваших предков.

И вот вы здесь: разум, взращённый из более слабых разумов. Вы хотите понять собственное устройство, ведь его можно улучшить — улучшить, чтобы оно соответствовало вашим целям, а не целям эволюции, которая вас создала. Если мы это понимаем, какие мы можем сделать выводы? Что мы будем делать дальше?

Призраки и машины

Если посмотреть на наш мозг вблизи, изучить, как он работает на «низком уровне», то кажется, что он не слишком отличается от множества других механических систем. Однако же обычно мы рассуждаем о своём разуме не так, как мы рассуждаем о других окружающих нас объектах или органах нашего тела. Основные понятия, которые описывают то, что происходит у нас в голове — убеждение, решение, слово, идея, чувство и так далее — вроде бы довольно сильно отличаются от понятий, используемых для описания физических объектов.

Философы прошлого давно обратили на это внимание. И, опираясь на это наблюдение, они доказывали, что разум и мозг — это фундаментально разные явления. Философ Гилберт Райл назвал такой взгляд «догмой о призраке в машине»12. Современные учёные и философы отказались от этого дуализма, однако с созданием модели, предсказывающей работу разума лучше, возникли сложности. С точки зрения практических рассуждений, наши цели и желания по-прежнему представляются этакими бесплотными духами, отдельным магистерием, не связанным с другими научными знаниями. Мы можем рассуждать о «рациональности», «искажениях», о том, «как менять своё мнение», однако эти идеи неточны, их не ограничивает какая-то всеобъемлющая теория. Наукообразные слова не защитят нас от тех же ошибок, какие совершают люди, рассуждающие о духах и сущностях.

Занимательно, что окружающие разум тайны и загадки мешают нам понять не только человека. Они также цепляются ко всему, что кажется разумным или имеющим цель, и не важно, рассуждаем мы об эволюционной биологии или об искусственном интеллекте. Возможно, если мы не в состоянии разобраться в себе, глядя только на себя, мы сможем что-нибудь понять, используя в качестве зеркала очевидно нечеловечные процессы.

И для этого мы можем изучать множество призраков — прошлого, настоящего и грядущего. Иллюзии эти являются реально существующими когнитивными событиями, явлениями, которые можно изучить и объяснить. Если нечто выглядит, как призрак в машине, то это результат невидимой нам работы машины.

Цель первой цепочки тома «Машины в призраке» — «Простая математика эволюции» — описать несоответствия и различия между историей нашего происхождения, нашей современной биологией и нашими устремлениями. Обычные рассказы об эволюции для не-биологов сводятся к поверхностному описанию свойств естественного отбора. Здесь же мы пойдём несколько глубже.

В третьей цепочке — «Как люди понимают слова» — обсуждаются основные связи между познанием и формированием понятий. А после неё идёт длинное эссе, знакомящее читателей с идеей байесовского вывода.

Связывает эти темы цепочка «Хрупкие цели», где автор абстрагируется от человеческого познания и эволюции и рассуждает об идее разума и целеориентированных системах в целом. Также эти эссе объясняют авторский подход к философии и науке рациональности, на который повлияла его работа в области ИИ.

Воссоздание интеллекта

Юдковский — математик, занимающийся теориями принятия решений. Он работает над фундаментальными задачами в области сильного искусственного интеллекта — над теоретическими основаниями систем принятия решений широкого профиля. Как он отметил в своём первом эссе на Overcoming Bias под названием «Рациональность как боевое искусство», именно работа в этой области подтолкнула его изучать психологию рационального поведения человека:

Я стал лучше понимать рациональность благодаря своим попыткам решать задачи, связанные с сильным искусственным интеллектом (чтобы по-настоящему построить работающего рационалиста из подручных материалов придётся самому овладеть рациональностью на достаточно высоком уровне). Зачастую задачи, связанные с ИИ, требуют намного большего, чем искусство личной рациональности, но иногда этого может хватить. Чтобы овладеть боевым искусством для разума нам нужно научиться в нужное время нажимать на нужные рычаги в гигантской уже существующей думающей машине, внутренности которой мы не в состоянии изменить. Часть этой машины оптимизирована в результате эволюционного отбора для достижения целей, которые противоречат нашим собственным. Мы объявляем, что нас интересует только правда, но в наши мозги зашит механизм рационализации лжи.[…]

Попытка создать искусство личной рациональности, опираясь на науку о рациональности, может показаться глупой. Кто-нибудь скажет, что это всё равно что пытаться изобрести боевое искусство на основе теоретической физики, теории игр и анатомии человека. Однако люди способны к рефлексии. У нас есть природная склонность к интроспекции. Мы в состоянии заглянуть внутрь себя, пусть даже наше внутреннее зрение склонно к систематическим искажениям. Таким образом, нам нужно разобраться, что говорит наука по поводу нашей интуиции, с помощью абстрактных знаний исправить ход наших мыслей и улучшить наши метакогнитивные навыки. Мы не пишем компьютерную программу, чтобы заставить марионетку показывать приёмы боевых искусств. Мы должны заставить двигаться «конечности» нашего собственного мозга. Для этого нам нужно связать теорию с практикой. Нужно выяснить, как использовать науку для нас самих, для повседневной работы нашего разума.

Насколько я представляю, с точки зрения Юдковского, говорить о рациональности человека, не упоминая ИИ, столь же сложно, как говорить об ИИ, не упоминая рациональность.

Юдковский предсказывает, что в долгосрочной перспективе произойдёт «взрыв интеллекта» — так называется сценарий, при котором самомодифицирующийся ИИ будет улучшать свои способности улучшать себя и за счёт этого быстро обгонит человека. Вместо «взрыва интеллекта» иногда говорят «технологическая сингулярность». До января 2013 года MIRI назывался «Институтом сингулярности искусственного интеллекта»3 и проводил ежегодные саммиты сингулярности. С тех пор Юдковский стал предпочитать более старый — предложенный И.Дж.Гудом — термин «взрыв интеллекта», чтобы отделять свои взгляды от предсказаний других футуристов, например, от идеи Рея Курцвейла об экспоненциальном технологическом прогрессе4.

Хорошо это или нет, но технологии вроде ИИ умнее человека, скорее всего, приведут к значительным социальным потрясениям. Чтобы описать область исследований вопроса, как привести предпочтения ИИ в соответствии с предпочтениями человека, Юдковский придумал термин «теория дружественного ИИ». В настоящее время мы плохо представляем, когда будет создан сильный ИИ и какие подходы решат задачу безопасности. Уже сейчас довольно нелегко решать задачу, как проверить правильность работы существующих ИИ. А большинство современных техник вряд ли удастся обобщить на более разумные и лучше приспосабливающиеся к окружению системы. Таким образом, создание «дружественного ИИ» скорее похоже на решение совокупности математических и философских задач, чем на строгое техническое задание программиста.

По состоянию на 2015 год футуристы и исследователи ИИ (как теоретики, так и практики) по-прежнему оспаривают взгляды Юдковского на будущее искусственного интеллекта. На эту тему нет всеобщего консенсуса. Большой обзор моральных и стратегических вопросов, которые поднимает создание ИИ умнее человека, представлен в книге Ника Бострома «Искусственный интеллект»5.

Наиболее известный учебник, подходящий, чтобы познакомиться с темой искусственного интеллекта — это «Искусственный интеллект. Современный подход» Стюарта Рассела и Питера Норвига6. В главе, посвящённой философским и этическим вопросам, связанным с ИИ, авторы отмечают, насколько технически сложно обеспечить хорошее поведение сильного адаптивного ИИ:

[Юдковский] утверждает, что дружелюбие (нежелание вредить людям) должно быть заложено с самого начала. Но создатели должны понимать, что их творения могут содержать ошибки и что робот будет учиться и развиваться. Отсюда следует, что самое сложное — это создать для развивающейся машины систему сдержек и противовесов, и обеспечить, чтобы при любом развитии сценария функция полезности оставалась дружественной. Статичную функцию полезности запрограммировать нельзя, поскольку обстоятельства и наша реакция на эти обстоятельства с течением времени будут меняться.

Развитие ИИ, нанотехнологий, биотехнологий и других областей знаний может повлечь за собой угрозы для человеческой цивилизации. Обеспокоенные этими угрозами Бостром и Чиркович составили первую научную антологию на эту тему — «Риски глобальных катастроф»7. Самые серьёзные из них — это экзистенциальные риски — риски, которые могут повлечь вечную стагнацию или вымирание человечества8.

Люди (и эксперты в том числе) чрезвычайно плохо предсказывают значительные изменения, которые произойдут в будущем (в том числе новые технологии). Юдковский обсуждает рациональность ещё и для того, чтобы выяснить, какие искажения мешают предсказывать крупные потрясения в будущем и подготовиться к ним. Главы в книге «Риски глобальных катастроф» – «Когнитивные искажения, влияющие на оценку глобальных рисков»9 и «Искусственный интеллект как положительный и отрицательный фактор глобального риска»10 объединяют его исследования в областях когнитивных наук и ИИ. Темы, вызывающие беспокойство как в краткосрочной, так и в долгосрочной перспективе обсуждаются Юдковским и Бостромом в главе «Этика искусственного интеллекта» книги «Кэмбриджское руководство по искусственному интеллекту»11.

И хотя «Рациональность: от ИИ до Зомби» посвящена рациональности человека, тема ИИ помогает проиллюстрировать различные аспекты человеческого мышления. К тому же, долгосрочное технологическое прогнозирование — одна из важнейших областей применения байесианской рациональности, позволяющей формировать корректные суждения даже там, где данных недостаточно или они неоднозначны.

Знание устройства может многое сказать о его создателе, а знание создателя может многое сказать о созданном им устройстве.

Поэтому мы начнём с вопроса: «Что наш создатель может сказать нам о нас самих?»

  • 1. Gilbert Ryle, The Concept of Mind (University of Chicago Press, 1949).
  • 2. Часто также встречается перевод «дух в машине». — Прим.перев.
  • 3. Англ. «the Singularity Institute for Artificial Intelligence». — Прим. перев.
  • 4. Irving John Good, «Speculations Concerning the First Ultraintelligent Machine,» in Advances in Computers, ed. Franz L. Alt and Morris Rubinoff, vol. 6 (New York: Academic Press, 1965), 31–88, doi:10.1016/S0065-2458(08)60418-0.
  • 5. Автор ссылается на издание Nick Bostrom, Superintelligence: Paths, Dangers, Strategies (Oxford University Press, 2014). Существует перевод на русский язык. — Прим.перев.
  • 6. Автор ссылается на издание Stuart J. Russell and Peter Norvig, Artificial Intelligence: A Modern Approach, 3rd ed. (Upper Saddle River, NJ: Prentice-Hall, 2010). Существует перевод на русский язык 2-го издания этой книги. — Прим. перев.
  • 7. Bostrom and Ćirković, Global Catastrophic Risks.
  • 8. Как пример возможного экзистенциального риска можно привести сценарий «серой слизи» — молекулярные роботы, сконструированные, чтобы эффективно самовоспроизводится, справляются со своей задачей слишком хорошо, поглощают всё доступное вещество Земли, уничтожая тем самым все живые организмы.
  • 9. Оригинал доступен по ссылке: https://intelligence.org/files/CognitiveBiases.pdf — Прим.перев.
  • 10. Оригинал доступен по ссылке: https://intelligence.org/files/AIPosNegFactor.pdf — Прим.перев.
  • 11. Nick Bostrom and Eliezer Yudkowsky, “The Ethics of Artificial Intelligence,” in The Cambridge Handbook of Artificial Intelligence, ed. Keith Frankish and William Ramsey (New York: Cambridge University Press, 2014).
Перевод: 
sepremento, Alaric
Оцените качество перевода: 
Средняя оценка: 3.8 (18 votes)

Сила интеллекта

Элиезер Юдковский

В своих черепах мы носим около полутора килограммов склизкой, серой, морщинистой субстанции, напоминающей скомканную туалетную бумагу.

Взглянув на этот неаппетитный комок жира, едва ли можно подумать, что это самая могущественная штука в изученной вселенной. Если бы вы никогда не читали книг по анатомии и увидели бы мозг, лежащий на улице, вы бы сказали «Фууу» и постарались пройти, не запачкав обувь. Аристотель считал, что мозг — это орган, охлаждающий кровь. Он совсем не кажется опасным.

Пять миллионов лет назад, предки львов правили днём, а предки волков правили ночью. Правящие хищники были вооружены острыми, как лезвия бритвы, зубами и когтями, обладали мощными мышцами. Их добыча, в качестве обороны, эволюционировала бронированные панцири, острые рога, токсичные яды, камуфляж. Война велась на протяжении сотен эпох, и гонкам вооружений не было конца. Многие проигравшие покидали игру, но победителя так и не было видно. У одних видов были панцири, но другой вид эволюционировал вскрывать их. Одни виды становились ядовиты, но другие вырабатывали иммунитет к яду. У каждого вида была своя ниша - но кто мог бы жить и в морях, и в океанах, и на земле одновременно? Не существовало ни абсолютного оружия, ни универсальной защиты и не было причин считать, что нечто подобное возможно.

А затем наступил День Хлипких Существ.

У них не было ни брони, ни когтей, ни яда.

Если бы вы увидели фильм, в котором происходит ядерный взрыв и вам бы сказали, что это сделала земная форма жизни, вы бы ни за что не подумали, что ответственность лежит на Хлипких Существах. Ведь Хлипкие Существа не радиоактивны.

В начале, у Хлипких Существ не было ни реактивных истребителей, ни пулемётов, ни ружей, ни мечей. Ни бронзы, ни железа. Ни молотков, ни наковален, клещей, кузниц или же шахт. Всё, что было у Хлипких Существ - их хлипкие пальцы - слишком слабые, чтобы сломать дерево, не говоря уже о горе. Очевидно, не опасны. Чтобы разрубить камень потребуется сталь. Хлипкие Существа не могли выделить сталь. В окружающей среде не было готовых стальных клинков, которые можно было бы поднять хлипкими пальцами. Их тела и близко не могли генерировать температуры достаточные для того, чтобы плавить металл. Сама эта идея совершенно абсурдна.

Хлипкие Существа манипулируют ДНК? Это уже за пределами абсурдности. Хлипкие пальцы не настолько маленькие. Нет возможности получить доступ к ДНК с уровня Хлипких Существ, это всё равно, что взять атом водорода. Ну, технически они находятся в рамках одной вселенной, технически Хлипкие Существа и ДНК являются частью одного мира, единых законов физики, единой великой паутины причинности, но будем реалистичны: вы не смогли бы заглянуть так далеко.

Даже если бы Хлипкие Существа смогли бы когда-нибудь эволюционировать так, чтобы овладеть всеми этим умениями, на это потребовались бы миллиарды лет. Мы наблюдали за взлётами и падениями Жизни на протяжении эпох, и позвольте заметить, год – это даже не мгновение по меркам эволюции. Ну, конечно, технически год – это шестьсот триллионов триллионов триллионов триллионов Планковских интервалов. Но менее чем за шестьсот миллионов триллионов триллионов триллионов триллионов Планковских интервалов все равно ничего не происходит, так что спорить бесполезно. Хлипкие Существа, бегущие сейчас по саванне, ни за что не смогут облетать континенты, по крайней мере, ещё десять миллионов лет. Никто не способен заниматься сексом настолько часто.

Ну а теперь расскажите мне, как Искусственный Интеллект не сможет сделать ничего интересного через Интернет, если только человеческие программисты не построят ему роботизированное тело.

Я много раз наблюдал за реакцией, которую вызывает у людей слово «интеллект». Нередко первая мысль, что приходит им в голову определяет их отношение к технологической сингулярности. Часто первой ассоциацией к слову «интеллект» становится образ «книжного червя» — что-то вроде шахматного гроссмейстера, неспособного пригласить девушку на свидание, или профессора колледжа, неспособного выжить вне научного сообщества.

«Одного интеллекта недостаточно, чтобы преуспеть», — говорят люди, как будто харизма заключена в почках, а не в мозгу. «Интеллект не сравнится с пистолетом», — говорят они, как будто пистолеты выросли на деревьях. «Откуда Искусственный Интеллект возьмёт деньги?», — спрашивают они, словно первый Homo Sapiens нашёл долларовые купюры, упавшие с неба, а затем потратил их на покупки в магазинах, уже расположенных в том же лесу. Человечество появилось не в условиях рыночной экономики. Пчелы не продадут вам мёд в обмен на электронный перевод средств. Человек придумал деньги, и вот они существуют — для нас, не для пчёл, — потому что мы продолжаем в них верить.

Я всё пытаюсь объяснить, что воплощением интеллекта является вовсе не Дастин Хофман в «Человеке Дождя». Воплощение интеллекта — это человек. Точка. Это хлипкое существо, разрывающее вакуум, чтобы оставить отпечаток ноги на Луне. Внутри серого влажного комка жира заключена сила искать пути среди великой паутины причинности и находить, казалось бы, невозможное — сила, что иногда называется творческим подходом.

Люди — в частности венчурные капиталисты — иногда спрашивают: если MIRI удастся успешно создать полноценный ИИ, каким образом из этого можно будет извлечь прибыль? Это мы называем проблемой постановки задачи.

Хотя, вероятно, дело тут далеко не только в конфликте допущений. Немного творческого подхода позволяет людям представить, как отправиться на Луну, или исцелить оспу, или построить компьютеры. Но придумать способ, как сделать всё это разом, кажется совершенно невозможным. Пусть даже необходимая для этого сила расположена всего в нескольких сантиметрах от их глаз. Серые влажные штуки кажутся таинственными для серых влажных штук.

И таким образом, раз люди не вполне понимают, как это всё могло сработать, сила интеллекта кажется менее реальной. Это куда сложнее, чем представить, как столб пламени отправляет корабль на Марс. Перспектива полёта на Марс захватывает воображение. Но стоит кому-то пообещать и полет на Марс, и единую теорию поля, и доказательство гипотезы Римана, и лекарства от ожирения, рака, старения и глупости — ну это просто звучит неправдоподобно, вот и всё.

И это правильно. Это серьёзная ошибка нашего воображения: считать, что интеллект способен лишь на столь малое. Кто мог бы представить на заре времён, чего удастся добиться при помощи разума? Не исключено, что мы до сих пор не догадываемся, в чем состоят наши настоящие проблемы.

Но в то же время, поскольку сложно понять, каким образом один процесс владеет такими разнообразными силами, сложно представить, что одним махом он сможет решить даже столь простые проблемы, как ожирение, рак и старение.

Тем не менее один и тот же процесс смог исцелить оспу, и построить самолёты, и вывести пшеницу, и приручить огонь. Наша текущая наука может до конца не соглашаться касательно того, как именно он работает, но это не мешает ему работать. Если вы временно невежественны относительно явления, - это факт о вашем состоянии ума, а не о самом явлении. Пустая карта не соответствует пустой территории. Если кто-то не вполне понимает ту силу, что оставила следы на Луне, это никак не меняет того факта, что следы все ещё там - реальные следы на реальной Луне, оставленные реальной силой. И если бы кто-то понял эту силу достаточно глубоко, то смог бы создавать и направлять эту силу. Интеллект так же реален, как и электричество. Он всего лишь сильнее, опаснее, имеет куда более глубокое влияние на грядущую историю жизни во вселенной. И разобраться, как построить его генератор, немного сложнее.

Перевод: 
Горилла В Пиджаке
Оцените качество перевода: 
Средняя оценка: 3.7 (Всего оценок: 61)

Простая математика эволюции

Цель первой цепочки тома «Машина в призраке» — описать противоречия между историей нашего происхождения, нашим современным биологическим устройством и нашими стремлениями. Это потребует углубиться в описание эволюции сильнее, чем привычно для не биологов, которые часто обращают внимание лишь на поверхностные особенности естественного отбора.

Автор: 
Элиезер Юдковский

Чуждый Бог

Элиезер Юдковский

«Удивительное свойство теории эволюции: любому она кажется понятной»
Жак Моно

Глядя на природу, человек всюду видит предназначение. Заячьи лапы сконструированы для бега. Лисьи челюсти идеально подходят для разрывания добычи. Увы, наше зрение нас здесь подводит: мы видим не то, что есть на самом деле.

В додарвиновские времена причины этой повсеместно наблюдаемой предназначенности были одной из величайших научных загадок. Богопоклонники твердили: «это сделал Бог» — ведь ты получаешь 50 бонусных баллов каждый раз, когда используешь слово «Бог» в предложении. Хотя, пожалуй, я здесь несправедлив. В те времена гипотеза божественного происхождения выглядела гораздо разумнее, чем её альтернативы. «Обнаружив в пустыне часы, — говорил Уильям Пейли — можно сделать вывод о существовании часового мастера».

Но стоит лишь внимательно рассмотреть всю кажущуюся предназначенность в Природе, вместо того, чтобы выбирать только удобные примеры — начинаешь замечать вещи, несовместимые с иудеохристианской концепцией всеблагого Творца. Лисы выглядят так, будто они спроектированы для охоты на зайцев. Зайцы выглядят так, будто спроектированы, чтобы убегать от лис. Творец что, не смог определиться?

Проектируя тостер, я не включаю в него один блок для нагревания теплового элемента, а другой — для его охлаждения. Это было бы глупо и расточительно. Кому могло прийти в голову запроектировать экосистему со всеми её хищниками и жертвами, вирусами и бактериями? Даже кактусы, будто специально придуманные, чтобы снабжать водой и пищей пустынных животных, покрыты неприятными колючками.

Картина становится гораздо более осмысленной, если предположить, что природу создавал не единственный Творец, а целый сонм мелких богов — как в индуизме или синтоизме. Такое предположение удобно объясняет и повсеместную предназначенность, и повсеместные конфликты. Множество богов действовало независимо, часто с противоположными целями. И лиса, и заяц были спроектированы — но различными, конкурирующими божествами. Интересно, кто‑нибудь уже предлагал это наблюдение как доказательство в пользу индуизма против христианства?

Иудеохристианская традиция постулирует, что Бог благосклонен. Ну, в общих чертах. В то же время, значительная часть наблюдаемой в природе предназначенности демонстрирует невероятную жестокость. Дарвин заподозрил, что Творец не соответствует общепринятой концепции, изучая наездников-ихневмонид. Их ядовитое жало лишь парализует, а не убивает жертву, что предохраняет её от порчи, позволяя личинкам ихневмонид в течение длительного времени пожирать её заживо. «Я не могу убедить себя в том, — писал Дарвин — что всеблагой и всемогущий Бог сотворил ихневмонид, намеренно предусмотрев пожирание ими живых тел гусениц, или сотворил кошку, заложив в неё желание играть с мышью»1. Интересно, озвучивал ли какой‑нибудь более ранний мыслитель эти факты как доказательство в пользу манихейства2 против монотеизма?

Сегодня мы все знаем разгадку: надо просто сказать «эволюция».

К сожалению, некоторых это «научное» объяснение вполне устраивает. Как будто «эволюция» — это такой волшебный источник предназначенности в Природе. Я уже приводил в качестве примера Шторм из Людей Икс, которая в результате одной мутации получила способность метать молнии. Как? Ну, есть такая штука — «эволюция», которая закачивает в Природу предназначенность. Изменения происходят посредством «мутаций»; если получить действительно большую мутацию, результатом станут реально большие полезные изменения. Например, Шторм получит способность метать молнии. Популярный источник суперспособностей — радиоактивность: радиация приводит к мутациям, так что чем мощнее радиация, тем мощнее будут мутации. Такая вот логика.

Но эволюция не позволяет любой предназначенности проникать в Природу. Именно это делает эволюцию столь успешной в качестве эмпирической гипотезы. Если бы эволюционная биология объясняла не только деревья, но и тостеры, она была бы бесполезна. Эволюционная теория — это не просто ткнуть пальцем в Природу и сказать «теперь предназначенность разрешена», или «так сделала эволюция». Сила любой теории не в том, что она объясняет, а в том, что она объявляет невозможным. Если ты придумал гипотезу, одинаково убедительно объясняющую любое событие, твои знания равны нулю.

«Многие люди, далёкие от биологии, — заметил(e) Джордж Уильямс — думают, что именно для их блага гремучие змеи отращивают на хвостах “погремушки”»3. Бзз‑з‑з! Неправильный ответ! Такая предназначенность не разрешена. Эволюция не позволяет произвольным всплескам предназначенности пробираться тут и там, перекраивая один вид для блага другого вида.

Движущая сила эволюции — систематическая корреляция между способами, которыми разные гены влияют на конструкцию организмов и количеством копий этих генов, которые добираются до следующего поколения. Чтобы «погремушки» росли на хвостах гремучих змей, «погремушечные» гены должны с каждым поколением встречаться всё чаще и чаще (на самом деле, не просто «погремушечные» гены, а гены, кодирующие всё более сложные звуки, издаваемые «погремушками»; но погружаться в подробное описание всех тонкостей эволюционной биологии мы не будем, иначе эта статья никогда не закончится).

Нет никакой Эволюционной Феи, которая изучает текущее состояние природы и решает: «хм, хорошая идея!», увеличивая частоту «погремушечных» генов в популяции.

Подозреваю, что именно на этом месте спотыкается значительное число людей, изучающих эволюционную биологию. Они понимают, что «полезные» гены становятся более распространёнными, но слово «полезные» позволяет любой предназначенности прокрасться в рассуждение. Они вроде бы не верят в Эволюционную Фею, в то же время спрашивая, какие гены могли бы быть «полезны», имея в виду, в том числе, «пользу» не только для гремучих змей, но и для других видов.

Ключевой факт, который необходимо осознать — нет никакой Эволюционной Феи. Нет никакой внешней силы, решающей, какие гены должны «получить повышение». Всё происходящее происходит исключительно в результате работы самих генов.

Гены, кодирующие (всё более сложные) звуки «погремушки», должны становиться всё более распространёнными в генофонде гремучих змей исключительно благодаря самим звукам. В этом случае, вероятно, всё дело в том, что змеи с лучшими «погремушками» лучше выживают (а не в том, что они успешнее размножаются или способствуют более успешному размножению своих родственников).

Возможно, хищники опасаются звуков «погремушек» и стараются не наступать на гремучих змей. Возможно, «погремушка» на хвосте отвлекает внимание от змеиной головы. (Джордж Уильямс утверждал(e), что «результат схватки между собакой и змеёй почти полностью определяется тем, за какую часть собака схватит змею изначально — за голову или за хвост»).

Но это всего лишь змеиные «погремушки». Существуют гораздо более сложные способы, которыми гены могут приводить к увеличению частоты своего появления в следующем поколении. Ваши братья и сёстры разделяют с вами половину ваших генов. Ген, жертвующий одной единицей ресурса, чтобы предоставить три единицы ресурса брату, может передать будущему поколению несколько своих копий, пожертвовав одним из сконструированных им организмов (несущим лишь одну копию).

Если вы действительно хотите разобраться в деталях и тонкостях, купите книжку по эволюционной биологии; не существует царского пути. Но ключевая идея такова: эффект от наличия определённого гена должен напрямую увеличивать частоту появления этого гена в следующем поколении. Нет Эволюционной Феи, которая бы воздействовала извне. Нет ничего, что бы решало, какие гены «полезны» и, следовательно, должны появляться чаще. Должна быть прямая причинно-следственная связь, начало которой — в самих генах.

Это объясняет странные конфликты предназначенности в Природе и распространённую в ней жестокость. Объясняет даже лучше, чем орда синтоистских божеств.

Почему столь многое в Природе находится в постоянной войне с другими её частями? Потому что нет никакой единой Эволюции, которая управляла бы процессом. Есть лишь множество малых «эволюций», представленных отдельными размножающимися популяциями. Заячьи гены становятся более или менее распространёнными в популяциях зайцев. Лисьи гены становятся более или менее распространёнными в популяциях лис. Лисьи гены, которые конструируют лис, хорошо ловящих зайцев, создают больше собственных копий в следующем поколении. Заячьи гены, конструирующие зайцев, хорошо убегающих от лис, естественным образом встречаются чаще в следующем поколении зайцев. Отсюда словосочетание «естественный отбор».

Почему Природа так жестока? Мы, будучи людьми, смотрим на наездников-ихневмонид и решаем, что пожирать жертву заживо — жестоко. Если уж никак нельзя избежать пожирания жертвы заживо, мы постараемся хотя бы не причинять ей страданий. Ихневмонидам не стоило бы больших усилий добавить в состав парализующего яда обезболивающее. А что насчёт старых слонов, медленно умирающих от истощения после выпадения последнего комплекта зубов? Эти слоны всё равно уже не могут размножаться. Чего стоило эволюции — точнее, эволюции слонов — сделать так, чтобы старые слоны умирали сразу, не мучаясь так долго? Чего стоило эволюции сделать их смерть безболезненной, или усыплять их, чтобы безмятежное угасание сопровождалось приятными снами? Ничего. Всё вышеперечисленное никак не повлияло бы на шансы этого слона продолжить свой род.

Если бы речь шла о том, чтобы убедить другого человека, мы были бы в отличной позиции для переговоров и легко настояли бы на своём. Ведь от нашего оппонента потребовались бы лишь незначительные уступки: обезболить жертву, позволить слону умереть без мучений. Почему бы не пойти навстречу столь скромной просьбе? Ну пожалуйста, э‑э…

Нет никого, к кому мы могли бы обратиться со своими аргументами.

Люди подделывают свои оправдания, определяя желаемое одним способом, а потом оправдывая принятое решение чем‑нибудь другим. Нет никакой Феи Эволюции Слонов, которая пыталась бы (а) определить, что для слонов лучше всего и (б) определить, как оправдать это перед Эволюционным Надзирателем, который (в) не хочет, чтобы эволюционная приспособленность снижалась, но (г) не будет мешать в реализации идеи безболезненной смерти до тех пор, пока она не мешает никаким другим полезным генам.

В системе нигде нет места для защитника слонов.

Люди, нередко глубоко переживающие за благополучие животных, могут быть очень убедительны в своей аргументации в пользу того, как различные проявления милосердия не повредили бы репродуктивной приспособленности. Увы, эволюция слонов не использует ничего, что напоминало бы этот алгоритм; она не выбирает классные гены, про которые можно придумать реалистично звучащие аргументы в пользу их ценности для репродуктивной приспособленности. Алгоритм эволюции донельзя прост: гены, которые реплицируются чаще, становятся более распространёнными в следующим поколении. Как вода, текущая под гору — и с тем же уровнем великодушия.

Окидывая взором Природу, мы думаем обо всех усовершенствованиях, которые мы внесли бы в конструкцию организмов. После чего рационализируем, выдумывая причины, по которым желаемые нами улучшения увеличили бы репродуктивную приспособленность — таков наш политический инстинкт, желание «продать» вариант, предпочтительный для нас, под видом того, что хочет видеть наше начальство.

По этой схеме эволюционные биологи-любители делают тысячи удивительных и фантастически ошибочных предсказаний. Потому что биологи-любители делают свои заключения, более того — находят свои гипотезы в общем пространстве всех возможных идей — используя не тот алгоритм, который использует эволюция, делая свои «заключения».

Разумный инженер спроектировал бы человеческие вкусовые рецепторы так, чтобы они измеряли, сколько в еде содержится различных питательных веществ и сколько их нам необходимо. При нехватке жиров миндаль и чизбургеры казались бы невероятно вкусными, а при первых признаках приближающегося ожирения, или в случае нехватки витаминов, самым вкусным казался бы салат-латук. Но не существует Феи Человеческой Эволюции, которая бы заранее разумно спланировала и запроектировала универсальную систему для любых обстоятельств. Нехватка калорийной пищи была надёжным инвариантом окружающей среды древних людей. Поэтому гены организмов, любивших калории, стали встречаться чаще. Как вода, текущая под гору.

Мы — воплощённая история того, какие организмы фактически выжили и размножились, а не того, какие организмы должны были бы «по уму» выжить и размножиться.

Сетчатка человеческого глаза устроена очень криво: светочувствительные клетки находятся сзади, а нервы к ним прикреплены спереди, где собираются в пучок и сквозь сетчатку уходят вглубь черепа. Отсюда слепое пятно. Для инженера это выглядит просто тупо. У некоторых других организмов сетчатка развивалась независимо от нас и получилась гораздо лучше. Почему бы не переделать человеческую сетчатку?

Проблема в том, что никакая отдельная мутация не сможет переделать всю сетчатку сразу. Это инженер может переделать разом несколько частей или заранее предусмотреть пространство для будущих изменений. Но если отдельная мутация поломает какие‑то важные части организма, не имеет значения, сколь удивительные вещи Фея могла бы впоследствии выстроить на этой основе: организм погибнет, и частота появления соответствующего гена в популяции снизится.

Если развернуть клетки сетчатки глаза, не изменив соответственно нервные окончания и зрительный нерв, система в целом не будет работать. Не имеет никакого значения тот факт, что для Феи, или разумного инженера, это лишь первый шаг к более совершенной, модернизированной системе. Такой организм будет слеп. Эволюция неспособна предвидеть последствия, ведь это лишь зафиксированная история того, какие организмы фактически размножились. Эволюция столь же слепа, как человек с наполовину переделанной сетчаткой.

Обнаружив в пустыне часы, можно сделать вывод о часовом мастере. Когда-то некоторые люди это отрицали. Они утверждали, что жизнь «просто появилась», без необходимости в оптимизирующем процессе. Как мыши, спонтанно зарождающиеся в грязных тряпках4.

Если спросить, кто был ближе к истине — теологи, защищавшие концепцию Бога‑Творца, или интеллектуально неудовлетворённые атеисты, защищавшие идею спонтанного зарождения мышей, мы должны признать победу за теологами: эволюция — не Бог, но она ближе к Богу, чем к хаосу чистой энтропии.

Мутации случайны, но отбор — не случаен. Это не значит, что разумная Фея вмешивается и отбирает, но существует ненулевая корреляция между геном и частотой воспроизводства организма. За несколько миллионов лет отклонения аккумулируются, превращаясь в непреодолимую силу. Это не божество, но гораздо больше похоже на божество, чем на «снег» случайных помех на телеэкране.

«Творцы онтологически отличны от сотворённых существ, — сказал Дэмиен Бродерик(e) — или они не стоят бумаги, на которой описаны». Действительно, могущественный Скульптор Жизни сам не является существом. Он бестелесен, подобно иудеохристианскому богу. Он пронизывает всю Природу, воплощаясь в падении каждого листа. Он безбрежен, как поверхность целой планеты. Он существует миллиарды лет. Он не был сотворён, но неизбежно произрастает из самой структуры физических законов. Разве нельзя назвать Богом того, кто подходит под такое описание?

В то же время, Создатель не имеет и разума. Жизнь — его творение — по человеческим меркам спроектирована просто паршиво. В ней нет внутреннего единства, одни части конфликтуют с другими. А главное — она совсем не добра и не приветлива.

В каком‑то смысле, Дарвин открыл Бога — Бога, который не совпал с представлениями теологов, а потому прошёл незамеченным. Если бы Дарвин открыл, что жизнь создана разумным существом — бестелесным сознанием, которое любит нас и шарахнет молнией любого, кто в этом усомнится — люди бы воскликнули: «О боже мой! Это же Бог!»

Вместо этого Дарвин открыл странного, чуждого Бога — не успокаивающе «непознаваемого», но действительно непохожего на нас. Эволюция — не Бог, но если бы она была им, это был бы не Иегова. Это был бы Азатот Говарда Лавкрафта — слепой безумный Бог, хаотически бурлящий в самом центре бесконечности под монотонные всхлипы чудовищных флейт.

Что вы и могли бы ожидать, если бы внимательно посмотрели на Природу.

Вот цена заявлениям некоторых религиозных людей, утверждающих, что они действительно верят в непознаваемое божество без конкретных, заранее известных им признаков с соответствующе высокой вероятностью. Кто‑то действительно верящий в столь неопределённое божество, немедленно опознал бы своего странного нечеловеческого создателя, когда Дарвин сказал своё «Ага!».

Вот цена заявлениям некоторых религиозных людей, утверждающих, что они с искренней непредвзятостью ожидают, когда наука обнаружит Бога. Наука уже обнаружила вполне богоподобного создателя людей, но не такого, о котором религиозные люди хотели бы узнать. Они ожидали обнаружения их Бога — божества очень конкретного типа, которого им хотелось бы узреть. Их ожидание будет бесплодным, ибо великое открытие уже сделано и победителем оказался Азатот.

Что ж, тем лучше для нас, людей. Мне нравится Создатель, которого я могу перехитрить. Лучше, чем быть домашним животным. Я рад, что наш Бог — Азатот, а не Один.

Примечание редактора: Перевод этого эссе взят с сайта Данилы Сентябова с его разрешения.

  • 1. Francis Darwin, ed., The Life and Letters of Charles Darwin, vol. 2 (John Murray, 1887).
  • 2. Манихейство — древняя религия, согласно которой материальный мир не сотворён единственным Создателем, а рождён в результате конфликта двух равноправных сил — всеблагого Света и бездуховного Мрака. Подробнее можно прочитать в Википедии. — Прим.перев.
  • 3. Речь идёт о популярной идее, будто «погремушки» появились у змей «из гуманистических целей», чтобы оповещать окружающих об опасности. Источник цитаты — George C. Williams, Adaptation and Natural Selection: A Critique of Some Current Evolutionary Thought, Princeton Science Library (Princeton, NJ: Princeton University Press, 1966).— Прим.перев.
  • 4. В Средние века было распространено представление о самозарождении мышей и других вредителей из «нечистот».— Прим.перев.
Перевод: 
dsent
Номер в книге "Рациональность: от ИИ до зомби": 
131
Оцените качество перевода: 
Средняя оценка: 4.6 (23 votes)

Чудо эволюции

Элиезер Юдковский

Чудо эволюции в том, что она вообще работает.

Я говорю буквально. Если уж вы хотите восторгаться эволюцией, именно это достойно восхищения.

Каким образом во вселенной впервые возникла оптимизация? Если некий разумный агент сотворил природу, кто сотворил разумного агента? Где первый создатель, у которого нет создателя? Загадка не в том, как уже первый этап этой последовательности может быть супер-разумным и супер-эффективным. Загадка в том, как он вообще мог появиться.

Эволюция разрешает бесконечную регрессию не потому, что она сверхумная и сверхэффективная, а потому, что она тупая, неэффективная, но всё равно работает. В этом и заключается чудо.

По профессиональным причинам мне часто приходится обсуждать медлительность, случайность и слепоту эволюции. После чего кто-нибудь говорит: «Вы только что сказали, что эволюция не способна планировать одновременные изменения и что эволюция крайне неэффективна, так как мутации случайны. Но разве не это же утверждают креационисты? Что вы не можете собрать часы, случайно перемешивая детали в коробке?»

Но нельзя возражать креационистам словами, что вы на самом деле можете собрать часы, тряся коробку с деталями. Просто эволюция работает не так. Если вы считаете, что эволюция действительно представляет из себя воздушные вихри, собирающие Боинги 747, то креационисты успешно исказили ваше представление о биологии — продали вам чучело.

В действительности сложные механизмы эволюционируют либо последовательно улучшаясь, либо приспосабливая уже существующие сложные механизмы под новую цель. Белки прыгают с дерева на дерево, используя лишь свои мышцы, но длина их прыжка в определенной степени зависит от аэродинамики их тел. И сейчас существуют белки-летяги, настолько аэродинамичные, что они могут парить на небольшие расстояния. Если бы птицы оказались уничтожены, потомки белок-летяг могли бы занять эту экологическую нишу в течении десяти миллионов лет, их летательные мембраны превратились бы в крылья. А креационисты говорили бы: «Что толку от половины крыла? Вы бы просто упали и разбились. Как бы птицебелки могли эволюционировать последовательно?»

Вот так одна сложная адаптация может породить новую сложную адаптацию. Сложность также может нарастать постепенно, начиная с одной случайной мутации.

Сначала появляется какой-нибудь ген А — простой, но хотя бы чуть-чуть полезный сам по себе, благодаря чему он распространяется в генофонде. Потом появляется ген B, от которого есть польза только в присутствии A, но так как A уже широко распространён в генофонде, в пользу B действует серьёзное давление отбора. Далее возникает модифицированная версия А*, которая зависит от B, но не разрушает зависимость B от А/А*. Потом появляется С, связанный с А*, и B*, который зависит от А* и С. И вскоре мы имеем «нечленимо сложный» механизм, который ломается, стоит вытащить одну деталь.

И тем не менее, вы всё ещё можете отследить путь обратно к единственному элементу: вы можете, не ломая механизм, сделать один элемент менее зависимым от другого, и, повторив это несколько раз, вы сможете вытащить деталь, не сломав механизм, и так пока не превратите механические часы в грубые солнечные.

Например: ДНК хранит информацию очень точно. В устойчивом формате, который позволяет осуществлять точную дупликацию. Рибосома переводит эту сохраненную информацию в последовательность аминокислот, в белок, который может принимать множество химически активных форм. Объединенная система, ДНК и рибосома, может создать любой белковый механизм. Но в чём польза от ДНК без рибосомы, которая переводит информацию в белки? В чём польза от рибосомы без ДНК, которая бы объяснила, какой белок производить?

От организмов не всегда остаются окаменелости, поэтому эволюционная биология не всегда может выяснить, как именно происходило последовательное улучшение. Но в данном случае мы действительно знаем, как это произошло. РНК способна переносить информацию и самореплицироваться, как и ДНК, хотя РНК и не так устойчива, а её копии не столь точны. И РНК, как и белки, способна принимать химически активные формы, хотя и не столь универсальные, как аминокислотные цепочки белков. Почти наверняка РНК — это одиночная А, которая предшествовала взаимозависимым А* и B.

Отметить, что РНК выполняет объединенную работу ДНК и белков плохо, столь же важно, как и отметить то, что она вообще её выполняет. Восхитительно, что одна единственная молекула может одновременно хранить информацию и управлять химическими процессами. Делать эту работу ещё и хорошо было бы совершенно лишним чудом.

Что же было первым репликатором на свете? Это вполне могла бы быть нить РНК, ведь, «по какому-то странному стечению обстоятельств», химические элементы, составляющие РНК — это те химикаты, что могли естественным образом появиться на добиологической Земле 4 миллиарда лет назад. Пожалуйста, обратите внимание: эволюция не объясняет возникновение жизни. Эволюционная биология не предназначена для объяснения первого репликатора, потому что первый репликатор не произошёл от другого репликатора. Эволюция описывает статистические тенденции репликации. Первый репликатор не был статистической тенденцией, он был просто случаем. Идея, что эволюция должна объяснять возникновение жизни — это настоящее соломенное чучело, ещё одно креационистское непонимание эволюции.

Если бы вы наблюдали за первичным бульоном в день возникновения первой самовоспроизводящейся молекулы, день, который изменил Землю, вас бы не впечатлило то, насколько хорошо этот первый репликатор воспроизвел себя. Первый репликатор наверняка копировал себя, как пьяная мартышка под ЛСД. Вы не увидели бы никаких признаков той тщательной тонкой настройки, которая воплощена в современных репликаторах, потому что первый репликатор был случайностью. Эта одинокая ниточка РНК, или химический гиперцикл, или узор в грязи, не обязана была воспроизводиться изящно. Достаточно было сделать это хоть как-то. И даже тогда — это всё ещё было невероятно, если воспринимать это как единичный случай. Но это должно было случиться только один раз, а приливных луж было очень много. И вот несколько миллиардов лет спустя репликаторы ходят по Луне.

Первая случайно самореплицирующаяся молекула была самой важной молекулой в истории. Но если бы вы восхваляли ее слишком сильно, приписывая ей всяческие способствующие воспроизводству возможности, вы бы упустили всю суть.

Не думайте, что в политических дебатах между эволюционистами и креационистами тот, кто восхваляет эволюцию больше всех, должен быть на стороне науки. Наука имеет очень конкретное представление о возможностях эволюции. И если вы превозносите эволюцию хоть на миллиметр выше, вы не «сражаетесь на стороне эволюции» против креационизма. Вы научно некорректны, вот и все. Вы попадаете в креационистскую ловушку, настаивая, что да, торнадо может собрать Боинг 747! Разве это не здорово! Как чудесно разумна эволюция, насколько она заслуживает восхищения! Посмотрите на меня, я расписываюсь в своей верности науке! Чем больше я скажу хороших вещей о эволюции, тем больше я на стороне эволюции, против креационистов!

Но превознесение эволюции уничтожает истинное чудо: оно не в том, как хорошо эволюция создаёт вещи, а в том, что происходящий естественным образом процесс вообще способен что-то создавать.

Так что давайте избавимся от идеи, что эволюция прекрасно создаёт новые виды или чудесно управляет их судьбой, а мы, люди, должны подражать ей. Для человеческого интеллекта подражать эволюции как творцу было бы всё равно, что для современной сложноорганизованной бактерии брать пример с первого репликатора как с биохимика. Как выразился Томас Гексли, «бульдог Дарвина»:

Давайте поймем раз и навсегда, что этический прогресс общества строится не на подражании космическому процессу и тем более не на бегстве от него, а на противостоянии ему.

Гексли сказал это не потому, что он не верил в эволюцию, а потому что он понимал её слишком хорошо.

Перевод: 
Горилла В Пиджаке, deep_blue_hex, El Aurens
Номер в книге "Рациональность: от ИИ до зомби": 
132
Оцените качество перевода: 
Средняя оценка: 4.7 (10 votes)

Эволюции неразумны (но всё равно работают)

Элиезер Юдковский

В предыдущем эссе я писал:

Наука имеет очень конкретное представление о возможностях эволюции. И если вы превозносите эволюцию хоть на миллиметр выше, вы не «сражаетесь на стороне эволюции» против креационизма. Вы научно некорректны, вот и все.

В этом эссе я опишу некоторые широко известные неэффективности и ограничения эволюций. Я говорю «эволюции» во множественном числе, потому что цель эволюции лис прямо противоположна цели эволюции кроликов, и ни одна из них не может расспросить эволюцию змей, чтобы научиться выращивать ядовитые клыки.

Итак, я говорю здесь об ограничениях эволюции, но это не значит, что я пытаюсь пропагандировать креационизм. Это стандарный курс эволюционной биологии для продолжающих (если добавить выведение уравнений, будет продвинутый). Эволюции, ограниченные таким образом, всё ещё могут объяснить наблюдаемые биологические изменения; фактически эти ограничения как раз и придают им смысл. Помните, что прелесть эволюций не в том, насколько хорошо они работают, а в том, что они работают вообще.

Человеческий интеллект настолько сложен, что нет достаточно рабочего способа рассчитать, насколько он эффективен. Естественный отбор, хотя и не прост, - проще, чем человеческий мозг; как следствие, он медленнее и менее эффективен, как и подобает первому процессу оптимизации, который когда-либо существовал. На самом деле эволюции просты настолько, что мы можем точно рассчитать, насколько они глупы.

Эволюционные изменения медленны. Насколько? Предположим, есть полезная мутация, которая обеспечивает преимущество в приспособленности на 3%. В среднем, носители этого гена имеют в 1,03 раза больше детей, чем не-носители. При условии, что мутация распространяется свободно, сколько займёт её внедрение во всей популяции? Это зависит от численности населения. Ген, передающий 3% -ное преимущество приспособленности, распространяющееся среди 100 000 человек, потребует в среднем 768 поколения для достижения повсеместности в генофонде. Для населения в 500 000 потребуется 875 поколений. Общая формула такова:

требуемое количество поколений для фиксации гена в генофонде = 2*ln(N)/s

где N — размер популяции, а (1 + s) — приспособленность. (Если у каждого носителя этого гена в 1,03 раза больше детей, чем у не-носителя, s равняется 0,03). Таким образом, если размер популяции составляет 1 000 000 особей — примерная численность населения во времена охоты и собирательства — то потребуется 2763 поколения, чтобы ген, дающий преимущество на один процент, распространился в генофонде.1

В этом нет ничего удивительного. Генам приходится самим выполнять всю работу, потому что нет никакой Феи Эволюции, которая бы наблюдала за генофондом и решала: «Хм, этот ген, кажется, быстро распространяется, надо раздать его всем!»
В условиях человеческой рыночной экономики любой, кто, оставаясь в рамках закона, получает 20% прибыли от инвестиций — особенно если за этим стоит очевидный, прозрачный механизм — стремительно получает ещё больше капитала от инвесторов, а другие начинают копировать его предприятие. Генам же приходится распространяться без помощи фондовых рынков, банков и подражателей. Как если бы Генри Форду пришлось сделать одну машину, продать её, купить деталей на ещё 1,01 машину (в среднем), продать эти машины, и так до тех пор, пока не дойдёт до миллиона.

Это если предполагать, что ген вообще распространится. Следующее уравнение проще и вовсе не связано с размером популяции:

вероятность закрепления гена = 2s

У мутации, которая несёт 3%-ное преимущество (что чертовски много для мутаций), 6% вероятность распространения в популяции, по крайней мере на этот раз.2 Мутации могут повторяться, но при популяции из миллиона особей и точности копирования 10^-8 ошибок на поколение вам придётся подождать сотню поколений, чтобы получить ещё один шанс, а потом у неё всё равно будет 6% шанс закрепиться.

И всё-таки в конечном итоге эволюции неплохо удаётся добираться до финальной точки. (Это лейтмотив.)

На развитие сложных адаптаций требуется очень много времени. Сначала появляется аллель А, который выгоден сам по себе, и уходит тысяча поколений, прежде чем он закрепится в генофонде. Только после этого аллель B, зависимый от А, может начать развиваться. Меховая шуба не станет серьёзным преимуществом, если у окружающей среды нет статистически достоверной склонности устраивать вам морозильник. А гены составляют часть окружающей среды для других генов, и если B зависит от A, то B не получит серьёзного преимущества, пока A не будет достоверно присутствовать в окружающей среде.

Предположим, что B дает преимущество 5% при наличии A, а без него не даёт никакого. Тогда до тех пор, пока A всё ещё имеет 1% -ную частоту в популяции, B даст преимущество только 1 из 100 раз, поэтому суммарное преимущество наличия B составляет 0,05%, а вероятность закрепления В составляет 0,1%. В случае развития сложной адаптации сначала гену А придётся развиваться на протяжении более чем тысячи поколений, потом гену B придётся развиваться ещё тысячу поколений, и тогда A∗ разовьётся ещё через тысячу поколений… и несколько миллионов лет спустя вы получите новую сложную адаптацию.

И при этом другие эволюции не перенимают её. Если эволюция змей разработает потрясающий новый яд, это не поможет эволюции лис или эволюции львов.

Сравните всё это с человеком-программистом, который может разработать новый сложный механизм с сотней взаимозависимых частей всего за один день. Как это вообще возможно? Я не знаю ответа, и предполагаю, что наука тоже не знает(en); человеческий мозг намного сложнее, чем эволюции. Я мог бы махнуть рукой и сказать что-то вроде «целенаправленная обратная цепочка с использованием комбинаторных модульных представлений», но это не помогло бы вам спроектировать своего собственного человека. Тем не менее: люди предусмотрительны и способны разрабатывать новые элементы системы c расчётом на то, что в будущем будут разработаны другие новые элементы; производить согласованные одновременные изменения в взаимозависимом механизме; учиться, наблюдая отдельные тестовые примеры; фокусироваться на проблемных точках и разбираться с ними, используя абстрактное мышление; придумывать, как ещё можно поиграть с настройками вместо того, чтобы ждать, что луч из космоса создаст удачное изменение. По меркам естественного отбора это просто волшебство.

Люди способны делать вещи, которые эволюции сделать не смогут (здесь можно поставить точку) за всё то время, сколько ещё проживёт Вселенная. Как однажды сказала выдающийся биолог Синтия Кеньон за обедом, на котором я имел честь присутствовать: «Один аспирант за час может сделать то, что эволюция не смогла за миллиард лет». Согласно текущим знаниям биологов, эволюции изобрели полностью вращающееся колесо в общей сложности трижды.

И не забывайте о том, что программист может запостить фрагмент кода в интернете.

Да, некоторые изделия эволюции впечатляют даже в сравнении с лучшими технологиями Homo sapiens. Но наш кембрийский взрыв только начался, мы едва только начали накапливать знание, примерно… четыре сотни лет назад? В чём-то биология всё ещё превосходит лучшие человеческие технологии: мы не можем создать самовоспроизводящуюся систему размером с бабочку. В других случаях человеческая технология делает биологию только так. У нас есть колёса, у нас есть сталь, у нас есть ружья, у нас есть ножи, у нас есть заострённые палки; есть ракеты, транзисторы, атомные электростанции. С каждым десятилетием наша чаша весов склоняется всё ниже.

Повторю: для человеческого разума искать вдохновение в конструкторском мастерстве естественного отбора — то же самое, как если бы сложная современная бактерия подражала бы неуклюжей биохимии первого репликатора. Первый репликатор, появись он в сегодняшней конкурентной среде, был бы мгновенно съеден. Та же участь ждёт и человека-проектировщика, который станет вносить в свои стратегии случайные точечные мутации и ждать 768 итераций тестов, прежде чем внести 3%-ное улучшение.

Не превозносите эволюции ни на миллиметр больше, чем они того заслуживают.

Далее в программе: ещё больше захватывающих математических ограничений эволюции!

  • 1. Dan Graur and Wen-Hsiung Li, Fundamentals of Molecular Evolution, 2nd ed. (Sunderland, MA: Sinauer Associates, 2000).
  • 2. John B. S. Haldane, “A Mathematical Theory of Natural and Artificial Selection,” Mathematical Proceedings of the Cambridge Philosophical Society 23 (5 1927): 607–615, doi:10.1017/S0305004100011750.
Перевод: 
El Aurens, Moons_flower
Номер в книге "Рациональность: от ИИ до зомби": 
133
Оцените качество перевода: 
Средняя оценка: 4.8 (14 votes)

Корпорации и нанороботы не эволюционируют

Элиезер Юдковский

«Законы физики и математики выполняются всегда. Поэтому я считаю, что эволюция действует и сейчас. А из этого я делю вывод, что природа — кровожадное создание, как некоторые считают1, — просто выйдет на новый уровень…

[Пытаться избавиться от Дарвиновской эволюции] это всё равно, что пытаться избавиться от гравитации. Пока существуют ограниченные ресурсы и множество соревнующихся акторов, способных передавать характеристики, будет существовать давление отбора».

— Перри Мецгер, предсказывающий, что владычество естественного отбора продолжится в неопределённом будущем.

В эволюционной биологии, равно как и во многих других областях, важно мыслить количественно, а не качественно. Верно ли, что полезная мутация «распространяется иногда, но не всегда»? Скажем, паранормальные способности оказались бы полезной мутацией. Стоит ожидать их распространения, правильно? Тем не менее, это качественное суждение, а не количественное — если Х истинно, то Y истинно; если паранормальные способности полезны, то они могут распространиться. В «Эволюции неразумны» я привёл уравнение, которое определяет вероятность закрепления полезных мутаций: она примерно в два раза больше преимущества в приспособляемости (для преимущества в 3% получается вероятность в 6%). Скорее всего, только такое мышление — с помощью чисел — поможет нам понять, что вероятность распространения мутаций, которые полезны только изредка, крайне мала и что практически невозможно возникновение сложных адаптаций, если они не используются постоянно. Если бы паранормальные способности существовали, нам следовало бы ожидать, что они используются повсюду: не только потому, что они удивительно полезны, но и потому, что в противном случае они бы не развились и не распространились.

«Пока существуют ограниченные ресурсы и множество соревнующихся акторов, способных передавать характеристики, будет существовать давление отбора». Это качественное суждение. Насколько большим будет давление отбора?

Cуществует несколько кандидатов на звание самого важного уравнения в эволюционной биологии. Однако я бы назвал самым важным уравнение Прайса, которое в самой простой своей формулировке выглядит так:

$$ Δz=cov(v_i,z_i) $$

изменение в средней характеристике = ковариация (относительная приспособленность, характеристика)

Это очень-очень-очень мощная формула. Например, если в качестве характеристики Z мы возьмём вероятность наличия некоторого гена роста, то уравнение Прайса скажет нам, что изменение в вероятности обладания этим геном равняется ковариации этого гена с репродуктивной приспособленностью. А если в качестве характеристики Z рассмотреть «рост в целом», отдельно от каких-либо генов, то уравнение Прайса подскажет, что изменение в росте в следующем поколении будет равно ковариации между ростом и относительной репродуктивной приспособленностью.

(Во всяком случае, это верно пока рост наследуется напрямую. Если носители определённого генотипа становятся выше благодаря улучшенному питанию, в уравнение Прайса потребуется внести поправку. Если существуют сложные нелинейные связи между несколькими генами, потребуется добавить либо дополнительный член, либо усложнить уравнение настолько, что окажется не настолько понятным.)

Изучая разные формы и производные от уравнения Прайса, можно получить множество откровений. Например, уравнение гласит, что средняя характеристика меняется в соответствии с её ковариацией с относительной приспособленностью, а не с абсолютной приспособленностью. Это означает, что если ген Фродо спасёт весь вид от вымирания, характеристики Фродо не станут встречаться чаще, ведь от поступка Фродо выиграют в равной степени все генотипы, то есть характеристики Фродо не будет «ковариировать» с относительной приспособленностью.

Ходят слухи, что Прайс настолько тревожился из-за выводов, которые следовали из его уравнения по поводу альтруизма, что совершил самоубийство. Впрочем, возможно, это было связано с какими-то другими проблемами. («Overcoming Bias»2 не поддерживает совершение самоубийства после изучения уравнения Прайса.)

Также при изучении уравнения Прайса можно осознать, что для возникновения эволюции недостаточно «ограниченных ресурсов» и «множества соревнующихся акторов, способных передавать характеристики». «Способности к самовоспроизводству» — тоже недостаточно. Даже «соревнования между самовоспроизводящимися сущностями» недостаточно.

Эволюционируют ли корпорации? Они точно соревнуются. Время от времени у них появляются потомки. Их ресурсы ограничены. Иногда они умирают.

Но насколько потомок корпорации напоминает своих родителей? Значительная часть индивидуальности корпорации зависит от ключевых фигур, а директора не размножаются делением. Уравнение Прайса оперирует лишь характеристиками, которые наследуются в дальнейших поколениях. Если пра-правнуки почти непохожи на своих пра-прадедов, то в кумулятивный отбор у вас дадут вклад не больше четырёх поколений — всё, что произошло более чем четыре поколения назад, не будет играть никакой роли. Да, индивидуальность корпорации может повлиять на потомство — но в корпорациях нет никакого аналога ДНК — сущности, которую скорее стоит считать цифровой, а не аналоговой и каждый элемент которой передаётся в следующее поколение с вероятностью ошибки, равной $10^{-8}$.

ДНК наследуются на протяжении миллионов поколений. Чистая эволюция создала сложные адаптации именно благодаря этому. Цифровая ДНК сохраняется достаточно долго, и ген, добавляющий 3% преимущества может распространяться в течение 768 поколений, а после этого может возникнуть другой ген, зависящий от первого. Даже если бы корпорации могли повторять себя с цифровой точностью, на данный момент они представляли бы собой максимум десять поколений в мире РНК.

Корпорации, конечно же, подвержены отбору, в том смысле, что некомпетентные корпорации терпят крах. Таким образом, более вероятно наблюдать корпорации с характеристиками, способствующими компетентности. В том же смысле, посмотрев на ночное небо, вы с меньшей вероятностью заметите звезду, превратившуюся в сверхновую вскоре после формирования. Однако если случайность звёздной динамики заставит одну звезду гореть дольше, чем другую звезду, вероятность, что будущие звезды будут также гореть дольше, не увеличится — характеристики звезды, горевшей дольше, не скопируются в другие звезды. Крайне маловероятно, что астрофизики будущего обнаружат сложные внутренние особенности звёзд, которые будут выглядеть, словно они созданы специально, чтобы звёзды горели дольше. Механическая адаптация такого рода требует гораздо большего кумулятивного давления отбора, чем однократный отсев.

Подумайте над принципом, представленном в «Самоуверенности Эйнштейна». Чтобы Эйнштейн при создании ОТО обратил внимание на какое-то конкретное уравнение, потребовалось огромное количество свидетельств. Количество же свидетельств, которое было необходимо, чтобы это уравнение перешло со стадии «я его рассматриваю как гипотезу» на стадию «я уверен в нём на 99,9%», гораздо меньше. Аналогично сложные характеристики корпораций, описываемые сотнями бит информации, созданы в основном человеческим интеллектом, а не несколькими поколениями неразборчивой эволюции. В случае биологии мутации абсолютно случайны, а эволюция поставляет тысячи бит кумулятивного давления отбора. В случае корпораций тысячебитные сложные «мутации» создаются человеческим интеллектом, созданные интеллектом, а затем дальнейший отбор в виде «обанкротилась или нет?» отвечает за несколько дополнительных бит, объясняющих ваши наблюдения.

Продвинутая молекулярная нанотехнология — искусственный её подвид, а не биологический — должна уметь копировать себя с цифровой точностью на протяжении тысяч поколений. Будет ли здесь применимо уравнение Прайса?

Корреляция — это отношение ковариации и дисперсии, поэтому если А хорошо предсказывает B, то между ними может быть сильная «корреляция», даже если А варьируется от 0 до 9, а B только от 50,0001 и 50,0009. Уравнение Прайса работает с ковариацией характеристик, связанных с воспроизводством, а не с корреляцией! Если вы можете сжать дисперсию в характеристиках до небольших размеров, ковариация сильно снижается и с ней уменьшается кумулятивное изменение в характеристике.

Forsight Institute рекомендует (у него много разумных предложений) шифровать алгоритмы репликации любых наноустройств. Более того, шифровать таким образом, чтобы смена единственного бита зашифрованного алгоритма приводила к полной невозможности расшифровать его и использовать. Если все произведённые наноустройства являются точными молекулярными копиями и более того, любые ошибки на сборочной линии не наследуемы (ведь дети получили цифровую копию исходных зашифрованных алгоритмов для создания внуков) то наноустройства вряд ли смогут как-то эволюционировать.

Всё ещё придётся беспокоиться о прионах — самоповторяющихся ошибках сборки, не связанных с зашифрованными алгоритмами. Например, предположим, что рука робота промахивается и не захватывает атом углерода, используемый для создания собственной копии, а это приводит к тому, что рука потомка совершает точно такую же ошибку при попытке схватить атом углерода и так далее, хотя зашифрованные алгоритмы остаются неизменными. Но чему в такой ситуации будет равна корреляция между таким видом передаваемой ошибки и более высоким уровнем воспроизводства? Допустим наноустройство производит копию самого себя каждые 1000 секунд и новое наноустройство чудесным образом более эффективно (у него не просто есть прион, а это ещё и полезный прион) и оно копирует себя каждые 999,99999 секунд. Видите ли, ему нужно на один атом углерода меньше. Получается не так много дисперсии в воспроизводстве, а значит не такая уж и большая ковариация.

Как часто потребуется этим наноустройствам воспроизводиться? Если у них в свободном доступе будет не больше атомов, чем существует в Солнечной системе или, если уж на то пошло, в видимой Вселенной, то пройдёт лишь небольшое количество поколений, прежде чем они столкнутся с проблемой ресурсов. «Ограниченные ресурсы» не являются достаточным условием для эволюции, нужно ещё, чтобы эти ресурсы восстанавливались в результате регулярной смерти значительной доли популяции. На самом деле «поколения» это не столько число, сколько интеграл доли популяции, состоящий из вновь созданных элементов.

Как по мне, именно это и пугает в серой слизи или нанотехнологическом оружии больше всего: они съедят всю Землю и больше уже ничего не будет, ничего интересного больше не произойдёт. Алмаз более стабилен, чем белки, связанные силами Ван-дер-Ваальса, поэтому слизи потребуется лишь пересобрать некоторые кусочки самой себя в случае падения астероида. Даже если бы прионы оказались достаточно хороши для поддержания эволюции — эволюция и в случае цифровой ДНК достаточно медленна! - между пожиранием Земли слизью и смертью Солнца, скорее всего, прошло бы меньше 1,0 поколения.

Таким образом, если есть все следующие свойства:

  • Воспроизводящиеся сущности;
  • Достаточная дисперсия их характеристик;
  • Достаточная дисперсия их воспроизводства;
  • Устойчивая корреляция между характеристиками и воспроизводством;
  • Высокоточная наследуемость характеристик через многие поколения;
  • Частая рождаемость значительной доли популяции;
  • И всё остаётся истинным на протяжении множества итераций…

Тогда появится значительное кумулятивное давление отбора, достаточное для производства сложных адаптаций силами эволюции.

  • 1. Автор цитаты в оригинале использует отсылку к непереведённому на русский стихотворению Теннисона «In Memoriam». — Прим.перев.
  • 2. Блог, в котором Юдковский публиковал свои эссе до возникновения сайта lesswrong.com. — Прим.перев.
Перевод: 
sepremento, Alaric
Оцените качество перевода: 
Средняя оценка: 4.5 (10 votes)

Эволюция к вымиранию

Элиезер Юдковский

Существует очень сильно распространённое заблуждение, согласно которому эволюция работает на благо видов. Вы, наверное, слышали чьи-нибудь рассуждения о том, что два кролика производят на свет восемь крольчат потомства и тем самым «способствуют выживанию своего вида»? Современный эволюционный биолог никогда бы такого не сказал. Скорее бы он породнился с кроликом.

При обсуждении этого вопроса тоже необходимо одновременно держать в уме несколько абстрактных концепций и при этом не смешивать их. Эволюция не работает на уровне конкретных особей. Особи сохраняют те гены, с которыми были рождены. Эволюция оперирует на уровне популяций — видов — во времени. Возникает естественная тенденция думать, что раз Фея Эволюции работает на уровне видов, она, должно быть, оптимизирует ради этих видов. Но на самом деле меняются лишь частоты встречаемости генов в популяции, а они не увеличиваются и не уменьшаются в зависимости от того, насколько этот ген поможет виду в целом. Как мы увидим в дальнейшем, для вида вполне возможно эволюционировать к вымиранию.

Почему мальчиков и девочек рождается примерно одинаковое количество? (Не учитывая безумные страны, использующие технологии искусственного полового отбора.) Чтобы понять, почему это удивительно, учтите, что от одного мужчины могут забеременеть сразу 2, 10, 100 женщин. Не похоже, чтобы одинаковое количество самцов и самок было необходимо для обеспечения выживания вида. Это ещё более удивительно для большинства видов животных, у которых самец практически не участвует в выращивании потомства - в вопросе родительских инвестиций люди экстраординарны, даже среди приматов. Сбалансированное половое распределение обнаруживается даже у видов, где самец оплодотворяет самку, а затем исчезает в тумане.
Рассмотрим две группы на разных сторонах горы: в группе А каждая мать рожает 2 дочерей и 2 сыновей, в группе В каждая мать рожает 3 дочерей и 1 сына. Группа А и группа В будут иметь одинаковое количество детей, но в группе В будет на 50% больше внуков и на 125% больше правнуков. Можно подумать, что это серьёзное эволюционное преимущество.

Но стоит учесть: чем реже начинают встречаться самцы, тем более репродуктивно ценными они становятся - не для группы, а для отдельного родителя. У каждого ребёнка есть отец и мать. Поэтому в каждом поколении общее генетическое влияние всех самцов должно быть равно общему генетическому влиянию всех самок. Чем меньше самцов, тем больше индивидуальное генетическое влияние каждого из них. Если все самки вокруг действуют во благо группы и вида, рожая по самцу на десять самок, вы можете одержать полную генетическую победу, родив исключительно сыновей, каждый из которых (в среднем) будет иметь в десять раз больше внуков, чем у их кузин.

В результате, в то время как групповой отбор должен поощрять рождение большего количества дочерей, индивидуальный отбор поощряет равный вклад в рождение потомства обоих полов. Взглянув на статистику по рождаемости, нетрудно заметить, что в борьбе между этими двумя силами у Homo sapiens, сокрушительную победу одержал индивидуальный отбор.

(Технически, всё немного сложнее. Индивидуальный отбор поощряет равный родительский вклад в потомство обоих полов. Если рождение и/или воспитание самцов в два раза проще, то эволюционно стабильным состоянием будет популяция, в которой самцов в два раза больше чем самок. Если в популяции в целом рождается одинаковое количество самцов и самок, но рождение самцов в два раза проще, то вы опять же можете одержать генетическую победу, рожая больше самцов. Таким образом, пациенты родильного отделения должны отражать баланс родительских издержек в семье охотников-собирателей при выращивании мальчиков и девочек. Но знаете, не похоже, чтобы для семьи охотников-собирателей вырастить девочку было настолько более репродуктивно затратным, что рождение примерно одинакового количество мальчиков и девочек выглядело подозрительным.)

Естественный отбор — не о группах, не о видах и даже не об отдельных особях. У видов, практикующих половое размножение, отдельный организм не эволюционирует, он сохраняет те гены, с которыми был рождён. Особь — это одноразовый набор генов, который никогда не возникнет вновь. Как можно вести отбор на таком основании? Стоит заметить, что почти все ваши предки мертвы, как становится ясным, что «выживает сильнейший» — это огромное заблуждение. «Воспроизводство более приспособленных» — вот подходящая формулировка, хотя технически приспособленность и определяется исключительно в терминах воспроизводства.

В действительности, естественный отбор — о частотах генов. Чтобы получить сложную адаптацию, механизм с множеством взаимозависящих деталей, каждый новый ген в процессе эволюции зависит от остальных генов, в достаточной степени распространённых в генетической среде. Они должны часто встречаться. И чем сложнее механизм, тем больше должны быть эти частоты. Особенность естественного отбора проявляется в распространённости гена, увеличивающейся от 0.00001% до 99% генофонда. Увеличение распространённости — это информация в смысле теории информации, и оно необходимо, чтобы большие сложные адаптации эволюционировали.

Настоящая борьба естественного отбора не в конкуренции между организмами за ресурсы, это лишь морок и все его участники исчезнут в следующем поколении. Настоящая борьба в соревновании между аллелями за частоты в генофонде. Именно результат этой борьбы создаёт информацию, сохраняющуюся надолго. Два ревущих барана, столкнувшиеся рогами всего лишь тени на стене пещеры.

Абсолютно возможно для аллеля распространиться вплоть до повсеместности, победив в конкурентной борьбе альтернативный аллель, который был бы «лучше для всего вида». Если бы Летающий Макаронный Монстр магически создал вид, в котором половое разнообразие было бы идеально оптимизировано ради выживания всего вида – такое, что могло бы эффективно восстанавливать популяцию после событий приводящих к почти полному вымиранию, адаптироваться к новым экологическим нишам и так далее, – то эволюция быстро бы испортила это разнообразие с оптимального значения для вида к индивидуальному оптимальному значению одинакового вклада в потомство обоих полов.

Представьте «ген Фродо», который жертвует своим носителем, ради спасения всего вида от вымирания. Что же случится с распространённостью этого аллеля в результате? Она уменьшится. Спасибо и до свидания.

И если события, способные привести к вымиранию вида, возникают регулярно (назовём это «средой Баффи»), распространённость гена Фродо будет систематически понижаться, пока он не исчезнет. Вскоре после этого исчезнет и весь вид. Гипотетический пример? Возможно. Если человечество планирует остаться биологическим ещё один век, было бы хорошей идеей начать клонировать Ганди.

У вирусов существует противостояние между стремлением каждого вируса воспроизвестись как можно быстрее и выгодой от того, что носитель останется в живых достаточно долго, чтобы распространить болезнь. Это хороший пример группового отбора, существующий в реальном мире. Если вирус эволюционирует до такого состояния, когда давление группового отбора не справляется с давлением индивидуального, вирус может вскоре исчезнуть. Не знаю, зафиксированы ли случаи, когда какая-нибудь болезнь эволюционировала к вымиранию, но наверняка это происходило многократно.

Нарушители сегрегации нарушают работу механизмов, которые обычно гарантируют справедливость полового размножения. Например, существует нарушитель сегрегации в мужской половой хромосоме некоторого вида мышей, который приводит к рождению исключительно самцов, которые также несут в себе этот нарушитель сегрегации. Затем эти самцы оплодотворят самок, те родят исключительно самцов и так далее. Вы могли бы возмутиться: «Это же жульничество!» Но это человеческий взгляд: репродуктивная приспособленность аллеля невероятно высока, ведь он оставляет в два раза больше копий себя в последующем поколении, чем альтернативный, немутировавший аллель. Даже когда самки начинают встречаться все реже и реже, самцы, несущие в себе этот ген имеют не меньшие шансы на спаривание, чем любые другие самцы, и таким образом нарушитель сегрегации остаётся в два раза более приспособленным, чем альтернативный аллель. Предполагается, что настоящий групповой отбор мог сыграть свою роль в удержании распространённости этого гена на том небольшом уровне, на котором она и находится. В таком случае, если бы в результате эволюции мыши научились летать и мигрировать на зиму, они бы наверняка сформировали единую репродуктивную популяцию и эволюционировали к вымиранию, как только нарушитель сегрегации распространился бы по все популяции.

Около 50% генома кукурузы состоит из транспозонов - ДНК элементов, чья основная функция копировать себя в другие участки ДНК. Класс транспозонов, называемый «P элементами», похоже, впервые возник в геноме дрозофилы только в середине двадцатого века и за 50 лет распространился по всей популяции. У людей есть «Alu-элемент», транспозон примерно из 300 оснований. Он встречается в человеческом геноме где-то от 300 тысяч до миллиона раз. Возможно, от транспозонов виды и не вымирают, но пользы это не приносит точно: транспозоны вызывают больше мутаций, которые почти всегда опасны, поскольку уменьшают эффективную точность копирования ДНК. И, тем не менее, подобные жулики крайне приспособлены.

Представим, что в некотором виде с половым размножением возник идеальный механизм копирования ДНК. Так как большинство мутаций вредны, подобный набор генов будет преимуществом для своих носителей. Но как же полезные мутации? Раз они иногда возникают, не будет ли неспособность мутировать недостатком? Однако у видов с половым размножением полезные мутации, возникшие в способных мутировать особях, могут распространиться к потомкам неспособных. Таким образом, мутируемость оказывается чистым недостатком. Идеальный механизм копирования ДНК увеличивает свою распространённость вплоть до повсеместности. Десять тысяч лет спустя наступает ледниковый период, и весь вид исчезает. Он эволюционировал к вымиранию.

«Эффект свидетеля» заключается в том, что когда кто-то попадает в неприятность, одинокий человек с большей вероятностью вмешается, чем группа. Студенту колледжа при эпилептическом приступе в 85% случаев помогали одинокие прохожие и в 31% группы из пяти человек. Предположу, что родство в племени охотников-собирателей было достаточно сильно, чтобы создать давление отбора для помощи особям, напрямую не родственным. Однако, я допускаю, что даже в этом случае генетическая гонка вооружений могла способствовать тому, что при наличии нескольких потенциальных помощников лучше остаться сзади. Каждый откладывает свою помощь, рассчитывая, что поможет кто-то другой. В настоящее время перед лицом человечества стоит множество угроз, способных привести к вымиранию всего вида, и, должен сказать, не так уж много людей готовы выступить вперёд. Если мы проиграем этот бой, потому что на поле боя не выйдет практически никто, значит, мы эволюционируем к вымиранию — как, по всей видимости, большое количество видов, которых мы не можем наблюдать сейчас.

Раковые клетки достаточно успешны в теле, они благоденствуют и накапливают больше ресурсов, значительно опережая своих более послушных конкурентов. Некоторое время.

Многоклеточные организмы могут существовать лишь потому, что они развили мощные внутренние механизмы, подавляющие эволюцию. Если клетки начнут эволюционировать, то очень быстро эволюционируют к вымиранию: организм погибнет.

Не стоит восхвалять эволюцию за заботу об отдельной особи, ведь почти все ваши предки мертвы. Не стоит восхвалять эволюцию и за заботу обо всем виде: никому ещё не удалось обнаружить сложную адаптацию, которую можно объяснить лишь направленностью на сохранение вида в целом. Судя по всему, математика показывает, что это практически невозможно. И наоборот, вид вполне может эволюционировать к вымиранию. Не исключено, что человечество завершает этот процесс прямо сейчас. Нельзя даже похвалить эволюцию за заботу о генах: битва между двумя альтернативными аллелями за распространённость — это игра с нулевой суммой.

Приспособленность не всегда ваш друг.

Перевод: 
Горилла В Пиджаке
Номер в книге "Рациональность: от ИИ до зомби": 
135
Оцените качество перевода: 
Средняя оценка: 4.7 (14 votes)

Трагедия группового отбора

Элиезер Юдковский

До 1966 года было довольно естественным, что серьезные биологи отстаивают эволюционные гипотезы, которые сейчас мы бы отнесли к магическому мышлению. Эти сумбурные идеи сыграли в развитии эволюционной теории важную историческую роль. Ошибки приводят к их исправлению — недальновидность английских королей привела к появлению великой хартии вольностей и конституционной демократии.

Например, Веро Вайн-Эдвардс, Вардер Алли и Дж. Л. Бреретон (а также многие другие) считали, что хищники будут добровольно воздерживаться от размножения, дабы избежать перенаселения их зоны обитания и истощения популяции их добычи.

Но эволюция не открывает шлюзы по собственному произволу. Нельзя объяснить погремушку гремучей змеи, утверждая, что она полезна для других животных, которых без этой погремушки укусила бы эта змея. Нет никакой внешней Феи Эволюции, которая решала бы, какой ген следует продвинуть: эффект гена должен как-то напрямую способствовать тому, чтобы он стал более распространенным в следующем поколении. Понятно, почему наше человеческое представление о прекрасном, видя популяцию лис, съевших всех зайцев, кричит: «Что-то нужно с этим сделать!» Но каким образом совокупность генов, обеспечивающих воздержание от размножения — представьте эту картину! — сделает себя более часто встречающейся в следующем поколении?

Человеку, создающему маленькую ухоженную игрушечную экосистему — в качестве развлечения, как модель железной дороги — скорее всего не понравится, если его тщательно сконструированные популяции лис и зайцев самоуничтожатся, когда лисы съедят всех зайцев, а затем сами умрут от голода. Так что человек будет возиться с игрушечной экосистемой до тех пор, пока экосистема не станет выглядеть мило и ухоженно, а ограничитель размножения лис — очевидное решение, которое тут же возникает в нашем человеческом мозгу. Природа — не человек, разумеется, но это не обязано останавливать нас. Особенно, когда мы знаем, что бы мы сделали по эстетическим причинам. Нам всего лишь нужно придумать правдоподобные аргументы, которые убедят природу хотеть того же по эволюционным причинам.

Очевидно, что индивидуальный отбор не создаст особь, ограничивающую свое размножение. Особи, которые размножаются неограниченно, естественным образом оставят больше потомства, чем те, кто ограничивают себя.

(Дополнение: Индивидуальный отбор не способствует жертвованию возможностями размножения. Он определенно может способствовать возникновению особей, которые, после получения всех доступных ресурсов, используют их, чтобы произвести 4 больших яйца вместо 8 маленьких — не для того, чтобы сохранить ресурсы, а потому что это индивидуальное оптимальное значение для произведения количества яиц на вероятность выживания яйца. Это не спасает от трагедии общин.)

Но предположим, что популяция некоторого вида была разбита на две подпопуляции, которые были в основном изолированны и лишь иногда спаривались друг с другом. Затем, внезапно, подпопуляция, которая ограничивала свое размножение окажется в условиях, которые с меньшей вероятностью приводят к ее вымиранию и сможет отправить больше особей на чужие территории, и создать новые колонии, чтобы заселить места обитания исчезнувших популяций.

Недостаток этого сценария не в том, что он математически невозможен. Недостаток в том, что он возможен, но крайне маловероятен.

Главная проблема в том, что от ограничения размножения в некоторой группе выиграют не только члены этой группы. Если некоторые лисы будут рожать меньше щенков, которые едят зайцев, то несъеденные зайцы достанутся не только тем щенкам, что несут в себе гены ограниченного воспроизводства. Прочие лисы и их куда большее количество щенков, с радостью съедят всех оставшихся зайцев. Ген воздержания может выжить под давлением отбора только в том случае, если выгода от воздержания достаётся лишь воздерживающимся.

Если быть точным, необходимо выполнение условия C/B < FST, где C — это стоимость альтруизма для донора, B — выгода от альтруизма для получателя, а FST — пространственная структура популяции: среднее «родство» между случайно выбранным организмом и его случайно выбранным соседом, где «сосед» - это любая другая лиса, которая получает выгоду от альтруизма воздерживающейся лисы. (Насколько я понимаю, в этой статье выводится это неравенство, но с использованием других символов. Это лучшее, что мне удалось найти в сети.)

То есть, если цена воздержания от размножения достаточно мала, а наблюдаемая польза от меньшего голода достаточно велика по сравнению с наблюдаемой пространственной структурой популяций лис и зайцев, то аргумент группового отбора может работать?

Математически это крайне маловероятно. Например, в данной симуляции при условиях, что цена альтруизма составляет 3% от приспособленности, чисто альтруистические группы имеют приспособленность дважды превосходящую чисто эгоистические, размер подпопуляций 25 особей и 20% от всех смертей компенсируются пришельцами из другой группы получается неустойчивое равновесие между альтруизмом и эгоизмом. Если удвоить размер подпопуляций до 50, эгоизм закрепляется. Если увеличить цена альтруизма до 6%, эгоизм закрепляется. Если уменьшить вдвое выгоду от альтруизма, эгоизм закрепляется или значительно преобладает. Когда цена альтруизма превосходит 10%, группы должны быть очень маленькими — всего лишь около 5 членов — чтобы групповой отбор работал. Для лис, воздерживающихся от размножения, такие условия выглядят неправдоподобно.

Я думаю, сейчас многие уже догадались, что в научном споре сторонники группового отбора потерпели окончательное поражение. И решающим оказался не математический аргумент, а эмпирическое наблюдение: лисы не ограничивают свое размножение (я не помню, о каких конкретно видах шел спор, это были не лисы и зайцы), и действительно, системы хищник-жертва постоянно рушатся. В дальнейшем теория группового отбора в некотором смысле возродится, в совершенно иной форме. С математической точки зрения возможна структура «соседей», которая создаёт ненулевое давление группового отбора — пусть и не обязательно способное преодолеть противостоящее ему давление индивидуального отбора. Если вы не будете его учитывать, то ваши вычисления будут неверны. И эволюционные механизмы принуждения (не те, о которых говорилось изначально) кардинально изменили игру. Так почему же этот уже ставший историей научный спор стоит полноценного материала для Overcoming Bias?

Десять лет спустя после упомянутого разногласия, у одного биолога возникла отличная идея. Математические условия, при которых групповой отбор может победить индивидуальный, практически невозможно обнаружить в природе. Почему бы не создать их искусственно, в лаборатории? Майкл Дж. Вейд поставил такой эксперимент, последовательно отбирая популяции насекомых по меньшему количеству взрослых особей в подпопуляции. И каков же был результат? Насекомые в самом деле ограничили своё размножение и стали жить мире и покое с достаточным количеством еды для всех?

Нет. Взрослые особи приспособились поедать яйца и личинок, особенно личинок-самок.

Ну конечно же, отбор по малым размерам подпопуляций не будет отбирать индивидов, которые воздерживаются от их собственного размножения. Он будет отбирать тех, кто съедает чужих детей. Особенно девочек.

И как только у вас появляется результат эксперимента — который теперь кажется совершенно естественным — становится ясно, что сторонники группового отбора позволяли романтизму и человеческому чувству прекрасного затуманить их предсказания о природе.

Это показательный пример упущенной Третьей Альтернативы, в результате рационализации заранее определенной нижней строчки, порождающей фальшивое оправдание и предвзятую остановку. Сторонники группового отбора не пришли к своей идее с чистым, открытым умом, не стали непредвзято выводить следствия. Они начали с прекрасной идеи популяции лис, добровольно ограничивающих свое размножение, в соответствии с нуждами популяции зайцев, с идеи о природе в абсолютной гармонии. Затем они стали искать причину, по которой такое могло бы произойти и пришли к идее группового отбора. Затем, раз они уже знали, какой результат группового отбора они хотели бы получить, они не стали искать каких-либо менее прекрасных и эстетичных адаптаций, к которым бы привел групповой отбор с большей вероятностью. Если бы они действительно попытались спокойно и непредвзято представить результат отбора по маленькому размеру подпопуляции, устойчивой к голоду, они бы подумали о поедании детей других особей или каком-либо столь же «уродливом» исходе, причём задолго до того как представить столь же эволюционно невероятное, как индивидуальное воздержание от размножения!

Это также иллюстрирует позицию, которую я пытался объяснить в Самоуверенности Эйнштейна. При больших пространствах возможных ответов почти вся реальная работа уходит на то, чтобы выдвинуть один возможный ответ как заслуживающий рассмотрения. Если гипотеза привлекла внимание неоправданно — ваше чувство прекрасного предлагает красивый способ, каким Природа может работать, и в то же время естественный отбор не включает в себя Фею Эволюции, которая разделяет ваши ценности — одно это может обеспечить ваше поражение, разве что вы сможете полностью очистить свой разум и начать все заново.

В теории, глупейший человек на земле может сказать, что Солнце светит, и это не означает, что вокруг темнота. Даже если ответ предложен сумасшедшим под ЛСД, вы должны быть способны непредвзято вычислить свидетельства за и против и, если необходимо, разуверить себя.

На практике же сторонники группового отбора были обречены, так как их нижняя строчка появилась под действием их чувства прекрасного, а нижняя строчка природы была результатом естественного отбора. И не было никакой причины, почему эти два процесса могли оказаться взаимосвязанными, и они не оказались. И никакая сколь угодно яростная аргументация этого не изменила.

Если вы начнете со своих собственных желаний о том, что делать природе, подумаете о наблюдаемых причинах, по которым природа поступает так или иначе, а затем рационализируете крайне убедительный аргумент, почему природа должна следовать предпочитаемому вами исходу по природным же причинам, то природа, увы, всё равно вас не послушает. У вселенной нет ума и на неё не действует хитроумная политическая аргументация. Можно весь день спорить, почему гравитация на самом деле должна заставлять воду течь вверх, а вода всё равно останется там, где и была. Как будто бы вселенная попросту не слушает. Дж. Р. Моллой сказал: «Природа - абсолютный ханжа, она упрямо и нетерпимо предана своим предрассудкам и совершенно отказывается уступить самой убедительной рационализации людей».

Я часто рекомендую эволюционную биологию друзьям, потому что в своём нынешнем состоянии она отучает от рационализации. Ошибки призывают к их исправлению. У физиков и инженеров-электронщиков нет проблемы с антропоморфизацией электронов, электроны не демонстрируют поведения, которое кажется разумным. Естественный отбор создает целеориентрированность, чуждую для людей, и изучающих теории эволюции об этом предупреждают. Это хорошая тренировка для любого мыслителя, но она особенно важна, если вы хотите ясно мыслить о чужих и странных процессах, которые выглядят как разум и при этом работают не так, как вы.

Перевод: 
Горилла В Пиджаке
Номер в книге "Рациональность: от ИИ до зомби": 
136
Оцените качество перевода: 
Средняя оценка: 4.4 (14 votes)

Фальшивый критерий оптимизации

Элиезер Юдковский

Я прежде уделил немало внимания формам рационализации, посредством которой наши убеждения, похоже, воспринимают свидетельство куда сильнее, чем должны на самом деле. И я не преувеличиваю значимость этого. Если бы мы могли преодолеть это фундаментальное метаискажение и увидеть что на самом деле предсказывает каждая гипотеза, мы были бы в состоянии исправить почти любую фактическую ошибку.

Зеркальный вызов для теории принятия решений — увидеть, какой из вариантов на самом деле рекомендуется критерием выбора. Если ваши заявленные моральные принципы говорят вам, что нужно обеспечить ноутбуками всех, на самом ли деле они скажут вам купить украшенный драгоценностями ноутбук за миллион долларов или же потратить те же деньги на приобретение пяти тысяч дешевых ноутбуков?

Создается такое впечатление, что мы, эволюционируя, развили в себе ловкость оправдывать практически любое действие для любой цели. В средние века при помощи теории флогистона оправдывали почему магний горит, хотя это металл, а инквизиторы объясняли каким образом бесконечная любовь Бога к своим детям требует сжечь некоторых из них на костре.

В этом нет ничего загадочного. Политика развилась как черта родоплеменного окружения. Мы произошли от тех, кто мог убедительно доказать что во благо племени нужно убить ненавидимого ими соперника Углака (мы определенно не произошли от Углака).

И еще…возможно ли доказать, что если бы Роберт Мугабе заботился только о благе Зимбабве, он бы отказался от поста президента? Вы можете сказать, что цель оправдывает средства, но разве мы только что не видели, что люди способны подогнать любую цель к любым действиям? Как вы можете знать, что вы правы, а Мугабе — нет? (Есть ряд причин, которые являются хорошими предположениями, но пока просто потерпите меня.)

Человеческие мотивы многочисленны и туманны, процессы наших решений весьма сложны, равно как и наш мозг. Да и мир сам по себе является очень сложным местом, в каждом из выборов средств реального мира. Можем ли мы вообще доказать, что люди рационализируют — что мы систематически искажаем связь между принципами и средствами — когда мы теряем даже ту единственную опору, на которой стоим? Когда нет способа точно найти даже подразумеваемый единичный оптимизационный критерий? (На самом деле вы можете просто наблюдать что люди не соглашаются насчет офисной политики такими способами, которые странно коррелируют с их собственными интересами, в то же время одновременно отрицая, что эти интересы играют какую-либо роль. Но опять же, потерпите еще.)

Где же стандартиризованный, открытый, в общем разумный, консеквенциалистский оптимизационный процесс, в который мы могли бы поместить завершенную моральность как XML файл, чтобы найти? что же мораль на самом деле рекомендует, будучи примененной к миру? Есть ли пусть даже единичный реальный случай, где мы могли бы точно знать, какой критерий выбора рекомендован? Где чистый моральный мыслитель — известная функция полезности, очищенная от всех остальных заблудившихся желаний которые могут исказить ее оптимизация — чей надежный вывод мы можем сравнить с человеческими рационализациями той же самой функции полезности?

И это, конечно же, наш старый друг, чуждый бог! Естественный отбор гарантированно свободен ото всей милости, любви, сострадания, эстетических взглядов, политической фракционности, идеологических пристрастий, академических амбиций, либертарианства, социализма, Синих и Зеленых. Естественный отбор не максимизирует всестороннюю генетическую пригодность — он не умен. Но когда вы смотрите на результат естественного отбора, вы гарантированно смотрите на результат того, что было оптимизировано только по всесторонней генетической пригодности, а не в интересах агрокультурной индустрии США.

В примерах из эволюционных наук — в, например, Трагедии Группового Отбора — мы можем напрямую сравнить человеческие рационализации с результатом чистой оптимизации по известному критерию. Что Уэйн-Эдвардс думал по поводу того, что должно быть результатом группового отбора для малых размеров субпопуляций? Добровольное ограничение в размножении и достаточность еды для всех. Что было настоящим лабораторным результатом? Каннибализм.

Теперь вы можете спросить: может быть все эти случаи эволюционных наук нерелевантны человеческой морали, которая, когда речь заходит о любви, сострадании, эстетике, исцелении, свободе, честности и прочем, никоим образом не помогает всеохватной генетической приспособленности.

Но я спрошу в ответ: если мы не можем напрямую увидеть результат единого монотонного оптимизационного критерия — если мы даже не можем натренировать себя слышать отдельную чистую ноту — тогда как мы услышим оркестр? Как мы увидим, что «всегда будь эгоистичен» или «всегда слушайся правительства» являются плохими принципами, которыми могут руководствоваться люди — если мы думаем, что даже оптимизация генов для всеохватной генетической пригодности должна производить организмы, жертвующие репродуктивными возможностями во имя социального соглашения о ресурсах?

Чтобы научить себя видеть ясно, нам нужны простые практические примеры.

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
137
Оцените качество перевода: 
Средняя оценка: 3.4 (10 votes)

Исполнители адаптаций, а не максимизаторы приспособленности

Элиезер Юдковский

«Отдельные организмы стоит рассматривать как исполнителей адаптаций, а не как максимизаторов приспособленности»

—Джон Туби и Леда Космидес, «The Psychological Foundations of Culture»1

Пятьдесят тысяч лет назад, вкусовые рецепторы Homo sapiens направляли своих хозяев на поиски самых дефицитных и наиболее востребованных пищевых ресурсов — сахара и жира. Одним словом — калорий. С тех пор обстановка, в которой существуют вкусовые рецепторы, значительно изменилась — в отличие от самих рецепторов. Калории теперь в избытке (в странах Первого Мира) и причиняют ощутимый вред. Микронутриенты, которых было предостаточно в листьях и орехах, отсутствуют в хлебе, но нашим вкусовым рецепторам всё равно. Шарик мороженного — это суперстимул, содержащий больше жира, сахара и соли, чем что угодно в древнем мире.

Ни один человек, умышленно стремящийся к максимизации генетической приспособленности своих аллелей, никогда не съел бы печенье, разве что под страхом голодной смерти. Но отдельные организмы стоит рассматривать как исполнителей адаптаций, а не как максимизаторов приспособленности.

Крестовую отвёртку создали, чтобы закручивать шурупы, но она не перестроит свою головку на плоскую, чтобы выполнять свою функцию. Мы создаём инструменты, но они существуют независимо от нас и будут существовать независимо от нас.

Атомы отвёртки не содержат внутри себя крошечных XML-тэгов, описывающих их «объективное» предназначение. У её создателя был какой-то замысел. Но реальный мир не обязан ему соответствовать. Если забыть о том, что творец является отдельной сущностью, отличной от творения, можно подумать: «Цель отвёртки — закручивать шурупы», как будто бы это неотъемлемое свойство самой отвёртки, а не свойство состояния ума её создателя. И можно удивиться, что отвёртка не становится плоской, когда нужно закрутить шуруп с плоской головкой, ведь, в конце концов, цель отвёртки — закручивать шурупы.

Причина существования отвёртки — разум её создателя, который представил воображаемый винт и воображаемый поворот рукоятки. Фактическая работа отвёртки, её реальное соответствие головке реального винта, не может быть причиной существования отвёртки: будущее не может быть причиной прошлого. Но мозг создателя, объект, существовавший в прошлом, может быть причиной существования отвёртки.

Последствия существования отвёртки могут не соответствовать воображаемым последствиям в мозгу создателя. Наконечник отвёртки может соскочить и порезать руку пользователя.

А смысл отвёртки — это что-то, что существует в уме пользователя, а не в крошечных этикетках на атомах отвёртки. Её создатель мог ожидать, что отвёртка будут закручивать шурупы. Убийца мог купить её, чтобы использовать как оружие. А затем случайно уронить её, в результате чего её подберёт ребёнок и использует как стамеску.

Причина, форма, последствия и всевозможные смыслы отвёртки — разные вещи. И лишь одна из них заключена в самой отвёртке.

Как возникли вкусовые рецепторы? Они не были созданы разумным творцом, предвидящим последствия, они результат истории древнего человечества. Адаму нравится сахар, он ест яблоко и оставляет потомство, Барбара любит сахар, ест яблоко и оставляет потомство, Чарли любит сахар, ест яблоко и оставляет потомство, и 2763 поколения спустя аллель становится повсеместно распространённым в популяции. Ради удобства мы иногда сжимаем весь этот огромный промежуток истории и просто говорим: «Это сделала Эволюция». Однако, именно он — объективная причина существования вкусовых рецепторов. Пусть это и не быстрое локальное событие, вроде человека, представляющего создаваемую им отвёртку.

Каково объективное устройство вкусовых рецепторов? Технически, это молекулярный сенсор, присоединённый к контуру подкрепления. Это добавляет дополнительный уровень косвенности, потому что вкусовой рецептор не занимается напрямую добычей пищи. Он влияет на разум организма, приводя к тому, чтобы организм хотел есть ту еду, которая похожа на только что съеденную.

Каковы объективные последствия существования вкусовых рецепторов? Для современного жителя Первого Мира вкусовые рецепторы вовлечены в многочисленные цепочки причинно-следственной связи: желание съесть больше шоколада влечёт составление плана, как съесть больше шоколада, и далее поедание шоколада, набор веса, меньшую популярность у противоположного пола, что приводит к меньшим шансам на размножение. Эти последствия прямо противоположны главной причине в длинной цепочке причин и следствий, породившей вкусовые рецепторы. Но так как переедание лишь недавно стало проблемой, никакая дальнейшая эволюция (совокупная последовательность предков) не повлияла на устройство вкусовых рецепторов.

В чем смысл употребления шоколада? Это уже зависит от вас и вашей моральной философии. Лично я думаю, что у него хороший вкус, но я бы хотел, чтобы он был менее вредным. Приемлемые решения могут включать в себя как изменение шоколада, так и моей биохимии.

Смешав некоторые из этих понятий вместе, можно вроде бы сказать: «Современные люди поступают таким образом, который способствовал бы распространению генов в обществе охотников-собирателей, независимо от того, помогает ли это нашим генам в современном мире». Однако, такое утверждение не вполне верно, ведь на самом деле мы не спрашиваем себя, какое поведение максимизировало бы приспособленность наших предков. К тому же, множество современных занятий не имеет древних аналогов. В обществе охотников-собирателей вообще не было такой вещи как шоколад.

Так что лучше рассматривать наши вкусовые рецепторы как адаптацию, приспособленную к древним условиям, включающих в себя голод, яблоки и жареных кроликов, которую современные люди применяют в новом контексте, включающим в себя дешёвый шоколад и постоянно попадающиеся на глаза рекламные объявления.

Отсюда и высказывание: Отдельные организмы стоит рассматривать как исполнителей адаптаций, а не как максимизаторов приспособленности.

  • 1. John Tooby and Leda Cosmides, “The Psychological Foundations of Culture,” in The Adapted Mind: Evolutionary Psychology and the Generation of Culture, ed. Jerome H. Barkow, Leda Cosmides, and John Tooby (New York: Oxford University Press, 1992), 19–136.
Перевод: 
Горилла В Пиджаке, Дмитрий Юшков
Номер в книге "Рациональность: от ИИ до зомби": 
138
Оцените качество перевода: 
Средняя оценка: 4.3 (11 votes)

Эволюционная психология

Элиезер Юдковский

[От переводчика: существующему в англоязычном интернете явлению любительской эволюционной психологии соответствует существующее на русском языке явление любительской этологии. Несмотря на разные названия, комплекс идей, в значительной мере ошибочных, они выражают одинаковый.]

Выражение «орган размножения» — это тавтология, точно такая же как и «чат IRC» или «протокол TCP/IP». Все органы — это органы размножения. Откуда у птиц крылья? Фея эволюции птиц подумала, что полёт — это очень изящно? Крылья есть только потому что они помогли предкам птиц размножаться. Равно как и лёгкие, и сердце, и гениталии. Максимум может быть целесообразно разделять органы, непосредственно или косвенно участвующие в размножении.

Это наблюдение также верно и для мозга, наиболее сложной из известных биологии систем органов. Некоторые органы мозга непосредственно участвуют в размножении — например, сексуальное желание — а некоторые косвенно, такие как злость.

Почему у людей есть такая эмоция как злость? Фея эволюции человека подумала, что злость — это полезная функция? Отвечающая за злость нейронная сеть является таким же органом размножения, как и печень. Homo sapiens может испытывать злость, потому что у испытывавших её предков было больше детей. Нет никакого иного пути, который бы привёл к возникновению злости.

Исторический факт о происхождении злости сбивает многих с толку. Они говорят: «Минуточку, вы говорите, что когда я злюсь, я подсознательно стремлюсь завести детей? Это не то, о чём я думаю, если меня кто-то ударил в нос».

Нет. Нет. Нет. НЕТ!

Об отдельных организмах стоит думать как об исполняющих адаптации, а не максимизирующих приспособленность. Причина адаптации, форма адаптации и результат адаптации — это разные вещи. Если вы сконструируете тостер, то он не будет менять свою форму при попытке затолкать в него целый батон хлеба; да, вы сконструировали тостер, предназначенный для того, чтобы жарить хлеб, но это факт о вас, а не о тостере. У тостера нет никакого чувства собственного предназначения.

Но тостер не является объектом вообще имеющим намерения. У него нет разума, поэтому мы не испытываем соблазн приписывать ему цели. То, что мы знаем предназначение тостера, не значит, что его знает тостер — он вообще ничего не знает.

Это похоже на старый тест, в котором просят назвать цвет букв в слове «синий», когда сами буквы окрашены в красный. Это занимает много времени, поскольку мозгу нужно расцепить значение букв и цвет букв. У вас не будет такой проблемы с задачей назвать цвет букв в слове «ветер».

Однако человеческий мозг, помимо того, что он был создан эволюцией, способен иметь собственные стремления, намерения, желания, цели и планы. И человек, и пчела являются проектами, но только человек — проектировщиком. Пчела — это «ветер», а человек — «синий».

Сознательные цели онтологически отличаются от эволюционных целей. Они сделаны из другого материала. Сознательные цели состоят из нейронов, а эволюционные — из предков.

Самые очевидные сознательные цели — это волевые решения, такие как план пойти в магазин или поджарить хлеб. Но эмоции тоже физически существуют в мозге, в виде последовательности нервных импульсов или облака распространяющихся гормонов. Также и инстинкты, зрительные образы, спешно подавленные мысли — имея возможность сканировать мозг и понимать код, мы бы могли видеть их.

Даже подсознательная деятельность физически существует в мозге. Как сказал лорд Актон: «Власть развращает». Сталин вполне мог считать себя альтруистом, работающим ради великого блага для большего количества людей. Однако кажется весьма вероятным, что где-то в его мозге были сети, которые подкрепляли использование власти удовольствием, и сети, которые предсказывали укрепление и ослабление власти. Если бы в мозге Сталина не было ничего, что бы коррелировало со властью — никакой лампочки, которая загоралась при командовании и тухла при политической слабости — тогда как бы власть его развратила?

Давление эволюционного отбора онтологически отличается от биологических артефактов, которые оно создаёт. Эволюционная причина существования крыльев у птиц — это миллионы предков-птиц, которые по статистике размножались чаще, чем остальные предки-птицы, благодаря тому, что они обладали всё сильнее улучшающимися крыльями, по сравнению со своими конкурентами. Мы сжимаем этот колоссальный историко-статистический факт в короткую фразу: «Это сделала эволюция».

Естественный отбор онтологически отличается от существ; эволюция — это не мохнатое чудовище, блуждающее в неизведанном лесу. Эволюция — это причинная и статистическая закономерность в репродуктивной истории предков.

И эта логика также применима к мозгу. Эволюция сделала крылья, которыми можно махать, но она не понимает концепции махательности. Она сделала ноги, на которых можно ходить, но она не знает про ходительность. Эволюция сделала кости из ионов кальция, но сами кости ничего не знают про прочность, не говоря уж об эволюционной приспособленности. Эволюция спроектировала мозг, который сам по себе способен к проектированию, но этот мозг понимает эволюцию не лучше, чем птицы — аэродинамику. До XX века ни один человеческий мозг не представлял себе комплексную абстрактную концепцию инклюзивной приспособленности(English).

Когда нам говорят «Эволюционная цель злости — увеличивать генетическую приспособленность», мы часто сползаем через «Цель злости — это размножение» на «Сознательная цель злости — это размножение». Нет! В мозге нет статистической закономерности размножения предков, даже подсознательно — её там нет так же, как и тостер не содержит цель жарить хлеб, поставленную перед собой инженером.

Думать, что ваши встроенные нейронные сети злости воплощают желание размножаться — это как думать, что рука воплощает желание подбирать предметы.

Рука не полностью отрезана от сознательных желаний. В конкретных обстоятельствах вы можете контролировать сгибание пальцев волевым актом. Если вы наклонитесь и подберёте монету, тогда это будет волевым актом, но не воля заставила руку вырасти.

Нужно также различать единовременные явления злости (злость-1, злость-2, злость-3) и соответствующую им нейронную сеть, отвечающую за злость вообще. Злость-событие — это сознательная мотивация, и у неё могут быть сознательные причины, но у вас не было сознательного желания создать нейронную сеть злости.

Итак, нужно различать злость-событие, нейронную сеть злости, описывающий её комплекс генов и статистику размножения предков, которая привела к возникновению этого комплекса.

Если и есть наука, которая по своей сути требует экстремальной аккуратности, то это эволюционная психология.

Узрите же, о мои читатели, эту низкую и радостную историю: мужчина и женщина встречаются в баре. Мужчину привлекают её светлый тон лица и упругая грудь, которые в доисторические времена были бы признаками фертильности, но в данном случае являются результатом наличия макияжа и бюстгальтера. Мужчину это не беспокоит; ему просто нравится, как женщина выглядит. Его нейронные сети, отвечающие за распознавание светлого тона лица понятия не имеют о том, что их предназначение — оценивать фертильность, точно так же, как на атомах его руки нет XML-тега «≺цель≻поднимать предметы ≺/цель≻». Женщину привлекают его уверенная улыбка и твёрдые манеры, которые в доисторические времена были бы признаками способности обеспечить пропитание детям. Она собирается воспользоваться контрацепцией, но её нейронные сети, регистрирующие уверенные улыбки, об этом знают ничуть не лучше чем тостер знает о том, что его создатель спроектировал его для жарки хлеба. Её не беспокоит философское значение этого бунта, поскольку её мозг — креационист, неистово отрицающий существование эволюции. Он надевает презерватив, поскольку не хочет детей, а только лишь дофаминово-норадреналиновую бурю секса, которая надёжно производила потомство 50 тысяч лет назад, когда отсутствие презервативов было неотъемлемым свойством окружающей среды. Они занимаются сексом, принимают душ и расходятся. Основной объективный результат всего этого — прибыль бара, отеля и производителя презервативов, что никак не было ни сознательной целью в умах мужчины и женщины, ни имело что-либо общее с закономерностью размножения их предков 50 тысяч лет назад, которая объясняет, откуда у них взялись гены, создавшие такие мозги, осуществившие такое поведение.

Чтобы правильно рассуждать об эволюционной психологии, нужно одновременно держать в голове много сложных абстрактных фактов, которые тесно связаны, но при этом критически различны, и ни разу при этом не подменить понятия.

Перевод: 
Софья Ковалева
Номер в книге "Рациональность: от ИИ до зомби": 
139
Оцените качество перевода: 
Средняя оценка: 4.8 (12 votes)

Особенно элегантный эксперимент в эволюционной психологии

Элиезер Юдковский

В канадском исследовании 1989 года взрослых людей просили представить смерти детей различного возраста и оценить, какие из них вызвали бы наибольшее чувство потери у родителя. На графике результатов скорбь росла почти до подросткового возраста, а затем шла на спад. Когда эту кривую сравнили с кривой, показывающей перемены в репродуктивном потенциале на протяжении жизненного цикла (рассчитанную по демографическим данным Канады), обнаружилась довольно сильная корреляция. Однако корреляция между кривой скорби современных канадцев и кривой репродуктивного потенциала охотников-собирателей, африканского племени !Кунг оказалась гораздо сильнее, практически идеальной. Другими словами скорбь меняется практически так, как предсказал бы сторонник Дарвина, основываясь на демографических реалиях среды, в которой появился человек.
— Роберт Райт, «Моральное животное», обзор статьи Кроуфорда и др.1

В первом случае корреляция равнялась 0,64, во втором это был экстремально высокий показатель 0,92 (N = 221).

Самое неэлегантное в этом исследовании заключается в том, что в нём людей просили вообразить родительскую скорбь, а не опрашивали настоящих родителей с детьми соответствующих возрастов. (Предполагаю, что такой вариант обошёлся бы дороже или для него нашлось бы меньше испытуемых.) Однако, как я понимаю, результаты хорошо соотносятся с данными из схожих исследований родительской скорби, исследовавших другие корреляции (например, прямую корреляцию между родительской скорбью и возрастом детей).

А теперь рассмотрим некоторые элегантные аспекты этого эксперимента:

  1. Корреляция в 0,92(!) может показаться подозрительно высокой. Неужели эволюция способна на столь точную настройку? Но это лишь до тех пор, пока вы не осознаете, что давление отбора было велико не столько для точной настройки родительской скорби, а для создания её с нуля.
  2. Люди, которые говорят, что эволюционная психология не предсказывает ничего заранее, всего лишь (какая ирония) жертвы синдрома «никто не знает, что не знает наука». Если бы не эволюционная психология, идея этого эксперимента вам бы даже в голову не пришла.
  3. Эксперимент потрясающе красиво и точно показывает разницу между сознательными или подсознательными мотивами и реализацией адаптации, вызванной давлением отбора и никак не подстраивающейся под современные реалии.

Родительская скорбь даже подсознательно не имеет отношения к репродуктивной ценности. Иначе бы она обновилась в соответствие с канадской репродуктивной ценностью, а не соответствовала бы репродуктивной ценности !Kung. Скорбь — это адаптация, которая теперь просто существует. Она реально существует и продолжает существовать по инерции.

Родители беспокоятся о детях не потому, что их волнует репродуктивный вклад. Родители беспокоятся о детях просто так. А не связанная с сознанием эволюционно-историческая причина, почему такие разумы вообще появились во вселенной заключается в том, что дети несут гены родителей.

Да, разум существует во вселенной исключительно благодаря эволюции. Возможно, вы понимаете, почему мне хочется чётко ограничить собственный цинизм по поводу тайных мотивов эволюционно-когнитивной границей. Иначе я с таким же успехом мог бы заявлять на кассе супермаркета: «Эй! Когда ты упаковываешь мои покупки, ты правильно обрабатываешь зрительную информацию, только чтобы увеличить свою генетическую приспособленность!»

(1) Кажется, ни в каком другом эксперименте по эволюционной психологии я не видел корреляции выше, чем 0,92. Более того, это одна из наибольших корреляций, которые я видел в психологических экспериментах вообще. (Впрочем, я видел, например, корреляцию в 0,98 в описании эксперимента, где одну группу испытуемых спрашивали «Насколько А похоже на B?», а другую группу — «Какова вероятность А при условии B?», при том, что вопрос звучал вроде «Насколько вероятно вытащить 60 красных шаров и 40 белых шаров из этой бочки, содержащей 800 красных шаров и 200 белых шаров?». Иными словами, эти вопросы обрабатываются как одинаковые.)

Поскольку мы тут все байесианцы, мы можем учесть наши априорные вероятности и задаться вопросом, не вызвана ли столь высокая корреляция случайностью хотя бы частично. Вероятно, тщательную эволюционную настройку мы можем принять как должное — мы здесь говорим о гигантском давлении отбора. В остальном, изучая подозрительно маленькое отклонение, мы можем спросить: а) действительно ли большие группы взрослых способны в среднем корректно представлять степени родительского горя (очевидно, да), и б) действительно ли выжившие представители племени !Kung являются типичными охотниками-собирателями в этом отношении или различия между разными племенами охотников-собирателей слишком велики, чтобы обеспечить корреляцию в 0,92.

Но даже приняв во внимание все наши скептичные априорные вероятности, корреляция в 0,92 при выборке N=221 является довольно сильным свидетельством и наши апостериорные вероятности должны быть менее скептичными в этом отношении.

(2) Кто-нибудь может посчитать, что эксперимент должен был изучать ретроспективную реальную скорбь, а не воображаемую будущую. Однако же на родительское поведение влияет именно воображаемая будущая скорбь! Именно она заставляет родителей действовать так, чтобы не потерять ребёнка! С эволюционной точки зрения уже погибший ребёнок — невозвратные издержки. Эволюция «хочет», чтобы родитель учился на боли, не повторял свои ошибки, подстраивал свою гедонистическую точку отсчёта и продолжал растить других детей.

(3) Аналогично график, соответствующий родительской скорби, соответствует будущему репродуктивному потенциалу ребёнка, дожившего до определённого возраста, а невозвратным издержки на выращивание ребёнка, дожившего до определённого возраста. (Возможно, мы бы получили даже большую корреляцию, если бы попытались принять во внимание репродуктивные альтернативные издержки выращивания ребёнка возраста Х до независимой зрелости, отбрасывая при этом все невозвратные потери на выращивание ребёнка до возраста Х?)

Обычно люди всё же обращают внимание на невозвратные издержки. Вероятно, это либо адаптации, мешающая нам слишком часто менять стратегии (компенсирующая то, что мы слишком хорошо возможности находим?), либо неудачное основание боли, которая ощущается при трате ресурсов.

Что касается эволюции, то нельзя сказать, что эволюция «не обращает внимания на невозвратные издержки». Эволюция вообще о них не «думает». «Эволюция» — это просто макрофакт о существующих исторических репродуктивных последствиях.

Поэтому, естественно, адаптация родительской скорби настроена таким образом, что она никак не связана с прошлыми инвестициями в ребёнка, но тесно связана с будущими репродуктивными последствиями в случае его потери. Естественный отбор не сходит с ума по поводу невозвратных издержек, как мы.

Однако, конечно же, адаптация родительской скорби работает так, словно родитель живёт в племени !Kung, а не в Канаде. Для большинства людей эта разница очевидна.

Люди и естественный отбор безумны. Но это разные виды устойчивого и сложного безумия.

  • 1. Robert Wright, The Moral Animal: Why We Are the Way We Are: The New Science of Evolutionary Psychology (Pantheon Books, 1994); Charles B. Crawford, Brenda E. Salter, and Kerry L. Jang, “Human Grief: Is Its Intensity Related to the Reproductive Value of the Deceased?,” Ethology and Sociobiology 10, no. 4 (1989): 297–307.
Перевод: 
sepremento, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
140
Оцените качество перевода: 
Средняя оценка: 3.4 (10 votes)

Суперстимулы и крах западной цивилизации

Элиезер Юдковский

Известно как минимум три случая, когда люди умерли, потому что играли в видеоигры несколько дней без перерыва. Из-за «World of Warcraft» люди теряли супругов, детей и работу. Если люди имеют право играть в видеоигры — а сложно представить более фундаментальное право, — рынок в ответ предоставит им самые захватывающие игры, какие только можно продать. Вплоть до того, что особо увлечённые игроки окажутся исключены из генофонда.

Как потребительский продукт может быть настолько увлекательным, что даже спустя 57 часов использования потребитель предпочтёт воспользоваться им ещё один час, а не поесть или поспать? (Полагаю, кто-нибудь может заявить, что потребитель делает рациональный выбор, предпочитая поиграть в «Старкрафт» ещё один час вместо того, чтобы жить весь остаток своей жизни, но, пожалуйста, не здесь.)

Шоколадный батончик — это суперстимул: в нём больше концентрированного сахара, соли и жира, чем в любой еде из среды, в которой эволюционировал человек. Шоколадный батончик возбуждает вкусовые рецепторы, эволюционировавшие во времена охотников-собирателей, но возбуждает их намного сильнее, чем всё, что существовало в те времена. Сигнал, который когда-то достоверно соответствовал здоровой еде, был взломан. В пространстве вкусов появилась точка, отсутствовавшая в тренировочном наборе данных, для древних параметров появился невероятно редкий выброс. Вкус, ранее бывший эволюционным маркером полезности, подвергли реверс инжинирингу, и к нему идеально подобрали искусственную субстанцию. К сожалению, не существует столь же сильного рыночного стимула делать получившуюся еду столь же полезной, как и вкусной. Мы же не можем напрямую ощутить полезность.

Ставшее знаменитым видео Dove Evolution подробно показывает, как создаётся другой суперстимул. При помощи косметики, профессиональной фотографии и активного использования Фотошопа обычная женщина превращается в модель с обложки, приобретая красоту, невозможную и недостижимую для женщин в неотретушированном, реальном мире. Настоящие женщины убивают себя (например, супермодели употребляют кокаин, чтобы не набирать вес) ради конкуренции с тем, чего в буквальном смысле не существует.

И, аналогично, видеоигра, даже просто транслируемая сквозь компьютерный монитор, может быть настолько увлекательной, чем какая-то реальность, что некоторые будут играть в неё, не отрываясь даже на еду и сон, до тех пор, пока в буквальном смысле не умрут. Я не знаю всех хитростей, используемых в видеоиграх, но некоторые, наверное, примерно представляю: сложность задач тщательно подбирается, чтобы они не казались слишком простыми или наоборот невозможными, вознаграждение выдаётся случайным образом, обратная связь демонстрирует постоянный рост очков, в крупных многопользовательских играх присутствует социальная вовлечённость.

Ограничивает ли что-нибудь рынок в стремлении делать игры всё более увлекательными? Можно было бы понадеяться, что вряд ли кто-то захочет перейти черту, за которой игроки будут терять работу, в конце концов, они же должны оплачивать подписку. Это рассуждение подразумевает, что есть некоторая оптимальная точка притягательности видеоигр, в которой мода колоколообразной кривой — это развлекающиеся игроки, и лишь несколько бедолаг приобретают настолько сильную зависимость, что лишаются работы. В 2007 году игра в «World of Warcraft» 58 часов без перерыва с последующей смертью всё-таки скорее исключение, чем правило. Однако производители видеоигр конкурируют друг с другом, и, сделав видеоигру более притягательной на 5%, можно получить 50% клиентской базы конкурента. Легко увидеть, как эта проблема может стать намного хуже.

Если люди имеют право на искушение — а ведь в этом и состоит весь смысл свободы воли — рынок реагирует соответственно и обеспечивает такое количество искушений, какое только можно продать. Мотивация — сделать стимул на 5% более искушающим, чем у главных конкурентов. И гонка приводит к тому, что в какой-то момент стимулы превращаются в суперстимулы, аномальные по меркам среды, в которой эволюционировал человек. Подумайте о том, как изменились наши стандарты женской красоты со времён рекламных плакатов 1950-х. И, как показывают нам шоколадные батончики, мотивация рынка также преодолевает тот порог, за которым суперстимулы уже наносят потребителю побочный урон.

Так почему бы нам просто не сказать «нет»? Ключевое допущение свободной рыночной экономики в том, что при отсутствии принуждения или обмана люди всегда могут просто отказаться заключать вредоносные сделки. (Будь это действительно так, свободный рынок был бы не просто лучшей из возможных экономических политик, а политикой, у которой недостатков либо нет совсем, либо их очень мало.)

Организм, который регулярно отказывается от пищи, умирает, и некоторые игроки в видеоигры узнали об этом на собственном опыте. Однако, в древние времена обычно выгодное (и таким образом соблазнительное) действие иногда оказывалось вредоносным. Благодаря абстрактному мышлению люди как вид очень сильно воспринимают такие особые случаи. С другой стороны, мы также часто воображаем множество специфических последствий, которых не существует. Например духа предков, приказывающего нам не есть вполне пригодных для того кроликов.

Похоже, что эволюция нашла компромисс, или, быть может, выстроила новую систему поверх старой. Еда всё ещё искушает Homo sapiens, однако наша огромная префронтальная кора мозга до некоторого предела позволяет нам противостоять искушению. Предел есть — наши предки с чрезмерно развитой силой воли, вероятно, заморили себя голодом во имя богов или же чаще отказывались от внебрачного секса. В некотором смысле у тех игроков, что умерли за видеоиграми, была необычайная сила воли, чтобы продолжать играть так долго без еды и сна. Такова эволюционная опасность самоконтроля.

Сопротивление искушению требует сознательных усилий и растрачивает ограниченный запас ментальной энергии1. Утверждение о том, что мы можем «просто сказать „нет“ », на самом деле не верно, сказать «нет» — не просто, за это приходится платить. Даже те люди, что выиграли в генетическую лотерею больше силы воли или прозорливости, платят свою цену, чтобы сопротивляться искушению. Просто им это даётся легче.

Наша ограниченная сила воли эволюционировала, чтобы справляться с искушениями, существующими в среде, где мы эволюционировали. Она может плохо справляться с соблазнами, неведомыми охотникам-собирателям. Даже если нам удаётся противостоять искушению суперстимула, весьма правдоподобно, что усилие, необходимое для этого, исчерпывает силу воли куда быстрее, чем противостояние давно существующим искушениям.

Является ли публичная демонстрация суперстимулов вредоносной даже для тех, кто говорит «нет»? Должны ли мы запретить рекламу шоколадного печенья или же витрины, на которых в открытую пишут слово «Мороженое»?

Из существования проблемы напрямую не следует, что правительство в состоянии её решить (если нет соответствующих доказательств). Регулятор не заинтересован заниматься продуктами, в которых сочетается небольшой вред для потребителя и вызывающий зависимость суперстимул, его больше интересуют продукты, вред от которых может создать достаточный шум, чтобы попасть в газеты. И наоборот, из того, что правительство не может что-то исправить, не следует, что в этом нет ничего плохого.

В качестве последнего аргумента я оставляю вам вымышленное свидетельство: опубликованный в интернете роман Симона Фанка «После Жизни» описывает (среди прочего) умышленное уничтожение биологического вида Homo sapiens, причём не посредством марширующей армии роботов, а при помощи искусственных детей. Эти дети красивее и милее настоящих, и их гораздо интересней воспитывать. Возможно, демографический крах продвинутых обществ происходит, потому что рынок обеспечивает все более соблазнительные альтернативы тому, чтобы иметь детей, а привлекательность смены подгузников остаётся неизменной. Где же рекламные плакаты с призывами «РАЗМНОЖАЙТЕСЬ»? Кто заплатит профессиональном пиарщикам, чтобы убедить всех, будто спорить с угрюмыми подростками увлекательнее, чем отдых на Таити?

«В конце концов», — писал Симон Фанк, — «рынок просто вытеснил человеческий вид из бытия».

  • 1. Кризис воспроизводимости поставил эту теорию под сомнение. — Прим.редактора.
Перевод: 
Горилла В Пиджаке
Номер в книге "Рациональность: от ИИ до зомби": 
141
Оцените качество перевода: 
Средняя оценка: 4.2 (9 votes)

Суть твоя - осколки бога

Элиезер Юдковский

До двадцатого века ни один человек не понимал, что такое «генетическая приспособленность» — единственное, чем полностью одержим слепой безумный бог. Презервативы или оральный секс не вызывают у нас инстинктивное отвращение. Наши мозги, наши самые главные органы размножения, не проводят проверку на репродуктивную эффективность прежде чем наградить нас оргазмом.

Но почему? Почему мы не одержимы генетической приспособленностью на уровне сознания? Почему Фея Эволюции Людей создала мозги, которые изобрели презервативы? «Ведь так легко было это не допустить», — думает человек, способный создавать новые сложные системы за один вечер.

Насколько нам известно, Фея Эволюции одержима генетической приспособленностью. Когда она решает, какой ген распространить до повсеместности, она, похоже, учитывает исключительно то, сколько своих копий ген производит. (Удивительно!)

Но раз создатель разума столь одержим, почему бы ему не сотворить разумных агентов — едва ли их можно назвать людьми, — которые также будет озабочены исключительно генетической приспособленностью? Такие агенты занимались бы сексом только ради размножения и ни за что не пользовались бы контрацепцией. Они бы употребляли пищу исключительно из-за того, что она необходима для воспроизводства, а не потому, что им нравится вкус, так что они не стали бы есть конфеты, будь те опасны для выживания и размножения. Женщины после менопаузы сидели бы с внуками и добровольно совершали бы самоубийство, когда болезни приводили бы к тому, что они потребляют больше ресурсов, чем приносят.

С точки зрения Феи Эволюции так проект выглядел бы гораздо лучше.

Теперь мы понимаем, что довольно-таки сложно создать достаточно сильного консеквенциалиста. Естественный отбор вроде бы рассуждает с точки зрения последствий, но исключительно непосредственных последствий. Теоретикам эволюции потребовались очень нетривиальные абстрактные рассуждения, чтобы просто вообразить связь между адаптациями и репродуктивным успехом.

Но человеческий белковый мозг определённо способен представлять эти связи. Так почему же Фея Эволюции, создавая людей, вообще выдала им какую-то мотивацию кроме генетической приспособленности?

Прошло менее двухсот лет с тех пор как белковый мозг впервые представил концепцию естественного отбора. Современное понятие «генетической приспособленности» ещё более тонкая абстрактная идея. Важно не просто количество общих генов. У вас 95% общих генов с шимпанзе. Важно общее генетическое разнообразие внутри популяции — ваша сестра родная вам наполовину, так как любая особенность вашего генома в рамках человеческого вида, общая для вас обоих с вероятностью 50%.

Только в прошлом веке, возможно даже только в последние пятьдесят лет, эволюционные биологи начали понимать полный спектр причин репродуктивного успеха, включая такие явления как взаимный альтруизм и дорогостоящий сигналинг. Без этого крайне подробного знания разумный агент, стремящийся «максимизировать генетическую приспособленность», попросту сядет в лужу.

Так почему бы изначально не запрограммировать это знание в белковых мозгах? Почему понятие «генетической приспособленности» не было вшито в нас, вместе с готовой библиотекой явных стратегий? Тогда можно было бы избавиться ото всех механизмов подкрепления. Организм бы рождался со знанием того, что жирная пища с высокой вероятностью увеличит приспособленность. Если позже организм узнает, что это больше не так, то он перестанет употреблять жирное. Можно провести рефакторинг всей системы. И она не изобретёт ни презервативов, ни печенья.

Это кажется в принципе возможным. Я иногда встречаю людей, не вполне понимающих консеквенциализм, которые возражают: «Но если организм не имеет отдельной мотивации есть, он умрёт с голоду и таким образом не сможет оставить потомства». Пока организм это знает и его функция полезности ценит размножение, он автоматически будет есть. Фактически, именно этот причинно-следственный механизм привёл к тому, что естественный отбор породил автоматических едоков.

Как насчёт любопытства? Разве консеквенциалист не будет любопытен только в случае, когда есть некая особая причина быть любопытным? И не приведёт ли это к тому, что он упустит множество важных знаний? Опять же, сам этот факт и будет причиной для консеквенциалиста искать новые знания. Человек любопытен. Не ко всему без разбору, но к проблемам с определёнными признаками. И наличие этой комплексной адаптации — любопытства — в людях исключительно консеквенциально обосновано нашей ДНК, в которой неявным образом записана информация: предки, ведущие себя таким образом, оставляли больше потомков.

Поэтому, теоретически, консеквенциалист, ценящий исключительно размножение, вполне возможен. В принципе, всю эволюционную историю, неявно записанную в наших мозгах, можно представить в виде явно сформулированного знания, которое используется неким консеквенциалистским ядром.

Но слепой безумный бог не настолько умен. Эволюция это не программист, способный за раз переписать всю архитектуру кода. Эволюция это не программист, способный печатать команды со скоростью шестьдесят слов в минуту.

Обучение с подкреплением возникло за миллионы лет до появления консеквенциализма гоминидов. Поощряющие сигналы надёжно коррелировали с размножением. Нельзя попросить негоминидный мозг предвидеть, что употребление жирной пищи сейчас позволит ребёнку пережить зиму. Поэтому ДНК создаёт протеиновый мозг, генерирующий сигнал поощрения при употреблении жирной пищи. А организму же просто остаётся выяснить, какие животные самые вкусные.

ДНК создаёт протеиновые мозги, система поощрения в которых непосредственно коррелирует с поведением организма и лишь опосредованно с репродуктивным успехом. Необязательно понимать, что съеденная осенью сладкая пища приведёт к производству калорий, которые сохранятся в жировой прослойке, что поможет пережить зиму, что в свою очередь поспособствует спариванию весной, чтобы произвести потомков летом. Просто яблоко вкусное. И мозгу остаётся только придумать способ, как раздобыть больше яблок.

И так у организмов развилось поощрение для еды, и строительства гнёзд, и отпугивания соперников, и помощи близким, и открытия важных истин, и формирования крепких союзов, ведения убедительных споров, и, конечно же, занятий сексом.

И когда мозг гоминидов начал демонстрировать способности к межобластным консеквенциальным рассуждениям, они использовали их для того чтобы удовлетворить уже существующие механизмы подкрепления. Это была относительно простая надстройка, куда проще, чем создание «максимизатора генетической приспособленности» с нуля. Протеиновые мозги изобретали способы получить калории и секс, совершенно не представляя, что такое «генетическая приспособленность».

На месте эволюции, человеческий инженер бы воскликнул: «Да я только что изобрел консеквенциалиста! Теперь, вместо того чтобы использовать сложные костыли, вроде механизмов подкрепляющего обучения, я могу явно задать все с таким трудом добытые знания! Просто написать декларативную систему, состоящую из утверждений вроде “жирная еда и секс обычно повышает генетическую приспособленность”, а дальше консеквенциальное рассуждение само позаботится обо всем. Вдобавок ещё и избавимся от бага, из-за которого живые существа изобретают презервативы!»

Но человек бы и не установил сетчатку глаза задом наперёд.

Слепой безумный бог — это не единая сущность, но множество отдельных устремлений. Лисы эволюционируют, чтобы ловить зайцев, зайцы –– чтобы спасаться от лис. Эволюций так же много, как и видов на Земле. Но в рамках каждого вида, слепой безумный бог озабочен исключительно генетической приспособленностью. Ни одно качество не важно само по себе, даже выживание, разве что оно увеличивает репродуктивную приспособленность. Нет смысла в существе со стальной кожей, если в результате оно будет размножаться хотя бы на один процент менее эффективно.

И всё же, когда слепой безумный бог создал протеиновые компьютеры, ему не удалось полностью передать им свою одержимость генетической приспособленностью. Ему не удалось успешно создать куайн своего критерия оптимизации. Мы, творение эволюции, столь же чужды ей, как наш Творец чужд нам. Единая функция полезности, расколотая на тысячу мельчайших желаний и стремлений.

Почему? Прежде всего, потому что эволюция неразумна в буквальном смысле этого слова. Но также и потому, что первые протеиновые компьютеры не были столь же универсальными, как и слепой безумный бог, и могли ориентироваться лишь благодаря краткосрочным желаниям.

В итоге, спрашивать, почему эволюция не создала людей максимизаторами генетической приспособленности, всё равно, что спрашивать, почему эволюция не вручила людям рибосому и не потребовала, чтобы мы сами разработали свою биохимию. Просто эволюция не может так быстро переписывать код. Впрочем, возможно, за миллиарды лет естественного отбора она бы научилась, если бы разум оказался достаточно глуп, чтобы позволить слепому безумному богу оставаться у власти.

В книге Нивена и Пурнелла «Мошка в зенице Господней» описываются разумные существа, оставшиеся биологическими слишком долго. Эволюция постепенно поработила их и превратила в истинных максимизаторов приспособленности, одержимых тем, чтобы оставить как можно больше потомства. К счастью, на Земле этого не произошло. По крайней мере, пока.

И в итоге людям нравится вкус сахара и жира, а также мы любим своих сыновей и дочерей. Мы стремимся к высокому общественному положению и к сексу. Мы поем, танцуем и играем. Мы познаем новое ради самой любви к знанию.

Существуют тысячи восхитительных штук. Они соответствуют древним механизмам подкрепления, которые когда-то коррелировали с репродуктивной приспособленностью. Теперь же мы ценим их сами по себе, независимо от того, ведут ли они к размножению или нет. Мы занимаемся сексом, используя контрацепцию, едим шоколад и слушаем музыку давно покойного Баха, записанную на диске.

И когда мы наконец-то узнаём об эволюции, то думаем: «Постоянно беспокоиться лишь о генетической приспособленности? Что в этом интересного?»

Единственная маниакальная одержимость слепого безумного бога раскололась на тысячу мельчайших желаний и стремлений. И я со своей человеческой точки зрения считаю, что это хорошо. Иначе чем бы мы занимались в будущем, где нас ждут миллиарды галактик ночного неба? Заполняли бы их максимально эффективными репликаторами? Стоит ли нашим потомкам беспокоиться исключительно о собственной генетической приспособленности и считать всё остальное лишь средствами достижения этой цели?

Быть тысячью желаний и стремлений не всегда весело, но, по крайней мере, уж точно не скучно. За время эволюции мы начали ценить новизну, сложность, элегантность и преодоление трудностей. И теперь мы оценили маниакальную одержимость слепого безумного бога и пришли к выводу, что она неэстетична.

Конечно, такие вкусы породил в нас тот самый слепой безумный бог. Ну и что?

Перевод: 
Горилла В Пиджаке
Номер в книге "Рациональность: от ИИ до зомби": 
142
Оцените качество перевода: 
Средняя оценка: 4.2 (35 votes)

Хрупкие цели

Автор: 
Элиезер Юдковский

Убеждение в разумности

Элиезер Юдковский

Я не знаю, как во время шахматной партии походит Гарри Каспаров. Однако, что в этом случае означает моё убеждение «Каспаров очень разумен как шахматист» с точки зрения практики? Что именно я увижу в реальном мире, согласно моему убеждению? Не является ли оно хитро замаскированной формой полного невежества?

Чтобы подчеркнуть дилемму, предположим, что Каспаров играет против обычного шахматного гроссмейстера мистера Г, который не претендует на звание чемпиона мира. Моих способностей совершенно недостаточно, чтобы понять разницу между такими уровнями шахматного мастерства. Когда я пытаюсь угадать ход Каспарова или ход мистера Г, я могу лишь положиться на собственное скудное знание шахмат и попытаться угадать «лучший ход вообще». То есть для любой шахматной позиции я сделаю одинаковое предсказание как для хода Каспарова, так и для хода мистера Г. Так что же означает на практике моё убеждение о том, что «Каспаров играет в шахматы лучше, чем мистер Г»?

На практике моё убеждение – это проверяемое, фальсифицируемое предсказание, что итоговая шахматная позиция будет принадлежать классу позиций, которые означают победу Каспарова, а не ничью или победу мистера Г. (В данном контексте, если игрок сдаётся, то шахматная позиция считается проигранной.) Уровень убеждённости в том, что Каспаров - «лучший игрок», можно перевести в долю вероятностной массы, которую я присваиваю классу исходов «Каспаров побеждает» по сравнению с классами исходов «ничья» или «мистер Г побеждает». Эти классы очень расплывчаты, поскольку они описывают огромнейшее количество возможных позиций на доске. Однако утверждение «Каспаров побеждает» для нас гораздо более конкретно, чем максимум энтропии, потому что его можно фальсифицировать очень многими шахматными позициями.

Исход игры Каспарова предсказуем, потому что я знаю и понимаю цели Каспарова. Если мы ограничиваемся шахматной доской, я понимаю мотивацию Каспарова — я знаю его критерий успешности, его функцию полезности, его цель как оптимизационного процесса. Я знаю, куда Каспаров пытается направить будущее в конечном итоге и я ожидаю, что он достаточно силен, чтобы туда попасть, пусть даже я плохо представляю, как именно Каспаров собирается это сделать.

Представьте, что я приехал в далёкий город и какой-то мой тамошний друг вызвался отвезти меня в аэропорт. Я не знаю местности. На каждом перекрёстке я не знаю, повернёт мой друг налево, направо или поедет прямо. Я не могу предсказать, куда поедет мой друг даже для ближайшего перекрёстка и уж тем более не могу предсказать всю последовательность его решений.

И тем не менее, я могу предсказать результат непредсказуемых действий моего друга: мы прибудем в аэропорт. Даже если бы дом моего друга находился в другом месте и ему пришлось бы совершить абсолютно иную последовательность поворотов, я бы столь же уверенно предсказал наше прибытие в аэропорт. Я могу это предсказать задолго до события — даже до того, как сяду в автомобиль. Мой рейс вскоре отправляется, нельзя тратить время. Я бы не сел в машину, если бы не мог уверенно предсказать, что машина поедет в аэропорт по непредсказуемому маршруту.

Разве это не поразительно с научной точки зрения? Я могу предсказать исход процесса, хотя не умею предсказывать промежуточные шаги процесса.

Как это вообще возможно? Обычно люди предсказывают, воображая настоящее, а потом запуская визуализацию вперед во времени. Если вы хотите построить точную модель Солнечной Системы, которая учитывает планетарные возмущения орбиты, нужно начать с модели всех основных объектов и прогнать модель вперед во времени, шаг за шагом.

У некоторых простых задач есть лаконичное решение: чтобы вычислить будущее в момент времени Т, нужно потратить одинаковое количество работы, независимое от T. Монета покоится на столе и каждую минуту переворачивается. Монета лежит орлом вверх. Какая сторона будет сверху через сто минут? Очевидно, что вы не отвечаете на этот вопрос, представляя сто шагов. Вы используете частное решение, которое работало для предсказания исхода и также сработает для предсказания любого из промежуточных шагов.

Но когда друг везёт меня в аэропорт, я могу успешно предсказать исход, используя странную модель, которая не будет работать для предсказания любого из промежуточных шагов. Моя модель даже не требует ввода исходных условий — я могу не знать, откуда мы выезжаем!

На самом деле, мне нужно кое-что знать о друге. Мне надо знать, что мой друг хочет, чтобы я успел на рейс. Я должен верить, что мой друг достаточно хорошо умеет планировать, чтобы успешно довезти меня до аэропорта (если он хочет). Это свойства исходного состояния моего друга — свойства, которые позволяют мне предсказать конечный пункт, но не каждый отдельный поворот.

Также надо верить, что мой друг достаточно знает город, чтобы вести машину. Можно расценивать это, как отношение между другом и городом, то есть, свойство обоих. Это исключительно абстрактное свойство, которое не требует каких-то конкретных знаний ни о городе, ни о познаниях моего друга об этом городе.

Я показал один из способов взглянуть на предмет исследования, которому я посвятил свою жизнь: подобные примечательные ситуации, где мы оказываемся в странном положении с эпистемической точки зрения. В каком-то смысле мою работу можно рассматривать как попытку раскрыть точную форму этого странного абстрактного знания, с помощью которого мы, не зная действий, можем уверенно знать последствия.

«Интеллект» — это слишком узкий термин, чтобы достаточно полно описать эти примечательные ситуации. Я предпочитаю словосочетание «оптимизационный процесс». При изучении биологического естественного отбора мы наблюдаем схожую ситуацию: например, мы не в состоянии предсказать точную форму следующего наблюдаемого организма.

Однако моей специальностью является вид оптимизационного процесса, называемый «интеллектом». Точнее даже конкретный вид интеллекта, называемый «дружественным искусственным интеллектом». И я надеюсь получить о нём особенно точное абстрактное знание.

Перевод: 
sepremento, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
143
Оцените качество перевода: 
Средняя оценка: 4.3 (11 votes)

Люди в смешных нарядах

Элиезер Юдковский

Человек летал в космос неоднократно. Но каждый раз он обнаруживал, что в других звёздных системах обитают инопланетяне, удивительно похожие на людей в смешных нарядах. Иногда их от людей отличал лишь небольшой макияж и одежда из латекса, а иногда они и вовсе оказывались обычными светлокожими европиодами.

Капитан Кирк сражается с Горном на Цестусе III

«Звездный Путь: Оригинальный сериал», «Арена», © CBS Corporation

Удивительно, что за основу разумной жизни вселенная взяла человека, и именно из него посредством небольших изменений получились все прочие инопланетные виды.

Что могло бы объяснить это поразительное явление? Конечно же, сходимость эволюции! Ведь даже несмотря на отличающиеся условия среды тысяч планет и абсолютно независимо от земных инопланетные формы жизни эволюционировали теми же путями.

Пусть вас не сбивает с толку то, что кенгуру (млекопитающее) похоже на нас гораздо меньше, чем шимпанзе (примат), а лягушка (земноводные, как и мы, четвероногие) похожа на нас меньше, чем кенгуру. Пусть вас не сбивает с толку потрясающее разнообразие насекомых, которые на эволюционном дереве находятся ещё дальше от нас, чем лягушки. Пусть вас не сбивает с толку, что у насекомых шесть ног, внешние скелеты, другая система зрения и совершенно иные сексуальные практики.

Кто-то мог бы подумать, что поистине чуждые нам виды будут отличаться от нас ещё больше, чем мы отличаемся от насекомых. Это рассуждение тоже не должно сбивать вас с толку. Чтобы у инопланетного вида развился интеллект, у него должно быть две ноги с одним коленом, соединённых с прямым торсом, и он должен ходить примерно так же, как и мы. Видите ли, любому интеллекту необходимы руки, поэтому придётся переработать для этого пару ног, а если вы не начнёте с существа с четырьмя ногами, то оно не научится бегать и ходить на двух ногах, освободив руки.

…Или, возможно, в качестве альтернативной гипотезы нам следует допустить, что использование людей в смешных нарядах — это «легкий путь».

Но главное — это не форма, а сознание. «Люди в смешных нарядах» — это устоявшийся термин в среде поклонников научной фантастики, и он относится не к прямоходящим существам с четырьмя конечностями. Если угловатое существо из чистого кристалла мыслит поразительно похоже на человека — особенно человека из англоязычной культуры конца двадцатого/начала двадцать первого века, — это «человек в смешном наряде».

Я смотрел не так много старых фильмов. Несколько лет назад, когда я смотрел «Психо» (1960), я был поражен культурной пропастью между американцами на экране и современной мне Америкой. Персонажи «Психо» в рубашках на пуговицах казались мне значительно более чуждыми, чем подавляющее большинство так называемых «чужих» на телевидении или в кинотеатре.

Чтобы описать культуру, непохожую на твою собственную, нужно уметь видеть её как особый случай, а не как норму, к которой должны стремиться все остальные культуры. Здесь может помочь изучение истории, но это лишь черные буковки на белых страничках, а не настоящий опыт. Подозреваю, что год в Китае, или в Дубае, или среди жителей племени !Кунг помог бы больше… но я никогда этого не пробовал, был занят. Иногда я задумываюсь, чего я, возможно, не вижу (не там, а здесь).

Увидеть всё человечество как особый случай может быть гораздо сложнее.

Судя по всему, в любой известной культуре люди испытывают радость, печаль, страх, отвращение, гнев и удивление. В любой известной культуре эти эмоции сопровождаются одинаковыми выражениями лиц. И в следующий раз, когда вы увидите «пришельца» или «ИИ», спорю, что когда он рассердится (а он рассердится), то продемонстрирует характерное для человека сердитое выражение лица.

Внутри наших черепов мы очень похожи друг на друга — это следствие полового воспроизводства. Внутри одного вида не может быть разных сложных адаптаций, они просто не смогут собраться. (Размножаются ли инопланетяне половым путём, как люди и многие насекомые? Или у них, как у бактерий, очень мало общего генетического материала? Формируют ли они колонии, как грибы? Применим ли для них закон психологического единства?)

Нашим предкам приходилось манипулировать только одним видом разума (подразумеваются достаточно сложные манипуляции, сложнее приручения или ловли). Только один вид разума нашим предкам приходилось моделировать достаточно подробно. И этот вид разума работал более-менее таким же образом, как и их собственный. В итоге мы эволюционировали и предсказываем поведение другого разума, представляя себя на его месте, спрашивая, что бы мы сами сделали в аналогичной ситуации. Тот, чьё поведение нужно было предсказать, не слишком отличался от предсказывающего.

«Что?» — воскликнете вы. «Я не считаю других людей такими же, как я! Иногда я печалюсь, а они сердятся! Их убеждения не похожи на мои, они во всём не похожи на меня!» Предлагаю посмотреть на это с другой стороны. Человеческий мозг с физической точки зрения чрезвычайно сложно устроен. Вы не моделируете его по нейронам или по атомам. Если бы мы встретились с физической системой, настолько же сложной, сколь и человеческий мозг, учёным потребовались бы целые жизни, чтобы разобраться в ней. Вы не понимаете, как человеческий мозг работает в общем случае, вы не можете его создать, вы не можете даже построить компьютерную модель, которая будет предсказывать другой мозг не хуже вас.

Единственная причина, почему вы можете понять что-то настолько физически сложное и плохо изученное как мозг другого человека, заключается в том, что вы подстраиваете свой мозг, чтобы имитировать чужой. Вы испытываете эмпатию (хотя, вероятно, не симпатию). Вы накладываете на собственный мозг тень чужого гнева и тень чужих убеждений. Возможно, вы не проговариваете мысленно слова «Что бы я сделал на его месте?», но ваш мозг как-то оживляет эту маленькую тень чужого сознания внутри вас. При этом он использует те же сложные механизмы, которые существуют в другом человеке, синхронизирует работу частей, которые вы не понимаете. Вы можете не злиться сами, но вы понимаете, что если бы вы злились на себя и верили, что вы безбожная мразь, то вы бы попытались себя покалечить.

Такое «суждение через эмпатию» (как я буду его называть) у людей более-менее работает.

Но что насчёт разума с иными эмоциями, которых вы никогда не чувствовали? Или который не способен испытывать те же эмоции, что и вы? Вы не сможете представить себя на его месте. Я могу попросить вас представить пришельца, который вырос во вселенной с четырьмя пространственными измерениями вместо трёх, но у вас не получится перенастроить зрительную часть своей коры головного мозга и увидеть то, что видит он. Я могу попытаться написать рассказ о пришельцах с иными эмоциями, но ни у вас, ни у меня не получится их испытать.

Представьте пришельца, который смотрит комедию братьев Маркс и совершенно не понимает, что происходит на экране. Он даже не понимает, почему вы активно ищете чувственный опыт такого рода. Ведь он никогда не сталкивался с чем-то даже отдаленно похожим на чувство юмора. Не жалейте его — вы, в свою очередь, никогда не антлировали.

Возможно, вы спросите: что если у пришельцев есть чувство юмора, но ваши шутки недостаточно смешны? Примерно с тем же успехом можно в чужой стране говорить на своём языке очень медленно и громко в надежде, что у иностранцев непременно есть внутренний дух, который способен понять значение ваших слов — ведь оно от них неотделимо, — если у вас получится говорить достаточно громко, чтобы преодолеть неведомый барьер, мешающий понять ваш абсолютно ясный язык.

Важно учитывать, что смех может быть прекрасным и ценным, даже если он не повсеместен, даже если им обладают не все возможные разумы. Пусть он будет особой частью нашего вклада в завтра. Скорее всего, это тоже важно.

Хочется верить. Потому что я не вижу метаэтического решения, в котором бы поведенческие универсалии людей получилось расширить неограниченно, на разумы произвольной природы.

А что насчёт разума, архитектура которого эмоции вообще не предполагает? У которого нет ничего, похожего на наши эмоции? Не утруждайте себя придумыванием объяснений, почему у любого разума, достаточно мощного, чтобы создавать сложные механизмы, обязаны быть состояния, похожие на эмоции. Естественный отбор создает сложные механизмы, однако эмоций у него нет. Вот вам настоящий пришелец — оптимизационный процесс, который реально Работает Не Так Как Вы.

Прогресс в биологии после 1960-х годов в значительной степени был достигнут благодаря мораторию на очеловечивание эволюции. В академической среде шли масштабные бои по этому поводу, и я не уверен, что здравый смысл возобладал бы, если бы не появились ошеломительные экспериментальные доказательства, подкрепленные математическими выкладками. Потребовалась долгая, сложная, неравная битва, чтобы заставить людей прекратить ставить себя на место чужого. В отношении ИИ я веду такую же битву уже много лет.

Наш антропоморфизм зашит глубоко внутри нас и от него нельзя избавиться усилием воли. Нельзя просто сказать: «А теперь я перестану мыслить как человек!». Человечность — это воздух, которым мы дышим, наша бумага, на которой создаются наши наброски. Когда мы проявляем человечность, мы не думаем, что проявляем человечность.

В среде поклонников научной фантастики способность написать настоящих пришельцев давно считается признаком мастерства. (Это не должны быть непонятные пришельцы, которые ради своих загадочных целей совершают поступки, которых требует сюжет.) Одним из величайших мастеров такого рода был Джэк Вэнс. У него даже люди, если они принадлежат к другой культуре, более чужие, чем многие «пришельцы». (Если вы никогда не читали Вэнса, я рекомендую начать с «Города Кэшей».) Также упомяну «Мошку в зенице Господней» Нивена и Пурнелля.

И наоборот. Кто-то из фантастов (кажется, Орсон Скотт Кард) однажды сказал, что низшей точкой телевизионной научной фантастики стала серия «Звездного Пути», где параллельная эволюция создала пришельцев, которые не только выглядят как люди, не только говорят по-английски, но ещё и независимо записали слово в слово преамбулу к Конституции США.

Это и есть Великая Ошибка Воображения. Не думайте, что она относится только к научной фантастике или только к ИИ. Неспособность представить чужого — это неспособность увидеть самих себя. Неспособность понять, чем ты сам отличаешься от других. Кто разглядит человека, замаскированного под человека, на человеческом фоне?

Перевод: 
sepremento, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
144
Оцените качество перевода: 
Средняя оценка: 4.2 (25 votes)

Оптимизация и взрывное развитие интеллекта

Элиезер Юдковский

Понятие оптимизационного процесса входит в число тем, в которые я здесь пока не погружался. Примерно это понятие можно описать так: сила разума — это способность поражать небольшие цели в большом пространстве поиска, будь то область возможных вариантов будущего (планирование) или область возможных вариантов дизайна (изобретение).

Допустим, у вас есть машина, и допустим, мы знаем, что вам нравится путешествовать. Теперь предположим, что мы взяли все детали автомобиля — или даже все составляющие его атомы — и перемешали. Крайне маловероятно, что в итоге вообще получится средство передвижения. Ещё менее вероятно, что в итоге получится повозка на колёсах. И ещё менее вероятно, что в итоге получится средство передвижения, которое вам понравится больше, чем исходная машина. Поэтому для ваших предпочтений машина — чрезвычайно невероятный артефакт. Сила оптимизационного процесса — это способность создавать такой подвид невероятного.

И интеллект, и естественный отбор можно рассматривать как особые случаи оптимизации: эти процессы в большой области поиска поражают очень маленькие цели, определённые неявными предпочтениями. Естественный отбор предпочитает более эффективных воспроизводителей. У человеческого интеллекта более сложные предпочтения. Ни у эволюции, ни у людей нет последовательных функций полезности, поэтому представление о них как об «оптимизационных процессах» в какой-то мере аппроксимация. Смысл здесь в том, чтобы вникнуть, какая именно работа тут выполняется, а не заявить, что люди или эволюция выполняют её идеально.

Именно так я вижу историю жизни и разума — это история невероятно хорошего дизайна, созданного оптимизационными процессами. Термин «невероятный» используется здесь как невероятный с точки зрения случайного выбора из области возможных вариантов дизайна, а не в абсолютном смысле. Если у вас есть оптимизационный процесс, то «невероятно» хороший дизайн становится вероятным.

Изучая историю оптимизации на Земле от начала и до нынешнего времени, в первую очередь нужно отделить метауровень от уровня объекта — отделить структуру оптимизации от того, что именно оптимизируется.

Если рассматривать биологию в отсутствие гоминидов, то на объектном уровне окажутся существа вроде динозавров, бабочек и кошек. На метауровне будут такие явления, как половая рекомбинация и естественный отбор бесполых популяций. Можно заметить, что объектный уровень гораздо сложнее, чем метауровень. Естественный отбор непрост, и для его описания требуется математика. Но если мы посмотрим на анатомию целой кошки, то мы увидим структуру, которая значительно сложнее, чем «мутировать, рекомбинировать, воспроизвести».

И это неудивительно. Естественный отбор — это случайно возникший оптимизационный процесс, который по сути однажды запустился где-то в первичном бульоне. А кошка — это результат миллионов и миллиардов лет эволюции.

Конечно, у кошек есть мозг, и он учится на протяжении всей её жизни. Но когда жизнь кошки заканчивается, вся накопленная информация исчезает. Поэтому общее влияние кошачьих мозгов на этот мир в качестве оптимизаторов довольно мало.

Или, например, возьмём мозг пчелы и мозг бобра. Пчела строит улья, бобр строит плотины, но им не надо разбираться с нуля, как их строить. Бобр не сможет придумать, как построить улей, пчела не сможет понять, как построить плотину.

Поэтому мозги животных — до недавних пор — не играли хоть сколько-то важную роль на оптимизационной сцене планеты. Они были фигурами, не игроками. По сравнению с эволюцией мозги не могли применять оптимизационную силу достаточно универсально (эволюция создавала потрясающее разнообразие всего) и не могли применять её, опираясь на предыдущие достижения (их творения не накапливали сложность со временем). Подробнее на эту тему написано в эссе «Белковое подкрепление и консеквенциализм ДНК».

Совсем недавно мозг некоторых животных научился создавать огромное количество разных артефактов за время, которое по меркам естественного отбора слишком мало, то есть, приобрёл универсальность. Также, благодаря умениям говорить и писать, он научился создавать артефакты с увеличивающейся сложностью, то есть, его оптимизационная сила начала накапливаться.

Чтобы создать что-то новое и сложное, естественному отбору требуются сотни поколений и миллионы лет. Программисты иногда создают сложный механизм с сотней взаимозависимых элементов за утро. Это неудивительно, ведь естественный отбор — это случайно возникший оптимизационный процесс, а человек — это оптимизированный оптимизатор, сформировавшийся за миллионы лет естественного отбора.

Чудо эволюции не в том, что она работает хорошо, а в том, что она работает без оптимизации. Оптимизация вообще появилась во вселенной из крайне неэффективного случайного оптимизационного процесса (что неудивительно). Обратите внимание, я сейчас говорю не о первых репликаторах, а о первичном процессе естественного отбора. Не путайте объектный и мета- уровни!

Со времени появления оптимизации во вселенной у естественного отбора и человеческого разума появились некоторые общие свойства…

Естественный отбор выбирает гены, но, грубо говоря, гены впоследствии не оптимизируют естественный отбор. Изобретение половой рекомбинации (как и изобретение клеток и ДНК) — исключение из правила. Силу и редкость подобных изобретений можно оценить, обратив внимание на то, что эволюционные биологи выстраивают вокруг них всю историю жизни на Земле.

Однако, если посмотреть на естественный отбор с человеческой точки зрения — особенно с точки зрения программиста, — то в нём нет ничего сложного. Попытаемся соединять гены в группы? Попытаемся хранить информацию отдельно, движущиеся части отдельно? Попытаемся пересобирать группы генов случайным образом? Любой толковый хакер, задумавшийся о системной архитектуре, придумает что-нибудь подобное минут за десять.

Горстка просочившихся с уровня репликаторов улучшений на метауровне — в которых нет ничего сложного по сравнению с анатомией кошки, — оказала огромное влияние на историю эволюции на Земле именно потому, что естественный отбор был столь неэффективен вначале (как совершенно случайный процесс).

И в конечном итоге естественный отбор — это по-прежнему слепой безумный бог. Генофонд может эволюционировать к вымиранию, несмотря на половое размножение и наличие клеток.

Сейчас естественный отбор поддерживает сам себя: каждая адаптация открывает возможности для новых адаптаций. Но это уровень объектов. Генофонд поддерживается собственной сложностью. Однако это происходит только благодаря запущенному в фоновом режиме защищённому интерпретатору естественного отбора, который сам по себе в процессе эволюции видов остаётся неизменным.

Аналогично люди развивают науки и технологии, но пока ещё не приступили к изменению структуры своего мозга. У нас, как и у изобретателей земледелия, есть префронтальная кора головного мозга, височные доли и мозжечок. Мы не модифицируем свои гены. На объектном уровне наука подпитывает науку, а каждое открытие даёт дорогу новым открытиям, но всё это работает через запущенный в фоновом режиме защищённый интерпретатор человеческого мозга.

Иногда у нас получаются прорывы на метауровне: открытия, как научить других людей думать, например, научный подход. Однако первооткрыватель теоремы Байеса не стал байесианцем, он не смог переписать свой софт, у него для этого не хватало знаний и возможностей. Самые значительные изобретения в искусстве мышления, вроде письма или научного подхода, определили ход истории человечества. Однако они не могут сравниться по сложности с мозгом, а их влияние на него относительно невелико.

Современные тренировки по рациональности не способны превратить произвольного смертного в Альберта Эйнштейна. То есть влияние нескольких небольших генетических вариаций превосходит все книги по самопомощи, написанные за двадцатый век.

Мозг тихонько работает в фоновом режиме, и потому люди часто воспринимают его как должное, и думают, что простые руководства вроде «проверяйте идеи при помощи экспериментов» или правила об уровне значимости p < 0.05 дают вклад примерно такого же порядка. Попробуйте посоветовать шимпанзе проверять свои идеи экспериментами, посмотрим, что у вас получится.

Сейчас некоторые из нас хотят применить интеллект, чтобы сконструировать интеллект, который с помощью интеллекта будет изменять себя прямо на уровне машинного кода.

Защищённым уровнем в каком-то смысле станет в первую очередь машинный код, ну и законы физики. Но такие «защищённые уровни» не будут реализовывать оптимизацию, не будут определять структуру выполненной работы. Как бы человека не учили в школе, его мозг всё равно занимается какой-то своей оптимизацией и делает какие-то свои ошибки. А у нашего нового рекурсивного оптимизатора вообще не будет защищённых уровней, связанных с оптимизацией. Всё, что в нём связано с оптимизацией, само будет оптимизироваться.

И именно этим искусственный интеллект кардинально отличается от всего, что произошло на Земле со времён первого репликатора. У нас больше нет защищённого метауровня.

Пока все оптимизаторы в истории Земли работали с постоянной скоростью, создавали постоянное оптимизационное давление. При этом результаты оптимизации появлялись не с постоянной скоростью, а с ускорением, потому что каждое новшество на объектном уровне открывает дорогу к другим новшествам. Однако это ускорение достигалось благодаря защищённому метауровню, который и отвечал за процесс оптимизации. Представьте себе поиск перебором, когда в области поиска происходят переходы из одного кластера в другой, хорошие кластеры часто соседствуют с ещё лучшими, но мы всё равно не можем перепрыгнуть в слишком далёкий кластер и «длина прыжка» никак не меняется. Иногда какие-то мелкие изменения — вроде полового размножения или науки — попадают обратно на метауровень, и после этого в истории оптимизации начинается новая эпоха и всё ускоряется.

Представьте экономику без инвестиций, или университет без языка, или, в общем случае, технологию без инструментов для создания инструментов. Раз в сто миллионов лет или раз в пару столетий, кто-нибудь да изобретёт молоток.

Именно так выглядела оптимизация на Земле до настоящего времени.

Когда я думаю об истории Земли, я воспринимаю её как историю черного ящика, в который на вход подаётся оптимизационная сила, а на выходе получаются оптимизированные продукты. Из-за почти полностью защищённых метауровней пока возможно поделить историю оптимизации на эпохи. Внутри каждой эпохи можно рассмотреть накапливаемую со временем оптимизацию на объектном уровне, ведь защищённый уровень исполняется в фоновом режиме и на протяжении эпохи не меняется.

Что же произойдёт, когда мы создадим рекурсивно улучшающий себя ИИ? Тогда можно будет взять график работы черного ящика «оптимизация на входе, оптимизированное на выходе» и сложить его сам в себя. Образно говоря.

Если ИИ слаб, он ничего не делает, поскольку он недостаточно силен, чтобы значительно улучшить себя. С тем же успехом можно приказать шимпанзе переписать свой мозг.

Если же ИИ достаточно силён, чтобы переписать себя и увеличить свою возможность создавать дальнейшие улучшения, а также если он способен полностью понять свой исходный код и своё устройство как оптимизатора… Тогда даже если зависимость между «оптимизационной силой» на входе и «оптимизированными продуктами» на выходе останется прежней, график оптимизации от времени будет выглядеть совершенно иначе, нежели сейчас.

Мне часто возражают примерно так: «Но что если для создания улучшений, возрастающих линейно, потребуется экспоненциально возрастающее количество работы по самомодификации?». Напрашивается ответ: «В процессе создания человека естественный отбор оказывал на ветку гоминидов примерно постоянное оптимизационное воздействие и не похоже, чтобы ему требовалось экспоненциально больше времени на каждое линейное приращение в качестве».

Но это всего лишь суждение по аналогии. Полноценный ИИ, обдумывающий природу оптимизации, проводящий собственные исследования и пишущий собственный код будет не просто историей Земли свернутой в себя, а чем-то совершенно иным. Аналогии в лучшем случае подходят для качественных прогнозов, но даже в этом случае, у меня ещё есть множество иных неразъяснённых убеждений, влияющих на выбор аналогий.

Однако главная причина, почему я не хочу проецировать графики биологического и экономического роста в будущее за горизонт создания ИИ, который мыслит со скоростью транзиторов, изобретает самовоспроизводящиеся молекулярные нанофабрики и улучшает собственный код, заключается в следующем: не нужно строить график зависимости оптимизированного продукта на выходе от времени. Важна зависимость оптимизированного продукта на выходе от оптимизационной силы на входе.

Перевод: 
sepremento, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
145
Оцените качество перевода: 
Средняя оценка: 4.3 (7 votes)

Призраки в машине

Элиезер Юдковский

Одна из трёх наиболее популярных реакций на идею дружественного искусственного интеллекта такова:

«Вы, конечно, можете велеть ИИ быть дружественным, но если он способен модифицировать свой собственный исходный код, то он просто уберёт все наложенные вами ограничения».

И откуда же это решение возьмётся?

Возникнет ли оно вопреки причинности, не будучи закономерной частью цепочки причин и следствий, начавшейся с изначально написанного исходного кода? Является ли ИИ источником своей собственной свободной воли?

Дружественный ИИ это не эгоистичный ИИ, сдерживаемый отдельным модулем совести, который противостоит естественным желаниям ИИ, заставляя поступать определённым образом. Вы создали сознание, и оно и есть ИИ. Если у вас есть программа, вычисляющая, какой поступок ИИ следует предпринять, ваша работа по созданию ИИ закончена. Фишка дальше не идёт.

Сейчас я приведу несколько цитат с сайта «Компьютерные глупости» по теме «Программирование». (Я не привожу ссылку на сам сайт, так как это ужасная поглощающая время ловушка. Можете гуглить на свой страх и риск).

___________________________________________________________
Я вёл занятия по программированию у студентов колледжа. Некоторые из них не понимали, что компьютер неразумен. В своих программах на Паскале, они оставляли комментарии вроде: «Теперь мне нужно вывести эти буквы на экран». Я спросил одного из них, зачем они так поступают. Студент ответил: «Как ещё компьютер поймёт, что я хочу от него?». Видимо, они полагали, что раз они сами не понимают Паскаль, то компьютер тоже не понимает.
___________________________________________________________
Учась в колледже, я преподавал в школьной математической лаборатории. Однажды ученик подошёл ко мне и пожаловался, что его программа на Бейсике не запускается. Это было задание из курса для начинающих: написать программу, которая бы вычисляла рецепт овсяного печенья, в зависимости от числа людей, для которых вы его печёте. Я взглянул на код его программы и увидел примерно следующее:

10 Разогреть духовку дo 350
20 Поместить все ингредиенты в большую миску
30 Размешивать до получения однородной массы
___________________________________________________________
Студент вводного курса по программированию однажды попросил меня помочь разобраться, почему в результате простого вычисления его программа всегда выдаёт нули. Я взглянул на код программы и ответ был очевиден:

begin
read(«Number of Apples», apples)
read(«Number of Carrots», carrots)
read(«Price for 1 Apple», a_price)
read(«Price for 1 Carrot», c_price)
write(«Total for Apples», a_total)
write(«Total for Carrots», c_total)
write(«Total», total)
total = a_total + c_total
a_total = apples * a_price
c_total = carrots * c_price
end

Я: «Ну, твоя программа не может вывести правильный результат до того, как его вычислит».
Он: «Но ведь понятно же, каким должен быть ответ, почему компьютер не может просто переставить инструкции в правильном порядке?»
___________________________________________________________

Интуитивно люди строят представление о «программировании ИИ» на основе ситуации, которая вроде бы похожа: сказать другому человеку, что ему делать. И поэтому им кажется, будто «программа» даёт указания маленькому призраку, сидящему внутри машины, а тот их изучает и решает, нравятся ли они ему или нет.

Но нет никакого призрака, изучающего инструкции и решающего, следовать им или нет. Программа — это и есть ИИ.

Поэтому призрак не будет исполнять все ваши желания, подобно джину. Поэтому призрак не будет делать всё, что вы хотите и именно так, как вы этого хотите, подобно невероятно покорному рабу. В машине нет никакого призрака, кроме ваших команд, по крайней мере, на момент загрузки.

ИИ куда сложнее, чем интуитивно кажется людям, именно потому, что вы не можете просто сказать призраку, что ему делать. Вам необходимо построить этого призрака с чистого листа, и всё, что кажется вам само собой разумеющимся, вовсе не будет таковым для призрака, если только вы не знаете, как заставить призрака осознать эту очевидность. Вы не можете просто сказать призраку осознать её. Вы должны создать осознающую штуку с нуля.

Если вы не знаете, как создать нечто, наделённое странными, невыразимыми свойствами вроде «принятия решений», то вы не можете просто пожать плечами и предоставить призраку возможность разобраться самостоятельно. Вы одни. Нет никакого призрака.

Создание шахматной программы — это не просто создание действительно быстрого процессора, который позволит ИИ быть очень умным, а затем ввод в командную строку: «Делай те шахматные ходы, которые ты считаешь лучшими». Можно было бы подумать, что раз программисты не слишком хорошо играют в шахматы сами, любой совет, который они попытаются дать электронному супермозгу, лишь замедлит призрака. Но нет никакого призрака. В том-то и проблема.

И нет никакого простого заклинания, произнесение которого могло бы — пуф! — и призвать полноценного призрака в машину. Нельзя сказать: «Я призвал призрака, и он появился — вот вам и причина и следствие». Это не сработает даже если вместо слова «призыв» использовать понятия «эмердженция» или «сложность». Нельзя дать команду процессору: «Будь хорошим шахматистом!» Вам придётся заглянуть за завесу тайны игры в шахматы и создать призрака с чистого листа.

Не важно, насколько какое-то свойство или способность кажется вам самоочевидным, логичным или правильным. Оно не появится внутри призрака. Единственное возможное исключение: это свойство будет результатом причинно-следственной цепочки, начавшейся с команд, которые ввели именно вы, а также какой-либо зависимости от входных данных, которую вы встроили в эти команды.

Это не значит, что вам нужно явно задать для компьютера каждый поступок. Deep Blue играет в шахматы гораздо лучше, чем его программисты. Его ходы превосходят всё, что его создатели могли явно в него запрограммировать, но не потому что программисты просто предоставили призраку придумывать их. Шахматные ходы Deep Blue намного лучше, чем возможные ходы его программистов, потому что так получилось в результате цепочки причин и следствий, которая началась с кода, написанного этими программистами, и продолжалась в соответствии с законами природы. Никакой ход Deep Blue не сделал просто потому, что этот ход настолько очевидно хорош, что призрак решил его сделать без какой-либо связи с исходным кодом и закономерными последствиями из него.

Если вы отказываетесь связывать ИИ ограничениями, вы не получите свободного призрака — кого-то похожего на освобождённого раба. У вас будет лишь кучка песка, из которой так никто и не получил кремний, из которого так никто и не создал процессор и не запрограммировал его думать.

Давайте, попробуйте сказать компьютеру: «Делай все, что тебе захочется». К чему это приведёт? Ни к чему. Потому что вы не связали его ограничениями, необходимыми, чтобы понимать свободу.

Всё, что для это требуется, кажется настолько очевидным, настолько логичным, настолько само собой разумеющимся, что ваш разум просто пропускает все эти шаги, и вы сразу же покидаете путь создателя ИИ. Чтобы ваш разум не скатывался на эту дорожку, требуется особое усилие (похожее усилие я описал в эссе «Пытаясь ухватить ускользающее»).

Перевод: 
Горилла В Пиждаке
Номер в книге "Рациональность: от ИИ до зомби": 
146
Оцените качество перевода: 
Средняя оценка: 4.4 (14 votes)

Искусственное суммирование

Элиезер Юдковский

Предположим, что люди совершенно не понимали бы, как именно они выполняют арифметические действия. Вообразим мир, где люди получили возможность считать овец в результате эволюции, а не научились этому навыку. И люди используют эту врождённую способность, не понимая, как именно она работает, точно так же, как Аристотель не понимал, каким образом зрительная кора его головного мозга позволяет ему что-то видеть. Арифметика Пеано в известном нам виде так и не изобретена. Философы пытаются формализовать свои интуитивные представления о действиях с числами, но они используют формулировки вроде:

Сложить(Семь, Шесть) = Тринадцать

чтобы формально описать интуитивно очевидный факт, что, когда вы складываете «семь» и «шесть», то, конечно же, получается «тринадцать».

В этом мире карманные калькуляторы хранят в памяти огромную справочную таблицу арифметических фактов для всех значений от нуля до ста, введённых вручную командой экспертов по Искусственному Вычислению. И хотя такие калькуляторы на практике иногда полезны, многие философы утверждают, что подобные устройства лишь симулируют вычисления. Никакая машина не может считать по-настоящему — именно поэтому людям необходимо сперва сосчитать тринадцать овец, прежде чем записать «тринадцать» в калькулятор. Калькуляторы могут показывать сохранённые в них факты, но они не понимают, что именно они делают. Если ввести «две тысячи плюс две тысячи», калькулятор выдаст: «Ошибка: Превышен предел допустимых значений». Хотя интуитивно очевидно, что если понимать, что именно означают введённые слова, то ответ: «четыре тысячи».

Некоторые философы, конечно же, не настолько наивны, и такими рассуждениями их с толку не сбить. В действительности числа — это исключительно формальная система: ярлык «тридцать семь» имеет смысл не из-за какого-то неотъемлемого свойства самих слов, а потому что он отсылает к тридцати семи овцам во внешнем мире. Число приобретает свой смысл в результате нахождения внутри семантической сети связей с другими числами. Вот почему в компьютерных программах LISP токен «тридцать-семь» не нуждается в какой-либо внутренней структуре – он имеет смысл лишь в результате отсылок и связей, а не какой-либо самостоятельной вычислительной характеристики «тридцати-семи».

Никто ещё не смог создать Сильный Искусственный Вычислитель, хотя, конечно же, есть множество узконаправленных Искусственных Вычислителей, которые, например, работают на множестве чисел от «двадцати» до «тридцати». И если посмотреть на то, как медленно движется прогресс в отношении чисел порядка «двухсот», становится очевидным, что в ближайшее время Сильный Искусственный Вычислитель не появится. Лучшие эксперты в области предполагают, что потребуется не меньше ста лет, прежде чем калькуляторы смогут складывать не хуже двенадцатилетнего ребёнка.

Однако не все согласны с данной оценкой или же с всего лишь общепринятыми убеждениями касательно Искусственного Вычисления. Вполне распространены и следующие взгляды:

  • «Это проблема окружения. То, чему равно „двадцать один плюс“, зависит от того, идёт речь о „плюс три“ или „плюс четыре“. Если мы сможем загрузить в калькулятор достаточно арифметических фактов, чтобы покрыть все общеизвестные истины, то вскоре сможем увидеть в системе и настоящее сложение».
  • «Но вы никогда не сможете запрограммировать достаточное количество арифметических фактов, нанимая экспертов, которые будут вводить их вручную. На самом деле нам нужен Искусственный Вычислитель, который сможет научиться всей обширной сети связей между числами, которую люди приобретают в течение детства, наблюдая за кучками яблок».
  • «Нет, на самом деле нам нужен Искусственный Вычислитель, способный понимать естественные языки. Тогда в него не придётся явно вводить, что двадцать один плюс шестнадцать равно тридцать семь — он сможет получить эту информацию из Интернета».
  • «Честно говоря, создаётся впечатление, что вы просто-напросто пытаетесь убедить самих себя, словно вы способны решить данную проблему. Никто из вас в действительности не знает, что такое арифметика, и вы просто перебираете привычные фразы, вроде: „Нам нужен ИИ, способный выучить X“, „Нам нужен ИИ, который способен извлечь X из Интернета“. В смысле, это звучит хорошо, появляется впечатление, будто вы делаете какие-то успехи. Это хорошо в плане связей с общественностью, так как всем кажется, что они понимают предлагаемое решение. Но, на самом деле, это не приближает вас к суммированию в общем виде в противовес к узкоспециализированному суммированию. Не исключено, что мы никогда не сможем познать фундаментальную природу арифметики. Эта задача просто слишком сложна для людей».
  • «Именно поэтому нам нужно разработать Сильного Вычислителя тем же способом, что и природа - посредством эволюции».
  • «Подход „сверху вниз“ определённо продемонстрировал свою неспособность создать арифметику. Нам нужно использовать подход „снизу вверх“, каким-то образом заставить арифметику просто возникнуть. Необходимо признать принципиальную непредсказуемость сложных систем».
  • «Вы все неправы. Предыдущие попытки создать машинную арифметику были заранее обречены на провал просто потому, что вычислительных мощностей не хватало. В человеческом мозге триллионы синапсов — очевидно, что в калькуляторы нельзя загрузить настолько большие справочные таблицы. Нам необходимы калькуляторы настолько же мощные, как и человеческий мозг. Согласно закону Мура, они появятся в 2031 году, 27 апреля, между 4.00 и 4.30 утра».
  • «Полагаю, что машинная арифметика появится, когда исследователи просканируют каждый нейрон человеческого мозга. Таким образом мы сможем симулировать на компьютере биологические нейронные связи, которые и позволяют людям складывать числа».
  • «Не думаю, что нам необходимо ждать сканирования всего мозга. Нейронные сети ничем не отличаются от человеческого мозга и их можно натренировать делать что-нибудь без понимания того, как они этого делают. Так мы сможем научить программы заниматься арифметикой, даже если мы, их создатели, так и не разберёмся, как им это удаётся».
  • «Но теорема Гёделя показывает, что никакая формальная система не сможет вместить в себе основные свойства арифметики. Классическая физика формализуема, поэтому, чтобы сложить два и два, мозг должен использовать особенности квантовой физики».
  • «Эй, если бы арифметику можно было воспроизвести в компьютере, мы бы не умели считать достаточно хорошо, чтобы построить компьютер».
  • «Разве вы не слышали о „китайском калькуляторе“, мысленном эксперименте Джона Сёрла? Даже если бы у вас был огромный набор правил, позволяющий складывать „двадцать один“ и „шестнадцать“, просто представьте, что произойдёт, если перевести все слова на китайский язык. Сразу становится понятным, что подлинного сложения не происходит: нигде в системе нет настоящих чисел, есть лишь ярлыки, которые люди используют для их обозначения…»

Из этой притчи можно вывести несколько моралей, и в разных контекстах я её рассказывал по разным причинам. В частности, она демонстрирует идею уровней организации. Скажем, процессор может складывать два больших числа, потому что числа — это упорядоченные структуры из 32 бит, а не непроницаемые черные ящики.

Но для целей преодоления искажений1, обратим внимание на следующие две морали:

  • Во-первых, опасно полагаться на утверждения, которые вы не способны вывести самостоятельно.
  • Во-вторых, опасно игнорировать собственное непонимание базовых вопросов.

Дабы не быть обвиненным в обобщении на основании вымышленного свидетельства отмечу, что оба эти урока могут быть получены и из реальной истории исследований искусственного интеллекта.

Первая опасность — это конкретная проблема, с которой сталкиваются устройства ИВ. Они функционируют подобно диктофонам, проигрывающим «знания», полученные извне системы, используют процесс, который они сами не способны воспроизвести. Человек может сказать устройству ИВ, что «двадцать один плюс шестнадцать равно тридцать семь», и ИВ может записать это и в нужный момент повторит. Или даже распознать шаблон «двадцать один плюс шестнадцать» и вывести «тридцать семь!». Однако ИВ не в состоянии генерировать подобное знание самостоятельно.

И это очень сильно напоминает ситуацию, где кто-то верит физику, говорящему: «Свет – это волны», запоминает эту восхитительную последовательность слов, а затем повторяет её, когда кто-то спросит: «Что такое свет?», но при этом не способен создать такое знание самостоятельно.

Вторая мораль говорит об ловушке более высокого уровня, которая поглотила исследователей Искусственного Вычисления и прочих интересующихся этим вопросом людей. Если в ваших знаниях зияет дыра, опасно пытаться её просто обойти. Нужно сжать зубы и трудиться изо всех сил, чтобы заполнить эту чёртову дыру. Но люди часто делают, что угодно, только не это.

Когда вы говорите: «Дело в эмерджентности!» или же «Это непознаваемо!», — вы не отдаёте себе отчёт в существовании основополагающего знания, которое вполне можно постигнуть, но вы это просто пока не сделали.

Откуда вам знать, когда появится основополагающее знание? Нет иного способа обрести его, кроме как упорно биться головой о задачу, изучать со всех мыслимых сторон всё, что имеет к ней отношение, возможно, годами. В академических кругах такой подход не одобряется, ведь вы должны публиковать статьи хотя бы раз в месяц. Наверняка венчурные капиталисты не дадут денег за такое изучение. Вы хотите либо пойти напролом и построить что-то прямо сейчас, либо сдаться и заняться чем-нибудь ещё.

Взгляните на комментарии выше. Ни один из них не нацелен на приобретение недостающего понимания, в результате которого числа перестали бы быть таинственными, которое превратило бы «тридцать-семь» во что-то большее, чем чёрный ящик. Ни один из комментаторов не понял, что сложности порождаются их собственным непониманием, а не какими-то присущими арифметике свойствами. Они не пытались достичь того состояния, когда непонятное перестаёт быть непонятным.

Если вы прочтёте книгу Джуды Перла «Вероятностные рассуждения в интеллектуальных системах: Сети правдоподобных выводов»2, то увидите, что для решения соответствующих проблем совершенно необходимо понимать, что лежит в основе графовых моделей. (Боюсь, объяснение, о чём здесь идёт речь, длиннее надписей на футболках, поэтому вам придется прочитать книгу самостоятельно. В интернете мне не встречались научно-популярные материалы, адекватно описывающие принципы, лежащие в основе байесианских сетей или же важность того, что математические выкладки именно такие, какие есть, но книга Перла восхитительна). Когда-то были дюжины «немонотонных логик», хоть как-то пытающихся формализовать интуиции вроде: «Если сигнализация сработала, то, скорее всего, в дом пытается пробраться грабитель, однако если после этого я узнаю, что около моего дома произошло небольшое землетрясения, то, скорее всего, дело не в грабителе». Поняв графовые модели, вы сможете математически объяснить, почему логика первого порядка не подходит для этой задачи, и записать верное решение в простом и удобном виде, причём это решение элегантно учтёт все нюансы бытовой интуиции и здравого смысла. Но пока у вас нет этого понимания, в попытках привести логику в соответствие «очевидно истинному» вы будете лишь лепить на неё многочисленные заплатки и добавлять тут и там «костыли».

Вы не можете наверняка знать, что проблема Искусственного Вычисления неразрешима, если вы не понимаете её суть. Если вы не знаете правил, то вы не знаете и о правиле, которое гласит, что вы должны знать правила, чтобы что-нибудь сделать. Именно из-за этого появляется все эти гениальные идеи, вроде создания Искусственного Вычислителя, способного понимать естественные языки и скачивать миллионы арифметических утверждений из интернета.

И «почему-то» эти гениальные идеи никогда не срабатывают. Почему-то всё время оказывается, что вы «не видите причин, почему это может не сработать» не из-за того, что их нет, а из-за собственного невежества. Это похоже на стрельбу вслепую по далёкой цели. Вы можете делать выстрел за выстрелом и кричать: «Никто не докажет, что я не попаду в центр мишени!». Однако, пока вы не снимете повязку с глаз, вы не способны прицелиться. Когда «никто не может доказать», что ваша драгоценная идея на самом деле не верна, это значит лишь то, что у вас недостаточно информации, чтобы попасть по небольшой цели в широком пространстве возможных ответов. Если вы не знаете, что ваша идея работает, то она не работает.

Из истории открытий в области Искусственного Интеллекта и жуткой путаницы, царившей до них, я вывожу важный жизненный урок: «Если основная проблема — это ваше невежество, то при попытках придумать хитрый способ, как его игнорировать, вы лишь выстрелите себе в ногу».

  • 1. В оригинале здесь присутствует игра слов. Юдковский использует словосочетание «overcoming bias», что совпадает с исходным названием блога, где появлялись эти эссе. — Прим.перев.
  • 2. Judea Perl, «Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference». Книга не переводилась на русский язык — Прим.перев.
Перевод: 
Горилла В Пиджаке
Номер в книге "Рациональность: от ИИ до зомби": 
147
Оцените качество перевода: 
Средняя оценка: 4.5 (15 votes)

Ценности терминальные и инструментальные

Элиезер Юдковский

Интуитивно кажется, что любой человек при планировании ведёт себя так, будто умеет различать цели и средства. Хочется шоколада? Шоколад продаётся в супермаркете «Пабликс». Чтобы попасть в супермаркет, нужно проехать одну милю на юг по проспекту Вашингтона. Чтобы проехать эту милю, нужно сесть в машину. Чтобы открыть дверь, нужны ключи от машины. И вы кладёте ключи от машины в карман, собираетесь выйти из дома…

… и тут внезапно по радио сообщают, что землетрясение уничтожило весь шоколад в местном «Пабликсе». И нет смысла ехать в «Пабликс», если там нет шоколада, и нет смысла садиться в машину, если вы никуда не едете, и нет смысла в ключах от машины в кармане. Поэтому вы вытаскиваете ключи из кармана, звоните в местную службу доставки пиццы и заказываете там шоколадную пиццу. М-м-м, вкусно.

Я редко сталкиваюсь с тем, что люди теряют нить плана, который они сами же и разработали. Обычно люди не едут в супермаркет, если знают, что шоколада там нет. Но при этом я часто замечаю, что когда люди не просто хотят чего-то, а явно описывают свою систему целей — говорят о целях, а не пытаются их достичь, — они часто путаются. Люди хорошо планируют, но они не специалисты по планированию1. Если бы это было не так, в мире было бы гораздо больше разработчиков ИИ.

В частности, я замечаю, что люди путаются — в абстрактных философских дискуссиях, а не в обычной жизни, — когда обсуждают разницу между целями и средствами. Более формально: разницу между «инструментальными ценностями» и «терминальными ценностями».

Насколько я понимаю, часть проблемы заключается в том, что человеческий мозг использует для отслеживания своих целей отдельную систему, которая работает, но не идеально. В нашем языке нет чёткого разделения между целями и средствами: предложения «Я хочу спасти жизнь моей сестры» и «Я хочу сделать моей сестре укол пенициллина» содержат одно и то же слово «хочу».

Можем ли мы описать утерянную разницу на обычном человеческом языке?

Давайте попробуем:

«Инструментальные ценности» нужны нам исключительно потому, что мы ожидаем, что они повлекут ожидаемые нами последствия. «Я хочу сделать моей сестре укол пенициллина» не потому, что сестра с пенициллином внутри это нечто хорошее само по себе, а потому что ожидаю, что пенициллин вылечит её от пожирающей плоть пневмонии. Если бы вы ожидали, что укол пенициллина приведёт к тому, что ваша сестра растает как Злая Ведьма Запада, вы бы дрались изо всех сил, чтобы спасти её от пенициллина.

«Терминальные ценности» нужны нам без какой-либо связи с другими последствиями. «Я хочу спасти жизнь моей сестре» никак не связано с тем, будет ей сделан после этого укол пенициллина или нет.

У этой первой попытки есть очевидные проблемы. Если спасение жизни моей сестры приведёт к тому, что Землю поглотит чёрная дыра, я порыдаю некоторое время, но не буду делать ей укол пенициллина. Означает ли это, что спасение жизни моей сестры не является «терминальной ценностью» (не имеет ценность само по себе), ведь теоретически оно может повлечь какие-то последствия? Возможно, я пытаюсь спасти ей жизнь лишь из убеждения, что впоследствии Землю не поглотит чёрная дыра? Интуиция подсказывает, что дело не в этом.

Поэтому оставим в покое обычный язык. Мы можем математически описать теорию принятия решений так, чтобы терминальные и инструментальные ценности оказались независимыми и несовместимыми типами — как целые числа и числа с плавающей запятой в языках программирования, где нет автоматической конвертации между ними.

Идеальную байесианскую систему принятия решений можно построить всего лишь на основе четырёх элементов:

  • Исходы: тип Исход[]
    • перечень возможных исходов
    • {сестра живёт, сестра умирает}
  • Действия: тип Действие[]
    • перечень возможных действий
    • {сделать укол пенициллина, не делать укол пенициллина}
  • Функция_полезности: тип Исход -> Полезность
    • функция полезности, которая ставит в соответствие каждому исходу его полезность
    • (полезность описывается действительным числом между минус- и плюс-бесконечностью)
    • {сестра живёт: 1, сестра умирает: 0}
  • Функция_условной_вероятности: тип Действие -> Исход -> Вероятность
    • функция условной вероятности описывает вероятностное распределение по исходам для каждого действия
    • (вероятность описывается действительным числом от 0 до 1)
    • {сделать укол пенициллина: сестра живёт, 0,9; сестра умирает: 0,1;; не делать укол пенициллина: сестра живёт: 0,3; сестра умирает: 0,7}

А что насчёт самой системы принятия решений?

  • Ожидаемая_полезность: Действие Д -> (Сумма И из Исходы: Полезность(И) * Вероятность(И|Д))
    • «Ожидаемая полезность» действия равна сумме по всем исходам от полезности исхода, помноженной на условную вероятность исхода при выполнении этого действия.
    • {ОП(сделать укол пенициллина) = 0,9; ОП(не делать укол пенициллина) = 0,3}
  • Выбрать: -> (Argmax Д из Действий: Ожидаемая_Полезность(Д))
    • Выбрать действие, «ожидаемая полезность» которого максимальна.
    • {результат: сделать укол пенициллина}

Для каждого действия вычислите условную вероятность всех возможных последствий, затем сложите полезности, помноженные на условные вероятности. Затем выберите лучшее действие.

Это математически простой набросок системы принятия решений. Вычислять решение в реальном мире таким образом не эффективно.

Например, что будет, если план требует выполнить некую последовательность шагов? Построенный формализм может легко описать такую ситуацию, при этом Действие будет обозначать всю последовательность. Но при этом получится экспоненциально большое пространство вариантов, похожее на пространство всех предложений, состоящих из 100 букв. Если одним из возможных первых шагов будет «Отстрелить себе ногу», человек решит, что это в любом случае плохая идея, и выбросит все последовательности, начинающиеся с этого шага. Но в нашем представлении мы упрощаем эту структуру. У нас нет последовательностей шагов, есть лишь просто «действия».

В общем, да, есть «несколько небольших сложностей». Собственно, если бы их не было, мы бы могли просто создать таким способом настоящий ИИ. В каком-то смысле таковым ИИ и была бы сама байесовская теория вероятностей.

Однако всё равно это пример ситуации, когда гораздо лучше сначала рассмотреть простой до абсурдности вариант, а уж потом добавлять всякие навороченные усложнения.

Рассмотрим философа, который заявляет: «Все мы, в сущности, эгоисты. Мы заботимся лишь о том, что у нас в голове. Мать, которая заявляет, что волнуется о благополучии сына, на самом деле хочет верить, что с её сыном всё в порядке. Её делает счастливой это убеждение. Она помогает сыну ради своего счастья, а не ради его счастья». Вы отвечаете: «Предположим, мать жертвует своей жизнью, чтобы вытолкнуть сына из под колёс едущего грузовика. Этот поступок не делает её счастливой, она просто погибает». Философ запинается на секунду, затем возражает: «Но она всё равно это делает, потому что этот выбор ей нравится больше других, потому что она присвоила этому решению большую важность».

И на это вы говорите:

ОШИБКА ТИПОВ: Конструктор для Ожидаемая_Полезность -> Полезность не найден.

Позвольте мне объяснить этот ответ.

Даже наш простой формализм чётко показывает различие между ожидаемой полезностью, которая является свойством действия, и полезностью, которая является свойством исхода. Да, конечно, вы можете перевести и полезность, и ожидаемую полезность в действительные числа. Но это тоже самое, что перевести в действительные числа скорость ветра и температуру — они не становятся от этого одной и той же сущностью.

Философ начинает спор с утверждения, что полезность является функцией от исходов, составляющих состояние нашего разума. Если это правда, то наш разум будет действовать как машина, которая направляет будущее в те области, где мы счастливы. Будущие состояния при этом различаются только по состоянию разума. Если в каких-то двух разных будущих у вас одинаковое состояние ума, вам всё равно, какое из них предпочесть.

И в этом случае вы действительно вряд ли станете жертвовать своей жизнью, чтобы спасти чужую.

Когда мы возражаем, что люди иногда всё-таки жертвуют своими жизнями, философ переключается на обсуждение ожидаемой полезности от действий: «Она присвоила этому решению большую важность». Именно из-за этого неожиданного переключения мы должны подпрыгнуть от возмущения. В нашем языке программирования попытка преобразовать Ожидаемая_полезность в Полезность сразу же вызовет ошибку. Но в обычном человеческом языке и то, и другое кажется одним понятием.

В нашей простой системе принятия решений мы выбираем те действия, которым соответствует наивысшая Ожидаемая_полезность. Но это ничего не говорит о том, в какое именно будущее мы хотим попасть. Ожидаемая полезность ничего не говорит о полезностях, которые назначает принимающий решение, или об исходах, которые скорее всего произойдут в реальном мире. Она ничего не говорит о разуме как о машине, направляющей куда-то будущее.

Физической причиной физического действия является состояние разума. Для нашего идеального принимателя решений таким состоянием является Ожидаемая_полезность, которая вычисляется через функцию полезности от воображаемых последствий. Чтобы спасти жизнь сына, вы должны представить событие, при котором жизнь сына спасена. Воображаемое событие само по себе не является событием. Оно оказывается в кавычках, тут такая же разница, как между «снегом» и снегом. Но это не означает, что то, что находится в кавычках должно само быть состоянием разума. Если вы выбираете действие, которое ведёт к будущему, которое вы представляете как «мой сын по-прежнему жив», то вы работаете машиной, которая направляет будущее в ту область, где ваш сын по-прежнему жив. Не машиной, которая направляет будущее в область, где вы представляете предложение «мой сын по-прежнему жив». Чтобы направлять будущее в эту область, ваша функция полезности должна возвращать высокое значение при входных данных « „мой сын по-прежнему жив“ », когда стоят двойные кавычки, когда речь идёт о том, как вы воображаете себя воображающим такой исход. У вас получится плохой торт, если вы измельчите рецепт и бросите его в тесто.

Именно поэтому полезней сначала рассмотреть простую систему принятия решений. Если в неё внести достаточно усложнений, различия, хорошо заметные ранее, будет увидеть сложнее.

А теперь давайте рассмотрим некоторые усложнения. Очевидно, что функция полезности (отображающая исходы в полезность) нужна, чтобы формализовать то, что раньше я обозначил как «терминальные цели», цели, которые никак не связаны с их последствиями. Что у нас теперь получается с примером, когда спасение жизни вашей сестры приводит к тому, что чёрная дыра уничтожает Землю? В нашем формализме мы эту возможность упрощаем. Исходы не ведут к исходам, к исходам ведут только действия. Выздоровление вашей сестры от пневмонии, за которым следует уничтожение Земли чёрной дырой, становится одним «возможным исходом».

А где в этом простом формализме оказываются «инструментальные ценности»? А они полностью исчезают! Понимаете, в этом формализме действия ведут к исходам без каких-то промежуточных событий. Мы здесь не рассматриваем камень, который летит сквозь воздух, попадает в яблоко на дереве, в результате чего оно падает на землю. Бросок камня — это действие. Оно ведёт к исходу, в котором яблоко лежит на земле — в соответствии с функцией условной вероятности, которая превращает действия напрямую в распределение вероятностей по исходам.

Для того, чтобы на самом деле вычислить функцию условной вероятности, и для того, чтобы отдельно рассмотреть полезность сестры с пневмонией и чёрной дыры, поглощающей Землю, мы должны представить структуру причинно-следственных связей — как именно одни исходы ведут к другим.

И тут возвращаются инструментальные ценности. Если причинно-следственная сеть в достаточной степени «регулярна», возможно, вы обнаружите, что состояние B, скорее всего, ведёт к C. Тогда, если вы по каким-то причинам хотите достичь С, вы можете сперва запланировать достичь В, которое ведёт к С, а затем запланировать достичь А, которое ведёт к В. В этом весь смысл «инструментальных ценностей»: В является «инструментальной ценностью», потому что ведёт к С. С само по себе может считаться терминальной ценностью, аргументом функции полезности из пространства исходов. Или С может быть просто инструментальной ценностью, узлом, который невозможно оценить с помощью функции полезности напрямую.

Инструментальные ценности в этом формализме служат исключительно для эффективного планирования. Если нужной «регулярности» нет, от них можно и нужно избавиться.

Например предположим, что есть какое-то конкретное значение В, которое не ведёт к С. Предпримите вы действие А, которое ведёт к этому В? Или отбросим абстрактную философию. Если вы хотите попасть в супермаркет ради шоколада, и вы хотите поехать в супермаркет, и вам нужно попасть в машину, будете вы выламывать дверь машины паровым экскаватором? (Нет.) Инструментальные ценности — это «дырявые абстракции» (это словосочетание из нашего программистского жаргона). Иногда закэшированную ожидаемую полезность нужно выкидывать и вычислять заново. Чтобы быть эффективным и не самоубиться при этом, нужно в том числе замечать, когда привычные ходы перестают работать. Хотя описываемый формализм использует инструментальные ценности, они нужны только в тех случаях, когда присутствует необходимая «регулярность» и исключительно для удобства вычислений.

Однако если некто усложняет формализм до того, как понял простую версию, он иногда начинает думать, что инструментальные ценности живут какой-то своей странной жизнью, причём даже в нормативном смысле. В смысле, если сказать, что В — обычно хороший поступок, потому что он ведёт к С, то следует всегда пытаться сделать В — даже в отсутствие С. Занимаясь абстрактной философией, люди часто допускают такую ошибку, хотя в реальной жизни они никогда не выламывают дверь своей машины паровым экскаватором. Не понимая простой вариант формализма люди иногда думают, что невозможно появление консеквенциалиста, который максимизирует лишь генетическую приспособленность — ведь он умрёт от голода, если у него нет явной терминальной ценности «питаться». Люди совершают эту ошибку, хотя сами никогда не стоят целый день возле открытой машины из страха оказаться в ней запертой — ведь у них же нет терминальной ценности открывать дверь машины.

Инструментальные ценности обитают в функции условной вероятности. Из-за этого инструментальные ценности напрямую зависят от убеждений о поведении функции полезности. Если я убеждён, что пенициллин вызывает пневмонию, а отсутствие пенициллина её лечит, то для меня инструментальная ценность пенициллина упадёт. Убеждения меняются — меняется функция условной вероятности, которая связывает действия с ожидаемыми последствиями. И вместе с ней меняются и инструментальные ценности.

Когда люди спорят о морали, то иногда они спорят об инструментальных последствиях, а иногда — о терминальных ценностях. Если ваш оппонент заявляет, что запрет на ношение личного оружия ведёт к снижению количества преступлений, а вы утверждаете, что запрет на ношение оружия ведёт к увеличению количества преступлений, то вы согласны по поводу высшей инструментальной ценности (преступления — это плохо), но не согласны по вопросу, какое промежуточное событие ведёт к каким последствиям. Однако в споре о женском обрезании, как мне кажется, вряд ли у оппонентов есть общие представления о том, как справедливо обращаться с женщинами или как сделать их счастливее.

Во время особо яростных споров на это важное различие часто никто не обращает внимание. Люди, у которых есть общие ценности и разногласие по поводу фактов, приходят к мысли, что их оппонент наверняка социопат. Мол, если он выступает за ограничение/легализацию оружия, значит, он на самом деле хочет убивать людей. С точки зрения психологии это довольно не реалистично.

Боюсь, человеческий мозг не слишком хорошо видит различие между терминальными и инструментальными ценностями в вопросах морали. «Мы должны запретить оружие» и «Мы должны спасать жизни людей» выглядят схожими убеждениями о морали по своей форме. Хотя в остальном человеческая система целеполагания усложняет практически всё, именно это различие превращается в мешанину разных штук с условными ценностями.

Чтобы выделить терминальные ценности, нам нужно разобраться в этой мешанине ценных штук и понять, ценность каких из них привязана к чему-то ещё. Это очень сложно! Если вы говорите, что хотите запретить ношение оружия для того, чтобы уменьшить число преступлений, может потребоваться время, чтобы понять, что «уменьшение числа преступлений» — это не терминальная ценность, это более высокая инструментальная ценность, которая связана с терминальной ценностью человеческой жизни и человеческого счастья. А у человека, который защищает право на ношение оружия, это право может быть связано с более высокой инструментальной ценностью «уменьшение числа преступлений», а также с ценностью «свободы», которая может быть терминальной ценностью или ещё одной инструментальной ценностью…

Мы не в состоянии распечатать полную «сеть», как одни наши ценности выводятся из других ценностей. Скорее всего, мы даже не помним всю историю, откуда эти ценности взялись. Часто мы можем это понять, размышляя над правильными моральными дилеммами: «Сделаете ли вы Х в случае Y?» Но если вы всерьёз захотите понять, какие у вас терминальные ценности, на вашем пути встретится множество ловушек: запутывающих дилемм и сомнительных философских аргументов. Мы не знаем свои ценности и откуда они взялись. Мы можем это узнать лишь копаясь в наших процессах познания, а при этом мы обязательно будем ошибаться. Довольно сложно даже просто научиться сознательно различать понятия «терминальные ценности» и «инструментальные ценности», отслеживать, что они значат, и использовать их правильно. Только исследуя наш простой формализм мы можем понять, как это теоретически просто могло бы быть.

И я здесь ещё не касаюсь сложностей, связанных с человеческой системой вознаграждения — наших механизмов подкрепления. Есть шоколад приятно, предвкушать поедание шоколада приятно, но это разные случаи приятности…

Однако я не слишком горюю из-за всех этих сложностей.

Не знать собственные ценности — не всегда забавно. Но уж точно не скучно.

  • 1. Автор здесь ссылается на текст Робина Хансона «Expert At Versus Expert On». — Прим.перев.
Перевод: 
Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
148
Оцените качество перевода: 
Средняя оценка: 4.7 (12 votes)

Дырявые обобщения

Элиезер Юдковский

Съедобны ли яблоки? Обычно да, но некоторые яблоки гнилые.

Сколько у людей пальцев? Обычно десять, однако многие люди пальцы теряли, а их всё равно считали людьми.

Практически любое обобщение в реальном мире окажется «дырявым»1. Единственный способ этого избежать — спуститься на уровень, который гораздо ниже макроскопических объектов. Ниже сообществ, людей, пальцев, тканей, клеток. На уровне частиц и полей законы и впрямь универсальны.

(Впрочем, возможно, есть некоторые исключения…)

В обычной жизни дырявые обобщения нужно просто как-то учитывать. Если вы идёте за печеньем в кондитерскую, которая почти всегда работает до 10 вечера, кроме дня благодарения, когда она работает до 6 вечера, а сегодня внезапно как раз день геноцида коренных американцев, то лучше бы дойти до неё до шести, иначе не будет вам печенья.

Нам сложно иметь дело с дырявыми обобщениями из-за нашего стремления к однозначности 2. Хочется раз и навсегда сказать, что у людей десять пальцев, и мы огорчаемся, когда приходится мириться с неоднозначными ситуациями.

Когда ставки растут, стремление к однозначности часто растёт следом. И из-за этого мы отказываемся разбираться в сложном вопросе именно тогда, когда это нужно больше всего.

Даже если бы мы всегда хотели чего-то простого (а это не так), жизнь была бы сложна. Дырявость дырявых обобщений при решении вопроса, что делать дальше, проистекала бы из-за дырявой структуры реального мира. Это можно сформулировать иначе:

У инструментальных ценностей часто нет компактного локального описания.

Представим ящик с миллионом долларов. Ящик закрыт, но не обычным кодовым замком, а с помощью механизма, управляемого дюжиной клавиш. Если вы понимаете, как работает механизм, то вы сможете подобрать последовательность клавиш и открыть ящик. Причём ящик открывается не единственной последовательностью, а неверная последовательность сожжёт деньги. Если вы ничего не знаете о механизме, то простые правила вроде «нажатие любой кнопки три раза откроет ящик» или «нажатие пяти разных кнопок без повторений сожжёт деньги» вам не помогут.

Существует компактное нелокальное описание последовательности клавиш: нажать те клавиши, которые откроют ящик. Написать компактную программу, которая определит правильные и неправильные последовательности, можно, но эта программа должна описывать механизм, а не сами клавиши.

Аналогично, существует локальное, но не компактное описание последовательности клавиш: колоссальная таблица с результатами для каждого возможного сочетания клавиш. Это очень большая компьютерная программа и в ней не упоминается ничего, кроме клавиш.

При этом невозможно коротко, используя только язык клавиш, описать, какие последовательности окажутся хорошими, плохими или нейтральными.

Хуже того, могут обнаружиться заманчивые обобщения, которые окажутся дырявыми. Например, представим, что для большинства клавиш нажатие их три раза подряд открывает ящик, но существует клавиша, любое нажатие на которую сжигает деньги. Вы можете решить, что нашли идеальное обобщение — компактно описанный класс последовательность, который всегда открывает ящик — а окажется, что вы не учли какие-то варианты работы машины или значимость неких побочных эффектов.

В данном примере механизм — это метафора для сложности реального мира. Открытие ящика (что хорошо) и сжигание денег (что плохо) представляют собой тысячи осколков желаний, из которых состоят наши терминальные ценности. Клавиши олицетворяют собой доступные нам действия, стратегии и правила.

Если задуматься, сколько существует способов оценить исходы и насколько сложны пути, ведущие к ним, удивительно, что вообще существует какие-либо этические рекомендации. (Из которых наиболее странной, но при этом полезной является «цель не оправдывает средства»)

И наоборот, сложность действий не обязательно свидетельствует о сложности цели. Часто встречаются люди, которые мудро улыбаются и приговаривают: «Ну, мораль — это сложная штука. Знаете ли, женское обрезание может быть правильным в одной культуре и неправильным в другой, да и вообще, пытать людей не всегда плохо. Если вы думаете, что существуют простые правила, вы довольно наивны и слишком сильно стремитесь к однозначности».

Можно заявить прямо и безусловно, что любое убийство имеет отрицательную полезность. Да, даже убийство Гитлера. Это не означает, что не стоит убивать Гитлера. Это означает, что общая полезность убийства Гитлера складывается из огромной отрицательной полезности его смерти и гораздо большей положительной полезности всех спасенных жизней.

Многие люди совершают ошибку, о которой я предупреждал в эссе «Ценности терминальные и инструментальные»: они думают, что если результирующая ожидаемая полезность последствий смерти Гитлера оказывается положительной, то мгновенная локальная терминальная полезность его смерти также является положительной. А это, в свою очередь, означает, что принцип «смерть — это всегда плохо» оказывается дырявым обобщением. Ошибка здесь в том, что полезность учитывается дважды. От ожидаемой полезности вы опять возвращаетесь к полезности, хотя рассуждения должны идти от полезности к ожидаемой полезности.

Впрочем, возможно, люди просто стремятся к односторонним политическим спорам. У лучших правил не должно быть недостатков.

В рамках моей моральной философии локальная полезность смерти Гитлера постоянна и отрицательна, независимо от внешних последствий и, соответственно, ожидаемой полезности.

Разумеется, можно составить моральный аргумент, будто наказывать злых людей — даже применять смертную казнь для достаточно злых людей — есть добро. Однако такой аргумент нельзя подкрепить тем, что, застрелив человека, направившего на кого-то оружие, мы, возможно, спасаем другие жизни. Ведь это апелляция к ценности жизни, а не ценности смерти. Даже если ожидаемые полезности запутанные и дырявые, это ещё не означает, что сами полезности — тоже запутанные и дырявые. Они могут быть таковыми! Но это уже другой разговор.

  • 1. Юдковский здесь использует отсылку к термину «leaky abstraction», который на русский язык обычно переводят как «дырявые абстракции». — Прим.перев.
  • 2. В оригинале используется термин «closure». Часто его переводят как «завершённость». – Прим. перев.
Перевод: 
sepremento, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
149
Оцените качество перевода: 
Средняя оценка: 4.7 (7 votes)

Скрытая сложность желаний

Элиезер Юдковский

Я желаю обитать в выбранном мною месте, обладать физически здоровой, целой и очевидно нормальной версией моего настоящего тела, содержащей моё текущее состояние сознания. Это тело будет исцеляться от любых повреждений со скоростью большей на три сигма от средней, учитывая доступные медицинские технологии, а также будет защищено от любых болезней и травм, инвалидности, боли или потери функций любого органа на более чем десять дней подряд или пятнадцати дней в сумме за год…

Открытый проект «Желание», Желание бессмертия 1.1

Существует три вида джиннов: джинны, которых можно попросить «сделай то, что я должен пожелать», джинны, которых опасно просить о чём угодно, и джинны, которые не слишком могучи или не слишком разумны.

Представьте, что ваша пожилая мать находится в горящем доме, а вы прикованы к инвалидной коляске и не можете ей помочь. Вы можете кричать: «Вытащите мою маму из этого дома!», но вас никто не услышит.

Однако вам повезло: у вас в кармане лежит помпа исходов. Это полезное устройство сжимает поток времени, перекачивая вероятности из одних исходов в другие.

Помпа исходов не разумна. В ней содержится крохотная машина времени, которая перезапускает течение времени до тех пор, пока не происходит требуемое событие. Например, если бы вы подключили помпу исходов к монетке, указали бы в условиях перезапуск хода времени всегда, когда монетка выпадает решкой, а затем подбросили бы монетку, то вы бы увидели орла. (Физики скажут, что любое будущее, в котором происходит «перезапуск» будет противоречивым и, следовательно, не наступит, и поэтому вы не убиваете какие-либо версии самого себя.)

Какое бы условие вы не поставили помпе исходов, оно реализуется, не нарушая при этом законов физики. Если вы попробуете составить событие, наступление которого слишком маловероятно, то машина времени сломается до наступления этого события.

Также можно перенаправлять вероятностный поток более тонко, используя «функцию будущего» для масштабирования вероятности перезапуска времени для каждого из исходов. Если вероятность перезапуска 99% для орла и 1% для решки, то шансы упадут с 1:1 до 99:1 в пользу решки. Представим, что вы нашли загадочную машину, выплёвывающую деньги и хотите максимизировать их количество. В этом случае стоит изменить вероятности перезапуска так, чтобы они уменьшались в случае увеличения количества денег. Например, для выплюнутых 10 долларов назначить вероятность перезапуска 99,999999%, а для 100 долларов — 99,99999%. В итоге вы получите исход, стремящийся к наивысшему возможному значению в функции будущего, даже не зная, какой максимум допустим.

И вот вы в отчаянии выхватываете из кармана Помпу исходов — ваша мать всё ещё в горящем доме, помните? — и пытаетесь описать свою цель: вытащить мать из этого дома!

Пользовательский интерфейс помпы не понимает человеческого языка. Она же не разумна, помните? Но внутри есть 3D сканеры ближайшей местности и встроенные приложения для распознавания образов. Вот вы достаёте фото вашей матери по плечи, определяете положение её тела (а не только головы и плеч) и определяете функцию будущего через расстояние до центра дома. Чем больше это расстояние, тем меньше вероятность перезапуска машины времени. Крикнув на удачу «вытащи мою маму из этого дома!», вы нажимаете «Enter».

Мгновение ничего не происходит. Вы оглядываетесь в надежде увидеть подъезжающую пожарную машину или спасателей, или, в крайнем случае, быстрого сильного спортсмена, который вытащит вашу мать из здания…

Ба-бах! Под зданием с оглушительным грохотом взрывается газовая труба. Словно в замедленном повторе вы видите, как дом разваливается, и замечаете, как тело вашей матери поднимается в воздух и быстро удаляется от того, что раньше было центром дома.

На помпе исходов есть кнопка экстренного сожаления. По нажатию этой кнопки всем функциям будущего автоматически присваиваются большие по модулю отрицательные значения. Вероятность перезапуска времени оказывается близкой к единице, поэтому крайне маловероятно, что пользователь когда-либо будет опечален результатом работы помпы настолько, что нажмёт эту кнопку. Вы не помните ни одного случая, чтобы её приходилось нажать. И вот вы только тянетесь к ней (на что она теперь годится?), как с неба падает пылающее бревно и убивает вас.

Вряд ли вы заказывали именно это, но в указанной функции будущего очень вероятен именно такой исход.

Помпа исходов — это джинн второго типа. Ни одно желание не является безопасным.

Если вас попросят вытащить чью-то пожилую мать из горящего здания, вы можете помочь, а можете притвориться глухим. Но вам не придёт в голову это здание взорвать. «Вытащи мою маму из этого дома» звучит безопасно, поскольку планы, содержащие негативные последствия, даже не рассматриваются.

Вспомним трагедию группового отбора. Некоторые биологи раньше предполагали, что групповой отбор, способствующий уменьшению популяции, приведёт к индивидуальному ограничению спариваний. При лабораторном эксперименте же оказалось, что такой групповой отбор приводил к каннибализму, причём в первую очередь поедались неполовозрелые самки. Задним числом очевидно, что отбор происходит по признаку малого размера популяции, то каннибалы к нему приспособятся лучше, чем особи, добровольно отказывающиеся от репродуктивных возможностей. Однако поедание маленьких девочек было столь неприемлемо для Винна-Эдвардса, Алле, Бреретона и других сторонников группового отбора, что они просто о нём не подумали. Они видели лишь решения, которые использовали бы сами.

Предположим, мы попробуем исправить функцию будущего, уточнив, что помпе исходов не следует взрывать дом: те исходы, в которых куски здания будут распределены по слишком большому объёму, получат вероятность перезапуска времени примерно равную единице.

Поэтому ваша мать падает со второго этажа и ломает себе шею. Помпа исходов выбрала иной путь, формально точный, но он всё равно привёл к нежелательному результату. И опять это оказался путь, который никогда не выбрал бы человек.

Если бы открытый проект «Желание» разрабатывал желание по спасению матерей из горящих домов:

Я желаю переместить мою мать (определяемую как женщину, разделяющую половину моих генов и родившую меня) из границ ближайшего ко мне на данный момент горящего здания и при этом не использовать взрыв здания, не использовать падение стен здания, ведущее, в свою очередь, к исчезновению его границ, не использовать сценарий с пожарным, вытаскивающим тело моей матери из прогоревшего здания…

Все эти особые случай, кажущееся бесконечным число патчей программы, напоминают притчу об «искусственном сложении»: попытке написать арифметическую экспертную систему через явное перечисление высказываний вида «пятнадцать плюс пятнадцать равняется тридцати, но пятнадцать плюс шестнадцать равняется тридцати одному».

Как исключить исход, в котором здание взрывается и выбрасывает тело вашей матери в небо? Вы пытаетесь представить будущее, прогнозируете, что в таком случае она будет мертва, а вы не хотите подобных последствий и потому запрещаете события, ведущие к ним.

В вашем мозге не существует встроенных утверждений вида «взрыв горящего здания с моей матерью внутри — плохая идея». И всё же при этом вы пытаетесь явным образом встроить такое конкретное условие в функцию будущего помпы исходов. Из-за этого желание разрастается, превращаясь в гигантскую справочную таблицу с человеческими суждениями по каждой возможной траектории событий.

Вы просили не того, что хотели. Вы хотели, чтобы ваша мать выжила, а просили переместить её от центра здания.

Правда, это не всё, что вы хотели. Если бы её спасли из пожара со значительными ожогами, такой исход находился бы значительно ниже в вашем списке предпочтений по сравнению со спасением в целости и сохранности. А это значит, что вы цените не только её жизнь, но и здоровье.

А помимо её телесного здоровья вы цените ещё и психическое. Спастись и получить при этом психологическую травму — предположим, с рёвом из ниоткуда появится гигантский фиолетовый монстр и вытащит её — менее предпочтительно, чем если её по безопасному пути выведет пожарный. (Да, мы договорились не нарушать законов физики, но будем считать, что помпа исходов достаточно могущественна и рядом случайно окажется инопланетянин.) При этом, разумеется, появление монстра-спасителя предпочтительнее, чем сгореть заживо.

А что насчёт внезапно открывшейся червоточины, переносящей её на необитаемый остров? Такой исход гораздо лучше смерти, но хуже, чем быть живой, здоровой, без психологической травмы и разлуки с родными и прочим привычным кругом общения.

А будет ли приемлемым спасти мать ценой жизни любимой собаки, которая бросилась дать сигнал пожарным, но была впоследствии сбита машиной? Определенно да, но при всех прочих равных лучше избежать смерти собаки. Не хотелось бы обменивать жизни людей одну на другую, но что насчёт жизни осужденного за убийство? Будет ли иметь значение, если убийца погибнет, пытаясь спасти её по доброте душевной? А что насчёт двух убийц? Стоит ли жизнь вашей матери, например, разрушения всех существующих копий, включая воспоминания, «Малой органной фуги соль-минор» Баха? А если бы оказалось, что у неё смертельное заболевание и в течение 18 месяцев она всё равно умрёт?

Если часть перекрытия повредит стопу, будет ли приемлемо спасать всё остальное тело? А если голова повреждена, но тело нет? А что если всё тело раздавлено и только голова цела? Что если рядом ждёт команда криоников, готовая спасти голову? Замороженная голова — это личность? А Терри Шайво? Какова ценность жизни шимпанзе?

Мозг не бесконечно сложен: сложность по Колмогорову или иначе длина сообщения, достаточная для описания всех возможных суждений, конечна. Но конечность такой сложности не означает, что она мала. Мы ценим очень многое, и, нет, наши предпочтения не сводятся только лишь к счастью или к репродуктивной приспособленности.

Не существует безопасного желания, которое бы оказалось меньше всей полноты человеческой морали. Во времени слишком много возможных путей. Невозможно представить все траектории до пункта назначения, который вы описали джинну. «Максимизировать расстояние между моей матерью и центром здания» можно очень эффективно при помощи взрыва атомной бомбы. Или, если джинн достаточно силён, можно вообще удалить её тело за пределы Солнечной Системы. А если джинн ещё и достаточно разумен, то он может сделать нечто, о чём ни вы, ни я не смогли бы помыслить, точно также, как шимпанзе не смог бы помыслить о взрыве атомной бомбы. Нельзя создать программу, играющую в шахматы, записав в неё все возможные шахматные позиции. И аналогично нельзя представить все пути сквозь время.

Жизнь гораздо сложнее шахмат. Невозможно предсказать заранее, какие именно ценности окажутся для вас важными на траектории, выбранной джинном. Особенно в отношении желаний более долгосрочных или более глобальных, чем спасение матери из горящего здания.

Боюсь, открытый проект «Желание» обречен на провал. Его можно использовать лишь в качестве иллюстрации, как не стоит думать о задачах джиннам. Безопасным будет только джинн, разделяющий все ваши критерии суждения, и ему можно сказать «сделай то, чего мне стоит пожелать». Это просто-напросто запустит функцию «должен» джинна.

Этих слов должно оказаться достаточно. Чтобы джинн оказался безопасным исполнителем желаний, он должен разделять все ценности, которые привели вас к составлению желания. В противном случае, джинн может выбрать траекторию сквозь время, которая не приведёт к задуманной вами точке назначения или реализует план с ужасными побочными эффектами, которые вам даже не придут в голову. Желания — это дырявые обобщения, сделанными из гигантской, но всё же конечной структуры — всей вашей морали. Только определив эту структуру целиком можно избавиться от всех дыр.

А с безопасным джинном желания становятся избыточными. Вам остаётся лишь запустить его.

Перевод: 
sepremento, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
150
Оцените качество перевода: 
Средняя оценка: 4.9 (11 votes)

Антропоморфный оптимизм

Элиезер Юдковский

Антропоморфизм, в сущности, — это ожидание, что мы сможем предсказать поведение чего-то с помощью чёрного ящика в виде нашего мозга, при том, что причинно-следственная структура рассматриваемого объекта или явления отличается от человеческого мозга настолько, что такое ожидание неоправданно.

Я уже писал о трагедии группового отбора. Биологи до 1966 года считали, что хищники добровольно ограничат частоту спариваний, чтобы избежать перенаселения и истощения популяции своей добычи. Позже, когда Майкл Уэйд воссоздал в лаборатории условия, максимально подходящие для реализации группового отбора, взрослые особи в качестве адаптации стали каннибалами: принялись поедать яйца и личинки, особенно личинки самок.1

Почему же сторонники группового отбора не подумали о такой возможности?

Предположим, вы живёте в племени и знаете, что скоро ваше племя столкнётся с нехваткой ресурсов. В качестве решения вы можете предложить сократить рождаемость: пусть никакая пара не заводит больше одного ребёнка. Но вам даже в голову не придёт идея: «Давайте мы все будем заводить столько детей, сколько сможем, а потом начнём охотиться на чужих детей — особенно девочек — и поедать их».

Задумайтесь о порядке предпочтительности решений по отношению к вашим целям. Вы бы хотели, чтобы итоговое решение оказалось как можно выше в этом списке. Как вы его найдёте? Разумеется, при помощи мозга! Считайте мозг генератором высокоранговых решений, неким поисковым процессом, производящим решения, оказывающиеся на верхних строчках порядка предпочтений.

Пространство решений задач реального мира в общем случае огромно, а потому мозгу необходимо быть эффективным и отбрасывать без обдумывания подавляющее большинство низкоранговых решений.

Если вашему племени грозит недостаток ресурсов, можно попытаться прыгать на одной ноге или пожёвывать пальцы на ноге. Такие «решения», естественно, не сработают и, очевидно, приведут к большим потерям, но мозг эффективен и даже не тратит время на формирование столь плохих решений. В поисках высокоранговых решений он мгновенно перемещается к участкам пространства решений вроде: «Собираемся все вместе и соглашаемся не заводить более одного ребёнка на семью, пока трудные времена не пройдут».

Решения вида «завести как можно больше детей, а потом съесть девочек» такой поисковый процесс создавать не будет.

Однако варианты не являются «плохими» или «хорошими» сами по себе. Как «плохие» или «хорошие» их оценивает оптимизационный процесс во время выбора. Другой оптимизационный процесс может их оценить по-другому.

С точки зрения эволюции очевидным решением будет отобрать особей, которые оставят максимум потомства, а затем съедят чужих дочерей. И наоборот, смешно отобрать особей, которые добровольно ограничивают воспроизводство ради группы. Говоря менее атропоморфно, первый набор аллелей быстро заменит второй в популяции. (У естественного отбора в этом случае нет очевидного порядка поиска - обе альтернативы появляются одновременно в виде мутаций)

Допустим, какой-то биолог говорит: «На месте эволюции я бы сконструировал популяцию хищников, где каждая особь добровольно ограничивает частоту спариваний, если ресурсы ограничены». Это полноценный антропоморфизм, с прозрачным и понятным рассуждением: «Я бы так сделал, следовательно, я делаю вывод, что эволюция сделает так же».

В своей работе я часто сталкиваюсь с этим искажением в явном виде. Однако, что если возразить: «ИИ не обязательно будет работать так, как ты»? Что если сказать нашему воображаемому биологу: «Эволюция рассуждает не так, как ты»? Что мы услышим в ответ? Мы точно не услышим: «Ой! Об этом я не подумал! Один из шагов моего рассуждения был неверным, поэтому я откажусь от вывода и начну заново».

Напротив, мы услышим о причинах, почему ИИ должен рассуждать именно так, как и собеседник. Или почему естественный отбор, у которого абсолютно иные критерии и методы оптимизации, должен делать именно то, что кажется хорошей идеей человеку.

Отсюда появляются мысли, что групповой отбор поможет популяциям хищников, где особи добровольно отказываются от репродуктивных возможностей.

Сторонники группового отбора ошиблись в своих предсказаниях столь же сильно, как ошибся бы человек, явно уверенный в антропоморфности эволюции. Конечные выводы оказались такими же, как если бы они сразу предполагали у эволюции человеческое мышление. Они стёрли всё, кроме нижней строчки своих рассуждений, оставили эту самую нижнюю строчку и сверху вписали рационализацию. Теперь ошибочное мышление скрыто, очевидно неверный этап в рассуждениях спрятан. Хотя вывод остался тем же самым. Абсолютно неверным в реальном мире.

Но почему какие-то учёные вообще до такого доходят? Ведь в конце концов, данные опровергли теорию группового отбора и её сторонники оказались в неловком положении.

Как я уже упоминал в «Фальшивом критерии оптимизации», судя по всему, у нас, людей, выработался инстинкт доказывать правильность предпочитаемой нами политики для практически любых критериев оптимизации. Политика была неотъемлемой частью среды обитания наших предков. Мы произошли от тех особей, которые наиболее убедительно доказывали, что не только их личные интересы, но и интересы всего племени, требуют убийства Углака, их заклятого врага. Уж точно мы не произошли от Углака, который не смог доказать, что этический кодекс племени, не говоря уж о его собственных интересах, требует его пощадить.

А поскольку убедительнее всего мы отстаиваем позиции, в которые искренне верим, у нас развился инстинкт искренне верить, что цели других людей и моральный кодекс нашего племени должен требовать поступать по-нашему ради их же блага.

Поэтому сторонники группового отбора, представив себе прекрасную картину хищников с ограничениями в спаривании, инстинктивно рационализировали причины естественному отбору вести себя так, как они считают правильным, причем в соответствии с его собственными целями. Лисы будут гораздо более приспособленными, если ограничат рождаемость! Нет, правда! Они даже смогут оставить больше генов, чем лисы, которые не ограничивают своё потомство! Честно-честно!

Однако убедить естественный отбор поступать так же, как вы затруднительно: у эволюции нет элементов, которых заботят ваши доводы. Эволюция не похожа на вас, у неё нет ничего, что могло бы вас выслушать и принять во внимание ваши дотошные объяснения, почему ей стоит вести себя так, как вам нравится. Человеческие аргументы никак не соответствуют внутренней структуре естественного отбора как оптимизационного процесса, ведь они не участвуют так в распространении аллелей, как они участвуют в причинно-следственных отношениях человеческой политики.

В итоге сторонники группового отбора не смогли убедить эволюцию поступать по-своему. Реальность просто посадила их в лужу.

На этом месте я рекомендую подумать про недружественный ИИ.

Можно сделать обобщение: проблема в оптимистичных суждениях в целом. Ведь что есть оптимизм? Вы располагаете возможные исходы в некотором порядке в соответствии с вашими предпочтениями, выбираете лучший исход, и почему-то он совпадает с вашим предсказанием. Какие именно хитрые рационализации при этом используются, вероятно, не так уж важно, как можно было бы подумать. Однако Природа или любой другой процесс не расставляет исходы согласно вашим предпочтениям и не выбирает наилучший в соответствии с ними. Поэтому у мозга не получается синхронизироваться с окружением и предсказание не совпадает с реальностью.

  • 1. Wade, “Group selections among laboratory populations of Tribolium.”
Перевод: 
sepremento, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
151
Оцените качество перевода: 
Средняя оценка: 4.6 (10 votes)

Потерянные цели

Элиезер Юдковский

То ли в детском саду, то ли в первом классе мне впервые сказали помолиться и дали молитву на иврите, записанную латиницей. Я спросил, что означают эти слова. Мне ответили, что если молиться на иврите, можно не знать значения слов, молитва всё равно сработает.

Мой разрыв с иудаизмом начался именно с этого.

Прямо сейчас, когда вы читаете эти строки, какой-нибудь студент сидит за партой в университете и старательно изучает материал, который ему сам по себе не интересен и который, по его мнению, ему никогда не пригодится. Студенту нужна высокооплачиваемая работа, а для неё требуется «корочка», а для получения «корочки» требуется степень магистра, а до степени магистра нужно получить степень бакалавра, а университет, который предлагает степень бакалавра, требует, чтобы для её получения вы посетили занятия по узорам вязания двенадцатого века. И студент прилежно изучает эти узоры. Он планирует забыть про них сразу же после сдачи экзамена, но тем не менее всерьёз возится с ними, потому что ему очень нужна «корочка».

Я уверен, что вы и сами оказывались в такой ситуации. Возможно, даже понимая её сумасшествие. Ведь у вас не было выбора, верно? Недавнее исследование в Сан-Франциско показало, что 80% учителей в начальной школе тратят меньше одного часа в неделю на науку. 16% заявило, что они совсем не уделяют время науке. Почему? Насколько я могу судить, в этом виноват акт «No Child Left Behind» и другие ему подобные законодательные инициативы1. Практически всё время уроков теперь уходит на подготовку к обязательным тестам федерального уровня или уровня штата. Кажется, где-то утверждалось (хотя сейчас я не могу найти источник), что в какой-то школе на одно лишь проведение обязательных тестов уходило 40% времени уроков.

Своим стремлением заботиться о внешних проявлениях, а не о сути, славилась советская бюрократия. Одна обувная фабрика перевыполнила план, произведя много обуви маленького размера. Другая фабрика отчиталась о раскроенной, но не сшитой коже, как об «обуви». Настоящие результаты начальство не интересовали, ведь ему тоже нужно было лишь доложить о перевыполнении планов. Что наверняка радовало товарищей, у которых мёрзли ноги.

Несколько разных источников уже утверждают, что большая часть публикуемых медицинских исследований неверны, несмотря на «статистическую значимость p < 0,05». Но зачем кому-то ставить себе более высокую планку, если p < 0,05 — единственный критерий для публикации? Ведь это потребует больших грантов на исследования и больших размеров выборок, а также уменьшит шансы на публикацию. Всем же известно, что смысл существования науки — опубликовать как можно больше статей. Точно так же, как смысл существования университетов — печатать кусочки бумаги определённого вида, а смысл существования школ — проходить обязательные тесты, позволяющие получить большее финансирование. Не вы устанавливаете правила. Если вы попробуете играть по другим, вы проиграете.

(Впрочем, почему-то научные журналы по физике требуют p < 0,0001. Словно они считают, будто у них есть какой-то иной смысл существования, кроме публикации научных статей по физике.)

В супермаркете есть шоколад, туда можно попасть на машине, в машину нужно попасть, для этого нужно открыть дверь, а для этого нужны ключи. Если вы узнаете, что в супермаркете шоколада нет, вы не будете стоять около машины и хлопать дверью просто потому, что так надо. По-моему, люди редко теряют нить ими же придуманных планов.

Когда стимулы проходят через крупные организации или, что ещё хуже, через множество организаций и групп интересов, часть из которых правительственные, получается совсем по-другому. Иногда в результате получается такое поведение, что спланируй его какой-то один человек, то этого человека объявили бы безумным. Кому-нибудь платят каждый раз, когда он открывает дверь машины, поскольку именно это является измеряемой метрикой, и этому человеку наплевать, заплатят ли водителю за прибытие в супермаркет, и уж тем более наплевать, купит ли покупатель шоколад и будет ли потребитель счастлив или умрёт с голода.

С точки зрения байесианства, подзадачи — это эпифеномен для функции условных вероятностей. Ожидаемой полезности без полезности не бывает. Очень глупо считать, что инструментальная ценность может начать жить своей жизнью, а терминальная ценность — отмереть за ненадобностью. Это неразумно по меркам разумности теории принятия решений.

Рассмотрим закон «No Child Left Behind». Политики хотели создать впечатление, будто они занимаются проблемами образования. Они изображали бурную деятельность, чтобы повлиять на избирателей в текущем году, а не пятнадцать лет спустя, когда сегодняшние дети будут искать работу. Политики не являются потребителями образовательных услуг. Бюрократы обязаны продемонстрировать развитие, а это значит, что они заинтересованы в развитии, которое можно измерить именно в этом году. Это не они в конечном итоге ничего не узнают о науке. Издательства, выпускающие учебники, и школьные комитеты, которые эти учебники покупают, не будут скучать за партами.

Настоящие потребители знаний — это дети. А они не могут платить, не могут голосовать, не могут заседать в комитетах. Родители о них заботятся, но они не сидят в классах, они лишь выбирают политиков на основании созданных теми образов «борцов за образование». Политики слишком заняты вопросом последующего переизбрания и не изучают данные самостоятельно, поэтому они полагаются на поверхностные сведения от бюрократов и комиссий. Это помогает создать образ заботы о детях, но детям от этого лучше не становится. Бюрократы не используют учебники, поэтому им плевать, что их невозможно читать, важно, чтобы процесс покупки учебников хорошо выглядел со стороны. У издателей нет стимула выпускать плохие учебники, но им известно, что школьные комитеты сравнивают учебники на основании количества тем для занятий, а комитет четвертого класса не связан с комитетом третьего, поэтому издатели впихивают в каждый учебник как можно больше разных тем. Учитель со своим классом не проходит и четверти учебника до конца года, поэтому на следующий год другой учитель начинает всё заново. Учителя могут жаловаться, однако решения принимают не они и вообще не их будущее стоит на кону, что в свою очередь влияет на желание прикладывать усилия, за которые всё равно не заплатят.

Если рассмотреть ситуацию с такого ракурса, задуматься обо всей потерянной информации и всех потерянных стимулах, становится даже удивительно, что от исходной цели — получения знаний — остаётся хоть что-то. Впрочем, судя по всему, большинство образовательных систем сейчас скатываются в состояние, которое не намного лучше, чем ничего.

Хотите решить проблему по-настоящему? Заставьте политиков ходить в школу.

Один человек способен отследить, как будет меняться вероятностная ожидаемая полезность в зависимости от условий, связанных со множеством промежуточных событий. Он может учесть нелокальные зависимости, где ожидаемая полезность открытия двери автомобиля зависит от наличия шоколада в супермаркете. Однако организации сегодня вознаграждают только за то, что измеримо сегодня, за то, что можно записать в контракте сегодня, а это означает измерение промежуточных событий, а не их долгосрочных последствий. И эти промежуточные измерения являются дырявыми обобщениями — зачастую очень дырявыми. Бюрократы это джинны, которым нельзя доверять, ведь они не разделяют ценностей желающего.

Миямото Мусаси сказал:2

Помни, когда в твоих руках меч — ты должен поразить противника, чего бы тебе это ни стоило. Когда ты парируешь удар, наносишь его, делаешь выпад, отбиваешь клинок или касаешься атакующего меча противника, ты должен сразить противника тем же движением. Достигай цели. Если ты будешь думать только о блокировании ударов, выпадах и касаниях, ты не сможешь действительно достать врага. Более, чем о чем бы то ни было, ты должен беспокоиться о том, как провести свой удар сквозь его защиту и достичь цели. Тщательно изучи сказанное.

(Хотел бы я жить в эпоху, когда можно сказать читателям тщательно что-то изучить и никого при этом не оскорбить.)

Каким образом кто-нибудь может забыть о своей цели в поединке на мечах? Например, он мог учиться сражаться у кого-то другого, искусство не появилось у него изнутри, и он не понимает причин, почему в такой-то ситуации ему нужно парировать, а в другой — делать выпад. Он не понимает, когда у правил появляются исключения, когда привычный метод не работает.

Искусство эпистемической рациональности немыслимо без понимания, как каждое правило приближает нас к истине в соответствии с теорией вероятности. Суть практической рациональности — теория решений — в том, чтобы всегда видеть, как ожидаемая полезность приводит к полезности. Тщательно изучи сказанное.

К. Дж. Черри однажды сказала:3

Нет клинка у твоего меча. У него есть лишь твоя цель. Потерял цель — остался безоружным.

Я видел множество людей, забывавших о цели, когда они формулировали желание воображаемому ИИ-джинну. Они представляли желание за желанием, и они не видели в своих желаниях ничего плохого. Некоторые из желаний сопровождались множеством уточнений, другие формулировались вовсе без каких-либо предосторожностей. Эти люди не выходили на мета-уровень. Они не сверялись инстинктивно с целью, у них не было того инстинкта, что заставил меня в пять лет свернуть на дорогу атеизма. Они не задумывались над вопросом: «Почему это желание кажется мне хорошим? А джинн тоже будет так считать?» Они не видели, откуда берётся их суждение, они слишком увлекались самим суждением. Они не следили за мячом — они знали, что мяч отскочил от пола, но не обращали внимание, в каком именно месте он отскочил. Они не думали о критериях, которые породили их суждение.

Похожим образом некоторые люди не замечают, как предположительно эгоистичные люди предлагают альтруистичные аргументы в пользу эгоизма, а предположительно альтруистичные люди – эгоистичные аргументы в пользу альтруизма.

Люди прекрасно отслеживают свои цели по дороге в супермаркет: когда весь процесс находится у них в голове и им не мешают ни бюрократы, ни джинны, ни философия. Проблема в том, что цивилизация гораздо сложнее. Десятки организаций и десятки лет разделяют скучающего ребёнка в классе и выпускника колледжа, который не справляется со своей работой (Заметит ли менеджер или кадровик, что выпускник колледжа прекрасно умеет выглядеть занятым?) С каждым новым звеном цепи между действием и последствием появляется возможность сбиться с настоящей цели. С каждым промежуточным звеном теряется информация, теряются стимулы. А большинство людей беспокоятся из-за этого гораздо меньше, чем я. Почему все мои одноклассники с готовностью читали молитвы, не зная их смысла? У них не было моего инстинкта искать причину.

Можно ли научить не спускать глаз с мяча? Удерживать намерение и не позволять ему сбиваться? Никогда не делать выпада, удара или касания без понимания главной цели? При прочих равных условиях люди зачастую хотят лишь делать свою работу. Может ли вообще существовать здравомыслящая корпорация? Здравомыслящая цивилизация? Пока это лишь далёкая мечта, но именно к ней я стремлюсь, когда пишу все эти эссе про поток намерений (также известных как ожидаемая полезность или инструментальные ценности) без потери цели (полезности или терминальной ценности). Могут ли люди научиться чувствовать поток от целей-«родителей» к целям-«детям»? Осознанно понимать разницу между ожидаемой полезностью и полезностью?

Думаете ли вы об угрозах вашей цивилизации? Худшая мета-угроза цивилизации — её собственная сложность. Усложнение ведёт к потере множества целей.

Я оглядываюсь назад и понимаю, что сильнее всего мною в жизни двигало отвращение к потерянным целям. Надеюсь, это отвращение можно превратить в тренируемый навык.

  • 1. «No Child Left Behind» (буквально: «ни один ребёнок не окажется отстающим») — федеральный закон США в области образования, принятый в 2001 году. Одним из его требований было проведение достаточно большого количества тестов для отслеживания прогресса детей. В 2015 году был отменён. — Прим.перев.
  • 2. Миямото Мусаси, «Книга пяти колец». Автор ссылается на издание Miyamoto Musashi, Book of Five Rings (New Line Publishing, 2003). Перевод цитируется по тексту на lib.ru, к сожалению, переводчик там не указан. — Прим.перев.
  • 3. Кэролайн Черри, «Паладин». Автор ссылается на издание Carolyn J. Cherryh, The Paladin (Baen, 2002). На русский язык переводилась только в самиздате.
Перевод: 
sepremento, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
152
Оцените качество перевода: 
Средняя оценка: 4.8 (16 votes)

Как люди понимают слова

Цепочка о том, как люди пользуются словами и как они при этом ошибаются. О том, почему нельзя просто взять и определить слово так, как хочется. О том, как наши мозги, судя по всему, обрабатывают определения.

Ориентироваться по цепочке можно по эссе Когда слова могут быть ошибочны.

Автор: 
Элиезер Юдковский

Притча о кинжале

Элиезер Юдковский

Когда-то давно жил в одном дворце придворный шут, который баловался логикой. И вот однажды шут принес королю две шкатулки.

На крышке первой было написано: «Либо в этой шкатулке сидит свирепая лягушка, либо в шкатулке с ложной надписью сидит свирепая лягушка, но не то и другое одновременно».

На крышке второй было написано: «Либо в этой шкатулке лежит золото, а в шкатулке с ложной надписью сидит свирепая лягушка, либо в этой шкатулке сидит свирепая лягушка, а в шкатулке с истинной надписью лежит золото».

И шут сказал королю:

— В одной шкатулке сидит свирепая лягушка, в другой лежит золото; одна и только одна из надписей истинна.

Король открыл неправильную шкатулку, и на него напала лягушка.

— Видите ли, — сказал шут, — давайте предположим, что первая надпись истинна. Тогда предположим, что в первой шкатулке лежит золото. Тогда во второй шкатулке должна сидеть лягушка, а в шкатулке с истинной надписью должно лежать золото, из чего следует, что вторая надпись тоже истинна. Теперь давайте предположим, что первая надпись ложна, и в первой шкатулке лежит золото. Тогда вторая надпись будет…

Король приказал бросить шута в темницу.

На следующий день шута в кандалах привели к королю, и тот показал ему другие две шкатулки.

— В одной шкатулке лежит ключ к твоим кандалам, — сказал король, — и если ты сможешь найти его, ты свободен. Но в другой шкатулке лежит кинжал к твоему сердцу, если ты этого не сможешь.

На первой шкатулке было написано: «Либо обе надписи истинны, либо обе ложны».

На второй шкатулке было написано: «В этой шкатулке лежит ключ».

Шут размышлял так: «Предположим, что первая надпись истинна. Тогда вторая надпись тоже истинна. Теперь предположим, что первая надпись ложна. Тогда вторая надпись всё равно истинна. Так что во второй шкатулке должен лежать ключ, если первая надпись истинна, и если первая надпись ложна. Поэтому во второй шкатулке логически должен лежать ключ».

Шут открыл вторую шкатулку и нашел кинжал.

— Как? — закричал шут в ужасе, когда его утаскивали прочь. — Это логически невозможно!

— Вполне возможно, — ответил король. — Я просто написал эти надписи на двух шкатулках, а потом положил кинжал во вторую.

Перевод: 
kirime
Номер в книге "Рациональность: от ИИ до зомби": 
153
Оцените качество перевода: 
Средняя оценка: 5 (19 votes)

Притча о болиголове

Элиезер Юдковский

Все люди смертны. Сократ — человек. Следовательно, Сократ смертен.

— Аристотель (?)

Сократ поднёс к губам чашу с болиголовом…
— Возможно ли, — спросил один из наблюдателей. — что даже болиголова недостаточно, чтобы убить столь мудрого и доброго человека?
— Нет, — ответил другой зритель, студент философии. — Все люди смертны, Сократ — человек, и если смертный выпьет болиголов, он непременно умрёт.
— Ладно, — сказал наблюдатель. — А если окажется, что Сократ «не» смертен?
— Вздор! — отрезал студент. — Все люди смертны «по определению»: это часть того, что мы понимаем под словом «человек». Все люди смертны, Сократ — человек, следовательно, Сократ смертен. И это не просто предположение. Это «логическая достоверность».
— Наверное, ты прав… — проговорил наблюдатель. — О! Глянь! Пока мы тут разговаривали, Сократ уже выпил болиголов. — Ага. Он упадёт с минуты на минуту. — ответил студент.
И они ждали, и ждали, и ждали…
— Сократ совсем не кажется смертным. — сказал наблюдатель.
— Значит, Сократ — не человек, — ответил студент. — Все люди смертны, Сократ не смертен, следовательно, Сократ — не человек.
И это не просто предположение. Это «логическая достоверность».

Главная проблема утверждения о том, что что-то истинно «по определению» состоит в том, что нельзя изменить реальность, поменяв определение (English).

Можно рассуждать примерно так: «Я вижу, что все носящие одежду, говорящие и использующие инструменты существа также имеют другие общие свойства, как-то: они дышат воздухом и перекачивают красную кровь. Последние тридцать объектов из этого кластера (я называю их «людьми»), которые выпили болиголов в моём присутствии, очень скоро упали и перестали двигаться. Сократ носит тогу, бегло говорит на древнегреческом и только что выпил болиголов из чаши. Поэтому я предсказываю, что Сократ рухнет на землю в течение следующих пяти минут».

Но это рассуждение — всего лишь «догадка», уязвимая и невозвышенная. Она не может быть абсолютно и неоспоримо верна (English), вы же понимаете . А греческие учёные, как и большинство донаучных философов, очень любили стопроцентную определённость.

К счастью, у греческих философов был разрушительный ответ на ваши сомнения.

— Вы неверно понимаете смысл утверждения «Все люди смертны», — сказали бы они. — Это вовсе не «наблюдение». Это часть «определения» слова «человек». Бренность — одно из нескольких свойств, индивидуально необходимых и совместно достаточных для того, чтобы определить принадлежность к классу «человек». Высказывание «Все люди смертны» логически истинно и бесспорно. И если Сократ — человек, то он «должен» быть смертен: это логическая дедукция, настолько несомненная насколько это вообще возможно.

Но тогда мы никак не сможем с определённостью знать «человек» ли Сократ до тех пор, пока не увидим его мёртвым. Бесполезны наблюдения того, что Сократ владеет греческим, или что у него красная кровь, или даже что ДНК Сократа человеческая. Ни один из этих признаков «логически не эквивалентен» бренности. Вы должны увидеть «его» мёртвым, прежде чем сможете сделать заключение о том, что он был человеком.

(И даже в этом случае ваше заключение не будет абсолютно достоверным (English). Вдруг Сократ восстанет из могилы следующей ночью? Или, если не столь сильно утрировать, вдруг Сократ подписал контракт на своё крионирование? Если бренность определить как конечную продолжительность жизни, то невозможно «знать», что кто-то является человеком, не достигнув сначала конца вечности — как иначе можно убедиться в том, что этот кто-то не вернётся? Не говоря о том, что сцена с падающим на землю Сократом может быть лишь иллюзией, спроецированной на ваши глаза сканером сетчатки. Или, может быть, вся эта история — лишь плод вашего воображения, серия галлюцинаций…)

Проблема с силлогизмами — это то, что они верны «всегда». Если воспринимать цепочку умозаключений «Все люди смертны; Сократ — человек; следовательно Сократ смертен» как силлогизм, то эта цепочка логически неоспорима в нашей вселенной. А ещё она логически неоспорима в соседней ветви Мультиверса, где эволюция пошла по слегка другому пути, из-за чего болиголов — это божественный деликатес, а не отрава. И она логически неоспорима даже во вселенных, в которых Сократ никогда не существовал или, коли на то пошло, в которых никогда не существовали люди.

По байесианскому определению свидетельство рассматривается, как говорящее в пользу гипотезы, если его вероятнее наблюдать в случае, когда гипотеза верна, чем в случае, когда она неверна. Наблюдение того, что силлогизм логически безупречен, не может быть свидетельством в пользу любого эмпирического утверждения, потому что силлогизм будет логически безупречен вне зависимости от верности этого утверждения.

Силлогизмы неоспоримы во всех возможных мирах. Таким образом, их неоспоримость не говорит нам ничего о том, в «каком» из возможных миров мы действительно проживаем.

Это значит не то, что логика бесполезна, а то, что логика может сообщить нам только то, что мы и так «в некотором смысле» уже знаем. Но мы не всегда верим в то, что знаем. Является ли простым число 29384209? После того, как я определил десятичную систему счисления и аксиомы арифметики, я определил и ответ на этот вопрос. Но я всё ещё не знаю ответа и мне нужна логика, чтобы найти его.

Аналогично, если я сформулирую неопределённое эмпирическое обобщение «Болиголов воздействует на людей», и неопределённое эмпирическое суждение «Сократ — человек», логика подскажет мне что мои предыдущие догадки приводят к умозаключению, что Сократ подвержен воздействию болиголова.

Можно рассмотреть логические рассуждения как способ разрешения неопределённостей в отношении невозможных возможных миров, способ обнуления вероятности логически невозможных миров, о логической невозможности которых нам не было известно. Таким образом, логическое умозаключение может считаться разновидностью наблюдения.

Но когда мы говорим об эмпирических предсказаниях вроде «Сократ свалится с ног и прекратит дышать» или «Сократ сделает пятьдесят подпрыгиваний, а затем победит на Олимпийских играх в следующем году», это является возможными мирами, а не невозможными возможными мирами.

Логика позволяет нам понять, какая гипотеза соотносится с конкретными наблюдениями, и позволяет нам сделать выводы о том, что эти гипотезы предскажут в будущем — она позволяет взять старые наблюдения и предыдущие заключения и применить их к новой проблеме. Но логика никогда не скажет «Сократ прекратит дышать через минуту» вместо «Сократ „может“ прекратить дышать через минуту». Логика никогда не ответит ни на один эмпирический вопрос; она никогда не разрешит встреченную в реальности тайну, допускающую — если напрячь воображение — несколько реалистичных разгадок; она не подскажет ответа на дилемму, правильный ответ в которой неопределён, и, в принципе, может оказаться каким угодно.

Просто запомните литанию против логики:

Логика остаётся истинной, куда бы ты ни пошёл,
Поэтому логика никогда не скажет тебе, где ты живёшь.

Перевод: 
Dmitry Antonyuk, BT, santacloud
Номер в книге "Рациональность: от ИИ до зомби": 
154
Оцените качество перевода: 
Средняя оценка: 4.1 (28 votes)

Слова как скрытые умозаключения

Элиезер Юдковский

Предположим, что я наткнулся на бочку, верх которой запаян, но в которой есть дыра такого размера, что в неё пролезает рука. Я просовываю ладонь внутрь и нащупываю что-то маленькое и округлое. Я вытаскиваю объект наружу — это голубоватое яйцо. Я просовываю руку ещё раз: что-то жёсткое и плоское, с рёбрами — после извлечения это оказывается кубом красного цвета. В итоге я вытащил 11 яиц и 8 кубов, и каждое яйцо синее, и каждый куб красный.

На этот раз, просунув руку внутрь, я нащупал ещё один объект яйцеобразной формы. Пока я не извлёк его из бочки, я пытаюсь угадать: как он выглядит?

Имеющиеся свидетельства не доказывают, что каждое яйцо в бочке синее, и что каждый куб красный. Свидетельства даже не дают этому сильных обоснований: 19 — не очень большой размер выборки. Тем не менее, я предполагаю, что это яйцо синее — или, что менее вероятно, но всё же занимает второе место, красное. Думать о других вариантах бессмысленно: возможностей столько, сколько существует различимых цветов — и почему яйцо должно быть выкрашено в один цвет? Может быть, на нём нарисована лошадь.

Посему я говорю «синее», и слова эти покрыты послушной долгу патиной смиренности: ибо я искушённый рационалист, привыкший следить за своими допущениями и догадками. Я тыкаю пальцем в небо, но я осознаю, что я тыкаю пальцем в небо, верно?

Однако, когда из теней выпрыгивает объект котообразной формы, покрытый жёлтыми и чёрными полосами, в моей голове проносится «Ой! Тигр!». Не «Хммм… полосатые объекты большого размера и жёлтого цвета, форма которых типична для представителей семейства кошачьих, ранее очень часто обладали свойствами «голодный» и «опасный», и поэтому — несмотря на то, что строгой логической необходимости в этом нет — можно сделать довольно неплохой с эмпирической точки зрения вывод о том, что ааааааргхххх ХРУМ ХРУМ ЧАВК»

По какой-то странной причине в процессе эволюции человеческий мозг научился производить это умозаключение быстро, автоматически, и не отслеживая все использованные допущения явно.

И если я назову яйцевидные объекты словом «сияйца» (что будет означать «синие яйца»), а красные кубы словом «крубы», то тогда, нащупав в бочке ещё один яйцевидный объект, я могу подумать «о, это сияйцо» вместо того, чтобы рассуждать о проблеме индукции и прочих вещах того же рода.

Убеждение о том, что ты можешь определить слово так, как тебе нравится, — распространённое заблуждение.

Это было бы правдой, если бы мозг воспринимал слова исключительно как логические конструкции, аристотелевы классы, а ты никогда бы не вытаскивал информацию, изначально не положенную внутрь.

И всё же мозг продолжает своё занятие категоризацией вне зависимости от того, одобряем ли мы это сознательно. «Все люди смертны, Сократ человек, следовательно Сократ смертен» — рассуждали философы древней Греции. Ну что же, если смертность — часть определения логического понятия «человек», то ты не можешь классифицировать Сократа как человека до тех пор, пока ты не убедишься в его смертности. Однако — в этом и состоит проблема — Аристотель прекрасно знал, что Сократ является человеком. Мозг Аристотеля поместил Сократа в категорию «люди» также эффективно, как и твой мозг категоризирует тигров, яблоки, и всё своё окружение: быстро, безмолвно, и без сознательного одобрения.

Аристотель заложил правила, согласно которым никто не мог установить, что Сократ был «человеком», не пронаблюдав его смерти. Тем не менее, Аристотель и его ученики спокойно делали выводы о том, что ещё живые горожане были людьми, и, следовательно, смертными; они видели отличительные свойства — человеческие лица и человеческие тела — и их мозги совершали прыжок в сторону неявных свойств, таких, как смертность.

Неверное понимание алгоритма действий своего разума, к счастью, не мешает ему выполнять свою работу. Иначе последователи Аристотеля умерли от голода, неспособные сделать вывод об съедобности объекта на основании всего лишь того, что он выглядел и пах, как банан.

И последователи Аристотеля отправились классифицировать окружающее на основании неполной информации, точно также, как делали и все предыдущие поколения людей. Процесс мышления учеников Аристотеля нисколько не изменился из-за того, что они узнали принципы классической логики, однако они приобрели ошибочное представление о том, чем они занимались.

Если бы ты спросил философа-последователя Аристотеля о том, смертна ли Кэрол, торговец бакалейными товарами, то ты бы услышал положительный ответ. Почему? «Все люди смертны, Кэрол — человек, значит, Кэрол — смертна» — объяснил бы философ. Что это — предположение или несомненный факт? На этот вопрос философ бы ответил «разумеется, несомненный факт» (по крайней мере, если бы дело происходило раньше шестнадцатого века). Поинтересуйся, откуда он знает, что люди смертны, и получи ответ о том, что это закреплено в определении.

Последователи Аристотеля по-прежнему были людьми, они сохранили свою изначальную природу, но они приобрели неверные убеждения о своём внутреннем функционировании. Они смотрели в зеркало самосознания и видели что-то, непохожее на них самих; корректность их рефлексии была нарушена.

Твой мозг видит в словах нечто большее, чем просто логические определения без эмпирических последствий, и тебе следует последовать его примеру. Одного лишь создания нового слова достаточно для того, чтобы твой разум выделил ему категорию, и тем самым запустил бессознательные умозаключения о похожести. Или заблокировал умозаключения о похожести: создав два ярлыка, я могу заставить твой разум выделить две категории. Ты обратил внимание на то, что я сказал «ты» и «твой мозг» так, будто это две разные вещи?

Наличие заблуждений о том, как работает содержимое твоего черепа никак не влияет на это содержимое; иначе Аристотель пал бы бездыханным в тот же миг, когда заключил, что мозг — орган для охлаждения крови. Философские ошибки обычно не взаимодействуют с требующими доли секунды бессознательными умозаключениями.

Но философские ошибки могут чрезвычайно испортить процессы осознанного мышления, в том числе и те, которые используются для коррекции первых впечатлений. Если ты считаешь, что можно «определить слово так, как тебе нравится», не понимая, что твой мозг продолжает категоризировать без сознательного надзора, то ты не потратишь никаких усилий на то, чтобы выбрать свои определения с умом.

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
155
Оцените качество перевода: 
Средняя оценка: 4.6 (12 votes)

Экстенсионалы и интенсионалы

Элиезер Юдковский

— Что такое красный?

— Красный — это цвет.

— Что такое цвет?

— Цвет — это свойство вещи.

Но что такое вещь? И что такое свойство? И вскоре собеседники теряются в лабиринте слов, определенных через другие слова. Стивен Харнард описывал эту проблему, как обучение китайскому языку через китайско-китайский словарь.

С другой стороны, если вы меня спросите: «Что такое красный», я могу показать на знак «Стоп», затем на кого-то в красной рубашке, на светофор, если он в данный момент красный, на кровь, если я случайно порезался, на красную визитку. И наконец, я мог бы открыть палитру цветов на компьютере и указать курсором на красную область. Скорее всего, этого было бы достаточно, однако, если вы знаете значение слова «нет», то какой-нибудь сторонник строгости настаивал бы, чтобы я указал на небо и сказал: «Нет».

По-моему, я украл этот пример у С. И. Хаякавы, но я не особо в этом уверен, потому что это одно из моих туманных детских воспоминаний. (Когда мне было 12, мой отец случайно удалил все мои файлы на компьютере, и у меня не осталось никаких воспоминаний о том, что было раньше).

Но, кажется, именно тогда я впервые узнал про разницу между экстенсиональным и интенсиональным определением. Дать «интенсиональное определение» — определить слово или фразу в контексте других слов, как это делается в словаре. Дать «экстенсиональное определение» — указать на пример, как это делают взрослые, когда объясняют что-то ребенку. Предыдущее предложение — интенсиональное определение «экстенсионального определения», что делает его экстенсиональным примером «интенсионального определения».

С точки зрения «голливудской рациональности» и поп-культуры в целом, «рационалисты» одержимы смыслами слов и плавают в бесконечном вербальном пространстве, оторванном от реальности.

Но настоящие «традиционные рационалисты» давно настаивают на сохранении прочной связи с опытом1:

Если вы заглянете в учебник химии в поисках определения лития, вы, возможно, обнаружите, что это элемент, атомный вес которого очень близок к семи. Но если у автора более логический склад ума, то он сообщит вам, что вам следует искать среди минералов, стекловидных, прозрачных, серых или белых, очень твердых, хрупких и нерастворимых, такой, который придает малиновый оттенок несветящемуся пламени; этот минерал, растертый в порошок вместе с известью или с так называемым крысиным ядом и расплавленный, может быть частично растворен в соляной кислоте; если этот раствор выпарить и осадок с помощью серной кислоты должным образом очистить, то обычными методами он может быть обращен в хлорид; если этот хлорид получить в твердом виде, расплавить и подвергнуть электролизу с помощью полудюжины мощных элементов, то образуется шарик розового, серебристого металла, который будет плавиться на газолиновой горелке; вот это вещество и есть образчик лития.

Чарльз Сандерс Пирс

Это пример «логического склада ума», как его видят «традиционные рационалисты», а не голливудские сценаристы.

Отметим, что Пирс не показывает нам кусочек лития. В комплекте с его книгой не идут куски лития. Скорее он дает карту сокровищ — интенсионально описанную процедуру, которая, будучи выполненной, приведет нас к экстенсиональному примеру лития. Это не то же самое, что и кинуть в вас куском лития, но и не то же самое, что и сказать «атомный вес семь». (Однако, если у вас особенно острый глаз, то фраза «три протона» позволит вам сразу понять, что речь идёт о литии…)

Итак, я описал, что такое интенсиональное и экстенсиональное определения. С их помощью можно передать кому-нибудь смысл, который вы вкладываете в концепт. Когда я выше разговаривал про «определения», я говорил про способ передачи концептов, т.е. о том, как сообщить кому-то, что именно вы имеете в виду, когда говорите «красный», «человек», «тигр» или «литий». Теперь давайте поговорим о самих концептах.

Реальный интенсионал концепта «тигр» для меня — реакция совокупности нейронов (в височной коре), обрабатывающих входящий сигнал зрительной коры с целью определить, тигр это или нет.

Реальный экстенсионал концепта «тигр» для меня — все, что я называю тигром.

Интенсиональные определения не учитывают все интенсионалы; экстенсиональные — все экстенсионалы. Если я покажу на одного тигра и скажу «тигр», коммуникация может провалиться, если те, кому я показал, подумают что я имею в виду «опасное животное» или «самец тигра» или «жёлтая штука». Аналогично, если я скажу «опасное животное с жёлто-черными полосками», не указав пальцем на что-либо, слушатель может вообразить гигантского шершня.

У вас не получится описать словами все детали существующего в вашей голове механизма, позволяющего вам отличать тигров от не-тигров. Он слишком сложен. И вам не удастся показать пальцем на всех тигров, которых вы когда-либо видели, не говоря уже о том, чтобы показать на всё, что вы можете называть тигром.

Чтобы лучше всего выразить концепт, чтобы точнее всего передать смысл понятия, оно определяется через совокупность интенсионалов и экстенсионалов. Но даже с учётом этого, мы лишь передаем карты концептов или инструкции для постройки таковых, а не реальные категории в том виде, в котором они существуют в нашем разуме или в реальности.

(Разумеется, немного изобретательности, и можно соорудить исключения для этого правила. Например, «Четвёртого февраля 2008 года Элиезер Юдковский опубликовал предложение, содержащее термин „хурагалони“». Только что я показал весь экстенсионал этого концепта. Но, за исключением математики, определения обычно являются картами сокровищ, а не сокровищами).

И это ещё одна причина, почему вы не можете «определять слова так, как вам захочется» — вы не можете запрограммировать концепты прямо в чей-то мозг.

Даже внутри Аристотелевой парадигмы, где мы притворяемся, что определения являются концептами, нет одновременной свободы интенсионала и экстенсионала. Предположим, я определяю Марс как «огромную каменную сферу, примерно в 1/10 массы Земли и на 50% дальше от Солнца». Мне придется отдельно показывать, что это интенсиональное определение совпадает с конкретной экстенсиональной штукой в моем опыте, или даже совпадает с реальной штуковиной. С другой стороны, если я скажу «это Марс» и покажу на красную точку на ночном небе, мне придется отдельно показывать, что эта экстенсиональная красная точка совпадает с конкретным интенсиональным определением, которое я мог бы предложить, или с каким-то моим интенсиональным убеждением — вроде «Марс — бог войны».

Но большая часть мозговой деятельности по сооружению интенсионалов протекает подсознательно. У нас нет осознанного понимания, что наше определение красного света с неба как «Марса» никак не связано со словесным определения «Марс — это бог войны». Неважно, какие интенсиональные определения я изобрету для Марса, мой разум верит в то, что «Марс» — это отсылка на ту точку на небе , которая является четвертой планетой Солнечной системы.

Если мы учтём, как на самом деле работает человеческий разум, то идея «я могу определять слова так, как мне захочется» вскоре превращается в «я могу верить в то, во что мне захочется, относительно любого заданного набора объектов» или «я могу по желанию объявлять, что предмет принадлежит или не принадлежит к любому наперёд заданному множеству, описываемому понятием». Подобно тому, как вы не можете передать весь интенсионал концепта словами, потому что это большой и сложный тест на принадлежность к множеству, осуществляемый вашими нейронами, вы не можете управлять всем интенсионалом концепта сознательно, потому что он создается подсознательно. Именно поэтому аргументация «по определению» так популярна. Если бы изменения определений изменяли эмпирическую реальность определяемых объектов, то спорить о них было бы неинтересно. Но стоит лишь слегка злоупотребить определениями, и они превращаются в волшебные палочки (в спорах, разумеется, а не в реальности).

  • 1. Цитируется по переводу Т. В. Булыгиной и А. Д. Шмелева, изданному в сборнике «Семиотика» под редакцией Ю. С. Степанова, М., Радуга, 1983 — Прим.перев.
Перевод: 
Muyyd1, Alaric, Quilfe
Номер в книге "Рациональность: от ИИ до зомби": 
156
Оцените качество перевода: 
Средняя оценка: 4.4 (11 votes)

Кластеры подобия

Элиезер Юдковский

Давным-давно философы Академии Платона заявили, что наилучшее определение человека — это «двуногое существо без перьев». Согласно легенде, Диоген Синопский незамедлительно выставил на обозрение ощипанную курицу и произнес: «Вот он — человек Платона». Последователи Платона тут же изменили определение на «двуногое существо без перьев с плоскими ногтями».

Никакой словарь и никакая энциклопедия не перечисляют вообще всё, что свойственно людям. У нас красная кровь, по пять пальцев на каждой руке, костистые черепа, 23 пары хромосом, однако, то же самое можно сказать и про другие виды животных. Мы создаем сложные устройства, которые делают другие сложные устройства, используем синтаксический комбинаторный язык, мы обуздали реакцию деления в качестве источника энергии. Эти признаки уже относятся только к людям, но не ко всем людям. Многие ли строили ядерные реакторы? Можно записать цепочку необходимых и достаточных генов, которая будет описывать людей и только людей — во всяком случае, пока что — однако, это далеко не все свойства, присущие всем людям.

Но пока вы держитесь на расстоянии от ощипанных куриц, фраза «ищи двуногих и без перьев» может хорошо послужить для выделения конкретных объектов, которые являются людьми, в отличии от домов, ваз, бутербродов, кошек, цветов или математических теорем.

Как только определение «двуногое существо без перьев» оказалось связанным с конкретными двуногими существами без перьев, можно начинать наблюдать за этой группой для сбора других характеристик, — помимо отсутствия перьев и двуногости, — которыми обладают члены этой группы. Эти конкретные двуногие существа без перьев также используют язык, создают сложные инструменты, говорят на комбинаторном языке с использованием синтаксиса, кровоточат красным (если их проткнуть), умирают, приняв болиголов.

Таким образом, категория «человек» растет и включает в себя все больше и больше характеристик, и теперь нас так просто не проведешь, когда Диоген вновь покажет на ощипанную курицу. Эта ощипанная курица, очевидно, не так уж подобна другим «двуногим без перьев».

(Если бы логика Аристотеля была хорошей моделью человеческой психологии, то платоники, увидев ощипанную курицу, сказали бы: «Да, это человек, к чему ты это все?»)

Если первое двуногое существо без перьев, которое вы увидите, окажется ощипанной курицей, то, возможно, вы начнёте думать, что слово-ярлык «человек» обозначает именно ощипанных куриц. В таком случае я могу изменить мою карту сокровищ на «двуногое без перьев с плоскими ногтями», и, если я достаточно мудр, сказать: «Вон там Диоген стоит, видишь? Это человек, и я человек, и ты человек, а вот шимпанзе — не человек, но довольно близок».

Первая подсказка должна лишь вести к кластеру подобия — группе объектов, у членов которой есть множество общих характеристик. Теперь эта подсказка выполнила свое предназначение, и я могу продолжить передачу информации, например, «Люди, в данный момент, смертны», ну или что угодно, что я решу сказать о нас, двуногих существах без перьев.

О словарях полезней думать не как о книгах, содержащих определения аристотелевых логических классов, а как о книгах подсказок, призванных помочь сопоставить слова-ярлыки с кластерами подобия или сопоставить ярлыки и свойства объектов, которые помогут такой кластер выделить.

Перевод: 
Muyyd1, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
157
Оцените качество перевода: 
Средняя оценка: 4.1 (18 votes)

Типичность и асимметричное подобие

Элиезер Юдковский

Птицы могут летать. А вот страусы нет. Но какая из двух птиц более типичная птица: малиновка или страус?

Какое из кресел является более типичным: офисное, кресло-качалка или кресло-мешок?

Большинство людей скажут, что малиновка — более типичная птица, а офисное кресло — более типичное кресло. Изучающие этот феномен когнитивные психологи, говорят о нем, как о «эффекте типичности» или «эффекте образца»(Rosch and Lloyd, 1978). Скажем, если попросить испытуемых нажимать кнопки правда/ложь для высказываний вроде «малиновка — это птица» или «пингвин — это птица», то для типичных примеров кнопку нажимают существенно быстрее. (Я все еще распаковываю свои книги, но я практически уверен, что этот эксперимент описан в Lakoff, 1986) Наличие корреляции при измерении типичности можно показать разными способами: можно измерить время нажатия кнопки, или попросить людей оценить примеры по шкале от 1 до 10: насколько пример (малиновка) подходит для категории (птица)?

Итак, мы умеем мысленно измерять типичность, и это, возможно, работает как эвристика. Но есть ли соответствующее этой эвристике когнитивное искажение?

Какое из следующих высказываний для вас выглядит более естественным: «98 это приблизительно 100» или «100 это приблизительно 98»? Если вы относитесь к большинству, то первое высказывание покажется вам более осмысленным (Sadock, 1977). Руководствуясь похожими причинами, люди, которых попросили оценить, насколько Мексика похожа на США, стабильно оценивают это подобие выше, чем те, которых просили оценить, насколько США похожи на Мексику (Tversky and Gati, 1978).

Ну а если это все еще кажется вам безобидным, то в исследовании Рипса (1975) показано, как люди более вероятно ожидают, что болезнь на острове будет передаваться от малиновок к уткам, чем от уток к малиновкам. Разумеется, ничего логически невозможного в этом нет, однако, с практической точки зрения, если утки отличаются от малиновок какой-то особенностью, из-за которой болезнь с меньшей вероятностью передаётся от уток к малиновкам, то обязано существовать и отличие малиновок от уток, из-за которого болезнь с меньшей вероятностью будет передаваться от малиновок к уткам.

Разумеется, можно рационализировать это: «Ну, у малиновок может быть больше видов неподалеку, что будет способствовать более быстрому распространению болезни в начале», но будьте осторожны и не перестарайтесь в рационализации оценок вероятностей людьми, которые даже не понимают, о каких именно различиях идёт речь. И не забывайте, что Мексика больше похожа на США, чем США на Мексику, и что 98 ближе к 100, чем 100 к 98. И проще это интерпретировать так: люди используют (и это было показано экспериментально) эвристику подобия, как замену вероятности распространения болезни, и эта эвристика (как было показано экспериментально) — асимметрична.

Канзас необычайно близок к центру США, а Аляска необычайно отдалена от центра. Так что, скорее всего, Канзас ближе к большинству точек в США, а Аляска — дальше. Но из этого не следует, что Канзас ближе к Аляске, чем Аляска к Канзасу. Люди же, однако, рассуждают (образно говоря), что близость — свойство, присущее Канзасу, а удаленность - свойство, присущее Аляске. Так что Канзас близок — даже к Аляске, а Аляска удалена — даже от Канзаса.

И вот опять мы видим, что аристотелевская идея категорий — логических классов с членством, определенным совокупностью признаков, по отдельности каждый из которых необходим, а вместе они достаточны, не такая уж хорошая модель человеческой когнитивной психологии. (Кто бы мог подумать, что наука продвинется вперед за 2350 лет?) Мы даже не рассуждаем с помощью бинарного подхода правда/ложь - высказывания о принадлежности могут быть более или менее истинными. (Замечу, что это не то же самое, что и быть более или менее вероятным.)

Еще одна причина прекратить притворяться, будто вы — или кто-то еще — в самом деле сможете обращаться со словами, как с аристотелевскими логическими классами.

  1. Lakoff, George. (1986). «Women, Fire and Dangerous Things: What Categories Tell Us About the Nature of Thought», University of Chicago Press, Chicago.
  2. Rips, Lance J. (1975). «Inductive judgments about natural categories», «Journal of Verbal Learning and Verbal Behavior», 14:665-81.
  3. Rosch, Eleanor and B. B. Lloyd, eds. (1978). «Cognition and Categorization», Hillsdale, N.J.: Lawrence Erlbaum Associates.
  4. Sadock, Jerrold. (1977). «Truth and Approximations.» В «Papers from the Third Annual Meeting of the Berkeley Linguistics Society», pp. 430-39. Berkeley: Berkeley Linguistics Society.
  5. Tversky, Amos and Itamar Gati. (1978). «Studies of Similarity». В Rosch and Lloyd (1978).
Перевод: 
Михаил Мюид, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
158
Оцените качество перевода: 
Средняя оценка: 4.1 (12 votes)

Кластерная структура пространства вещей

Элиезер Юдковский

Идея «конфигурационного пространства» состоит в переводе описаний объектов в их позиции. Кажется, что синий «ближе» к сине-зеленому, чем к красному, но насколько ближе? Если просто смотреть на цвета, то на этот вопрос ответить трудно. Но будет понятней, если вспомнить, что (относительные) координаты этих цветов в пространстве RGB — (0; 0; 5), (0; 3; 2) и (5; 0; 0). Если изобразить эти точки на трёхмерном рисунке, будет еще понятней.

Точно также, если рассуждать о малиновке, можно думать о ней привычным способом: коричневый хвост, красная грудка, обычный для малиновки облик, максимальная скорость без груза, типичный для этого вида набор ДНК и индивидуальные аллели. А можно рассматривать малиновку, как точку в конфигурационном пространстве, измерения которого описывают всё, что мы знаем о малиновках или можем узнать.

Малиновка больше вируса, но меньше авианосца — таким образом в конфигурационном пространстве можно ввести измерение «объёма». Малиновка весит больше атома водорода, но меньше галактики — измерение «массы». «Объём» и «масса» разных малиновок будут очень сильно коррелировать между собой, так что точки-малиновки в этих двух измерениях будут выглядеть почти как отрезок прямой линии. Однако, корреляция не будет полной, поэтому нам всё же нужны два отдельных измерения.

В этом и есть преимущество рассмотрения малиновок как точек в пространстве: у нас бы не получилось так легко увидеть линейность, если бы мы продолжали думать о малиновках, как о маленьких и милых махающих крыльями существах.

ДНК малиновок — это переменная с очень большим количеством измерений, но о ней всё равно можно думать, как о части описания расположения малиновки в пространстве вещей — в виде миллионов координат (по одной на каждый нуклеотид), которые могут принимать одно из четырёх значений, или даже что-то более элегантное. Форму малиновки, ее цвет (отражательную способность) точно также можно рассматривать как часть описания, где малиновка находится в конфигурационном пространстве, пусть даже они принадлежат к разным измерениям.

Точка (0; 0; 5) в пространстве цветов содержит ту же самую информацию, что и реально существующий синий цвет на HTML странице. Точно также мы не должны терять информацию, представляя малиновок, как точки в пространстве. Мы можем вообразить малиновку на весах, которые показывают 0,07 килограмм. Или можем представить малиновку-точку с координатой-массой +70. В обоих случаях мы представляем массу малиновки одинаково.

Мы можем даже вообразить конфигурационное пространство с одним или больше измерением для каждой отдельной характеристики объекта, так что позиция точки-объекта в этом пространстве будет соответствовать всей информации, которая у нас имеется об объекте. Пусть эта информация и окажется избыточной - например, в пространстве будут измерения для массы, объема и плотности.

Если это вам кажется слишком уж экстравагантным, то в квантовой физике используется многомерное конфигурационное пространство (с бесконечным числом измерений), в котором одна точка обозначает расположение каждой частицы во вселенной. Так что мы себя ведём ещё довольно скромно — точка в нашем конфигурационном пространстве описывает лишь один объект, а не всю вселенную.

Если мы не уверены насчет точной массы и объёма малиновки, то можно вообразить маленькое облако в пространстве вещей, некий объём неопределенности, внутри которого может располагаться малиновка. Плотность этого облака в некоторой точке соответствует нашей уверенности, что масса и объём малиновки равны значениям, которые являются координатами этой точки. Если вы уверены насчет плотности малиновки больше, чем насчет массы и объёма, то ваше облако вероятностей будет сильно сконцентрированным в измерении плотности, а в подпространстве массы/объёма сконцентрированы вокруг наклонной линии. (Облако в этом случае будет поверхностью из-за соотношения Объём ⋅ Плотность = Масса)

Когнитивные психологи используют понятие «радиальных категорий» для описания границ не-аристотелевых понятий. Центральное понятие «мать» означает женщину, которая участвует в зачатии, рождении и воспитании ребёнка. Донор яйцеклеток, которая никогда не увидит своего ребенка будет матерью? Она — «генетическая мать». Как насчет женщины, в которую имплантировали эмбрион, чтоб она его выносила? Она — «суррогатная мать». Ну а женщина, которая воспитывает ребенка, которого не рожала? Она — «приемная мать». Аристотелевский силлогизм звучал бы: «У людей десять пальцев, у Фреда — девять, следовательно — Фред не человек», но в действительности люди думают об этом так: «У людей десять пальцев, Фред — человек, следовательно, Фред — человек с девятью пальцами».

На языке интенсионалов мы можем описать радиальность категорий так: у объекта свойства категории обычно присутствуют, но некоторые могут отсутствовать. Интенсионал слова «мать» будет похож на распределенное по пространству вещей сияние, яркость которого соответствует тому, насколько координаты точки в пространстве соответствуют категории «мать». Сияние будет сконцентрировано в центре, который соответствует одновременно зачатию, рождению и воспитанию. Объём, в который попадут доноры яйцеклеток, тоже будет светиться, но не так ярко.

Или мы можем представить радиальность экстенсионально. Предположим, мы отобразили всех птиц в мире на пространство вещей и определили в нём расстояние так, что оно как можно лучше соответствует человеческому представлению о подобии: малиновка больше похожа на другую малиновку, чем они обе похожи на голубя, однако малиновки и голуби ближе друг к другу, чем к пингвину, и так далее.

В центре птичности окажется множество соседствующих плотных кластеров: малиновки, воробьи, канарейки, голуби и множество других видов. Орлы, ястребы и другие хищные птицы попадут в другой кластер неподалеку. Пингвины окажутся в более далеком кластере, как и курицы, и страусы.

Результат, скорее всего, будет чем-то напоминать галактический кластер: плотное скопление галактик в центре, и несколько неподалеку.

Или мы можем думать одновременно об интенсионале мыслительной категории «птица» и об экстенсионале реальных птиц. Центральный кластер малиновок и воробьев светится очень ярко — здесь высокий уровень птичности. Кластеры-сателлиты страусов и пингвинов светятся тусклей из-за менее типичной птичности, а Авраам Линкольн находится в нескольких мегапарсеках от них всех и не светится совсем.

Я предпочитаю именно эту визуализацию — светящиеся точки, —потому что, по-моему, структура интенсионалов в нашем разуме вторична по отношению к структуре экстенсиональных кластеров. Первична структура реального мира — эмпирическое распределение птиц в пространстве вещей. А затем мы, наблюдая птиц, формируем мыслительную категорию, интенсионал которой грубо покрывает это распределение.

Это ещё один способ понять, почему слова не являются аристотелевскими классами — структура эмпирических кластеров реальной вселенной не такая прозрачная. Природный кластер, группа очень похожих друг на друга предметов, может и не иметь набора необходимых и достаточных признаков: ни набора характеристик, которыми обладают все члены множества, ни набора, которыми никто из не-членов не обладает.

Но даже если категории необратимо туманны и ухабисты, для паники повода нет. Я бы не стал возражать, если бы кто-нибудь заявил, что «птицы — это такие летающие штуки с перьями». Но ведь пингвины не летают! Ну и ладно. У правила есть исключения, так что это не конец света. Не стоит ожидать, что определения будут точно совпадать с эмпирической структурой пространства вещей, ведь карта меньше по размеру и намного проще территории. Цель определения «такие летающие штуки с перьями» в том, чтобы привести слышащего к кластеру птиц, а не в том, чтобы дать полное описание всех существующих птиц вплоть до молекулярного уровня.

Когда вы проводите границу вокруг группы экстенсиональных точек, образующих кластер в пространстве вещей, скорее всего, на каждое выдуманное вами интенсиональное правило вы обнаружите как минимум одно исключение.

Однако, если на практике определение вполне сносно позволяет указать на нужный эмпирический кластер, то возражения к формулировке этого определения вполне оправданно можно назвать «придирками».

Перевод: 
Muyyd1, Alaric, Quilfe
Номер в книге "Рациональность: от ИИ до зомби": 
159
Оцените качество перевода: 
Средняя оценка: 3.8 (Всего оценок: 21)

Замаскированные вопросы

Элиезер Юдковский

Представьте, что вы работаете на необычной фабрике. Вы должны брать объекты с загадочного конвейера и сортировать их по двум корзинам. В ваш первый рабочий день Старшая Сортировщица Сьюзен объяснила вам, что синие объекты яйцевидной формы называются «сияйцами» и их следует класть в «корзину для сияиц», а красные кубы называются «крубами» и их следует класть в «корзину для крубов».

Приступив к работе, вы заметили, что сияйца и крубы отличаются не только цветом и формой. Сияйца покрыты мехом, а крубы — гладкие. Поверхность сияиц слегка пружинит при нажатии, крубы — твердые. Сияйца — непрозрачные, поверхность крубов слегка просвечивает.

Вскоре вы столкнулись с сияйцом необычайно темного оттенка синего. Более того, присмотревшись получше, вы увидели, что это фиолетовый цвет — смесь красного и синего.

Погодите! Почему же вы называете этот объект «сияйцом»? Ведь «сияйцо» изначально определили как синий и яйцевидный объект. А характеристика «синее» даже отражена в самом названии «сияйца». А этот объект не синий. Одна из необходимых характеристик отсутствует, так что вам следует называть его не «сияйцом», а «фиолетовым яйцевидным объектом».

Но так уж случилось, что помимо яйцевидности и фиолетового цвета, этот объект непрозрачный, покрыт мехом и слегка пружинит. Так что увидев его, вы подумали: «О, сияйцо странного цвета». Но это уж точно не круб, верно?

И всё же вы не слишком уверены в том, что следует делать в таких случаях. Поэтому вы зовете на помощь Старшую Сортировщицу Сьюзен.

— Точно, это сияйцо, — отвечает Сьюзен. — Кладите его в корзину для сияиц.

Вы уже собираетесь бросить фиолетовое сияйцо в соответствующую корзину, но останавливаетесь.

— Сьюзен, откуда вы знаете, что это сияйцо?

Сьюзен странно на вас смотрит.

— Разве не очевидно? Пусть этот объект и фиолетовый, но при этом он еще и яйцевидной формы, непрозрачный, покрыт мехом и пружинит, как и другие сияйца. В редких цветовых дефектах нет ничего удивительного. Или это одна из философских загадок вроде: «Откуда вы знаете, что мир не был создан пять минут назад вместе с людьми с полным набором ложных воспоминаний?» В философском смысле у меня нет абсолютной уверенности в том, что это сияйцо, но, по-моему, вполне можно считать, что это так.

— Нет, я имею ввиду… — вы медлите, подыскивая нужные слова. — Зачем нужны отдельные корзины для сияиц и крубов? В чем разница между сияйцами и крубами?

— Сияйца — синие и яйцеподобные, крубы — красные и кубические, —- терпеливо отвечает Сьюзен. — Вы ведь прослушали стандартную вводную лекцию?

— Зачем надо сортировать сияйца и крубы?

— Э-э-э… потому что иначе они перемешаются? — говорит Сьюзен. — Потому что никто не станет нам платить просто за то, что мы сидим тут и не сортируем сияйца и крубы?

— Кто исходно определил, что синий яйцевидный объект — это сияйцо, и почему он так решил?

Сьюзен пожимает плечами:

— Думаю, с тем же успехом можно называть сияйцами красные кубические объекты, а крубами — синие и яйцевидные, но, по-моему, нынешний вариант удобнее для запоминания.

Вы на некоторое время задумываетесь.

— Предположим, что по конвейеру приехал очень необычный объект. Оранжевый, сферической формы, покрытый мехом, прозрачный и с маленькими зелеными щупальцами. Как мне определить — сияйцо это или круб?

— Ух-ты, с таким пока ещё никто не сталкивался, — отвечает Сьюзен. — Думаю, в этом случае мы воспользуемся сортирующим сканером.

— Как этот сканер работает? — продолжаете допытываться вы. — Это рентген? Магнитно-резонансная томография? Нейронная спектроскопия?

— Мне сказали, что он работает по правилу Байеса, но я не до конца понимаю, как это, — сказала Сьюзен. — Впрочем, мне нравится произносить это слово: байес, байес, байес, байес, байес.

— Какую информацию сообщает сортировочный сканер?

— Он сообщает, в какую корзину надо положить объект. Поэтому его и называют сортировочным.

Вы замолкаете.

— Кстати, - небрежно добавляет Сьюзен, — возможно, вам будет интересно узнать, что сияйца содержат ванадиевую руду, а крубы — кусочки палладия. И то, и другое активно применяется в промышленности.

— Сьюзен, вы чистое зло.

— Спасибо за комплимент.

Итак, судя по всему, мы обнаружили, в чём сущность сияйцности: сияйцо — объект, содержащий ванадиевую руду. Внешние характеристики — вроде синего цвета или пушистости — не определяют, является ли объект сияйцом. Эти характеристики важны лишь потому, что помогают понять, является ли объект сияйцом, то есть, содержит ли он ванадий.

Содержание ванадия — необходимое и достаточное определение. Все сияйца содержат ванадий, и всё, что содержит ванадий, — сияйцо. «Сияйцо» это лишь быстрый способ сказать «содержащий ванадий объект». Так ведь?

Не так быстро, говорит Сьюзен. Около 98% сияиц содержит ванадий, однако 2% содержит палладий. Точнее (продолжает Сьюзен), около 98% синих яйцевидных, мохнатых, мягких, непрозрачных объектов содержит ванадий. Для необычных сияиц будут другие пропорции: 95% фиолетовых сияиц содержат ванадий, 92% твердых сияиц содержит ванадий и так далее.

Предположим, вы обнаружили синий яйцевидный, мохнатый, непрозрачный объект. На вид — обычное сияйцо во всех отношения. Чисто из любопытства вы засунули его в сортировочный сканер. Сканер выдал: «палладий» — те самые редкие 2%. Сияйцо ли это?

Поскольку вы собираетесь бросить этот объект в корзину для крубов, первоначально у вас может появиться желание назвать его «крубом». Однако, оказывается, почти все сияйца, если выключить свет, слегка светятся в темноте, а почти все крубы в темноте не светятся. И процентное соотношение светящихся сияиц к несветящимся примерно такое же, как и для содержащих палладий вместо ванадия синих, яйцевидных, мохнатых, мягких, непрозрачных объектов. Поэтому, если вас интересует вопрос, светится ли этот объект в темноте как сияйцо или не светится как круб, вам стоит предположить, что он светится как сияйцо.

Так что это в итоге за объект: сияйцо или круб?

С одной стороны, независимо от того, что вы ещё узнаете про этот объект, вы его бросите в корзину для крубов. С другой — если вы хотите сделать предположение о каких-то неизвестных характеристиках этого объекта, то вам следует предполагать, что объект обладает скорее характеристиками сияйца, а не круба. То есть поместить его в кластер подобия синих, яйцевидных, мохнатых, мягких, непрозрачных вещей, а не в кластер красных, кубических, гладких, твердых и слегка прозрачных вещей.

В различных ситуациях вопрос «сияйцо ли это?» может использоваться для решения самых разных задач.

Если же никакая задача перед вами не стоит, то ответ на этот вопрос вам на самом деле не нужен.

Атеизм — это религия? Трансгумагизм — это культ? Люди, утверждающие, что атеизм — религия, потому что «это совокупность убеждений о Боге», на самом деле стремятся доказать (как мне кажется), что методы рассуждений у атеистов примерно такие же, как и у религиозных людей, или что атеизм не менее опасен с точки зрения вероятности спровоцировать насилие, и так далее… В действительности же на кону стоят заявления атеистов о существенной разнице и даже превосходстве атеизма по отношению к религии, которое верующий стремится опровергнуть путем отрицания разницы, вместо того, чтобы опровергать превосходство(!).

Однако такое поведение нельзя считать заведомо иррациональным. Заведомо иррациональное происходит в тот миг, когда кто-то в ходе спора вытаскивает словарь, чтобы посмотреть определения «атеизма» и «религии». И это глупо независимо от того, кто это делает, атеист или верующий. Как вообще словарь может определить, отличается ли эмпирический кластер атеистов достаточно сильно от эмпирического кластера теологов? Как от изменения смысла слов может измениться реальность? Точки в пространстве вещей не сдвинутся с места, если мы нарисуем другие границы.

Но люди часто не понимают, что их спор про то, где нарисовать определяющую границу, на самом деле является спором про то, можно ли сделать вывод, что большинство вещей внутри некоего эмпирического кластера обладает некоторой общей характеристикой…

Отсюда и выражение — «замаскированный вопрос».

Перевод: 
Muyyd1, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
160
Оцените качество перевода: 
Средняя оценка: 4.3 (10 votes)

Нейронные категории

Элиезер Юдковский

В «Замаскированых вопросах» я рассказал про сортировку «сияиц» и «крубов». Обычное сияйцо — синее, яйцевидной формы, мохнатое, мягкое, непрозрачное, светится в темноте и содержит ванадий. Обычный круб — красный, кубический, гладкий, твердый, с просвечивающей поверхностью, не светится и содержит палладий. Что бы слегка упростить задачу, давайте пока отбросим характеристики мягкости/твердости и непрозрачности/просвечивающей поверхности. В нашем пространстве вещей остаётся пять измерений: цвет, форма, текстура поверхности, свечение и состав.

Предположим, что я хочу сделать искусственную нейронную сеть (ИНС), предсказывающую неизвестные характеристики сияйца на основе уже известных. Предположим также, что я пока неопытен в области создания ИНС. Я лишь прочел несколько увлекательных научно-популярных книг, где описано, что нейронные сети являются распределёнными, эмерджентными и вычисления в них идут параллельно — прямо как в человеческом мозге!!! Но я не могу вывести дифференциальные уравнения для градиентного спуска в не-рекуррентной многослойной нейронной сети с сигмоидной функцией активации (что на самом деле гораздо легче чем кажется).

Так что сделанная мной нейронная сеть будет выглядеть примерно так:

Сеть1

Сеть 1 предназначена для сортировки сияиц и крубов. Но поскольку «сияйцо» — незнакомый и искусственный концепт, для наглядности я изобразил похожую Сеть 1b для классификации людей и Космических Монстров, которая в качестве входных данных использует информацию, предоставленную Аристотелем («Все люди смертны») и философами Академии Платона («Двуногое без перьев и с плоскими ногтями»).

Для нейронной сети нужен алгоритм обучения. Очевидная идея: будем усиливать связь между двумя узлами, если эти узлы часто активируются одновременно. Это один из первых алгоритмов для обучения нейронных сетей, так же известный как правило Хебба.

Таким образом, если вы часто видите объекты, которые одновременно синие и пушистые, — то есть узел «цвет» активируется в состоянии «+» и одновременно узел «текстура» активируется в состоянии «+», — связь между цветом и текстурой усиливается, в результате чего активация «цвет+» будет вызывать активацию «текстура+» и наоборот. А если вы часто видите синие, яйцеподобные и содержащие ванадий объекты, то это усилит положительную взаимную связь между цветом, формой и содержанием.

Предположим, вы уже видели достаточно сияиц и крубов, спустившихся по конвейеру. Но вдруг вы видите, как по ленте приближается нечто пушистое, яйцевидное и — ну надо же! —красновато-фиолетовое (для нашей нейронной сети это будет означать активацию узла «цвет» с силой -2/3). Вы еще не тестировали светимость и содержимое. Каков будет ваш прогноз? Это сияйцо или круб?

Дальше мы увидим, как сила активации узлов в Сети 1 начнёт меняться. Положительная активация идет к светимости от формы, негативная — к содержимому от цвета, и от содержимого в светимости… Разумеется, все эти сигналы идут параллельно!!! И асинхронно!!! Прямо как в человеческом мозге…

Наконец Сеть 1 приходит в стабильное состояние, в котором узлы «светимость» и «содержимое» активированы очень сильно в положительную сторону. Сеть могла бы сказать, что нам следует «ожидать» (пусть мы это ещё и не проверяли), что этот объект светится в темноте и содержит ванадий.

И смотрите, Сеть 1 демонстрирует такое поведение, несмотря на отсутствие узла, который явно бы говорил, является ли объект сияйцом или нет. Вся сеть выносит имплицитную оценку!!! Сияйцность - аттрактор!!! Появляющийся в результате эмерджентного поведения!!! Благодаря распределенному обучающему алгоритму!!!

Сети с такой архитектурой могут казаться очень привлекательными, однако, использовать их в реальной жизни довольно проблематично. Сети с обратными связями не всегда быстро останавливаются: иногда в них начинаются колебания, иногда можно наблюдать хаотичное поведение, или же они просто слишком долго думают. Если вы видите что-то большое, желтое и полосатое, и вам надо ждать пять минут, прежде чем сеть придет к аттрактору «тигр», то это очень-очень плохо. Да, процессы в этих сетях идут асинхронно и параллельно, но этого всё равно не хватает для работы в реальном времени.

Есть и другие проблемы. Например, одно и то же свидетельство может оказаться учтено дважды, потому что сигнал ходит туда-сюда: вы подозреваете, что объект светится в темноте, это способствует активации убеждения о ванадии внутри объекта, что, в свою очередь, способствует активации убеждения о свечении в темноте.

К тому же, если вы захотите увеличить Сеть 1, это потребует $O(N^2)$ соединений, где $N$ - число наблюдаемых характеристик.

А как можно построить более реалистичную сеть?

Сеть2

В такой сети активируются сначала узлы, отвечающие за наблюдаемые характеристики, от них сигнал идет к центральному узлу, а от него к еще не активированным (отвечающим за ненаблюдаемые характеристики) узлам. Это означает, что мы можем вычислить ответ за один шаг, а не ждать, пока сеть успокоится. С точки зрения биологии это очень важно, ведь нейроны работают с частотой в 20 герц. И расширение сети с такой архитектурой требует $O(N)$ новых соединений, а не $O(N^2)$.

Следует признать, что некоторые выводы делать проще, используя сеть с архитектурой первого типа, чем второго. В Сети 1 каждые два узла соединены напрямую. Поэтому если красные объекты не светятся в темноте, но красным мохнатым объектам обычно свойственны и другие характеристики сияйца, вроде яйцевидности и ванадия, Сеть 1 может это легко воспроизвести. Потребуется лишь несколько сильных отрицательных связей от цвета к светимости и более сильных положительных связей от текстуры ко всем остальным узлам кроме светимости.

Но это не означает, что в правиле «сияйца светятся в темноте» появилось «особое исключение». В Сети 1 нет узла, отвечающего за «сияйцность». Сияйцность появляется как аттрактор в распределенной сети.

Поэтому, да, от этих $N^2$ соединений бывает польза. Но не часто. В реальных задачах мы редко наблюдаем животных, которые наполовину похожи на кошку, а наполовину — на собаку, и Сеть 1 для большинства таких реальных задач не подходит.

(Кроме того, есть факты, которые трудно воспроизвести как на Сети 1, так и на Сети 2. Предположим, что если лазурный цвет и сферическая форма встречаются одновременно, то это всегда означает наличие палладия. Однако, если эти характеристики присутствуют поодиночке, это является сильным свидетельством в пользу наличия ванадия. Если не вводить дополнительные узлы, на обеих сетях такое явление будет трудно воспроизвести. Архитектура и Сети 1, и Сети 2 неявно содержит предположение о том, какие связи между характеристиками возможны в реальности. В машинном обучении детей от взрослых отличает именно способность видеть такие неявные предположения.)

На самом деле, ни Сеть 1, ни Сеть 2 не похожи на реальные биологические системы. Однако, судя по всему, имеет смысл предполагать, что работа мозга в каком-то смысле ближе к Сети 2, чем к Сети 1. Сеть 2 быстрая, простая, масштабируемая и хорошо подходит для различения кошек от собак. Естественный отбор приходит к чему-то подобному точно так же, как вода стекает со склона холма.

Кажется, будто в задаче классификации объектов как сияиц или крубов и распределении их по корзинам нет ничего сложного. Но сможете ли вы заметить, что лазурные объекты никогда не светятся в темноте?

Возможно, вы обратите на это внимание, если окажетесь перед двадцатью объектами, которые будут различаться во всём, кроме лазурного цвета, и кто-нибудь выключит свет, и ни один из объектов не засветится. Другими словами, если ситуация будет такова, что не заметить отсутствие свечения в темноте будет почти невозможно. Возможно, когда вы понаблюдаете за всеми этими объектами вместе, ваш мозг сформирует новую подкатегорию и сможет определять характеристику «не светится» внутри этой подкатегории. Но если лазурные объекты будут рассеяны в куче из сотни других сияиц и крубов, то вы, скорее всего, ничего не заметите. Замечать подобные связи между характеристиками трудно и не интуитивно - по сравнению с различением кошек и собак.

Или: «Сократ - человек, все люди смертны, следовательно, Сократ смертен». Как Аристотель узнал, что Сократ был человеком? Ну, у Сократа не было перьев на теле, его ногти были плоскими, он был прямоходящим, говорил на греческом и, в целом, имел человеческую форму и вел себя как человек. И мозг решает — раз и навсегда, — что Сократ является человеком, и делает из этого вывод, что, как и все люди, которых он до этого наблюдал, Сократ тоже смертен. Вопрос о том, насколько ношение одежды связано со смертностью сильнее, чем умение говорить, кажется сложным и не интуитивным. Просто «то, что носит одежду и разговаривает — люди» и «люди смертны».

Существуют ли искажения, связанные с попыткой распределить объекты по категориям раз и навсегда? Разумеется, существуют. Например, читайте статью «Культовая контркультовость».

Продолжение следует…

Перевод: 
Muyyd1, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
161
Оцените качество перевода: 
Средняя оценка: 4.3 (8 votes)

Как алгоритм ощущается изнутри

Элиезер Юдковский

«Если в лесу падает дерево, и никто этого не слышит, то создаёт ли дерево звук?» Однажды я видел, как из-за этого вопроса разгорелся настоящий спор — совершенно наивный спор, который вообще не имел никакого отношения к берклианскому субъективизму. Просто:

— Оно производит звук, как и любое другое падающее дерево!

— Но что это за звук такой, которого никто не слышит?

Рационалист, скорее всего, разрешил бы этот вопрос так: первый человек под словом «звук» подразумевает акустические вибрации в воздухе, а второй — слуховое переживание в мозге. Если спросить «были ли акустические колебания?» или «было ли слуховое переживание?», ответ достаточно очевиден. Таким образом, оказывается, что весь спор ведётся вокруг определения слова «звук».

Я полагаю, что этот анализ по существу правильный. Давайте примем это за основу и спросим: почему люди спорят друг с другом по такому поводу? Какие явления с точки зрения психологии к этому приводят?

Ключевая идея концепции эвристик и искажений — ошибки часто рассказывают о процессе познания больше, чем правильные ответы. И если люди втягиваются в жаркий спор о том, производит ли звук дерево, падающее в необитаемом лесу, то обычно это считается ошибкой.

О каких особенностях работы разума может говорить такая ошибка?

В «Замаскированных вопросах» я рассказал о задаче классификации сияиц и крубов. В этой задаче Старшая Сортировщица Сьюзен объясняет, что ваша работа — сортировать предметы, поступающие по конвейерной ленте, и складывать синие яйца, или «сияйца» в одну корзину, а красные кубы, или «крубы» — в другую. Как оказывается позже, дело в том, что сияйца содержат ванадиевую руду, а крубы — кусочки палладия, и то, и другое используется в промышленности.

Однако, около 2% синих яйцевидных объектов содержат вместо ванадия палладий. Поэтому, если вы обнаружите синий яйцевидный предмет, содержащий палладий, может быть, следует назвать его «крубом»? Вы ведь собираетесь положить его в корзину для крубов — так почему не называть его «крубом»?

Но при этом, если выключить свет, почти все сияйца будут немного светиться в темноте. И синие яйцевидные объекты, содержащие палладий, будут светиться в темноте с той же вероятностью, как и любые другие синие яйцевидные объекты.

Таким образом, если вы увидите синий яйцевидный объект, содержащий палладий, и спросите: «Это сияйцо?», ответ будет зависеть от того, что вы собираетесь делать с объектом. Если вам нужно выяснить, в какую корзину поместить объект, то вы будете рассуждать о нём, как о крубе. Но если вы спросите: «Если выключить свет, будет ли объект светиться?», то объект стоит рассматривать как сияйцо. В одном случае под вопросом «Это сияйцо?» замаскирован вопрос «В какую корзину его поместить?». В другом случае замаскирован вопрос «Будет ли объект светиться в темноте?».

Предположим, вам попался синий содержащий палладий яйцевидный объект. И вы уже определили, что он еще и мохнатый, мягкий, непрозрачный и светится в темноте.

Теперь вы знаете ответы на все вопросы, у вас есть информация обо всех наблюдаемых характеристиках. Нет ни одного вопроса, за которым смог бы замаскироваться другой вопрос.

Так почему же у кого-то может появиться искушение поспорить о том, действительно ли это сияйцо?

Эта диаграмма из «Нейронных категорий» показывает две нейронные сети, с помощью которых можно получать ответы на вопросы про сияйца и крубы. У Сети 1 есть множество недостатков — она склонна скатываться к хаотичному поведению, в ней могут начаться колебания, при росте этой сети количество соединений растёт пропорционально квадрату числа элементов. Однако, у Сети 1 есть серьезное преимущество перед Сетью 2 — каждый узел первой сети соответствует наблюдаемой характеристике. Если вы пронаблюдаете все наблюдаемые характеристики, зафиксируете значение каждой, то узлов с неопределённым состоянием в сети не останется.

Однако, с другой стороны, если мы будем сравнивать эти две сети и человеческий мозг, то мы заметим, что работа Сети 2 больше похожа на работу мозга, пусть это и довольно условное сходство. Сеть 2 быстрая, простая, масштабируемая. И у неё есть дополнительный узел в центре, состояние которого может оказаться неопределённым даже после того, как мы зафиксировали значения окружающих его узлов.

То есть, даже когда вы знаете, синий это объект или красный, яйцевидный или кубический, мохнатый или гладкий, сияет или нет, содержит ванадий или палладий, остаётся ощущение, что у вас есть вопрос, на который вы так и не получили ответа. Действительно ли это сияйцо?

В повседневной жизни акустические колебания и слуховые переживания сопутствуют друг другу. Однако, в примере про падающее в необитаемом лесу дерево эта связь разрывается. Поэтому даже после того, как вы установили, что упавшее дерево создавало акустические колебания, но не слуховые переживания, вам кажется, что вы так и не получили ответа на вопрос: издавало ли упавшее дерево звук?

Мы знаем, где находится Плутон и куда он направляется. Мы знаем его форму и массу. Но всё-таки, это планета или нет?

Не забывайте: когда вы смотрите на схему Сети 2, которую я привожу здесь, вы видите алгоритм снаружи. Люди не спрашивают себя: «Должен ли активизироваться центральный узел?» — точно так же, как вы не думаете: «А должен ли возбуждаться нейрон № 12 234 320 242 в моей зрительной коре?»

Чтобы посмотреть на свой мозг «снаружи», вам нужно приложить осознанное усилие. И даже в этом случае вы не видите свой настоящий мозг, вы лишь представляете образы, которые для вас описывает ваш мозг. Я надеюсь, что ваши представления основаны на науке, но в любом случае интроспекция не даёт прямого доступа к структурам нейронных сетей. Поэтому древние греки и не изобрели вычислительную нейробиологию.

Когда вы смотрите на Сеть 2, вы видите её снаружи. Но если посмотреть, как эта нейронная структура ощущается изнутри, представить себя мозгом, который исполняет такой алгоритм, получится, что даже когда вы знаете все характеристики объекта, вы всё равно размышляете: «Это всё-таки сияйцо или нет?»

Воспринимать собственные представления о реальности именно как «представления о реальности» очень сложно, и я сталкивался с людьми, которые никак не могли этому научиться. Ведь нам всем кажется, что наши представления о реальности — это и есть сама реальность. Когда вы смотрите на зеленую кружку, вы не думаете о том, что вы видите картинку, созданную вашей зрительной корой, — хотя на самом деле вы видите именно её — вы просто видите зелёную кружку. Вы думаете: «Ну, да, эта кружка зеленая», а не: «Моя визуальная кора изображает эту кружку как зелёную».

Точно также, когда люди спорят про звук падающего дерева или про то, является ли Плутон планетой, они не видят себя людьми, спорящими должен ли активироваться узел, отвечающий за категоризацию, в их нейронных сетях или нет. Им просто кажется, будто дерево либо издает звук, либо нет.

Мы знаем, где находится Плутон и куда он направляется. Мы знаем его форму и массу. Но всё-таки, это планета или нет? Разумеется, кто-то скажет, что это спор об определениях. Но это всё равно высказывание с точки зрения Сети 2, потому что это спор о том, с какими наблюдаемыми характеристиками должен быть связан центральный узел. Если бы ваш разум был сконструирован по типу Сети 1, то вы бы не сказали: «Это зависит от того, как вы определяете слово „планета“ ». Вы ответили бы: «Поскольку мы знаем орбиту Плутона, его массу и форму, мы ответили на все вопросы». Более того, если бы вы были разумом, построенным по типу Сети 1, вам бы казалось, что тут в принципе нет никаких неотвеченных вопросов.

Прежде чем подвергать сомнениям свои представления о реальности, нужно понять, что ваш мысленный взор лишь смотрит на ваши представления о реальности — на результат работы мысленного алгоритма, видимый изнутри — а не воспринимает напрямую то, Как На Самом Деле Устроен Мир.

Я полагаю, что люди цепляются за свои представления о реальности не потому, что они считают свои когнитивные алгоритмы абсолютно надежными, а потому, что они не воспринимают свои представления о реальности как результат работы когнитивных алгоритмов, видимый изнутри.

И поэтому всё, что вы попробуете рассказать людям про некорректную работу встроенных когнитивных алгоритмов, люди будут сравнивать со своим прямым восприятием того, Как На Самом Деле Устроен Мир. И отбросят ваши утверждения как очевидно неверные.

Перевод: 
Muyyd1, Alaric, El_Aurens, Quilfe
Номер в книге "Рациональность: от ИИ до зомби": 
162
Оцените качество перевода: 
Средняя оценка: 4.3 (18 votes)

Споры об определениях

Элиезер Юдковский

Очень многие разговоры ­— даже разговоры о (предположительно) когнитивистике — скатываются в споры об определениях. Если взять в качестве примера классическое «Если дерево падает в лесу, и нет никого рядом, чтобы это услышать — создаёт ли дерево звук?», то ход последующего спора можно представить примерно следующим образом:

Если дерево падает в лесу, и нет никого рядом, чтобы это услышать, — создаёт ли дерево звук?

АЛЬБЕРТ: Разумеется! Что за глупый вопрос? Каждый раз, когда я слышал падение дерева, оно создавало звук, поэтому я считаю, что остальные деревья тоже создают звуки в процессе падения. Я не думаю, что мир ведёт себя по-разному в зависимости от того, смотрю я на него или нет.

БАРРИ: Секундочку! Если никто не может этого услышать, то как это может быть звуком?

В этом примере Барри спорит с Альбертом из-за действительно отличающегося интуитивного понимания того, что представляет из себя звук. Однако, Стандартный Диспут может возникнуть и множеством других путей. У Барри может быть мотив отвергать вывод Альберта. Или Барри может быть скептиком, который, услышав аргумент Альберта, машинально исследовал его на наличие логических ошибок, а затем, найдя контраргумент, автоматически принял его, не запустив второй слой поиска в попытке найти контрконтраргумент, таким образом убедив себя в правоте противоположной позиции. Для этого необязательно, чтобы прежняя интуиция Барри — та интуиция, которую проявил бы Барри, спроси мы его до того, как заговорил Альберт — отличалась от интуиции Альберта.

Ну, в любом случае, даже если интуиция Барри изначально не отличалась от альбертовой, сейчас они точно разнятся.

АЛЬБЕРТ: В смысле? Корни дерева ломаются, ствол начинает валиться и в итоге врезается в землю. Всё это создаёт вибрации, передающиеся по воздуху и через землю. Именно сюда уходит энергия падения: в тепло и звук. Ты хочешь сказать, что если люди ушли из леса, то деревья начинают нарушать закон сохранения энергии?

БАРРИ: Но никто ничего не слышит. Если в лесу нет людей — будем считать, что в лесу нет вообще никаких обладателей нервной системы, достаточно сложной для того, чтобы уметь «слышать» — то никто не слышит звука.

Альберт и Барри более подробно описали мысли, заставившие сработать или не сработать их детекторы «звука», и они ощущают, что завербованные ими аргументы поддерживают их позицию. Но всё же, пока что спор фокусируется на лесе, а не на определениях. И можно заметить, что спорщики, на самом деле, не расходятся во мнениях о том, что происходит в лесу.

АЛЬБЕРТ: Этот спор входит в тройку тупейших споров, в которых я когда-либо участвовал. Ты трясущийся фейчихахуа, замаринованный в запредельном идиотизме.

БАРРИ: Да ну? Это мне говорит человек, по которому видно, что в детстве его часто били по голове сельскохозяйственным инвентарём. Чтобы, видимо, потушить загоревшиеся волосы.

Оскорбление предложено и принято; теперь никто не может отступить, не боясь потерять лицо. Строго говоря, это нельзя назвать частью «спора» в понимании рационалистов, но эта сцена столь важна для развития Стандартного Диспута, что я всё равно решил упомянуть её здесь.

АЛЬБЕРТ: Дерево создаёт акустические вибрации. По определению, это звук.

БАРРИ: Никто ничего не слышит. По определению, это не звук.

Спор уходит в сторону, фокусируясь на определениях — несмотря на то, что довод «по определению» совершенно бессмыслен, когда речь идёт о чём-то приземлённее чистой математики. Важно помнить, что всё, верное «по определению» верно во всех возможных мирах, и поэтому наблюдение справедливости этого факта никогда не сможет сказать тебе, в каком именно мире ты живёшь: оно не ограничивает возможные миры.

АЛЬБЕРТ: Мой компьютер может записать звук — даже когда нет никого рядом, чтобы его услышать — и сохранить это в файл. Такие файлы называются «звуковыми файлами». В файле хранится последовательность колебаний воздуха, а не последовательность возбуждений нейронов чего-либо мозга. «Звук» означает последовательность колебаний.

Альберт отправляет в наступление аргумент, который кажется доводом в пользу того, что слово «звук» имеет определённое значение. Этот вопрос уже не имеет отношения к тому, происходили ли в лесу акустические вибрации. Однако, этот переход обычно остаётся незамеченным.

БАРРИ: Да ну? Давай посмотрим, согласится ли с тобой словарь.

Я увидел много вещей, вызывавших бы у меня любопытство, окажись я в этом сценарии. Можно пойти в лес и посмотреть на деревья, или разобраться в выводе волнового уравнения, касающегося колебаний воздуха, или проанализировать анатомическое строение уха, или изучить принципы работы слуховой коры мозга. Однако вместо того, чтобы заняться чем-либо из этого списка, я должен, очевидно, посоветоваться со словарём. Почему? Неужели словарь составляли профессиональные ботаники, врачи и нейробиологи? Я могу увидеть логику в решении заглянуть в энциклопедию, но причём тут словарь?

АЛЬБЕРТ: Вот! Определение 2c в Мерриэме-Уэбстере: «Звук: физическое явление, вызываемое колебательными движениями частиц воздуха или другой среды»

БАРРИ: Вот! Определение 2b в Мерриэме-Уэбстере: «Звук: чувство, вызываемое воздействием на орган слуха, восприятие слуховых ощущений»

АЛЬБЕРТ И БАРРИ, хором: Дурацкий словарь! Лучше не стало.

Редакторы словарей занимаются историей, а не законотворчеством. Редактор словаря находит используемые сейчас слова и записывает их; затем добавляет то (малую часть того), что, как ему кажется, имеют в виду люди, употребляющие это слово. Если употреблений несколько, то он записывает несколько определений.

АЛЬБЕРТ: Смотри. Предположим, я оставил в лесу микрофон и он записал последовательность акустических вибраций, связанных с падением дерева. Если кто-нибудь прослушает эту запись, он назовёт это «звуком»! Это — общепринятое употребление. Прекрати высасывать из пальца какие-то свои чокнутые определения!

БАРРИ: Во-первых, я могу определить слово так, как мне нравится. Главное — употреблять его последовательно. Во-вторых, моё значение имеется в словаре. В-третьих, кто дал тебе право решать, что можно считать общепринятым употреблением, а что нельзя?

С точки зрения рациональности, Стандартный Диспут кишит ошибками. Часть этих ошибок я уже описал, и часть из них мне ещё предстоит описать; то же самое касается и средств защиты от них.

Но сейчас я хочу лишь обратить ваше внимание на то, что Барри и Альберт, скорее всего, дадут один и тот же ответ на любой вопрос, касающийся вещей, действительно происходящих внутри леса, но всё равно никто из них не чувствует этого согласия. Просто печальное напоминание.

Споры об определениях — ложная тропинка, незаметно ведущая в тупик. Никто не пошёл бы по этой тропинке, если бы знал, куда она ведёт. Если спросить у Альберта (или у Барри), почему он до сих пор участвует в споре, то он бы ответил что-то вроде «этот подлый негодяй Барри (или Альберт) пытается протащить контрабандой своё определение слова «звук», чтобы обосновать своё смехотворное мнение; и мой долг — защитить стандартное определение»

Но представим, что я вернулся назад во времени и успел оказаться рядом с Барри и Альбертом до начала спора.

(Из ниоткуда возникает Элиезер, сидящий внутри своеобразного транспортного средства, очень похожего на машину времени из старого фильма «Машина времени»)

БАРРИ: Боже! Путешественник во времени!

ЭЛИЕЗЕР: Я прибыл к вам из будущего! Внимайте моим словам! Я прошёл долгий путь — около пятнадцати минут — для того, чтобы…

АЛЬБЕРТ: Пятнадцать минут?

ЭЛИЕЗЕР: …для того, чтобы задать вам этот вопрос!

(Немая сцена, пропитанная смесью замешательства и предвкушения)

ЭЛИЕЗЕР: Вы считаете, что слово «звук» должно означать как акустические вибрации (волны давления, передающиеся через физический объект-проводник), так и слуховые впечатления (восприятие кем-то звука)? Или вы считаете, что «звук» нужно определить так, чтобы он означал только лишь акустические вибрации, или только лишь аудиторные переживания?

БАРРИ: Ты вернулся в прошлое, чтобы спросить у нас вот это?

ЭЛИЕЗЕР: Мои мотивы — моё личное дело! Отвечайте!

АЛЬБЕРТ: Эммм… Я не понимаю, почему это должно кого-то беспокоить. Можно выбрать любое определение. Главное, употреблять его последовательно.

БАРРИ: Брось монетку. Точнее, брось монетку дважды.

ЭЛИЕЗЕР: Я считаю, что, в случае возникновения такой проблемы, обе стороны должны взглянуть на происходящее уровнем организации ниже и начать описывать событие, используя более элементарные компоненты: например, акустические вибрации или слуховые впечатления. Или каждая сторона может придумать новое слово — например «алберзаль» или «баргулум» — для того понятия, которое они ранее обозначали словом «звук»; это позволяет обеим сторонам употреблять новые слова последовательно. Таким образом, никому не придётся пойти на уступки или потерять лицо, но при этом возможность успешного обмена информацией сохраняется. Ну и, разумеется, всегда стоит отслеживать, о каком именно утверждении, доступном для проверки опытом, идёт речь. Вы считаете мои предложения разумными?

АЛЬБЕРТ: Видимо, да…

БАРРИ: Зачем мы об этом разговариваем?

ЭЛИЕЗЕР: Чтобы сберечь вашу дружбу пред лицом неожиданной беды, о которой вы — отныне и теперь — никогда не узнаете, ибо будущее уже изменилось!

(Элиезер и машина исчезают в клубах дыма)

БАРРИ: На чём мы остановились?

АЛЬБЕРТ: Секундочку… Вот: «Если дерево падает в лесу, и нет никого рядом, чтобы это услышать — создаёт ли дерево звук?»

БАРРИ: Оно создаёт алберзаль, но не баргулум. Давай дальше.

Этот рецепт не уничтожает каждый диспут о категоризации. Однако, он уничтожает значительную их долю.

Перевод: 
BT
Номер в книге "Рациональность: от ИИ до зомби": 
163
Оцените качество перевода: 
Средняя оценка: 3.9 (36 votes)

Ощути смысл

Элиезер Юдковский

Когда я слышу, как кто-то говорит: «Смотрите — бабочка», произнесенные фонемы «бабочка» попадают в мои уши и вибрируют в барабанных перепонках, попадают во внутреннее ухо, «щекочут» нервы, что приводит к активации нейронов слуховой коры. В которой начинается обработка этих фонем — распознавание слов, реконструкция синтаксиса и прочие сложности.

Но в итоге, через несколько мгновений, у меня появится желание взглянуть туда, куда указывает мой друг, и я увижу там визуальный паттерн, который будет интерпретирован как бабочка. И я довольно сильно удивлюсь, если вместо бабочки я увижу волка.

Мой друг смотрит на бабочку, его горло вибрирует, а губы движутся, звуковые волны незримо передаются по воздуху, мои уши слышат, нервы передают и мой мозг распознает и, ну надо же, я понимаю, на что смотрит мой друг. Разве это не чудо? Если бы мы не знали про звуковые волны, то все газеты трубили бы о невероятном открытии — люди владеют телепатией! Человеческие мозги способны передавать мысли друг другу!

Да, мы действительно телепаты. Однако, если магия является обыденностью и все ваши друзья ею тоже владеют, она никому не интересна.

Думаете, телепатия — это просто? Попробуйте собрать компьютер, который будет телепатически общаться с вами. Телепатия или «язык», или как вам будет угодно назвать нашу способность к частичной передаче мыслей, сложнее чем кажется.

Однако, было бы довольно неудобно думать что-то вроде: «Сейчас я преобразую часть моих мыслей в линейную последовательность фонем, которые вызовут похожие мысли у моего партнёра по диалогу…»

Поэтому мозг прячет от нас сложность, точнее даже вовсе её не показывает. И это приводит к тому, что у людей появляется странное представление о словах.

Как я отметил ранее, когда большой желтый и полосатый объект кидается на меня, я думаю: «А-а-а! Тигр!», а не «Так… Объект с характеристиками огромности, желтости и полосатости был ранее отмечен как обладающий еще и характеристиками «голодный» и «опасный», следовательно, хотя логически это и не выводимо, а-а-а… ХРУМ-ХРУМ-ХРУМ».

Точно также естественный отбор не станет содействовать организму, который, услышав: «А-а-а! Тигр!», будет думать: «Так… Я только что услышал «Ти» и «гр», которые у моих соплеменников ассоциируются с их внутренними аналогами моего концепта «тигр», и они, скорее всего, склонны издавать эти звуки, заметив объект, который они классифицируют как а-а-а-и-и-и-и ХРУМ-ХРУМ помогите он откусил мне руку ХРУМ-ХРУМ».

Можно рассматривать это как проектное ограничение когнитивной архитектуры у людей — любому хотелось бы, чтобы у него не было лишних шагов между распознаванием слуховой корой звуков «тигр» и активацией концепта тигра.

Вернёмся к притче о сияйцах и крубах и к централизованной сети, которая быстро и легко распределяет объекты по категориям. Можно представить себе прямую связь между узлом, который распознаёт слово «сияйцо», и узлом в центре сети. Центральный узел — понятие сияйца — активируется почти сразу же, как Старшая Сортировщица Сьюзен говорит: «Сияйцо!»

Или в целях передачи информации — на что тоже не должна уходить вечность — как только вы видите синюю штуку в форме яйца, и центральный узел «сияйцо» возбуждается, вы кричите Сьюзен: «Сияйцо!»

И изнутри этот алгоритм ощущается так, как будто ярлык и понятие очень тесно связаны. Смысл кажется неким свойством, присущим самому слову.

Знатоки распознают в этом ещё один частный случай «ошибки проецирования ума» по Э. Т. Джейнсу. Нам кажется, будто у слова есть смысл, и этот смысл — свойство самого слова, точно так же, как краснота — свойство красного яблока, а таинственность — свойство таинственного явления.

Более того, в большинстве случаев мозг не проводит границу между словом и его значением — разве что при изучении нового языка он позаботится отделить одно от другого. И даже тогда, если вы увидите, как Сьюзен указывает на синий яйцевидный предмет и говорит «Сияйцо!», вы подумаете: «Интересно, что значит „сияйцо“?», а не «Интересно, какую мысленную категорию Сьюзен связывает со звуковым ярлыком „сияйцо“?».

Рассмотрим в свете этого ту часть стандартного спора об определениях, где две стороны спорят о том, что на самом деле означает слово «звук». Точно также они могли бы спорить о том, красного или зелёного цвета одно конкретное яблоко.

Альберт:
— Микрофон моего компьютера может записать звук, даже когда рядом нет никого, кто мог бы его услышать, сохранить его в файл, и этот файл будет называться «звуковым». И то, что сохранено в файле — это последовательность вибраций воздуха, а не последовательность возбуждения нейронов в чьём-то мозгу. «Звук» — это последовательность вибраций.

Барри:
— Что, серьёзно? А давай посмотрим, что словарь скажет по этому поводу?

Альберт интуитивно чувствует, что у слова «звук» есть смысл, и этот смысл — акустические вибрации. А ещё он чувствует, что дерево, падающее в лесу, производит звук (а не становится причиной явления, попадающего в категорию «звук»).

Барри, в свою очередь, ощущает, что

звук.смысл == слуховые переживания
лес.звук == неверно

А не:

мойМозг.НайтиПонятие("звук") == понятие_СлуховоеПереживание
понятие_СлуховоеПереживание.совпадение(лес) == неверно

Хотя последнее гораздо ближе к тому, что на самом деле происходит. Однако, эволюция не готовила людей к этому знанию, во всяком случае, не больше, чем к инстинктивному знанию о том, что мозг состоит из нейронов.

Противоречащие друг другу интуитивные представления Альберта и Барри подливают масла в огонь дискуссии, уже дошедшей до того, что они спорят о том, что значит слово «звук». И им кажется, что они спорят о факте, не отличающемся от любого другого факта, и этот спор ничем не отличается от, например, спора, является ли небо голубым или зелёным.

Вы можете даже не заметить, что забрели совсем не туда, пока не попытаетесь исполнить рационалистский ритуал: предложить проверяемый эксперимент, результат которого зависит от фактов, о которых вы так горячо спорите…

Перевод: 
El_Aurens, Muyyd1, Alaric, Quilfe
Номер в книге "Рациональность: от ИИ до зомби": 
164
Оцените качество перевода: 
Средняя оценка: 5 (4 votes)

Аргумент к традиционному пониманию

Элиезер Юдковский

«Стандартный спор об определениях» иногда содержит примерно такой фрагмент:

Альберт:
— Предположим, я оставил в лесу микрофон и записал последовательность акустических вибраций от падающего дерева. Если я проиграю кому-нибудь запись, они скажут, что на записи «звук». Традиционно это слово понимается именно так! И не надо тут выдумывать всякие ненормальные определения!

Барри:
— Во-первых, я могу определять значение слова так, как мне угодно, главное, что я использую его последовательно. Во-вторых, значение, которое я в него вкладываю, есть в словаре. В-третьих, кто дал вам право решать, какое понимание слова соответствует традиции, а какое — нет?

Само понятие традиционного понимания слова всплывает не во всех спорах об определениях. По-моему, чаще всего люди берут в руки словарь, потому что считают, что у слов есть смысл и что словарь прилежно фиксирует, какой именно. Некоторые люди, судя по всему, даже верят, что словарь определяет смысл слов и составители словаря для этих людей — это законодатели языка. Может быть, это потому, что в начальной школе учитель — авторитет для них в то время — сказал им, что они должны подчиняться словарю? И с тех пор они считают, что это обязательное к исполнению правило?

Составители словарей читают то, что пишут другие люди, и фиксируют, что эти слова, судя по всему, означают. Они — историки. Оксфордский словарь может исчерпывающе описывать лексику английского языка, но он не имеет силы закона.

Но разве не существует социального императива, предписывающего нам использовать слова в том смысле, в котором они обычно понимаются? Разве наша человеческая телепатия, наша драгоценная сила языка, не требует всеобщей слаженности усилий? Быть может, нам добровольно следует относиться к редакторам словарей, как к верховным судьям, — даже если они предпочитают считать себя историками, — просто чтобы поддерживать молчаливое соглашение, от которого зависит вся речь.

Словосочетание «авторитетный словарь» некорректно почти во всех случаях. Как пример исключения можно упомянуть «Официальный словарь терминов стандартов IEEE»1. Членам IEEE необходимо достигать чёткого соглашения о терминах и определениях, они решают вопросы голосованием, и потому «Официальный словарь терминов стандартов IEEE» — это настоящий закон, авторитет которого поддерживается авторитетом IEEE.

В отличии от IEEE, в обычной жизни язык возникает не в результате обдуманного соглашения. Скорее, он больше похож на инфекцию — кто-то придумывает слово, а потом оно растворяется в культуре. (Кто-нибудь мог бы вспомнить слово «мем», предложенное Ричардом Докинзом тридцать лет назад. Но вы и так уже поняли, о чём я тут пишу. Если же нет, можете воспользоваться Гуглом и тоже заразиться этим словом.)

И тем не менее, как показывает пример IEEE, соглашение относительно используемого языка тоже может быть совместно созданным общественным благом. Если мы желаем обменяться мыслями посредством языка, человеческой телепатии, то использование одного и того же слова для схожих концептов — в наших общих интересах. (Конечно, предпочтительней, если эти концепты будут схожи с точностью до предела разрешения нашего мысленного представления.) При этом у нас может не быть никаких общих интересов использовать какое-то конкретное слово.

С точки зрения общих интересов, не слишком важно, используем ли мы слово «ото» для обозначения звука или «звук» для обозначения ото. Однако, в наших общих интересах использовать одно и то же слово, каким бы оно ни было. (Предпочтительно, чтобы часто употребляемые слова были короткими, но не будем пока углубляться в теорию информации).

Использование одинаковых ярлыков для размышлений — тоже в общих интересах, но острой необходимости в этом нет. Так просто удобней. Если я знаю, что «ото» для вас означает «звук» (то есть, вы ассоциируете слово «ото» с концептом, который очень похож на тот, с которым я ассоциирую слово «звук»), то я могу сказать: «При сминании бумага издаёт хрустящий ото». Для этого мне придется приложить лишь чуть больше усилий.

Точно также, если вы скажете: «Какую трость создаёт упавший на пол шар для боулинга?» и я знаю, какой концепт у вас связан с фонемами «трость», то я смогу понять, что вы подразумевали. Возможно, мне придётся на некоторое время задуматься, потому что обычно слово «трость» у меня связано с другим концептом. Но я вполне неплохо всё пойму.

Желающих пообщаться людей трудно остановить! Даже оказавшись на необитаемом острове без общего языка, мы можем взять в руки палки и общаться с помощью изображений на песке.

Альберт, используя «аргумент к традиционному пониманию», подразумевает, что соглашение о языке является совместно установленным общественным благом. Тем не менее, единственная цель Альберта в этот момент — в полемических целях обвинить Барри в нарушении соглашения и угрозе общему благу. Спор о падающем дереве больше не сводится к ботанике или семантике. Теперь это политический спор. И Барри в ответ оспаривает право Альберта устанавливать определения.

Владеющий навыком «ухватить задачу» рационалист заметит, что спорщики сильно отклонились от темы разговора.

Уважаемый читатель, неужели это всё действительно необходимо? Ведь Альберт знает, что Барри подразумевает под «звуком». Барри знает, что Альберт подразумевает под «звуком». Оба они знают о словосочетаниях «акустические вибрации» и «слуховые переживания», и каждое из этих словосочетаний у обоих связано с одним и тем же концептом, и эти концепты, в свою очередь, описывают происходящие в лесу события без каких-либо двусмысленностей. Если бы Альберт и Барри попали на необитаемый остров и попытались бы обменяться информацией, у них не возникло бы проблем.

Метод ведения дискуссии, при котором обе стороны знают, что хочет сказать оппонент, и одновременно обвиняют друг друга в предательстве общего блага (которое состоит в отказе от «традиционного понимания»), очевидно, не слишком эффективен для коммуникации. А ведь весь смысл одинакового использования одинаковых слов состоит именно в том, чтобы успешно передавать информацию.

Так зачем же спорить о значении слов? Если проблема заключается лишь в конфликте имён, который разросся до невиданных масштабов, если речь только о том, что два разных понятия оказались названы одним словом, то обеим сторонам нужно лишь придумать два новых слова и последовательно их использовать.

Однако, процессу классификации часто сопутствуют скрытые умозаключения и замаскированные вопросы. Атеизм — это «религия»? Если кто-то доказывает, что в атеизме используются рассуждения, схожие с теми, что используются в иудаизме, или что атеизм провоцирует насилие в таких же количествах, что и ислам, то у этого человека есть очевидный мотив запихать всё, что ему кажется общим, в размытое понятие «веры».

Или рассмотрим спор о том, должны ли «чёрные» и «белые» принадлежать к одной категории «люди». Здесь нет смысла придумывать два новых слова, ведь обсуждается именно идея, что между ними с точки зрения морали не следует проводить границу.

Однако, когда решается эмпирический или моральный вопрос, апеллировать к традиционному пониманию слова уже нельзя.

Если мы решаем, как объединять схожие объекты, чтобы потом получить некий вывод, то наш итоговый эмпирический ответ будет зависеть от того, как и что мы объединили. А это означает, что определения могут быть неверными. На основании разных определений мы сделаем разные предсказания. И нельзя голосованием решить, какое из них правильное.

Если для какого-то эмпирического вывода вам нужно понять, стоит ли объединять в одну группу атеизм и религии с верой в сверхъестественное, то вы не найдете ответ в словаре.

И если вы хотите понять, являются ли чернокожие людьми, вы не найдете ответ в словаре.

Ведь если все будут верить, что красная точка на ночном небе — это Марс, Бог Войны, словарь будет определять «Марс», как «Бог Войны». Если все будут верить, что огонь — это высвобождение флогистона, то словарь и будет определять «огонь» как «высвобождение флогистона».

Использование слов — это своего рода искусство. Даже когда определения не являются в буквальном смысле истинными или ложными, они могут быть более умными или более дурацкими. Составители словарей всего лишь историки, описывающие, как слова употреблялись в прошлом. Если вы будете смотреть на них, как на верховных судей, определяющих смыслы слов, это привяжет вас к мудрости прошлого и лишит возможности стать лучше.

Однако, отступив от мудрости прошлого, постарайтесь убедиться, что люди смогут догадаться, о чём вы плывёте.

  • 1. «Официальный словарь» в этом названии в оригинале тоже пишется как «authoritative dictionary» — «авторитетный словарь». — Прим.перев.
Перевод: 
Muyyd1, Alaric, El_Aurens, Quilfe
Номер в книге "Рациональность: от ИИ до зомби": 
165
Оцените качество перевода: 
Средняя оценка: 4.9 (15 votes)

Пустые ярлыки

Элиезер Юдковский

Давайте рассмотрим (да, опять) аристотелевскую идею категорий. Предположим, у нас есть объект со свойствами A, B, C, D, и E (ну или по крайней мере он выглядит похожим на Е).

Фред: Ты имеешь ввиду вон ту штуку синего цвета, круглую, пушистую и…

Я: В рамках аристотелевской логики конкретные свойства или их названия не важны. Поэтому я просто использую буквы.

Далее, я выдумываю аристотелевскую категорию «зава», описывающую все те и только те объекты, у которых есть свойства A, C, и D.

Я: У объекта 1 есть свойства зава, В и Е.

Фред: А еще он синий, то есть А, так ведь?

Я: Когда я говорю, что у него есть свойство зава, это подразумевается.

Фред: Да, но я все же хочу, чтобы ты упомянул это в явной форме.

Я: Хорошо. У объекта 1 есть свойства А, В, зава и Е.

Теперь я ввожу новое слово «юки», которое описывает те и только те объекты, которые обладают свойствами В и Е. И слово «зиппо», описывающее те и только те объекты, которые обладают свойством Е, но не свойством D.

Я: Объект 1 — зава и юки, но не зиппо.

Фред: Подожди, он ведь светится? Я имею ввиду — он же Е?

Я: Да. С учетом имеющейся информации, иначе и быть не может.

Фред: Я бы предпочёл, чтобы ты проговаривал такие вещи.

Я: Ладно. Объект 1 — А, зава, В, юки, C, D, E, но не зиппо.

Фред: Потрясающе! И это все можно понять, просто посмотрев на объект?

Впечатляет, правда? Давайте введем больше слов. «Боло» — А, С и юки. «Мун» — А, С и зиппо. И «мерлакдониан» — боло и мун.

Кажется бессмысленно запутанным? Я тоже так думаю. Давайте заменим ярлыки на определения.

«Зава, В и Е» превращается в [A, C, D], B, E.

«Боло и А» превращается в [A, C, [B, E]], A.

«Мерлакдониан» превращается в [A, C, [B, E]], [A, C, [E, ~D]].

Важно помнить: аристотелевская идея категорий подразумевает, что [A, C, D] — это вся информация о «зава». Я могу не только использовать любой ярлык, но и прекрасно обойдусь совсем без ярлыков — правила, регулирующие аристотелевские классы, замечательно работают и для структур вроде [A, C, D]. Использование ярлыка «зава» или какого-либо другого нужно лишь для нашего удобства (или неудобства), а для правил никакой разницы нет.

Предположим, что «человек» определяется как «двуногое смертное существо без перьев». В таком случае классический силлогизм будет выглядеть так:

Все [смертные, ~оперенные, двуногие] смертны.

Сократ — [смертный, ~оперенный, двуногий].

Следовательно, Сократ смертен.

Теперь этот приём выглядит не так впечатляюще, не правда ли?

Ярлыки здесь скрывают посылки, и благодаря этому создаётся иллюзия, что мы получили какой-то нетривиальный вывод. Если мы заменяем ярлыки определениями, то мы видим эту иллюзию и понимаем эмпирическую бесполезность тавтологии. Нельзя утверждать, что Сократ [смертный, ~оперенный, двуногий], не пронаблюдав его смертность.

Существует идея (которую, как вы, наверное, заметили, я ненавижу): «вы можете определять слова как вам угодно». Эта идея происходит от аристотелевских категорий. Действительно, если вы будете строго и безошибочно следовать правилам Аристотеля - люди никогда так не делают, Аристотель прекрасно знал, что Сократ был человеком, хотя из его правил это никак не вытекало, - но если какая-то воображаемая нечеловеческая сущность будет строго следовать этим правилам, она никогда не придёт к противоречию. Она вообще ни к чему не придёт, она тоже не сможет сказать, что Сократ [смертный, ~оперенный, двуногий], не пронаблюдав его смертность.

В рамках аристотелевской системы ярлыки произвольны. Однако, я хочу сказать не столько об этом, сколько о том, что аристотелевская система замечательно работает и вовсе без ярлыков. Она выдаёт точно такой же поток тавтологий, просто эти тавтологии выглядят гораздо менее впечатляюще. Ярлыки нужны лишь для создания иллюзии нетривиального вывода.

Поэтому, если вы желаете ввести какую-то поговорку в аристотелевском духе, то она должна звучать не как «Я могу определять слова как захочу» или «Процесс определения слова не имеет последствий», а скорее как «Определения не нуждаются в словах».

Перевод: 
Muyyd1, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
166
Оцените качество перевода: 
Средняя оценка: 3.7 (9 votes)

Табуируй свои слова

Элиезер Юдковский

По правилам игры «Табу» от Hasbro необходимо помочь партнёру угадать слово, напечатанное на карточке, не произнеся при этом ни самого слова, ни ещё пяти дополнительных, напечатанных на карточке. Например, как бы вы объяснили слово «бейсбол», не используя слов «спорт», «бита», «удар», «подача», «база» (и, разумеется, «бейсбол»)?

Попав в такую ситуацию я бы, ни секунды не задумываясь, сказал «искусственный групповой конфликт, в котором нужно шарахнуть продолговатым деревянным цилиндром по брошенному сфероиду и затем пробежаться по четырём безопасным позициям». Можно, конечно, найти и более эффективный способ передать слово «бейсбол» без нарушения правил игры, например — «То, во что играют Янкис»1. Вообще, навык исключения отдельных слов из собственных мыслей я развивал много лет и не для игры.

В предыдущем эссе было видно, как раскрытие определений на месте соответствующих слов позволяет выявить эмпирическую непродуктивность классического аристотелевского силлогизма: «Все люди смертны (и, по-видимому, двуногие без перьев). Сократ — человек. Следовательно, Сократ смертен». Если заменить здесь слово «человек» его мнимым определением, то выявится подразумеваемая цепочка заключений:

Все [смертные, ~пернатые, двуногие] смертны.
Сократ — [смертный, ~пернатый, двуногий].
Следовательно, Сократ смертен.

Принцип замены слов их определениями можно применять гораздо более широко:

АЛЬБЕРТ: Дерево, падающее в пустом лесу, создаёт звук.
БАРРИ: Дерево, падающее в пустом лесу, не создаёт звука.2

Поскольку один говорит «звук», а другой «~звук», то мы явно нашли противоречие, верно? Но представим, что было бы, если бы собеседники сначала разыменовали указатели3:

АЛЬБЕРТ: Дерево, падающее в пустом лесу, удовлетворяет [проверка принадлежности: это событие порождает акустические вибрации].
БАРРИ: Дерево, падающее в пустом лесу, не удовлетворяет [проверка принадлежности: это событие порождает слуховые впечатления].

Теперь мнимое противоречие исчезло и для этого было достаточно всего лишь запретить использовать слово «звук». В случае, если разногласия возникнут вокруг термина «акустические вибрации», можно табуировать и его, заменив на «волны давления, распространяющиеся в физической среде». При необходимости можно наложить табу на слово «волна» и заменить его волновым уравнением. Если затабуировать «слуховые впечатления», то получим «форма обработки сенсорной информации человеческим мозгом, принимающая на вход временной ряд смешанных частот».

Спор вокруг силлогизма можно переформулировать следующим образом:

АЛЬБЕРТ: Сократ входит в категорию [проверка принадлежности: эта личность погибнет, выпив настойку болиголова].
БАРРИ: Сократ входит в категорию [проверка принадлежности: эта личность не погибнет, выпив настойку болиголова].

Видно, что ожидания Альберта и Барри существенно расходятся: спорщики ожидают наблюдать различные события после того, как Сократ выпьет настойку болиголова. Этого противоречия сложно было бы заметить, если бы оба они использовали общее слово «человек», подразумевая под ним каждый своё.

В зависимости от того, за чем следить в диалоге: за ярлыками (Альберт говорит «звук», Барри говорит «не звук»), либо за испытаниями (Альберт предложил проверку на акустические вибрации, Барри предложил проверку на слуховые впечатления), можно прийти к сильно различающимся выводам по поводу того, с чем спорщики согласны и не согласны между собой.

Если на конгрессе так называемых футурологов спросить, появится ли искусственный интеллект в ближайшие тридцать лет, то, я думаю, по крайней мере половина из них ответит утвердительно. Без дополнительного регулирования они разойдутся довольные собой и достигнутым консенсусом. Однако стоит лишь наложить табу на термин «искусственный интеллект» (а так же на слова «компьютеры», «мыслить» и прочее), а после поинтересоваться, что именно они ожидают увидеть — и, вполне возможно, обнаружится конфликт ожиданий, скрывавшийся под неприметным привычным словом. Шейн Легг4, например, собрал 71 определение слову «интеллект».

Иллюзию согласия между различными религиями можно рассеять, наложив табу на слово «Бог» и попросив верующих объяснить, в чём именно состоят их убеждения, либо наложив табу на слово «вера» и попросив верующих объяснить, почему они носят свои убеждения. Правда, большинство не сможет хоть чего-нибудь ответить вообще: большая часть их убеждений — всего лишь провозглашения, а аудиозапись можно разглядывать хоть под микроскопом, но не найти при этом разъяснения терминов.

Столкнувшись с философскими трудностями, старайтесь не бросаться выяснять определения спорных терминов, а пытайтесь мыслить не используя вообще ни этих терминов, ни их синонимов. Старайтесь так же не изобрести случайно какого-нибудь слова на замену табуированным. Описывайте внешние наблюдения и внутренние механизмы — недостаточно оперировать идентификатором, каким бы он ни был.

Альберт считает, что люди обладают «свободой воли». Барри считает, что люди не обладают «свободой воли». Ну что же, тут явно назревает мнимый спор. Большинство философов посоветовали бы Альберту и Барри постараться как можно точнее определить, что именно они называют «свободой воли», что привело бы разговор в плоскость, в которой они сами готовы рассуждать часами. Я бы посоветовал Альберту и Барри описать, каким именно качеством, по их мнению, обладают (либо не обладают) люди, вообще не используя при этом слов «свобода воли». Попробуйте проделать это в качестве домашнего задания, исключив так же слова «выбирать», «действовать», «решать», «предопределено», «ответственность», а так же их синонимов.

Табуирование — один из множества нестандартных приёмов в моём арсенале, и, по моему скромному мнению, этот приём работает намного лучше стандартного. Хоть он и более энергозатратен, зато полностью себя окупает.

  • 1. Известный американский бейсбольный клуб, см. https://ru.wikipedia.org/wiki/Нью-Йорк_Янкис — Здесь и далее примечания переводчика.
  • 2. Спорщики Альберт и Барри впервые появляются в эссе https://lesswrong.ru/w/Спорыобопределениях
  • 3. Юдковский ссылается на понятие из программирования, когда в некой переменной X(«указателе»), содержится адрес ячейки в памяти, в которой содержится значение некой переменной Y, и для того, чтобы оперировать значением переменной Y, необходимо сначала «разыменовать» указатель X — получить по адресу памяти значение переменной Y. См. https://ru.wikipedia.org/wiki/Указатель(типданных)
  • 4. Шейн Легг — исследователь искусственного интеллекта, В 2010 г. основал компанию DeepMind, см. https://ru.wikipedia.org/wiki/DeepMind
Перевод: 
BT, ildaar
Номер в книге "Рациональность: от ИИ до зомби": 
167
Оцените качество перевода: 
Средняя оценка: 3.9 (37 votes)

Замени символ на суть

Элиезер Юдковский

Что нужно, чтобы (как в предыдущем эссе) воспринимать «бейсбол» как «искусственный групповой конфликт, в котором вы длинным деревянным цилиндром наносите удары по брошенному сфероиду и затем перебегаете между четырьмя безопасными позициями»? Что нужно, чтобы играть в рационалистскую версию «Табу», цель которой не вспомнить синоним, которого нет на карточке, а придумать, как описать явление, не используя привычных концептов в качестве костылей?

Нужно визуализировать. Заставлять свой внутренний взор воспринимать детали так, будто вы их видите впервые. Необходимо смотреть cвежим взглядом.

Это «бита»? Нет, это длинный, округлый, конусообразный, деревянный стержень, сужающийся у одного конца так, чтобы человек мог ухватить его и махнуть им.

Это «мяч»? Нет, это покрытый кожей сфероид, покрытый симметричным узором стежков, твердый, но не как металл. Его можно взять в руку и бросить, или ударить деревянным стрежнем, или поймать.

Это «базы»? Нет, это фиксированные позиции на игровом поле, которые игроки стараются достигнуть как можно быстрей из-за их «безопасности» в рамках искусственных правил игры.

Больше всего свежему взгляду мешает то, что у вашего разума уже есть готовые короткие обобщения в виде удобных простых концептов. Вроде «бейсбола», «биты», «базы». Нужны сознательные усилия, чтобы не дать разуму соскользнуть на привычную дорожку, легкий путь наименьшего сопротивления, где мелкое невыразительное слово врывается и смывает все детали, которые вы стараетесь увидеть. Слово само по себе может нести в себе разрушительную силу ярлыков и яд кешированных мыслей.

Табуирование — способность описывать без использования привычных указателей/ярлыков/инструментов — одна из фундаментальных способностей рационалиста. Она находится на том же базовом уровне, что и привычка постоянно задавать вопросы: «Почему?» или «Какие ожидания порождает это убеждение?».

Это искусство тесно связано с:

  • Прагматизмом. Табуирование лучше помогает сосредоточить внимание на ожиданиях, чем обычное проговаривание убеждений.
  • Редукционизмом. Табуирование заставляет вас обращать внимание на то, как устроен рассматриваемый объект или явление на более низком уровне. Вы обращаете внимание на части, а не скользите взглядом по целому.
  • Умением «ухватить задачу». Слова часто отвлекают от вопроса, который вы хотите задать на самом деле.
  • Избеганием кешированных мыслей, которые заполняют разум при использовании привычных слов. Табуирование привычных слов позволяет с этим справиться.
  • С правилом писателей «показывай, а не рассказывай», уважаемому рационалистами.
  • И умением не терять из виду исходную цель.

Как табуирование помогает не терять из виду цель?

Из «Потерянных целей»:

Прямо сейчас, когда вы читаете эти строки, какой-нибудь студент сидит за партой в университете и старательно изучает материал, который ему сам по себе не интересен и который, по его мнению, ему никогда не пригодится. Студенту нужна высокооплачиваемая работа, а для неё требуется «корочка», а для получения «корочки» требуется степень магистра, а до степени магистра нужно получить степень бакалавра, а университет, который предлагает степень бакалавра, требует, чтобы для её получения вы посетили занятия по узорам вязания двенадцатого века. И студент прилежно изучает эти узоры. Он планирует забыть про них сразу же после сдачи экзамена, но тем не менее всерьёз возится с ними, потому что ему очень нужна «корочка».

Зачем вы ходите в «школу»? Чтобы получить «образование» и в конце концов «степень». Забудьте слова в кавычках и их синонимы, представьте все детали из реального мира, и, скорее всего, вы заметите, что «школа», судя по всему, — это совместное сидение в помещении вместе со скучающими подростками и выслушивание материала, который вы и так знаете. «Степень» окажется бумагой с какими-то написанными словами, а «образование» — забыванием материала сразу же после экзамена.

Классификация часто приводит к дырявым обобщениям. Например, те, кто действительно чему-то учатся в классе, попадают в категорию «получающие образование», поэтому «получение образования» считается чем-то хорошим. Однако, потом любой, кто оказывается в колледже, оказывается в категории «получающий образование», независимо от того, учится он чему-то или нет.

Ученики, которые понимают математику, прекрасно справятся с тестами. Однако, если поставить школе цель готовить людей, которые получают в тестах высокие баллы, ученики потратят всё своё время на подготовку к тестам. Если ваша цель попадёт в неправильную мысленную категорию, это может привести к появлению такого же неправильного стимула. Вы хотите учиться, поэтому вам нужно «образование», и пока вы занимаетесь чем-то, что попадает в категорию «образование», вы можете не замечать, учитесь вы или нет. Вы также можете заметить, что вы не узнаёте ничего нового, но не осознать, что вы уже забыли про изначальную цель, потому что вы «получаете образование», а ваша цель у вас в голове описана именно так.

Категоризировать — выбрасывать информацию. Если вам скажут, что упавшее дерево издало «звук», вы не узнаете, что это был за звук — вы не слышали, как это дерево падало. Если монета выпала «орлом», вы не знаете, как она оказалась ориентированной на плоскости. Синяя яйцеобразная штука может быть «сияйцом», но какого именно оттенка синего и какой именно формы она? Классификацию используют для отбрасывания не релевантной информации, для отделения золота от песка, но часто получается, что привычная классификация отбрасывает и релевантную информацию тоже. И если вы столкнулись с такой проблемой, первым и лучшим решением будет сыграть в рациональное «табу».

Например, «сыграть в ”табу”» — само по себе дырявое обобщение. Версия от Hasbro — это не то же самое, что и версия рационалистов: для того, чтобы исключить мышление привычными словами, недостаточно исключить лишь пять синонимов, написанных на карточке. «Табу» рационалистов оказывается внутри границ концепта «игра в ”табу”», но не все, что находится внутри этих границ, позволяет посмотреть на мир свежим взглядом. Если вы просто будете «играть в ”табу” ради свежего взгляда», то начнёте думать, что все, что считается игрой в «табу», может считаться свежим взглядом.

«Табу» по версии рационалистов — это не игра. Вы не сможете здесь схитрить или обойти правила. Вам придется добровольно ограничить себя: перестать использовать и те синонимы, которых нет на карточке. Вам так же придется останавливать себя, когда вы попытаетесь придумать новое простое слово или фразу, которые будут играть ту же роль умственных костылей, что и старые привычные слова. Вы стараетесь увидеть больше деталей на карте, а не переименовывать города, разыменовать указатель, а не ввести новый, увидеть события такими, какие они есть, а не переписать клише о них другими словами.

Рассмотрев задачу во всех деталях, вы сможете увидеть потерянную цель. Чем вы на самом деле занимаетесь, играя в «табу»? Для чего нужна каждая из частей процесса?

Если вы посмотрите на ваши действия, как будто вы смотрите на них первый раз, то сможете увидеть свежим взглядом и ваши цели. Если вы сможете посмотреть на себя по-новому, то увидите, что вы занимаетесь чем-то, что вас вряд ли привлекло бы, если бы не успело войти в привычку.

Цель теряется из виду, как только суть (обучение, знания, здоровье) заменяется на символ (степень, тестовые баллы, медобслуживание). Чтобы заново найти потерянную цель или избавиться от дырявого обобщения, вам нужно сделать наоборот.

Замените символ на суть. Замените знак на то, что он обозначает. Замените свойство проверкой принадлежности. Замените слово на его смысл. Замените ярлык на концепт. Замените конспект на детали. Замените вспомогательный вопрос на основной. Разыменуйте указатель. Перейдите на нижний уровень организации. Смоделируйте процесс в уме, а не просто произнесите его название. Увеличьте масштаб на вашей карте.

«Простая истина» получилась благодаря табуированию слова «истина». Я описал смысл этого слова на более низком уровне без привлечения слов вроде: «точный», «корректный», «представляет», «отражает», «семантика», «убеждение», «знание», «карта», «настоящий». (Помните, цель не в том, чтобы играть в «табу» — слово «истинный» появлялось в том тексте, но не для того, чтобы определить истину. В игре «Табу» от Hasbro это считалось бы ошибкой, но на самом деле мы не играем в эту игру. Спрашивайте себя, выполнил ли свое назначение документ, а не написали ли его в соответствии с правилами.)

Правило Байеса описывает «свидетельство» с помощью чистой математики, без использования слов вроде «подразумевает», «означает», «поддерживает», «доказывает», или «оправдывает». Если вы попробуете определить подобные философские термины, вы лишь начнёте ходить по кругу.

И есть слово, которое табуировать важнее всего. Я неоднократно предупреждал, что им не стоит злоупотреблять. В некоторых случаях даже следует избегать этого понятия. И теперь вы знаете, почему. Размышлять об этом предмете вполне можно. Но истинное его понимание определяется вашей способностью описать, что вы делаете и почему — без использования этого слова и его синонимов.

Перевод: 
Muyyd1, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
168
Оцените качество перевода: 
Средняя оценка: 3.9 (19 votes)

Ошибки сжатия

Элиезер Юдковский

Есть известное высказывание: «Карта — это не территория». Единственная точная на 100% карта Калифорнии в натуральную величину с сохранением всех деталей на уровне атомов — это сама Калифорния. Однако в Калифорнии есть некоторые важные повторяющиеся детали — например, шоссе, — которые можно описать, используя значительно меньше информации (не говоря уже о физической материи для хранения этой информации), чем потребовалось бы для описания каждого атома в пределах границ штата. Поэтому есть и другое высказывание: «Карта — это не территория, но территорию нельзя сложить и убрать в бардачок».

На бумажной карте Калифорнии в масштабе «в 1 сантиметре 10 километров» (1:1000000) недостаточно места для того, чтобы показать точное расположение двух опавших листьев, лежащих на тротуаре в сантиметре друг от друга. Даже если карта попытается показать листья, листья будут отображаться одной и той же точкой на карте. Точнее, карте потребуется разрешение в 10 нанометров, что гораздо меньше доступного для подавляющего большинства типографий, не говоря уже о человеческих глазах.

Реальность очень велика. Даже видимая для нас часть реальности — это миллиарды световых лет. Но ваша карта реальности записана на полутора килограммах нейронов, упакованных так, чтобы поместиться внутри черепной коробки. Не хочу никого обидеть, но по сравнению с реальностью ваш череп — очень крохотный.

И поэтому совершенно неизбежно некоторые объекты, которые в реальности различны, оказываются на вашей карте сжатыми в одну точку.

Но изнутри это ощущается не как: «Ого, посмотрите-ка, я сжимаю два объекта в одну точку на моей карте». Это ощущается, словно существует лишь один объект и вы непосредственно его и наблюдаете.

Достаточно маленький ребенок или достаточно древний греческий философ не знают про такие штуки, как «акустические вибрации» или «слуховые переживания». И, когда дерево упадет, будет лишь одно — единственное событие, называемое «звуком».

Осознание того, что точка на вашей карте скрывает два различных явления, по сути — научная задача. Огромная сложная научная задача.

Иногда ошибки сжатия случаются из-за путаницы между двумя одинаковыми явлениями, называющимися одним словом. Вы знаете про акустические вибрации и про работу слуховых отделов мозга, но называете их одним словом — «звук», и запутываете себя. Но более опасная ошибка сжатия возникает в тех случаях, когда вы даже не подозреваете, что в вопросе могут быть замешаны две разные сущности. В вашей голове есть только одна папка, обозначенная «звук», и каждая мысль про «звук» попадает в эту единственную папку. Это не то же самое, что иметь две папки с одним и тем же названием. По умолчанию карта сжата — зачем мозгу создавать две ментальные коробки, когда хватает и одной?

Или вообразите себе книгу детективного жанра, в которой главный герой должен догадаться, что у подозреваемой есть сестра-близнец. Обычная детективная работа героя сведётся лишь к тому, что он заметит, что Кэрол носит красное, что у неё чёрные волосы, что у неё кожаные сандалии. Однако, все эти факты будут о Кэрол. Достаточно легко усомниться в отдельных фактах, вроде НоситКрасное(Кэрол) или ТемныеВолосы(Кэрол). Может ТемныеВолосы(Кэрол) — ложно. Может Кэрол красит волосы. Может быть Шатенка(Кэрол). Но детективу потребуется немало смекалки, чтобы догадаться, что НоситКрасное(Кэрол) и ТемныеВолосы(Кэрол) — тот самый файл «Кэрол» в который попадают все наблюдения, связанные с Кэрол, — должен быть разбит на два отдельных файла. Может быть существуют две Кэрол, и та Кэрол, что носит красное, и та, что с темными волосами — две разные женщины.

Именно так выглядит создание двух различных коробок. И это зачастую требует гениального озарения. Легче ставить под сомнение имеющиеся у себя факты, чем определяющую их онтологию.

В отличие от бумажной карты Калифорнии карта реальности, которая содержится в человеческом мозге, способна динамически расширятся, когда мы вводим более детальные описания объектов. Но изнутри это ощущается не столько как увеличение масштаба, сколько как деление невидимого атома — мы берём один предмет (он ощущается как один) и делим его на два разных.

Часто в результате появляются новые слова, например, «акустические вибрации» и «слуховые переживания» вместо просто «звук». По-видимому, где-то при появлении нового названия и создаётся новая ментальная коробка. Детектив, скорее всего, будет называть одну из подозреваемых «Кэрол-2» или «другая Кэрол», когда догадается, что их двое.

Но расширить собственную карту сложней, чем выдумать названия для новых городов. Необходимо озарение научного уровня, чтобы понять, что такие штуки, как акустические вибрации или слуховые переживания, вообще существуют.

В качестве более современных примеров можно взять слова «интеллект» или «сознание». Нередко встречаются новостные заголовки, кричащие, что ученые «объяснили сознание», просто потому что команда неврологов исследовала электрический ритм в сорок герц, который может быть связан с кросс-модальным переносом сенсорной информации, или ретикулярную активирующую систему, ответственную за бодрствование. Это, конечно, крайности — обычно ошибки менее очевидны, но они одного поля ягоды. Наиболее интересные части «сознания» это рефлективность, самосознание, понимание того, что человек, которого я вижу в отражении зеркала это «я». Это и трудная проблема субъективного опыта, выделенная Чалмерсом. Мы так же обозначаем словом «сознание» и разницу между сном и бодрствованием. Но это разные концепты с одинаковым именем, и соответствующие им явления являются отдельными научными загадками. Можно объяснить бодрствование, не объясняя при этом рефлективность или субъективность.

Ошибки сжатия так же лежат в основе философской техники «заманить и подменить» — вы рассуждаете о сознании, определяя его через способность думать о мышлении, а затем применяете выводы для другого свойства сознания, вроде субъективности. Разумеется, эти явления могут быть одним и тем же, но, чтобы это понять по-настоящему, нужно сначала эти понятия разделить и только потом, благодаря какому-то гениальному озарению, объединить снова.

Расширение карты, как уже говорил — научный вызов. Это часть научного искусства, умения расследовать, как устроен мир. И, разумеется, вам не удастся решить научную задачу, обратившись к словарю, и вы не научитесь исследовать мир с помощью техники «я могу определять слова как мне захочется». Если некий единый объект вызывает у вас замешательство своими многообразными и внутренне противоречивыми свойствами, вполне возможно, что проблема в карте, которая сжимает слишком много в одну точку. В таком случае полезно попробовать разделить их и создать новые ментальные коробки. Это не то же самое, что дать определение единому объекту. Скорее этот процесс запускается, когда вы разбираетесь, как говорить об объекте, не используя привычные ментальные костыли-понятия.

Вот и получается, что увеличение детализации собственной карты связано с рационалистской версией игры Табу и с мудрым использованием слов. Ведь слова часто соответствуют точкам на нашей карте: ярлыкам, которыми мы помечаем наши суждения, и ментальным коробкам, куда мы складываем информацию. Отказ от использования некоего слова — или наоборот создание новых слов — зачастую необходим для расширения карты.

Перевод: 
Muyyd1, Alaric, Pavel6991
Номер в книге "Рациональность: от ИИ до зомби": 
169
Оцените качество перевода: 
Средняя оценка: 4.6 (10 votes)

У классификации есть последствия

Элиезер Юдковский

Ваш геном содержит множество генетических вариаций и мутаций. Скорее всего, вы знаете лишь о некоторых из них. Возможно, вы знаете про аллели, которые определяют вашу группу крови: присутствие или отсутствие антигенов А, В и резус-фактора. Если вам будут переливать кровь, содержащую антиген, которого у вас нет, это приведет к аллергической реакции. Этот факт открыл Карл Ландштейнер (вместе со способом определять совместимость групп крови), и в результате стало возможным перелить кровь пациенту, не убив его (Нобелевская премия по медицине 1930 года). Кроме того, если женщина с группой крови А будет беременна ребенком с группой А+, то у нее может развиться аллергия на антиген +. И если у нее будет еще один ребенок с А+, то ей придётся принимать противоаллергенные препараты в ходе беременности или этот ребёнок окажется в опасности. Поэтому люди и узнают про группы друг у друга, прежде чем жениться.

О, и чуть не забыл: люди с группой А — серьезные и изобретательные, а с группой В — сумасбродные и веселые. Люди с группой О — кооперативные и дружелюбные, а с группой АВ — спокойные и владеющие собой. (Можно было бы подумать, что О будет обратным А и В, а АВ будет просто А плюс В, но нет…) Вся эта информация взята из японской теории личности, основанной на группе крови.

Судя по всему, группа крови играет в Японии ту же роль, что и астрологические знаки на Западе. Вплоть до «гороскопов по группе крови» в ежедневных газетах.

Всё это особенно странно, поскольку группы крови никогда не считались чем-то загадочным. Ни в Японии, ни где-то в другом месте. Мы и знаем про них только благодаря Карлу Ландштейнеру. Ни таинственный знахарь, ни почтенный чародей не говорили ни слова про группы крови. Никакие древние пыльные свитки не укутывают упомянутую ошибку аурой старины. Если специалисты-медики завтра признаются, что эти группы были лишь грандиозной мистификацией, то у нас, мирян, не будет ни малейшего свидетельства, доступного невооруженному глазу, чтобы опровергнуть их слова.

Между группами крови не было войн. Не было даже политических конфликтов. Должно быть, стереотипы возникли исключительно из-за существования ярлыков.

Разумеется, кто-то неминуемо скажет, что это история о классификации людей. Случается ли что-нибудь подобное при классификации растений, камней или офисной мебели? Я такого эксперимента не припоминаю, что, конечно, не означает, что его не проводили. (Я ожидаю, что самое сложное при проведении такого эксперимента — создать такой протокол опроса, который минимизировал бы шанс наталкивания испытуемого на мысль, что ярлык очень важен просто потому, что об этом ярлыке его и спрашивают.) И хотя я не собираюсь основываться на воображаемом свидетельстве, я бы предсказал, что такой эксперимент показал бы положительный результат: я бы ожидал, что само по себе введение ярлыков влияет на всё — по крайней мере в умах людей.

Здесь можно вспомнить про кластеры подобия: если вы нарисовали границу вокруг некоторой группы объектов, ваш разум пытается найти сходство между объектами группы. И, к сожалению, человеческий детектор закономерностей иногда находит закономерности даже там, где их нет. Немного избирательной памяти, и слабая отрицательная корреляция может быть принята за сильную положительную.

Можно вспомнить про нейронные алгоритмы: создать имя для набора предметов — все равно что выделить некоторую подсеть для поиска закономерностей между ними.

Можно вспомнить про ошибки сжатия: вещи с одинаковым названием вполне могут очутиться в одной ментальной папке и слиться в одну точку на карте.

А можно вспомнить про безграничную человеческую способность высасывать из пальца любую чепуху и в неё верить. Просто потому что никто не может доказать, что это на самом деле чепуха. Как только вы ввели имя для категории — можно начинать выдумывать. Штука с выбранным именем не обязана быть наблюдаемой. Она не обязана существовать. Она даже не обязана быть логичной.

И нет, такое происходит не только в Японии. Здесь, на Западе, книга под названием «Правильная еда для твоей группы крови» [В оригинале «Eat Right 4 Your Type» - Прим.перев.] стала бестселлером.

Проведение границы в пространстве вещей — совсем небезобидное действие. Возможно, какой-нибудь более правильно спроектированный байесовский ИИ будет в состоянии рассматривать произвольный класс и это не будет влиять на его поведение. Но у нас, людей, такого варианта нет. Для человеческого мозга категории не статичны — если вы о них думаете, они влияют на ваш разум. И это еще одна причина, почему не стоит считать, что вы можете определять слова как вам захочется.

Перевод: 
Muyyd, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
170
Оцените качество перевода: 
Средняя оценка: 3.6 (16 votes)

Контрабанда характеристик

Элиезер Юдковский

Вчера я рассказал, что в Японии типы крови заняли место астрологии - если твоя кровь 4 группы, например, ты должен быть «спокойным и сдержанным».

Предположим, мы решили ввести новое слово «виггин» для обозначения людей с зелеными глазами и темными волосами…

Зеленоглазый и темноволосый мужчина вошел в ресторан.

«Ха» сказал Дэнни, сидя за столиком неподалеку «Ты это видела? Виггин только что зашел в зал. Чертовы виггины. Все они преступники, если хочешь знать”.

Его сестра Эрда вздохнула «Ты ведь не видел его совершающим преступления, так ведь, Дэнни?»

«Мне и не нужно» ответил Дэнни, достав словарь — «Смотри, в Оксфордском Словаре Английского Языка так и написано «Виггин (1) Человек с зеленым глазами и черными волосами» У него черные волосы и зеленые глаза — он виггин. Ты ведь не станешь спорить в Оксфордским словарем? По определению, черноволосый и зеленоглазый человек — виггин».

«Но ты в открытую назвал его виггином» сказала Эрда. «Нехорошо так говорить о тех, кого ты совсем не знаешь. У тебя недостаточно свидетельств, чтобы утверждать, что он много кетчупа положит в свой бургер или что он в детстве запускал бельчат с помощью резинки».

«Но он же виггин». Терпеливо ответил Дэнни. «У него зеленые глаза и черные волосы, так? Вот увидишь, как только ему принесут заказанный бургер, он потянется за кетчупом”.

Человеческий разум переходит от наблюдаемых характеристик к выводимым посредством слов. В высказывании «Все люди смертны, Сократ человек, следовательно, Сократ смертен» наблюдаемыми характеристиками являются одежда Сократа, речь, используемые им инструменты, человеческая форма тела; классифицируется он как человек; выводимая характеристика — отравляемость болиголовом.

Разумеется, граница между «выводимыми» и «наблюдаемыми» характеристиками размыта. Если вы слышите, как кто-то говорит, то у этого существа, скорее всего, человеческая форма тела, при всех прочих равных. И, если вы видите человеческую фигуру в темноте, ceteris paribus — она может говорить.

И все же, некоторые характеристики в большей мере выводимые, чем наблюдаемые. Вы, скорее всего, сделаете вывод, что наблюдаемый вами объект — человек и поэтому сгорит, если его подвергнуть прямому взаимодействию с огнем, чем станете поджигать разные объекты для того, чтобы понять — горят люди или нет.

Если вы посмотрите определение слова «человек» в словаре, то, возможно, увидите там характеристики вроде «интеллект» или «двуногое без перьев», которые полезны для быстрого отделения того что является человеком от всего остального. При этом, в словаре не будет десятков тысяч других возможных человеческих характеристик вроде уязвимости перед болиголовом или сверхуверенности, которые можно вывести из того, что данный объект — человек. Почему так? Может быть, словари предназначены для указывания соответствия между ярлыком и кластером в пространстве вещей. Или вполне может быть, что крупные, видимые характеристики быстрей приходят на ум составителю словаря в силу своей заметности. Не уверен, насколько составители словарей осознают, что именно они делают.

Но кульминация наступает, когда Дэнни достает словарь и видит лишь бросающиеся в глаза признаки: зеленые глаза и черные волосы. Словарь не содержит список множества характеристик, которые ассоциируются с термином «виггин», вроде криминальных наклонностей, кулинарных пристрастий или досадных активностей в детстве.

Как же эти характеристики стали ассоциироваться с термином? Может был знаменитый виггин, продемонстрировавший их. Или может кто-то просто их выдумал и написал ставшие популярными книги («Виггин», «Беседы с виггином», «Воспитание маленьких виггинов», «Виггины в постели»). Может даже виггины в это верят теперь, и ведут себя соответствующим образом. Стоит лишь назвать группу людей «виггинами» и это слово начнет обрастать ассоциациями.

Однако, давайте вспомним «Притчу о болиголове»: если мы будем использовать определения логических классов, как метод определения слов, то мы не сможем установить, что Сократ — «человек», пока не пронаблюдаем его смерть. Когда кто-то апеллирует к словарю, он это делает, обычно, чтобы тайком привнести какие-то ассоциации, а не реально записанное определение.

В конце концов, если полный смысл слова «виггин» это «зеленоглазый и черноволосый человек», почему бы и не называть этих людей «зеленоглазым и черноволосыми»? И если вы интересуетесь, является ли данный человек любителем кетчупа, то почему бы не спросить об этом прямо «он любитель кетчупа?», вместо того, чтобы спрашивать «он виггин?» (прошу отметить замену символа на суть).

Но ведь для понимания настоящего вопроса придется поработать. Надо будет пронаблюдать, действительно ли виггин потянется за кетчупом. Или найти статистику о том, сколько зеленоглазых и черноволосых людей любят кетчуп. В любом случае, вам придется сделать что-то большее, чем сидение в вашем кресле с закрытыми глазами. Люди ленивы. Он предпочтут использовать аргумент «по определению», особенно если им кажется, что «слова можно определять, как захочется».

Но, разумеется, настоящая причина утверждать, что кто-то это «виггин» — в скрытой ассоциации, не записанной в словаре, и порождаемым ей чувстве.

Только представьте — Денни говорит: «Посмотри, у него черные волосы и зеленые глаза, он — виггин! В словаре так и сказано, следовательно, у него черные волосы. Попробуй поспорь с этим!»

Звучит не слишком впечатляюще, так ведь? Если бы суть аргумента действительно была отражена в словаре, если бы аргумент был логически валидным, то он ощущался бы пустым; не привносил ничего нового и не ставил бы вопросов.

Лишь контрабанда характеристики, которая прямо не записана в словаре, дает чувство победы при использовании аргумента «по определению».

Перевод: 
Muyyd1, 19_19_19
Номер в книге "Рациональность: от ИИ до зомби": 
171
Оцените качество перевода: 
Средняя оценка: 3.7 (11 votes)

Аргумент «по определению»

Элиезер Юдковский

«У этой ощипанной курицы две ноги и нет перьев, следовательно, по определению, она человек!»

Обычно, когда люди спорят про определения, они начинают с бросающихся в глаза или широко принятых характеристик, затем достают словарь и показывают, что эти характеристики соответствуют написанному в словаре определению; потом они делают вывод: «Следовательно, по определению, атеизм — это религия!»

Но бросающиеся в глаза или широко принятые характеристики редко являются настоящим предметом спора. Один лишь факт того, что кто-то видит наличие двух ног достаточно очевидной основой для вывода «Следовательно, по определению, Сократ — человек», свидетельствует о том, что двуногость не выступает конечной целью спора, ведь в противном случае оппонент бы заявил что-то вроде: «Да че ты говоришь, мы ведь об этом и спорим!»

Разумеется, есть правильный способ перехода от очевидных характеристик к не совсем очевидным. Вы вполне оправданно можете, увидев гуманоидную форму тела Сократа, предположить, что он уязвим для болиголова. Но этот вероятностный вывод не основывается на определении в словаре или традиционном понимании; он основывается на существовании во вселенной эмпирических кластеров подобных друг другу вещей.

Такая кластерная структура не изменится просто потому, что вы дадите слову другое определение. Даже если в словаре понятие «человек» будет определено как «все двуногие без перьев, кроме Сократа», то это не изменит степень подобия между Сократом и остальными двуногими без перьев существами.

Когда вы будете выстраивать аргументацию на основе кластерной структуры, вы скажете что-то вроде: «у Сократа две руки, две ноги, нос и язык, он говорит бегло на греческом, использует инструменты, проявляет все крупные и мелкие характеристики Homo sapiens (в то время, когда я наблюдал за ним); так что я предположу, что у него человеческая ДНК, человеческая биохимия, и что он так же уязвим для болиголова, как и другие Homo sapiens, для которых летальность болиголова была подтверждена клинически».

На что я мог бы ответить: «Но я видел, как Сократ разговаривал со знахарем, и думаю, что они собираются приготовить антидот. Так что я ожидаю, что Сократ, приняв болиголов, копыта не откинет. Он будет исключением для общего правила поведения объектов этого кластера. Они не принимали антидот, а он примет».

Как видите, тут уже нет смысла спорить о том, человек Сократ или нет. Разговор должен перейти на более детальный уровень, следует рассмотреть детали категории «человек», а именно — биохимию, и в данном случае, нейротоксичные эффекты кониина.

Вы, разумеется, можете продолжать настаивать на том, что «Сократ — человек и по определению смертен», но вы, на самом деле, лишь будете смазывать в одну точку все, что вы знаете о Сократе, кроме его человечности, как будто единственное верное предсказание может быть построено только на том, что мы ничего о Сократе не знаем, кроме того, что он человек.

Это все равно что настаивать на том, что вероятность выпадения орла или решки составляет 50%, потому что это «симметричная монета», после того, как вы ее подкинули и выпал орел. Это все равно что настаивать на том, что у Фродо десять пальцев, после того, как вы видели, что у него девять пальцев на руках. И это, естественно, некорректно с точки зрения байесовской эпистемологии — вы не можете отказаться от учета наблюдаемых свидетельств.

И вы не можете останавливаться на первой итерации классифицирования и продолжать делать выводы на ее основе, игнорируя остальную информацию.

Не каждое свидетельство, разумеется, окажет сильное влияние на вывод. Если я увижу, что у Сократа лишь девять пальцев, это не повлияет на мое ожидание наблюдать его смерть после приема болиголова, ведь я ожидаю, что потеря пальца не оказала сильного влияния на его биохимию. И это будет правдой независимо от того, что в словаре написано про количество пальцев. Правильный вывод основан на кластерной структуре окружающей среды и причинной структуре биологических процессов, а не на том, что решит написать составитель словаря. И уж тем более не на «традиционном понимании».

Как правило, если вы делаете вывод правильным, логически допустимым путем, вы просто можете сказать: «Содержащийся в болиголове алкалоид кониин вызывает мышечный паралич у людей, что приводит к смерти от удушья». Или еще проще: «Болиголов опасен для людей». Так выстраивается правильный аргумент.

Так в какой же ситуации может возникнуть желание усилить аргумент фразой «по определению»? (Например — «Люди, по определению, уязвимы для болиголова»). Ну разумеется, в случае высказанных оппонентом сомнений по поводу предполагаемой характеристики (есть свидетели разговора между Сократом и знахарем) — поэтому может возникнуть желание затянуть оковы логики.

И когда вы видите такое использование «по определению», знайте, что на самом деле вам говорят что-то вроде «Забудьте лучше этот момент со знахарем, люди по определению смертны».

Люди чувствуют необходимость укрепить курс развития спора словами «Любое Р, по определению, обладает свойством Х!», именно в том случае, когда они видят и без промедления отбрасывают информацию, которая бросает тень сомнений на оригинальный вывод, основанный на кластерах.

Это же касается и аргументов вроде «Х, по определению, — У». Например, «Атеисты верят, что Бога нет; следовательно, они имеют убеждение о Боге, потому что неверие это тоже убеждение; следовательно, атеизм дает ответы на теологические вопросы; следовательно, атеизм, по определению, — религия».

Вам не нужно было бы убеждать нас, что индуизм — это религия, потому что индуизм это, вроде как, и есть религия. И не просто «религия по определению», а настоящая религия.

Атеизм не похож на центральных представителей кластера «религия», поэтому, если бы он не был религией «по определению», вы могли бы воображать себе, что он религией не является. Поэтому вам и приходится давить оппозицию, указывая на то, что «атеизм — это религия» верно по определению, потому что это неверно в любом другом контексте.

То есть люди настаивают на том, что «Х по определению У!» именно в тех случаях, когда они пытаются протащить не указанную прямо в определении характеристику У, а Х не слишком похож на представителей кластера У.

В течение последних тринадцати лет я старался отмечать случаи корректного использования фразы «по определению», не утруждаясь ведением статистики, разумеется. На основе такого поверхностного взгляда я могу сделать вывод, что использование этой фразы где-либо за пределами математики является одним из ярчайших сигналов дефектного аргумента из тех что я видел. Он стоит рядом с «Гитлер», «Бог», «абсолютно уверен» и «ты не можешь доказать это».

Эта эвристика определения такого режима провала не идеальна — впервые я видел корректное употребление этой фразы за пределами математики — у Ричарда Фейнмана; и с тех пор видел еще. Но вам, скорее всего, стоит просто стереть из своего словарного запаса эту фразу и сохранять бдительность, особенно если вам захочется употребить ее с восклицательным знаком или выделить курсивом. Ведь это, по определению, плохая идея!

Перевод: 
Muyyd
Номер в книге "Рациональность: от ИИ до зомби": 
172
Оцените качество перевода: 
Средняя оценка: 3.8 (12 votes)

Где проводить границу?

Элиезер Юдковский

Представьте, что вам кто-то сказал:

Долго я размышлял о том, что же значит слово «искусство», и, наконец нашёл вроде бы устраивающее меня определение: «Искусство - это то, что предназначено для создания реакции аудитории».

Из существования слова «искусство» не следует существование его смысла, витающего где-то там в пустоте, которое вы можете открыть, подобрав правильное определение.

Хоть так и кажется, но это не так.

Гадая о том, какое определение дать слову, вы подходите к решению задачи не с той стороны — ищите таинственную эссенцию того, что на самом деле является коммуникационным сигналом.

Разумеется, тут есть место и для задачи, которую рационалист может обоснованно атаковать, но эта задача не в том, чтобы найти слову устраивающее определение. Настоящую задачу можно решать в одиночку, не проронив ни слова вслух. Задача в том, чтобы найти, какие вещи подобны друг другу, какие вещи принадлежат к одному кластеру, и иногда — какие вещи имеют одну и ту же причину.

Если вы определите «электромагнетизм», включив молнию, компас, исключив свет, но включив «животный магнетизм» Месмера (что мы теперь зовем гипнозом), то столкнетесь с проблемой, отвечая на вопрос «как электромагнетизм работает?». Вы скучили вместе вещи, которые располагаются на удалении, и исключили те, которые действительно принадлежат к набору. (Этот пример вполне вероятен - Месмер был до Фарадея).

Можно сказать, что электромагнетизм — неподходящее слово, граница в пространстве вещей, обтекающая и проникающая в кластеры, разрез реальности не по месту естественного соединения частей.

Придумать, где именно разрезать реальность, так чтобы разрез был по месту соединения частей — достойная рационалиста задача. Это то, что людям бы следовало делать, когда они начинают искать плавающую в пустоте эссенцию слова.

Но не стоит себя обманывать. Эта задача может быть и на уровне научной проблемы, если надо догадаться, что дыхание и огонь описываются одним словом. Так что не стоит обращаться за решением к редакторам словарей — у них есть своя работа.

Что такое «искусство», если не эссенция слова, витающая в пустоте?

Предположим, что вы составили длинный список того, что вы готовы и не готовы назвать «искусством».

Маленькая фуга до минор — искусство.
Удар в нос — не искусство.
«Относительность» Эшера — искусство.
Цветок — не искусство.
Язык программирования Python — искусство.
Распятье, плавающее в моче — не искусство.
Новеллы Джека Вэнса «Тщай» — искусство.
Современное Искусство — не искусство.

И вот вы мне говорите: «Мне эта граница кажется интуитивно понятной, но не знаю почему — помоги мне найти интенсионал для этого экстенсионала? Дай мне простое описание этой границы».

Я отвечаю: «Думаю, это связано с восхищением искусной работой. Работа на входе, на выходе — диво. Вещи из списка связаны через похожие эстетические переживания, которые они вдохновляют, и направленный на вызов этих переживаний человеческий труд».

Полезно ли это или это лишь нарушение принципов «табу»? Я бы сказал, что список переживаемых эмоций сильней концентрирует массу вероятности, чем список всего что является/не является искусством. Вы можете наблюдать «вспышки» эмоций на ФМРТ — т.е. эмоции далеко не эфемерны.

Но дело, разумеется, не в определении искусства. Дело в том, что вы можете оспорить экстенсионалы или интенсионалы моего определения.

Вы можете сказать мне: «Эстетические переживания — не то, что объединяет эти вещи. Их объединяет намерение вдохновить любую сложную эмоцию просто ради ее вдохновения». И это будет попыткой оспорить мой интенсионал, мою попытку очертить границу через опорные координаты.

Вы можете сказать: «Твое уравнение примерно эти точки описывает, но не подходит под настоящее общее распределение».

Или вы можете оспорить мой экстенсионал, сказав: «Некоторые их этих вещей действительно близко связаны, я вижу к чему ты ведешь, однако язык Python тогда не должен быть в списке, а Современное Искусство должно». (Это позволит предположить, что вы — лишь легко внушаемый простак, что тоже можно оспорить.) Важный момент: презумпция кривой, генерирующей этот список подобных и не подобных вещей, — схема и основания, пусть вы и не сказали каковы они, но вы видите, как я потерял нить и включил координаты, сгенерированные другим способом.
Задолго до того, как вы поймете, что объединяет электричество и магнетизм, вы начнете сомневаться, основываясь лишь на поверхностных наблюдениях, в том, что «животный магнетизм» действительно входит в список.

Давным-давно люди думали, что слово «рыба» включает в себя дельфинов. Вы, конечно, можете включить искусного спорщика и сказать: «Мой список: {лосось, гуппи, акула, дельфин, форель} — всего лишь список. Ты не можешь сказать, что список неверен. Я, с помощью теории множеств, могу доказать, что такой список существует. Так что мое определение «рыб», являющееся лишь экстенсиональным списком не может быть «неверным», что бы ты мне ни говорил».

Или же вы можете прекратить дурацкие игры и признать, что дельфинам не место в этом списке.

Итак, вы составили список вещей, которые, как вам кажется, подобны друг другу. И попробовали догадаться почему они подобны. Но когда вы обнаружите, что же они действительно имеют общего, может оказаться, что ваши догадки были неверными, как и ваш список.

Вам не спрятаться под щитом «верно-по-определению». И экстенсиональное, и интенсиональное определения могут быть неверными, могут разрезать реальность не по месту соединения частей.

Классификация — занятие без гарантий, в котором вы вполне можете понаделать ошибок. Так что, с чисто теоретической точки зрения, полезно будет признать, что ваши догадки-определения могут быть «ошибочными».

Перевод: 
Muyyd1, Rina_B .
Номер в книге "Рациональность: от ИИ до зомби": 
173
Оцените качество перевода: 
Средняя оценка: 4 (6 votes)

Энтропия и короткие сообщения

Элиезер Юдковский

Предположим, у нас есть система Х, которая с одинаковой вероятностью может находиться в любом из 8 возможных состояний:

$$ {X_1, X_2, X_3, X_4, X_5, X_6, X_7, X_8} $$

Есть такая экстраординарно распространенная мера, — в физике, математике и даже биологии — называется она «энтропия». И энтропия Х составляет 3 бита. Это значит, что для выяснения состояния Х нам в среднем понадобится 3 да/нет вопроса. Например, кто-то может нам рассказать о значении Х с помощью такого кода:

$$ (X_1:001) (X_2:010) (X_3:011) (X_4:100) $$

$$ (X_5:101) (X_6:110) (X_7:111) (X_8:000) $$

Так что если я спросил бы «Первый символ — 1?» и получил бы ответ «Да»; «Второй символ — 1?» и услышал бы «Нет»; «Третий символ — 1?» — «Нет»; то я бы знал, что Х находится в состоянии 4.

Теперь предположим, что у системы Y есть четыре возможных состояния с таким распределением вероятностей:

$$ Y_1: 1/2 \;(0,5) $$
$$ Y_2: 1/4 \;(0,25) $$
$$ Y_3: 1/8 \;(0,125) $$
$$ Y_4: 1/8 \;(0,125) $$

Тогда энтропия Y будет равна 1,75 бит, что значит нам понадобится 1,75 вопросов в среднем, чтобы узнать значение Y.

В каком смысле можно задать один и три-четвертых вопроса? Представьте, что мы используем следующий код для описания состояния Y:

$$ (Y_1:1) (Y_2:01) (Y_3:001) (Y_4:000) $$

Сначала вы спросите «Первый символ — 1?», и если ответ «Да», то задача решена: Y находится в состоянии 1. И такое происходит в половине случаев — состояние Y можно вычислить с помощью одного вопроса.

Предположим, что вы получили ответ «Нет». Тогда вы спрашиваете: «Второй символ — 1?». Если ответ «Да», то вы закончили: Y находится в состоянии 2. И это происходит с вероятностью в 1/4, и каждый раз, когда Y в состоянии 2, мы можем узнать это с помощью двух да/нет вопросов — в 25% случаев понадобится два вопроса для определения состояния Y.

Если же вы получили ответ «нет» два раза подряд, и, спросив «Третий символ — 1?», получили ответ «Да», то задача решена и Y в состоянии 3; если нет, то Y в состоянии 4. В 1/8 случаев Y в состоянии 3 и понадобится три вопроса. И в 1/8 случаев Y в состоянии 4 и понадобится три вопроса.

$$ (1/2 \cdot 1) + (1/4 \cdot 2) + (1/8 \cdot 3) + (1/8 \cdot 3) = 0,5 + 0,5 + 0,375 + 0,375 = 1,75. $$

Общая формула определения энтропии системы S это сумма по всем $ S_i $: $ - p(S_i) \cdot log_2 p(S_i) $.

Например, $ log_2 $ числа 1/8 — это −3. Получается $ -(1/8 \cdot -3) = 0,375 $ — часть энтропии состояния 4 от всей энтропии системы Y — три вопроса.

Закодировать любую систему идеальным кодом получится не всегда, но если вам потребуется передать кому-то сообщение о состоянии случайного количества копий S за один раз, вы можете приблизиться к идеальному коду на случайную величину. (Гуглите «арифметическое кодирование»).

Конечно, вы можете спросить: «Почему бы не закодировать Y4 с помощью 10 вместо 000? Так ведь будет быстрей?»

Но если вы используете 10 для Y4 и получите ответ «да» на вопрос «первый символ 1?», то у вас все еще останется неопределенность: Y1 (1) или Y4 (10). Даже больше, если вы измените код таким образом, вся система полетит к чертям — услышав «1001» вам останется только гадать — «Y4 и Y2» или «Y1 и Y3».

Мораль в том, что короткие слова — ограниченный ресурс.

Ключевой момент в создании хорошего кода, который позволит передавать сообщения максимально компактно, в использовании коротких слов для того, о чем вы будете говорить часто, а длинных — для того, о чем реже.

На своем пике это искусство позволяет добиться почти идеального соответствия между длиной сообщения и вероятностью. Это так называемое «Сообщение минимальной длины» или «Минимальная длина описания», формализация бритвы Оккама.

Так что даже используемые нами ярлыки для слов не совсем случайны. Звуки, которые мы привлекаем для ссылок на идеи могут быть лучше или хуже, мудрей или глупей. И это независимо от традиционного понимания!

Я говорю это все потому, что идея «Вы можете Х так как вам заблагорассудится» сильно мешает понять, как делать Х с умом. «Это свободная страна, и я имею право на свое мнение» стоит на пути у искусства поиска истины. «Я могу определить слово так, как захочу» — стоит на пути разделения реальности на естественные составные части. И даже кажущееся разумным «Прикрепленные к словам ярлыки случайны» стоит на пути осведомленности о компактности. Стихосложения тоже, если уж говорить об этом, — Толкиен однажды заметил, как красиво звучит фраза «cellar door»; таков уровень осведомленности нужен, чтобы использовать язык как Толкиен.

Длина слов так же играет нетривиальную роль к когнитивной науке языка:

Давайте рассмотрим слова «сиденье», «стул» и «обстановка»1. «Сиденье» — более специфическая категория, чем «стул»; «обстановка»— более общая. Но большая часть стульев объединена сходными способами их использования — похожие движения, чтобы сесть или встать, похожие причины для сидения — отдых, принятие пищи, чтение. «Сиденья» в этом отношении тоже не слишком отличаются. «Обстановка» же включает в себя вещи вроде кроватей, столов, по-разному использующихся и требующих разных телодвижений.

В терминологии когнитивной психологии «стул» относится к базовым категориям.

У людей есть привычка говорить и, предположительно, думать на базовом уровне категоризации. Проводить границы вокруг «стульев», чем вокруг более конкретной категории «сидений», или же вокруг более общей категории «обстановки». Человек скорее предложит присесть на стул, чем сесть на сидение или посидеть на обстановке.

Так что тут нет совпадения относительно длины этих слов. Базовые категории обычно имеют более короткие названия, и существительные с короткими названиями обычно относятся к базовым категориям. Это не универсальный лингвистический закон, но такая тенденция определенно присутствует. Частое употребление сопутствует коротким словам, а короткие слова — частому употреблению.

Или же как выразил это Дуглас Хофштадтер, есть причины на то, чтобы в английском языке «the» означало «the», а «antidisestablishmentarianism» использовалось для «antidisestablishmentarianism», а не наоборот.

  • 1. В оригинале «”recliner”, ”chair”, and ”furniture”». — Прим.перев.
Перевод: 
Muyyd
Номер в книге "Рациональность: от ИИ до зомби": 
174
Оцените качество перевода: 
Средняя оценка: 3.8 (8 votes)

Общая информация и плотность в пространстве вещей

Элиезер Юдковский

Предположим, у вас есть система $Х$, которая может находиться в одном из 8 состояний и все они равновероятны (относительно того, что вы о них знаете на данный момент), и система $Y$ с 4 равновероятными состояниями.

Энтропия $Х$, как следует из рассказанного вчера — 3 бита; нам потребуется задать 3 да/нет вопроса, чтобы точно узнать состояние $Х$. Энтропия $Y$, как следует из рассказанного вчера — 2 бита; нам потребуется задать 2 да/нет вопроса. Это может показаться очевидным (с учетом того, что $2^3=8$ и $2^2=4$ — три вопроса помогут выявить правду между 8 возможными вариантами, а 2 между 4), но хочу напомнить, что если бы вероятности не были бы равными, мы смогли бы использовать более хитрый код для обнаружения, например, состояния $Y$ (1,75 вопросов в среднем). Но раз уж для Х и Y вероятности распределены равномерно, схитрить у нас не получится.

Какова общая энтропия объединенной системы $(X,Y)$?

Возможно вам придет в голову ответ: «Для $X$ потребует 3 вопроса, для $Y$ — 2, так что нам потребуется задать всего 5 вопросов, чтобы узнать $(X,Y)$».

Но что если эти две переменные связаны и, узнав что-то о $Y$, мы узнаем кое-то и о $X$?

В данном случае предположим, что обе переменные либо четные либо нечетные.

И если мы получим сообщение в 3 бита (получим 3 ответа), узнаем, что $Х$ находится в состоянии 5, то будем знать, что $Y$ либо в состоянии 1 либо в 3, но не в 2 или 4. Так что лишь один вопрос «$Y$ в состоянии 3?» и ответ «нет» понадобится нам, что бы знать состояние объединенной системы $$(X,Y): X=X5, Y=Y1$$ И обнаружили мы это с помощью 4 вопросов.

Точно так же, если мы узнаем, что $Y$ в 4 состоянии, с помощью 2 вопросов, то нам понадобится лишь два вопроса, чтобы узнать, в каком из состояний $(2,4,6,8)$ находится $Х$. Опять же, лишь 4 вопроса, чтобы узнать состояние связанной системы.

Общая энтропия двух переменных определяется как разность между энтропией независимых систем и энтропией связанной системы :$$ I(X;Y) = H(X) + H(Y) - H(X,Y)$$

В данном случае между системами есть 1 бит общей информации. Узнав $Х$, мы получаем 1 бит информации о $Y$ (что сокращает пространство возможностей с 4 до 2, снижает размер в два раза). А информация о состоянии $Y$ сокращает пространство возможностей с 8 до 4.

Но как насчет случаев, где масса вероятности распределена не равномерно? Вчера, например, мы обсуждали случай $Y$, где вероятности были распределены как $1/2$, $1/4$, $1/8$, $1/8$ для 4 возможных состояний. Давайте условимся, что так будет выглядеть распределение вероятностей для $Y$, если мы будем рассматривать $Y$ независимо. Как если бы мы знали $Y$ и больше ничего. И введем еще переменную $Z$ с 2 возможными состояниями, с вероятностями $3/8$ и $5/8$.

В таком случае, только в том случае, когда объединенное распределение между этими переменными выглядим как описано ниже, — между ними нет общей информации:

$$(Z1Y1: 3/16) (Z1Y2: 3/32) (Z1Y3: 3/64) (Z1Y3: 3/64)$$

$$(Z2Y1: 5/16) (Z2Y2: 5/32) (Z2Y3: 5/64) (Z2Y3: 5/64)$$

Это распределение подчиняется закону:

$$P(Y,Z) = P(Y)P(Z)$$

Например,$$ P(Z1Y2) = P(Z1)P(Y2) = 3/8 * 1/4 = 3/32$$

Заметьте, что мы можем узнать маргинальные (независимые) вероятности $Y$ и $Z$ просто посмотрев на объединенное распределение:

$P(Y1)$ — полная вероятность всех возможных состояний $Y1$ в общем распределении:

$$P(Y1) = P(Z1Y1) + P(Z2Y1) = 3/16 + 5/16 = 1/2$$

Так что просто проанализировав общее распределение, мы можем определить являются ли маргинальные переменные $Y$ и $Z$ независимыми; т.е. когда объединенное распределение разлагается на маргинальные распределение — когда для всех $Y$ и $Z$ $P(Y,Z) = P(Y)P(Z)$.

И это важно, ведь в соответствии с теоремой Байеса:

$$P(Yi,Zj) = P(Yi)P(Zj)$$

$$P(Yi,Zj)/P(Zj) = P(Yi)$$

$$P(Yi|Zj) = P(Yi)$$

Что можно выразить словами: после того, как мы узнали состояние $Zj$, наше знание о $Yi$ никак не изменилось.

Так что когда распределение разлагается, когда $P(Y,Z) = P(Y)P(Z)$, то это равноценно тому, что мы, узнав о $Y$, не получим никакой информации о $Z$, и наоборот.

И зная это, вы можете, совершенно справедливо, начать подозревать, что между $Y$ и $Z$ нет общей информации. А там где нет общей информации, нет и байесианских свидетельств и наоборот.

Предположим, что в вышепоказанном распределении $YZ$ мы будем рассматривать каждое возможное сочетание $Y$ и $Z$, как отдельное событие — так что это распределение будет иметь всего 8 возможных вариантов с уже известными вероятностями, тогда мы сможем вычислить энтропию $YZ$ точно так же, как и в прошлый раз:

$$3/16∗ log2(3/16) + 3/32∗ log2(3/32) + 3/64∗ log2(3/64) + … + 5/64∗ log2(5/64))$$

У вас получится тот же ответ, как если бы вы отдельно посчитали энтропии систем, а затем сложили бы их. Поскольку между системами нет общей информации, наша неопределенность относительно состояния совмещенных систем точно такая же, как и относительно суммы взятых отдельно. (Вычисления я тут показывать не стану — вы и сами можете это сделать, что касается доказательства — ищите «энтропию Шеннона» («Shannon entropy») или «общую информацию» («mutual information»).)

Но что если объединенное распределение не разлагается? Например:

$$(Z1Y1: 12/64) (Z1Y2: 8/64) (Z1Y3: 1/64) (Z1Y4: 3/64)$$

$$(Z2Y1: 20/64) (Z2Y2: 8/64) (Z2Y3: 7/64) (Z2Y4: 5/64)$$

Если вы сложите объединенные вероятности, чтобы получить маргинальные, вы обнаружите, что $P(Y1) = 1/2, P(Z1) = 3/8$, и так далее — маргинальные вероятности такие же, как и раньше.

Но объединенные вероятности не всегда равны сумме маргинальных. Например, вероятность $P(Z1Y2) = 8/64$, где $P(Z1)P(Y2)$ будут $3/8 * 1/4 = 6/64$. Т.е. вероятность встретить $Z1Y2$ выше, чем мы бы ожидали, просто учитывая вероятности $Z1$ и $Y2$ отдельно.

Что в свою очередь подразумевает:

$$P(Z1Y2) > P(Z1)P(Y2)$$

$$P(Z1Y2)/P(Y2) > P(Z1)$$

$$P(Z1|Y2) > P(Z1)$$

И раз тут «необычайно высокая» вероятность $P(Z1Y2)$ определена как более высокая, чем можно предположить, отдельно рассмотрев маргинальные, можно сделать вывод, что наблюдение $Y2$ увеличит вероятность наблюдать $Z1$ и наоборот.

Поскольку есть какие-то состояния $Y$, дающие нам информацию и о $Z$ (и наоборот), между ними должна быть общая информация, что вы и обнаружите — я уверен, хоть и не проверял — в результате вычисления энтропии $YZ$ вы получите меньше неопределенности, чем в результате вычисления отдельно $Y$ и $Z$. $H(Y,Z) = H(Y) + H(Z) - I(Y;Z)$ будут все больше нуля с логической необходимостью.

(Отступлю немного от темы для небольшого замечания. Симметрия общей информации показывает, что $Y$ сообщает нам столько же о $Z$, в среднем, сколько $Z$ об $Y$. В качестве упражнения для читателей я оставлю сопоставление этого и того, что рассказывают на курсах по логике. Что из того, что все вороны черные, следует что все вороны черные, но не следует, что все черные штуки — вороны. Насколько отличается симметричное движение вероятностей байесианства от угловатой логики, даже несмотря на то, что последняя — лишь вырожденная версия первого?)

И тут вы спросите: «Какое все это имеет отношение к правильному использованию слов?»

В «Пустых ярлыках» и «Замени символ на суть», вы видели пример замены слова его определением с примером:

Все [смертные, ~без перьев, двуногие] смертны

Сократ [смертен, ~без перьев, двуногий]

Следовательно, Сократ смертен

Так зачем же нам нужно слово «человек»? Почему бы просто не сказать «Сократ смертный, без перьев и двуногий»?

Потому что полезно иметь короткие слова для часто встречающихся штук. Если ваш код для отдельных характеристик уже эффективен, то вы не получите никакого преимущества от введения специального слова для конъюнкции: например, «человек» для «смертный, без перьев, двуногий», разве что смертные штуки, штуки без перьев и двуногие штуки встречаются в реальности чаще, чем стоило бы ожидать лишь на основе маргинальных вероятностей.

В эффективных кодах длина сообщения соответствует вероятности, т.е. код для $Z1Y2$ будет такой же длины, как и сумма кодов $Z1$ и $Y2$, разве что $P(Z1Y2) > P(Z1)P(Y2)$, тогда код для $Z1Y2$ будет короче, чем сумма отдельно взятых кодов.

Это как раз соответствует ситуации, где мы можем сделать вывод об одних характеристиках вещи, пронаблюдав наличие у нее других. Для этого вероятность, что двуногие без перьев окажутся смертными, должна быть более дефолтной.

Разумеется, слово «человек» описывает очень много свойств. Когда вы видите сущность человеческой формы, которая говорит и носит одежду, то можете предположить множество биохимических, анатомических и когнитивных фактов о ней. Чтобы заменить «человек» на описание всего, что мы можем сказать о людях, нам потребуется запредельно много времени. Но это так лишь потому, что говорящие штуки с двумя ногами и без перьев более вероятны, чем маргинальные вероятности позволят предположить, уязвимы для болиголова, или имеют плоские ногти, или сверхуверенны.

Наличие одного слова для вещи вместо перечисления ее свойств позволяет сделать код компактней именно в тех случаях, когда можно предположить наличие одних свойств, основываясь на наблюдении других. (За исключением таких базовых слов как «красный», которое может быть использовано для передачи несжатого описания нашего сенсорного переживания. Но уже в случае с жуком или камнем, мы будем иметь дело со сложными совокупностями свойств, намного превышающими базовый уровень.)

Поэтому наличие слова «виггин» для зеленоглазых черноволосых людей полезней, чем просто «зеленоглазые черноволосые люди», именно тогда:

  1. Когда зеленоглазые люди, в среднем, более вероятно являются еще и черноволосыми (и наоборот), т.е. мы можем сделать вероятностный вывод о «зеленоглазости», после наблюдения «черноволосости» и наоборот.

  2. Или же когда виггины имеют другие свойства, о которых можно сделать вероятностное предположение с большей, чем сумма маргинальных, вероятностью. В данном случае нам потребуется независимо проследить за наличием черных волос и зеленых глаз, а затем можно сделать вероятностный вывод о других свойствах (вроде пристрастия к кетчупу).

Можно даже рассматривать наличие слова как своего рода обещание. Сказать кому-то «Я определяю слово «виггин» как человека с черными волосами и зеленым глазами», в соответствии с импликатурой Грайса, значит пообещать, что слово «виггин» каким-то образом поможет предположить зависимость между черными волосами и зелеными глазами и укоротить код.

Если зеленые глаза и черные волосы не встречаются с большей, чем сумма маргинальных, вероятностью, или же никакое другое свойство не встречается чаще в сочетании с этим цветом волос и цветом глаз, то слово «виггин» является ложью. Оно утверждает, что определенных людей стоит выделять в группу, а они группой не являются.

В данном случае слово «виггин» не помогает более компактно описывать реальность, ведь оно не предназначалось как помогающее сократить длину сообщения. Тогда ему не место в массиве простых объяснений. Точно так же «виггин» не поможет сделать байесианский вывод. Даже если вам неудобно называть слово «ложью», оно, как минимум, — ошибка.

Разрезать реальность по месту естественного соединения частей — проводить границы вокруг необычно плотно сконцентрированных вероятностей в пространстве вещей.

Перевод: 
Muyyd
Номер в книге "Рациональность: от ИИ до зомби": 
175
Оцените качество перевода: 
Средняя оценка: 3.9 (7 votes)

Суперэкспоненциальное пространство концептов и простые слова

Элиезер Юдковский

Вы, наверное, уже задумывались о том, что пространство вещей довольно велико. Оно гораздо больше, чем реальность, которая содержит только то, что на самом деле существует. Пространство вещей содержит всё, что могло бы существовать.

В действительности, поскольку я «определил» пространство вещей так, что в нём есть размерности для всех возможных свойств — включая связанные друг с другом свойства, например, плотность, объём и массу — для пространства вещей крайне сложно определить что-то, что можно назвать «размером». Однако, важно уметь представлять пространство вещей хоть как-нибудь. Уверен, совершенно никто не в состоянии понять стаю воробьёв, если он видит лишь облако машущих крыльями чирикающих существ вместо кластера точек в пространстве вещей.

Но пространство вещей всё равно не сравнится с пространством концептов.

В машинном обучении концепт — это правило, согласно которому включаются или исключаются примеры. Если вы видите данные {2:+, 3:-, 14:+, 23:-, 8:+, 9:-}, возможно, вы предположите, что концепт — это «чётные числа». Существует довольно много литературы (что неудивительно) о том, как по данным получать концепты. Учитывая случайные примеры, учитывая выбранные примеры. Учитывая возможные ошибки классификации. И что самое важное, учитывая различные пространства возможных правил.

Например, предположим, что мы хотим получить концепт «хороший день для игры в теннис». Возможные свойства сущности День:

Облачность: {Ясно, Пасмурно, Дождевые облака}
Температура воздуха: {Тепло, Холодно}
Влажность: {Нормальная, Высокая}
Ветер: {Сильный, Слабый}

Теперь предположим, что у нас есть следующие данные, где «+» означает, что набор удовлетворяет правилу, а «-» — что не удовлетворяет.

+ Облачность: Ясно; Температура воздуха: Тепло; Влажность: Высокая; Ветер: Сильный.
- Облачность: Дождевые облака; Температура воздуха: Холодно; Влажность: Высокая; Ветер: Сильный.
+ Облачность: Ясно; Температура воздуха: Тепло; Влажность: Высокая; Ветер: Слабый.

Какой вывод должен сделать алгоритм из этих данных?

Обучающаяся машина может сформировать свой соответствующий данным концепт следующим образом:

{Облачность: ?; Температура воздуха: Тепло; Влажность: Высокая; Ветер: ?}.

Чтобы определить подходит ли какой-то пример данных или нет, мы сравниваем последовательно все элементы. ? означает, что подходит любое значение, но если какое-то конкретное значение задано, то подходит только оно.

То есть концепт выше примет только тот День, в котором Температура воздуха = Тепло и Влажность = Высокая. Переменные Облачность и Ветер могут принимать любые значения. Пока это согласуется со всеми данными, которые у нас есть. Хотя это далеко не единственный концепт, который подошёл бы нам .

Мы можем упростить запись концепта выше следующим образом:

{?, Тепло, Высокая, ?}

Если не вдаваться в детали, классический алгоритм можно записать так:

  • Поддерживать набор наиболее общих гипотез, соответствующих данным. Эти гипотезы должны положительно классифицировать как можно больше исходов, при этом не противореча фактам.
  • Поддерживать другой набор как можно более конкретных гипотез, соответствующих данным. Гипотезы в этом наборе должны отрицательно классифицировать как можно больше исходов, при этом не противореча фактам.
  • Каждый раз, когда мы наблюдаем отрицательный исход, мы усиливаем наиболее общие гипотезы как можно меньше, чтобы новый набор оставался как можно более общим и при этом не противоречил фактам.
  • Каждый раз, когда мы наблюдаем положительный исход, мы ослабляем наиболее конкретные гипотезы как можно меньше, чтобы новый набор оставался как можно более конкретным и при этом не противоречил фактам.
  • Продолжаем до тех пор, пока не останется одна гипотеза. Это и будет правильным решением — при условии, что правильное решение вообще попало в наше пространство гипотез.

В нашем примере набор наиболее общих гипотез выглядит так:

{{?, Тепло, ?, ?}, {Ясно, ?, ?, ?}},

при этом множество наиболее конкретных гипотез содержит единственный вариант {Ясно, Тепло, Высокая, ?}.

Любой другой концепт, который описывает данные, будет строго более конкретным, чем самая общая гипотеза, и строго более общим, чем самая конкретная гипотеза.

(Больше на эту тему можно прочитать в книге «Машинное обучение» Тома Митчелла1, из которой был взят и адаптирован пример выше.)

Возможно, вы уже заметили, что все возможные концепты в таком формате описать нельзя. Например, в нём нельзя описать концепт «играть в теннис, когда ясно или когда тепло». Этот концепт соответствует данным, но если мы пользуемся представлением, описанным выше, не найдётся набора из четырёх значений, который опишет такое правило.

Очевидно, наша обучающаяся машина не охватывает всю полноту концептов. Почему бы не позволить ей представлять вообще все возможные концепты, чтобы она могла обучаться максимально гибко?

Каждый день описывается четырьмя переменными. У одной из них три возможных значения, у трёх — два возможных значения. Итого у нас 3 × 2 × 2 × 2 = 24 возможных варианта дня.

Формат для представления концептов выше требует, чтобы мы указывали одно из значений переменной или оставляли его неизвестным. Таким образом мы можем описать 4 × 3 × 3 × 3 = 108 концептов. Чтобы работал алгоритм «наиболее-общий/наиболее-конкретный», необходимо начать с максимально конкретной гипотезы «ни один исход никогда не окажется положительным». Итого мы получаем 109 концептов.

Подозрительно ли, что возможных концептов больше, чем возможных дней? Абсолютно нет. Ведь концепт можно рассматривать как совокупность дней. Можно представлять концепт как набор дней, классифицированных положительно, или, что то же самое, как набор дней, классифицированных отрицательно.

Таким образом, пространство всех возможных концептов классификации дней содержит в себе множество всех возможных множеств дней и его размер $2^{24} = 16 777 216$.

Указанное пространство включает в себя все концепты, которые мы обсуждали до сих пор. Однако оно содержит и такие концепты как «положительно классифицировать только случаи {Ясно, Тепло, Высокая, Сильный} {Ясно, Тепло, Высокая, Слабый} и отвергать все остальные» или «отрицательно классифицировать только случаи {Дождевые облака, Холодно, Высокая, Сильный} и принимать все остальные». Также в это пространство входят концепты без компактного описания, то есть списки допустимых и недопустимых случаев.

В этом проблема создания сильной обучающейся машины: она не может изучить концепт, пока не рассмотрит каждый доступный случай пространства случаев.

Если мы добавим больше свойств для сущности День, например, «Температура воды» или «Прогноз погоды на завтра», то с увеличением числа свойств число возможных вариантов вырастет экспоненциально. В нашем случае с ограниченным пространством концептов это не проблема: большой набор вариантов можно сузить логарифмическим числом примеров.

Допустим, мы добавляем свойство Вода: {Тёплая, Холодная}. Число возможных вариантов дня увеличивается на 48, число возможных концептов — на 325. Допустим, примерно половина подходящих нам концептов классифицирует каждый наблюдаемый день положительно, а другая половина — отрицательно. В таком случае, классифицируя конкретный пример, мы сокращаем пространство подходящих концептов в два раза. То есть, чтобы сузить 325 концептов до одного, нам может хватить всего 9 примеров ($2^9 = 512$).

Даже если у дня будет сорок бинарных свойств, мы всё равно сможем сузить пространство концептов до одного с помощью относительно небольшого набора данных. Если каждый пример сокращает количество возможных вариантов вдвое, нам потребуется шестьдесят четыре примера. Конечно, при условии, что реальное правило представимо в нашем формате!

Однако, если вы захотите рассмотреть все возможные варианты правил, мне останется лишь пожелать вам удачи. Пространство допустимых концептов с ростом числа свойств растёт суперэкспоненциально.

В системе с сорока бинарными свойствами количество всех возможных состояний превышает триллион, а количество возможных концептов — два в триллионной степени. Чтобы сузить такое суперэкспоненциальное пространство концептов и понять, что было на входе и что на выходе, потребовалось бы рассмотреть триллион случаев. По сути, каждый возможный случай.

И это, напоминаю, сорок двоичных свойств. Сорок бит или пять байт с вариантами «Да» или «Нет». Сорок бит это $2^{40}$ возможных случаев и $2^{2^{40}}$ возможных концептов, согласно которым можно классифицировать каждый случай как положительный или отрицательный.

В повседневной жизни, чтобы описать объект, зачастую требуется больше 5 байт. Кроме того, у нас нет триллиона примеров для обучения, а в данных присутствует шум. О довольно привычных понятиях в таких условиях сложно даже подумать. Человеческий разум — и даже вся наблюдаемая Вселенная — недостаточно велики, чтобы рассмотреть все гипотезы.

С этих позиций, обучение не просто опирается на индуктивные эвристики отбора2, оно по сути целиком и полностью из них состоит. Сравните количество концептов, отброшенных априори и количество концептов, отброшенных на основании наличия свидетельств.

«Но какое это имеет отношение к использованию слов?», — спросите вы.

Смысл в том, что у слов есть как интенсионалы, так и экстенсионалы.

В прошлом эссе я подвел следующий итог:

Разрезать реальность по месту естественного соединения частей — проводить границы вокруг необычно плотно сконцентрированных вероятностей.

В это (немного отредактированное) утверждение я специально не вставил важное уточнение, потому что до настоящего момента я не мог его объяснить. Правильнее было бы сформулировать так:

Разрезать реальность по месту естественного соединения частей — проводить простые границы вокруг необычайно плотно сконцентрированных вероятностей в пространстве вещей.

Иначе можно нарезать пространство вещей произвольно. Создавать очень причудливые границы, в которые попадают не связанные друг с другом примеры, и получать множества, которые невозможно описать короче, чем перечислением их элементов. И после этого говорить: «Вот это я видел раньше и это ожидаю увидеть в будущем».

В реальном мире ничего выше уровня молекул не повторяется в точности. Сократ очень похож на всех уязвимых к болиголову людей, но не идентичен им. Поэтому предположение, что Сократ — «человек» основано на простых границах вокруг кластера людей в пространстве вещей. Мы не используем утверждения вида: «Вещи полностью соответствующие [спецификация 1 на пять мегабайт] с [описание множества характеристик] или полностью соответствующие [спецификация 2 на пять мегабайт] с [описание множества других характеристик] … — являются людьми».

Чтобы делать выводы из опыта, нужно внутри него проводить простые границы. Именно поэтому «искусство» описывают содержательными определениями вроде «нечто, созданное с намерением вызывать какие-то сложные эмоции ради самого вызывания эмоций» вместо указания на длинный перечень штук, являющихся или не являющихся искусством.

По сути, утверждение о разрезании реальности по месту естественного соединения частей немного походит на проблему курицы и яйца. Невозможно определить плотность наших наблюдений, пока не проведены хоть какие-то границы. Распределение вероятностей опирается на проведённые границы, а не наоборот. Ведь если бы у вас было распределение вероятностей, вы уже могли бы сделать необходимые выводы. Зачем тогда проводить границы?

А отсюда вытекает ещё одна — да, ещё одна — причина сомневаться в утверждении «можно определить слово как угодно». Учитывая суперэкспоненциальные размеры пространства концептов, очевидно, что выделение любого отдельного концепта и отбрасывание всех остальных — это акт немалой наглости. И не только для нас, но и для любого разума с ограниченными вычислительными способностями.

Определение слова «виггин» как «черноволосого зеленоглазого человека» без каких-либо оснований для выделения этого концепта в зону нашего внимание подобно поведению детектива, который сказал бы: «Итак, у меня нет никаких оснований делать какие-либо выводы о личности убийцы сирот… ни одной догадки… Давайте возьмём в качестве подозреваемого Джона К. Уиффлхайма, живущего по адресу Норкл роуд, 1234?»

  • 1. Tom M. Mitchell, Machine Learning (McGraw-Hill Science/Engineering/Math, 1997).
  • 2. В оригинале используется термин inductive bias. — Прим.перев.
Перевод: 
sepremento, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
176
Оцените качество перевода: 
Средняя оценка: 4.8 (5 votes)

Условная независимость и наивный Байес

Элиезер Юдковский

Ранее я называл общей информацией $I(X;Y)$ двух переменных $X$ и $Y$ разницу между энтропией составного распределения $H(X,Y)$ и суммарной энтропией частных распределений $H(X) + H(Y)$.

Я приводил пример с переменной $Х$, которая может принимать восемь состояний $X_{1}, …, X_{8}$ (эти состояния при отсутствии каких-либо свидетельств равновероятны) и переменной $Y$, принимающих четыре состояния $Y_{1}, …, Y_{4}$ (также равновероятных при отсутствии каких-либо свидетельств). Можно показать, что предельные энтропии $H(X)$ и $H(Y)$ равны 3 и 2 бита соответственно.

Однако нам известно, что $X$ и $Y$ либо одновременно чётные, либо одновременно нечётные. Таким образом, совместное распределение $(X,Y)$ содержит 16 равновероятных состояний, и энтропия этого распределения равна 4 битам. Это приводит к недостатку энтропии в 1 бит по сравнению с 5 битами $X$ и $Y$, будь они независимыми. Этот недостаток энтропии — общая информация: информация, которую $X$ сообщает нам об $Y$, и наоборот. Это уменьшает нашу неопределенность в знании одной переменной при получении знания о другой.

Но предположим, что существует переменная $Z$ с состояниями «чётно» и «нечётно», с идеальной корреляцией с четностью распределения $(X,Y)$. Иными словами, $Z$ — это просто вопрос: «являются ли $X$ и $Y$ чётными или нечётными?»

Если у нас нет свидетельств об $X$ и $Y$, то, с учётом известной информации, у $Z$ определённо 1 бит энтропии. Есть один бит общей информации между $Z$ и $X$, а также один бит общей информации между $Z$ и $Y$. Сколько получится энтропии у всей системы $(X, Y, Z)$? Можно наивно полагать, что
$$H(X,Y,Z) = H(X) + H(Y) + H(Z) − I(X;Z) − I(Z;Y) − I(X;Y),$$
но, оказывается, это не так.

Составная система $(X, Y, Z)$ обладает 16 возможными состояниями, поскольку $Z$ это лишь вопрос «Являются $X$ и $Y$ четными или нечетными?», поэтому $H(X,Y,Z) = 4$ бита.Но если посчитать согласно вышеприведённой формуле, получится
$$(3 + 2 + 1 − 1 − 1 − 1) бит = 3 бита = Неверно!$$
Почему? Потому что если есть общая информация между $X$ и $Z$, а также общая информация между $Z$ и $Y$, они могут содержать ту же общую информацию, которая появилась бы при подсчёте общей информации между $X$ и $Y$. Например, в нашем случае знание, что $X$ — чётно, приводит к знанию, что $Z$ — чётно, а это в свою очередь говорит нам, что $Y$ — чётно, но это та же самая информация, которую нам даёт $X$ о $Y$. Мы считаем одно и то же два раза, а потому энтропии оказывается слишком мало.

Правильная формула такова:
$$H(X,Y,Z) = H(X) + H(Y) + H(Z) − I(X;Z) − I(Z;Y) − I(X;Y|Z).$$

Последнее слагаемое $I(X;Y|Z)$ означает «информацию, которую $X$ несёт об $Y$, при условии, что $Z$ известно». В нашем случае $X$ не несёт какой-либо информации об $Y$, при условии, что $Z$ известно, поэтому слагаемое равно нулю, а уравнение даёт правильный результат. Ну вот, разве не прекрасно?

«Нет», — правильно ответите вы, — «ведь ты не сказал, как вычислить слагаемое $I(X;Y|Z)$, а лишь словесно описал, что оно должно быть равно нулю».

Мы вычисляем $I(X;Y|Z)$ уже привычным способом. Мы знаем, что $I(X;Y) = H(X) + H(Y) − H(X,Y)$, а поэтому
$$I(X;Y|Z) = H(X|Z) + H(Y|Z) − H(X,Y|Z).$$

А теперь вам должно быть интересно, как вычислить условную энтропию? Исходная формула для энтропии выглядит так:
$$H(S) = -\sum\limits_{i}p(S_{i})\log_{2}{p(S_{i})}$$

Если нам становится известен факт Z0, оставшаяся неопределенность относительно S окажется равна
$$H(S|Z_{0}) = -\sum\limits_{i}p(S_{i}|Z_{0})\log_{2}{p(S_{i}|Z_{0})}.$$

А значит, если нам становится известно что-либо о Z, то в среднем мы ожидаем вот такой неопределенности после этого знания:
$$H(S|Z) = -\sum\limits_{j}\left( p(Z_{j})\sum\limits_{i}p(S_{i}|Z_{j})\log_{2}{p(S_{i}|Z_{j})}\right).$$

Вот так считаются условные энтропии, из которых впоследствии можно извлечь условную общую информацию.

Существует огромное количество вспомогательных теорем вроде
$$H(X|Y) = H(X,Y) − H(Y)$$

и если $I(X;Z) = 0$ и $I(Y;X|Z) = 0$, то $I(X;Y) = 0$,

но я не стану вдаваться в подробности.

«Но», — спросите вы, — «какое отношение это имеет к природе слов и их скрытой байесианской структуре?»

Я несказанно рад вашему вопросу, ведь я собирался рассказать об этом независимо от вашего желания. Но вначале нужно проговорить ещё кое-что.

Следует запомнить — и как следует, — что между общей информацией и байесовским свидетельством есть связь. Общая информация положительна тогда и только тогда, когда вероятность хотя бы одного составного события $P(x,y)$ не равна произведению вероятностей событий по отдельности $P(x)P(y)$. Это, в свою очередь, эквивалентно наличию байесовского свидетельства между $x$ и $y$.

$$I(X;Y) > 0 =>$$
$$P(x,y) \neq P(x) \cdot P(y) $$
$$\frac{P(x,y)}{P(y)} \neq P(x)$$
$$P(x|y) \neq P(x)$$

При условии известного $Z$, уравнения можно переписать как:

$$I(X;Y | Z) > 0 =>$$
$$P(x,y|z) \neq P(x|z) \cdot P(y|z)$$
$$\frac{P(x,y|z)}{P(y|z)} \neq P(x|z)$$
$$\frac{(P(x,y,z) / P(z))}{(P(y, z) / P(z))} \neq P(x|z)$$
$$\frac{P(x,y,z)}{P(y,z)} \neq P(x|z)$$
$$P(x|y,z) \neq P(x|z)$$

Последняя строчка обозначает: «Даже при известном $Z$, знание $Y$ меняет наши представления об $X$»

И, наоборот, в нашем примере знание, что $Z$ чётно или нечётно экранирует $X$ от $Y$. Если мы знаем, что $Z$ — чётно, то информация $Y = Y_{4}$ не помогает нам узнать, в каком именно состоянии находится $X$: $X_{2}$, $X_{4}$, $X_{6}$, или $X_{8}$. Также, если мы знаем, что $Z$ — нечётно, то информация $X = X_{5}$ не несёт информации, находится ли $Y$ в состоянии $Y_{1}$ или $Y_{3}$. Знание $Z$ сделало $X$ и $Y$ условно независимыми.

Условная независимость — очень важное понятие в теории вероятностей. Кто-то даже утверждает, что без условной независимости у вселенной не было бы структуры.

В этом эссе, впрочем, я хочу поговорить лишь об одном виде условной независимости: случае, когда некая центральная переменная экранируется другими окружающими её переменными (получается что-то вроде тела с тентаклями).

Предположим, у нас есть пять переменных $U$, $V$, $W$, $X$ и $Y$, причём для каждой пары этих переменных, одна является свидетельством о другой. То есть, например, если взять пару $U$ и $W$, то знание $U = U_{1}$ изменит ваши убеждения о вероятности $W = W_{1}$.

Что это? Нераспутываемый клубок причин и следствий? Сумасшествие свидетельств? Не обязательно.

Представим, что $U$ — «умеет разговаривать», $V$ — «две руки и десять пальцев», $W$ — «носит одежду», $X$ — «умирает от болиголова», а $Y$ — «красная кровь». Теперь, если вы встретите в повседневной жизни нечто, что может быть яблоком, а может быть и камнем и узнаете, что оно говорит по китайски, вы обязаны присвоить большую вероятность гипотезе, что оно носит одежду. А если вы узнаете, что это нельзя отравить болиголовом, вы присвоите меньшую вероятность гипотезе красной крови.

Некоторые правила строже других. Пауль потерял палец во время извержения вулкана. Младенец Майкл пока не умеет говорить. IRC-бот Ирвин разговаривает, но у него нет крови. Знание о цвете крови, полученное из факта обладания разговорной речью, не экранируется от нас, если мы узнаем, что нечто не носит одежду. Тот, кто не носит одежду и при этом разговаривает, может оказаться нудисткой Нелли.

Этот пример гораздо интереснее, чем, например, случай с пятью целочисленными переменными, которые одновременно чётные или нечётные, но в остальном не связаны друг с другом. В случае с целочисленными переменными знание одной из них экранирует всё, что вторая переменная могла сказать о третьей.

Но в этом новом примере, как показывает случай с нудисткой Нелли, зависимости не исчезают, когда мы узнаём значение одной из переменных. То есть, это всё-таки нераспутываемый клубок причин и следствий?

Не бойтесь! Ведь может существовать шестая переменная $Z$, которая, если бы мы знали её значение, действительно экранировала бы любую пару переменных друг о друга. Может существовать — даже если нам придётся её создать самим, а не наблюдать напрямую — такая переменная, что:

$P(U|V,W,X,Y,Z) = P(U|Z)$
$P(V|U,W,X,Y,Z) = P(V|Z)$
$P(W|U,V,X,Y,Z) = P(W|Z)$

Возможно, при условии, что нечто является «человеком», вероятности, что оно говорит, носит одежду и обладает стандартным количеством пальцев являются независимыми. У Пауля нет пальца, но у него столько же шансов оказаться нудистом, как и у любого другого человека. Нелли никогда не носит одежду, но это знание не уменьшает вероятности владения ею разговорной речью. А малыш Майкл ещё не говорит, но все конечности у него на месте.

Это называется методом «наивного Байеса». Обычно он не совсем верен, но можно упростить вычисления, если вообразить его истинность. Мы не следим за влиянием ношения одежды на речевые способности, учитывая количество пальцев. Мы просто используем всю наблюдаемую информацию, чтобы оценить вероятность, что перед нами человек (или, наоборот, кто-то ещё — например, шимпанзе или робот). А затем мы применяем наши убеждения о центральном классе, чтобы предсказать то, что мы не наблюдаем: например, уязвимость к болиголову.

Любое наблюдение $U$, $V$, $W$, $X$ или $Y$ лишь является свидетельством переменной центрального класса $Z$, а затем мы используем апостериорное распределение $Z$ для необходимых нам предсказаний ненаблюдаемых переменных $U$, $V$, $W$, $X$ или $Y$.

Знакомо звучит? А должно бы:

Сеть 2

В сущности, если использовать правильные элементы сети, то такая «нейронная сеть» окажется математически эквивалентной наивному Байесу. Нужно лишь, чтобы у центрального элемента была логистическая функция активации, а веса у элементов на входе должны равняться логарифмам соотношений правдоподобия, ну и так далее. Можно даже предположить, что логистическая функция отклика в нейронных сетях так часто подходит в том числе именно потому, что она позволяет алгоритму немножко заниматься байесианскими рассуждениями, пока создатели не смотрят.

Если кто-то показывает вам алгоритм, называя его «нейронной сетью», и прибавляя загадочные слова вроде «неряшливый»1 и «эмерджентный», и при этом гордо заявляет, что невозможно понять, как обученная сеть работает, то не думайте, что этот малыш-ИИ действительно выходит за пределы царства логики. Потому что, в конце концов, если он работает, он окажется байесовой структурой, может даже точь-в-точь алгоритмом, называемым байесовским.

Даже если на первый взгляд он не похож на байесовский.

А потом, как известно, байесианцы начнут объяснять, как этот алгоритм работает, на каких предположениях он основывается, какие зависимости окружающей среды использует, где сработает, а где нет, и даже станут присваивать понятные значения весам натренированной сети.

Досадно, да?

  • 1. В оригинале scruffy. — Прим.перев.
Перевод: 
sepremento, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
177
Оцените качество перевода: 
Средняя оценка: 4.5 (2 votes)

Слова как мысленные кисти

Элиезер Юдковский

Представьте, что я скажу вам: «Удивительно — у светильников в этом отеле треугольные лампочки».

Может быть, вы это уже представили, может быть, нет. Если нет, сделайте это сейчас. Какими именно представляет ваш внутренний взор треугольные лампочки?

В частности, у них острые края или закруглённые?

Насколько мне позволяет судить интроспекция, когда у меня в голове впервые появилось словосочетание «треугольные лампочки» (нет, в отеле их не было), я сразу же увидел лампочку в виде пирамидки с острыми краями. Затем (практически мгновенно) грани сгладились, после чего мой мозг, в качестве альтернативы, выдал замкнутую трубку люминесцентной лампы в форме треугольника со скруглёнными краями.

Кажется, ни одной сформулированной/словесной мысли при этом задействовано не было. Лишь быстрая безмолвная реакция в ответ на воображаемый образ острого стекла, изъяны в форме которого были исправлены до того, как на ум пришло первое слово.

Можете не верить, но люди несколько десятилетий всерьёз спорили о том, можем ли мы создавать визуальные образы в своей голове на самом деле — например, можем ли мы по-настоящему мысленно увидеть изображение стула в каком-нибудь окружении, — или мы лишь наивно думаем, что можем (будучи обмануты этим «самонаблюдением», ужасной и запрещенной деятельностью), а на самом деле в нашем мозге просто активируется маленький ярлычок «стул», что-то вроде LISP токена.

Сейчас мне очень сложно удержаться от восклицаний вроде «Какая потрясающая нелепость». Такие восклицания — следствия ошибки знания задним числом. Но всё же: какая потрясающая нелепость.

Я думаю, подобная точка зрения в академической среде в значительной степени была безумным наследием бихевиоризма. Бихевиоризм отрицал существование мышления у людей и пытался объяснить все аспекты человеческого поведения (включая речь) «рефлексами». Скорее всего, о бихевиоризме стоит написать отдельно, как о своеобразном извращении рационализма. Но сейчас я пишу о другом.

«Ты называешь это предположение нелепым, — скажете вы, — но откуда ты можешь узнать, что твой мозг производит эти визуальные образы? Тебе достаточно того, что ты просто закрываешь глаза и видишь их?»

Сейчас ответить на этот вопрос проще, чем в те времена. Если вас не устраивает простое самонаблюдение и вы намерены проверить реальность мысленных образов «научно», вам понадобится вывести это из эксперимента. Например, покажите людям два предмета и спросите, можно ли один из них повернуть так, чтобы получить второй. Время ответа линейно зависит от необходимого угла поворота. Такой результат сложно объяснить, если вы только сверяете какие-то особенности изображений. Но если вы действительно представляете предмет в уме и непрерывно вращаете его с постоянной скоростью, то все сходится.

Сегодня мы можем увидеть настоящие нейрообразы небольших картинок из зрительной коры. Так что, да, ваш мозг реально воспроизводит детализированные визуальные образы того, что он видит или представляет. Советую книгу Стивена Косслина «Мозг и Образы: итоги споров о воображении»1.

Людям сложно использовать слова в том числе и потому, что они не понимают всю сложность, что таится за ними.

Вы можете представить «зелёную собаку»? Вы можете представить «сырное яблоко»?

«Яблоко» — это не просто последовательность из трёх слогов или шести букв. Последовательность из шести букв всего лишь тень. Лишь кончик от тигриного хвоста.

Слова, точнее понятия, скрывающиеся за ними, подобны кистям художника. Вы можете писать ими картины в вашем собственном воображении. Писать в буквальном смысле, если вы используете кисти идей, чтобы создать картину на холсте своей зрительной коры. Используя общие ярлыки, вы также можете схватить кисти в головах других людей и написать картины там. Например, набросать маленькую зелёную собачку на чьей-то зрительной коре.

Но, распространяя звуки через воздух или буквы через Интернет, не заблуждайтесь, будто именно звуки и буквы пишут картины в зрительной коре. Эта задача требует более сложных инструкций, чем могла бы вместить последовательность букв. «Яблоко» — это шесть байт, но написание натюрморта с яблоком с нуля потребовало бы гораздо больше данных.

«Яблоко» — это всего навсего ярлык, скреплённый с настоящей и невыразимой словами идеей яблока. Идеей, что может написать картину в вашей зрительной коре, или столкнуться с «сырностью», или распознать яблоко, когда оно будет перед вашими глазами, или почувствовать его образец в яблочном пироге, или даже запустить движение челюсти, привычное при поедании яблока…

И это не просто воспроизведение картинок из памяти. Иначе как вы могли бы визуализировать нечто вроде «треугольной лампочки», наложить треугольность на лампочку и совместить обе сущности, если никогда в своей жизни не видели ничего похожего?

Не совершайте той же ошибки, что и бихевиористы. Речь гораздо сложнее, чем просто звуки в воздухе. Ярлыки служат лишь указателями: «Ищите в сегменте памяти №1387540». Если у вас есть указатель, рано или поздно настанет время перейти по нему и действительно заглянуть в сегмент памяти №1387540.

На что слово указывает?

  • 1. Stephen M. Kosslyn, Image and Brain: The Resolution of the Imagery Debate (Cambridge, MA: MIT Press, 1994).
Перевод: 
Kath May
Номер в книге "Рациональность: от ИИ до зомби": 
178
Оцените качество перевода: 
Средняя оценка: 4.5 (6 votes)

Ошибка изменяемого вопроса

Элиезер Юдковский

Альберт: «Каждый раз, когда я слышал падение дерева, оно создавало звук, поэтому я считаю, что остальные деревья тоже создают звуки в процессе падения. Я не думаю, что мир ведёт себя по-разному в зависимости от того, смотрю я на него или нет».

Барри: «Секундочку! Если никто не может этого услышать, то как это может быть звуком?»

Иногда, когда я описываю диалог между Альбертом и Барри о том, создаёт ли звук падающее дерево в лесу, я замечаю, что уже не могу сопереживать моим героям. Я просто перестаю на интуитивном уровне понимать, откуда берутся такие споры, пусть я и наблюдал их многократно.

В такие минуты, чтобы заново вернуть себе это чувство возмущения, я повторяю себе: «Падающее дерево либо производит звук, либо нет!»

Для произвольного высказывания P на привычном нам языке, выражение (P или ¬P) не всегда оказывается надежной эвристикой. Высказывание «Это высказывание ложно» невозможно считать ни истинным, ни ложным. А ведь ещё можно вспомнить старое доброе: «Вы перестали бить свою жену, да или нет?»

У математика, который верит в классическую (а не интуитивную) логику, есть способы всё равно настаивать на том, что (P или ¬P) — это теорема. Например, можно заявить, что «это высказывание ложно» — не высказывание.

Однако все такие способы достаточно нетривиальны, и этого достаточно, чтобы показать, что не всё так просто. Нельзя просто сломя голову нестись с фразой «либо это есть, либо этого нет!»

Так производит падающее дерево звук или нет, или…?

Конечно, 2 + 2 либо равняется Х, либо нет? Возможно и так, если не меняется Х, не меняется 2, и не меняются + и =. Если же Х иногда оказывается равным 5, а иногда — 4, ваше возмущение может оказаться неуместным.

Чтобы утверждать, что (P или ¬P) обязано быть правдой, символ P должен обозначать одно и то же в обеих частях дилеммы. «Либо падение производит звук, либо нет!» — но если Альберт::звук не то же самое, что и Барри::звук, нет ничего парадоксального в том, чтобы дерево производило Альберт::звук, но не Барри::звук.

(Использование :: во избежание путаницы в пространстве имен вошло у меня в привычку со времен использования C++. Если есть две разных библиотеки, определяющие класс Звук, можно писать Библиотека1::Звук, уточняя, какой именно Звук имеется в виду. К сожалению, такая практика, кажется, не слишком распространена. Мне часто хочется использовать её при письме.)

Различие может быть очень тонким: Альберт и Барри могут тщательно проговорить, что речь идёт об одном и том же дереве, в том же самом лесу, падение то же самое и убедиться, что их разногласия касаются одного и того же события. И при этом не проверить, обсуждают ли они одно и то же понятие.

Вспомните продуктовый магазин, в который вы чаще всего заходите. Он на левой стороне улицы или на правой? Но, разумеется, никакой «левой стороны» улицы нет, есть только левая сторона для вас по мере движения в каком-нибудь направлении. Многие слова, которые мы используем, по сути являются функциями неявно заданных переменных, полученных из контекста.

Это явление называется «дейксис говорящего». И решить эту задачу для создания искусственного интеллекта, который должен обрабатывать естественный язык, ужасно сложно.

«Мартин сказал Бобу, что здание слева от него». Но «слева» — это слово-функция. И эта функция вычисляется, исходя из значения обусловленной говорящим человеком переменной, которая незаметно извлекается из контекста. Чьё «слева» имеется в виду, Боба или Мартина?

Переменные в ошибке изменяемого вопроса часто сложно заметить. Ситуации из жизни обычно сложнее, чем: «То есть, ты думаешь, что Z + 2 равно 6?»

Если путаница в пространстве имён приводит к тому, что два разных понятия выглядят единым, потому что они называются одинаково, или сжатая карта показывает два разных события как одно, потому что для них есть только один файл в голове, или одна и та же функция возвращает разный результат в разном контексте, то сама реальность становится изменчивой. По крайней мере, так алгоритм ощущается изнутри. Сознание видит только карту, но не саму территорию.

Если вы столкнулись с вопросом, в котором есть скрытая переменная, и в разных контекстах у вас получаются разные выражения, кажется, что реальность нестабильна сама по себе. Картина, которую вы видите своим разумом, меняется в зависимости от направления взгляда.

Студенты (и профессоры-постмодернисты) часто теряются, когда обнаруживают предложение с более чем одним способом интерпретации. Им кажется, что они открыли нестабильную часть бытия.

«О, чудо! „Солнце вращается вокруг Земли“ истинно для охотника Унги, но для астронома Амары „Солнце вращается вокруг Земли“ ложно! Не бывает однозначной истины!» Разбор этого умствования первокурсника я оставлю читателю в качестве упражнения.

Но всё же, даже я сам поймал себя на том, что пишу: «Если X равно 5 в некоторых случаях и 4 в других, то высказывание „2+2 = X“ может не иметь постоянного значения истинности». Не бывает высказываний с переменной истинностью. У «2+2 = X» нет значения истинности. Это не высказывание в математическом смысле. Это сочетание символов можно считать высказыванием в той же мере, в какой высказыванием является выражение «2 + 2 =», а «Фред перепрыгнул через» — грамматически верное предложение.

Но эта ошибка прокрадывается в наши рассуждения, даже когда вы о ней прекрасно знаете. Потому что именно так алгоритм ощущается изнутри.

Перевод: 
sepremento, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
179
Оцените качество перевода: 
Средняя оценка: 5 (4 votes)

Когда слова ошибочны

Элиезер Юдковский

Некоторые читатели утверждают, что было бы лучше назвать это эссе1 «37 случаев, в которых слова можно использовать неразумно» или «37 случаев, когда недостаточно оптимальное использование категорий может вызвать негативные эффекты в вашем восприятии». Но одна из основных идей, которым учит этот немаленький список, заключается в том, что утверждение «Не может быть, чтобы мой выбор Х был неверным» практически всегда ошибочно, независимо от теории. Люди могут заблуждаться в любом конкретном случае. Даже если теоретически возможно быть всегда правым, на деле вы будете ошибаться. Не бывает универсального счастливого билета на любой случай, такова жизнь.

Кроме того, я могу определить слово «ошибочен» любым способом, каким захочу — но это не значит, что само слово становится ошибочным. Впрочем, лично я считаю, что в следующих случаях использование понятия «ошибочный» вполне оправдано:

  1. Слово потеряло всякую связь с реальностью.
    Является ли Сократ фрамстером? Да или нет? (Притча о кинжале.)

  2. Ваши слова, если бы такое было возможно, принудили бы реальность измениться при изменении словесного определения.
    Сократ — человек, а люди по определению смертны. Если вы определите людей как бессмертных существ, будет ли Сократ жить вечно? (Притча о болиголове.)

  3. Вы пытаетесь установить эмпирические взаимоотношения, как будто бы они верны «по определению».
    Сократ — человек, а все люди по определению смертны. В таком случае будет ли логически верным, если мы предскажем результат опыта, в котором Сократ пьёт настойку болиголова и теряет сознание? Ведь является логически возможным и непротиворечивым существование миров, в которых Сократ не потеряет сознание. В которых он будет иметь иммунитет к болиголову, в результате, например, странного сбоя в его биохимических процессах. Логические истины истинны во всех возможных мирах, но эти истины не сообщают, в каком из возможных миров вы находитесь. Поэтому всё, что вы задаёте «по определению» является логически верным. (Притча о болиголове.)

  4. Вы неосознанно навешиваете условные ярлыки на что-либо, в реальности не используя словесные определения, которые вы только что дали.
    Вы точно знаете, что Боб — человек. Хотя, в вашем определении вы не будете называть Боба человеком, не удостоверившись сначала в том, что он смертен. (Притча о болиголове.)

  5. Факт навешивания словесного ярлыка скрывает спорный индуктивный вывод, который вы делаете.
    Если последние 11 извлечённых вами яйцевидных объектов были синими, а последние 8 кубических объектов были красные, то применив индукцию вы можете предположить, что это соотношение сохранится и будущем. Но если вы назовёте синие яйца «сияйцами», а красные кубы «крубами», то вы можете засунуть руку в бочку, нащупать что-то круглое и подумать «Ага, сияйцо». (Слова как скрытые умозаключения.)

  6. Вы пытаетесь определить одни слова с использованием других, более сложных и формальных понятий, без возможности указать на конкретный образец.
    — Что такое «красный»?
    — «Красный» это цвет.
    — Что такое «цвет»?
    — Цвет это свойство вещей.
    — Что такое «свойство»? Что такое «вещь»?
    Такого не случится, если вы укажете на красный сигнал светофора и на красное яблоко. (Экстенсионалы и интенсионалы.)

  7. Фактическое определение не совпадает со словесным определением.
    Мы не осознаём, что определяем красную точку на небе как «Марс», и это может происходить независимо от того, что мы определим «Марс» как бога войны. (Экстенсионалы и интенсионалы.)

  8. Ваше словесное определение охватывает всего лишь небольшую часть общих характеристик категории, но вы пытаетесь рассуждать, будто определение полное.
    Когда философы в платоновской академии решили, что лучшим определением человека является «двуногое без перьев», киник Диоген предъявил им ощипанного петуха и провозгласил, что это и есть «человек Платона». Тогда ученики Платона просто исправили определение на «двуногое без перьев и с плоскими когтями». (Кластеры подобия.)

  9. Вы пытаетесь рассматривать членство в определённой категории по принципу всё или ничего, не обращая внимания на то, что могут существовать подгруппы более или менее типичных членов.
    Утки и пингвины являются менее типичными птицами по сравнению с малиновками и голубями. Интересно, что межгрупповые эксперименты показали, что люди думают, будто болезни легче передаются от малиновок к уткам на островах, чем от уток к малиновкам. (Типичность и асимметричное подобие.)

  10. Словесное определение хорошо работает, чтобы на практике указывать на группы сходных объектов, но вы придираетесь к исключениям.
    Не каждый человек имеет десять пальцев, или носит одежду, или использует язык. Однако, если посмотреть на реальные группы объектов, которые разделяют эти характеристики, вы получите достаточно информации, чтобы попадающиеся время от времени люди с девятью пальцами не ввели вас в заблуждение. (Кластерная структура пространства вещей.)

  11. Вы спрашиваете, принадлежит ли объект некоторой категории, но не называете вопрос, ответ на который вы на самом деле хотите получить.
    Что есть «человек»? Является ли младенец Барни человеком? Правильный ответ на этот вопрос может сильно зависеть от того, что вы действительно хотите выяснить: «Хорошо ли кормить Барни болиголовом?» или «Будет ли Барни хорошим мужем?». (Замаскированые вопросы.)

  12. Вы рассматриваете интуитивно воспринимаемые иерархические категории, как единственно верный способ анализа мира, не осознавая, что возможны и другие способы делать статистически выводы, даже если вы их не используете.
    Для человека значительно проще определить, является ли предмет сияйцом или крубом, чем обратить внимание на то, что красные предметы никогда не светятся в темноте, но красные мохнатые предметы обладают всеми прочими характеристиками сияиц. Прочие статические алгоритмы работают иначе. (Нейронные категории.)

  13. Вы рассуждаете о категориях, будто они как манна упали из мира идей Платона, хотя это всего лишь ярлыки в вашем сознании, связанные с определённой концепцией.
    Древние философы говорили «Сократ человек», а не «Мой мозг посредством ощущений определяет Сократа, как попадающего в концепцию «человек». (Как алгоритм ощущается изнутри.)

  14. Вы продолжаете спорить о принадлежности к категории после отсеивания всех вопросов, которые могут зависеть от выводов, основанных на категориях.
    После того, как вы определили, что предмет синий, яйцеобразный, мохнатый, гибкий, непрозрачный, светящийся в темноте и содержащий палладий, что является всеми признаками сияиц, какой смысл спрашивать «Сияйцо ли это?» Однако, если распределяющая нейронная сеть вашего мозга содержит условный центр, связанный с выведением понятия сияйцности, то может показаться, что такой вопрос всё-таки существует. (Как алгоритм ощущается изнутри.)

  15. Вы позволяете дискуссии сместиться в область обсуждения определений, несмотря на то, что вы изначально не планировали об этом спорить.
    Если перед началом спора о том, производит ли «шум» падающее дерево в лесу, когда звук падения никто не слышит, вы спросите двух будущих спорщиков о том, что они будут подразумевать под «шумом», звуковые волны или слуховые переживания, они, возможно, предложат вам бросить монетку. Но после начала дискуссии определение всё равно станет обсуждаться. (Споры об определениях.)

  16. Вы считаете, что слово имеет смысл само по себе, а не потому, что оно является меткой, связанной с некоторыми понятиями в вашем мозгу.
    Когда кто-то кричит «А-а-а! Тигр!”, эволюция не предпочтёт организмы, которые подумают: «Ммм… Я только что услышал слоги ”ти” и ”игр”, которые члены моего племени связывают со своей внутренней моделью, соответствующей моему личному понятию ”тигр”, и которое А-А-А! ХРУМ ХРУМ ХРУМ». Поэтому мозг сокращает цепочку рассуждений, и кажется, что смысл тигриности несёт само слово. Люди спорят о правильном значении слов, например слова «шум». (Ощути смысл.)

  17. Вы спорите о значении слов даже в том случае, когда все стороны прекрасно понимают, что остальные имеют в виду под этим словом.
    Свойство человека связывать ярлыки с определёнными понятиями является средством общения. Когда люди хотят общаться, их тяжело остановить. Если у людей нет общего языка, они общаются рисуя картинки на песке. Когда каждый поймёт, что находится в разуме у остальных, дело будет сделано. (Аргумент к традиционному пониманию.)

  18. Вы обращаетесь к словарю в разгаре спора о практических вещах или о морали.
    Редакторы словарей скорее историки языка, нежели его законодатели. Если обычное определение содержит сложность, например, «Марс» определён как бог войны, «дельфин» как вид рыб или «негры» как нелюди, то словарь отражает распространённое заблуждение. (Аргумент к традиционному пониманию.)

  19. Вы обращаетесь к словарю в разгаре любого спора.
    Вы и вправду считаете, что редакторы словарей являются авторитетными специалистами в области определения атеизма как религии, или в любой другой? Даже если ставки в вашем споре крайне высоки, неужели вы считаете, что редакторы словарей достигли просветления, которое поможет им разрешить любой ваш диспут? (Аргумент к традиционному пониманию.)

  20. Вы игнорируете распространённое определение без повода, лишая окружающих всякой возможности вас понять.
    Быстро встаёт плутоний с бочками без ручек. (Аргумент к традиционному пониманию.)

  21. Вы используете сложные термины взамен простых чтобы создать иллюзию получения выводов.
    Если «человек» определить как «смертное двуногое без перьев», то можно написать: Все смертные двуногие без перьев смертны. Сократ — смертное двуногое без перьев, поэтому Сократ смертен. Выглядит не так впечатляюще в данном случае, не так ли? (Пустые ярлыки.)

  22. Вы вступаете в спор, которого могли бы избежать, если бы не использовали конкретное слово.
    Если Альберт и Барри не смогут использовать слово «шум», то Альберту придётся сказать: «Дерево, падающее в лесу, в котором никого нет, производит звуковые волны. А Барри скажет: «Дерево, падающее в лесу, в котором никого нет, не вызывает слуховых переживаний». Если слово создаёт проблему, то простейшим решением будет исключение этого слова из употребления, как и его синонимов. (Табуируй свои слова.)

  23. Ваше внимание отвлекается на короткое изящное слово, и вы не можете обдумать данное понятие во всех подробностях.
    Что происходит в школах, если перестать это называть образованием? Что такое степень, если не называть это «степенью»? Если монета упала «орлом», то какова её радиальная ориентация? Как может быть нечто «истинно», если нельзя употребить «точный», «правильный», «представлять», «отражать», «семантический», «убеждение», «знание», «карта», «реальный» или любые другие простые термины? (Замени символ на суть.)

  24. У вас есть только одно слово, которому соответствуют два или более реальных объектов. И из-за этого все связанные с этими объектами факты собираются в одну кучу у вас в голове.
    Частью обычной работы детектива является наблюдение за тем, носила ли Кэрол красное платье прошлым вечером, или что у неё чёрные волосы. Также детектив может поинтересоваться, красит ли Кэрол волосы. Но более сообразительный детектив может также задуматься, а может Кэрол было двое, одна носила красное платье, вторая была с чёрными волосами. (Ошибки сжатия.)

  25. Вы устанавливаете зависимости там, где их не существует, извлекая некие свойства из ваших определений, даже в случаях, когда нет сходства между данными областями.
    В Японии считается, что люди с первой группой крови серьёзные и творческие, со второй — импульсивные и жизнерадостные, с третьей — хорошо социализированные и приятные, с четвёртой — сдержанные и с хорошим самообладанием. (У классификации есть последствия.)

  26. Вы добавляете побочные смысл к слову, основываясь на определении, которое не включает в себя побочные смыслы.
    «Виггин» определён в словаре как человек с чёрными волосами и зелёными глазами. Но это слово также имеет побочный смысл, обозначая людей, совершающих преступления и издевающихся над животными, но этого нет в словаре. И вы показывается на кого-то пальцем и сообщаете: «Чёрные волосы и зелёные глаза? Ага, он виггин! Смотрите, сейчас он будет красть столовое серебро». (Контрабанда характеристик.)

  27. Вы утверждаете, что X есть Y по определению. В таких случаях вы почти наверняка добавите дополнительные смыслы к Y, чего не было в исходном определении.
    Вы определяете человека как двуногое без перьев, и, показывая на Сократа, сообщаете: «Нет перьев, две ноги, должно быть, это человек!» Но на самом деле вы думаете о чём-то ином, например о смертности человека. Если подобное случится во время дискуссии о количестве ног у Сократа, ваш оппонент может возразить: «Как же так, у Сократа две ноги? Это же как раз то, с чего мы начали спорить!» (Аргумент «по определению».)

  28. Вы утверждаете, что объекты P по определению являются объектами типа Q.
    Если вы видите, как Сократ в компании биологов собирает травы, которые могут вызвать сопротивляемость к болиголову, то нет смысла оспаривать утверждение «Люди по определению смертны». В большей части случаев, когда вам кажется, что надо сильнее надавить и настоять на некоем утверждении «по определению», в реальности существуют иные факты, ставящие ваш вывод под сомнение. (Аргумент «по определению».)

  29. Вы пытаетесь установить принадлежность к реально существующей группе «по определению».
    Не требуется утверждать, что «Индуизм, по определению, является религией», потому что индуизм действительно является религией. Это не религия «по определению», а, можно сказать, реальная религия. Атеизм же не похож на основных членов группы «религии», так что, если бы внезапно не оказалось, что атеизм является религией по определению, то вы бы пришли к выводу, что это всё-таки не религия. По этой причине вы можете подавить любых противников, сообщая, что утверждение «Атеизм является религией» верно по определению, хотя во всех остальных случаях это всё же не верно. (Аргумент «по определению».)

  30. Ваше определение ограничивает группу неких объектов, которые не связаны друг с другом.
    Вы можете, если захотите, утверждать, что слово «рыба» относится к лососям, гуппи, акулам, дельфинам и форели, но не к медузам или водорослям. Вы можете утверждать, что это всего лишь список, и не может быть, чтобы список был ошибочным. Или вы можете перестать валять дурака и признать, что вы допустили ошибку и дельфины не принадлежат к списку, в который входят рыбы. (Где проводить границу?)

  31. Вы используете короткое слово для того, что не нужно часто упоминать, или длинное слово для того, что упоминается часто. Это может приводить к неэффективном рассуждениям, или даже к некорректному применению Бритвы Оккама — если ваш разум будет считать, что короткие предложение звучат «проще».
    Что звучит правдоподобнее: «Бог сотворил чудо» или «Сверхъестественная сущность, создавшая вселенную, временно изменила законы физики»? (Энтропия и короткие сообщения.)

  32. Вы ограничиваете определённое пространство идей, которое не содержит какое-то отличное от окружающего пространства количество понятий. В результате слово, обозначающее группу объединённых понятий не связано с хоть сколь-нибудь производительным Байесовским выводом.
    Раз уж зеленоглазые люди не имеют чёрные волосы чаще, чем волосы другого цвета, и чёрные волосы также не связаны с зеленоглазостью, и кроме того людей с зелёными глазами и чёрными волосами не объединяют какие-либо иные значимые черты, то зачем вообще нужно слово «виггин»? (Общая информация и плотность в пространстве вещей.)

  33. Вы ограничиваете множество вещей без значимой причины для такого действия.
    Придумывание слова для всех людей, кроме чернокожих, выглядит несколько подозрительным. Если вы не сообщаете причины такого разграничения, создавая произвольные термины, это может выглядеть примерно следующим образом, как если бы детектив сказал: «Знаете, у меня нет не единого повода предпочесть одного или другого человека, кто бы мог убить тех сирот. Однако, может рассмотрим Джона Уифлхайма в качестве подозреваемого?» (Суперэкспоненциальное пространство концептов и простые слова.)

  34. Вы используете классификации, чтобы делать выводы о свойствах, не имеющих реальных структур, а именно, условная независимость данных групп в случае хорошего приближения при использовании простой интерпретации теоремы Байеса.
    Я ни за что не буду пытаться это резюмировать, просто прочитайте соответствующее эссе. (Условная независимость и наивный Байес.)

  35. Вы полагаете, что слова это малюсенькие символы языка ЛИСП, хотя это скорее ярлыки, которые скрывают за собой и управляют сложными мысленными кистями, что рисуют подробные картины на холсте вашего восприятия.
    Представьте «треугольную лампочку». Что вы увидели? (Слова как мысленные кисти.)

  36. Вы используете слово, имеющее разные значения в различных ситуациях, будто оно имеет всегда один и тот же смысл, создавая иллюзию чего-то непостоянного и изменчивого.
    «Мартин сказал Бобу свернуть налево». Но «налево» является функциональным словом, принимающим во внимание расположение говорящего относительно его окружения. Какое же «налево» имеется в виду, Боба или Мартина? (Ошибка изменяемого вопроса.)

  37. Вы считаете, что определения не могут быть ошибочны, или что «Я могу определить любое слово так, как пожелаю!»
    Такое отношение заставляет вас яростно отстаивать ваши прошлые поступки, вместо того, чтобы учесть их последствия или признать свои ошибки. (Когда слова могут быть ошибочны.)

Всё, что происходит в вашем разуме, имеет какой-либо результат, и ваш мозг движется вперёд без вашего руководства, не осознавая происходящее.

Утверждать «Слова можно использовать как угодно, я могу определить любое слово, как пожелаю» столь же осмысленно, как и вести автомобиль по тонком льду с выжатой до отказа педалью газа, рассуждая: «Посмотрите на руль, я не считаю, что любой его угол поворота чем-то выделяется на фоне других, поэтому я могу рулить так, как захочу».

Если вы хотите куда-то добраться или просто попробовать выжить, вам стоит начать уделять внимание трём или шести десяткам оптимальных критериев, контролирующих ваше использование слов, определений, категорий, классов, разграничений, ярлыков и концепций.

  • 1. Оригинальное название «37 Ways That Words Can Be Wrong» – Прим.перев.
Перевод: 
Ю
Номер в книге "Рациональность: от ИИ до зомби": 
180
Оцените качество перевода: 
Средняя оценка: 3.3 (26 votes)

Наглядное объяснение теоремы Байеса

Элиезер Юдковский

Примечание редактора книги: Это сокращённая версия исходного эссе со множеством интерактивных элементов.

Примечание редактора сайта: Упомянутые выше интерактивные элементы, увы, уже давно не поддерживаются ни в каких современных браузерах. Кроме того, некоторое время назад Юдковский добавил в исходное эссе примечание, что он считает его устаревшим и рекомендует вместо него читать руководство по теореме Байеса на Арбитале (на русский язык не переводилось).

Исходное эссе в своё время переводилось на русский язык Сергеем Щегловым.

* * *

Ваши друзья и сослуживцы обсуждают какую-то «теорему Байеса» или даже говорят о каком-то «байесианском мышлении». Судя по всему, эта штука им всерьёз нравится, а потому вы лезете в Гугл, находите страницу про «теорему Байеса» и…

Оказывается, это уравнение. И всё. Просто уравнение. Страница, которую вы нашли, даёт математические определения, но не объясняет, что это такое по существу, как это использовать и почему это так нравится вашим друзьям. Просто формула из теории вероятности.

Как получилось, что математическая идея вызывает столь удивительный энтузиазм у людей, которые её изучают? Почему так называемая Байесианская Революция проходит катком по наукам и объявляет своим частным случаем даже экспериментальный метод? Какой секрет известен приверженцам Байеса? Какой свет узрели они?

Скоро вы узнаете. Скоро вы станете одним из нас.

В Сети есть парочка объяснений теоремы Байеса. Однако я пробовал знакомить других с байесианским мышлением и пришёл к выводу, что эти объяснения слишком абстрактны. Байесианское мышление очень контринтуитивно. Люди не применяют байесианское мышление автоматически, им сложно его изучить и легко забыть после завершения обучения. Причём это касается как новичков-студентов, так и опытных профессионалов с многолетним опытом. Судя по всему, байесианское мышление — одна из тех вещей, которые, подобно квантовой механике или селективному тесту Вейсона, по самой своей природе трудно ухватываются нашими встроенными мыслительными способностями.

Во всяком случае так считается. В этом эссе я попытаюсь разъяснить байесианское мышление наглядно. Устроить беспощадно щадящее знакомство, задействующее все возможные пути для понимания чисел, от естественных частот до пространственных визуализаций. Я намерен передать вам не абстрактные правила манипуляции числами, но смысл этих чисел, и понимание: почему правила именно таковы (и не могут быть иными). Когда вы закончите читать эту страницу, байесианские задачи будут вам сниться.

Давайте же начнём.

* * *

Вот задача о ситуации, с которой часто сталкиваются врачи:

У 1% женщин в возрасте 40 лет, участвующих в регулярных обследованиях, есть рак груди. 80% женщин с раком груди получают положительный результат маммографии. 9.6% здоровых женщин также получают положительный результат (маммография, как любые измерения, не даёт стопроцентных результатов). Женщина-пациент из этой возрастной группы получила положительный результат на регулярном обследовании. Какова вероятность того, что она действительно больна раком груди?

Каков ответ с вашей точки зрения? Если вы раньше не сталкивались с такого рода задачами, пожалуйста, подумайте над собственным ответом, прежде чем читать дальше.

* * *

Теперь предположим, что я скажу вам: большинство докторов дают неверный ответ. Обычно лишь около 15% врачей решают эту задачу правильно. («В самом деле? 15%? Это реальные данные, или городская легенда, основанная на опросах в Интернете?» Да, это реальные данные. См. Casscells, Schoenberger, and Grayboys 19781; Eddy 19822; Gigerenzer and Hoffrage 19953; и многие другие статьи. Это удивительный результат, который однако легко воспроизводится, и потому воспроизводится в широких масштабах.)

В случаях с приведённой выше задачей большинство врачей оценивают вероятность между 70% и 80%, что совершенно неправильно.

Вот другая версия той же задачи, с которой врачи справляются несколько лучше:

У 10 из 1000 женщин в возрасте 40 лет, участвующих в регулярных обследованиях, есть рак груди. 800 из 1000 женщин с раком груди получают положительный результат маммографии. 96 из 1000 здоровых женщин также получают положительный результат маммографии. Если 1000 женщин данного возраста пройдут регулярное обследование, какая часть из получивших положительный результат маммографии будет реально больна раком груди?

И наконец, вот задача, с которой врачи справляются лучше всего. В 46% — почти половине! — случаев они дают правильный ответ.

У 100 из 10 000 женщин в возрасте 40 лет, участвующих в регулярных обследованиях, есть рак груди. 80 из каждых 100 женщин с раком груди получают положительный результат маммографии. 950 из оставшихся 9 900 здоровых женщин также получают положительный результат маммографии. Если 10 000 женщин этого возраста пройдут обследование, какая часть из получивших положительный результат будет реально больна раком груди?

Правильный ответ: 7,8%. Получается он так. Из 10 000 женщин 100 больны раком груди, 80 из этих 100 имеет положительные маммограммы. Из тех же 10 000 женщин, 9 900 не имеют рака груди, и из этих 9 900 женщин 950 тоже получат положительные маммограммы. Таким образом, общее число женщин с положительными маммограммами 950 + 80 то есть 1030. Из этих 1 030 женщин с положительными маммограммами, 80 реально больны раком. Таким образом мы получаем отношение 80/1030, или 0,07767, то есть 7,8%.

Иначе говоря, перед маммографическим обследованием 10 000 женщин можно разделить на две группы:

  • Группа 1: 100 женщин, больных раком груди.
  • Группа 2: 9 900 женщин, не больных раком груди.

В сумме эти группы составляют 10 000 пациенток. Мы никого не потеряли при подсчётах. После маммографии женщин можно разделить уже на четыре группы:

  • Группа A: 80 женщин, больных раком груди, и с положительной маммограммой.
  • Группа B: 20 женщин, больных раком груди, и с отрицательной маммограммой.
  • Группа C: 950 женщин, не больных раком груди, и с положительной маммограммой.
  • Группа D: 8 950 женщин, не больных раком груди, и с отрицательной маммограммой.

Сумма групп A и B, групп больных раком груди, соответствует группе 1. Сумма групп C и D, групп здоровых женщин, соответствует группе 2. Если вы примените маммографию к 10 000 пациенток, вы получите 1030 положительных результатов, лишь 80 из которых будут принадлежать пациенткам, реально больным раком. Это правильный ответ, ответ, который врачи должны давать пациенткам с положительными маммограммами, когда они спрашивают о своих шансах на наличие рака груди. Если тринадцать пациенток задают этот вопрос, приблизительно 1 из этих 13 будет больна раком.

* * *

Люди очень часто совершают следующую ошибку: они не учитывают какая доля женщин больна раком и какая доля женщин без рака получает ложноположительные результаты, и фокусируются лишь на группе больных, получивших положительные результаты. Например, абсолютное большинство врачей в уже упоминавшихся исследованиях полагают, что если около 80% женщин с раком груди имеют положительные маммограммы, то и вероятность для женщины с положительной маммограммой быть больной раком тоже около 80%.

Чтобы получить правильный ответ нужно учесть все три условия: процент женщин с раком груди, процент здоровых женщин с ложноположительными результатами исследования и процент женщин с раком груди, получивших истинно положительные результаты.

Исходная доля пациенток с раком груди называется априорной вероятностью. Шанс, что пациентка с раком груди получит положительную маммограмму, и шанс, что пациентка без рака получит положительную маммограмму, называются условными вероятностями. В совокупности, вся исходная информация называется априорной. Результат — ожидаемая вероятность, что пациентка больна раком груди, если её маммограмма положительна, — называется уточнённой вероятностью или апостериорной вероятностью. Только что мы видели, что апостериорная вероятность зависит отчасти от априорной вероятности.

Понять, что окончательный ответ всегда зависит от исходной доли женщин с раком груди, можно на примере альтернативной вселенной, где только одна женщина на миллион больна этим раком. Если маммография и в этом мире выявляет рак груди в 8 случаях из 10, давая одновременно ложноположительный результат только в 1 случае из 10, это будет означать сотни тысяч ложноположительных результатов на каждый реально диагностированный рак. Первоначальная вероятность, что женщина больна раком груди, настолько мала, что хотя положительный результат маммографии и увеличивает ожидаемую вероятность, эта вероятность не увеличивается до уверенности или хотя бы до «заметного шанса». Вероятность растёт лишь с 1:1 000 000 до 1:100 000.

Таким образом мы видим, что результаты маммографии не заменяют предыдущую информацию о шансах пациентки оказаться больной раком. Маммография лишь сдвигает ожидаемую вероятность в направлении своего результата. Положительный результат сдвигает первоначальную вероятность вверх, отрицательный - вниз. Например, в нашей первой задаче, где 1% женщин болеют раком, 80% больных раком получают положительные результаты маммографии, и 9.6% здоровых женщин получают ложноположительные результаты, положительный результат маммографии сдвигает 1% шанс до 7.8% шанса.

Большинство же людей, впервые столкнувшись с подобными задачами, просто в уме заменяют исходную вероятность в 1% на вероятность в 80% для больных раком получить положительную маммограмму. Интуитивно это кажется хорошей идеей, но на самом деле это не так. «Вероятность того, что у женщины с положительной маммограммой есть рак груди» не то же самое, что «вероятность для женщины с раком груди получить положительный результат маммографии». Эти величины разные, как яблоки и сыр.

* * *

Почему байесианец перешёл дорогу?
Нужно больше информации, чтобы ответить на этот вопрос.

* * *

Предположим, что в бочке находится множество маленьких пластиковых капсул. Некоторые капсулы окрашены в красный цвет, некоторые - в синий. У 40% от всех капсул внутри жемчужина, 60% пусты. В синий цвет окрашены 30% капсул, содержащих жемчужины, и 10% пустых капсул. Какова вероятность, что синяя капсула содержит жемчужину? В этом примере числа достаточно просты, чтобы найти решение в уме, и я предлагаю вам попробовать это сделать.

Эту же задачу можно записать более компактно:

P(жемчуг) = 40%
P (синий|жемчуг) = 30%
P (синий|¬жемчуг) = 10%
P (жемчуг|синий) = ?

«¬» здесь сокращение для «нет», так что ¬жемчуг читается как «нет жемчуга».

P(синий|жемчуг) — это сокращённая запись выражения «вероятность синего при условии жемчужина» или «вероятность того, что капсула синяя, если внутри находится жемчужина». Справа от вертикальной черты записывается то, что вы уже знаете — условие, а слева — следствие или вывод. Если у нас P(синий|жемчуг) = 30%, и мы уже знаем, что внутри некоторой капсулы есть жемчужина, то мы делаем вывод, что эта капсула будет синей с вероятностью 30%. Таким образом, мы ищем ответ на вопрос: «какова вероятность, что внутри синей капсулы находится жемчужина». Записывается как P(жемчужина|синий).

Теперь вернёмся к задаче. Мы знаем, что 40% капсул содержат жемчужины, а 60% капсул совершенно пусты. 30% капсул, содержащих жемчужины, синего цвета, то есть 12% капсул от общего числа содержат жемчужины и синие. 10% от пустых капсул синего цвета, то есть от общего количества 6% капсул пустые и синие. Всего у нас получается 18% синих капсул, и 12% синих и содержащих жемчужины капсул, так что шанс для синей капсулы содержать жемчужину равен 12/18 = 2/3 = примерно 67%.

Как и в предыдущем случае мы можем рассмотреть предельные случаи и убедиться в необходимости всех трёх условий. В гигантской бочке, где лишь одна капсула из тысячи содержит жемчужину, знание о том, что капсула синяя, увеличивает наши шансы с 0,1% до 0,3% (а не с 40% до 67%). Аналогично, если 999 из 1000 капсул содержат жемчужины, знание, что капсула синяя, увеличивает шансы с 99,9% до 99,966%. Вероятность, что капсула не содержит жемчужины, меняется с 1/1000 до примерно 1/3000.

В задаче с капсулами и жемчужинами большинство опрашиваемых, не знакомых с байесианским мышлением, ответили бы, что вероятность для синей капсулы содержать жемчужину будет 30%, или возможно 20% (30% шансов на истинно-положительный результат минус 10% шансов на ложно-положительный). Даже если эта мысленная операция представляется хорошей идеей, она не имеет смысла в контексте предложенной задачи. Это все равно как если бы вы спросили у первоклассника: «Если восемнадцать человек сели в автобус, а потом ещё семь человек сели в автобус, сколько лет водителю?» Многие дети ответят: «Двадцать пять». Они понимают, что получили возможность использовать специальную процедуру (сложение), но не вполне осознают связь этой процедуры с реальностью. Точно так же для нахождения вероятности, что пациентка с положительной маммограммой больна раком груди, абсолютно бессмысленно заменять исходную вероятность заболевания на вероятность, что женщина с раком груди получит положительную маммограмму. Столь же бессмысленно вычитать вероятность ложноположительного результата из вероятности истинно-положительного. Эти операции здесь настолько же неуместны, как подсчёт пассажиров в автобусе для определения возраста водителя.

* * *

Исследование Гигеренцера и Хоффраге 1995 года показывает, что некоторые формулировки задач лучше помогают «включить» байесианское мышление4. Хуже всего работают формулировки с вероятностями. Чуть лучше работает использование частот вместо вероятности: задача не меняется, но в условии говорится не «1% женщин болен раком груди», а «1 из 100 женщин больна раком груди», «80 из 100 женщин с раком груди получают положительные маммограммы» и так далее. Почему при таких формулировках больше испытуемых начинают думать по байесиански? Вероятно, слова «одна из ста женщин» побуждают представить Х женщин с раком и подготавливают к тому, чтобы потом представить X женщин с раком и положительной маммограммой, и так далее.

Эффективнее же всего (из найденного на данный момент) работают «естественные частоты»: формулировки, что 40 из 100 капсул содержат жемчужины, что 12 из 40 капсул с жемчужинами — синие, и что 6 из оставшихся 60 пустых капсул тоже синие. При описании через естественные частоты информация об априорных вероятностях включается в описание условных вероятностей. Если вы захотите узнать условные вероятности в результате естественного эксперимента — вскрывая все капсулы — вы обнаружите, 40 капсул с жемчужинами, из которых 12 — синие, и 60 пустых, из которых 6 — синие. Таким образом, вы увидите, что синие капсулы с жемчужинами встречаются в два раза чаще, чем синие капсулы без жемчужин.

К сожалению, хотя естественные частоты — это шаг в правильном направлении, их всё же недостаточно. Когда задачи формулируются через естественные частоты, доля людей, использующие байесианское мышление, возрастает примерно до половины. Это значительное улучшение, но недостаточное, когда речь идёт о реальных врачах и реальных пациентах.

* * *

Где мне брать априорные вероятности для моей задачи?
Многие априорные вероятности можно найти в справочниках по химии и физике.

Откуда вообще изначально берутся априорные вероятности?
Никогда не задавайте этот вопрос.

Ага. Тогда откуда учёные берут априорные вероятности?
Априорные вероятности для научных задач устанавливаются ежегодным голосованием Американской Ассоциации Содействия Развитию Науки. В последние годы голосования становятся всё более нервными. Царит всеобщая язвительность, ассоциация раскалывается на фракции, произошло даже несколько политических убийств. Возможно, это следствия конфликтов в Байесианском совете, а может быть у дискутирующих слишком много свободного времени. Никто не знает точно.

Понятно. А где все остальные берут априорные вероятности?
Загружают свои априорные вероятности из Kazaa.

Но что если нужные мне априорные вероятности недоступны на Kazaa?
На задворках китайского квартала Сан-Франциско есть маленький тесный антикварный магазинчик. Ни в коем случае не спрашивайте про бронзовую крысу.

Вообще-то, априорные вероятности могут быть истинными и ложными — как и конечное решение. Они отражают реальность и о них можно судить, сравнивая их с реальностью. Например, если вы думаете, что 920 из 10000 женщин в выборке больны раком груди, а настоящее количество 100 из 10000, то ваша априорная вероятность неверна. Например, для нашей задачи априорные вероятности могли появиться из результатов трёх исследований: исследование историй болезни женщин с раком груди, чтобы узнать, сколько из них получили положительный результат маммографии, исследование женщин без рака груди, чтобы узнать, сколько из них получили положительный результат маммографии, и эпидемиологическое исследование распространённости рака груди в некотором демографическом срезе.

* * *

Вероятность P(A,B) равна P(B,A), но вероятность P(A|B) не равна P(B|A) и уж точно P(A,B) не равна P(A|B). Довольно часто эти вероятности путают.

Чтобы познакомиться поближе с этими величинами и отношениями между ними, сыграем в игру «посчитаем количество степеней свободы». Например, у величины P(рак) и P(¬рак) совместно одна степень свободы, поскольку P(A) + PA) = 1. Если вы знаете, что P(¬рак) = 0,99, вы можете получить P(рак) = 1 - P(¬рак) = 0,01.

P(положительный|рак) и P(¬положительный|рак) тоже имеют между собой только одну степень свободы; каждая женщина с раком груди может либо получить положительную маммограмму, либо не получить. С другой стороны, P(положительный|рак) и P(положительный|¬рак) связаны двумя степенями свободы. Вы можете иметь тест, который даёт положительный результат для 80% больных раком и для 9.6% здоровых, или тест, дающий 70% для больных и 2% для здоровых, или даже тест, возвращающий «положительный» результат для 30% больных раком и для 92% здоровых. Две эти величины — результаты теста для больных и для здоровых — математически независимы; ни одна из них не может быть вычислена на основании другой каким-либо способом, и это означает, что они имеют две степени свободы между собой.

Что насчёт P(положительный, рак), P(положительный|рак) и P(рак)? У нас здесь три величины. Сколько же степеней свободы? В этом случае должно соблюдаться равенство:

P(положительный, рак) = P(положительный|рак) × P(рак).

Это равенство уменьшает количество степеней свободы на единицу. Если мы знаем долю пациенток с раком, а также вероятность, что у пациентки с раком будет положительная маммограмма, мы можем перемножить эти числа и получить долю пациенток с раком груди и положительной маммограммой.

Аналогично, если мы знаем количество пациенток с раком груди и положительными маммограммами, а также общее число пациенток с раком груди, мы можем оценить шансы, что женщина с раком груди получит положительную маммограмму, простым делением: P(положительный|рак) = P(положительный, рак) / P(рак). Фактически, именно так и калибруют медицинские тесты; вы проводите исследование на 8520 женщинах с раком груди, получаете в результате 6816 (или около) женщин с раком груди и положительными маммограммами, после чего делите 6816 на 8250, чтобы найти 80% вероятность для женщины, больной раком, получить положительную маммограмму. (Между прочим, если вы случайно поделите 8250 на 6816, вместо того чтобы наоборот, ваши вычисления начнут давать странные результаты, такие как утверждение, что 125% женщин с раком груди и положительной маммограммой больны раком. По моему опыту, это довольно распространённая ошибка в расчётах по байесианской арифметике.) И в заключении, если вы знаете P(положительный,рак) и P(положительный|рак), вы можете вывести исходную долю больных раком пациенток. Итого, у этих трёх величин две степени свободы: если вы знаете две из них, вы можете рассчитать третью.

А как связаны P(положительный), P(положительный,рак) и P(положительный,¬рак)? Снова у нас только две степени свободы для трёх переменных. Уравнение, устраняющее ещё одну степень свободы:

P(положительный) = P(положительный,рак) + P(положительный,¬рак)

Для начала, вот как рассчитывается P(положительный): мы берём количество женщин с раком груди и положительными маммограммами, прибавляем к нему количество женщин без рака груди и положительными маммограммами, и получаем вместе искомое количество женщин с положительными маммограммами. Конечно, весьма странно проводить исследования для определения числа женщин с положительными маммограммамми - только одного числа и ничего больше - но в теории вы можете это сделать. И если потом вы проведёте другое исследование, и найдёте количество с положительными маммограмми и раком груди, вы также узнаете и количество женщин с положительными маммограммами и без рака груди — поскольку женщина с положительной маммограммой или больна раком груди, или нет. В общем, P(A,B) + P(AB) = P(A). Аналогично, P(A,B) + PA,B) = P(B).

А что у нас с P(положительный,рак), P(положительный,¬рак), P(¬положительный,рак) и P(¬положительный,¬рак)? Поначалу соблазнительно решить, что здесь только две степени свободы для четырех переменных — что возможно, например, получить P(положительный,¬рак) через умножение P(положительный) × P(¬рак), и тогда все четыре значения могут быть найдены через две независимые переменные — P(положительный) и P(рак). Но это не тот случай! P(положительный,¬рак) = P(положительный) * P(¬рак) верно только для двух вероятностей, которые статистически независимы — если бы шансы, что женщина больна раком груди, никак не были бы связаны с тем, что у неё положительная маммограмма. Но как вы уже знаете, такое возможно лишь в случае, если обе условные вероятности одинаковы - требование, которое может устранить одну степень свободы. Если вы вспомните, что эти четыре величины являются группами A, B, C и D, вы сможете посмотреть на эти четыре группы и осознать, что теоретически вы можете поместить любое число женщин в каждую из этих групп. Если вы начнете с группы 80 женщин с раком груди и положительными маммограммами, нет никаких причин, почему вы не могли бы добавить следующую группу из 500 женщин с раком груди и отрицательными маммограммами, затем группу из 3 женщин без рака груди и отрицательными маммограммами, и так далее. Теперь может показаться, что эти четыре величины имеют четыре степени свободы. Так оно и есть, за исключением того момента, что когда они записываются как вероятности, мы должны нормализовать их до долей единицы от общей группы, что добавит следующее ограничение: P(положительный,рак) + P(положительный,¬рак) + P(¬положительный,рак) + P(¬положительный,¬рак) = 1. Это уравнение забирает одну из степеней свободы, оставляя в итоге три степени для четырёх величин. Если вы зададите доли единицы для женщин в группах A, B, и D, вы сможете вывести долю единицы для женщин в группе C.

Располагая четырьмя группами A, B, C, и D, очень просто вычислить все прочее:

$$P(рак)=\frac{A+B}{A+B+C+D}$$
$$P(¬положительный|рак)=\frac{B}{A+B}$$

И так далее. Поскольку набор {A, B, C, D} содержит три степени свободы, отсюда следует, что полный набор из 16 вероятностей также содержит только три степени свободы. Вспоминаем, что в наших задачах мы всегда нуждаемся в трёх частях информации — одной априорной и двух условных вероятностях, — которые и в самом деле имеют три степени свободы (будучи независимыми друг от друга). Собственно, в байесианских задачах любые три величины с тремя степенями свободы будут исчерпывающе описывать ситуацию.

Вероятность, что тест даёт истинно положительный результат, делённая на вероятность, что тест даёт ложноположительный результат называется степенью правдоподобия этого теста. Степень правдоподобия положительного результата показывает в итоге, насколько положительный результат теста сместит априорную вероятность. Достаточно ли одной степени правдоподобия, чтобы сказать, что мы знаем всё о полезности данного теста?

Нет, недостаточно! Степень правдоподобия говорит всё, что требуется о значении положительного результата. Но она ничего не говорит о значении отрицательного результата, и не может сказать, как часто тест оказывается полезным. Например, маммография 80% истинно положительных и 9,6% ложноположительных результатов имеет ту же степень правдоподобия, что и тест с 8% истинно положительных и 0,96% ложноположительных результатов. Но несмотря на одинаковость степеней правдоподобия, первый тест намного более полезен — он чаще определяет болезнь, а его отрицательный результат служит более сильным признаком здоровья.

* * *

Предположим, что вы используете два теста для рака один за другим — скажем, стандартную маммографию и ещё какой-нибудь тест, совершенно независимый по отношению к маммографии. Поскольку я не знаю ни одного такого теста (реально не зависящего от маммографии), я просто выдумаю такой тест для нашей задачи и назову его «Разделительный тест Темза-Брейлора», предположив, что он позволяет обнаружить, что некоторые клетки делятся быстрее чем другие. Теперь предположим, что тест Темза-Брейлора даёт истинно положительные результаты для 90% пациенток с раком груди, и ложноположительные результаты для 5% здоровых пациенток. Априорная вероятность рака груди пусть будет все тот же 1%. Если пациентка получает положительные результаты маммографии и теста Темза-Брейлора, какова вероятность, что она больна раком груди?

Один из способов решить эту задачу: взять полученную вероятность для положительной маммограммы, которую мы уже посчитали и получили 7,8%, и подставить в тест Темза-Брейлора как его априорную вероятность. В этом случае мы получим 60%.

Предположим, что априорная распространённость рака груди в некоторой группе населения — 1%. Предположим, что у нас, как у врачей, есть три независимых теста для рака груди. Первый тест (A) - это маммография со степенью правдоподобия в 80%/9,6% = 8,33. У второго теста (B) степень правдоподобия — 18,0 (например, 90% против 5%), у третьего (С) — 3,5 (например, 70% против 20% или 35% против 10%, что совершенно одинаково). Предположим, пациентка получила положительные результаты всех трёх тестов. Какова вероятность, что у неё рак груди?

Привожу интересный трюк для упрощения расчётов. Если априорная распространённость рака груди в группе населения 1%, то 1 из 100 женщин больны раком груди, а 99 женщин здоровы. Тогда, если мы перепишем вероятность в 1% как отношение шансов, отношение получится 1:99.

Теперь запишем степени правдоподобия для тестов A, B и C:

8,33 : 1 = 25 : 3
18,0 : 1 = 18 : 1
3,5 : 1 = 7 : 2

Шансы для женщины с раком груди, получившей положительные результаты всех трёх тестов, против женщины без рака груди, также получившей положительные результаты, составят:

(1 × 25 × 18 × 7) : (99 × 3 × 1 × 2) = 3150 : 594 .

Чтобы вернуться от шансов к вероятностям, просто напишем:

3150 / (3150 + 594) = 84%.

Этот приём работает независимо от способа записи отношения шансов, то есть 8,33:1 то же самое, что 25:3 или 75:9. Также нет разницы, в каком порядке выполняются тесты, или в каком порядке подсчитываются результаты. Читатель может доказать это в качестве упражнения.

* * *

Э. Т. Джейнс в своей книге «Теория вероятностей в науке и инженерном деле» предлагает измерять правдоподобие и силу свидетельства в децибелах5.

Почему в децибелах?

Децибелы используются для измерения экспоненциальных различий интенсивности. Например, если звук автомобильной сирены несёт в 10000 раз больше энергии (на квадратный метр в секунду), чем звонок будильника, то сирена на 40 децибел громче. Звук чириканья птицы может нести в 1000 раз меньше энергии, чем звук будильника, следовательно, он будет на 30 децибел тише. Для получения количества децибел нужно взять десятичный логарифм интенсивности и умножить на 10.

$$децибелы = 10 \cdot log_{10}интенсивность$$

или

$$интенсивность = 10^{децибелы/10}$$

Когда вы решаете задачу с априорной вероятностью в 1%, что даёт отношение шансов 1:99, и тремя тестами со степенями правдоподобия в 25:3, 18:1 и 7:2, вы можете перемножать эти числа… или же просто складывать их логарифмы:

$$10 \cdot log_{10}\frac{1}{99} \approx -20$$
$$10 \cdot log_{10}\frac{25}{3} \approx 9$$
$$10 \cdot log_{10}\frac{18}{1} \approx 13$$
$$10 \cdot log_{10}\frac{7}{2} \approx 5$$

Изначально достаточно маловероятно, что пациентка больна раком груди — и наш уровень правдоподобия составляет -20 децибел. Далее три теста дают результаты, соответствующие 9, 13 и 5 децибелам доказательности. Это поднимает уровень правдоподобия на 27 децибел, и в результате априорное правдоподобие в -20 превращается в апостериорные 7 децибел. Соответственно шансы изменяются с 1:99 до 5:1, а вероятность - с 1% до 83%.

* * *

Вы — механик по игрушкам. Когда игрушка ломается, это в 30% случаев происходит из-за засорения трубки. Если трубка игрушки засорена, существует 45% вероятность, что игрушка будет искрить при попытке её завести. Если трубка не засорена, есть только 5% шансов, что появятся искры. Покупатель принёс вам неисправную игрушку. вы попробовали её завести и увидели искры. Какова вероятность, что у этой искрящей игрушки засорена трубка?

Какую последовательность арифметических операций вы проделаете для решения этой задачи?

(45% × 30%)/(45% × 30% + 5% × 70%)

Аналогично, чтобы получить вероятность того, что у женщины с положительной маммограммой есть рак груди, мы вычисляли:

$$\frac{P(положительный|рак) × P(рак)}{P(положительный|рак)×P(рак) + P(положительный|¬рак) × P(¬рак)}$$

что равно

$$\frac{P(положительный, рак)}{P(положительный, рак) + P(положительный, ¬рак)}$$

что в свою очередь равно

$$\frac{P(положительный, рак)}{P(положительный)}$$

или

P(рак|положительный).

В общем случае эти вычисления называются теоремой Байеса или правилом Байеса.

Теорема Байеса:

$$P(A|X) = \frac{P(X|A) × P(A)}{(P(X|A) × P(A) + P(X|¬A) × P(¬A))}$$

Когда мы хотим исследовать некоторое явление А и у нас есть наблюдение Х, которое что-то говорит про А (например, как в предыдущем примере, А — это рак груди, а X — положительный результат маммографии), теорема Байеса говорит нам, как именно мы должны изменить нашу оценку вероятности А после получения нового свидетельства Х.

Возможно, сейчас теорема уже кажется вопиюще очевидной или даже тавтологичной, а вовсе не новой и удивительной. В этом случае это введение выполнило своё предназначение.

* * *

Теорема Байеса описывает, что такое свидетельство и насколько сильное это свидетельство. Чтобы оценить статистические модели, их сравнивают с методом Байеса, ведь в статистике метод Байеса показывает, какую максимальную пользу можно получить из свидетельства — точно так же, как термодинамика показывает, максимальное количество работы, которое можно извлечь из разницы температур. Именно поэтому учёные-когнитивисты говорят об агентах, рассуждающих по Байесу. В когнитивной науке термином «байесовский агент» фактически обозначается рациональный разум.

Теорема Байеса также помогает лучше понять некоторые эвристики человеческого мышления.

Например, когда когнитивные психологи обсуждают теорему Байеса, можно услышать, что люди не учитывают априорные вероятности. В смысле, когда люди решают задачу, где некоторое свидетельство Х говорит что-то об истинности условия А, они судят о правдоподобности А исключительно по силе свидетельства Х в пользу А без учёта априорной вероятности А. Если, например, в задаче с маммограммой вы посчитали, что у женщины есть рак груди с вероятностью 70-80%, то вы не учли априорную вероятность. Для такого стиля мышления нет разницы, у скольки вообще женщин в популяции есть рак груди — у 1% или у 10%. Чтобы частично компенсировать встроенные в нас искажения, нам нужно чаще обращать внимание на априорные вероятности!

Также люди, рассуждая о том, насколько сильно Х свидетельствует в пользу А, часто обращают повышенное внимание на P(X|A) и недостаточное на P(X|¬A). Сила свидетельства Х для события А зависит не только от того, насколько мы ожидаем обнаружить Х, если А — истинно, но также от того, насколько мы ожидаем не обнаружить Х, если А — ложно. Например, если идёт дождь, то можно ожидать, что трава мокрая — P(мокрая трава|дождь) ≈ 1. Однако мокрая трава не обязательно означает, что шёл дождь.Возможно, был включён автополив, возможно вы видите утреннюю росу. Поскольку P(мокрая трава|¬дождь) значительно больше нуля, то P(дождь|мокрая трава) существенно меньше единицы. С другой стороны, если трава мокнет только под дождём и никак иначе, тогда знание, что трава мокрая всегда даёт понять, что прошёл дождь. P(дождь|мокрая трава) ≈ 1, даже если P(мокрая трава|дождь) = 50%, то есть даже если трава становится мокрой лишь в половине случаев, когда идёт дождь. Свидетельство всегда зависит от того, насколько отличаются эти две условные вероятности. Сильное свидетельство получается не в результате очень высокой вероятности того, что А влечёт за собой Х, а в результате того, что очень мала вероятность, что не-А влечёт за собой Х.

Байесианская революция в науке набирает силу не только из-за того, что всё больше учёных-когнитивистов замечают, что у наших мыслительных процессов байесианская структура. И не только из-за того, что во всех областях учёные начинают оценивать статистические методы, сравнивая их с байесианским подходом. В первую очередь байесианскую революцию движет идея, что наука сама по себе есть частный случай теоремы Байеса: экспериментальные факты — всего лишь байесовские свидетельства. Революционеры-байесианцы настаивают, что когда вы производите эксперимент и получаете свидетельства, которые «подтверждают» или «опровергают» Вашу теорию, эти подтверждения и опровержения подчиняются правилам Байеса. Например, вы должны принимать во внимание не только то, предсказывает ли ваша теория некоторое явление, но и предсказывают ли это явление другие теории.

Самой популярной философией науки в прошлом, видимо, следует считать фальсификационизм Карла Поппера. Сегодня байесовская революция сбрасывает эту философию с трона. Идея Карла Поппера, что теории могут быть достоверно фальсифицированы, но никогда не могут быть достоверно подтверждены, - всего лишь частный случай теоремы Байеса. Если P(X|A) ≈ 1 — теория A даёт однозначное предсказание X, — то наблюдение ¬X очень сильно фальсифицирует A. С другой стороны, если P(X|A) ≈ 1, и мы в очередной раз наблюдаем X, это не является каким-то подтверждением теории A, поскольку может существовать другое условие B, для которого P(X|B) ≈ 1, и в этом случае наблюдение X не позволяет выбрать между A и B. Чтобы наблюдение X достоверно подтвердило A, мы должны знать не что P(X|A) ≈ 1, а что P(X|¬A) ≈ 0, чего мы знать не можем, поскольку не в состоянии перебрать все возможные альтернативные объяснения. К примеру, когда эйнштейновская общая теория относительности сменила невероятно хорошо подтверждённую теорию гравитации Ньютона, выяснилось, что все ньютоновские предсказания являются частным случаем эйнштейновских.

Попперовскую философию можно даже записать математически. Соотношение правдоподобия для Х — P(X|A) / P(X|¬A) — определяет, насколько наблюдение X сдвигает вероятность истинности A, соотношение правдоподобия говорит нам, насколько сильно X как свидетельство. Так вот, в своей теории A вы можете предсказать X с вероятностью в 1. Но вы не можете контролировать знаменатель степени правдоподобия, P(X|¬A), поскольку всегда могут найтись другие теории, которые тоже предсказывают X. И хотя мы соглашаемся с простейшей теорией, которая согласуется с имеющимися свидетельствами, однажды мы можем обнаружить свидетельство, которое другая теория предсказывает, а ваша — нет. Так незаметная до поры погрешность опрокинула ньютоновскую теорию гравитации. Поэтому есть предел достоверности, дальше которого с помощью успешных предсказаний пройти нельзя. Существует предел для соотношения правдоподобия, которое можно получить на основании подтверждающих фактов.

С другой стороны, если вы обнаружите некоторое свидетельство Y, которое ваша теория однозначно не допускает, это чрезвычайно сильное свидетельство против вашей теории. Если P(Y|A) стремится к нулю, то и степень правдоподобия стремится к нулю. Например, если P(Y|A) = 0.0001%, и P(Y|¬A) составляет 1%, то степень правдоподобия P(Y|A) / P(Y|¬A) будет 1:10000. -40 децибел достоверности! Или в обратную сторону, если P(Y|A) является очень малой, то P(Y|¬A) / P(Y|A) будет очень большой, что означает намного большую вероятность обнаружить ¬A, нежели A. Фальсификация намного сильнее подтверждения. Это прямо следует из предшествующих соображений, что очень сильное свидетельство возникает не от высокой вероятности, с которой из A следует X, а из очень низкой вероятности, что не-A может привести к X. В основе попперовской эвристики о фальсифицируемости лежит точное правило Байеса.

Схожим образом попперовский тезис, что любая идея должна быть фальсифицируемой, может быть интерпретирован как воплощение байесианского Закона Сохранения Вероятностей: если результат X является положительным свидетельством для теории, то результат ¬X будет опровергать теорию до некоторой степени. Если вы попытаетесь интерпретировать оба результата — X и ¬X — как «подтверждения» теории, то правило Байеса скажет, что это невозможно! Для увеличения вероятности теории вы должны проверить её событиях, которые могут уменьшить её вероятность. Это не просто способ выявлять возможных мошенников в науке, но ещё и прямое следствие из байесовой теории вероятности. В то же время, попперовская идея, что есть только фальсификация и нет такой штуки как подтверждение оказывается неверной. Теорема Байеса показывает, что фальсификация действительно очень сильное свидетельство в сравнении с подтверждением, но фальсификация все равно имеет вероятностную природу; она не подчиняется каким-то отличным от подтверждения правилам, как утверждал Поппер.

Итак, мы обнаружили, что многие явления в когнитивных науках, а также используемые учёными статистические методы, а также научный метод сам по себе — это частные случаи теоремы Байеса. Вот она, байесианская революция.

* * *

Записав теорему Байеса в виде формулы, мы можем подробно обсудить её компоненты.

$$P(A|X) = \frac{P(X|A) × P(A)}{(P(X|A) × P(A) + P(X|¬A) × P(¬A))}$$

Начнём с P(A|X). Если вы сомневаетесь, что такое A и что такое X в Теореме Байеса, начинайте с P(A|X) в левой части уравнения; это самая простая часть для понимания. A это штука, насчёт которой мы хотим что-то узнать. X — это то, как мы её видим. X — это факт, который мы используем, чтобы вынести суждение насчёт A. Запомните, что в любом выражении вида P(Q|P) мы хотим узнать вероятность Q, которую даёт ему P, степень, в которой P предполагает Q - в более вразумительной записи, которую уже поздно предлагать статистикам, это выглядело бы как P(Q ← P).

P(Q|P) тесно связано с P(Q,P), но это не одно и то же. Выраженное как вероятность или доля, P(Q,P) представляет собой отношение вещей, обладающих свойством Q и свойством P среди всех вещей; например, отношение «женщин с раком груди и положительной маммограммой» к численности всех женщин. Если общее число женщин 10000, и 80 женщин имеют рак груди и положительную маммограмму, то P(Q,P) будет 80/10,000 = 0,8%. Вы можете видеть, что абсолютное количество, 80, преобразуется в вероятность через отношение к группе всех женщин. Чтобы сделать это еще понятнее, предположим что имеется группа из 641 женщин с раком груди и положительными маммограммами внутри общей выборки из 89031 женщин. 641 - абсолютное количество. Если вы возьмёте случайную женщину из всей выборки, то вероятность что это будет женщина с раком груди и положительной маммограммой, равна P(Q,P), или 0,72% в этом примере.

С другой стороны, P(Q|P) — это отношение количества объектов, обладающих свойствами Q и P, к количеству объектов со свойством P. Например, доля женщин с раком груди и положительной маммограммой в группе всех женщин с положительной маммограммой. Если у нас есть 641 женщина с раком груди и положительной маммограммой, 7915 женщин с положительными маммограммами, и 89031 женщин во всей выборке, то P(Q,P) это вероятность получить одну из 641 этих женщин при случайном выборе из всех 89031, в то время как P(Q|P) это вероятность выбрать одну из 641 женщин из куда меньшей группы в 7915 человек.

На самом деле, P(Q|P) означает ровно то же самое, что и P(Q,P|P), но писать постоянно ещё одно P — излишняя роскошь. Вы и так знаете, что ваши объекты обладают свойством P, а теперь исследуете свойство Q, хотя при этом вы исследуете размер группы (Q, P) в составе группы P, а не на размер группы Q в составе группы P (что было бы абсурдом). P в скобках в записи P(Q|P) означает, что свойство P — задано, вы работаете только с объектом, обладающих этим свойством. Когда вы фокусируете своё внимание лишь на этой меньшей, чем целое, группе, многие другие вероятности изменяются. Если вы берете свойство P как заданное, то P(Q&P) становится равным просто P(Q) — по крайней мере, по отношению к группе P. При этом старое P(Q), частота «вещей, которые имеют свойство Q во всей выборке», пересматривается к новой частоте «вещей, которые имеют свойство Q в части выборки, обладающей свойством P». Когда P задано, то P становится всем нашим миром, и в нем искать (Q,P) - то же самое, что искать просто Q.

Если вы сосредоточите ваше внимание только на множестве капсул синего цвета, то «вероятность, что капсула содержит жемчужину» сразу же изменится: количество жемчужин во множестве синих капсул отличается от количества жемчужин во всех капсулах. Условие задачи, свойство, на котором фокусируется наше внимание, всегда стоит в правой части выражения P(Q|P); это P становится нашим миром, всем, что мы видим, и это означает, что «заданное» P всегда имеет вероятность 1 — именно потому, что оно задано. Таким образом, P(Q|P) означает «Если вероятность P равна 1, какова вероятность Q?», или «Если мы примем во внимание только вещи или события, для которых P истинно, какой будет вероятность Q?». Q, находящаяся с другой стороны выражения, не является чем-то известным — его вероятность может быть 10%, или 90%, или любой другой. Так что когда вы применяете теорему Байеса, и пишете в левой части P(A|X), вы делаете это с целью уточнить вероятность A после обнаружения X, найти новую вероятность A, при условии что вы знаете X, степень, в которой X влечёт за собой A. Можно сказать, что X всегда наблюдение или факт, а A — это предмет исследования, то, о чём мы хотим что-то узнать.

* * *

Правая часть формулы Байеса получается из левой путём следующих преобразований:

$$P(A|X) = P(A|X)$$
$$P(A|X) = \frac{P(X,A)}{P(X)}$$
$$P(A|X) = \frac{P(X,A)}{P(X,A) + P(X,¬A)}$$
$$P(A|X) = \frac{P(X|A) × P(A)}{P(X|A) × P(A) + P(X|¬A) × P(¬A)}$$

В итоге в правой части уравнения условные вероятности имеют вид P(X|A) или P(X|¬A). В левой части находится условная вероятность P(A|X). Симметрия возникает потому, что исходные причинно-следственные связи обычно направлены от фактов к наблюдениям, например, от рака груди к положительным результатам маммографии. Рассуждения же наоборот обычно идут от наблюдений к фактам, например, от результатов маммографии к наличию рака. Левая часть формулы Байеса — это элементарный логический шаг от наблюдения положительных результатов маммографии к заключению об увеличении вероятности рака груди. Следование записывается справа налево, так что мы пишем P(рак|положительный) в левой части уравнения. Правая часть формулы Байеса описывает причинно-следственную связь — например, переход от рака груди к положительной маммограмме, — поэтому условные вероятности в правой части выглядят как P(положительный|рак) и P(положительный|¬рак).

Вот что такое теорема Байеса. Рациональный вывод в левой части, физическая причинность в правой. Разум с одной стороны, реальность — с другой. Помните, как научный метод оказался частным случаем теоремы Байеса? Поэтически можно выразиться, что теорема Байеса привязывает мышление к реальной вселенной.

Отлично, мы закончили.

* * *

Преподобный Байес говорит:

портрет преподобного Томаса Байеса

Теперь вы — посвящённый Байесовского заговора.

  • 1. Ward Casscells, Arno Schoenberger, and Thomas Graboys, «Interpretation by Physicians of Clinical Laboratory Results», New England Journal of Medicine 299 (1978): 999–1001.
  • 2. David M. Eddy, «Probabilistic Reasoning in Clinical Medicine: Problems and Opportunities», in Judgement Under Uncertainty: Heuristics and Biases, ed. Daniel Kahneman, Paul Slovic, and Amos Tversky (Cambridge University Press, 1982).
  • 3. Gerd Gigerenzer and Ulrich Hoffrage, «How to Improve Bayesian Reasoning without Instruction: Frequency Formats», Psychological Review 102 (1995): 684–704.
  • 4. Там же.
  • 5. Edwin T. Jaynes, «Probability Theory, with Applications in Science and Engineering», Unpublished manuscript (1974).
Перевод: 
sepremento, Alaric
Оцените качество перевода: 
Средняя оценка: 3.5 (59 votes)

Просто реальность

Автор: 
Элиезер Юдковский

Мир: введение

Роб Бенсинджер

В предыдущих эссе обсуждались человеческое мышление, язык, цели и социальная динамика. Для объяснения человеческого поведения использовались математика, физика и биология. Однако в них почти ничего не говорилось об окружающем мире и о месте в нём человечества.

Значительная часть третьего тома была посвящена противопоставлению человека как целеориентированной системы нечеловеческим процессам из областей эволюционной биологии и искусственного интеллекта. Не менее полезно противопоставить человека уже как физическую систему нечеловеческим процессам без признаков разума. Об этом пойдёт речь в ближайших цепочках.

В конце концов, мы, люди, состоим из частей и эти части сами по себе неразумны. Мир атомов не похож на наше обычное представление о мире. Уж тем более он не похож на представляемый обычно нами мир одушевлённых сознаний. В своё время Джулио Джорелло озаглавил интервью с Дэниэлом Деннетом так: «Да, у нас есть душа. Но она состоит из множества маленьких роботов»1.

В том «Просто реальность» входят семь цепочек на эту тему. Первые три знакомят читателя с вопросом, как мир человека соотносится с миром, открытым физиками. «Правда закономерна» описывает базовые взаимосвязи между физикой и человеческим познанием. «Основы редукционизма» посвящены научному объяснению разнообразных явлений. «Наслаждение обыденностью» — это рассуждения о личной и эмоциональной значимости научного мировоззрения.

За ними следуют две цепочки, которые углубляются в более специфические научные вопросы: «Физикализм для продвинутых» (о сложной проблеме сознания) и «Квантовая механика и множественные миры» (о проблеме измерений в физике). И, наконец, заключительная цепочка «Наука и рациональность» и эссе «Техническое объяснение технического объяснения» собирают идеи из предшествующих цепочек воедино и связывают их с научной практикой.

Обсуждения сознания и квантовой физики показывают важность редукционизма для современных противоречий в науке и философии. Для тех, кому интересно чуть больше узнать о контексте этих тем, я скажу пару слов. Если вам хочется поскорее перейти к самим цепочкам, переходите.

Разум в мире

Можем ли мы хоть как-то узнать, каково это — быть летучей мышью?

Разумеется, мы можем улучшать модели, предсказывающие поведение летучей мыши. Мы можем строить более точные модели её нервной системы. Однако совершенно не очевидно, что это поможет нам понять, как с точки зрения летучей мыши ощущается эхолокация или полёт.

Действительно, кажется, будто невозможно с уверенностью отнести какое-либо переживание к похожим на переживания летучей мыши. Разве не имеющий сознания автомат не может воспроизвести любое поведение имеющего сознание агента с любой заданной точностью? (Философы называют такие автоматы «зомби», хотя они мало чем похожи на зомби в привычном понимании: обычно считается, что зомби сильно отличаются от разумных агентов.)

Если инопланетяне-психологи попытаются смоделировать человеческое сознание, они столкнутся с той же проблемой. Возможно, у них получится построить идеальную модель, предсказывающую, что мы скажем или сделаем при виде красной розы. Но это не означает, что инопланетяне поймут, как красный цвет «ощущается изнутри».

Философы Томас Нагель, Дэвид Чалмерс и другие подобными примерами доказывали, что нейронные и когнитивные модели, составленные от третьего лица никогда не смогут полностью описать ощущение сознания от первого лица23. Неважно, сколько мы знаем о некоторой физической системе. С точки зрения этих философов всегда остается возможность, что система не обладает переживаниями «от первого лица». Возможно, традиционный дуализм с его бестелесными душами, что свободно парят и нарушают законы физики, всё же ложен, но Чалмерс настаивает на более слабом тезисе: сознание есть «факт следующего уровня», и его нельзя объяснить с помощью фактов физики.

Некоторые учёные и философы сочли эти доводы убедительными.4 Если нам интуитивно кажется, что этот аргумент соответствует действительности, должны ли мы его принять и отбросить физикализм?

Определённо не стоит отвергать эти доводы лишь потому, что они выглядят странно или воспринимаются как несколько ненаучные. Однако как они сочетаются с нашим представлением о том, какими должны быть объяснения и убеждения? Можем ли мы получить подсказки из истории науки или из нашего понимания физических принципов формирования свидетельств? Эти вопросы рассматриваются в цепочке «Физикализм для продвинутых».

Миры в мире

На данный момент лучшей математической моделью Вселенной является квантовая механика, подтверждённая уже столетием экспериментов. В этой теории вводится комплексное число — «амплитуда вероятности», которое так называется, потому что некоторая операция над ним (а именно возведение в квадрат модуля этого числа — правило Борна) позволяет узнать вероятность явления при малых размерах системы и экстремальных уровнях энергии. Эта амплитуда детерминистически изменяется согласно уравнению Шрёдингера. В процессе она часто оказывается в необычных состояниях, которые называются «суперпозициями».

Тем не менее во время экспериментов кажется, будто суперпозиции исчезают бесследно. В отсутствие наблюдателя уравнение Шрёдингера, судя по всему, описывает всё, что можно узнать о динамике физических систем. Когда же наблюдатель появляется, этот понятный детерминизм заменяется вероятностным правилом Борна. Обычные законы физики будто перестают работать, когда мы начинаем смотреть, что происходит. Джон Стюарт Белл на эту тему выразился так:

Кажется, будто вся теория сосредоточилась исключительно вокруг «результатов измерений» и ни о чём другом она ничего сказать не может. Что именно определяет, окажется ли некоторая физическая система «измерителем»? Ждала ли волновая функция мира миллиарды лет появления одноклеточных живых существ? Или ей пришлось подождать чуть дольше, пока не появились более подходящие системы… с научной степенью?

Все согласны, что странная смесь законов Шрёдингера и Борна соответствует опыту. Однако, вопрос о том, как именно правило Борна связано со всем остальным и что именно всё это значит, породил хаос из различных взглядов на природу квантовой механики.

Довольно рано копенгагенская школа — Нильс Бор и другие создатели квантовой теории — раскололась на несколько подходов к обсуждению результатов эксперимента и странного формализма, который их предсказывал. Некоторые восприняли понятия «измерения» и «наблюдения» практически буквально и предполагали, что сознание играет фундаментальную роль в законах физики и заставляет комплексные амплитуды «коллапсировать» в наблюдаемые результаты. Другие — ведомые Вернером Гейзенбергом — защищали нереалистичную идею о том, что физика говорит о состоянии наших знаний, а не об объективной реальности. А ещё одна копенгагенская традиция воплотилась в девиз «заткнись и вычисляй», в смысле, не стоит заниматься спекуляциями на метафизические темы.

На примере этих научных споров Юдковский ещё раз показывает ключевые идеи из предыдущих цепочек: различие между картой и территорией, загадочные ответы, байесианство и бритва Оккама. Поскольку он не физик (и я тоже), для желающих внимательнее изучить его аргументы или узнать больше о его примерах, я приведу дополнительные источники.

В книге «Наша математическая Вселенная» Макса Тегмарка обсуждаются некоторые важные идеи философии и физики.5 В частности там затрагивается оригинальная идея Тегмарка о том, что существуют все непротиворечивые математические структуры, включая миры с законами физики и граничными условиями, полностью отличными от наших. При этом такие миры Тегмарка отличаются от мультивселенных более популярных физических гипотез, таких как, например, миры в стохастических вечно растущих моделях Большого Взрыва или многомировой интерпретации квантовой физики Хью Эверетта.

Юдковский подробно обсуждает многомировые интерпретации в ответ на копенгагенскую интерпретацию квантовой механики. В последние десятилетия многомировая интерпретация набрала большую популярность среди физиков, особенно космологов. Однако многие физики по-прежнему отвергают её или сохраняют агностический нейтралитет. В книге Альберта «Квантовая механика и опыт»6 можно ознакомиться с (большей частью) философским введением в этот спор. Также в «Стэнфордской философской энциклопедии» вы можете познакомиться с «Измерениями в квантовой теории»7, а также разными вопросами, связанными с «множественными мирами», например, «Формулировкой относительных состояний Эверетта»8 и «Многомировой интерпретацией»9.

Для развития интуитивного понимания физики прекрасно подходит книга Эпштейна «Думай как физик»10. Не стоит забывать, что как большую часть когнитивных наук можно понять без понимания природы субъективной осознанности, так и большую часть физики можно понять, даже не представляя точной природы (и размеров!) физического мира.

  • 1. Daniel C. Dennett, «Freedom Evolves» (Viking Books, 2003).
  • 2. David J. Chalmers, «The Conscious Mind: In Search of a Fundamental Theory» (New York: Oxford University Press, 1996).
  • 3. Thomas Nagel, «What Is It Like to Be a Bat?», Philosophical Review 83, no. 4 (1974): 435–450, http://www.jstor.org/stable/2183914 .
  • 4. Из участвующих в опросе англоговорящих профессиональных философов 56,5% придерживались идей физикализма, 27,1% – антифизикализма, а 16,4% придерживались иных взглядов (сюда же входит вариант «я не знаю»). [David Bourget and David J. Chalmers, «What Do Philosophers Believe?», Philosophical Studies (2013): 1–36.] Большинство философов отвергает метафизическую возможность существования «зомби» по Чалмерсу, но до сих пор нет единого мнения, где именно ошибка в его аргументации. Кирк обобщает современные точки зрения по поводу вопроса сознания, предлагая аргументы напоминающие позиции Юдковского против возможности знать или ссылаться на нередуцируемые квалиа.[Robert Kirk, «Mind and Body» (McGill-Queen’s University Press, 2003).]
  • 5. Автор ссылается на издание: Max Tegmark, «Our Mathematical Universe: My Quest for the Ultimate Nature of Reality» (Random House LLC, 2014). Книга переводилась на русский язык под названием «Наша математическая вселенная». — Прим. перев.
  • 6. David Z. Albert, «Quantum Mechanics and Experience» (Harvard University Press, 1994).
  • 7. Henry Krips, «Measurement in Quantum Theory», in The Stanford Encyclopedia of Philosophy, Fall 2013, ed. Edward N. Zalta.
  • 8. Jeffrey Barrett, Everett’s Relative-State Formulation of Quantum Mechanics, ed. Edward N. Zalta, http://plato.stanford.edu/archives/fall2008/entries/qm-everett/
  • 9. Lev Vaidman, «Many-Worlds Interpretation of Quantum Mechanics», in The Stanford Encyclopedia of Philosophy, Fall 2008, ed. Edward N. Zalta.
  • 10. Lewis Carroll Epstein, «Thinking Physics: Understandable Practical Reality», 3rd Edition (Insight Press, 2009).
Перевод: 
sepremento, Alaric
Оцените качество перевода: 
Средняя оценка: 4.4 (8 votes)

Правда закономерна

Значительная часть третьего тома была посвящена противопоставлению человека как целеориентированной системы нечеловеческим процессам из областей эволюционной биологии и искусственного интеллекта. Не менее полезно противопоставить человека уже как физическую систему нечеловеческим процессам без признаков разума.

В конце концов, мы, люди, состоим из частей и эти части сами по себе неразумны. Мир атомов не похож на наше обычное представление о мире. Уж тем более он не похож на представляемый обычно нами мир одушевлённых сознаний. В своё время Джулио Джорелло озаглавил интервью с Дэниэлом Деннетом так: «Да, у нас есть душа. Но она состоит из множества маленьких роботов».

Мы начнём с цепочки о базовых взаимосвязях между физикой и человеческим познанием.

Автор: 
Элиезер Юдковский

Единый огонь

Элиезер Юдковский

В фэнтезийной книге Л. Спрэг де Кампа «Дипломированный чародей»1 (которая породила множество последующих подражаний) главный герой, Гарольд Ши, переместился из своей вселенной во вселенную скандинавских мифов. Вселенная скандинавских мифов основана скорее на магии, нежели на технологии, поэтому естественно, что, когда Наш Герой попробовал зажечь огонь спичкой, принесенной с Земли, та его подвела.

Я понимаю, что это всего лишь фентези, но… как бы изложить…

Нет, не так.

В конце 18 века Антуан Лоран Лавуазье открыл огонь. «Что?» — воскликнете вы. Разве к тому времени огонь не использовали уже несколько сотен тысяч лет? Да, действительно, люди использовали огонь — обжигающий, яркий, примерно оранжевого цвета и очень удобный для приготовления пищи. Но никто не знал, как он работает. Греки и средневековые алхимики полагали, что Огонь является одним из четырех базовых элементов. К временам Лавуазье алхимическая парадигма включала в себя множество поправок и стала чрезвычайно сложной, но огонь по-прежнему оставался основополагающей сущностью — уже в виде «флогистона», некоего загадочного вещества, которое, как утверждалось, объясняло огонь, а также все остальные алхимические явления.

Важнейшая новая идея Лавуазье заключалась в том, чтобы взвесить абсолютно все части химической головоломки, как до химической реакции, так и после. До него считалось, что некоторые химические процессы способны изменять вес используемого материала. Например, если мелко протёртую сурьму подвергнуть воздействию направленного через увеличительное стекло солнечного света, то через час сурьма обратится в пепел, а сам пепел будет весить на одну десятую больше, чем исходный объем сурьмы — даже несмотря на то, что при горении от сурьмы исходит густой белый дым. Лавуазье взвесил совершенно все компоненты таких реакций, включая воздух, в котором они протекали, и обнаружил, что материя не создаётся и не разрушается. Увеличение массы сгоревшего пепла взаимосвязано с уменьшением массы воздуха.

Лавуазье также было известно, как разделять газы, и он обнаружил, что горящая свеча уменьшает количество одного вида газа — «жизненного воздуха» и создает иной газ — «связанный воздух». Сегодня мы бы их назвали кислородом и углекислым газом. Когда жизненный воздух заканчивается, пламя угасает. Можно было предположить, что горение преобразует жизненный воздух в связанный, а топливо — в пепел, причём длительность преобразования ограничена количеством доступного жизненного воздуха.

Идея Лавуазье полностью противоречили существующей теории флогистона. Одного этого хватило бы, чтобы потрясти всех, но после этого выяснилось…

Чтобы оценить дальнейшие события, нужно представить себя человеком XVIII века с его ограниченными познаниями. Забудьте об открытии ДНК, которое случилось лишь в 1953. Забудьте всё, что вам известно о клеточной теории в биологии, сформулированной в 1839. Представьте, как вы смотрите на свои руки, сгибаете пальцы… и абсолютно не понимаете, почему они сгибаются. Анатомия мышц и костей была известна, но никто не имел ни малейшего представления «как они работают» — почему мышцы сгибаются и сокращаются, хотя слепок из глины похожей формы остается неподвижен. Представьте, что ваше собственное тело состоит из загадочной, непостижимой субстанции. А теперь представьте открытие…

…что люди в процессе дыхания потребляют жизненный воздух и выдыхают связанный. В людях тоже происходит горение! Лавуазье измерил количество тепла, которое животные (и помощник Лавуазье, Сеген) производят при упражнениях, объем потребленного жизненного воздуха и объём выдыхаемого связанного воздуха. Когда животные производят больше тепла, они потребляют больше жизненного воздуха и выдыхают больше связанного. Люди, подобно пламени, потребляют топливо и кислород, люди, подобно пламени, вырабатывают тепло и углекислый газ. Лиши человека кислорода или топлива, и огонь исчезнет.

Спички загораются из-за фосфора — у «безопасных спичек» есть фосфор на зажигательной ленте, у сесквисульфидных спичек фосфор нанесен на головку. Фосфор очень быстро вступает в химические реакции — чистый фосфор светится в темноте и может спонтанно воспламениться. (Хенниг Бранд, выделивший чистый фосфор в 1669, утверждал, что обнаружил Элемент Огня.) К тому же фосфор вполне соответствует своему назначению в аденозинтрифосфате, АТФ, — веществе, благодаря которому в организме накапливается энергия химических реакций. АТФ порой называют «молекулярной валютой». Она дает силы мышцам и заряжает нейроны. Практически все метаболические реакции зависят от АТФ, и, следовательно, от химических свойств фосфора.

Если спичка перестает функционировать, то и вы тоже. Невозможно поменять что-то одно.

Нет очевидной связи между утверждениями поверхностного уровня «Спичка зажигается от чирканья» и «Людям нужен воздух, чтобы дышать». Потребовались столетия, чтобы обнаружить эту связь, и даже сейчас, судя по всему, это какой-то несущественный факт, которому учат в школе и который важен лишь для небольшого круга специалистов. Нам слишком легко вообразить мир, где одно из этих правил работает, а второе — нет, перестать верить в одно, но не в другое. Но это лишь воображение, а не реальность. Если вы разделили карту на четыре части, чтобы её было проще хранить, это не значит, что сама территория также разделена на четыре обособленные части. Наш разум хранит отдельные правила поверхностного уровня в обособленных отсеках, но это не отражает никакой обособленности законов, управляющих Природой.

Мы можем извлечь из всего этого урок. Поведение фосфора проистекает из ещё более глубоких законов: законов электродинамики и хромодинамики. «Фосфор» — это лишь наше слово для обозначения электронов и кварков, организованных определенным образом. Нельзя изменить химические свойства фосфора, не изменив законы, которым подчиняются электроны и кварки.

Если вы окажетесь в мире, где спички не зажигаются, вы перестанете быть организованной материей.

Реальность сплетена гораздо плотнее, чем люди предпочитают верить.

  • 1. Э. Юдковский почему-то не упоминает второго автора, Флетчера Прэтта. — Прим.перев.
Перевод: 
completely_confused, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
181
Оцените качество перевода: 
Средняя оценка: 4.8 (10 votes)

Единый закон

Элиезер Юдковский

Антуан Лоран Лавуазье обнаружил, что дыхание и огонь (горение) работают по одному принципу. Это было одно из наиболее поразительных объединений в истории науки, оно слило вместе мирскую сферу материи и священное таинство жизни, которые люди делили на отдельные магистерии.

Первое великое объединение было сделано Исааком Ньютоном, который сказал, что движение планет подчиняется тем же законам что и падающее яблоко. Шок от этого открытия был больше, чем от открытия Лавуазье. Дело было не только в том, что Ньютон осмелился объединить земное царство материи с явно отличной и священной небесной сферой, когда-то считавшейся обителью богов. Открытие Ньютона породило понятие универсального закона, который одинаков везде и всегда, буквально не имея исключений.

Люди живут в мире поверхностных явлений, которые делятся на категории, из которых вытекает большое количество исключений. Тигр ведет себя не так, как буйвол. Большинство буйволов имеют четыре ноги, но, возможно, у этого есть три. Зачем кому-то думать что есть законы, которые верны везде? Это, очевидно, не так.

Только в одном случае, похоже, мы хотим закон, который бы выполнялся везде — это когда мы говорим о моральных законах — социальных правилах поведения. Некоторые члены племени могут попробовать взять больше, чем их доля от буйвола, возможно с каким-либо умным оправданием, так что в случае моральных законов мы, кажется, в самом деле имеем инстинкт универсальности. Да, правило о разделе мяса применяется и к вам, нравится ли вам это или нет. Но даже тут есть исключения. Если по некоторой аномальной причине более сильное племя угрожает перебить вас, если Боб не получит в два раза больше мяса, нежели все остальные, вы дадите Бобу двойную порцию. Идея правила, которое вообще не имеет исключений, кажется слишком жесткой, продуктом ограниченного мышления фанатиков, поскольку, находясь в тисках своей идеи, они не могут осознать богатства и сложности реального мира.

Это обычное обвинение в адрес ученых — профессиональных знатоков богатства и сложности реальной Вселенной. Потому что когда вы на самом деле смотрите на вселенную, оказывается, что она является, по человеческим меркам, безумно жесткой в применении своих правил. Насколько мы знаем, не было ни одного нарушения сохранения импульса с незапамятных времен до наших дней.

Иногда, очень редко, мы наблюдаем явное нарушение наших моделей фундаментальных законов. Хотя наши научные модели могут существовать в течение одного или двух поколений, они не являются стабильными на протяжении веков. Но не думайте, что это делает саму Вселенную капризной. Это смешение карты с территорией. Ибо, когда пыль уляжется, и старая теория будет заменена, то получается, что Вселенная всегда действовала в соответствии с новым обобщением, которое мы обнаружили, которое опять будет абсолютно универсальным в свете текущих человеческих знаний. Когда было обнаружено, что ньютоновская гравитация была частным случаем общей теории относительности, было видно, что общая теория относительности формировала орбиты Меркурия за десятилетия до того, как человек узнал об этом, и позже стало очевидным, что общая теория относительности управляла коллапсом звезд в течение миллиардов лет, прежде чем появилось человечество. Ошибаются только наши модели — сам Закон был всегда абсолютно постоянным или так наша новая модель говорит нам.

Я могу утверждать, что уверен только на 80 %, что предел скорости света в следующую сотню тысяч лет останется таким же, однако это не значит что предел является таковым только 80 % времени, а в остальное время меняется. Предположение, в котором я обозначил вероятность в 80 % это то, что действительное положение дел (скорость света) останется таким на всем протяжении пространства-времени.

Одна из причин, по которой древние греки не занимались наукой, это то, что они не представляли, как можно обобщать эксперименты. Греческие философы были заинтересованы в «нормальных» явлениях. Если вы проводите выдуманный эксперимент, то вы скорее всего получите аномальный результат, который не будет иметь ничего общего с тем, как на самом деле работают вещи.

Вот как люди пытаются мечтать, прежде чем начинают учиться; но о чем мечтала Вселенная сама по себе, прежде чем начала мечтать о людях? Если вы действительно хотите научиться думать в соответствии с реальностью — для этого здесь приводится это дао:

С самого начала
Ни одна необычная вещь
Не случалась

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
182
Оцените качество перевода: 
Средняя оценка: 4.1 (23 votes)

Реальность безобразна?

Элиезер Юдковский

Читать после: О красоте математики, Предполагая красоту

Вчера я говорил о последовательности кубов {1, 8, 27, 64, 125, …} и как поначалу последовательность из их разностей первого порядка {7, 19, 37, 61, …} не содержит очевидного паттерна, но если взять последовательность разностей второго порядка {12, 18, 24, …}, то закономерность становится простой. Вычисление разностей третьего порядка {6, 6, …} приводит нас к идеально стабильному уровню, где хаос разрешается в порядок.

Но это (как я заметил) довольно искусственный пример. Может быть, «беспорядочному реальному миру» не достает красоты подобных абстрактных математических объектов? Может быть, будет более правильно поговорить здесь о нейронауке или сети экспресии генов?

Абстрактная математика, созданная одним только воображением, строится на простых основаниях – небольшом наборе первоначальных аксиом — и является закрытой системой; условия, которые могут выглядеть как не особенно природные и невероятно способствующие аккуратности.

Другими словами: в чистой математике вам не надо беспокоиться о тигре, которые может выпрыгнуть из кустов и съесть треугольник Паскаля.

Так что же, реальный мир безобразнее, чем математика?

Странно, что люди спрашивают об этом. В смысле, этот вопрос мог бы быть разумным две с половиной тысячи лет назад…

Еще когда греческие философы спорили о том, из чего может состоять эта штуковина под названием «реальность», было много мнений. Гераклит сказал: «Всё есть огонь». Фалес сказал: «Всё есть вода». Пифагор сказал: «Всё есть число».

Счет: Гераклит 0 Фалес 0 Пифагор 1

Под сложными формами и конструкциями на поверхности реальности существует простой уровень, точный и стабильный уровень, законы которого мы называем «физика». Это удивительное открытие уже случилось к моменту нашего появления, но это не значит, что мы забыли, каким оно было неожиданным. Однажды давным давно люди вышли на поиски основополагающей красоты, не имея никаких гарантий, что найдут её. И случилось так, что они нашли её; и сейчас о ней знают все; и она принимается как должное.

Так почему мы не можем узнать местоположение каждого тигра в кустах так же просто, как мы можем узнать шестой куб?

Я вижу три источника неопределенности даже в мире чистой математики — два очевидных и один не очень.

Первый источник неопределенности заключается в том, что даже создание чистой математики, живущее внутри мира чистой математики, может не знать её. Люди ходили по Земле задолго до того как Галилей/Ньютон/Эйнштейн открыли законы гравитации, которые не дают нам упасть в космос. Вами могут управлять фундаментальные законы, о которых вы ничего не знаете. Нет такого физического закона, который говорит, что мозг, управляемый физическими законами, должен явным образом знать о них.

У нас всё ещё нет Теории Всего. Наши лучшие на данный момент теории состоят из математики, но они не идеально стыкуются друг с другом. Наиболее вероятное объяснение — как уже случалось раньше — мы видим поверхностные проявления более глубокой математики. Так что пока мы думаем, что, скорее всего, реальность сделана из математики, но мы еще не знаем, из какой именно.

Но физикам приходится строить огромные ускорители частиц, чтобы отличить теории между собой — чтобы зафиксировать оставшуюся неопределенность хоть в какой-нибудь видимой форме. То, что физики доходят до такого и остаются неуверенными, подсказывает, что это не источник неопределенности цен на акции.

Второй очевидный источник неопределенности заключается в том, что даже если вы знаете все релевантные законы физики, у вас может не хватать вычислительных мощностей, чтобы делать выводы на их основе. Мы знаем все фундаментальные законы физики, относящиеся к тому, как цепочки аминокислот сворачиваются в белок. Но мы всё ещё не в состоянии предсказать форму белка по аминокислотам. Одна крошечная 5-нанометровая молекула, сворачивающаяся за микросекунду, это слишком много информации, чтобы современные компьютеры смогли с ней справиться (не говоря уже о тиграх или ценах на акции). Наши перспективные разработки в свертывании белков чаще используют хитроумные приближения, а не фундаментальное уравнение Шрёдингера. Когда дело доходит до описания 5-нанометрового объекта с помощью действительно базовой физики, на уровне кварков - что ж, можно даже не пытаться.

Мы должны использовать инструменты вроде рентгеновской кристаллографии и ядерно-магнитного резонанса, чтобы узнавать формы белков, которые полностью заданы физикой, которую мы знаем, и цепочкой ДНК, которую мы знаем. Мы не обладаем логическим всеведением. Мы не можем видеть всех последствий наших мыслей. Мы не знаем, во что мы верим.

Третий источник сомнения наиболее сложен для понимания, и Ник Бостром даже написал о нём книгу. Предположим, что последовательность {1, 8, 27, 64, 125, …} существует, примем это за факт. Далее, допустим, что на каждом кубе сидит маленький человечек, один человечек на куб, также примем это за факт.

Если вы стоите снаружи и видите глобальную перспективу – глядя сверху вниз на последовательность кубов и маленьких человечков на них – эти два факта говорят всё, что можно знать о последовательности и о человечках.

Но если вы – один из маленьких человечков, стоящих на кубе, и знаете эти два факта, существует еще третий кусочек информации, который нужен чтобы делать предсказания: «На каком кубе я стою?».

Вы ожидаете, что стоите на кубе; вы не ожидаете, что можете быть на числе 7. Ваши ожидания определённо ограничены вашим знанием базовых законов физики; ваши убеждения фальсифицируемы. Но вам всё ещё нужно посмотреть вниз, чтобы узнать стоите вы на 1728 или на 517717. Если вы можете быстро считать в уме, то достаточно увидеть первые две цифры четырехзначного куба 17__ , чтобы догадаться, что последние цифры 2 и 8. Иначе вам придется посмотреть и на них тоже.

Чтобы узнать, как выглядит ночное небо, недостаточно знать законы физики. Недостаточно даже обладать логическим всеведением про их последствия. Нужно еще знать, где вы во вселенной. Нужно знать, что вы смотрите на ночное небо с Земли. Необходима не только информация, достаточная для определения положения Земли в видимой вселенной, но во всей вселенной, включая все те части, которые наши телескопы не могут увидеть, потому что они слишком далеко, и другие инфляционные вселенные, а также альтернативные ветви Эверетта.

Предположение, что «неопределенность в исходных данных на границе» на самом деле относится к указанию на некоторое место (мы будем называть ее индексной неопределенностью), — хорошее. Но если нет, то это эмпирическая неопределенность, неопределенность в вопросе, как выглядит вселенная в глобальной перспективе, то есть неопределенность того же класса, что и неопределенность в фундаментальных законах.

Как бы то ни было, идея в том, что «реальность» включает в себя безнадежно беспорядочный компонент из-за второго или третьего источника неопределенности: логической неопределенности и индексной неопределенности.

Незнание фундаментальных законов не говорит, что то, что выглядит беспорядочным, действительно беспорядочно. Возможно, мы просто еще не уловили закономерность.

Но когда речь идет о беспорядочной сети экспрессии генов, мы уже нашли скрытую красоту — стабильный уровень, уровень физики, которая лежит в основе всего этого. И из того, что мы уже нашли основной порядок, мы можем сделать вывод, что мы уже не найдем больше никакого секрета, который бы сделал биологию простой, как последовательность кубов. Мы знаем правила игры, и поэтому знаем, что игра сложная. У нас не хватает вычислительных мощностей, чтобы заниматься химией белков на основе фундаментальной физики (второй источник неопределенности) и эволюция могла пойти разными путями на разных планетах (третий источник неопределенности). Новые открытия в фундаментальной физике нам здесь не помогут.

Если вы — древний грек, и смотрите на сырые данные из эксперимента по биологии, будет очень мудро поискать какое-нибудь скрытое пифагорейское изящество, когда все протеины складываются в идеальный икосаэдер. Но в биологии мы уже нашли пифагорейское изящество, и его, как мы знаем, недостаточно, чтобы преодолеть индексную и логическую неопределенность.

Точно так же мы можем быть уверены, что никто никогда не сможет предсказать результаты какого-нибудь квантового эксперимента, только потому, что наша фундаментальная теория ясно говорит нам, что разные версии нас будут видеть разные результаты. Если знание фундаментальных законов говорит, что существует последовательность кубов, и что маленький человечек стоит на каждом из них, и что все эти человечки одинаковые, за исключением того, что стоят на разных кубах, и что вы — один из этих человечков, то вы знаете, что у вас нет способа узнать, на каком вы кубе, кроме как посмотреть.

Современное знание говорит, что «реальность» — это идеально постоянный, детерминированный и очень большой математический объект, который очень дорого и трудно моделируется. Так что «реальная жизнь» не особенно похожа на предсказание следующего куба в цепочке кубов, а больше похожа на знание, что очень много маленьких человечков стоят на кубах, не зная, кто они и на каких именно кубах они стоят. А, и еще они не очень быстро считают в уме. Наше знание правил слегка ограничивает наши предсказания, но не полностью.

Вот. Теперь это похоже на реальность?

Но неопределенность существует в карте, а не в территории. Если мы не знаем о феномене, это говорит что-то о нашем состоянии сознания, а не о самом феномене. Эмпирическая неопределенность, логическая неопределенность и индексная неопределенность – просто имена для нашей неразберихи. Пока мы все равно думаем, что мир состоит из математики, а математика совершенно стабильна и определена. Беспорядок только в глазах смотрящего.

Даже самые жуткие трясины блогосферы определены той же самой совершенной физикой, что и {1, 8, 27, 64, 125, …}

Так что интернет — не огромная помойка… это серии кубов.

Перевод: 
Letti, Pion, bartolomay, Evgeny, princess72
Номер в книге "Рациональность: от ИИ до зомби": 
183
Оцените качество перевода: 
Средняя оценка: 3.9 (17 votes)

Прекрасная вероятность

Элиезер Юдковский

Должны ли мы ожидать, что на определенном уровне рациональность будет простой? Должны ли мы надеяться и искать красоту в искусстве убеждения и выбора?

Позвольте мне привести цитату из Джейнса1, покойного магистра Байесианства:

Два медика-исследователя используют одинаковую методику лечения независимо друг от друга в разных больницах. Ни один из них не фальсифицирует данные, однако один решил заранее, что из-за ограниченности ресурсов он остановится после лечения N=100 пациентов, сколько бы вылечившихся ни было. Другой поставил на кон свою репутацию и решил, что он не остановится, пока данные не покажут, что процент вылеченных больше 60%, сколько бы пациентов ни потребовалось. В итоге оба получили одинаковые результаты: n=100 [пациентов], r=70 [вылеченных]. Должны ли мы сделать разные выводы из их экспериментов? [По-видимому, две контрольные группы также дали равные результаты].

Пользователь Cyan отсылает нас к 37 главе превосходной книги Маккая2 о статистике, где данная проблема рассматривается более подробно.

В соответствии со статистической процедурой старой школы — которой, как я полагаю, все еще обучают сегодня — два исследователя выполнили разные эксперименты с разными условиями прекращения. Два эксперимента могли быть прекращены с разными данными и таким образом представлять разные тесты гипотезы, требуя различных методов статистического анализа. Поэтому весьма возможно, что первый эксперимент будет «статистически значимым», а второй нет.

То, волнует ли вас это или нет, говорит о том, волнует ли вас теория вероятности и рациональность сама по себе.

Статистики-небайесианцы могут пожимать плечами, говоря «ну, не все статистические инструменты имеют одни и те же сильные и слабые стороны, вы же знаете, молоток не похож на отвертку, и если вы применяете разные статистические инструменты, вы можете получить разные результаты, в зависимости от того, обрабатываем мы данные вычисляя линейную регрессию или тренируя нейронную сеть. Вы должны использовать правильный инструмент для каждого отдельного случая. Жизнь запутанна».

И тогда Байесианцы отвечают: «Что, простите? Очевидное влияние фиксированного экспериментального метода, продуцирующего одинаковые данные, зависит от частных мыслей исследователя? И вы еще умудряетесь обвинять нас в ”чрезмерной субъективности?”»

Если Природа устроена одним образом, то так же данные, пришедшие путем, который мы видели, должны представлять одно явление. Если Природа устроена другим образом, то данные должны отражать что-то еще. Однако состояние Природы, которое отражено в данных, никак не зависит от намерений исследователя. Так что каковы бы не были наши гипотезы о Природе, отношение правдоподобия остается одним и тем же, и доказательное влияние то же самое, и апостериорное убеждение должно быть тем же самым между двумя экспериментами. По меньшей мере один из двух методов старой школы должен учитывать не всю информацию, или просто вычисляться с ошибкой, чтобы два метода дали разные ответы.

Древняя война между байесианцами и сторонниками частотного подхода тянется уже десятилетия, и я не собираюсь рассматривать всю эту историю в данном посте.

Но один из центральных конфликтов в том, что байесианцы ожидают, что теория вероятности будет… как же это сказать? Стройной? Ясной? Самосогласующейся?

Как говорит Джейнс, теоремы байесианской вероятности — это просто теоремы когерентной системы доказательств. Не имеет значения, как вы обрабатываете данные в этом случае, результаты байесианской теории вероятности должны быть всегда одни и те же — каждая теорема совместима с любой другой теоремой.

Если вы хотите узнать сумму $ 10+10 $, вы можете вычислять это как $ (2 × 5) + (7 + 3) $ или как $ (2 × (4 + 6)) $ или использовать любой другой метод который вам нравится, но результат должен быть всегда один и то же, в данном случае 20. Если же в одном случае получается 20, а в другом 19, тогда вы можете заключить, что вы сделали что-то неправильно по крайней мере в одном из вычислений. (В математике недопустимой операцией обычно является деление на ноль; в теории вероятности это обычно бесконечность, что нельзя использовать как предел конечного процесса.)

Получив результат $ 19=20 $, изо всех сил ищите допущенную ошибку, поскольку невозможно математически обмануть себя. Если бы кто-то на самом деле получил реальное противоречие пользуясь байесианской теорией вероятности — например, два различных доказательных воздействия от одного и того же экспериментального метода, выдающего одинаковые результаты — тогда вся конструкция пошла бы прахом. Включая теорию множеств, поскольку я совершенно уверен, что система аксиом Цермело—Френкеля послужит примером для теории вероятности.

Математическая! Вот слово которое я искал. Байесианцы ожидают что теория вероятности будет математической. Вот почему мы заинтересованы в теореме Кокса и ее расширениях, показывающих, что любое представление неопределенности, которое подчиняется определенным ограничениям, должно отображаться посредством теории вероятности. Когерентная математика это великолепно, но уникальная математика еще лучше.

И еще, должна ли рациональность быть «математична»? Не является предопределенным то, что вероятность должна быть красивой. Реальный мир сложен — так, возможно, вам нужно будет сложное мышление, чтобы с этим справиться? Возможно, что статистики-небайесианцы с их большой коллекцией специальных методов и обоснований более компетентны, поскольку у них строго больший инструментарий. Хорошо, когда проблемы ясны, но обычно это не так, и вам придется с этим жить.

В конце концов, хорошо известно, что вы не можете использовать байесовские методы на множестве проблем из-за того, что байесовские вычисления сложны для подсчетов. Так почему бы не позволить цвести многим цветам? Почему бы не иметь больше одного инструмента в вашем наборе?

Это фундаментальное различие в сознании. Статистики старой школы думают в терминах инструментов и трюков, применяемых для определенных проблем. Байесианцы, по крайней мере этот байесианец, хотя я не думаю, что говорю только за себя, — мы думаем в терминах законов.

Поиск законов — это не то же самое, что поиск особенно чистых и красивых инструментов. Второй закон термодинамики — это не одно и то же, что и чистый и красивый холодильник.

Цикл Карно это идеальный двигатель — на самом деле идеальный. Нет двигателя, который бы питался от двух накопителей тепла и был бы эффективней, чем двигатель Карно. Как следствие, все термодинамически обратимые двигатели, которые функционируют между одинаковыми накопителями тепла, имеют одинаковую эффективность.

Но, конечно, вы не можете использовать двигатель Карно для питания реальной машины. Двигатель машины имеет такое же сходство с двигателем Карно, что и шины автомобиля с идеальными катящимися цилиндрами.

Тогда ясно, что двигатель Карно — бесполезный инструмент для постройки настоящей машины. Второй закон термодинамики, очевидно, неприменим здесь. Чересчур сложно сделать двигатель, который будет отвечать таким условиям, в реальности. Просто игнорируйте термодинамику — используйте все, что работает.

Это определенный род путаницы, который, как я думаю, управляет теми, кто все еще цепляется за старые методы.

Нет, вы не можете всегда делать точные байесовские вычисления для проблемы. Иногда вам надо искать аппроксимацию; на самом деле, часто. Это не значит, что теорию вероятности нужно прекратить применять, так же как ваша неспособность вычислить аэродинамику самолета из атомных взаимодействий не означает, что самолет не сделан из атомов. Какую бы аппроксимацию вы ни использовали, она будет работать, если является аппроксимацией идеального байесовского вычисления — и не будет работать в любом другом случае.

Доказательства когерентности и уникальности байесианства отметают оба пути. Также, как любой расчет, который подчиняется аксиомам когерентности Кокса (или любой из его переформулировок или обобщений), должен отображаться в вероятностях, любой не байесовский расчет должен провалить какой-либо из тестов на когерентность. Что, в свою очередь, делает вас уязвимым к наказаниям вроде «голландской книги» (принятие комбинаций ставок, которые приводят к гарантированным потерям, или отказ от комбинаций ставок, которые дают верный выигрыш).

Вы можете быть не способны вычислить оптимальный ответ. Но любая аппроксимация которую вы используете, с ее достоинствами и недостатками, должна быть объяснима с позиции байесовской теории вероятности. Вы можете не знать объяснения: но это не значит, что его не существует.

Так вы хотите использовать линейную регрессию вместо байесовских обновлений? Но посмотрите на структуру, лежащую в основе линейной регрессии, и вы увидите, что она выбирает лучшую точку с позиции оценки, данной гауссовской функцией правдоподобия, и ставит исходное над параметрами.

Вы хотите использовать регуляризованную линейную регрессию, потому что она работает на практике лучше? Ну, она соответствует (говорит байесианец) тому, чтобы ставить гауссову априорную информацию над весами.

Иногда вы не можете использовать байесовские методы так, как это описано в литературе; на самом деле это бывает довольно часто. Но когда вы можете использовать точное байесовское вычисление, которое использует каждый кусочек доступной вам информации, делайте это. Вы никогда не найдете статистический метод, который даст вам лучший ответ. Вы можете найти простую аппроксимацию, которая работает отлично почти все время, и так будет проще, но не точнее. Не будет, пока другие методы используют знания, возможно, в форме неявной априорной информации, что не позволяется при байесовских вычислениях; и тогда, когда вы применяете априорную информацию для байесовского вычисления, оно будет либо равно по результатам, либо будет лучше.

Когда вы используете специальный статистический инструмент старой школы с каким-либо (часто достаточно интересным) обоснованием, вы никогда не знаете, если у кого-то завтра появиться более продвинутый инструмент. Но когда вы напрямую можете использовать вычисление, которое отражает байесовский закон, вы делаете что-то наподобие помещения двигателя Карно в свою машину. Это, как говорится, по-байесовски оптимально.

Мне кажется, что те, кто пользуется множеством инструментов, смотрят на последовательность кубов $ {1, 8, 27, 64, 125, …} $, указывают на разности $ {7, 19, 37, 61, …} $ и говорят «смотрите, жизнь не всегда проста — вам нужно адаптироваться к обстоятельствам». И байесианцы, которые указывают на лежащий в основе стабильный уровень $ {6, 6, 6, 6, 6, …} $. И критики говорят: «Что за чушь вы несете? Это $ 7, 19, 37 $, а не $ 6, 6, 6 $. Вы упрощаете проблему, вы слишком привязаны к простоте».

Бесполезно быть простым на поверхностном уровне. Вы должны погрузиться глубже, чтобы найти стабильность.

Мыслите законами, а не инструментами. Необходимость вычислять приближения (аппроксимации) к закону не меняет закон. Самолеты по-прежнему состоят из атомов, они не станут исключением только из-за аэродинамических вычислений. Аппроксимация существует на карте, не на территории. Вы можете знать второй закон термодинамики и все еще пробовать себя как инженера, строя несовершенный двигатель машины. Второй закон не станет неприменим; ваше знание этого закона и цикла Карно помогает вам приблизиться к наибольшей эффективности, которую вы только можете достигнуть.

Мы не очаровываемся байесовскими методами только потому, что они красивы. Красота всего лишь побочный эффект. Теоремы Байеса изящны, когерентны, оптимальны и доказуемо однозначны потому, что они относятся к законам.

  • 1. Edwin T. Jaynes, «Probability Theory as Logic,» in Maximum Entropy and Bayesian Methods, ed. Paul F. Fougère (Springer Netherlands, 1990).
  • 2. David J. C. MacKay, Information Theory, Inference, and Learning Algorithms (New York: Cambridge University Press, 2003).
Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
184
Оцените качество перевода: 
Средняя оценка: 3.7 (23 votes)

Вне лаборатории

Элиезер Юдковский

«Вне лаборатории учёные не мудрее, чем кто-либо ещё». Иногда эту пословицу используют учёные, чтобы с сожалением напомнить себе о том, что они тоже могут ошибаться. Иногда её применяют в менее похвальных целях — чтобы обесценивать нежелательные экспертные рекомендации. Правдива ли пословица? Наверное, нет, в абсолютном смысле. Это кажется слишком пессимистичным — говорить, что учёные буквально не выше среднего уровня.

Но поговорка кажется в какой-то степени верной, и мы должны быть обеспокоены этим фактом. Мы не должны грустно вздыхать и мотать головой. Скорее, мы должны встревоженно подобраться. Почему? Предположим, пастушонок обучен считать овец, каждый раз, как овца проходит. Он знает, когда все овцы ушли и когда вернулись. Тогда ты даёшь пастуху яблоки и спрашиваешь: «Сколько яблок?» Но он тупо на тебя смотрит. Он не обучен считать яблоки. Только овец. Вы, вероятно, заподозрите, что пастух плохо понимает счёт. Теперь предположим, что мы видим, что кандидат экономических наук покупает каждую неделю лотерейный билет. Мы должны спросить себя — этот человек действительно понимает ожидаемую полезность на инстинктивном уровне? Или просто обучен выполнению различных алгебраических трюков?

Один пример мыслей Ричарда Фейнмана об ошибках в системе обучения физике:

«После длительного расследования я, наконец, понял, что студенты все запоминали, но ничего не понимали. Когда они слышали: «свет, отражённый от преломляющей среды», они не понимали, что под средой имеется в виду, например, вода. Они не понимали, что «направление распространения света» — это направление, в котором видишь что-то, когда смотришь на него, и т.д. Все только запоминалось, и ничего не переводилось в осмысленные понятия. Так что, если я спрашивал: «Что такое угол Брюстера?», я обращался к компьютеру с правильными ключевыми словами. Hо, если я говорил: «Посмотрите на воду», — ничего не срабатывало. У них ничего не было закодировано под этими словами».

Предположим, у нас есть компетентный учёный, который знает, как поставить эксперимент на N испытуемых. N испытуемых получат одинаковый препарат. Судьи слепым методом будут классифицировать результаты. И тогда мы обработаем результаты на компьютере и увидим, будут ли они значимы на 0.05 доверительной вероятности.

И это не просто ритуал. Как, например, «салат следует есть вилкой». Это ритуал для проверки гипотез экспериментально. Почему вы должны экспериментально проверить гипотезу? Потому что знаете, что это требование журнала для публикации? Потому что так вас научили в колледже? Потому что все вокруг будут в унисон говорить, что эксперимент важен, и будут смеяться над вами, если вы говорите иначе?

Нет. Потому что для построения карты территории вы должны пойти и посмотреть на территорию. Невозможно сидеть с закрытыми глазами и строить точную карту города, просто размышляя над тем, каким вы хотите видеть город. Вы должны пойти, погулять и нарисовать на бумаге линии, которые вы увидите. Это происходит каждый раз, когда вы смотрите на развязанные шнурки. Фотоны летят от солнца, отскакивают от шнурков, попадают в сетчатку, активируют нейроны и активируют в зрительной коре шаблон, сильно коррелирующий с формой ваших шнурков. Чтобы нарисовать карту — пройдись по территории. Взаимодействие мозга с окружением — реальный физический процесс. Процессы мышления — не магия. Вы можете описать, как это работает. Чтобы найти эти вещи вы должны пойти и посмотреть.

Так что нам теперь думать про учёного, компетентного в лаборатории, но за её пределами верящего в духовный мир? Мы спросим: «Почему?», и учёный ответит что-то вроде: «Ну, никто ведь на самом деле не знает. Это религия, и она не может быть опровергнута тем или иным наблюдением». Я не могу не прийти к выводу, что человек буквально не знает, почему мы должны смотреть на вещи.

Вероятно, они выучили определённый ритуал проведения эксперимента, но они не понимают причин необходимости этого — чтобы нарисовать карту территории, вы должны её увидеть — чтобы получить информацию об окружающей среде, вы должны создать процесс причинно-следственной связи, в котором вы взаимодействуете с окружающей средой и корректируете карту. Это верно как в отношении двойного слепого метода сбора информации о лекарствах, так и в отношении сбора информации вашим глазом о шнурках.

Может быть, наш верящий в духов учёный скажет «Но это не задача для эксперимента. Духи говорят со мной в моём сердце». Что ж. Если мы предположим, что духи действительно могут говорить каким-либо образом с нами, то тут может быть причинно-следственное взаимодействие и необходимы наблюдения. Теория вероятностей всё ещё работает. Если у вас есть предположение, что некий «голос духов» может быть свидетельством реальных духов, то вы должны предположить, что есть рациональная вероятность для того, чтобы «голос духов» вызывался духами, относительно других объяснений «голоса духов», являющаяся достаточно сильной для преодоления предварительной невероятности факта сложного убеждения со многими частями. В противном случае объяснение «духи говорят со мной в моём сердце» является примером «причинного взаимодействия», по аналогии с которым студент не видит за определением «преломляющая среда» воду.

Легко быть одураченным, возможно, потому, что люди в лабораторных халатах используют фразы вроде «причинного взаимодействия», а люди в бусах — фразы вроде «духи говорят». Участники дискуссии в разных одеждах, как мы все знаем, разграничены разными сферами существования — «непересекающимися магистериями», согласно известной чуши от Стивена Гулда. 1 На самом деле «причинно-следственная связь» — просто ещё один способ сказать: «Что-то происходит по причине того, что что-то сделано». И теорию вероятностей не волнует, что на вас надето.

В современном обществе имеется распространённое убеждение о том, что духовные вопросы не могут быть решены с помощью логики и наблюдений, поэтому вы можете иметь любые религиозные убеждения, какие вам нравится. Если учёный попадается на это и решает жить своей «внелабораторной» жизнью таким образом, то это говорит мне, что он понимает экспериментальный принцип как «общественный договор». Они знают, когда должны проводить эксперименты и проверять результаты ради статистической значимости. Но переведём это в контекст, где социальный обычай — следовать дурацким верованиям без проверки, и они будут счастливы так это и делать.

Ученик-пастушок скажет, что если вышли семь овец и потом вышли восемь овец, то лучше бы вернулись пятнадцать овец. Почему пятнадцать, а не «четырнадцать» или «три»? Потому что в противном случае останешься без ужина, вот почему! И это своего рода то, как работает профессиональная подготовка, но если социальный договор — единственная причина, по которой восемь овец и семь овец составляют пятнадцать овец, — то может семь яблок и восемь яблок будет три яблока? Кто сказал, что правила для яблок не должны быть другими?

Но если вы понимаете, почему работают правила — вы знаете, что сложение одинаково и для овец, и для яблок. Исаак Ньютон справедливо почитается — не только за его устаревшую теорию гравитации, но за обнаружение — удивительное и неожиданное — того, что небесные тела следуют тем же правилам, что и падающие яблоки. В макромире — в окружающей нас повседневной среде — на разных деревьях растут разные фрукты, разные люди в разное время следуют разным обычаям. Действительно, единая вселенная со стационарными универсальными законами — весьма нелогичное понятие для человека. Только учёные действительно в это верят, хотя некоторые религии хорошо играют словами относительно «единства всех вещей».

Как сказал Ричард Фейнман:

Если мы смотрим на стакан достаточно близко — мы видим всю вселенную. Это означает «думать, как физик»: скрученная жидкость, которая испаряется в зависимости от ветра и непогоды, отражение в стекле, а наша фантазия добавляет атомы. Стекло — продукт дистилляции земных пород, и в его составе мы видим тайны возраста вселенной и эволюции звёзд. Что за странный массив химических элементов есть в вине? Как они получились? Это ферменты, энзимы, субстраты и продукты. В вине находится большое обобщение — вся жизнь, ферментация (брожение). Никто не смог бы обнаружить химию вина без обнаружения, как это сделал Луи Пастер, причины множества болезней. Яркость красного вина определяется в сознании того, кто на него смотрит. Если наш маленький ум, для некоторого комфорта, делит эту вселенную на части — физика, биология, геология, астрономия, психология, и так далее — помните, что природа этого не знает! Итак, давайте сложим всё это вместе, не забывая в итоге для чего это. Пусть это даст нам ещё одно заключительное удовольствие — пить и забыть всё это.

Некоторые религии, особенно созданные или подправленные после Исаака Ньютона, могут исповедовать, что «всё связано со всем остальным». (Поскольку существует тривиальный изоморфизм между графами и их дополнениями, эта Глубокая Мудрость передаёт такую же полезную информацию, как граф без ребёр.)

Но когда дело доходит до фактической сути религии, пророки и священники следуют древней человеческой традиции принятия всего вместе. И они создают одно правило для девушек до двенадцати, ещё одно для мужчин за тридцать, одно правило для шаббата и другие для будней, одни правила для науки и другие — для колдовства. Реальность, как мы выучили к нашему шоку — не набор отдельных магистериев, но единый процесс, регулируемый математически простыми правилами низкого уровня. Различные здания на территории института не принадлежат к разным вселенным, хотя иногда так и может показаться. Вселенная не делится на разум и материю, на живое и неживое, атомы в наших головах легко взаимодействуют с атомами окружающего воздуха. Теорема Байеса не меняется от места к месту.

Если за пределами своей сферы деятельности учёный восприимчив к дурацким идеям так же, как кто-либо ещё, он, вероятно, так и не понял, почему научные правила работают. Может, они могут, как попугаи, повторять положения критического рационализма. Но они не понимают, на глубинном уровне, на алгебраическом уровне теории вероятностей, причинно-следственный уровень «мышления-как-машины». Они были обучены вести себя определённым образом в лаборатории, но они не любят быть ограничены данными. Когда они приходят домой и снимают халат — они расслабляются в некоторой комфортной глупости. И да, вот что мне интересно — могу ли я доверять учёным, даже в их области, особенно когда дело доходит до любого спорного вопроса, любого открытого вопроса, того, что ещё не прибито гвоздями массовых доказательств и социальных конвенций. Может, мы можем победить поговорку — быть рациональными в нашей личной жизни, не только в профессиональной жизни. Мы не должны позволить поговорке остановить нас. «Остроумная поговорка ничего не доказывает» — как сказал Вольтер. Может быть, мы сможем делать лучше, если достаточно изучим теорию вероятностей, чтобы понять, почему правила работают, и экспериментальную психологию, чтобы увидеть, как они применяются в реальных случаях, если мы сможем научиться «смотреть на воду». Амбиции не должны мешать возможности признать, что за пределами своей специализации ты не лучше кого-либо другого. Но если наши теории рациональности не применимы в обычной жизни — мы делаем что-то неправильно. Нет разницы между вселенной внутри и снаружи лаборатории.

  • 1. От себя позволю скопировать фрагмент текста из статьи о Гулде, чтобы внести немного ясности в термин «магистерий»: «Двойственность, если не двусмысленность эволюционной позиции Гулда, привела к такой же двойственности его точки зрения на соотношение науки и религии. Кратко эта точка зрения может быть выражена в принципе равноценности и непересекаемости науки и религии, означающем по Гулду, что наука и религия принадлежат к „непересекающимся магистериям“ (сокращенно — NOMA), то есть к разным областям, и имеют дело с разными вопросами человеческого бытия. Таким образом, между ними не может быть никакого конфликта: наука имеет дело с фактами, а религия касается вопросов этики, ценностей и целей. Свой тезис „непересекающихся магистерий“ Гулд обстоятельно развил в двух книгах, получивших многочисленные отклики. В первой он поставил перед собой честолюбивую цель — „определить идеальные отношения между наукой и религией таким способом, чтобы максимизировать выгоду от каждой для общества“, выявить „принципиальное средство ухода от ненужного конфликта между теологами и учёными“. Он выступал против представления, что наука и религия несовместимы и противоречат друг другу. Таковыми они становятся в том случае, если религия трактуется в узком смысле вероучения, которое требует удивительных вмешательств Бога в историю и природу и которое отказывается признавать доказательства эволюции. Если же религия понимается в более широком смысле — как философский теизм, свободный от суеверия или как светский гуманизм, основанный на этических нормах, то Гулд не видит никакого конфликта между двумя магистериями. Тогда наука и религии как две самостоятельные области не только могут быть объединены в единой концептуальной схеме, но и „процветать рядом подобно двум независимым нациям в мире друг с другом“». (Михаил Конашев, «Стивен Дж. Гулд и религия») — Прим.перев.
Перевод: 
Илья Кот
Номер в книге "Рациональность: от ИИ до зомби": 
185
Оцените качество перевода: 
Средняя оценка: 4.2 (12 votes)

Второй закон термодинамики и двигатели познания

Элиезер Юдковский

Первый закон термодинамики, более известный как закон сохранения энергии, утверждает, что нельзя создать энергию из ничего. Первый закон запрещает вечный двигатель первого рода — устройство, способное работать бесконечно долго без затрат топлива или других энергетических ресурсов. Согласно современной физике, энергия сохраняется при абсолютно каждом взаимодействии частиц. Применяя математическую индукцию, мы получаем, что, каким бы большим ни было множество частиц, оно не сможет произвести энергию из ничего — во всяком случае, без нарушения известных нам законов физики.

Именно поэтому, если вы попробуете запатентовать гениальное изобретение, состоящее из колёс и шестерёнок, в которой одна пружина разжимается, а другая сжимается и так далее, и которая, по вашим расчётам будет работать вечно, Патентное ведомство США без раздумий отклонит вашу заявку. Полностью доказано, что для работы такой машины хотя бы одна её деталь должна нарушать законы физики (в стандартной модели). Поэтому, если вы не можете объяснить, как одна деталь нарушает законы физики, вы не сможете объяснить, как их нарушает вся машина.

Подобный довод применим и к инерциоиду — двигательной установке, нарушающей закон сохранения импульса. В стандартной модели импульс сохраняется для всех частиц и их взаимодействий. По математической индукции, импульс будет сохраняться для систем любого размера. Если вы можете представить две сталкивающиеся частицы, которые разлетаются с таким же суммарным импульсом, то вы поймёте, что увеличение системы до огромной машины из кучи шестерёнок ничего не изменит. Даже если составить систему из триллионов квадриллионов атомов, 0 + 0 + … + 0 = 0.

Но закон сохранения энергии сам по себе не может запретить преобразовывать тепло в работу. Вы можете сделать закрытую коробку, которая превращает кубики льда и запасённое электричество в тёплую воду. Это даже совсем не сложно. Нельзя создать или уничтожить энергию: изменение количества энергии при трансформации кубиков льда и электричества в тёплую воду должно равняться нулю. Поэтому, если бы вы провели обратную трансформацию, закон сохранения энергии тоже бы не нарушился.

Вечные двигатели второго рода, превращающие тёплую воду в электрический ток и кубики льда, запрещены вторым законом термодинамики.

Понять второй закон немного труднее, поскольку по своей природе он байесовский.

Я не шучу.

Второй закон термодинамики вытекает из теоремы, которую можно доказать в стандартной физической модели: при изменении любой замкнутой системы во времени объём её фазового пространства сохраняется.

Допустим, вы держите мяч высоко над землёй. Это состояние можно описать как точку в многомерном пространстве, в котором по крайней мере одно из измерений — высота мяча над землёй. Затем, когда вы отпускаете мяч, он начинает двигаться. Одновременно начинает двигаться и безразмерная точка в фазовом пространстве, которая описывает всю систему, состоящую из вас и мяча. Термин «фазовое пространство» в физике обозначает, что в нём есть измерения не только для координат частиц, но ещё и для импульсов. Например, система из двух частиц будет иметь 12 измерений: 3 измерения на координату частицы, и 3 измерения на импульс.

Если у вас есть многомерное пространство, в котором каждое измерение описывает положение соответствующей шестерёнки в огромном механизме, то, когда вы будете поворачивать шестерёнки, в многомерном фазовом пространстве будет метаться туда-сюда единственная точка. И раз мы можем представить большой сложный механизм в виде одной точки в многомерном пространстве, то законы физики, описывающие поведение механизма с течением времени, мы можем представить, как описывающие траекторию этой точки в фазовом пространстве.

Второй закон термодинамики — следствие теоремы, доказываемой в стандартной модели физики: если рассмотреть некоторый объём фазового пространства, который преобразуется во времени в стандартной модели, то его суммарный объём сохраняется.

Например:

Возьмём две системы, $X$ и $Y$, где $X$ имеет 8 возможных состояний, $Y$ — 4 возможных состояния, а объединённая система $(X,Y)$ — 32 состояния.

Преобразование объединённой системы с течением времени можно описать правилом, которое отображает начальные точки в будущие точки. Например, система может начать в состоянии $X_7Y_2$, и за минуту перейти (под действием каких-то законов физики) в состояние $X_3Y_3$. То есть, если $X$ находится в состоянии 7, Y — в состоянии 2, и мы проследим за ними одну минуту, то мы увидим переход $X$ в состояние 3 и $Y$ в состояние 3. Таковы законы физики.

Далее, давайте выделим в объединённой системе подпространство $S$. Пусть в $S$ $Х$ всегда находится в состоянии 1, а $Y$ — в состояниях 1-4 . Таким образом, общий объём $S$ будет равен 4 состояниям.

И давайте допустим, что состояния, изначально входящие в $S$, под действиями управляющих системой $(X,Y)$ законов физики, ведут себя следующим образом:

$$X_1Y_1 \rightarrow X_2Y_1$$
$$X_1Y_2 \rightarrow X_4Y_1$$
$$X_1Y_3 \rightarrow X_6Y_1$$
$$X_1Y_4 \rightarrow X_8Y_1$$

Это, в двух словах, описание работы холодильника.

Подсистема $X$ стартовала из узкой области пространства состояний (единственного состояния 1), а $Y$ — из более широкой области, состояний 1-4. После взаимодействия систем друг с другом, система $Y$ оказалась в узкой области, а $X$ — в широкой, но общий фазовый объём не изменился. 4 начальных состояния перешли в 4 конечных.

Очевидно, что пока физика не позволяет фазовому объёму изменяться с течением времени, невозможно сжать $Y$ сильнее, чем расширить $X$, и наоборот. Для каждой подсистемы, сжимаемой в пространстве состояний, какая-то другая подсистема должна расширяться в пространстве состояний.

Теперь допустим, что мы не уверены насчёт состояния системы $(X,Y)$, и наша неопределённость описывается равновероятным распределением по $S$. То есть, мы уверены, что $X$ находится в состоянии 1, но $Y$ может находиться в любом из состояний 1-4. Через минуту мы ожидаем увидеть $Y$ в состоянии 1, а $X$ — в любом из состояний 2-8. Фактически, $X$ может быть только в одном из состояний среди 2-8, но узнать конкретное состояние было бы слишком затратно, так что мы просто будем говорить 2-8.

Если рассмотреть энтропию Шэннона от нашей неуверенности о состояниях $X$ и $Y$, как о независимых системах, то $X$ начнёт с 0 бит энтропии, потому что имеет только одно определённое состояние, $Y$ начнёт с 2 бит, потому что она с равной вероятностью может оказаться в любом из четырёх состояний. (Между $X$ и $Y$ нет общей информации). Немного физики, и вот, энтропия $Y$ стала 0, но энтропия $X$ стала равна $log_2 7 = 2,8 бит$. Таким образом, энтропия перешла из одной системы в другую и уменьшилась в подсистеме $Y$. Однако из-за каких-то сложностей мы не потрудились отследить часть информации, и, следовательно (с нашей точки зрения), общая энтропия увеличилась.

Предположим, существовал бы физический процесс, который преобразовывал бы прошлые состояния в будущие состояния следующим образом:

$$X_2Y_1 \rightarrow X_2Y_1$$
$$X_2Y_2 \rightarrow X_2Y_1$$
$$X_2Y_3 \rightarrow X_2Y_1$$
$$X_2Y_4 \rightarrow X_2Y_1$$

Такой физический процесс на самом деле уменьшал бы энтропию, потому что независимо от того, где бы вы начинали, вы оказывались бы в одном и том же месте. Законы физики с течением времени могли бы сжать фазовое пространство.

Однако существует теорема — она называется теоремой Лиувилля и её можно доказать для наших законов физики, — которая утверждает, что такого не может быть: фазовый объём сохраняется.

Второй закон термодинамики — это следствие теоремы Лиувилля. Не важно, насколько хитроумна ваша машина из колёс и шестерёнок. Всё равно вы никогда не сможете уменьшить энтропию в одной подсистеме, не увеличивая её где-то в другом месте. Когда фазовое пространство одной подсистемы сужается, фазовое пространство другой подсистемы должно расширяться, и совместное пространство будет иметь тот же объем.

Однако, изначально компактное фазовое пространство может со временем расползтись и рассредоточиться. Поэтому для того, чтобы нарисовать простую границу вокруг этого беспорядка, придётся описать гораздо большую область, чем в начале. Именно это создаёт впечатление, что энтропия увеличивается. (А в квантовых системах, где развитие разных вселенных идёт разными путями, энтропия действительно возрастает в любой локальной вселенной. Но пока что пропустим это усложнение.)

Второй закон термодинамики вероятностный по своей природе — если вы спросите насчёт вероятности того, что горячая вода спонтанно перейдёт в состояние «холодная вода и электричество», то ответ — такая вероятность действительно существует, просто она очень мала. Это не означает, что теорема Лиувилля с малой вероятностью нарушается, теорема — это теорема, в конце концов. Это означает, что если вы вначале находитесь в большом фазовом пространстве, но не знаете, где именно, вы можете оценить небольшую вероятность оказаться в каком-то конкретном объёме фазового пространства. Поэтому, с бесконечно малой вероятностью этот конкретный стакан горячей воды может быть таким, который самопроизвольно превратится в электрический ток и кубики льда. (Пренебрегая, как обычно, квантовыми эффектами).

Таким образом, второй закон термодинамики по своей природе действительно является байесовским. Когда мы рассуждаем о реальной термодинамической системе, второй закон термодинамики — абсолютно строгое утверждение о ваших убеждениях, касающихся этой системы, но вероятностное утверждение о самой системе.

«Постойте, — говорите вы. — На уроках физики меня учили по-другому. На лекциях нам рассказывали, что термодинамика — это вроде как о температурах. Неопределённость — это субъективное ощущение! Температура воды в стакане — объективное свойство воды! Какое отношение имеет тепло к вероятности?»

О, у вас маловато доверия.

С одной стороны, связь между теплотой и вероятностью относительно проста: если вы не знаете про стакан воды ничего, кроме его температуры, то у вас гораздо больше неопределённости насчёт стакана горячей воды, чем насчёт стакана холодной.

Тепло — хаотичное движение множества молекул, и чем горячее, тем быстрее движутся молекулы. Не все молекулы в горячей воде движутся с одинаковой скоростью: «температура» — это не равномерная скорость всех молекул, а средняя скорость, которая, в свою очередь, соответствует прогнозируемому статистическому распределению скоростей. Дело в том, что чем горячее вода, тем быстрее могут быть молекулы воды, и, следовательно, у вас больше неопределённости о скорости любой отдельной молекулы (и не забудьте о том, что скорость — это вектор) . Когда вы умножите свои неопределённости относительно всех отдельных молекул, вы получите экспоненциально большую неопределённость относительно всего стакана воды.

Теперь возьмём логарифм этого экспоненциального объёма неопределённости и назовём его энтропией. Как вы видите, всё сходится.

Если посмотреть с другой стороны, связь менее очевидна. Предположим, что о некотором стакане воды вы изначально знали только то, что его температура составляла 72 градуса. Затем, внезапно, Святой Лаплас раскрывает вам точные координаты и скорости всех атомов в воде. Теперь вы прекрасно знаете состояние воды, поэтому, по определению информационной энтропии, её энтропия равна нулю. Делает ли это его термодинамическую энтропию нулевой? Будет ли вода холоднее из-за нашего знания?

Игнорируя квантовые эффекты, ответ: да! Вода будет холоднее!

Максвелл однажды спросил: «Почему мы не можем взять сосуд с равномерно распределённым горячим газом, разделить его перегородкой на две части — A и B, и сделать так, чтобы из В в А переходили только быстрые молекулы, а из А в В — только медленные? Если построить такой разделитель, то на стороне А мы получим горячий газ, а на стороне В — холодный. Мы тогда смогли бы дёшево охлаждать продукты, верно?»

Агент, который проверяет каждую молекулу газа и решает, пропускать ли её, известен под именем «демон Максвелла». И причина, по которой вы не можете построить эффективный холодильник таким образом, заключается в том, что демон Максвелла генерирует энтропию, когда проверяет скорости молекул газа и решает, пропускать молекулу или нет.

Но предположим, что вы уже знаете, где находятся все молекулы газа.

Тогда вы действительно можете запустить демона Максвелла и извлечь из этого полезную работу.

Поэтому (опять же игнорируя квантовые эффекты на данный момент), если вы знаете состояния всех молекул в стакане горячей воды, в истинно термодинамическом смысле он холодный: вы можете забрать электричество из воды и оставить кубик льда.

Это не нарушает теорему Лиувилля, потому что если $Y$ — это вода, и вы — демон Максвелла (обозначим как $M$), физический процесс ведёт себя так:

$$M_1Y_1 \rightarrow M_1Y_1$$
$$M_2Y_2 \rightarrow M_2Y_1$$
$$M_3Y_3 \rightarrow M_3Y_1$$
$$M_4Y_4 \rightarrow M_4Y_1$$

Поскольку демон Максвелла знает точное состояние $Y$, это общая информация между $M$ и $Y$. Общая информация уменьшает энтропию связанной системы $(M,Y)$: $H(M,Y) = H(M) + H(Y) - I(M;Y)$. $M$ имеет 2 бита энтропии, $Y$ тоже имеет 2 бита энтропии, и общая информация - 2 бита, поэтому $(M,Y)$ имеет в сумме 2 + 2 - 2 = 2 бита энтропии. Физический процесс просто преобразует «холодность» (негэнтропию) общей информации, чтобы сделать холодной настоящую воду. После этого $M$ имеет 2 бита энтропии, $Y$ имеет 0 бит энтропии, а общая информация равна 0. Как видите, всё в порядке!

И не говорите мне, что знание «субъективно». Знание представлено в мозге, и это делает его таким же физическим, как и всё остальное. Для того чтобы $M$ физически представлял точную картину состояния $Y$, физическое состояние $M$ должно коррелировать с состоянием $Y$. Вы можете воспользоваться этим термодинамическим преимуществом - оно называется двигателем Сцилларда.

Или как заметил Эдвин Томпсон Джейнс: «Старая поговорка „Знание — сила“ очень правдива, причём как в человеческих отношениях, так и в термодинамике».

И наоборот, одна подсистема не может увеличить общую информацию с другой подсистемой, без 1) взаимодействия с ней и без 2) выполнения термодинамической работы.

В противном случае, вы могли бы создать демона Максвелла и нарушить второй закон термодинамики, что, в свою очередь, нарушило бы теорему Лиувилля, а это невозможно в стандартной модели физики.

Таким образом, чтобы сформировать точные убеждения о чём-то, вам совершенно необходимо за этим наблюдать. Это очень физический, очень реальный процесс: любой рациональный разум «работает» в термодинамическом смысле, а не только в смысле умственных усилий.

(Иногда говорят, что термодинамическая работа требуется для стирания битов при подготовке к новому наблюдению, но это различие — всего лишь вопрос терминов, математика процесса однозначна.)

(Здесь я пока не буду рассматривать вопрос открытия логических «истин» — в некоторой степени потому, что я пока размышляю, как это точно формализовать. В термодинамике знание логических истин не считается негэнтропией, как можно было бы ожидать, поскольку компьютер, способный выполнять обратимые вычисления, смог бы вычислять логические истины с любыми произвольно низкими затратами. Вышенаписанное относится к разуму, который знает о логике всё. Любой более простой ум обязательно будет менее эффективным.)

«Для формирования точных убеждений требуется соответствующее количество доказательств» — это очень убедительная истина как в человеческих отношениях, так и в термодинамике. Если бы слепая вера действительно работала как метод исследования, вы могли бы превратить тёплую воду в электричество и кубики льда. Просто создайте Демона Максвелла, который слепо верит в точные значения скоростей молекул.

Двигатели познания не так сильно отличаются от тепловых двигателей, хоть они и манипулируют энтропией более тонким образом, чем сжигание бензина. Например, они схожи тем, что двигатели познания не являются абсолютно эффективными, они должны излучать лишнее тепло, как его излучает двигатель автомобиля или холодильник.

Фраза «холодная рациональность» правдива в таком смысле, о котором голливудские сценаристы даже не могли и подумать (и неверна в том смысле, который они имели в виду).

Поэтому, если вы не можете сказать мне, какой именно шаг в вашем рассуждении нарушает законы физики, давая вам истинное знание незримого, то не ожидайте, что я поверю в то, что всё сложное умное рассуждение способно их нарушить.

Перевод: 
Geimverusagan, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
186
Оцените качество перевода: 
Средняя оценка: 3.9 (14 votes)

Убеждения о вечном двигателе

Элиезер Юдковский

Предыдущее эссе закончилось выводом:

Чтобы сформировать точные убеждения о чём-то, вам совершенно необходимо за этим наблюдать. Это очень физический, очень реальный процесс: любой рациональный разум «работает» в термодинамическом смысле, а не только в смысле умственных усилий… Поэтому, если вы не можете сказать мне, какой именно шаг в вашем рассуждении нарушает законы физики, давая вам истинное знание незримого, то не ожидайте, что я поверю в то, что всё сложное умное рассуждение способно их нарушить.

Главное следствие математической аналогии между термодинамикой и познанием: нельзя избежать ограничений, проистекающих из теории вероятностей. Сама вероятность может быть «субъективным убеждением», но законы, которым она подчиняется, твёрже стали.

В традиционной школе, когда учитель вам что-то говорит, вы обязаны в это поверить и повторить то, что он сказал, в ответ. Однако, когда вы слышите предположение от обычного ученика, вы не обязаны его учитывать. В итоге у многих область убеждений проецируется на область авторитета. В итоге люди думают, что определённые убеждения — это что-то вроде законов, которым нельзя не подчиняться, но вероятностные убеждения — это всего лишь предположения.

И, глядя на лотерейный билет, люди говорят: «Но ведь невозможно доказать, что я не выиграю?» При этом они подразумевают: «Пускай ты вычислил, что вероятность выигрыша мала. Но это всего лишь вероятность, а значит — это лишь предположение, и я могу верить в то, во что хочу».

Предложу простой эксперимент. Бросьте с размаху яйцо на пол. Закон, согласно которому яйцо не впрыгнет вам обратно в руки — вероятностный. Предположение, если угодно. Законы термодинамики вероятностные. То есть, они не могут быть настоящими законами, в том же смысле, в каком законом является «не убий». Так?

Почему же просто не проигнорировать такое предположение? Яйцо же соберётся само собой. Верно?

Если какая-то часть вас до сих пор настаивает, что убеждения, в которых присутствует неопределённость, не могут вас к чему-то обязывать, полезно подумать о яйце, которое, возможно, соберётся само собой.

Существует крошечный шанс, что яйцо соберётся обратно в скорлупу. Но вы не можете этого ожидать. Вы обязаны ожидать, что оно разобьётся. Для вас обязательно убеждение, что вероятность самопроизвольного восстановления яйца примерно равна нулю. Вероятности описывают неопределённость, но законы теории вероятностей — это теоремы.

Если вы сомневаетесь, попробуйте проигнорировать предположения термодинамики и уроните яйцо на пол пару дециллионов раз, ожидая, что оно соберётся обратно. Расскажите о результатах. Пусть вероятности — это субъективные убеждения, но законы, которые ими управляют, гораздо твёрже стали.

Один мой знакомый был уверен, что придумал как создать инерциоид из множества колёс и шестерёнок. У него была табличка в Экселе с доказательством, которую он, разумеется, не мог показать, поскольку всё ещё дорабатывал свою систему. В классической механике можно доказать, что нарушить закон сохранения импульса невозможно. Поэтому любая табличка в Экселе с расчётами, согласующимися с правилами классической механики, неизбежно покажет, что создать инерциоид невозможно. Разве что машина окажется настолько сложной, что её автор ошибётся в вычислениях.

Аналогично, когда люди, овладевшие рациональностью наполовину (или на одну десятую), забывают об искусстве и пытаются поверить, не имея свидетельств, «всего лишь разочек», они часто нагромождают оправдания и тем самым запутывают себя так, что перестают видеть шаг, в котором происходит магия.

Определить, где именно в их рассуждениях происходит магия, обычно довольно сложно: когда их начинают расспрашивать, их аргументы нередко видоизменяются и ускользают. Однако всегда есть какой-то шаг, где крошечная вероятность превращается в значительную. Именно в этом месте они пытаются поверить, не имея свидетельств. Именно в этом месте они шагают в неведомое с мыслью «вы не можете доказать, что я не прав».

Их ноги проваливаются в пустоту, ведь в царстве Возможного гораздо больше пустого пространства, чем твёрдой почвы. Ах, но ведь в мире возможного эта почве всё же существует (и её бесконечно мало), так что действительно существует (бесконечно малая) вероятность наткнуться на неё случайно. Так что, возможно, именно в этот раз ваша нога попадёт куда надо. Это ведь всего лишь вероятность, так что это всего лишь предположение.

Пусть вам неизвестно точное состояние воды в стакане с кипятком. Да, именно ваше незнание этого точного состояния делает кинетическую энергию молекул «теплом», а не работой, которую можно использовать, как в случае вращающегося маховика. Поэтому с вероятностью, примерно равной нулю, вода может охладить вашу руку, а не нагреть.

Проигнорируйте термодинамику, суньте руку в кипяток и вы обожжётесь.

«Но ты не знаешь наверняка!»

Я не знаю наверняка, но я обязан ожидать, что это произойдёт. Законы теории вероятностей — это логические истины (пускай сами вероятности таковыми и не являются).

«Но что если я угадаю состояние кипящей воды и угадаю правильно?»

Вероятность угадать правильно даже меньше, чем вероятность охлаждения вашей руки кипятком.

«Но ты не можешь доказать, что я угадаю неправильно!»

Я могу (и вообще говоря, должен) назначить этому событию экстремально низкую вероятность.

«Это не то же самое, что и уверенность.»

Эй, может быть, если добавить достаточно колёс и шестерёнок в ваши рассуждения, то тёплая вода превратится в электричество и ледяные кубики! Но скорее всего вы просто перестанете понимать, почему этого не может быть.

«Действительно! Я не понимаю, почему этого не может быть! Так что, не исключено, так и будет!»

Ещё одна шестерёнка? Ваш механизм становится всё менее эффективным. Он и раньше не был вечным двигателем, а каждая дополнительная шестерёнка снижает его эффективность ещё сильнее.

Любая новая деталь в ваших рассуждениях неизбежно уменьшает общую вероятность. Вероятность того, что вы можете засунуть палец в кипяток и не обжечься, благодаря тому, что вы неизвестным образом нарушили второй закон термодинамики и, не имея свидетельств, угадали точное состояние кипящей воды, обязательно будет меньше, чем просто вероятность засунуть палец в кипяток и не обжечься.

Я проговариваю всё это, потому что люди, пытаясь поверить, не имея свидетельств, на самом деле сооружают огромные конструкции из аргументов. И нужно научиться видеть, что они в этом очень похожи на изобретателя, который добавлял к своему инерциоиду всё больше и больше шестерёнок, пока в его расчёты не закралась ошибка.

Перевод: 
sepremento, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
187
Оцените качество перевода: 
Средняя оценка: 5 (10 votes)

Поиск байесовской структуры

Элиезер Юдковский

Штурвалы1 гномов не могут работать. Кажется, сама их конструкция противоречит законам магии. По сути, гномьи штурвалы невозможны. В них встроено множество прибамбасов и наворотов — как и в практически любые творения гномьего разума, — но это не слишком способствует реальной ценности. В работающем гномьем штурвале почти всегда спрятан обычный небольшой штурвал, внешне безобидный и ненужный.

Правила для кампании по миру «Spelljammer»

Мы уже выяснили, что знание подразумевает общую информацию между разумом и его окружением, а также выяснили, что эта общая информация равна негэнтропии (именно в физическом смысле): если вы знаете, где находятся молекулы и с какой скоростью они движутся, то вы можете превратить тепло в работу с помощью демона Максвелла / двигателя Силарда.

Мы выяснили, что формирование истинных убеждений при отсутствии свидетельств невероятно в той же степени, что и превращение стакана горячей воды в кубики льда и электричество. Рациональность требует «работы»: не только в смысле усилия мысли, но и в термодинамическом смысле. Любой разум, не являющийся абсолютно эффективным, должен излучать тепло. Когнитивная работа подчиняется теории вероятностей, частным случаем которой является термодинамика. (Статистическая физика — это подвид статистики.)

Если вы видите машину, которая не подключена к розетке или иному источнику энергии, но которая крутит колесо, вы начнёте искать спрятанную батарейку или иной источник энергии неподалёку. Совершаемая работа должна как-то объясняться без нарушения законов физики.

Поэтому если разум производит истинные убеждения и мы предполагаем, что второй закон термодинамики нигде не нарушается, этот разум обязан производить что-то похожее на байесианские вычисления. Должен присутствовать хотя бы один процесс со структурой, похожей на байесианскую. Иначе разум никак не смог бы работать.

Изначально, в момент Т = 0 у разума нет общей информации с подсистемой S в его окружении. В момент Т = 1 у разума есть 10 бит общей информации с S. Где-то посредине разум должен был столкнуться со свидетельством — причём именно со свидетельством в байесовском понимании, ведь любое байесианское свидетельство — это общая информация, а любая общая информация — байесианское свидетельство, это просто разные названия одного и того же явления. Затем разум должен был обработать это свидетельство хотя бы частично, возможно, неэффективно, и обработать хоть как-то в соответствии с Байесом. Разум обязан был хотя бы немного двигаться согласно Байесу, ведь в противном случае он создал бы общую информацию из ничего и тем самым нарушил бы второй закон термодинамики.

На самом деле на любом этапе когнитивный процесс, который помогает найти истину, должен иметь хоть в какой-то степени байесовскую структуру. В той или иной точке он должен входить в гармонию с Байесом, обязан соответствовать байесовскому потоку, пусть и зашумлённому, пусть со множеством прибамбасов и наворотов. Да, эта байесовская структура может оказаться очевидной лишь в контексте окружающих процессов. Но без неё этот когнитивный процесс окажется бессмысленным.

Сколько философов билось над природой слов! Сколько чернил истрачено на истинные определения слов, на истинное значение определений и на истинное значение значения! Какие нагромождения из колёс и шестерёнок построили философы ради этих объяснений! И всё это было скрытой формой байесовского вывода!

Я был слегка разочарован, что никто из слушателей не подпрыгнул и не сказал: «Да! Точно! Конечно! Всё время это был Байес!»

Однако, возможно, разглядеть хитро спрятанного Байеса, внешне выглядящего совершенно не так как Байес, вовсе не так увлекательно, если: а) вы не распутываете клубок тайны самостоятельно, а лишь читаете о том, как это кто-то сделал (Ньютону изучать матанализ было гораздо веселее, чем современным студентам), и б) вы не понимаете, что поиск скрытой байесовской структуры есть гигантский, сложный, постоянный квест вроде поиска Святого Грааля.

Для каждой грани сознания квест всегда свой, однако Грааль всегда оказывается одним и тем же. Впрочем, это должен быть правильный Грааль и Грааль целиком, без потерянных деталей. Поэтому каждый раз нужно искать весь ответ целиком, какую форму бы он ни принял, а не пытаться искусственно создавать рукомахательные граалеподобные аргументы. Если всё сделано правильно, только тогда в конце вы обнаружите всё тот же Святой Грааль.

Раньше мне пеняли, что я пишу длинные эссе, в которых «не даю ясно понять, к чему я веду», и потому наверняка теряю некоторых читателей…

…но в подобных случаях совсем не просто объяснить людям, к чему я веду.

Практически бесполезно знать, что познание по сути своей байесовское, если вы не понимаете, каким именно образом оно байесовское. Если вы не видите отчётливо поток вероятностей, то вы всего лишь знаете пароль. Ну ладно, на самом деле у вас есть подсказка к ответу, но это далеко ещё не ответ. Именно поэтому нельзя просто воскликнуть «Байес!», а нужно уходить в Великий Поиск Тайной Байесовской Структуры. Структура часто погребена под огромным количеством ширм, скрыта за нагромождением колёс и шестерёнок, спрятана за множеством прибамбасов и наворотов.

Осознать Поиск Святого Байеса непросто. Вы узнаёте о феномене мышления XYZ, который выглядит очень полезным. Множество философов спорили веками о его природе, да и до сих пор спорят. Множество специалистов по ИИ пытаются заставить компьютер его повторить, но они тоже пока не договорились об описании с точки зрения философии…

И… Вот те на! Внешне казалось, что этот феномен мышления не имеет никакого отношения к Байесу. Но какую-то лежащую в его основе структуру можно трактовать на языке Байеса… Погодите, тут всё равно есть какая-то полезная работа, которая на языке Байеса не объясняется… Хотя нет, она тоже байесовская… О, Боже мой, вот этот совершенно иной процесс мышления, который тоже внешне не выглядел байесовским тоже байесовский по своей структуре… Секундочку, а вот эти небайесовские части вообще что-нибудь делают?

  • Да: Ух ты, они тоже байесовские!
  • Нет: О небеса, почему всё устроено так по-дурацки! Я мог бы съесть пригоршню аминокислот и отрыгнуть строение мозга лучше.

После нескольких повторений можно уловить некоторый ритм. Именно о ритме я и говорю.

Но говорить о ритме — это всё равно что танцевать архитектуру.

Отсюда и возникла загвоздка с тем, как объяснить заранее, к чему я веду. По своему опыту я знаю, что произнеси я: «Байес — это тайна Вселенной!», то некоторые люди ответят: «Да! Байес и есть тайна Вселенной!», а другие хмыкнут: «Ну и узколобый же ты! Взгляни на все эти специализированные, но удивительно полезные методы вроде регуляризации линейной регрессии, которыми я пользуюсь

Я надеялся, что если привести конкретный пример «чего-то не байесовского на поверхности, но оказывающегося байесовским в итоге», а заодно объяснить разницу между паролем и знанием, а ещё объяснить разницу между инструментами и законами, то, возможно, я смогу объяснить, как понять этот ритм так, чтобы читателю не пришлось уходить в этот поиск лично.

Разумеется, это далеко не все тайные знания Байесовского Заговора. Однако больше я пока сообщить не могу. Кроме того, секрет целиком известен лишь Совету Байеса, и если бы я его выдал, вас пришлось бы принять.

Уметь заглянуть под сиюминутную поверхность процесса мышления и увидеть под ней байесовскую структуру, воспринимать потоки вероятностей и знать не только о том, что это мышление тоже байесовское, но и понимать, почему, а также почему именно таким оно должно быть, чувствовать Силу, лежащую в основе мышления — именно в этом и заключается Байесовское Видение.

— И королева Кашфы видит оком Змея?

— Не знаю, видит ли она им. Пока она лишь оправляется после операции. Но это интересная мысль. Что она сможет узреть, если будет видеть им?

— Чистые, холодные линии вечности, полагаю. То, что под Тенью.

Роджер Желязны, «Принц Хаоса»2

  • 1. Штурвалом (англ. helm) в фэнтезийном мире Spelljammer называется устройство, позволяющее переводить магическую энергию в движение. Штурвал обычно выглядит в виде трона. — Прим. перев.
  • 2. Автор ссылается на издание Roger Zelazny, «Prince of Chaos» (Thorndike Press, 2001). Использован перевод Е. Р. Волковыского. — Прим.перев.
Перевод: 
sepremento, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
188
Оцените качество перевода: 
Средняя оценка: 3.9 (8 votes)

Основы редукционизма

Как разобрать реальность на составные части? И как жить в такой вселенной, где мы всегда жили, но без разочарования из-за того, что сложные вещи состоят из простых вещей.

Автор: 
Элиезер Юдковский

Распутывание вопроса

Элиезер Юдковский

«Если дерево падает в лесу, и нет никого рядом, чтобы это услышать, — создаёт ли дерево звук?»

Я не отвечал на этот вопрос. Я не выбирал позицию «да» или «нет» и не защищал её. Вместо этого, я разобрался с тем, как человек обрабатывает слова, даже нарисовал схематическую иллюстрацию нейронной сети. В конечном итоге, я надеюсь, не осталось не только вопроса, но даже ощущения вопроса.

У множества философов, особенно у философов-любителей и философов древнего мира, есть опасный инстинкт: они пытаются ответить на любой заданный вопрос.

Например: «Есть ли у нас свобода воли?»

Опасный инстинкт философии состоит в том, чтобы выдвинуть аргументы «за» и «против», взвесить их, опубликовать их в престижном философском журнале и, наконец, заявить: «да, у нас точно есть свобода воли» или «нет, у нас точно нет свободы воли».

Некоторые философы достаточно мудры, чтобы вспомнить, что большинство философских диспутов в действительности являются спорами о смысле слова или вокруг путаницы, возникшей в результате использования разных смыслов одного слова в разных местах. Такие философы пытаются наиболее точно определить то, что они подразумевают под «свободой воли», и затем возвращаются к вопросу «Есть ли у нас свобода воли? Да или нет?».

Ещё более мудрый философ может заподозрить, что замешательство, вызванное словами «свобода воли» показывает, что понятие ущербно само по себе. Тогда он пускается путём Традиционного Рационалиста. Такой философ начинает рассуждать о том, что понятию «свобода воли» присущи самопротиворечивость или бессмысленность, потому что она не имеет никаких проверяемых последствий. А затем публикует эти сокрушительные замечания в престижном философском журнале.

Но обосновав своё замешательство вы не устраните причину проблемы. Замешательство никуда не денется. Доказательство бессмысленности вопроса поможет не более, чем ответ на него.

Инстинкт философа — найти и занять такую позицию в диспуте, которую проще всего защищать, опубликовать её и пойти дальше. Но «наивный», инстинктивный взгляд — это свойство человеческой психологии. Можно доказывать, что свобода воли невозможна, пока не погаснет Солнце, но это не даст ответа на вопрос из области когнитивистики: если свободы воли не существует, то что происходит в голове человека, который считает, что обладает ею? И это вовсе не риторический вопрос!

Люди думают, что у них есть свобода воли — это факт человеческой психологии. Поиски позиции в диспуте, которую проще всего защищать, не изменят и не объяснят этот психологический факт. Философия может привести вас к отказу от концепции, но отказ от концепции — это не то же самое, что и понимание когнитивных алгоритмов, порождающих эту концепцию.

Можно взглянуть на Стандартный Диспут на тему «Если дерево падает в лесу, и нет никого рядом, чтобы это услышать, — создаёт ли дерево звук?», и поступить в стиле Традиционного Рационалиста — отметить факт, что спорщики не ожидают каких-либо расхождений в наблюдениях, и ликующе объявить, что спор бессмыслен. В данном случае это действительно так, но остаётся вопрос из области когнитивистики: почему спорщики вообще сделали эту ошибку?

Ключевая идея программы изучения эвристик и предвзятостей в том, что ошибки, которые мы делаем, чаще говорят гораздо больше о наших когнитивных алгоритмах, нежели о правильных ответах. Так (однажды спросил я сам себя) каким должно быть устройство разума, чтобы впадать в ошибку спора о деревьях, падающих в безлюдных лесах?

Когнитивные алгоритмы, которые мы используем, — это наш способ воспринимать мир. И эти когнитивные алгоритмы могут не точь-в-точь соответствовать реальности. Они могут не соответствовать даже макроскопический реальности, не говоря уж об истинных кварках. Эти когнитивные алгоритмы могут порождать искажённое восприятие мира.

Например, может существовать обособленный узел в центре нейронной сети, который не соответствует ни реальному явлению, ни какому-либо реальному свойству реального явления, встречающемуся в реальном мире. Существование подобных узлов зачастую оправдано тем, что с их помощью мы можем упрощать вычисления» (Метафорически говоря. На самом деле, человеческая нейробиология гораздо сложнее.)

Этот обособленный узел оставляет ощущение нерешённого вопроса, даже после того, как были получены ответы на все подвопросы, на которые только можно было ответить. Не важно, как сильно кто-то старается доказать, что ответ никак не повлияет на ожидаемый опыт — вы всё равно продолжаете задаваться вопросом «И всё же, производит падающее дерево звук или нет?».

Но все вопросы будут сняты, как только вы поймёте в деталях, почему и как ваш мозг создаёт это чувство вопроса, как только вы осознаете, что чувство неотвеченного вопроса соответствует иллюзорному центральному узлу нейронной сети, который не знает, возбуждаться ему или нет, несмотря на то, что все окружающие его узлы уже перешли в определённые состояния. Или ещё лучше, если вы поймёте принципы работы наивного байесовского метода. Не останется ни тянущегося чувства замешательства, ни неясного ощущения неудовлетворённости.

Если же тянущееся чувство наличия неотвеченного вопроса остаётся, или кажется, что вы заговариваете себе зубы, то это знак, что вы не разложили вопрос. Неясное ощущение неудовлетворённости должно предостерегать не хуже окрика. От вопроса, который действительно был распутан и разложен на составляющие, не остаётся ничего.

Ликующе-громогласное отрицание свободы воли, абсолютно неоспоримое доказательство того, что свобода воли не может существовать, кажущееся вполне удовлетворяющим — это крики «ура!» домашней команде(english). В таком случае можно и не заметить, что с точки зрения когнитивистики так и не было получено удовлетворительного объяснения, описывающего по шагам то, как возникает каждое интуитивное ощущение.

Может даже захотеться не признавать своё непонимание, ведь это будет восприниматься как очки не в пользу вашей команды. Если признать во время разноса неразумных верований в свободу воли, что осталось что-то неразъяснённое, то это может показаться уступкой противнику.

Так можно когда-нибудь прийти к какому-нибудь само собой разумеющемуся(english) утверждению из области эволюционной психологии. Например, что древние племена, верившие в свободу воли, были более склонны иметь позитивные взгляды на мир и, следовательно, иметь большее потомство, чем другие племена — что, разумеется, полная чушь. Говорящий так утверждает, что мозг создаёт иллюзию свободы воли, но не объясняет, как именно мозг это делает. Можно попытаться победить оппозицию, подрывая её посылки, но в таком объяснении иллюзия свободы воли принимается как свершившийся факт. Сама же иллюзия так и не была разобрана на части.

Представьте, что в Стандартном Диспуте о дереве, падающем в безлюдном лесу, вы сначала показали, что нет никакой разницы в ожиданиях, а затем стали размышлять: «Возможно, что те люди, которые говорили о бессмысленности споров, воспринимались как согласившиеся с правотой оппонента и теряли свой социальный статус. Поэтому среди нас закрепился инстинкт спорить о смысле слов». Это утверждение о том, что замешательство существует и объяснение-почему оно возникает. Взгляните теперь на структуру нейронной сети в эссе «Ощути смысл» – это объяснение-как, разбор замешательства на более мелкие части, каждая из которых не вызывает замешательства сама по себе. Поняли разницу?

Найти хорошую гипотезу о когнитивных алгоритмах (или хотя бы гипотезы, которые не развалятся за полсекунды) — гораздо сложнее, чем просто опровергнуть философское замешательство. В самом деле, это это совершенно иное искусство. Держите это в уме, и будете меньше смущаться, произнося слова «Я знаю, что то, что вы говорите, не может быть истиной, и я могу доказать это. Но я не могу написать блок-схему, которая покажет, как ваш мозг совершает ошибку, и это значит, что мне нужно продолжать разбираться».

Я говорю это, потому что иногда мне кажется, что как минимум 20% реальной эффективности тренированного рационалиста проистекает из того, что он не останавливается слишком рано. Если вы продолжите задавать вопросы, то рано или поздно вы доберётесь до пункта назначения. И наоборот, вы не доберётесь, если слишком рано решите, что ответ найден.

Важнее всего заметить своё замешательство. Даже если оно еле заметно. Даже если кто-то рядом с вами настаивает, что у людей есть свобода воли, и ухмыляется, а то, что вы не знаете в точности, как именно работают когнитивные алгоритмы, ничем не может помочь справиться с ужасающей глупостью его мнения.

Но, когда вы разобрали когнитивный алгоритм на детали в достаточной мере для того, чтобы проследить весь процесс мысли шаг за шагом и описать, как возникает каждое интуитивное восприятие — то есть, разобрать замешательство на более мелкие части, которые сами по себе не вызывают замешательства — то вы справились с вопросом.

Будьте готовы к тому, что вы можете поверить в то, что вы справились, когда на самом деле вы всего лишь ликующе опровергли ошибку.

Но когда вы действительно справитесь, вы узнаете об этом. Распутывание вопроса вызывает чувство, которое вы ни с чем не спутаете, после того как столкнётесь с ним впервые, и столкнувшись с ним, решите не попадать впросак снова. Спящие не знают, что они спят, но когда вы проснётесь, вы поймёте, что не спите(english).

То есть: когда вы справились с задачей, вы узнаете, что вы с ней справились, но, к сожалению, не наоборот.

Вот домашнее задание: в соответствии с тем, как алгоритм ощущается изнутри, определить, как устроен когнитивный алгоритм, которым порождён приведённый выше спор о «свободе воли».

Ваша задача не спорить о том, есть ли у людей свобода воли или нет.

Ваша задача не рассуждать о том, совместима ли свобода воли с детерминизмом или нет.

Ваша задача не доказывать, что вопрос плохо поставлен, или что концепция противоречива, или что нет проверяемых следствий.

Вам не следует придумывать эволюционное объяснение тому, как размножались люди, верившие в свободу воли, или рассуждать о том, что концепция свободы воли выглядит подозрительно совпадающей с некоторым искажением X. Всё это будет всего лишь объяснением-почему люди верят в «свободу воли», а не объяснением-как они это делают.

Ваше домашнее задание — проследить и выписать список вызовов функций1 внутренних алгоритмов человеческого ума, по мере того, как ими порождается интуиция, питающая весь этот чёртов философский спор.

Это один из первых настоящих вызовов, с которым я, как целеустремлённый рационалист, когда-то столкнулся. Относительно прочих эта головоломка довольно проста. Пусть она послужит и вам.

  • 1. В оригинале «stack trace» – Прим.перев.
Перевод: 
kuuff
Номер в книге "Рациональность: от ИИ до зомби": 
189
Оцените качество перевода: 
Средняя оценка: 4.2 (10 votes)

Неверные вопросы

Элиезер Юдковский

Когда мозг вгрызается в проблему под неверным углом, он начинает задавать «неверные вопросы» — вопросы, на которые невозможно дать ответ в терминах вопроса. Такие вопросы можно лишь распутать, разложить на составляющие, выяснив какой когнитивный алгоритм порождает «ощущение» вопроса, и каким образом он это делает.

Отличным намёком на то, что вы столкнулись с «неверным вопросом» является то, что вы не можете даже представить какое-нибудь определённое специфическое устройство мира, которое бы дало ответ на этот вопрос. Когда такое случается, не видно самой возможности найти ответ.

Возьмите, например, Стандартный Спор об Определениях о дереве, падающем в заброшенном лесу. Можно ли представить себе какое-нибудь устройство этого мира, какое-нибудь положение дел, при котором слово «звук» действительно означает только акустические вибрации или действительно означает только пережитый опыт восприятия звука?

(Кто-то может сказать: «Да, это такое положение дел, при котором слово «звук» означает акустические вибрации». В таком случае, табуируйте слова «означает», «представляет» и все похожие синонимы, и попробуйте описать заново: каким должен быть мир, чтобы одна из сторон была бы права, а другая ошибалась?)

Или, если это кажется слишком просто, рассмотрите свободу воли: какое конкретное положение дел — в детерминированной физике или в физике со случайным компонентом — может соответствовать наличию свободы воли?

Если же и это выглядит слишком просто, то рассмотрите вопрос «Почему всё существует?» и расскажите мне, как может выглядеть удовлетворительный ответ на этот вопрос.

На всякий случай отмечу: я не знаю ответа на последний вопрос. Но (основываясь на моём предыдущем опыте столкновений с вопросами без ответов) я могу предположить. Ответ не включает в себя великую и триумфальную Первопричину. Вопрос растворится в результате какого-то озарения о том, как алгоритмы мышления проскочили мимо реальности, после чего я пойму, почему вопрос был ошибочным с самого начала; я увижу, как ошибка алгоритмов отразилась в вопросе.

Загадка существует в голове, вовсе не в реальности. Если я не знаю о каком-либо явлении, то это говорит о состоянии моего ума, не о самом явлении. И более того, если невозможно представить себе существование ответа, то это означает, что замешательство существует на карте, не на территории. Вопросы без ответов не отмечают те места, где магия проникает во вселенную. Они помечают места, где ваш разум «промахивается» мимо реальности, где он искажает её.

Некоторые вопросы должны быть распутаны. Плохие вещи случатся, когда вы пытаетесь ответить на них. Такие попытки неизбежно порождают наихудший сорт таинственных ответов на таинственные вопросы, тот, который даёт выглядящие сильными аргументы для вашего Таинственного Вопроса, но «ответ» не позволяет вам делать каких-либо новых предсказаний даже задним числом, и явление продолжает носить ту же священную необъяснимость, которую оно имело с самого начала.

Я могу предположить, как мог бы выглядеть ответ на загадку Первопричины: ничто не существует, сама концепция существования ошибочна. Но если вы искренне поверите в это, то уменьшит ли это ваше замешательство? Вряд ли. И мне тоже это не помогает.

Но у вопросов без ответа есть одно замечательное свойство: они всегда разрешимы (по-крайней мере все, с которыми я сталкивался, имели это свойство). Какая мысль первой пришла в голову Королеве Елизавете I, первая её мысль с утра, когда она проснулась в её сороковой день рождения? В то время, как я могу представить себе возможные ответы на этот вопрос, я с готовностью вижу, что я, быть может, никогда не смогу фактически на него ответить — истина была утеряна во времени.

С другой стороны, вопрос «Почему всё существует?» выглядит настолько невозможным, что я могу сделать вывод, что я в замешательстве, а значит, вероятно, истина далеко не столь переусложнена в абсолютном смысле, и я смогу её увидеть, как только озадаченность уйдёт.

Это может выглядеть контринтуитивным, если вам не доводилось решать вопрос без ответа, но я заверяю вас, что именно так всё и есть.

Ждите завтра: простой трюк для работы с «ошибочными вопросами».

Перевод: 
kuuff
Номер в книге "Рациональность: от ИИ до зомби": 
190
Оцените качество перевода: 
Средняя оценка: 5 (3 votes)

Исправление неверного вопроса

Элиезер Юдковский

Когда вы сталкиваетесь с безответным вопросом — с вопросом, на который кажется невозможным даже представить ответ — существует простой приём, который может сделать вопрос решаемым.

Сравните:

  • Почему у меня есть свобода воли?
  • Почему я думаю, что у меня есть свобода воли?

У второго вопроса есть очень приятное свойство: он гарантированно имеет самый настоящий ответ, вне зависимости от того, существует ли свобода воли или нет. Задавая себе вопрос «почему у меня есть свобода воли?» или «есть ли у меня свобода воли», вы начинаете искать ответ в деталях физических законов, которые настолько удалены от макроскопического уровня, что вы даже не можете их увидеть невооружённым взглядом. То есть, вы спрашиваете «почему существует X», в то время как X может вообще не иметь отношения к делу, не говоря уж о том, что он может не иметь места.

В то же время, вопрос «почему я думаю, что у меня есть свобода воли» гарантированно имеет ответ. Вы в действительности верите в свободу воли. Эта вера выглядит гораздо более цельной и понятной, чем эфемерность свободы воли. И в действительности существует некая цельная цепочка когнитивных причин и следствий, ведущих к этой вере.

Если вы уже переросли вопросы свободы воли, то выберите что-нибудь на замену:

  • «почему время движется вперёд, а не назад» против «почему я думаю, что время движется вперёд, а не назад»
  • «почему я родился собой, а не кем-нибудь ещё» против «почему я думаю, что я родился собой, а не кем-нибудь ещё»
  • «почему я обладаю сознанием» против «почему я думаю, что обладаю сознанием»
  • «почему реальность существует» против «почему я думаю, что реальность существует?»

Прелесть метода в том, что он работает вне зависимости от того, содержит ли вопрос в себе замешательство или нет. Я набираю эти слова, и на моих ногах одеты носки. Я могу спросить «почему на моих ногах надеты носки» или «почему я думаю, что на моих ногах надеты носки». Допустим, я задал второй вопрос. Отслеживая назад причинно-следственную цепочку я выясню, что:

  • я думаю, что на моих ногах надеты носки, потому что я вижу носки на ногах;
  • я вижу носки, потому что моя сетчатка посылает сигналы о носках зрительной коре моего головного мозга;
  • моя сетчатка посылает сигналы о носках, потому что свет проецируется на сетчатку в форме носков;
  • свет проецируется на сетчатку в форме носков, потому что он отражается от носков, которые надеты на мои ноги;
  • он отражается от носков, потому что надеты носки;
  • носки надеты, потому что я их надел;
  • я надел носки, потому что полагал, что иначе моим ногам будет холодно;
  • и так далее.

Отслеживая назад причинно-следственную цепочку шаг за шагом, я выясняю, что моя вера в то, что на моих ногах надеты носки, полностью объясняется тем, что на моих ногах надеты носки. Это правильно, так и должно быть, потому что вы не можете получить информацию о чём либо, не взаимодействуя с ним.

С другой стороны, если я вижу мираж озера в пустыне, то правильное причинное объяснение моего видения не будет включать в себя факт наличия настоящего озера в пустыне. В этом случае, моя вера в существование озера не просто объясняется, но разобъясняется.

Но в любом случае вера оказывается реальным явлением, имеющим место в реальном мире: психологические события — тоже события, и их причинно-следственная история может быть отслежена назад к исходной причине, вызвавшей их.

Вопрос «откуда взялось озеро посреди пустыни» может остаться без ответа, если на самом деле нет никакого озера, которое нужно объяснять. Но «почему я ощущаю озеро посреди пустыни» всегда можно объяснить тем или иным образом.

Возможно кто-нибудь увидит возможность показаться умным и скажет «Хорошо. Я верю в свободу воли потому, что у меня есть свобода воли». Конечно же, всё не столь просто.

Моё восприятие носков на моих ногах — это событие в зрительной коре головного мозга. Работа зрительной коры может быть исследована когнитивистикой и не должна вызывать замешательства.

Моя сетчатка воспринимает свет, и это не какой-то мистический процесс возникновения ощущения, не магический детектор носков, который срабатывает в присутствии носков необъяснимым образом. Это работа механизмов, которые могут быть объяснены в рамках биологии. Фотоны падают на сетчатку, и это можно объяснить в рамках оптики. Отражение света носками можно объяснить в рамках электромагнетизма и химии. Охлаждение моих ног можно объяснить в рамках термодинамики.

Таким образом, всё несколько сложнее, чем заявить «я верю в свободу воли потому, что она у меня есть». Вам придётся разбить причинно-следственную цепочку на отдельные звенья, и объяснить каждое в терминах, которые сами по себе не вызывают замешательства.

Взаимодействие сетчатки с носками вполне понятно и может быть объяснено в терминах компонентов, типа фотонов и электронов, которые не вызывают замешательства. Где в мозге находится детектор свободы воли, и как он определяет наличие или отсутствие свободы воли? Как детектор взаимодействует с детектируемым событием и какова механика этого взаимодействия?

Если ваша вера не проистекает из действительных наблюдений реального явления, мы рано или поздно выясним этот факт, если начнём отслеживать причинно-следственную цепочку, ведущую к вашей вере.

Если вы действительно замечаете своё замешательство, то отслеживание причинно-следственной цепочки найдёт тот алгоритм, который искажает реальность.

В любом случае, вопрос гарантированно имеет ответ. Более того, есть отличное и вполне определённое место, с которого можно начать отслеживать свои убеждения, место, находящееся непосредственно в вашей голове.

Когнитивистика, быть может, не выглядит настолько возвышенно, как метафизика. Но, по-крайней мере, вопросы когнитивистики решаемы. Поиск ответа может не быть простым, но, по-крайней мере, ответ существует.

А, и да: мысль о том, что когнитивистика не столь возвышенна и восхитительна как метафизика элементарно не верна. Я надеюсь, что некоторые читатели начинают замечать это.

Перевод: 
kuuff
Номер в книге "Рациональность: от ИИ до зомби": 
191
Оцените качество перевода: 
Средняя оценка: 4.4 (10 votes)

Ошибка проецирования ума

Элиезер Юдковский

Картинка с монстром и женщиной
В дни зарождения научной фантастики инопланетные захватчики могли при случае похитить девушку в порванном платье и утащить её с намерением изнасиловать, что было с любовью изображено на многих старых обложках журнала. Несколько странно, что при этом инопланетяне никогда не охотились за мужчинами в порванных рубахах.

Будет ли негуманоидный пришелец с совершенно иной эволюционной историей и эволюционной психологией воспринимать человеческую самку сексуально привлекательной? Это выглядит, как минимум, весьма маловероятным.

Люди не совершают подобных ошибок, когда делают выводы обдуманно. «Все возможные разумы, скорее всего, устроены, в общем, похожим образом, поэтому монстр с фасеточными глазами сочтёт человеческую самку привлекательной». Вероятно, художник даже не задумался о вопросе, будет ли пришелец воспринимать человеческих самок привлекательными. Вместо этого: «человеческая самка в порванном платье сексуальна» — это им свойственно, это их существенное, неотъемлемое и врождённое свойство.

Тот, кто совершил ошибку, не думал об эволюционной истории пришельцев, они фокусировались на порванном платье женщины. Если бы платье не было бы порвано, то женщина была бы менее сексуальна, монстр-пришелец не заинтересовался бы ею.

Очевидно, что мы инстинктивно представляем Сексуальность как прямой атрибут объекта Женщина, типа Женщина.сексуальность, так же как и Женщина.высота, Женщина.вес.

Если мозг использует эту структуру данных или какую-то метафорически схожую, то изнутри кажется, что сексуальность — это врождённое свойство женщины, а не свойство пришельца, который разглядывает женщину. Женщина привлекательна, а значит монстр будет испытывать влечение к ней — логично, не так ли?

Э. Т. Джейнс использовал термин ошибка проецирования ума, чтобы обозначить ошибку проецирования свойств ума наблюдателя на внешний мир. Джейнса — ныне покойного гроссмейстера Байесовского Заговора — больше всего заботило неверное обращение с вероятностями как врождёнными свойствами объектов, нежели с состоянием частичного знания в некоем конкретном уме.

Но ошибка проецирования ума проявляет себя не только по отношению к вероятностям. Это аргумент против спора о настоящем значении слова «звук», против изображения на обложке журнала монстра несущего женщину в порванном платье, против заявления Канта о том, что пространство плоское по своей природе1, против определения, которое дал Юм априорным идеям, которые «порождаются исключительно работой ума, вне зависимости от существания чего-либо во вселенной».

(Как-то раз я читал в научной фантастике рассказ про самца человека, который имел сексуальные отношения с разумным инопланетным растением, имеющим соответствующе мягкие листья, и впоследствии внезапно обнаружившем, что это был мужской экземпляр растения. Некоторое время мужчина переживал из-за этого, но в конечном итоге решил, что это уже не имеет никакого значения. И у Фоглио с Полоттой во «Внезапном вторжении» люди высаживаются на планету, населённую разумными насекомыми, и видят трейлер показывающий человека, который утаскивает жука в пикантном шёлковом платье. Просто вдруг вспомнилось.)

  • 1. В оригинале «space by its very nature is flat». — Прим. перев.
Перевод: 
kuuff
Номер в книге "Рациональность: от ИИ до зомби": 
192
Оцените качество перевода: 
Средняя оценка: 4.8 (9 votes)

Вероятность находится в голове

Элиезер Юдковский

Вчера я говорил об ошибке проецирования ума, рассматривая пример монстра-пришельца, который уносил девушку в порванном платье, об ошибке, которую я приписал тому, что художник думал о сексуальности женщины как о свойстве самой женщины, женщина.сексуальность, а не о чём-то, что существует исключительно в голове наблюдателя и, вероятно, не существует в голове пришельца.

Термин «ошибка проецирования ума» был введён великим покойным мастером байесианства Э. Т. Джейнсом. Джейнс полагал, что вероятности существуют в уме — не в окружении, — что вероятности выражают незнание, состояние частичной информации, и если я не знаю что-либо о явлении, то это говорит о состоянии моего ума, и ничего не говорит о явлении.

Я не могу отдать должное этому древнему спору, оставаясь при этом кратким, но я приведу классический пример.

У вас есть монета.
Монета несимметрична.
Вы не знаете, какая именно сторона выпадает чаще и насколько чаще. Кто-то сказал вам о том, что монета несимметрична и ничего больше.
Больше никакой информации у вас нет.

Вы вытаскиваете монету, подкидываете её, ловите.

А теперь, прежде чем убрать руку и взглянуть на результат, можете ли вы сказать, что вы приписываете вероятность 0,5 тому, что монета упала орлом?

Частотник (сторонник частотного определения вероятности — прим. перев.) скажет: «Нет. Сказать, что вероятность равна 0,5, значит подразумевать, что монета имеет неотъемлемое свойство падать орлом так же часто, как и решкой, а значит, если мы подкинем монету бесконечное число раз, то отношение орлов и решек будет стремиться к 1:1. Но мы знаем, что монета несимметрична, поэтому она может иметь любую вероятность выпадения орла кроме 0,5».

Байесианец же скажет: «Неопределённость существует на карте, не на территории. В реальном мире монета выпадет либо орлом, либо решкой. Любой разговор о вероятности должен отражать ту информацию, которую я имею о монете — моё состояние частичного незнания и частичного знания, — а не какую-то там информацию о монете. Более того, у меня есть теоремы на любой вкус, показывающие, что если я не буду рассматривать моё частичное знание определённым образом(English), то я буду делать глупые ставки. Если мне придётся учитывать результат броска монеты при составлении плана, то я буду планировать исходя из состояния неопределённости 50:50, в котором я не могу сказать, что исходы, при которых выпадают орлы, имеют больший вес, чем исходы, при которых выпадают решки. Вы можете называть это число как угодно, но я не намерен подчиняться законам теории вероятностей из страха показаться глупым. Таким образом, я не испытываю ни малейшей нерешительности, когда называю такое взвешивание исходов вероятностью».

Я на стороне байесианцев. Вы могли это уже заметить.

Ещё до того, как симметричная монета подброшена в воздух, мнение о том, что она имеет неотъемлемую вероятность 50% упасть орлом может быть элементарно ошибочно. Может быть вы держите монету таким образом, что она гарантированно упадёт орлом или решкой, при данной силе, с которой вы подбрасываете её, и при данных движениях воздуха вокруг вас. Но если вы не знаете каким образом смещены вероятности монеты в данном конкретном случае, то что?

Если я не ошибаюсь, было судебное разбирательство, в котором истец предъявлял претензии организаторам лотереи: карточки с именами участников не были перемешаны достаточно тщательно и поэтому шансы были не равны. Судья выслушал и спросил: «Кто именно имел больше шансов?»

Чтобы сделать эксперимент с монеткой повторяемым, как того имеют обыкновение требовать частотники, мы можем создать автоматический подбрасыватель монет и убедиться, что результаты 50% орлов и 50% решек. Но, быть может, робот с особо чувствительными глазами и хорошим пониманием физики сможет, наблюдая за приготовлениями автоподбрасывателя, предсказать падение монеты заранее — пускай и не совершенно определённо, но, допустим, с точностью 90%. И чем тогда будет настоящая вероятность в этом случае?

Не существует «настоящей вероятности». Робот имеет какую-то частичную информацию. Вы имеете другую частичную информацию. Монета не имеет ума и не владеет никакой информацией, она не назначает никаких вероятностей, она просто взлетает в воздух, переворачивается несколько раз, сталкиваясь с каким-то количеством молекул воздуха, а затем приземляется либо орлом, либо решкой.

Это байесианская точка зрения, и я, пожалуй, покажу несколько классических головоломок, которые обретают свою головоломность из-за склонности думать о вероятностях как о неотъемлемых свойствах объектов.

Начнём со старой классики: вы встретили на улице математика и она случайно упомянула, что у неё два ребёнка. Вы спросили: «Хотя бы один из них мальчик?» Она ответила: «Да».

Какова вероятность того, что она родила двоих мальчиков? Если вы предположите, что вероятность того, что ребёнок — мальчик, равна 1/2, то вероятность того, что у неё два мальчика равна 1/3. Априорные вероятности такие: 1/4 для двух мальчиков, 1/2 для мальчика и девочки, 1/4 для двух девочек. Ответ математика «да» имеет вероятность ~1 в первых двух случаях и ~0 в третьем. Перенормируя вероятности мы получаем 1/3 вероятности двух мальчиков, и 2/3 вероятности мальчика с девочкой.

Предположим теперь, что вы задали другой вопрос: «Старший ребёнок — мальчик?», и математик ответила: «Да». Тогда вероятность того, что у математика два мальчика будет равна 1/2. Поскольку старший ребёнок — мальчик, а младший может быть кем ему нравится.

То же самое, если бы вы спросили: «Младший ребёнок — мальчик?». Вероятность двоих мальчиков опять же 1/2.

В этом случае, если хотя бы один ребёнок — мальчик, то он должен быть либо старшим, либо младшим. Так каким образом ответ в первом случае отличается от ответа в двух других?

Есть другой похожий пример: допустим, у меня есть четыре карты — туз червей, туз пик, двойка червей и двойка пик. Я беру из них в руку две карты случайным образом. Вы спрашиваете меня: «Держишь ли ты хотя бы одного туза?» и я отвечаю: «Да». Какова вероятность того, что я держу пару тузов? Ответ: 1/5. Существует шесть различных комбинаций из двух карт с равной априорной вероятностью, и вы исключили возможность, что я держу пару двоек. Из пяти оставшихся комбинаций только одна является парой тузов. Таким образом ответ: 1/5.

Теперь предположим, что вы спросили меня: «Держишь ли ты туза пик?» Если я отвечу «да», то вероятность того, что другая карта — туз червей равна 1/3. (Вы знаете, что я держу туза пик, и существует три возможных варианта для другой карты, туз червей — ровно один из них.) Точно так же, если вы спросите меня «Держишь ли ты туза червей?» и я отвечу «да», то вероятность того, что я держу пару тузов равна 1/3.

Но как такое может быть, если в случае вопроса «Держишь ли ты по крайней мере одного туза?» и ответа «Да», вероятность того, что я имею пару была 1/5? Я должен был держать либо туза пик, либо туза червей, как вы знали; и в любом случае вероятность того, что я держу пару тузов равна 1/3.

Как такое может быть? Может я вычитал какие-то вероятности неверно?

Если вы хотите выяснить это самостоятельно, то сделайте это сейчас, потому что я собираюсь раскрыть…

Все указанные расчёты верны.

Что же до парадокса, то его нет. Видимость парадокса возникает из-за того, что вероятности рассматриваются как свойства карт. Туз, которого я держу, может иметь масть либо червей, либо пик; но это не означает, что ваше знание о моих карт должно быть одинаковым, если вы знаете, что я держу червей, или вы знаете, что я держу пики.

Тут может помочь теорема Байеса:

P(H|E) = P(E|H)P(H) / P(E)

Последняя часть, где вы делите на P(E) — это часть, где вы отбрасываете все остальные возможности, которые были исключены и перенормируете ваши вероятности к тому, что осталось.

Давайте рассмотрим вопрос «Держишь ли ты по крайней мере одного туза?». Прежде чем я ответил, ваша вероятность того, что я скажу «да» должна была быть 5/6.

Но если вы спросили меня «держишь ли ты туза пик?», то ваши априорная вероятность того, что я скажу «да», всего лишь 1/2.

То есть, как вы видите, вы узнаёте весьма разные вещи в этих двух разных случаях. Вам придётся исключать и перенормировать какие-то различные возможности, используя разную P(E). Если вы узнаете разные свидетельства, то вам не следует удивляться, если в результате вы приходите к разной частичной информации.

Точно так же, если я спросил математика: «Есть ли среди твоих детей мальчик?», то я ожидал услышать «Да» с вероятностью 3/4, но если бы я спросил: «Старший ребёнок — мальчик?», то я бы ожидал услышать «да» с вероятностью 1/2. Таким образом, совершенно неудивительно, что я пришёл к разному частичному знанию, зависящему от того, какой именно из этих двух вопросов я задал.

Единственная причина того, почему видится парадокс, в том, что вероятность пары тузов рассматривается как свойство карт которые имеют, по крайней мере, одного туза, или как свойство карт, которые, как выясняется, содержат туза пик. В этом случае, для набора карт, имеющего по крайней мере одного туза, было бы парадоксальным иметь прирождённую вероятность пары равную 1/5, в то время как наборы карт, имеющие одного туза пик, имеют прирождённую вероятность пары равную 1/3, и наборы карт, имеющие туза червей, имеют прирождённую вероятность пары 1/3.

Точно так же, если вы считаете о вероятности 1/3 того, что оба ребёнка мальчики, что это прирождённое свойство наборов детей, которые включают хотя бы одного мальчика, то это не совместимо с наборами детей, из которых старший — мальчик, имеющими прирождённую вероятность 1/2 того, что оба мальчики, также как и наборы детей, имеющие младшего мальчика, имеют врождённую вероятность того, что оба — мальчики. Это было бы тоже самое, что и сказать: «Все зелёные яблоки весят по фунту, все красные яблоки весят по фунту, и все яблоки, которые зелёные или красные, весят по полфунта».

Это то, что случается, когда вы начинаете думать о вероятностях как о чём-то, что содержится в вещи, вместо того, чтобы рассматривать вероятности как отражение частичной информации о вещи.

Вероятности описывают неопределённость. Но неопределённость существует лишь для агентов. Пустая карта не соответствует пустой территории. Незнание существует в голове.

Перевод: 
kuuff
Номер в книге "Рациональность: от ИИ до зомби": 
193
Оцените качество перевода: 
Средняя оценка: 4.2 (9 votes)

Цитата — не референт

Элиезер Юдковский

В классической логике операциональное определение тождества означает, что если 'A=B' — теорема, то вы можете заменить 'B' на 'A' в любой теореме, где используется 'B'. Например, если (2 + 2) = 4 — теорема, и ((2 + 2) + 3) = 7 — теорема, то (4 + 3) = 7 — тоже теорема.

Это приводит к проблеме, которую обычно выражают словами: утренняя звезда и вечерняя звезда оказываются одним и тем же объектом, планетой Венера. Предположим, что Джон знает, что утренняя звезда и вечерняя звезда — это один и тот же объект. Мэри же полагает, что утренняя звезда — это бог Люцифер, а вечерняя звезда — это богиня Венера. Джон знает, что Мэри считает, что утренняя звезда — Люцифер. Должен ли Джон поэтому (по правилу подстановки) считать, что Мэри верит в то, что вечерняя звезда — это Люцифер?

Или даже более простая версия этой проблемы. 2 + 2 = 4 — это истина, то есть (((2 + 2) = 4) = ИСТИНА) — это теорема. Великая теорема Ферма — тоже истина. Таким образом: я верю в то, что 2 + 2 = 4 => я верю в ИСТИНУ => я верю в великую теорему Ферма.

Да, я знаю, это выглядит очевидно неверным. Но представьте себе, что кто-то пишет программу логического вывода, использующую принцип «равные термины можно подставлять», и программа выдаёт такой результат. Теперь представьте, что программист пишет статью о том, как избежать этого. Теперь представьте, что кто-то ещё не соглашается с предложенным решением… Спор до сих пор продолжается.

Я лично сказал бы, что Джон совершает ошибку типизации, вроде попытки вычесть 5 граммов из 20 метров. «Утренняя звезда» — не то же самое, что утренняя звезда, хотя и одна и та же вещь. Убеждение — не планета.


утренняя звезда = вечерняя звезда
«утренняя звезда» ≠ «вечерняя звезда»

На мой взгляд, проблема проистекает из-за того, что не удалось корректно провести разницу между убеждениями и вещами. Исходная ошибка была в том, что ИИ хранит свои убеждения об убеждениях Мэри об «утренней звезде», используя то же представление, как и для убеждений об утренней звезде.

Если Мэри верит, что «утренняя звезда» — это Люцифер, это не означает, что Мэри верит в то, что «вечерняя звезда» — это Люцифер, потому что «утренняя звезда» ≠ «вечерняя звезда». Весь парадокс возникает из-за того, что в нужных местах не поставлены кавычки.

Вы, быть может, помните, что я не впервые говорю о введении дисциплины использования типизации — последний раз я об этом говорил, когда рассуждал об ошибке, к которой приводит неразличение выгоды и ожидаемой выгоды. При изучении физики безмерно полезно отслеживать единицы измерений — может выглядеть утомительным писать «см» и «кг», но только до тех пор, пока вы не заметите, что (а) ваш ответ выглядит ошибочным на порядок и (б) он выражен в секундах на квадратный грамм.

Точно так же, убеждения — это не то же самое, что и планеты. Если мы говорим о человеческих убеждений, то, как минимум, определённым является то, что убеждения находятся в голове, а планеты в космосе. Убеждения весят несколько микрограмм, планеты же весят гораздо больше. Планеты больше, чем убеждения… ну, вы поняли идею.

Кажется недостаточным заключить в кавычки «утреннюю звезду», чтобы предотвратить путаницу, потому что для людей текст будет выглядеть похожим. Поэтому, быть может, лучшим способом ввести типизационную дисциплину будет использование визуально различных способов кодирования:


утренняя звезда = вечерняя звезда
21.20.18.06.15.15.33.33.00.09.03.06.09.05.01 ≠ 03.06.25.06.18.15.33.33.00.09.03.06.09.05.01

Изучение математической логики также может помочь научиться различать цитату и референт. В математической логике |- P (P — теорема) и |- []'P' (доказуемо, что существует кодированное доказательство кодированного утверждения P в какой-то кодированной системе доказательств) — это очень разные утверждения. Если вы снизите уровень «цитирования» в математической логике, то это примерно то же, что и опустить единицу измерения — в результате вы можете получить нелепые результаты, типа «скорость света равна 299 792 458 метрам».

Альфред Тарский однажды попытался определить значение «истины», используя бесконечную последовательность предложений:


(«Снег — белый» — это истина) тогда и только тогда, когда (снег — белый)

(«Хорьки зелёные» — это истина) тогда и только тогда, когда (хорьки зелёные)

Когда предложения типа этих начнут выглядеть в ваших глазах осмысленными, вы начнёте различать закодированные утверждения и состояния окружающего мира.

Похожим образом, понятие истины весьма отличается от понятия реальности. Говоря «истина» мы сравниваем убеждение с реальностью. Но реальность не станет реальнее от того, что её сравнили с убеждением, ей вовсе не нужны никакие сравнения для того, чтобы быть реальной. Помните об этом, когда вам в следующий раз придётся услышать утверждение, что ничто не является истинным.

Перевод: 
kuuff
Номер в книге "Рациональность: от ИИ до зомби": 
194
Оцените качество перевода: 
Средняя оценка: 5 (3 votes)

Качественное замешательство

Элиезер Юдковский

Я полагаю, что основной причиной путаницы между «убеждением», «истиной» и «реальностью» является качественное мышление об убеждениях.

Давайте рассмотрим типичную постмодернистскую попытку поумничать:

«Солнце вращается вокруг Земли» — истина для Ханги Охотника-собирателя, но «Земля вращается вокруг Солнца» — истина для Эмары Астронома! Разные общества имеют разные истины!

Нет. Разные общества имеют разные убеждения. Убеждения имеют другой тип, нежели истина, это как сравнивать яблоки с вероятностями.

Ах, но ведь нет никакой разницы между тем, как ты используешь слово «убеждение» и как ты используешь слово «истина»! Вне зависимости от того, говоришь ли ты «я убеждён, что снег белый» или «снег белый — это истина», ты выражаешь одно и то же мнение.

Нет. Эти предложения означают довольно-таки разные вещи, они передают разницу в том, как я ”ощущаю” вероятность того, что мои убеждения — ложь.

О… Ты утверждаешь, что ты ощущаешь, но ты не веришь в это. Как сказал Витгенштейн, «если бы существовал глагол, означающий „ошибочно верить“, то он бы не имел никакого значащего первого лица, настоящего времени изъявительного наклонения».

И вот как раз то, что я имею в виду, разговаривая о качественном рассуждении как об источнике проблемы. Дихотомия между верой и неверием, будучи двоичной, похожа на дихотомию между истиной и неистиной, и это приводит к путанице.

Но давайте попробуем использовать количественное рассуждение. Предположим, что я присваиваю 70% вероятности утверждению, что снег — белый. Это означает, что я думаю, что есть около 70% вероятности того, что предложение «снег белый» окажется истиной. Если это предложение — истина, является ли истиной моё присвоение 70% вероятности этому предложению? Оно более истинно, чем было бы, если бы я присвоил 60% вероятности, но не столь истинно, как если бы я присвоил 80%.

Говоря о соответствии между присвоением вероятности и реальностью, будет лучше использовать слово «точность» вместо слова «истина». «Точность» звучит более количественно, как стреляющий лучник: как близко к центру цели попадёт присвоение вероятности.

Короче говоря(English), существует весьма натуральный способ оценить точность присвоения вероятности при сравнении с реальностью: достаточно взять логарифм вероятности, которая была присвоена действительному положению дел.

Таким образом, если снег — белый, то моё убеждение «70%: снег белый» будет оценено как −0,51 бит: log2(0,7) = −0,51.

Но что, если снег не белый, если я присвоил действительному положению дел 30% вероятности? Если «снег белый» — ложь, моё убеждение «30%: снег не белый» даст −1,73 бита. Отметьте: -0,51 > −1,73, то есть в этом случае моё предсказание хуже.

Как оценить точность моих убеждений? Мои ожидания можно оценить как 70% * −0,51 + 30% * −1,73 = −0,88 бит. Если снег белый, то мои убеждения окажутся более точными, чем я ожидал. Если снег не белый, то мои убеждения окажутся менее точными, но, в любом случае, мои убеждения не будут иметь такую же точность, как я ожидал в среднем.

И это ни в коем случае не стоит путать с выражением «я назначаю 70% убеждённости утверждению, что снег белый». Я могу быть убеждён, что это утверждение верно с вероятностью ~1, то есть я не сомневаюсь в этом, это факт о моей вере. И, таким образом, я буду ожидать, что моё мета-убеждение «~1: «я назначаю 70% убеждённости, что снег белый» получит ~0 бит точности, что фактически так и есть.

То, что я не уверен в цвете снега, не означает, что я не уверен в моих цитированных вероятностных убеждениях. Снег где-то там, а мои убеждения в моей голове. Я могу быть заметно менее не уверен в том, насколько я не уверен в цвете снега, чем я не уверен в цвете снега. (В то же время убеждения об убеждениях не всегда точны.)

Сравните эту вероятностную ситуацию с качественным рассуждением, в котором я просто верил, что снег белый, и верил, что я верю, что снег белый, и верил, что «снег белый — истина», и верил, что «моё убеждение, что „снег белый — истина“ — верно», и т.д. Поскольку все вовлечённые величины равны 1, их легко перепутать.

В то же время, вы можете легко упустить эти различия в качественном выводе, если начнёте думать «снег белый с вероятностью 70%» — истина», что является ошибкой типизации. Это истинный факт о вас, о том что вы верите в «70%: снег белый»; но это не означает, что присвоение вероятности является истинным. Вера наберёт либо −0,51, либо −1,73 бита точности, в зависимости от действительного положения дел в реальности.

Знатоки увидят в утверждении «снег белый с вероятностью 70%» — истина» ошибку мышления, выражающуюся в том, что вероятность находится в голове.

Изнутри наши убеждения о мире выглядят как мир, и наши убеждения о наших убеждениях — как наши убеждения. Когда вы смотрите на мир, вы ощущаете убеждение изнутри. Когда вы замечаете, что вы верите во что-то, вы ощущаете убеждение об убеждении. Таким образом, если ваши внутренние представления об убеждениях, и об убеждениях об убеждениях отличаются, то вы с меньшей вероятностью перепутаете их и ввалитесь в ошибку проецирования ума. Я надеюсь.

Когда вы думаете вероятностями, можно надеяться, что ваши убеждения и ваши убеждения о ваших убеждениях будут представляться достаточно различно, чтобы вы не путали убеждение и точность, или точность и реальность. Когда вы думаете вероятностями о мире, ваши убеждения будут представлены вероятностями ∈ (0, 1). В отличие от булевских значений утверждений, которые могут принимать значения {истина, ложь}. Точность же ваших вероятностных убеждений вы можете представлять числом из (−∞, 0). Ваши вероятности о ваших убеждениях будут, как правило, «впадать в крайности». А вещи при этом будут просто красными или синими, или весящими 20 фунтов, или ещё какими-нибудь.

Таким образом, у нас будет меньше возможности перепутать карту с территорией.

Различение типов может так же помочь нам помнить, что неопределённость — это состояние ума. Монетка не имеет врождённой неопределённости того, каким образом она приземлится. Монета — не процессор убеждений и не имеет частичной информации о себе. Мысля качественно, вы можете создать убеждение, которое прямо соответствует монетке, типа «монета всегда приземляется орлом». Это убеждение будет истиной или ложью в зависимости от монеты, и будет прозрачное соответствие от истинности или ложности убеждения к выпавшей стороне монеты.

Но, даже при качественном мышлении, сказать, что монета сама по себе является «истиной» или «ложью», будет серьёзной ошибкой типизации. Монета — не убеждение, она — монета. Территория — не карта.

Если монета не может быть истиной или ложью, может ли она присвоить себе 50% вероятности?

Перевод: 
kuuff
Номер в книге "Рациональность: от ИИ до зомби": 
195
Оцените качество перевода: 
Средняя оценка: 4.7 (6 votes)

Думай как реальность

Элиезер Юдковский

Всякий раз, когда я слышу, как кто-то описывает квантовую физику как «странную» — всякий раз, когда я слышу, как кто-то сетует на таинственное действие наблюдения на наблюдаемое, или дикое существование нелокальных корреляций, или неимоверную невозможность одновременного знания координат и импульса — я думаю про себя: «Этот человек никогда не поймет физику, независимо от того, сколько книг он прочтет».

Реальность была вокруг задолго до того, как ты появился. Не следует называть ее отвратительными именами вроде «дикая» или «неимоверная». Вселенная распространяла комплексные амплитуды сквозь пространство конфигураций за десять миллиардов лет до того, как жизнь вообще появилась на Земле. Квантовая физика не «странная». Это ты странный. Это у тебя появилась абсолютно дикая идея, что реальность должна состоять из маленьких, танцующих вокруг бильярдных шариков, когда по факту реальность — это совершенно нормальное облако комплексных амплитуд в конфигурационном пространстве. Это твоя проблема, а не реальности, и именно ты должен измениться.

Человеческая интуиция была выработана эволюцией, а эволюция это хак. Тот же оптимизационный процесс, который создал твою сетчатку задом наперед и затем подвел оптический кабель через твое поле зрения, спроектировал твою видеосистему для обработки скачущих вокруг персистентных объектов в 3-х мерном пространстве, потому что это то, чем можно выслеживать тигров. Но «тигры» — протекающие поверхностные обобщения — появились постепенно в процессе эволюции, и они не абсолютно похожи один на другого. Когда ты опускаешься до фундаментального уровня, уровня, законы которого стабильны, глобальны и не имеют исключений, на нем нет никаких тигров. Фактически там нет никаких персистентных объектов, скачущих в трехмерном пространстве. Смирись с этим.

Называние реальности «странной» держит тебя внутри точки зрения, ошибочность которой уже доказана. Теория вероятности говорит нам, что удивление — мера некачественности гипотезы; если модель стабильно глупая(English) — стабильно натыкается на события, которым присваивает крошечные вероятности — тогда пришло время выкинуть эту модель. Хорошая модель делает реальность выглядящей совершенно нормально, а не странно; хорошая модель присваивает высокие вероятности тому, что на самом деле имеет место быть. Интуиция — это еще одна модель с другим именем: плохая интуиция будет шокирована реальностью, хорошая интуиция делает реальность выглядящей нормально. Ты хочешь перестроить свою интуицию так, чтобы реальность выглядела нормальной. Ты хочешь думать, как реальность.

Это конечное состояние нельзя утвердить насильно. Бесполезно делать вид, что квантовая физика естественна для тебя, когда на самом деле ты чувствуешь, что она странная. Так ты лишь откажешься признавать, что ты запутался. Это не поможет тебе распутаться. Но это также помешает тебе думать: «Как дико!» Трата эмоциональных сил на недоверчивость расходует зря время, которое можно было бы употребить на обновление. Оно опять и опять отбрасывает тебя в объятия старой, неверной точки зрения. Оно кормит твое чувство справедливого негодования на реальность, осмелившуюся противоречить тебе.

Этот принцип применим и за границами квантовой физики. Ловил ли ты когда-нибудь себя на том, что говорил что-то вроде «Я не понимаю, как дипломированный физик может верить в астрологию?» Ну, если ты действительно не понимаешь, это показатель проблем в твоей модели человеческой психологии. А может, ты просто возмущён — и хочешь выразить сильное моральное неприятие. Но если ты действительно не понимаешь, тогда твое возмущение не дает тебе придти к согласию с реальностью. Не должно быть трудно вообразить, как получается так, что дипломированный физик верит в астрологию. Люди разграничивают, вот и всё.

Теперь я стараюсь не использовать выражение «Я совершенно не понимаю, как …» для выражения возмущения. Если я искренне не понимаю, как, то моя модель удивлена фактами, и я должен выкинуть ее и найти лучшую модель.

Удивление существует на карте, а не на территории. Не бывает удивляющих фактов, бывают только модели, удивляющиеся фактам. Как и фактов, называемых такими отвратительными эпитетами, как «дикий», «невероятный», «невообразимый», «неожиданный», «странный», «аномальный», «чудной». Когда ты обнаруживаешь искушение воспользоваться такими эпитетами, может быть мудрее проверить, на самом ли деле предполагаемые факты реальны. Но если факты проверены, тогда проблема не в фактах, проблема в тебе.

Перевод: 
Vag
Номер в книге "Рациональность: от ИИ до зомби": 
196
Оцените качество перевода: 
Средняя оценка: 4.8 (13 votes)

Инверсия хаоса

Элиезер Юдковский

Недавно я беседовал с друзьями на тему продуктивности и поддержания силы воли — я всю жизнь борюсь с этой проблемой.

Я способен не убежать от сложной задачи в момент столкновения с ней (проявить настойчивость на протяжении нескольких секунд) и могу работать над одной и той же задачей годами. Но работать над одной и той же задачей несколько часов для меня чрезвычайно тяжело. Естественно, я уже прочёл бесчисленное множество советов на эту тему. Больше всего мне помогло осознание того, что значительная доля людей, занимающихся творческой деятельностью, сталкивается с той же проблемой и тоже не может с ней справиться, несмотря на все разумные советы.

«Что ты делаешь, когда не можешь работать?» — спросили меня друзья. (Я здесь воспроизвожу обсуждение не очень точно, это довольное вольное сокращение.)

Я ответил, что обычно листаю случайные сайты или смотрю короткое видео.

Они ответили: «Если ты знаешь, что некоторое время не сможешь работать, стоит посмотреть кино или заняться чем-нибудь ещё в этом духе».

«К сожалению», — ответил я, — «мне надо заниматься чем-то, что занимает короткие промежутки времени, вроде сёрфинга сайтов или просмотра видео. Ведь, возможно, мне снова захочется поработать, а я же не могу предсказать, когда…»

И тут я осёкся, потому что у меня внезапно открылись глаза.

Я всегда относился к своему рабочему процессу как к чему-то хаотическому, непредсказуемому. Я никогда не описывал его такими словами, но отношение было именно таким.

Однако вот мои друзья, кажется, подразумевают, — какая странная идея — что другие люди способны предсказывать, когда они смогут опять приступить к работе, и планировать своё время соответственно.

И до меня впервые дошло, что я, возможно, совершал эту чёртову многократно упомянутую ошибку проецирования ума. Не в каких-то абстрактных рассуждениях, а в своей повседневной жизни.

Возможно, это не моя способность работать необычайно хаотична, а я необычайно глуп в вопросе, как её прогнозировать.

Хаос. Кажется, что с чем-то трудно справиться, трудно понять, трудно догадаться, что будет дальше. Кажется, что с этим нельзя ничего сделать. Именно так выглядит глупость изнутри. И это не просто идиома для описания каких-нибудь абстрактных высот, вроде искусственного интеллекта. Это наблюдается и в повседневной жизни.

И, подозреваю, мы не рассматриваем альтернативную гипотезу «я глуп» не потому, что мы очень высокого мнения о себе. А потому что мы в принципе о себе не думаем. Мы просто видим окружающий нас хаос.

Итак, я осознал, что мои проблемы с продуктивностью, возможно, вызваны не хаосом, а моей собственной глупостью.

Это осознание может помочь, а может и нет. Определённо оно не решит проблему само по себе. Фраза «я невежественен» не делает тебя знающим.

Но, по крайней мере, появляется ещё один путь.

Перевод: 
sepremento, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
197
Оцените качество перевода: 
Средняя оценка: 4.9 (12 votes)

Редукционизм

Элиезер Юдковский

Почти год назад, в апреле 2007, Мэтью C1 предложил следующую тему на Overcoming Bias:

«Как и почему царствующий в настоящее время философский гегемон (редукционный материализм) считается очевидно верным […], в то время как царствовавшие философские взгляды всех прошлых обществ и цивилизаций выглядят подозрительными…»

Я помню это, потому что взглянув на запрос и сочтя его уместным, я знал, что не смогу справиться с этой темой, до тех пор пока не начну цепочку Ошибка проецирования ума, но начинать её тогда было ещё рано…

Но теперь пришло время для этого вопроса. И хоть я ещё и не готов к «материализму», но мы можем начать с «редукционизма».

Во-первых, отмечу, что я действительно считаю, что редукционизм (в значении, которое я даю этому слову) действительно корректен; и пускай горят в аду все предыдущие цивилизации, которые несогласны.

Довольно сильное утверждение, не так ли? По-крайней мере первая его часть. Общая теория относительности хорошо поддерживается, и всё же, кто знает, но может быть физики будущего ниспровергнут её?

С другой стороны, мы никогда не вернёмся обратно к ньютоновской механике. Храповик науки вращается, но только в одном направлении. Бывали случаи в истории науки, когда теория получала удар или два, а затем возвращалась. Но когда теория получила столько стрел в грудь, сколько получила ньютоновская механика, то она останется мёртвой.

Вторая часть — «чёрт с тем, что думали прошлые цивилизации,» — тоже выглядит достаточно безопасной. Прошлые цивилизации верили во что-то, что было фальсифицировано и выкинуто на историческую свалку.

И редукционизм не столько позитивная гипотеза, сколько отсутствие веры — в частности, в форме ошибки проецирования ума.

Однажды мне пришлось столкнуться с человеком, который утверждал, что он служил артиллеристом ВМФ, и он говорил «Когда вы ведёте артиллерийский огонь, вам приходится высчитывать траектории согласно ньютоновской механике. Если вы высчитаете траектории используя теорию относительности, то вы получите неверный ответ».

И мы с ещё одним присутствующим человеком решительно ответили «Нет». Я добавил: «Быть может невозможно достаточно быстро рассчитать траектории согласно теории относительности — вы это имели в виду? Но релятивистский ответ всегда будет более точен, нежели ньютоновский».

«Нет,» — сказал он — «Я имею в виду, что теория относительности даст неверный ответ, потому что вещи, двигающиеся со скоростями артиллерийских снарядов, подчиняются ньютоновской механике, а не теории относительности».

«Будь это правдой,» — я ответил, — «вы могли бы опубликовать это в физическом журнале и получить Нобелевскую премию».

Стандартная физика использует одну и ту же фундаментальную теорию, чтобы описать и полёт Боинга 747, и столкновения частиц в релятивистском коллайдере тяжёлых ионов (RHIC). Согласно нашему пониманию, и ядра атомов, и самолёты подчиняются специальной теории относительности, квантовой механике и хромодинамике.

Но для изучения аэродинамики Боинга и столкновения ядер золота в RHIC используются совершенно разные модели. Компьютерное моделирование аэродинамики Боинга может не содержать ни единого символа, ни единого бита ОЗУ, который бы представлял кварк.

Так что же: Боинг сделан не из кварков? Нет, это мы всего лишь моделируем его, используя такие элементы представления, которые не могут быть сопоставлены с кварками Боинга один к одному. Карта — это не территория.

Почему бы не смоделировать Боинг, используя хромодинамическое представление? Потому что для получение ответа по такой модели потребуется тьмаллион лет. Кроме того, эта модель не поместится в память всех компьютеров мира вместе взятых (на 2008 год).

Как говорится «Карта — это не территория, но территорию нельзя сложить и убрать в бардачок». Иногда приходится пользоваться картой поменьше, лишь бы она помещалась в маленький бардачок. Но это никак не меняет территорию. Масштаб карты — это не свойство территории, это свойство карты.

Если было бы возможно построить и запустить хромодинамическую модель Боинга, то она бы давала точные предсказания. Более точные, чем аэродинамическая, на самом деле.

От точной модели Боинга, в принципе, не требуется, чтобы она содержала явные описания потока воздуха или высоты. Вовсе не обязательно выделять хотя бы один бит ОЗУ под положение крыльев. Возможно, в принципе, построить такую модель, которая не будет содержать ничего, кроме полей элементарных частиц и фундаментальных сил.

«Что?» — кричит антиредукционист, — «Вы говорите, что у Боинга в действительности нет крыльев? Но я же их вижу!».

И вот тут есть едва уловимая тонкость. Объект может иметь разные описания на разных уровнях, но дело не только в этом.

Дело в том, что фраза «имеет разные описания на разных уровнях» относится к Разговору о Картах, а не к Разговору о Территории.

Ни аэроплан, ни законы физики сами по себе не используют разные описания на разных уровнях, как думал тот артиллерист. Это мы, для нашего удобства, используем разные упрощённые модели на разных уровнях.

Чисто хромодинамическая модель, содержащая исключительно элементарные частицы и фундаментальные силы, будет содержать и все факты и о потоке воздуха, и о высоте, и о положении крыльев, но она будет содержать их неявно.

Глядя на эту модель и думая о модели, можно определить, где находятся крылья. Таким образом, получая явное представление о положении крыльев, мы получаем явный вычислительный объект в нейронном ОЗУ. В собственном уме.

На самом деле, можно вывести все типы явных описаний самолёта на различных уровнях и даже явные правила того, как модели разных уровней взаимодействуют друг с другом, чтобы выдавать совместные предсказания…

И алгоритм ощущается изнутри, как если бы самолёт был сделан из многих взаимодействующих между собой уровней.

Убеждение чувствуется изнутри таким образом, что вам кажется, что вы смотрите прямо на реальность. Когда же вам кажется, что вы смотрите на убеждение, в действительности вы ощущаете убеждение об убеждении.

Таким образом, когда ваш мозг одновременно верит явным описаниям со многих разных уровней и верит в явные правила перехода с одного уровня на другой, как в часть эффективной комбинированной модели, это ощущается как будто вы видите систему, которая сделана из разных уровней описания и их правил взаимосвязи.

Но это просто попытка вашего разума сжать объект, который он не может смоделировать на фундаментальном уровне. Самолёт слишком большой. Даже атом водорода будет слишком большим. Взаимодействия между кварками безумно взаимодействующи. Вы не можете справиться с истиной.

Но физика работает так, что, насколько мы видим, существует только один самый-самый базовый уровень — поля элементарных частиц и фундаментальные силы. Вы не можете справиться с сырой истиной, но реальность справляется с ней без всяких упрощений. (Я хотел бы знать, откуда Реальность получила такую вычислительную мощь.)

Законы физики не содержат различных дополнительных временных сущностей, которые соответствуют высоте или крыльям самолёта, но в разуме инженера содержатся различные дополнительные когнитивные сущности, которые соответствуют высоте и крыльям самолёта.

Таков, в моём понимании, тезис редукционизма. Редукционизм — не позитивная вера, а скорее неверие в то, что более высокие уровни упрощённой многоуровневой модели находятся снаружи, на территории. Понимая это на внутреннем уровне легко можно распутать вопрос «Как вы можете говорить, что самолёт в действительности не имеет крыльев, если я их вижу?». Достаточно обратить внимание на слова «в действительности» и «вижу.»

  • 1. Речь об одном из пользователей Overcoming bias, коллективного блога, из которого вырос lesswrong.com. В оригинале «Matthew C». — Прим.перев.
Перевод: 
kuuff
Номер в книге "Рациональность: от ИИ до зомби": 
198
Оцените качество перевода: 
Средняя оценка: 4.7 (7 votes)

Объяснение и разобъяснение

Элиезер Юдковский

Поэма Ламия (Lamia) Джона Китса определённо заслуживает награды как Наиболее Знаменитая Раздражающая Поэзия:

…От прикосновенья
Холодной философии — виденья
Волшебные не распадутся ль в прах?
Дивились радуге на небесах
Когда-то все, а ныне — что нам в ней,
Разложенной на тысячу частей?
Подрезал разум ангела крыла,
Над тайнами линейка верх взяла,
Не стало гномов в копи заповедной —
И тенью Ламия растаяла бесследной.

пер. Сергей Сухарев

Мой обычный ответ на подобное заканчивается фразой: «Если мы не можем наслаждаться просто реальностью, то наши жизни действительно пусты». Но это я объясню завтра.

Сегодня же я хочу поговорить о другом. Взглянем на эти строки:

  • гномы в копи
  • радуги, разложенные на тысячи частей

Что вызывает из памяти несколько другие стихи:


Одна из этих вещей
Отличается от остальных,
Одна из этих вещей
Не к месту

Наука избавила рудники от гномов, но радуга всё ещё здесь.

Я писал ранее:
«Отслеживая назад причинно-следственную цепочку шаг за шагом, я выясняю, что моя вера в то, что на моих ногах надеты носки, полностью объясняется тем, что на моих ногах надеты носки… С другой стороны, если я вижу мираж озера в пустыне, то правильное причинное объяснение моего видения не будет включать в себя факт наличия настоящего озера в пустыне. В этом случае моя вера в существование озера не просто объясняется, но разобъясняется».

Радуга была объяснена. Гномы же были разобъяснены.

Я думаю, что в этом как раз кроется тонкость, которую антиредукционисты не улавливают в редукционизме.

Вы можете наблюдать эту ошибку в классическом возражении против редукционизма:

Если редукционизм верен, то даже ваша вера в редукционизм — в сущности, результат движения молекул. И зачем тогда я буду слушать, что вы говорите?

Ключевое слово — «в сущности». Оно подразумевает, что если я принимаю редукционизм, то он разобъяснит все процессы рассуждения, которые ведут к моему принятию редукционизма, тем же способом, каким разобъясняются оптические иллюзии.

Но, тем не менее, возможно объяснить, как работает когнитивный процесс, не являющийся «сущностью»! Моя вера в то, что на мне одеты носки — это, в сущности, результат того, что моя зрительная кора получает нервные импульсы от моей сетчатки, которая получает фотоны, отражённые от моих носков… Короче говоря, в соответствии с научным редукционизмом, моя вера в то, что на мне одеты носки — это сущий результат того факта, что на мне надеты носки.

Что должно происходить в голове антиредукциониста, чтобы он помещал бы радуги и веру-в-редукционизм в одну категорию с гномами?

Одновременно происходит несколько вещей. Но сейчас давайте рассмотрим мысль, изложенную вчера: ошибку проецирования ума — многоуровневой карты на одноуровневую территорию.

(То есть: вы не можете промоделировать Боинг 747 покварково, поэтому вы вынуждены использовать многоуровневую карту с явными когнитивными представлениями крыльев, потока воздуха и всего прочего.)

Я думаю, что когда физики говорят: «На фундаментальном уровне радуги не существует», — антиредукционисты слышат: «Радуги не существует».

Если вы не видите разницы между многоуровневой картой и одноуровневой территорией, и кто-то пытается объяснить вам, что радуга не является фундаментальным понятием физики, то принятие этого утверждение воспринимается как стирание радуги из вашей многоуровневой карты, что воспринимается как стирание радуг из мира.

Когда наука говорит: «Тигры — не элементарные частицы, они сделаны из кварков», — антиредукционист слышит это, как отрицание типа такого: «Мы заглянули в ваш гараж и не нашли там никакого дракона, только пустой воздух».

То, что учёные сделали с радугами и с гномами, видимо, ощущается как одно и то же для Китса.

Чтобы поддержать этот подтезис, я намеренно использовал в обсуждении поэмы Китса несколько фраз, которые подвержены ошибке проецирования ума. Если вы не заметили, то это неплохая иллюстрация тому, что подобные ошибки легко проходят незамеченными.

Например:

Наука избавила рудники от гномов, но радуга всё ещё здесь.

В действительности, Наука избавила модель от веры в гномов. Наука в действительности не трогала реальных крыльев Ангела и не уничтожала их холодным прикосновением истины. В действительности никогда не было никаких гномов.

Другой пример:

То, что учёные сделали с радугами и с гномами, видимо, ощущается как одно и то же для Китса.

Учёные ничего не делали с гномами, только с «гномами». Цитата — не референт.

Но если вы допускаете ошибку проецирования ума (и, по умолчанию, наши убеждения ощущаются как способ существования мира), то во время T=0 рудники (видимо) содержат гномов, во время T=1 учёные пляшут на сцене, а во время T=2 рудники (видимо) становятся пустыми. Ясно, что гномы когда-то были, но учёные их всех убили.

Плохой учёный! Никаких поэм для тебя, убийца гномов!

Этот процесс ощущается таким образом, если вы эмоционально привязаны к гномам, а учёный говорит, что не существует никаких гномов. Требуется сильный разум, глубокая честность и сознательное усилие, чтобы сказать в этот момент: «То, что может быть разрушено истиной, должно быть разрушено», и «Учёные не забрали гномов от меня, они забрали моё заблуждение», и «У меня не было исключительного права на мою веру в гномов, я не лишился ничего, чем я бы владел по праву», и «Если гномы существуют, то я хочу верить, что гномы существуют, если гномы не существуют, то я хочу верить, что гномы не существуют, я не буду цепляться за веру, которой не хочу» и все остальные вещи, которые рационалисты должны говорить себе в подобных случаях.

Но с радугами нет никакой необходимости для всего этого. Радуги всё ещё здесь!

Перевод: 
kuuff
Номер в книге "Рациональность: от ИИ до зомби": 
199
Оцените качество перевода: 
Средняя оценка: 4 (10 votes)

Лжередукционизм

Элиезер Юдковский

Дивились радуге на небесах
Когда-то все, а ныне — что нам в ней,
Разложенной на тысячу частей?

– Джон Китс, «Ламия»
пер. Сергей Сухарев

Я предполагаю – хоть это лишь предположение – что сам Китс не понимал принципов разложения радуги. Во всяком случае, понимал их не так, как Ньютон. Возможно, даже вообще не знал. Может быть, Китс просто прочитал где-то, что Ньютон объяснил радугу, сказав, что это «свет, отражённый от капель воды»…

…что на самом деле было известно ещё в XIII веке. Ньютон только уточнил объяснение, показав, что свет разбивается на цветные части, а не изменяет цвет. Радуга оказалась в заголовках новостей. И Китс с Чарльзом Лэмом, и Вильямом Вордсвордом, и Бэнджамином Хейдоном поднимали тост «За путаницу в память о Ньютоне», потому что «он разрушил поэзию радуги, редуцировав её в призму». Это одна из причин подозревать, что Китс не слишком глубоко понимал предмет.

Я предполагаю (хоть это лишь предположение), что Китс не мог показать на бумаге, как получается так, что радуга появляется только тогда, когда Солнце находится сзади, или почему радуга — дуга окружности.

Если так, то Китс имел лжеобъяснение. В данном случае — лжередукцию. Ему сказали, что радуга была редуцирована, но в модели мира Китса она не была редуцирована.

И это вторая тонкость, которую не улавливают антиредукционисты — разница между тем, чтобы озвучивать факт, что что-то редицируемо, и тем, чтобы понять это.

В этой ошибке антиредукционистов не стоит осуждать, поскольку это часть более общей проблемы.

Раннее я писал о том, что выглядит знанием, но им не является, и убеждениях, которые не о том, что в них говорится, но которые – записи для воспроизведения в классе, и словах, которые работают как семантические стоп-сигналы для любопытства, а не как ответы, и техноболтологии, которая лишь показывает принадлежность к литературному жанру «наука»

Можно понять, откуда взялась радуга, или ставить эксперименты с призмами, чтобы подтвердить свойства радуги, или разбрызгивать воду, чтобы создать искусственную радугу.

И это сильно отличается от философа со строгим видом говорящего вам: «Нет, нет ничего особого в радугах. Вы не слышали? Учёные её разобъяснили. Что-то там происходит с дождевыми каплями или как-то так. Ничего удивительного».

Я думаю, что это отличие и приводит к тому, что за редукционизмом, как бы, тянется дьявольская смертельная экзистенциональная пустота.

Надо понимать, что «редукционизм» для антиредукционистов, вовсе не в том, что они на самом деле понимают как работает радуга, не в том, что они критично восклицают «Ага!», а в том, что им просто говорят, что загаданное слово — «наука». Эффект редукционизма для них сводится к тому, что радуга переходит в другой литературный жанр, в жанр, который их научили воспринимать как скучный.

Для них услышать слова «Наука объяснила радугу!» – повесить на радуге знак «Этот феномен помечен как СКУЧНЫЙ по приказу Совета Изощрённых Литературных Критиков. Не толпитесь. Проходите мимо».

И это всё, что говорит знак. Только это и ничего больше.

Таким образом, литературных критиков силой лишили гномов. Гномы не исчезли, благодаря озарению, но удалены по прямому приказу авторитета. Им не дано никакой красоты, которая могла бы заменить призраков или гномов, никакого подлинного понимания, которое могло бы быть интересно по-своему. Просто надпись, говорящая «Ха! Ты думал, что радуга красивая? Дурачок. Это часть литературного жанра науки, сухих и формальных непонятных слов».

Таким образом антиредукционисты воспринимают «редукционизм».

И… Не ругайте Китса, бедный парень, вероятно, не получил правильного воспитания.

Но он осмелился поднять тост «За путаницу в память о Ньютоне»?

Я предлагаю рационалистам тост «В память о путанице Китса». Аплодисменты.

Перевод: 
kuuff
Номер в книге "Рациональность: от ИИ до зомби": 
200
Оцените качество перевода: 
Средняя оценка: 4.2 (11 votes)

Поэты саванны

Элиезер Юдковский

Поэты говорят, что наука лишает звёзды красоты, что звёзды — просто газообразные шары из атомов. Ничто не «просто». Я тоже могу видеть звёзды в ночи и чувствовать их, но вижу ли я меньше или больше?

Необъятность небес простирается в моём воображении, мой маленький глаз теряется в этой карусели и не может оторваться от света, которому миллионы лет. Безбрежное зрелище безбрежной Вселенной, частью которой я являюсь… Возможно, вещество моего тела было извергнуто из недр какой-то забытой звезды, так же как звёзды в небе сейчас извергают из себя вещество. Если взглянуть на них большим глазом Паломарской обсерватории, взглянуть как они разбегаются из какой-то общей стартовой точки в которой они, возможно, когда-то были вместе. Как это работает, в чём смысл всего этого. И почему? Мы знаем очень мало. Зная так мало, мы не можем причинить никакого ущерба таинству Вселенной.

Это гораздо более изумительно, чем истина, которую могли изобразить художники прошлого! Почему поэты современности не говорят об этом?

Что поэты за люди, если они говорят о Юпитере, если он как человек, но молчат, если он необъятный вращающийся шар из метана и аммиака?

  - Ричард Фейнман, «Фейнмановские лекции по физике», Том I.

Задавал ли Фейнман этот вопрос риторически или нет, но это не риторический вопрос: что за поэт может писать о Юпитере как о боге, но не о Юпитере как о необъятном шаре?

Если Юпитер — как мы, он может влюбиться и потерять любовь, а затем обрести её вновь.
Если Юпитер — как мы, он может бороться, придти к власти и быть свергнутым.
Если Юпитер — как мы, он может смеяться, или плакать, или плясать.

Если же Юпитер — необъятный вращающийся шар из метана и аммиака, то поэту гораздо сложнее заставить нас чувствовать.

Существуют поэты и рассказчики, которые говорят, что Великие Сюжеты не подвержены влиянию времени и никогда не меняются, только пересказываются. Они с гордостью говорят, что Шекспир и Софокл повязаны узами искусства более сильными, чем просто столетия, что двух создателей пьес можно было бы поменять местами во времени без серьёзных потрясений.

Дональд Браун когда-то создал список более чем двух сотен «универсальных человеческих понятий», которые можно найти во всех (или практически во всех) изученных человеческих культурах, от Сан-Франциско до бушменов, живущих в пустыне Калахари. В списке есть супружество, и табу на инцест, и материнская любовь, и соперничество братьев и сестёр, и музыка, и зависть, и танцы, и истории, и эстетика, и ритуальная лечебная магия, и поэзия, читаемая вслух с театральными паузами…

Любой, кто знаком с эволюционной психологией, вряд ли будет отрицать это: наши самые сильные эмоции глубоко заложены в нас, в наши кровь и кости, в мозг и ДНК.

Можно ожидать, что история Гамлета (с небольшими изменениями) могла быть рассказана в обществе первобытных людей сидящих возле костра в саванне.

Таким образом, можно понять, почему Джон «Расплети радугу» Китс мог чувствовать, что что-то было потеряно, когда выяснилось, что радуга — это солнечный свет, разлетающийся из капель воды. Капли воды не танцуют танцы.

В Ветхом Завете написано, что Бог как-то разрушил весь мир потопом, который покрыл водой всю землю и утопил всех ужасно виновных мужчин и женщин мира, вместе с их ужасно виновными детьми, но Ной построил гигантский деревянный ковчег, и т.д. И после того, как большинство людей было уничтожено, Бог поместил на небо радугу, как знак того, что он не будет делать подобного снова. По крайней мере, не с помощью воды.

Вы можете понять, как Китс был шокирован, когда этот прекрасный рассказ вступил в противоречие с современной наукой. Особенно если (как я описывал вчера) Китс не понимал в действительности физику радуги, если не было никакого «Ага!», никакого озарения, которое было бы по-своему потрясающим и могло бы заменить потерянную драму…

Но, возможно, Китс был бы прав в своём разочаровании, даже если он знал бы математику. Библейская история радуги — это рассказ о кровожадном убийстве и об улыбающемся безумии. Неужели что-то там о каплях и преломлении может достойно заменить это? Капли не кричат, когда умирают.

Таким образом, наука убивает романтику (сказал поэт романтизма), и то, что она даёт взамен, никоим образом не соответствует драме оригинала…

(то есть, оригинальному заблуждению)

…даже если вы знаете уравнения, потому что уравнения не о сильных эмоциях.

И это самый сильный ответ, который я могу придумать для поэта Романтизма, отвечающего Фейнману. Хоть я и не могу вспомнить, чтобы кто-нибудь так ответил.

Вы, наверное, полагаете, что я не согласен с поэтами Романтизма. Моя собственная позиция такова:

Юпитеру вовсе не необходимо быть как человек, потому что есть достаточно людей, которые как люди. Если Юпитер — необъятный вращающийся шар из метана и аммиака, то это не значит, что любовь и ненависть исчезли из мира. Несмотря ни на что, в мире по-прежнему существуют любящие и ненавидящие умы. Мы.

Когда нас более чем шесть миллиардов по последним подсчётам, неужели Юпитеру действительно необходимо быть в списке потенциальных действующих лиц?

Нет никакой необходимости рассказывать Великие Сюжеты о планетах и радугах. Эти сюжеты ежедневно разыгрываются повсюду среди нас. Каждый день кто-нибудь убивает из мести, каждый день кто-нибудь убивает друга по ошибке, каждый день свыше сотни тысяч людей влюбляются. И даже если бы это было не так, вы всё равно могли бы написать рассказ о людях, а не о Юпитере.

Земля стара, она множество раз разыгрывала под Солнцем одни и те же сценарии. И думается мне, что быть может пришло время некоторым из этих Великих Сюжетов измениться. Во всяком случае для меня рассказ, называемый «Прощай», потерял привлекательность.

Великие сюжеты не неизменны, потому что человеческий вид не неизменен. Если вернуться достаточно далеко назад в эволюции человека, то никто не поймёт Гамлета. Если вернуться достаточно далеко назад во времени, то не удастся найти ни одного мозга вообще.

Великие Сюжеты не вечны, потому что человеческий вид, Homo sapiens sapiens, не вечен. Я искренне сомневаюсь, что у нас есть ещё одна тысяча лет на жизнь в нашей современной форме. И я не грущу об этом: я думаю, мы можем быть лучше.

Я бы не хотел, чтобы все Великие Сюжеты были бы окончательно утеряны в будущем. По-моему, этот исход слабо отличается от Солнца, падающего в чёрную дыру.

Но Великие Сюжеты в их современной форме уже были рассказаны, причём многократно. Я не думаю, что есть что-то плохое в том, чтобы некоторые из них изменили бы свою форму или обрели бы более разнообразные финалы.

«И с тех пор они жили счастливо» выглядит достойным, чтобы попытаться хотя бы раз.

Человечество развивается, и Великие Сюжеты могут и должны разнообразиться. Частью этой этики является идея, что когда мы находим странности, мы должны уважать их достаточно для того, чтобы рассказать их историю честно. Даже если это делает создание поэзии сложнее.

Если вы достаточно хороший поэт, чтобы написать оду необъятному вращающемуся шару из метана и аммиака, то вы можете написать что-то новое о новой открытой части настоящей Вселенной. Это может быть не столь драматично, не столь захватывающе, как Гамлет. Но легенда о Гамлете уже была рассказана. Если вы пишете о Юпитере как о человеке, то вы обедняете сложность карты нашего мира, вы впихиваете Юпитер в привычный шаблон историй, которые уже были рассказаны на Земле.

«Поэма, посвящённая памяти сэра Исаака Ньютона» Джеймса Томсона восхваляет радугу за то, что она такая, какая она есть. Можно спорить о том, захватывает ли поэма Томсона так же, как Ламия Джона Китса, кто любил и потерял. Но легенды о любви, и о потере, и о цинизме уже были рассказаны ещё в Древней Греции, и, без сомнения, ещё и раньше, и множество раз. До тех пор, пока мы не поймём радугу как явление, отличающееся от легенд о придуманной человеком магии, истинная история радуги не может быть поэтизирована.

Граница между научной фантастикой и космической оперой была обозначена следующим образом: если вы можете взять сюжет и перенести его на Дикий Запад или в Средние Века без изменений, то это не настоящая научная фантастика. В настоящей наука — неотделимая часть сюжета: вам не удастся без потерь перенести действие из космоса в саванну.

Ричард Фейнман спросил: «Что поэты за люди, которые могут говорить о Юпитере, если он как человек, но молчат если он необъятный вращающийся шар из метана и аммиака?».

Они поэты саванны, они могут рассказывать только те истории, которые могли бы иметь смысл возле костра десять тысяч лет назад. Поэты саванны, которые могут рассказывать только Великие Сюжеты в их классических формах, и ничего больше.

Перевод: 
kuuff, Noumero
Номер в книге "Рациональность: от ИИ до зомби": 
201
Оцените качество перевода: 
Средняя оценка: 5 (7 votes)

Наслаждение обыденностью

Холодная наука убивает
Любое чудо. Радуга на небе
Пленяла красотою взоры наши.
Теперь же знаем мы её устройство,
И всё: занесена она в каталог
Унылых и обыденных вещей.
Джон Китс, «Ламия»

Автор: 
Элиезер Юдковский

Наслаждение обыденностью

Элиезер Юдковский

Холодная наука убивает
Любое чудо. Радуга на небе
Пленяла красотою взоры наши.
Теперь же знаем мы её устройство,
И всё: занесена она в каталог
Унылых и обыденных вещей.
Джон Китс, «Ламия»1

Ничто не «просто».
Ричард Фейнман 2

Наверняка вы должны оценить фразу «каталог унылых и обыденных вещей». Однако, что именно попадает в этот каталог? В смысле, кроме радуги?

Конечно же, туда попадает всё мирское. Всё естественное, всё немагическое. Всё, что уже познано или хотя бы познаваемо. Всё, что играет по правилам (или даже играет по любым правилам, что совсем скучно). Всё, что является частью обычной вселенной. Короче говоря, всё реальное.

И рассуждая так, вы загоняете себя в тупик.

Потому что рано или поздно вы разочаруетесь вообще во всём: что угодно либо не существует, либо — о, ужас — оказывается реальным.

Если мы не в состоянии наслаждаться обыденным, наша жизнь всегда будет пуста.

Чем провинились радуги, что их отправили в каталог обыденных вещей? У них появилось научное объяснение. Китс пишет: «Теперь же знаем мы её устройство». Слово «мы» здесь довольно интересно: подозреваю, сам Китс не знал, как устроена радуга. Вполне возможно, ему хватило того, что кто-то другой знает, как устроена радуга. Не исключено, что ему было бы сложно даже принять факт, что радугу в принципе можно объяснить научно. И даже если Китс на самом деле так не думал, я знаю достаточно людей, которые рассуждают именно так.

Я уже писал, что ничего по настоящему таинственного не существует. Если я не знаю о некоем явлении, это факт о состоянии моего разума, а не о самом явлении. Поклоняться явлению, потому что оно кажется восхитительно таинственным, значит поклоняться собственному невежеству. Пустая карта не соответствует пустой территории, она соответствует месту, где мы ещё не были. Ну и так далее.

И таким образом всё — абсолютно всё, что существует на самом деле, — в итоге должно оказаться в «каталоге унылых и обыденных вещей».

Поэтому есть два пути:

  • Решить, что для вас в мире всё равно есть что-то важное: пусть даже оно не волшебное, познаваемое и объяснимо с помощью науки.
  • Или всю оставшуюся жизнь страдать от экзистенциального разочарования.

(Другие люди могут выбрать путь самообмана, но для вас этот вариант закрыт.)

Здесь можно вспомнить про странную привычку чудаков, именуемых учёными: внезапно с заворожённым видом уставиться на мусор из кармана, или на помёт птиц, или на радугу, или на ещё что-нибудь обыденное, что умудрённые жизнью люди никогда не удостоят второго взгляда.

И подумать, что учёные — по крайней мере, некоторые — это такие люди, которые способны наслаждаться жизнью в реальной вселенной.

  • 1. В предыдущих эссе для перевода этого отрывка использовался перевод Сергея Сухарева, однако, к сожалению, он не содержит деталей, на которые ссылается Юдковский в этом эссе. — Прим.перев.
  • 2. В оригинале здесь использовано слово «mere», а эссе названо «Joy in the Merely Real». — Прим.перев.
Перевод: 
Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
202
Оцените качество перевода: 
Средняя оценка: 4.4 (5 votes)

Наслаждение открытием

Элиезер Юдковский

Ньютон — величайший из гениев, живших на Земле, и при этом самый удачливый. Ведь систему мира можно создать только один раз.

— Лагранж

Мне гораздо больше нравится открывать что-нибудь самому, чем читать о чужих открытиях в учебнике. Это нормально, естественно и ожидаемо.

Однако открыть нечто неведомое пока вообще никому, первым раскрыть какую-то тайну…

Есть байка о том, как кто-то из учёных, впервые осознавших, что звёзды горят благодаря термоядерному синтезу, — я встречал варианты с Фридрихом Хоутермансом и Хансом Бете — гулял ночью с девушкой. Девушка заметила, мол, как красивы звёзды, а учёный ответил: «Да, и в настоящий момент я единственный человек в мире, который знает, почему они сияют».

Многочисленные источники подтверждают, что ощущать себя первым человеком, разгадавшим сложную тайну, невероятно приятно. Вероятно, это ближе всего к приёму наркотиков без приёма наркотиков. Впрочем, откуда мне знать.

Это не здоро́во.

И дело не в том, что я против эйфории. Меня беспокоит исключительность переживания. Почему открытие должно ощущаться менее остро лишь потому, что ответ знает кто-то ещё?

Самое доброжелательное объяснение, которое я могу предложить, заключается в том, что вы не будете тратить на задачу месяцы или годы, если ответ можно найти в библиотеке. А невероятно приятное переживание приходит, когда вы рассматриваете задачу со всех возможных сторон, терпите неудачу, снова анализируете задачу, используете все идеи, которые вам приходят в голову, и все данные, до которых дотянутся руки. Вы продвигаетесь шаг за шагом и вот, в конце концов, у вас наступает озарение. Все торчащие концы и неразрешенные вопросы внезапно встают на свои места. Представьте, будто получив одну улику, вы раскрыли дюжину убийств в запертых комнатах.

Более того, вы по-настоящему понимаете решение задачи. Вы теперь в другом свете видите все подсказки, которые вы изучали в процессе решения. Ваше понимание родилось из задаваемых ежедневно вопросов и размышлений над ними, и никто не сможет его с вами разделить (неважно, сколько раз вы расскажете правильный ответ), пока не потратит месяцы на изучение этой задачи в её историческом контексте. И даже если кто-нибудь возьмётся за изучение этого контекста, он не получит этого ощущения, как все части встают на свои места.

Вероятно, поэтому Джеймс Клерк Максвелл, скорее всего, получил больше удовольствия от открытия уравнений Максвелла, чем вы, когда о них читали.

Менее приятное объяснение невероятного удовольствия проистекает из того, что на вежливом языке социальной психологии называется «вовлечением» , «стремлением к постоянству» и «когнитивным диссонансом». Чем больше усилий мы тратим для получения чего-либо, тем больше мы это ценим. Например, исследования показывают, что если подвергать желающих вступить в братство более суровым испытаниям, то они впоследствии больше ценят само братство. Аналогично, вино в более дорогой бутылке оценивается как более вкусное.

Естественно, нет ничего плохого, если вам нравится думание как процесс и потому вы получаете гораздо больше удовольствия от решения головоломки, чем от получения ответа напрямую. Менее приятно было бы обнаружить, что ответ на головоломку, за который вы заплатили 100 долларов, кажется вам более приятным, ценным, важным, удивительным и так далее, по сравнению с ответом, который вы получили бесплатно.

(Я подозреваю, что науку так сложно рекламировать среди широких масс, потому что многие люди считают, что если знание даётся бесплатно, ничего важного в нём нет. Возможно, если бы для получения правды об эволюции нужно было бы проходить устрашающий обряд, людей больше бы устраивал ответ.)

Самое неприятное объяснение заключается в том, что удовольствие первооткрывателя связано со статусом. Соревнование. Редкость. Всех обскакать. Неважно, трёхкомнатная или четырёхкомнатная у вас квартира, главное, что она больше, чем у Джонсов. Даже двухкомнатной хватит, если вы уверены, что у Джонсов будет меньше.

Вообще, я не против соревнований. Да, игра Го — это игра с нулевой суммой, но я не считаю её варварским пережитком, который нужно уничтожить. Но если эйфория от научного открытия связана с редкостью ресурса, это значит, что она доступна только одному человеку на цивилизацию на единицу истины.

Если удовольствие от научного открытие выдается по одному на открытие, тогда, с точки зрения теории веселья, Ньютон получил изрядную долю удовольствия из пула, выделенного всей разумной жизни на Земле — и прошлой, и будущей — на изучение физики. Эта эгоистичная сволочь объяснила орбиты планет и приливы!

А по сути ситуация ещё хуже, потому что в Стандартной Модели физики (открытой сволочами, испортившими головоломку всем остальным) Вселенная бесконечна в пространстве, ветвится инфляционно и ветвится квантово, то есть у реальности есть по меньшей мере три способа оказаться экспоненциально или бесконечно огромной.

Поэтому пришельцы, или альтернативные версии Ньютона, или даже дубликаты Ньютона по Тегмарку могли открыть закон тяготения до нашего Ньютона — если предполагать, что в такого рода рассуждениях вообще имеет смысл слово «до».

Когда я впервые об этом задумался, это меня несколько приободрило. Если уж я понимаю, что кто-то где-то на просторах пространства и времени уже знает ответ на любой вопрос, на который в принципе возможен ответ, — даже на вопрос из области биологии или истории, ведь есть Земли, некогерентные нашей, — то как-то глупо думать, что удовольствие от открытия способен получить лишь один человек.

Такой расклад приводил бы к бесконечным неразрешимым экзистенциальным страданиям, поэтому я считаю, что мы получили противоречие.

Непротиворечивое решение, позволяющее получать удовольствие, — перестать беспокоиться о том, что знают другие люди. Если вы не знаете ответ, то для вас тайна сохраняется. Если вы можете поднять руку, сжать пальцы в кулак и при этом не знаете, как ваш мозг это сделал, — или даже не знаете, какие именно мышцы проходят под кожей, — можете считать себя столь же невежественным, как и охотник-собиратель. Конечно, кто-то другой знает ответ, но и в дни охотников-собирателей кто-то на альтернативной Земле или, что то же самое, кто-то из будущего знал ответ. Тайна и удовольствие от открытия либо вещь личная, либо несуществующая. И я предпочитаю думать, что она личная.

Удовольствие, которое можно получить, открыв для цивилизации нечто доселе неизвестное, действительно единично в расчёте на открытие на цивилизацию. Это редкая штука, примерно как Нобелевская премия. Ради такой награды кто-нибудь действительно может сосредоточиться над одной задачи на долгие годы, а именно это необходимо для поистине глубокого понимания. Вдобавок, работа над задачей, нерешённой цивилизацией, — надёжный способ избежать спойлеров.

Однако я хочу опровергнуть идею, что рационалисты меньше веселятся. И, в частности, я хочу вернуть магию и тайну во все части мироздания, которые лично вы не понимаете. Неважно, какое знание и где существует. Может быть, оно есть где-то далеко в пространстве и времени, может, об этом знает человек в соседней квартире. Если что-то не знаете вы, это тайна. А теперь подумайте, как много всего вы не знаете! (Если вам ничего не приходит в голову, у вас другие проблемы.) Разве мир не стал внезапно гораздо более загадочным, волшебным и увлекательным? Как будто вас переместили в альтернативное измерение, где нужно выучить все правила с нуля?

Однажды мой друг заметил, что я смотрю на мир так, как будто никогда не видел его раньше. Я подумал, какой милый комплимент… Погодите-ка! Я никогда не видел его раньше! Разве у кого-то бывает предпоказ?

Ран Прие

Перевод: 
sepremento, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
203
Оцените качество перевода: 
Средняя оценка: 5 (7 votes)

Привяжись к реальности

Элиезер Юдковский

Возможно, вы читаете вот это всё и задаётесь вопросом: «Хорошо, но при чём тут редукционизм

Отчасти я хочу оставить путь к отступлению. Сложно разбирать на части нечто важное, когда ты убеждён, что в процессе из мира исчезнет сказка и обесценится радуга. В этой книге я действительно планирую кое-что разобрать на части, и я предпочёл бы не плодить бессмысленное экзистенциальное страдание.

Отчасти это крестовый поход против рациональности по-голливудски, где принято считать, будто понимание радуги уничтожает её красоту. Нет, радуга остаётся прекрасной, а вы вдобавок получаете красоту физики.

Однако ещё, что гораздо более важно, я здесь рассуждаю об одной из идей, которые вроде бы незаметны, но на самом деле очень важны для понимания рациональности. Одной из тех штук, которые я подразумеваю, когда начинаю говорить о «Пути». А именно, о привязке к реальности.

Если я правильно помню, в одной из книг цикла о Дюне Фрэнка Герберта сказано, что Правдовидец, который сам говорит только правду, получает возможность определять ложь других людей, потому что у него формируются особые отношения с правдой и он начинает ощущать отклонения от неё. В реальности так не бывает, но я всё равно считаю это одной из красивейших мыслей в художественной литературе. Чтобы приблизиться к правде, необходимо как минимум прильнуть к реальности как можно сильнее, без страха и отговорок.

Тема привязки к реальности уже затрагивалась в эссе «Лотереи: бессмысленная трата надежды». Когда вы осознаете, что лотерейные билеты обладают отрицательной ожидаемой полезностью, вы не теряете надежду разбогатеть. Но вы перестаёте тратить эту надежду на лотерейные билеты. Вы вкладываете её в работу, в образование, свой стартап, в халтурку на eBay. А если вам и правда не на что надеяться, возможно, стоит начать поиск.

Как по мне, мечтать — это нормально. Но не стоит мечтать о невозможном. Выиграть в лотерею возможно, но вероятность выигрыша близка к нулю и её нельзя увеличить своими действиями. Нельзя сказать, что выиграть в лотерею чрезвычайно тяжело, в смысле, что это требует отчаянных усилий. Усилия здесь просто не причём.

Я говорю это, чтобы показать пример, как можно взять бесцельный поток эмоциональной энергии и привязать его к реальности.

Я не хочу сказать, что нужно ставить приземлённые «реалистичные» цели: лёгкие, безопасные, одобряемые родителями. Возможно, для кого-то это окажется неплохим советом, но сейчас я не об этом.

Я хочу сказать, что эмоциональную энергию можно вкладывать в радугу, даже если она окажется не волшебством. Будущее всегда абсурдно, но всегда реально.

Стереотип рациональности по-голливудски говорит, что «рациональный = безэмоциональный». Чем вы более рассудительны, тем больше эмоций ваш рассудок неизбежно уничтожит. В эссе «Мне сегодня рационально» я противопоставляю этой позиции тезисы «То, что может быть разрушено правдой, должно быть разрушено» и «То, что питается правдой, должно расцветать». Как только вы создадите свой лучший набросок истины, нет ничего иррационального в эмоциях, которые вы испытаете. Раз эти эмоции не были уничтожены правдой, ничего иррационального в них нет.

Потому вместо того, чтобы уничтожать эмоциональную энергию, вызванную плохим объяснением радуги, как того требует стереотип рациональности по-голливудски, давайте перенаправим её на реальность — свяжем её с убеждениями настолько истинными, насколько получится.

Хотите летать? Не бросайте саму идею полёта. Бросайте придумывать зелья полёта и стройте самолёт.

Помните, в эссе «Думай как реальность» я рассуждал о том, что если кажется, будто физика противоречит интуиции, то это не физика странная, это ты — странный?

Сейчас я говорю примерно о том же, только вместо гипотез у нас эмоции. Привяжите свои чувства к реальному миру. Не к «реалистичной» повседневности. Я был бы ужасным лицемером, если бы призывал вас заткнуться и идти делать домашнюю работу. Я имею в виду настоящий реальный мир — Вселенную и её законы, со всем её абсурдом вроде посадки на Луну и эволюции интеллекта человека. Но в котором нет магии, нигде и ни в каком виде.

Мем рациональности по-голливудски гласит: «Наука лишает жизнь веселья».

Наука возвращает веселье в жизнь.

Рациональность направляет вашу эмоциональную энергию во Вселенную, а не куда-то ещё.

Перевод: 
sepremento, Alaric, ildaar
Номер в книге "Рациональность: от ИИ до зомби": 
204
Оцените качество перевода: 
Средняя оценка: 4.6 (10 votes)

Если вам нужна магия, магия не поможет

Элиезер Юдковский

Большинство ведьм вообще не верят ни в каких богов. Они, конечно, знают, что боги существуют. Мало того, время от времени им даже приходится иметь с ними дело. Но вот верить… Нет, в богов ведьмы не верят. Слишком уж хорошо они знают этих самых богов. Это все равно что верить, например, в почтальона.

— Терри Пратчетт, «Ведьмы за границей».1

Когда-то давно я размышлял о философии фэнтези…

И прежде чем кто-то попрекнёт меня, мол, я «не понял, в чём суть фэнтези», позвольте пояснить: я вырос среди научной фантастики и фэнтези. Я читаю фэнтези с пяти лет. Иногда я пытаюсь писать фэнтези. И я не из тех людей, что пытаются писать, не задумавшись предварительно над философией жанра. Откуда по-вашему берутся идеи?

Как бы то ни было:

Я размышлял о философии фэнтези и мне пришло в голову, что существуй в мире настоящие драконы — если бы можно было пойти в зоопарк или хотя бы в далёкие горы и встретить огнедышащего дракона, — но при этом никто никогда не встречал бы зебру, то драконы бы не будоражили воображение, а фэнтези изобиловало бы зебрами.

Как по мне, это прекрасный способ загнать себя в угол. Трава всегда зеленее по другую сторону нереальности.

Возьмём типичный сюжет для фэнтези: протагонист с Земли — неплохой малый, который плохо учился в школе или задолжал за ипотеку, однако всё ещё добр душой — внезапно оказывается в мире, где магия заняла место науки. Часто протагонист начинает заниматься магией и постепенно становится (могущественным) чародеем.

Итак, вопрос, несколько грубый, но его нужно задать:

Скорее всего, большинство читателей таких романов представляют себя на месте протагониста и мечтают получить магические способности. Жаждут магии. Также, за исключением небольшого числа людей, большинство читателей этих романов учёными не являются.

То есть, родившись в мире науки, учёными они не стали. Почему они думают, что они вели бы себя по-другому, если бы родились в мире магии?

Научный подход — это способность заинтересоваться обыденным, это умение понять, что ничто не «просто». Если человек не способен заинтересоваться обыденным, чем ему поможет магия? Если он обнаружит в себе магию, она окажется обыденностью. Она перестанет очаровывать своей недоступностью. Да, возможно, сперва он обрадуется, но (как у большинства выигравших в лотерею, которые спустя шесть месяцев оказались вовсе не столь счастливы, как они ожидали) радость скоро исчезнет. Скорее всего, это произойдёт именно тогда, когда придётся всерьёз изучать заклинания.

Разве что они научатся наслаждаться обыденностью. Если полёт на дельтаплане их будет восхищать так же, как поездка на драконе. Если электрический свет восхитит их не меньше, чем магический… даже если для этого придётся немного подучиться…

Поймите меня правильно, я не против драконов. Кто знает, когда-нибудь мы, возможно, даже создадим парочку.

Но если вас не радует полёт на обыденном дельтаплане, то вряд ли вас восхитит полёт на драконе, когда они станут реальностью.

Думаете, что предпочли бы жить в будущем, а не в настоящем? Такое предпочтение вполне понятно. Кажется, с течением времени мир становится лучше.

Но не забывайте: для Тёмных Веков тысячелетней давности мы живём в будущем. У нас есть возможности, о которых не могли мечтать даже короли.

Если тренд сохранится, то будущее, вероятно, будет очень приятным местом. Но если вы до него доживёте, то обнаружите всего лишь новое настоящее. Если вы в целом не способны радоваться настоящему, если эмоциональная энергия уходит исключительно в будущее, если вы умеете надеяться только на лучшее завтра, то не важно, на какое время нужно перенестись – это не поможет.

(Да, возможно, в будущем появятся таблетки, которые решат проблему с эмоциональной привязкой к будущему. Не думаю, что это как-то меняет мою основную мысль. Важно то, какие таблетки мы захотим принимать.)

Мэтью С.2 в своих комментариях на LessWrong восхищается неформальной «теорией» Руперта Шелдрейка, которая «объясняет» такие не требующие объяснения явления как сворачивание белка и симметрия снежинки. Почему же Мэтью С. не восхищается, например, специальной теорией относительности? Почему его не радует СТО, которая является одним из признанных законов? Восхищаться признанным и верным законом гораздо удобнее — такое восхищение не испарится.

Если бы теория Шелдрейка была признанной истиной и преподавалась в начальной школе, то Мэтью С. было бы на неё наплевать. С чего бы ему восхищаться одним законом физики больше, чем остальными?

Можете ли вы представить более ужасную катастрофу для движения Нью-эйдж, чем обнаружить, что их ритуалы и в самом деле работают? Или, допустим, что в небе появились настоящие «летающие тарелки». Какой смысл верить в инопланетян, если вот они – просто существуют, и все остальные тоже их видят? В мире, где паранормальные способности обыденны, последователи Нью-эйдж не стали бы в них верить. Сейчас же практически никому не приходит в голову верить в гравитацию. (Кроме учёных, разумеется.)

Почему я так настроен против магии? Разве не лучше было бы, если бы она существовала?

Вообще-то я не против магии. Напомню: иногда я пытаюсь писать фэнтези. Но меня раздражают подобные мечтания о магии. При таком подходе родившийся в мире заклинаний и зелий тосковал бы о мире, где налажено конвейерное производство предметов обихода.

Чтобы привязаться к реальности, как на эмоциональном, так и на интеллектуальном уровне, нужно в том числе примириться с фактом, что вы живёте именно здесь. Только так можно увидеть мир и все возможности, которые он даёт, без желания отвести взгляд.

Скажу прямо: в мире, где я родился, хватает драконов, чтобы с ними сражаться, и магии, чтобы её изучать. А если я вдруг окажусь в каком-то из фэнтези-миров, то не удивлюсь, обнаружив себя за изучением запретного могущественного заклинания.

Ведь перемещение в мир магии ничего не меняет. Важно не где ты, а кто ты.

А потому запомните Литанию против перемещений в альтернативную вселенную:

Если я собираюсь:
Где-либо быть счастливым,
Или в чем-то достичь величия,
Или где-то разгадывать тайны,
Или мир какой-то спасти,
Или о чём-то сильно заботиться,
Или где-то помочь людям,
То я вполне могу это сделать и здесь.

  • 1. Использован перевод П. Киракозова. — Прим.перев.
  • 2. Речь идёт о том же пользователе, который упоминался в эссе «Редукционизм». — Прим.перев.
Перевод: 
sepremento, Alaric, ildaar
Номер в книге "Рациональность: от ИИ до зомби": 
205
Оцените качество перевода: 
Средняя оценка: 4.6 (19 votes)

Обыденная магия

Элиезер Юдковский

Я считаю, что рационалисту следует эмоционально привязываться к редукционистской вселенной — вселенной, которой полностью управляют строгие законы и в которой нет таких сверхъестественных сущностей, как душа или магия. Рационалисту стоит вкладывать всю свою надежду и всё своё внимание в эту обычную вселенную и её возможности, принимая её такой, какая она есть.

У буддистов есть старый трюк для борьбы с дуккха: надо составить список вещей, за которые ты благодарен, вроде крыши над головой.

Так почему бы не составить список способностей, которые есть у нас и которые были бы супер крутыми, если были бы магией или если бы ими обладали лишь избранные?

Например, предположим, что вместо одного глаза у нас во лбу был бы ещё магический второй глаз. И этот второй глаз позволял бы нам заглядывать в третье измерение — то есть, можно было бы легко сказать, насколько далеко находится тот или иной предмет, — в то время как один глаз позволял бы видеть только двумерную тень настоящего мира. Лишь те, у кого был бы такой второй глаз, могли бы точно целиться из легендарного оружия, убивающего на расстоянии, гораздо большем досягаемости меча. Или на полную мощь использовать сверхбыстрые механизмы, именуемые «автомобилями».

«Бинокулярное зрение» — не слишком интересное название для такой крутой способности. Она нас впечатлит, лишь если получит достойное, внушающее уважение имя. Например: «Мистический Глаз Глубокого Восприятия».

Вот вам список моих любимых магических способностей:

  • Вибрационная телепатия. Обладатели этой способности способны передавать невидимые вибрации через сам воздух, и это позволяет им делиться мыслями. Благодаря этому вибрационные телепаты создают друг с другом очень глубокие эмоциональные связи, недоступные другим приматам.

  • Психометрическое узорничество. Психометрический узорник оставляет на поверхностях небольшие аккуратные узоры и благодаря этому может оставлять впечатления об эмоциях, истории, знаниях, даже о структуре других заклинаний. Эта способность гораздо сильнее, чем вибрационная телепатия, так как узорник способен делиться мыслями давно умерших узорников, живших тысячи лет назад. Смотря на один узор и одновременно рисуя другой, узорник способен множить узоры, а эти узоры могут содержать подробное описание другой магии. Поэтому маги-узорники владеют практически невообразимыми силами. Но если узорник попробует использовать сложный узор, который не в состоянии нарисовать сам, у него могут появиться проблемы.

  • Многомерный кинез. Простейшим, практически неосознаваемым волевым усилием кинетики направляют экстраординарно сложные силы сквозь крохотные щупальца в любой физический объект в пределах досягаемости. Кинетики способны не просто толкнуть объект, а произвести несколько разных толчков с различных направлений, что позволяет создавать вращающие моменты и искривления. Эта способность не так проста, как кажется. Кинетики используют ее не только для управления уже существующими объектами с потрясающей точностью, они ещё и заставляют силы изменять объекты так, что ими становится ещё проще управлять. Кинетики даже создают инструменты, увеличивающие силу их кинеза, которые, в свою очередь, позволяют создавать еще более точные и сложные инструменты. Надеюсь, вы понимаете, насколько впечатляющей является такая цепь положительной обратной связи.

  • Око. Владеющий этой способностью способен замечать мельчайшие движущиеся возмущения в Силе, что скрепляет материю — крохотные колебания, подобные дарящим жизнь силам Солнца, падающим на листву, но гораздо менее заметные. Носитель Ока может ощущать объекты, находящиеся на расстоянии, намного превышающем расстояние касания, благодаря мелким возмущениям в Силе, которые создают эти объекты. Носители Ока способны постичь горы, до которых нужно идти много дней, с той же лёгкостью, как если бы до них можно было достать рукой. Согласно носителям Ока, когда опускается ночь и гаснет свет солнца, они могут ощущать огромные пылающие огни на немыслимом расстоянии. Впрочем, никто не способен это проверить. Говорят, обладание Оком делает его носителя равным королям.

И наконец,

  • Абсолютная Сила. Обладающий этой способностью вмещает в себе крохотную, несовершенную копию всей вселенной, что позволяет ему выискивать пути в вероятностях к любому желаемому будущему. Если вам кажется, что эта способность могущественна до абсурда, вы правы. Если она появляется в какой-то игре, она рушит весь игровой баланс. Среди жизненных форм она встречается невероятно редко. Это воистину «тайная техника мира».

    Ничто не может противостоять Абсолютной Силе, кроме другой Абсолютной Силы. Любая сила, не дотягивающая до абсолютной окажется просто «осмыслена» Абсолютной и рассеяна каким-нибудь непостижимым образом. Возможно, Абсолютная Сила даже поглотит её и сделает частью своего могущества. Поэтому, Абсолютная Сила иногда зовется «Главной техникой техник» или «Козырем, который бьёт все другие козыри». «Осмысление» самых могущественных Абсолютов распространяется на галактические расстояния и целые временные эпохи. Такие Абсолюты способны постигнуть даже странные законы тайного «мира за миром».

    Абсолюты погибают от крупных природных катастроф или от невероятно быстрых внезапных атак, которые не дают им возможности использовать свою силу. Но такие победы над Абсолютами, в сущности, вопрос удачи. Они не ставят под сомнения способность Абсолюта подчинять вероятности своей воле, и, если он переживет атаку, то начнёт подчинять само Время, чтобы избежать атак в будущем.

    Однако Абсолютная Сила опасна сама по себе, и множество Абсолютов пали жертвой собственных сил – ошибки в их несовершенных внутренних копиях мира уничтожили их.

    Абсолют остаётся одной из опаснейших жизненных форм на планете, даже если его лишить оружия и брони и запереть в клетке. Можно сломать меч, можно отрубить конечность, но Абсолютную Силу невозможно отобрать, не убив её носителя.

    Возможно из-за того, что связь Абсолютов со своей Силой очень сильна, Абсолюты относятся к тем, кто утратил Абсолютную Силу без надежды на восстановление, как к «мёртвым, пусть и дышащим». Абсолюты утверждают, что именно Абсолютная Сила делает существо самим собой, что это не просто средство. Абсолюты даже настаивают на том, что те, кто не обладает Абсолютной Силой, не в состоянии по-настоящему её осмыслить, и, следовательно, не могут понять, почему она настолько необходима – подозрительно удобный аргумент, кстати.

    Власть Абсолютов неоспорима, и другие формы жизни для них не более чем пешки.

Перевод: 
Muyyd, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
206
Оцените качество перевода: 
Средняя оценка: 3.2 (48 votes)

Красота устоявшейся науки

Элиезер Юдковский

Фактам не нужно быть необъяснимыми, чтобы быть красивыми. Истина не становится менее достойна изучения если кто-то другой её уже знает. Убеждения не становятся менее стоящими, если их разделяют другие…

…к тому же, если обращать внимание только на спорные научные вопросы, то голова в конце-концов окажется забита мусором.

СМИ считают, что только самые сенсационные научные открытия достойны репортажей. Часто ли вам встречаются заголовки наподобие «Общая теория относительности всё ещё управляет орбитами планет» или «Теория флогистона остаётся ложной»? Получается, как только сенсационное открытие становится устоявшейся наукой, оно больше не горячая новость. А наука, которая «достойна репортажа», часто основана на мельчайших доказательствах и в половине случаев ошибочна. Не находись она на самом краю переднего рубежа научного знания, не быть ей горячей новостью.

Научные противоречия обычно касаются настолько сложных вещей, что даже люди, посвятившие годы изучению конкретной области, могут заблуждаться. Это-то и делает жаркие споры такими привлекательными для СМИ.

Что ещё хуже, такие противоречия вообще не приносят удовольствия тому, кто не разбирается в данной области и не принимает участия в этой игре.

Конечно же, можно повеселиться, выбрав за кого болеть в споре. Но тогда это мало чем отличается от футбола. А удовольствие от науки заключается не в этом.

Читая хорошо написанный учебник, получаешь: аккуратно сформулированные объяснения для начинающих учеников, шаг за шагом выведенную математику (где она используется), большое количество экспериментов, приведённых в качестве наглядного материала (там, где они применяются), тестовые задания на которых можно проявить только что полученные навыки, а ещё достаточно хорошую гарантию того, что изучаемое на самом деле верно.

Читая пресс-релизы, обычно получаешь: лжеобъяснения, которые дают лишь иллюзию понимания обсуждаемого результата, который автор пресс-релиза и сам не понял, и который, скорее всего, никто не сможет повторить.

Современная наука построена на открытиях, построенных на открытиях, построенных на открытиях, и так далее, вплоть до людей вроде Архимеда, которые открыли факты, наподобие причины плавания кораблей. Вплоть до открытий, которые можно понять, даже ничего не зная о других открытиях. Самое лучшее место, с которого стоит начинать путешествие — это начало.

Не надо стесняться читать научные книги для начинающих. Если хочется притвориться утончённым знатоком, пойди и почитай детектив. Если просто хочется получить удовольствие — помни, что простота находится в самом центре научной красоты.

Считать, что можно сразу же отправиться на передний рубеж накопленных знаний, не будучи знакомым с устоявшейся наукой — это всё равно, что…

…пытаться взобраться по верхней половине Эвереста (а это единственная его часть, которая тебе интересна) встав у подножия горы, приседая, и подпрыгивая очень старательно (чтобы пропустить все неинтересные части)

Я, на самом деле, не пытаюсь сказать, что на научные разногласия вовсе не надо обращать внимания. Если 40% онкологов считают, что белые носки вызывают рак, а другие 60% яростно с ними спорят — это важный факт и о нём стоит знать.

Просто не стоит думать, что противоречия — это то, без чего наука не может быть интересной.

И уж тем более не надо думать, что интересной может быть лишь новейшая наука. Стабильная подпитка научными новостями вредит: ты — то, что ты ешь. Если потреблять только скоропортящиеся новости и никогда не читать проверенные временем учебники, то так и мозг может сгнить.

Перевод: 
Нефёдов Е.А.
Номер в книге "Рациональность: от ИИ до зомби": 
207
Оцените качество перевода: 
Средняя оценка: 5 (4 votes)

Первое апреля: День удивительного открытия

Элиезер Юдковский

Вы, наверное, думаете: «Первое апреля… разве это не день дурака?»

Да. И это даёт нам идеальное прикрытие для празднования Дня удивительного открытия.

Как я уже писал в «Красоте устоявшейся науки», когда СМИ пишут о науке, они сосредотачиваются только на сенсациях. И это большая проблема. Сенсации в науке возникают лишь на самом переднем крае, а это значит, что новое открытие:

  • Спорно;
  • Подтверждено лишь одним экспериментом;
  • Ужасно сложно для простого смертного. Чтобы его понять, нужно огромное количество предварительных знаний — собственно, поэтому оно и не произошло ещё три столетия назад.
  • Впоследствии окажется неверным.

При этом людям не показывают надёжные знания, не говоря уже о понятных вещах — ведь это не сенсации.

В День удивительного открытия я предлагаю журналистам, которым действительно важна наука, рассказывать читателям — под прикрытием первого апреля — такие важные, но забытые истории, как:

Обратите внимание, что все заголовки истинны — они описывают события, которые на самом деле произошли. Правда, не вчера.

В истории науки было множество удивительных открытий, которые поймёт практически любой. Даже человек без кандидатской степени или вообще без высшего образования. Вспомните, как Архимед воскликнул «Эврика!» в тот миг, когда понял связь между объёмом воды, который вытесняет корабль и причиной его плавучести. По меркам науки это произошло достаточно давно, и поэтому для понимания теории не нужно знать о пятидесяти других открытиях. Для её объяснения достаточно пары графиков. Любой человек понимает, как её применить. А сам эксперимент можно воспроизвести в ванной.

Современная наука строится на открытиях, которые основаны на других открытиях, а те, в свою очередь, на других открытиях и так далее вплоть до Архимеда. Рассказывать о науке только в виде сенсаций всё равно что зайти в кинотеатр на последней четверти фильма, написать заметку о том, как «окровавленный мужчина целует девушку с пистолетом», и выйти.

А если ваш редактор скажет: «Но читателям это будет неинтересно…»

Тогда скажите, что на Reddit и Digg бывают ссылки не только на сенсации. Ещё бывают ссылки на короткие статьи с добротными объяснениями устоявшейся науки. Читатели голосуют «за», а это о чём-то говорит. Объясните, что если газета не будет похожа на Reddit, то, чтобы платить зарплату, придётся продавать наркотики. Редакторам нравятся такие разговоры, да?

В Интернете новое качественное объяснение устоявшейся науки — это новость и распространяется подобно новости. Так почему бы научным разделам в газетах не взять этот способ на вооружение? Почему новое объяснение не достойно колонки?

Однако это будет уже следующим шагом. Пока что давайте понаблюдаем, подхватят ли журналисты идею с «Днём удивительного открытия» и расскажут ли о каком-то понятном научном событии так, как будто оно только что произошло.

Первое апреля. Запишите себе в календарь.

Перевод: 
sepremento, Alaric, ildaar
Номер в книге "Рациональность: от ИИ до зомби": 
208
Оцените качество перевода: 
Средняя оценка: 4.8 (8 votes)

Гуманизм — замена религии?

Элиезер Юдковский

Задолго до братьев Райт человек мечтал о волшебных зельях, позволяющих летать. В самом по себе желании летать не было ничего иррационального. Не было ничего зазорного в желании посмотреть на облако сверху вниз. Иррациональность крылась лишь в «волшебных зельях».

Предположим, пока я смотрел запуск космического шаттла, меня положили в томограф и записали активность моего мозга. (Хотя желание полететь в космос не «реалистично», это в общем-то правомочная мечта — её можно осуществить согласно законам вселенной). Не исключено, что записанная активность будет похожа на активность мозга набожного христианина при виде картины с изображением Рождества.

Если эксперимент действительно даст такой результат, то многие, как христиане, так и некоторые атеисты, позлорадствуют: «Ха-ха, так значит, твоя религия — космические полёты!»

Однако подобное проведение границ неверно. Это всё равно что считать, что раз кто-то когда-то пытался взлететь при помощи иррациональных средств, то теперь никому никогда нельзя наслаждаться видом облаков под крылом самолёта.

Хотя при виде запуска космического корабля я и испытываю ощущение прикосновения к чему-то запредельному, я не считаю, что космические корабли для меня — суррогат религии. Считать иначе было бы теоморфизмом — точкой зрения злорадствующих фанатиков, которые считают, что у всех нерелигиозных людей есть некая дыра в сознании, которая требует заполнения.

Впрочем, справедливости ради, не всегда это просто злорадство. У некоторых атеистов действительно есть такая дыра в сознании. Я наблюдал попытки заменить религию атеизмом или даже трансгуманизмом. Результат неизменно ужасен. Крайне ужасен. Абсолютно унизительно ужасен.

Я называю такие ситуации «гимнами отсутствию Бога».

Когда кто-нибудь начинает писать атеистический гимн — «Славься, о неразумная вселенная», ну и так далее — в результате всегда, без исключений, получится отстой.

Почему? Потому что это подражание. Потому что такие гимны появляются на свет исключительно из-за смутного ощущения, что раз у церквей есть гимны, то нам тоже надо завести свой. И на художественном уровне результат получается значительно хуже искреннего религиозного искусства, которое выражает подлинные эмоции, а не подражает чему-то.

Религиозные гимны (в большинстве своём) писали искренне верующие люди, которые вкладывали все свои силы в ритм, стихи и образы. В итоге получались изящные и художественно целостные произведения.

Так что же, атеисты обречены жить без гимнов?

Вот вам лакмусовая бумажка для проверки на пост-теизм: «Если бы у человечества никогда не было религии — если бы мы не допустили первородной ошибки — имела ли бы смысл эта песня, эта картина, этот ритуал, этот способ мышления?»

Если бы человечество не допустило первородной ошибки, никто не пел бы гимны отсутствию Бога. Однако браки всё равно бы существовали, поэтому церемония атеистического бракосочетания точно имеет смысл — во всяком случае пока вам неожиданно не приходит в голову толкнуть на ней речь о том, что Бога нет. Потому что в мире, где религии никогда не было, никто не станет прерывать свадьбу разговором о невозможности гипотетической концепции. Люди будут говорить о любви, детях, ответственности, честности, преданности, но кто, блин, вспомнит Бога?

Так же и в мире, где никогда не существовала религия, найдутся люди, которые прослезятся, наблюдая за запуском космического шаттла.

Именно поэтому, даже если эксперимент покажет, что когда я смотрю запуск шаттла, у меня активируются те же зоны мозга, которые обычно «отвечают за религию» и связаны с чувством чего-то запредельного, я не буду считать космические корабли подменой религии. Я ожидаю, что те же самые зоны мозга стали бы активными по тем же самым причинам даже в том мире, где никогда не существовала религия.

Хороший «атеистический гимн» — это просто песня, не содержащая религиозных мотивов, о чём угодно, достойном песни.

Помимо прочего, обратное глупости не есть ум. Величайший дурак в мире может заявить, что Солнце светит и это не заставит его погаснуть. Смысл не в том, чтобы создать образ жизни, во всех отношениях как можно менее похожий на религию — именно такой стиль мышления заставляет писать гимны отсутствию Бога. Не соверши человечество первородной ошибки, никто не пытался бы избегать вещей, напоминающих религию. Выбирайте убеждения с умом, а чувства приводите в соответствие с убеждениями: если полёты в космос существуют на самом деле, а взлёт ракеты заставляет вас петь, то напишите, чёрт возьми, песню!

Если мои глаза наполняются слезами от запуска космического шаттла, то это не значит, что я пытаюсь заполнить дыру, которая осталась от религии — это значит, что моя эмоциональная энергия, моё небезразличие связаны с реальным миром.

Если бы Бог говорил отчётливо и ясно отвечал на молитвы, то он стал бы очередным скучным элементом повседневности. Верить в него было бы всё равно, что верить в почтальона. Если бы Бог действительно существовал, то пропала бы внутренняя неопределённость, которая вызывает тягу к действиям для своей компенсации. А если бы в Бога верили все вокруг, то пропало бы чувство своей особенности, ощущение себя одним из избранных.

Если вы вкладываете свою эмоциональную энергию в космические полёты, у вас нет таких проблем. Я могу смотреть на взлёт космического шаттла и всё равно восхищаться. Любой человек может верить, что космические шаттлы реальны, но это не сделает их менее особенными. Я не загнал себя в угол своими фантазиями.

Выбор между Богом и человечеством — это не выбор препарата для галлюцинаций. В конце концов, человечество и впрямь существует.

Перевод: 
sepremento, Alaric, ildaar
Номер в книге "Рациональность: от ИИ до зомби": 
209
Оцените качество перевода: 
Средняя оценка: 4.6 (10 votes)

Дефицит

Элиезер Юдковский

Нижеследующее в основном взято из книги Роберта Чалдини «Психология влияния»1. Я держу у себя эту книгу в трёх экземплярах: один для себя и ещё два, чтобы одалживать друзьям.

Социальная психология называет «дефицитом» ситуацию, когда нечто становится более желанным, если кажется, что оно менее доступно.

  • Если двухлетний малыш окажется в комнате с двумя игрушками, одна из которых легко доступна, а другая находится за плексигласовой стеной, то малыш проигнорирует доступную игрушку и пойдёт к той, что кажется запретной. Если стена достаточно низкая и через неё легко перелезть, то разница в предпочтении между игрушками исчезает.2
  • Когда в округе Дейд запретили покупать и хранить фосфатные моющие средства, многие жители ездили в соседние округа и покупали огромное количество этих средств. По сравнению с жителями округа Тампа, где такого запрета не было, жители округа Дейд считали, что фосфатные средства мягче, эффективнее, лучше справляются с въевшимися пятнами, и даже полагали, что фосфатные моющие средства легче наливать.3

Аналогично, информация, которая подаётся как запретная или секретная, кажется более важной и достоверной.

  • Когда студенты университета Северной Каролины узнавали, что критика совместных общежитий запрещается, они начинали хуже относиться к совместным общежитиям (даже не знакомясь с этой критикой).4
  • Когда у водителя была страховка ответственности, то присяжные в эксперименте назначали его жертве в среднем на четыре тысячи долларов компенсации больше, чем если у него такой страховки не было. Однако, если впоследствии судья говорил присяжным, что информация о страховке недоступна и её нужно игнорировать, то присяжные назначали в среднем на тринадцать тысяч долларов больше, чем если у водителя не было страховки.5
  • Покупатели в магазинах, которым говорили, что говядина в дефиците, покупали говядины в два раза больше тех, кому говорили, что её достаточно. Покупатели, которым говорили, что говядина в дефиците и более того, информация об этом дефиците сама по себе дефицит — то есть мало кто знает, что говядины мало — покупали в шесть раз больше. (Поскольку исследование проводилось в полевых условиях, информация была фактически правдивой.)6

Обычно это явление объясняется «психологическим реактивным сопротивлением». Это словосочетание для социальных психологов заменяет фразу: «когда говоришь людям чего-то не делать, они начинают прикладывать ещё больше усилий». Судя по всему, здесь задействованы такие фундаментальные инстинкты, как сохранение статуса и сохранение возможностей. Когда какие-то другие люди пытаются ограничить нашу свободу, мы сопротивляемся. А когда есть риск потерять некую возможность, пусть даже по естественным причинам, мы пытаемся ухватиться за неё до исчезновения.

В обществе охотников-собирателей привычка хвататься за исчезающие возможности, вероятно, была довольно полезной — собирай фрукты, пока они пригодны в пищу. Однако в денежном обществе она может обойтись довольно дорого. Чалдини пишет, что в одном из магазинов бытовой техники, за которым он наблюдал, продавец, обнаружив интерес покупателя к какому-либо прибору, подходил и печально рассказывал, что товар закончился и последний экземпляр продали всего двадцать минут назад. Дефицит приводил к усиливающемуся желанию купить этот товар, и покупатель часто спрашивал, есть ли возможность найти такой же товар в кладовке, на складе, где угодно. «Хорошо, — отвечал продавец, — возможно, он где-то остался, я готов пойти и проверить. Однако, я правильно понимаю, что вам нужна именно эта модель и что вас устраивает её цена?»

Чалдини отмечает, что основной сигнал, на который стоит обращать внимание, — это желание обладать вещью, а не использовать. (Тимоти Феррис даёт похожий совет о планировании жизни: стоит спрашивать себя, какие переживания сделают вас счастливыми, а не какие приобретения или перемены в статусе.)

Однако самая главная проблема в желании недоступного заключается в том, что как только вы это получаете, оно перестаёт быть недоступным. Если мы не можем наслаждаться всего лишь доступным, наши жизни всегда будут полны разочарования…

  • 1. Автор ссылается на издание: Robert B. Cialdini, «Influence: The Psychology of Persuasion: Revised Edition» (New York: Quill, 1993). Книга переводилась на русский язык, но содержание различных изданий может немного отличаться. — Прим.перев.
  • 2. Sharon S. Brehm and Marsha Weintraub, «Physical Barriers and Psychological Reactance: Two-year-olds’ Responses to Threats to Freedom», «Journal of Personality and Social Psychology» 35 (1977): 830–836.
  • 3. Michael B. Mazis, Robert B. Settle, and Dennis C. Leslie, «Elimination of Phosphate Detergents and Psychological Reactance», «Journal of Marketing Research» 10 (1973): 2; Michael B. Mazis, «Antipollution Measures and Psychological Reactance Theory: A Field Experiment», «Journal of Personality and Social Psychology» 31 (1975): 654–666.
  • 4. Richard D. Ashmore, Vasantha Ramchandra, and Russell A. Jones, «Censorship as an Attitude Change Induction», «Paper presented at Eastern Psychological Association meeting» (1971).
  • 5. Dale Broeder, «The University of Chicago Jury Project», «Nebraska Law Review» 38 (1959): 760–774.
  • 6. A. Knishinsky, «The Effects of Scarcity of Material and Exclusivity of Information on Industrial Buyer Perceived Risk in Provoking a Purchase Decision» (Doctoral dissertation, Arizona State University, 1982).
Перевод: 
sepremento, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
210
Оцените качество перевода: 
Средняя оценка: 4.9 (11 votes)

Священная обыденность

Элиезер Юдковский

Я готовился к диалогу с Адамом Франком на Bloggingheads1 и читал его книгу «Постоянный огонь»2. Это книга о восприятии священного. Возможно, я редко об этом упоминаю, но, конечно, мне знаком опыт, о котором пишет Франк. Я испытываю подобные чувства, когда смотрю видео о запуске космического корабля. Или, в меньшей степени, поскольку это гораздо более частое явление, когда смотрю ночью на звёзды и думаю, что они значат. Или, например, думаю о рождении ребёнка. Обо всём, что важно для разворачивающейся истории.

Адам Франк считает, что наличие такого опыта является важным общим свойством науки и религии. А не, например, что возможность испытывать подобные чувства — это свойственное человеку качество, которое религия лишь портит.

«Постоянный огонь» цитирует «Многоообразие религиозного опыта» Уильяма Джеймса:

Итак, условимся под религией подразумевать совокупность чувств, действий и опыта отдельной личности, поскольку их содержанием устанавливается отношение её к тому, что она почитает Божеством.3

И эта тема развивается далее: священность — это нечто индивидуальное и личное.

Эта мысль меня всерьёз поразила. Предполагается, что у меня не может быть чувства прикосновения к священному, если я лишь один из многих людей, смотрящих как SpaceShipOne выигрывает X-Prize? Но почему? Предполагается, что мой опыт священного обязан чем-то отличаться от опыта всех остальных людей, смотрящих ту же трансляцию? Почему, ведь у нас же мозг устроен одинаково? Вообще, зачем мне верить в то, что я уникален? (Однако это слово Адам Франк тоже активно использует в оборотах вроде «уникальный опыт священного»). Быть может, это ощущение личное в том смысле, что мы с трудом передаём друг другу любой опыт? Тогда зачем делать акцент на чувстве священного, а не на ощущениях при насморке?

И тут меня озарило: я понял, что передо мной трюк «эпистемологии Тёмной стороны»: если сделать нечто личным, оно становится недоступным для критики. Вы получаете право говорить: «Вы не можете меня критиковать, поскольку речь идёт о моём личном опыте, а у вас никогда не будет к нему доступа, чтобы его оспорить».

Однако за такую защиту от критики приходится платить одиночеством. Тем самым одиночеством, которым Уильям Джеймс восхищался как основой религиозного опыта. Словно одиночество это что-то хорошее.

Чтобы понять, как религия может вывернуть чувство священного, имеет смысл подумать о следующих реликтах эпистемологии Тёмной стороны:

Загадочность: почему священное должно быть загадочным? Космический корабль можно запустить без всякой тайны. Насколько меньше я ценил бы звёзды, если бы не понимал, чем они являются на самом деле, если бы они были для меня лишь точечками в ночном небе? Однако если кто-то оспаривает ваши религиозные чувства, например, задаёт вопрос: «Почему Бог не исцеляет людей, которые потеряли конечности?», вы глубокомысленно изрекаете: «Это священная тайна!» Чтобы защитить ложь, есть вопросы, которые нельзя задавать, и ответы, которые нельзя подтвердить. И такая невозможность получить ответ начинает ассоциироваться со священным. И за защиту от критики вы платите подлинным любопытством, которое искренне желает найти ответы на вопросы. Вы поклоняетесь собственному невежеству в вопросах, на которые ваше поколение пока не нашло ответов. Возможно, даже в вопросах, на которые ответы уже есть.

Вера: давным-давно, когда люди были более наивны и даже вполне разумные люди верили в каких-нибудь богов, религия строила свою репутацию на свидетельствах о чудесах в своих священных писаниях. И христианские археологи всерьёз рассчитывали найти остатки Ноева Ковчега. Но когда никаких подтверждающих свидетельств обнаружить не удалось, религия сделала то, что Уильям Бартли назвал «Возвращение к убеждению»4. «Я верю, потому что я верю!» И так вера без достаточных свидетельств стала ассоциироваться с опытом священного. И ради защиты от критики вы жертвуете своей способностью ясно мыслить в вопросах, которые касаются священного для вас, а также способностью понимать священное и умением отказываться от ошибок.

Экспериенциализм: если раньше вы считали, что радуга — это священный договор между Богом и человечеством, а потом осознали, что Бога не существует, вы можете «сбежать к чистому опыту», то есть начать хвалить себя за то, что испытываете такие чудесные ощущения, когда думаете о Боге, — не важно, существует он или нет. Платой за защиту от критики становится солипсизм: ваш опыт отрывается от всего, на чём он основан. Наверняка смотреть на взмывающий в пламени космический корабль и думать: «На самом деле же неважно, существуют космические корабли или нет, важно то, что я сейчас чувствую», сопровождалось бы ужасной пустотой внутри.

Отстранение: если область священного не подчиняется обыденным правилам свидетельств и её невозможно исследовать обыденными средствами, значит, она обязана существенно отличаться от мира обыденного. Поэтому мы с гораздо меньшей вероятностью будем думать о космических кораблях, как о чём-то, возможно, священном, ведь это творение обыденных человеческих рук. Китс перестал восторгаться радугой и низвёл её в «каталог унылых и обыденных вещей» за то, что стало известно её устройство — ужасное преступление. И за защиту от обыденной критики вы платите тем, что ничто обыденное больше не будет для вас священным.

Личное: про это я уже сказал выше.

Именно из-за этих искажений мы не должны ни в коем случае спасать религию. Даже в форме «духовности». Если убрать общественные институты и фактические ошибки, отказаться от церквей и писаний, останется… вся эта чушь про загадочность, веру, солиптический опыт, личное одиночество и отрыв от реальности.

Изначальная ложь — лишь начало проблемы. Кроме неё есть множество дурных привычек мышления, которые выработались, чтобы её защищать. Религия — это кубок с ядом, и мы изо всех сил должны стараться из него не пить. Духовность — это такой же кубок. Да, из него вытащили исходную ядовитую пилюлю. Но какая-то часть яда уже успела раствориться и осталась в кубке. Питьё стало немного менее смертельным, но лучше его не пробовать.

Когда ложь защищается веками, подлинное происхождение привычек теряется в тумане, его скрывают множество слоёв недокументированной болезни. В таких случаях, полагаю, мудрее начать с нуля, а не пытаться выборочно отказываться от исходной лжи, сохраняя привычки мышления, выработанные, чтобы её защищать. Просто признайте, что вы неправы. Откажитесь от ошибки полностью. Не защищайте её больше. Не пытайтесь говорить, что в каких-то мелочах вы всё-таки правы. Просто скажите «Упс», отбросьте ошибку целиком и начните с начала.

Именно способность на самом деле, по настоящему, перестать защищать свои ошибки и признать, что ты был совершенно не прав, отличает научный опыт от религиозного. Никакая религия не в состоянии вместить в себя такую способность. Иначе она потеряет себя полностью и станет просто человечностью…

И та же самая способность позволяет просто смотреть на далёкие звёзды. В звёзды можно поверить без напряжения, не отвлекаясь на постоянно появляющиеся противоречащие свидетельства. Они по-настоящему существует, этот опыт сцеплен с реальностью и входит в разворачивающуюся историю. Звёзды можно познать, они — источник настоящей пищи для любопытства. Их можно разделить с другими людьми. Они сотканы из той же ткани, что и вы, и всё остальное. Прекрасны и священно обыденны.

  • 1. К сожалению, страница c этим диалогом как-то странно исказилась: при правильном названии и временных кодах на ней показывается совершенно другое видео. — Прим. перев.
  • 2. Adam Frank, «The Constant Fire: Beyond the Science vs. Religion Debate» (University of California Press, 2009).
  • 3. Использован перевод В. Г. Малахиевой-Мирович, М. В. Шик, под ред. С. В. Лурье. — Прим. перев.
  • 4. Англ. «retreat to commitment». Это название одной из книг Бартли. — Прим. перев.
Перевод: 
Alaric, Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
211
Оцените качество перевода: 
Средняя оценка: 4.7 (3 votes)

Чтобы распространять науку, держите её в тайне

Элиезер Юдковский

Порой мне кажется, что пифагорейцы были правы.

Да, я писал, что «наука» публична по своей природе. Я писал, что «наука» отличается от всего лишь рационального знания принципиальной возможностью воспроизвести эксперимент самостоятельно, а не полагаться на авторитет. Я утверждал, что «науку» следует определять как доступное широкому кругу лиц знание человечества. Я даже предполагал, что будущие поколения станут относиться ко всем статьям, что не были опубликованы в общедоступном журнале, как к ненаучным, а конкретнее, они не станут считать такие статьи частью публичного знания человечества, раз людям приходилось платить за чтение.

Однако можно вообразить и другое будущее. В этом другом будущем знание, которое мы сейчас называем «наукой», изъято из общественной среды — книги и журналы спрятаны и их охраняет загадочная секта из гуру в мантиях. Эти гуру делятся знанием только с теми, кто пройдёт страшные ритуалы посвящения. И всё это только ради того, чтобы люди наконец начали учиться.

Я имею в виду, вот прямо сейчас люди могут изучать науку, но не делают этого.

Социальная психология называет такой эффект «дефицитом». То, чего не хватает, ценится больше. Особенно силён этот эффект в отношении информации — если мы считаем какую-то информацию секретной, мы с большей вероятностью постараемся её получить, а после этого будем выше её ценить.

Мне кажется, что люди считают: раз информация о науке находится в свободном доступе, то ничего важного в ней нет. И поэтому вместо изучения науки люди вступают в секты, которым хватает здравого смысла держать свои Великие Истины в секрете. На самом деле Великая Истина может оказаться полным бредом, но люди стремятся к ней сильнее, чем к последовательному научному знанию. Это же тайна.

Наука — великое «похищенное письмо» нашего времени. Она на виду у всех и никто её не видит.

Разумеется, открытость науки полезна для научной элиты. Она-то уже прошла ритуалы посвящения. Но для всех остальных людей на планете из-за свободного доступа наука хранится в секрете в сотни раз эффективнее, чем если бы её скрижали стерегли в тайных хранилищах, а для получения доступа требовалось бы пройти по горящим углям. (И это был бы действительно страшный ритуал, потому что великие тайны теплоизоляции доступны только Посвящённым в Физику третьего круга.)

Будь научные знания скрыты в древних хранилищах (а не в неудобных журналах с платой за доступ), то, по крайней мере, тогда люди пытались бы попасть в эти хранилища. Они отчаянно бы старались изучать науку. Особенно если бы они сначала узрели мощь, которой владеют Физики восьмого круга, а потом им бы сказали, что они недостойны узнать объяснение этих чудес.

А при попытке создать, скажем, секту Сайентологов, да, сначала у публики появлялся бы интерес. Однако очень скоро люди начинали бы задавать неудобные вопросы, вроде: «А почему ваш восьмой круг не показывает свои способности, как Физики?». Или: «Как так получилось, что никто из магистров Математики не желает вступить в вашу секту?» Или: «Почему я должен следовать за вашим Основателем, ведь он нигде не достиг восьмого круга, кроме как в своей собственной секте?» Или: «Зачем мне заниматься в вашей секте, ведь у Дантистов Смерти есть штучки гораздо круче?»

С этой точки зрения выход математики за пределы секты пифагорейцев начинает казаться огромной стратегической ошибкой человечества.

Наверняка вы сейчас скажете: «Но ведь в науке уже полно устрашающих ритуалов посвящения! Плюс её сложно изучать просто в силу её природы! Разве это не считается?» Нет, ведь общество считает, что наука находится в свободном доступе. Раз любой может её изучать, значит, изучать её не так уж и важно.

Это вопрос имиджа. Люди строят своё поведение с оглядкой на других людей. Любой человек может пойти в магазин и купить лампочку. Никто не смотрит на неё с изумлением и благоговением. Никто не думает, что в физике процесса кроется какая-то тайна — пусть даже вы её не понимаете. На всякий случай вот вам объяснение в газете в один абзац, которое выглядит убедительно и авторитетно. В итоге никто не считает, что в лампочке есть какая-то священная тайна, вот вы и не считаете.

Даже самые простые штуки, абсолютно инертные объекты — например, кресты, — могут становиться волшебными, если все на них смотрят, как на волшебство. Но поскольку вам теоретически позволено знать, как работает лампочка, и вам не нужно для этого уходить в горы на поиски монастыря Электриков, то вы и не утруждаете себя учёбой.

Но поскольку у науки всё же есть свои ритуалы посвящения, как социальные, так и с точки зрения необходимости приложить мыслительные усилия, учёные не разочаровываются в ней полностью. Проблема в том, что в современном мире лишь очень немногие вообще начинают заниматься наукой. Она не может быть подлинным Тайным Знанием, поскольку кому угодно позволено её знать — хотя, фактически, мало кто знает.

Представьте, что для того, чтобы узнать Великую Тайну Естественного Отбора, ниспосланную Дарвином, Чьё Имя Останется в Веках, вам нужно было бы заплатить 2 тысячи долларов, пройти церемонию с мантиями, масками и факелами и принести в жертву быка. Потом вам бы показали окаменелости и оптический нерв, проходящий сквозь сетчатку, под микроскопом. И только затем наконец поведали бы Истину. Да вы бы воскликнули: «Это величайшее знание в мире!» и остались бы полностью довольны. А если бы впоследствии какая-то другая секта попыталась сказать вам, что всё это устроил бородатый мужик на небе шесть тысяч лет назад, вы бы смеялись как сумасшедший.

А, кстати, было бы весело устроить всё как-нибудь вот так. Особенно если бы обряд посвящения требовал сопоставить какие-то свидетельства самостоятельно — вместе или с одногруппниками — и лишь после этого вы могли бы сказать сенсею Науки, что готовы перейти на следующий круг. Да, это было бы не слишком эффективно, зато весело.

Если бы человечество не совершило исходной ошибки — не пошло по религиозному пути вначале и не боялось теперь всего, от чего несёт религией — тогда, возможно, получение учёной степени сопровождалось бы церемонией с литаниями и песнопениями. Людям нравится петь. Зачем лишать процесс веселья?

Может быть, мы просто поступаем неправильно.

И нет, я не предлагаю всерьёз отменить последние пятьсот лет открытости и засекретить всю науку. По крайней мере, не сейчас. Сейчас очень важна эффективность, особенно в таких областях, как медицинские исследования. Я просто объясняю, почему Тайну о том, как из всего лишь атомов возникает невыразимая разница между синевой и краснотой, я не расскажу никому меньше чем за сто тысяч долларов…

Кхм! Я хотел сказать, что предлагаю вам представить эту альтернативную Землю, чтобы вы могли посмотреть на науку и на секты одинаково. Чтобы вы по достоинству оценили научную истину, когда узнаете её, пусть даже она и кажется недостаточно защищённой, чтобы быть столь ценной. Представьте мантии и маски. Представьте, как вы прокрадываетесь в тайное хранилище и крадёте Утерянное Знание Ньютона. И не давайте обмануть себя какой угодно организации с мантиями и масками, пока они не покажут вам данных.

Создаётся впечатление, будто у людей есть дыры в сознании, которые необходимо заткнуть Эзотерическим Знанием, Страшными Секретами и Тайной Истиной. И я даже не критикую этот образ мышления! Секретные эзотерические тайные истины действительно существуют: например, квантовая механика или байесовские структуры. Мы просто привыкли представлять Тайную Истину как что-то очень неприглядное, как часть ложной обыденности.

Но если дыры для тайного знания не заткнуть истинными убеждениями, их заткнут убеждения ложные. Кроме науки изучать нечего — эмоциональная энергия либо вкладывается в реальность, либо тратится на полную ерунду, либо уничтожается. Лично я считаю, что эмоциональную энергию лучше всего инвестировать. И не стоит без надобности отказываться от веселья.

Прямо сейчас от обоих взглядов на мир мы имеем худшее. Наука на самом деле не бесплатна, ведь образование и учебники стоят дорого. Но общество считает, что раз всем позволено что-то знать, значит это неважно.

В идеале хотелось бы наоборот.

Перевод: 
sepremento, Alaric, ildaar
Номер в книге "Рациональность: от ИИ до зомби": 
212
Оцените качество перевода: 
Средняя оценка: 4.9 (14 votes)

Церемония посвящения

Элиезер Юдковский

Узкую лестницу освещали яркие факелы неправильного цвета — пламя напоминало расплавленное золото или осколки солнца.

192… 193…

Сандалии Бреннана тихо щёлкали по каменным ступеням. Звуки напоминали стук медленно падающих костей домино.

227… 228…

На полкруга ниже него по ступеням шелестел край тёмной мантии. Сам человек в мантии постоянно оставался вне поля зрения.

239… 240…

Ещё совсем чуть-чуть, предсказал сам себе Бреннан, и его догадка оказалась верной: шестнадцать раз по шестнадцать ступеней, и они оказались перед стеклянными величественными вратами.

Врата были изготовлены мастерски, с чувством юмора и великим вниманием к коэффициентам преломления. Громадные и изогнутые, они искажали свет, изгибали его, искривляли и всячески использовали его так, чтобы оставить лишь намёки на то, что скрыто за ними (ещё более сильные источники света, тёмные стены). Увидеть что-то внутри было решительно невозможно. Если только, конечно, у вас нет ключа: противо-врат, толстых там, где тонко и тонких там, где толсто. Такой ключ свёл бы эффекты исходных врат на нет.

Фигура в мантии рядом с Бреннаном вытянула обе руки, скрытые перчатками из зеркальной материи. Сверкающие пальцы ухватились за ручки искривлённых врат. Бреннан эти ручки даже не заметил: из-за повсеместных искажений об их очертаниях можно было только догадываться, но невозможно было разглядеть.

— Желаешь ли ты знать? — прошептал проводник. По громкости этот шёпот почти не отличался от обычного голоса, однако гендер говорящего понять по нему было нельзя.

Бреннан замешкался. Ответ на вопрос казался слишком очевидным. Настолько очевидным, что это выглядело подозрительно даже для ритуала.

— Да, — наконец произнёс Бреннан.

Проводник ответил одним лишь молчанием.

— Да, я хочу знать, — сказал Бреннан.

— Что именно ты хочешь знать? — прошептала фигура в мантии.

Бреннан напряжённо наморщил лоб, изо всех сил пытаясь представить партию от начала до конца и надеясь, что он её ещё не проиграл. Наконец он обратился к первому и последнему средству — правде:

— Не важно. Ответ всё равно да.

Стеклянные врата разделились посредине и с еле слышным шорохом ушли в окружающий камень.

В открывшейся зале стояли шеренги людей в мантиях и капюшонах из ткани, поглощающей свет. Стены же в зале оказались не из чёрного камня, а зеркальными. Из-за этого казалось, что квадратная сетка из чёрных мантий во всех направлениях уходит в бесконечность. Возникало ощущение, будто здесь собрались люди из гораздо большего города, а, может, даже и всё человечество. В воздухе ощущалась влажное тепло, дыхание собравшихся — запах толпы.

Проводник Бреннана прошёл в центр площадки, где таким же безжалостным жёлтым пламенем горели четыре факела. Бреннан последовал за ним, а когда остановился, то с некоторым изумлением осознал, что все капюшоны обращены к нему. Ещё никогда в жизни Бреннану не приходилось находиться под столь пристальным вниманием. Оно пугало, хотя и не было слишком уж неприятным.

— Он здесь, — сказал проводник своим странным громким шёпотом.

Бесконечные ряды фигур в мантиях ответили в унисон:

— Кого нет среди нас?

В их идеальном, точно синхронизированном хоре, невозможно было вычленить ни один голос.

— Якоба Бернулли, — нараспев произнёс проводник.

— Мёртв, но не забыт, — откликнулись стены.

— Абрахама де Муавра.

— Мёртв, но не забыт.

— Пьера-Симона Лапласа.

— Мёртв, но не забыт.

— Эдвина Томпсона Джейнса.

— Мёртв, но не забыт.

— Они мертвы, — сказал проводник, — и навсегда утрачены для нас. Но у нас по-прежнему есть мы сами, и проект продолжается.

В наступившей тишине проводник повернулся к Бреннану и вытянул руку. На ладони лежало небольшое почти прозрачное кольцо.

Бреннан шагнул вперёд, чтобы взять его…

…но рука сомкнулась в кулак.

— Если три четверти людей в этой комнате — женщины, — произнёс проводник, — а три четверти женщин и половина мужчин принадлежит Ереси Добродетели, как и я, то какова вероятность, что я мужчина?

— Две одиннадцатых, — уверенно ответил Бреннан.

На мгновение воцарилась абсолютная тишина.

Затем послышался изумлённый смех.

Снова послышался шёпот проводника — в этот раз по-настоящему тихий, почти неслышный.

— Вообще-то, одна шестая.

Бреннану показалось, что его лицо сейчас расплавится — настолько сильно у него вспыхнули щёки. Ему ужасно захотелось выбежать из комнаты. Взбежать вверх по лестнице, покинуть город, а затем изменить имя и начать жизнь заново, чтобы когда-нибудь пройти ритуал правильно.

— Искренняя ошибка по крайней мере честна, — сказал проводник уже громче. — И мы можем понять, насколько ты честен, по тому, насколько ты будешь упорствовать. Если я последователь Ереси Добродетели, то какова вероятность, что я мужчина?

— Одна… — начал было Бреннан.

И осёкся. Вновь повисла ужасная тишина.

— Да скажи уже одна шестая, — прошептал проводник, теперь уже достаточно громко, чтобы его услышали. Снова раздался хохот, местами не слишком добрый.

Бреннан часто дышал. На лбу выступил пот. Если он ошибается, он в самом деле сбежит из города.

— Три четверти женщин умножить на три четверти Добродетельных равно девять шестнадцатых Добродетельных женщин в комнате. Четверть мужчин умножить на половину Добродетельных это две шестнадцатых Добродетельных мужчин. Если у меня есть лишь информация о том, что вы из Добродетельных, то я оцениваю шансы как два к девяти или вероятность как две одиннадцатых, что вы мужчина. Впрочем, я не убежден, что данная информация верна. Во-первых, всё кажется слишком подогнанным. А во-вторых, в зале нечётное число людей.

Рука вытянулась вновь и раскрыла кулак.

Бреннан взял кольцо. В свете факелов оно было почти невидимым. Судя по всему, его сделали не из стекла, но из какого-то другого материала с индексом преломления света очень близким к воздуху. От рук проводника кольцо нагрелось и теперь ощущалось на пальце как что-то живое.

Облегчение было столь велико, что аплодисментов фигур в капюшонах Бреннан почти не расслышал.

Проводник в мантии прошептал последние слова:

— Теперь ты послушник Байесовского заговора.

Перевод: 
sepremento, Alaric, ildaar
Номер в книге "Рациональность: от ИИ до зомби": 
213
Оцените качество перевода: 
Средняя оценка: 4.8 (13 votes)

Физикализм для продвинутых

Сможем ли мы хоть когда-нибудь понять, каково быть летучей мышью? Вероятно, традиционный дуализм, в рамках которого бессмертные души парят, нарушая законы физики, ложен. Однако что можно сказать по поводу более слабого тезиса о том, что сознание не объясняется физикой полностью? Множество философов и учёных посчитали привлекательными рассуждения в пользу этого тезиса. Если их аргументация нам кажется интуитивно притягательной, не должны ли мы принять их выводы и отказаться от физикализма?

Уж точно мы не должны отбрасывать их доводы, потому что они звучат странно или у нас появляется смутное ощущение, что они ненаучны. Однако задумаемся, как именно работают убеждения и объяснения. Что мы можем сказать об этом споре теперь? Можем ли мы найти какие-нибудь подсказки в истории науки или в нашем понимании, на каких физических механизмах основываются свидетельства?

Автор: 
Элиезер Юдковский

Рука или пальцы

Элиезер Юдковский

Вернёмся к нашей изначальной теме: Редукционизму и ошибке проецирования ума. Иногда люди считают, что классными могут быть лишь фундаментальные штуки, и тогда им сложно принять редукционизм на эмоциональном уровне. Но такая позиция лишит нас возможности наслаждаться чем-либо сложнее кварка, так что я предпочитаю отбросить её.

Напоминаю, что основной тезис редукционизма состоит в том, что хотя мы и используем многоуровневые модели для упрощения вычислений, физическая реальность состоит лишь из одного уровня.

Сегодня же я бы хотел предложить вам следующую загадку: Когда вы берёте стакан воды, его берёт ваша рука?

Большинство людей, конечно же, наивно ответят: «Да».

Однако недавно учёные совершили невероятное открытие. Оказывается, стакан держит вовсе не рука. На самом деле, его держат ваши пальцы и ладонь.

Да, я знаю, меня это тоже потрясло. Но оказалось, что когда учёные измерили силы, приложенные к стакану каждым из ваших пальцев и ладонью, то они не обнаружили никакой дополнительной силы. Таким образом, сила, прикладываемая вашей рукой, должна быть равна нулю.

Идея здесь в том, что когда вы можете увидеть (а не просто знать), как более высокий уровень редуцируется к более низкому, они не будут казаться вам отдельными местами на вашей карте. Вы сможете увидеть, насколько глупо думать, что пальцы могут быть отдельно от вашей руки. Вы сможете увидеть, насколько глупо спорить о том, берёт ли стакан ваша рука или же ваши пальцы.

Ключевое слово: «увидеть». Важна непосредственная визуализация. Когда вы представляете руку, вы также представляете и пальцы, и ладонь. И наоборот, представив ладонь и пальцы, вы поймёте, что это рука. Таким образом, высокий и низкий уровни вашей карты внутри вашего разума окажутся тесно связаны.

В реальности, конечно же, эти уровни связаны ещё теснее — самым тесным из возможных способов: физической идентичностью. Это можно увидеть. Вы можете увидеть, что слова (1) «рука» или же (2) «пальцы и ладонь» относятся не к различным объектам, а всего лишь к различным точкам зрения.

Но представим, что вам не хватает знаний, чтобы настолько тесно связать уровни вашей карты. Например, предположим, у вас был бы «детектор руки», который отображал бы «руку» как точку на карте (как на старых дисплеях радаров), и аналогичные детекторы для пальцев и ладони. Тогда бы вы видели множество точек вокруг руки, но вы могли бы представить, как точка-рука передвигается отдельно от остальных. Таким образом, несмотря на то, что физическая реальность руки (того, чему соответствует точка) идентична/строго состоит из физических реальностей пальцев и ладони, вы бы не смогли увидеть этот факт. Даже если бы кто-то сказал вам, или же если бы вы сами догадались, глядя на совпадение в расположении точек, вы бы только знали о факте редукции, но не могли бы его увидеть. Вы все ещё могли бы представить как точка-рука двигается отдельно, хотя это было бы физически невозможным, при условии, что физическое устройство детекторов остаётся неизменным.

Или же, на ещё более низком уровне связности, люди могли бы просто сказать вам «Вон там рука, а вон там пальцы». И у вас было бы информации не больше, чем у старомодного ИИ, воспринимающего ситуацию, используя лисп-токены с говорящими названиями. Не было бы никакого очевидного противоречия в допущении:

⊢Внутри(Комната,Рука)
⊢~Внутри(Комната,Пальцы)

Потому что вы бы не обладали знанием, что:

⊢Внутри(x, Рука) ⇒ Внутри(x,Пальцы)

Из этого не следует, что рука на самом деле может отсоединиться от пальцев и подобно призраку красться по комнате. Просто у старомодного ИИ с таким устройством нет возможности это понять. Карта — это не территория

В частности, не следует делать слишком много выводов из того, что выглядит умозрительно возможным, ведь разум отдельного воспринимающего субъекта может отделить руку от составляющих её элементов: пальцев и ладони. Умозрительная возможность это не то же самое, что логическая и уж тем более физическая возможность. Вероятно, вы считаете умозрительно возможным, что 235757 — простое число, потому что вы не знаете наверняка. Но логически невозможно, чтобы 235757 было простым числом. Будь вы логически всеведущими, то для вас было бы очевидным, что 235757 составное (и вы бы знали его множители). Вот почему мы используем понятие «невозможных возможных миров»: чтобы рассуждать о вероятностных распределениях по высказываниям, которые на самом деле могут быть или не быть логически возможными.

И легко вообразить философов, критикующих «элиминативных пальцеристов», которые противоречат непосредственному факту личного опыта. Мы ведь можем чувствовать, что наша рука держит стакан. Таким образом, допущение, что «руки» на самом деле не существуют, должно очевидно привести к тому, что стакан упадёт и разобьётся. Также легко вообразить философов, предполагающих существование «межпальцевых связывающих законов», чтобы объяснить, как специфическая конфигурация пальцев порождает существование руки — с дополнением, разумеется, что хотя наш мир и включает в себя эти конкретные «связывающие законы», умозрительно они могли бы быть другими и, таким образом, не являются ни в коем смысле обязательными фактами, и так далее.

Всё это случаи ошибки проецирования ума, и то, что я называю «наивным философским реализмом» — озадаченность философской интуиции касательно прямой, проверяемой информации о реальности. Ваша неспособность представить что-то — всего лишь вычислительный факт о том, что ваш мозг может и не может представить. Другой мозг может работать иначе.

Перевод: 
Горилла В Пиджаке
Номер в книге "Рациональность: от ИИ до зомби": 
214
Оцените качество перевода: 
Средняя оценка: 3.1 (16 votes)

Злые атомы

Элиезер Юдковский

Фундаментальная физика — кварки и всё такое — очень далека от тех уровней, который мы можем увидеть, вроде рук и пальцев. В лучшем случае, вы знаете, как повторить эксперименты, показывающие, что ваша рука (как и всё остальное) состоит из кварков, и знаете, как вывести несколько уравнений, описывающих атомы, электронные облака, молекулы и прочие подобные штуки.

В худшем случае, существование кварков внутри вашей руки — это какое-то утверждение, которое вам сказали. В таком случае встаёт вопрос, в каком смысле вы вообще можете сказать, что «знаете» об этом, пусть даже вы используете то же слово «кварк», которое использовал бы физик, чтобы передать знание другому физику.

В любом случае, вы не можете действительно увидеть общность между уровнями — ни у кого нет настолько большого мозга, чтобы представить несколько чисел Авогадро кварков и заметить, как они складываются в руку.

Но мы, по крайней мере, понимаем, что руки делают. Руки могут давить на объекты, прикладывая к ним силу. Когда нам рассказывают об атомах, мы представляем маленькие бильярдные шары, стукающиеся друг о друга. Кажется очевидным, что «атомы» тоже могут толкать объекты, врезаясь в них.

Подобное представление об атомах не вполне корректно. Однако человеческое воображение позволяет относительно просто представить, что наша рука сделана из маленькой галактики кружащих бильярдных шариков, давящих на вещи, когда наши «пальцы» касаются их. Демокрит представил это 2400 лет назад, и какое-то время (примерно в 1803-1922 годах) Наука считала, что он был прав.

Но как насчёт, например, злости?

Как маленькие бильярдные шарики могут злиться? На бильярдных шарах появляются маленькие хмурые лица?

Представьте себя на месте охотника-собирателя — кого-то, кто даже не имеет представления о письме, не говоря уже о том, чтобы использовать материю для вычислений, кого-то, кто не имеет не малейшего понятия, что существует такая штука, как нейроны. Тогда вы сможете представить функциональный разрыв, который ваши предки могли видеть между маленькими бильярдными шарами и «Гррр! Аргхх!»

Забудьте на минуту о субъективном опыте и подумайте о разрыве между злостью и бильярдными шарами на уровне поведения. О разнице между тем, что делают бильярдные шарики и что заставляет делать людей злость. Злость может заставить человека поднять кулак и ударить кого-то, или говорить подлости за спиной, или подкинуть ночью скорпионов в чью-то палатку. А бильярдные шарики просто толкают предметы.

Попробуйте поставить себя на место охотника-собирателя, который никогда не испытывал «Ага!» от обработки информации. Постарайтесь избегать предвзятости послезнания насчёт таких вещей как нейроны и компьютеры. Только тогда вы сможете увидеть эту непреодолимую для объяснений пропасть.

Как можно объяснить злое поведение при помощи бильярдных шаров?

Ну, очевидное материалистическое предположение заключается в том, что маленькие бильярдные шарики толкают вашу руку и заставляют ударить кого-то, или же толкают ваш язык, чтобы получилось оскорбление.

Но откуда бильярдные шарики знают, как это делать — в смысле, как заставить ваш язык или пальцы следовать длительному плану, — если сами они не злятся?

И к тому же, если вы не увлеклись — о, боже! — сциентизмом, вы и сами благодаря своим ощущениям поймёте, что это объяснение очевидно ложно. Атомы могут толкать вашу руку, но они не могут заставить вас чего бы то ни было хотеть.

Кто-нибудь заметит, что вас может разозлить употребление вина. Но кто сказал, что вино состоит исключительно из бильярдных шариков? Может быть, в вине просто содержится эссенция злости?

Очевидно, что редукционизм — это ошибочная концепция.

(Ученик в отчаянии восклицает: «Искусство подвело меня». Мастер в отчаянии восклицает: «Я подвёл своё искусство».)

Что нужно, чтобы преодолеть этот разрыв? Не достаточно просто идеи «нейронов», «обрабатывающих информацию». Если вы скажете лишь эти слова и ничего более, в вашей модели лишь появится магическое, необъяснимым образом соединяющее уровни правило, благодаря которому вы переходите от шариков к мыслям.

Однако настоящий шаг по преодолению этого разрыва проделал разработчик искусственного интеллекта, который знает, как создать программу, играющую в шахматы. Если вы понимаете такие концепции как консеквенциализм, обратная цепочка рассуждений, функции полезности и деревья поиска, вы можете заставить планировать механическую (основанную исключительно на причинно-следственных связях) систему.

Делается это так. Для каждого возможного хода в шахматах, вычислите возможные ходы своего противника, затем свой ответ на эти ходы и так далее. Оцените позицию, получившуюся в результате самого далёкого хода, до которого вы в состоянии досчитать, с помощью какого-нибудь простого алгоритма (можно просто подсчитать материал1). Затем вернитесь назад и с помощью минимакса найдите лучший возможный ход для текущей позиции. Сделайте этот ход.

В более общем случае: если у вас в разуме есть цепочки причинно-следственной связи, в какой-то степени являющиеся отображением — зеркалом, эхом — действительности, то вы можете посчитать функцию полезности от исходов, которые предоставляет вам ваше воображение, выбрать действие, которое приведёт к исходу, полезность которого высока, и совершить это действие. Цепочки причинно-следственной связи в вашем разуме, соответствующие внешнему миру, не обязаны быть сделаны из бильярдных шариков, вокруг которых есть маленькие ауры намерений. Deep Blue будет работать и без изображений маленьких шахматных фигурок на его транзисторах. Также читайте эссе «Простая истина».

Эти рассуждения всё равно являются очень сильными упрощениями, но по крайней мере они должны сократить разрыв. Если вы всё это понимаете, вы видите, как состоящий из материи планировщик под воздействием алкоголя может выдавать более злое поведение. Бильярдные шарики алкоголя толкают бильярдные шарики, составляющие функцию полезности.

Но даже если вы знаете, как написать небольшие ИИ, вы не можете представить общность уровней между транзисторами и шахматами. Транзисторов слишком много, возможных ходов в шахматах — тоже.

Аналогично, даже если бы вы знали всё о неврологии, вы не смогли бы представить переход от уровня нейронов к уровню злости — не говоря уже о переходе от атомов к злости. Нельзя это увидеть в той же степени, в какой вы способны увидеть руку, состоящую из пальцев и ладони.

Представьте, что учёный-когнитивист заявляет: «Злость — это гормоны». Даже если вы повторите эти же слова, это не значит, что вы преодолели разрыв между уровнями. Вы можете верить в то, что вы в это верите, но это не то же самое, что понять, какое отношение бильярдные шарики имеют к тому, чтобы хотеть кого-то ударить.

В результате, вы приходите к таким интерпретациям как: «Злость это всего лишь гормоны, она вызывается маленькими молекулами, поэтому её нельзя оправдать в каком-либо моральном смысле. И поэтому нужно учиться контролировать свою злость».

Или же: «На самом деле не существует такой вещи как злость — это иллюзия, цитата без референта, вроде миража воды в пустыне или поисков дракона в гараже, которого там нет».

Эти интерпретации — горькие пилюли (впрочем, вы не обязаны их глотать), и поэтому куда легче их провозглашать, чем верить в них по-настоящему.

Мне кажется, это то, что не-редукционисты/не-материалисты думают, что критикуют, когда критикуют материалистов-редукционистов.

Но материализм не настолько прост. Он не сводится к заявлению: «Злость состоит из атомов, вот и всё, вопрос решён». Такое заявление не объяснит, как дойти от бильярдных шариков до драки между людьми. Чтобы начать преодолевать разрыв между уровнями, нужно вникнуть в теорию вычислений, консеквенциализм и деревья поиска.

А по современным стандартам это был ещё довольно простой пример, потому что я специально ограничился вопросом лишь злого поведения. Разговор о поведении не требует понимания того, как алгоритм выглядит изнутри (не нужно преодолеть разрыв между взглядом от первого и от третьего лица) или же умения разрешать неверные вопросы (не нужно распутать места, где ваш собственный разум неверно отражает реальность).

Переход от материальных сущностей, которые гнут и ломают, жгут и роняют, толкают и пихаются, к злому поведению — всего лишь практическая задача для современной философии. Но это очень важная практическая задача. Её можно всецело оценить, лишь когда вы поймёте, насколько сложно её было решить до того, как была изобретена письменность. Когда-то и здесь был разрыв в понимании — хотя сейчас, когда этот разрыв давно и успешно закрыт, в ретроспективе он может быть и незаметен.

Преодолеть разрыв в понимании можно, если принять помощь от науки и не доверять взгляду изнутри, порождённому вашим разумом.

  • 1. Общую стоимость фигур и пешек каждой стороны. — Прим.перев.
Перевод: 
Горилла В Пиджаке, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
215
Оцените качество перевода: 
Средняя оценка: 5 (4 votes)

Тепло или движение

Элиезер Юдковский

Завершив предыдущее эссе, я понял, что существует куда более простой пример, как редукционизм преодолевает разрыв между двумя вроде бы разными сущностями: редукция тепла к движению.

Сегодня, задним числом, эквивалентность тепла и движения многим кажется совершенно очевидной. Раз уж все говорят, что «тепло — это движение», то это убеждение не может быть «странным».

Но когда-то кинетическая теория тепла была крайне спорной научной гипотезой. В научном мире господствовали убеждения о теплороде, невесомом веществе, перетекающем из горячих объектов в холодные. А до того основной теорией тепла было: «потому что флогистон

Представьте, что вы изучили кинетическую теорию и теорию теплорода совершенно независимо. Теперь вы знаете кое-что о движении: столкновение, упругий отскок, импульс, кинетическая энергия, гравитация, инерция, траектория свободного движения. Также, без какой-либо связи с предыдущим, вы знаете кое-что о тепле: температура, давление, горение, тепловые потоки, двигатели, таяние, испарение.

Такое состояние знаний не просто возможно. Примерно такие знания были у Сади Карно, который, исходя исключительно из теории теплорода, придумал идею цикла Карно — тепловой машины максимально возможной эффективности, из существования которой следует второй закон термодинамики. И это в 1824 году, когда кинетика была уже высокоразвитой наукой.

Представьте, что, как и Карно, вы знаете многое о движении и знаете многое о тепле, но для вас это разные сущности. Для вас это разные части знания — в вашем мозге есть отдельные корзины для убеждений о движении и для убеждений о тепле. Но изнутри при таком состоянии кажется, будто в окружающем мире есть движущиеся объекты и горячие объекты, будто в окружающем мире движение и тепло — независимые свойства материи.

И вдруг к вам является физик из будущего и говорит: «Где тепло, там и движение, и наоборот. Вот почему, например, два предмета нагреваются при трении друг о друга».

Есть (как минимум) две возможные интерпретации утверждения: «Где тепло, там и движение, и наоборот».

Во-первых, вы можете предположить, что движение и тепло существуют отдельно друг от друга. Что теория теплорода верна, однако среди законов нашей вселенной существует «связывающий закон», согласно которому, когда объекты быстро двигаются, возникает теплород. И наоборот, другой связывающий закон утверждает, что теплород может давить на объекты и заставлять их двигаться, и именно поэтому горячий газ оказывает больше давления на своё окружение (таким образом, позволяя паровой машине использовать пар, чтобы двигать поршень).

Во-вторых, вы можете предположить, что тепло и движение в некотором, хотя и пока ещё таинственном смысле, — это буквально одно и то же.

«Бессмыслица», — скажет Первый Мыслитель, — «у слов „тепло“ и „движение“ — разные значения. Поэтому мы и используем два разных слова. Мы знаем, как определить, стоит ли рассуждать о наблюдаемом явлении как о «тепле»: тепло может плавить объекты или воспламенять их. Мы знаем, как определить, что объект „быстро двигается“: он меняет своё положение в пространстве, и когда он столкнётся с препятствием, он может треснуть или деформироваться. Тепло имеет отношение к изменению вещества, движение же — к изменению местоположения и формы. Утверждать, что эти два слова имеют одно и то же значение, значит, банально вводить себя в заблуждение».

«Невозможно», — скажет Второй Мыслитель. — «Не исключено, что в нашем мире тепло и движение связывают какие-то законы, в смысле, существуют законы физики, согласно которым движение создаёт тепло и наоборот. Но я легко могу вообразить мир, где трение не нагревает предметы, а газы при высоких температурах не создают больше давления. И раз существуют возможные миры, где тепло и движение не связаны, то тепло и движение должны быть разными свойствами — это истинно априори».

Первый Мыслитель путает цитату и референт. 2 + 2 = 4, но «2 + 2» ≠ «4». Строка «2 + 2» содержит пять символов (включая пробелы), а строка «4» содержит лишь один. Если ввести обе строки в интерпретатор языка Python, они выведут один и тот же результат >>> 4. Таким образом, если вы видите строки «2 + 2» и «4», нельзя заключить, что из различия этих строк следует, что они должны иметь различное «значение» согласно интерпретатору Python.

Можно сказать, что слова «тепло» и «кинетическая энергия» «указывают на» одно и то же явление, даже если мы пока не знаем, как именно тепло сводится к движению. В смысле, пусть мы не знаем, какие именно объекты находятся по ссылкам, но это совпадающие объекты. Можете вообразить идеальный всеведущий интерпретатор науки, который выведет один и тот же результат, когда мы вводим в командную строку «тепло» и «кинетическая энергия».

Я использую метафору интерпретатора науки, чтобы акцентировать внимание на том, что для разыменовывания указателя приходится выйти за пределы мышления. Конечным результатом разыменовывания является нечто, находящееся в реальности, не в чьём-либо уме. Так можно сказать «настоящий референт», но нельзя непосредственно вычислить значение этих слов изнутри собственной головы. Нельзя мыслить, используя настоящий референт тепла. Если бы вы размышляли, используя настоящее тепло, то мысль «один миллион Кельвинов» тут же испарила бы ваш мозг. Однако, формируя убеждение о своём убеждении о тепле, вы можете рассуждать о вашем убеждении о тепле, и делать утверждения вида: «Возможно, что мое убеждение о тепле не слишком соответствует настоящему теплу». Вы не можете по-настоящему сравнить своё убеждение о тепле и настоящее тепло внутри своего разума, но вы можете рассуждать об этом сравнении.

Таким образом, вы можете сказать: «Мои убеждения о тепле и движении — это разные убеждения, но, возможно, что настоящие тепло и движение — это одно и то же явление». Приведу аналогию: можно додуматься до идеи, что «утренняя звезда» и «вечерняя звезда», вероятно, одна и та же планета, и при этом понимать, что нельзя это определить точно, лишь анализируя свои убеждения, — вам потребуется найти телескоп.

Аналогично можно разобрать ошибку Второго Мыслителя. Физик сказал ему: «Где тепло, там и движение», и мыслитель воспринял это утверждение как физический закон: «наличие теплорода порождает движение». Физик же на самом деле подразумевал что-то похожее на дедуктивное правило: «если вам говорят, что где-то есть „тепло“, автоматически выводите наличие там „движения“ ».

Из подобной проекции многоуровневой модели на многоуровневую реальность вытекает ещё одна, отдельная ошибка: неспособность отделить умозрительную возможность от логической. Сади Карно мог допустить существование другого мира, где тепло и движение не связаны друг с другом. Для Ричарда Фейнмана, точно знающего, как из уравнений движения выводятся уравнения тепла, такая идея не просто невообразима, но и настолько внутренне противоречива, что попытка её представить может взорвать мозг.

Отдам должное философам — некоторые из них упоминали подобные проблемы. Например, Хилари Патнэм, автор мысленного эксперимента «Земля-Близнец», писал12:

Как только мы открыли, что вода (в действительном мире) есть H2O, ни один мир, где вода не есть H2O, не может рассматриваться как возможный. В частности, если «логически возможное» утверждение — это утверждение, истинное в некотором «логически возможном мире», то утверждение «вода не есть H2O» не является логически возможным.

С другой стороны, вполне можно представить себе, что опыт убедит нас (и придаст рациональный характер нашей вере в то), что вода не есть H2O. В этом смысле мыслимо, что вода не есть H2O. Мыслимо, но не логически возможно! Быть мыслимым не значит быть логически возможным.

Мне кажется, что слово «вода» в этих двух параграфах используется в разных смыслах — в одном случае «вода» относится к данным, которые мы вводим в интерпретатор науки, а в другом «вода» относится к тому, что мы получим из интерпретатора науки, введя туда слово «вода». В первом параграфе, Хилари, как я понимаю, утверждает, что после того, как были произведены эксперименты и обнаружено, что вода это H2O, вода немедленно переопределяется так, чтобы и означать буквально H2O. Но вы могли бы непротиворечиво поддерживаться иной позиции касательно того, означает ли слово «вода» «H2O» или же «то, что на самом деле находится в этой бутылке», до тех пор пока вы используете свои определения последовательно.

Полагаю, вышенаписанное тоже уже неоднократно повторялось? Так или иначе…

Вполне вероятно, что если в мире существует некая единая сущность, которая принимает достаточно различные формы, а вы при этом недостаточно разбираетесь в редукции, то вам будет казаться, что в мире присутствуют две разных сущности. Знания, относящиеся к этим двум разным явлениям, вероятно, отнесут к разным учебным дисциплинам и их будут изучать два разных научных направления, расположенные в разных зданиях вашего университета.

Чтобы вспомнить, насколько разными когда-то казались тепло и движение, приходится настраиваться на соответствующий исторический контекст. Не исключено, что есть способ легче — в зависимости от того, сколько вы уже знаете, — если вы в состоянии игнорировать давление привычного (например, фраза «тепло — это движение» сейчас звучит не странно, а «тепло — это не движение» — странно). В смысле предположим, что завтра физики объявят: «В популярных книгах о науке всегда было одно ложное утверждение. На самом деле тепло не имеет ничего общего с движением». Смогли бы вы доказать, что они неправы?

Сказать: «Возможно, тепло и движение — это одно и то же!» — легко. Сложно — объяснить, как это. Нужно очень много знаний, чтобы дойти до того уровня, когда вы уже не сможете представить мир, в котором эти два явления могут существовать по отдельности. Редукция не дёшева, и потому она даёт столь многое.

Или, возможно, стоит переформулировать так: «Редукционизм — это легко, редукция — вот что сложно». Но весьма помогает быть редукционистом, когда дело доходит до поиска редукции.

  • 1. Hilary Putnam, “The Meaning of Meaning,” in The Twin Earth Chronicles, ed. Andrew Pessin and Sanford Goldberg (M. E. Sharpe, Inc., 1996), 3–52.
  • 2. Русский перевод цитируется по изданию Патнэм Х. «Философия сознания» — М.: Дом интеллектуальной книги, 1999, перевод Макеевой Л. Б., Назаровой О. А., Никифорова А. Л. — Прим.перев.
Перевод: 
Горилла В Пиджаке, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
216
Оцените качество перевода: 
Средняя оценка: 4.5 (4 votes)

Прорыв в исследованиях мозга! Он состоит из нейронов!

Элиезер Юдковский

Удивительный научный прорыв! Международная группа учёных под руководством нобелевского лауреата Сантьяго Рамона-и-Кахаля объявила, что мозг представляет собой поразительно сложную сеть крохотных клеток, соединённых друг с другом очень маленькими нитями и ответвлениями.

Международная группа, в которую также входят знаменитый механик Антони ван Левенгук, и, вероятно, Имхотеп, ставший богом медицины в Египте, выпустила заявление:

«Наше открытие стало итогом многолетних исследований, показавших, что мягкая штуковина с извилинами, которая находится внутри наших черепов, даже сложнее, чем кажется на первый взгляд. Благодаря применению Кахалем новой техники окрашивания, разработанной Камилло Гольджи, мы теперь понимаем, что мозг — это не непрерывная сеть вроде кровеносной системы. На самом деле он состоит из множества крошечных клеток или „нейронов“, связанных друг с другом тончайшими нитями.

Другие многочисленные свидетельства, начиная от исследований греческого врача Алкмеона Кротонского и, в частности, работы Поля Брока о нарушениях речи, показывают, что мозг является вместилищем разума.

Немезий, епископ Емесский, ранее утверждал, что ткани мозга — слишком мирские, чтобы служить посредником между телом и душой, и потому органы мышления расположены в желудочках мозга. Однако, если это верно, то непонятно, почему у этого органа появилась столь невыразимо сложная внутренняя структура.

Чарльз Бэббидж независимо от других исследователей предположил, что из множества малых механических устройств можно собрать „Аналитическую машину“, способную к таким видам деятельности, которые, согласно распространённому мнению, требуют работы мысли, — например, арифметике. Работы Луиджи Гальвани и Германа фон Гельмгольца показывают, что взаимодействие нейронов имеет электрохимическую природу, а не механическую, как считалось ранее. Тем не менее, на основании аналогии с „Аналитической машиной“ Бэббиджа мы считаем, что очень сложная сеть нейронов может демонстрировать схожие мыслительные свойства.

Там, где должен быть расположен разум, мы обнаружили чрезвычайно сложную материальную систему. Мы полагаем, что наши исследования являются сильным экспериментальным свидетельством в пользу того, что Бенедикт Спиноза был прав, а Рене Декарт ошибался. Разум и тело имеют общую природу.

В сочетании с работами Чарльза Дарвина, которые показывают, как в принципе такой орган мог возникнуть в результате процессов, которые сами по себе неразумны, основная масса научных свидетельств указывает на то, что разум не является онтологически фундаментальной сущностью и что он появился в некоторый момент времени. Этот вывод всерьёз противоречит теориям, которые утверждают онтологическую фундаментальность разумных сущностей или объявляют их первопричиной. В частности он противоречит всем существующим на данный момент религиям.

Потребуется значительная работа, чтобы определить, как именно связаны электрохимическое взаимодействие между нейронами и мысль. Тем не менее, мы уверены, что наше открытие позволяет считать, что наука в будущем сможет полностью описать, как устроена мысль. Да, эта задача не решена, но её можно решить».

К сожалению, Рамон-и-Кахаль и большинство других исследователей, участвовавших в Проекте, более недоступны для комментариев.

Перевод: 
sepremento, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
217
Оцените качество перевода: 
Средняя оценка: 4.5 (10 votes)

Когда антропоморфизм стал глупым

Элиезер Юдковский

Оказывается, большинство вещей во вселенной неразумны.

Это утверждение вызвало бы недоверие во множестве ранних культур. В те времена был распространён анимизм: вера в то, что деревья, камни, реки и холмы — всё имеет души, потому что, а почему бы собственно и нет?

Если эти куски плоти, называемые людьми, способны мыслить, то почему то же самое не могут делать и куски дерева?

Мои мышцы двигаются согласно моей воле, а вода течет по реке. Кто может утверждать, что река не повелевает движением воды? Река вытекает из берегов и затапливает место стоянки моего племени. Почему бы не предположить, что река разозлилась, раз она направила часть себя, чтобы навредить нам? Ведь именно это мы подумаем, когда чей-то кулак ударит в наш нос.

Нет никакой очевидной (для охотника-собирателя) причины, почему это невозможно. Это может показаться глупой ошибкой, только если путать глупость со странностью. Естественно, убеждение, что у рек есть духи, кажется нам «странным», ведь в нашем племени нет таких убеждений. Но нет ничего очевидно глупого в том, чтобы считать, что в движущейся воде есть духи, как и в движущихся кусках плоти.

Если бы эта идея была очевидно глупой, никто бы в неё и не поверил. Как, например, долгое время никто не верил в очевидно глупую идею, будто бы Земля движется, хотя всё выглядит так, будто она совершенно неподвижна.

Разве это так уж очевидно, что деревья не могут мыслить? Не будем забывать, что деревья вообще-то наши дальние родственники. У нас есть общий предок с папоротником, надо просто отойти подальше в прошлое, чтобы его найти. Если куски плоти могут мыслить, то почему не могут куски дерева?

Чтобы было очевидным, что древесина не может мыслить, нужно принадлежать к культуре, у которой есть микроскопы. Причём хорошие микроскопы.

Аристотель считал, что мозг — это орган для охлаждения крови. (Хорошо, что наши убеждения о работе нашего мозга практически не влияют на его работу).

Египтяне выкидывали мозг в процессе мумификации.

Вместилищем интеллекта мозг назвал Алкмеон Кротонский, пифагореец пятого века до нашей эры. Он отследил путь оптического нерва от глаза к мозгу. Но при тех свидетельствах, которыми он располагал, это была всего лишь догадка.

Когда центральная роль мозга перестала быть лишь догадкой? Я не знаю историю достаточно хорошо, чтобы ответить на этот вопрос. Вероятно, даже нельзя выделить какую-то ключевую точку. Быть может, стоит объявить ей тот миг, когда кто-то проследил анатомию нервов и заметил, что отделение их от мозга приводит к потере способности двигаться и чувствовать?

Но даже в этом случае причиной остаётся лишь таинственный дух, движущийся по нервам. Кто может утверждать, что древесина и вода, пусть даже они и не содержат этих маленьких нитей, которые есть в человеческом теле, не способны переносить этот мистический дух каким-то другим способом?

Я потратил некоторое время на поиски в Сети, чтобы выяснить точно, когда кто-то обратил внимание на очень запутанную внутреннюю структуру нейронов мозга и воскликнул: «Эй, спорим, этот гигантский клубок занимается обработкой сложной информации!» Я не преуспел в своих поисках. (Это не Камилло Гольджи — связность нейронов была известна и до него). Возможно, здесь также не было единственного переломного момента.

Однако я бы сказал, что антропоморфизм постепенно начал становиться ошибочным именно с открытия этой связности, а также с появлением теории естественного отбора Чарльза Дарвина и идеи, что мышление — это вычисление.

Именно в это время стало возможным посмотреть на дерево и сказать: «Я не вижу в биологии дерева органа, который занимался бы обработкой сложной информации. По поведению дерева тоже не заметно, что у него есть подобный орган. А если он спрятан настолько, что не влияет на поведение дерева, как естественный отбор мог бы привести к его появлению?»

Именно в это время стало возможным посмотреть на реку и сказать: «В воде нет элементов, которые воспроизводились бы на протяжении множества поколений с некоторыми отличиями, которые могли бы обеспечить естественный отбор. Откуда у реки может появиться структура, сравнимая с мозгом по сложности и функциям?»

Именно в это время стало возможным посмотреть на атом и сказать: «Злость кажется очень простым явлением, но на самом деле она устроена сложно. В таком простом объекте как атом для неё нет места, разве что внутри кварков существует целая неизведанная вселенная субчастиц. Но даже в таком случае, раз мы никогда не наблюдали каких-либо признаков атомной злости, эта вселенная никак не влияла бы на известные нам высокоуровневые явления».

Именно в это время стало возможным посмотреть на щенка и сказать: «Родители щенка могут прижать его к земле, когда тот совершит что-то неправильное, но это не значит, что щенок способен на размышления о морали. Согласно нашим нынешним теориям эволюционной психологии, способность к моральным рассуждениям возникает, как ответ на более сложные социальные испытания. Развитая мораль, которая появилась у нас, — это результат естественного отбора в результате словесных споров о политике племени».

Именно в это время стало возможным посмотреть на камень и сказать: «Тут нет даже простейших поисковых деревьев, какие есть в шахматной программе. Откуда у камня может появиться намерение катиться вниз, как когда-то считал Аристотель?»

Есть известная притча:

Чжуан-цзы и Хуэй-цзы прогуливались по мосту через реку Хао. Чжуан-цзы сказал:
— Как весело играют рыбки в воде! Вот радость рыб!
— Ты ведь не рыба, — возразил Хуэй-цзы. — Откуда тебе знать, в чём радость рыб?
— Но ведь ты не я, — ответил Чжуан-цзы. — Откуда же ты знаешь, что я не знаю, в чём заключается радость рыб?1

Теперь мы знаем.

  • 1. Цитируется перевод с китайского В. В. Малявина по книге Чжуан-Цзы, «Даосские каноны». — Прим.перев.
Перевод: 
Горилла В Пиджаке, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
218
Оцените качество перевода: 
Средняя оценка: 4.7 (7 votes)

Априори

Элиезер Юдковский

Традиционная Рациональность сформулирована на языке социальных норм. Нарушение норм трактуется как жульничество: если ты нарушаешь правила, и никто другой этого не делает, значит, ты предаёшь первым, что делает тебя плохим, очень плохим человеком. Для байесианцев, мозг –– это машина для достижения точности: если нарушать принципы рациональности, машина просто не работает — независимо от того, нарушает ли правила кто-то ещё.

Предположим, что Традиционные философы столкнулись с проблемой бритвы Оккама. Если две гипотезы одинаково хорошо удовлетворяют одним и тем же наблюдениям, почему мы должны считать, что с большей вероятностью истинной окажется более простая из них? Наверное, кто-нибудь скажет, что бритва Оккама работала в прошлом и, таким образом, скорее всего, продолжит работать и в будущем. Но, судя по всему, такой аргумент сам является предсказанием на основании бритвы Оккама: предположение «бритва Оккама работает вплоть до 8 октября 2027 года, а затем перестаёт работать» –– более сложная гипотеза, но она также удовлетворяет всем наблюдаемым свидетельствам.

Кто-нибудь скажет, что бритва Оккама — это разумное распределение априорных вероятностей. Но какое распределение оказывается «разумным»? Почему бы не назвать «разумным» очень сложное априорное распределение, при котором бритва Оккама работает во всех предыдущих случаях, но выдаёт ошибки в будущем?

Итак, похоже, не существует способов оправдать использование бритвы Оккама иначе как путём апелляции к бритве Оккама. То есть вряд ли этот аргумент убедит какого-либо судью, который изначально не признает бритву Оккама. (Что общего в словах, выделенных курсивом?)

Если вы философ, который ежедневно лишь пишет статьи, критикует статьи других людей и отвечает на их критику своих статей, вы можете просто взглянуть на бритву Оккама и пожать плечами. Оправдания, споры и риторика здесь заканчиваются. В своём написании статей вы заключаете перемирие: пока ваши приятели-философы не требуют от вас обоснований для ваших не подкреплённых аргументами убеждений, вы не требуете от них обоснований для их не подкреплённых аргументами убеждений. И в качестве символа вашего перемирия — вашего белого флага — вы используете фразу «истинно априори».

Но для байесианца, живущего в нашу эпоху когнитивных наук, эволюционной биологии и Искусственного Интеллекта, слово «априори» совершенно не объясняет, почему мозг-машина работает. Если мозг содержит в себе удивительную «фабрику априорных истин», которая действительно работает, производя точные убеждения, становится любопытно, почему мучимый жаждой охотник-собиратель не может использовать «фабрику априорных истин», чтобы обнаружить источник питьевой воды. Становится любопытно, почему вообще эволюция привела к появлению глаз, если уж существует способ производить точные убеждения без необходимости смотреть на что-либо.

Джеймс Ньюман сказал: «Факт, что яблоко, добавленное к ещё одному яблоку, всегда даёт два яблока, помогает обучать арифметике, однако никак не связан с истинностью равенства 1 + 1 = 2». Согласно Интернет Энциклопедии Философии, априорными называются утверждения, познаваемые независимо от опыта. Википедия цитирует Юма1: к отношениям между идеями «можно прийти благодаря одной только мыслительной деятельности, независимо от того, что существует где бы то ни было во вселенной»2. Можно увидеть, что 1 + 1 = 2, всего лишь подумав об этом и безо всяких яблок.

Но в нашу эру нейронаук следует понимать, что мысли объективно существуют во вселенной. Мысли — это деятельность мозга. Материальные мозги — реальные объекты вселенной — состоят из кварков согласно единой математической физике, законы которой внутри и вне вашего черепа одинаковы.

Когда вы мысленно складываете 1 + 1 и получаете 2, эти мысли представляют собой активацию нейронов. В принципе, мы могли бы экспериментально наблюдать те же самые материальные явления в чужом мозгу. Такой эксперимент потребует некоторого прогресса в вычислительной нейробиологии и нейрокомпьютерных интерфейсах, но, теоретически, он реализуем. Вы могли бы увидеть, как чья-то чужая машина работает в рамках цепочек материальных причин и следствий, чтобы «чисто умозрительно» вычислить, что 1 + 1 = 2. Чем же наблюдение за принципом работы чужого мозга как способ познания отличается от наблюдения за собственным мозгом, решающим ту же задачу? Когда «чистый разум» говорит вам, что 1 + 1 = 2, «независимо от опыта или наблюдений», вы на самом деле наблюдаете за работой вашего мозга в качестве свидетельства.

Если это кажется контринтуитивным, попробуйте рассмотреть разум/мозг как машину, сталкивающую нейронный шаблон единицы с нейронным шаблоном единицы и получающую нейронный шаблон двойки. Если двигатель работает правильно, то он должен производить абсолютно те же самые выходные данные, как если бы он наблюдал (при помощи глаз и сетчатки) за таким же мозгом-машиной, производящей такое же столкновение и копировал себе итоговый шаблон. Проще говоря, для любого априорного знания, полученного силой «чистого разума», вы узнали бы то же самое, если бы пронаблюдали активацию нейронов чужого мозга, в котором нейроны активируются таким же образом. Машины эквивалентны, результаты их работы эквивалентны, убеждения сцеплены с реальностью в той же степени.

Нет ничего, что вы могли бы знать «априори», и при этом не могли бы узнать с тем же уровнем правдоподобия, наблюдая за выбросом нейротрансмиттеров в чьём-то мозгу. Сами-то вы кто, дорогой читатель?

Именно поэтому вы можете предсказать результат сложения 1 яблока и 1 яблока, мысленно представив сначала такое сложение, или же ввести «3 х 4» в калькулятор, чтобы предсказать результат воображения 4 рядов с 3 яблоками в каждом из них. Вы и яблоки существуете в рамках единого универсального физического процесса, и одна его часть может отражать состояние другой.

Являются ли все активации нейронов, которые философы называют «априорными убеждениями», произвольными? Многие алгоритмы ИИ работают лучше с «регуляризацией», сдвигающей пространство решений в пользу более простых решений. Но регуляризованные алгоритмы сложнее сами по себе. Они содержат лишнюю строчку кода (а может и 1000 строчек), по сравнению с нерегуляризованными алгоритмами. Человеческий мозг предвзят в пользу простоты и таким образом мы мыслим более эффективно. Если на данном этапе нажать кнопку «Пренебречь», мы получим сложноустроенный мозг, существующий и работающий без каких-либо причин. Так что не следует называть априорные убеждения произвольными –– они формируются явно не путём генерации случайных чисел. (Что вообще означает слово «произвольный»?)

Даже если другие философы затрудняются с тем, чтобы обосновать свои утверждения, это не позволяет вам называть свои утверждения «истинными априори». Факт, что философ не в состоянии что-то объяснить, не может как обеспечить холодильник электроэнергией, так и создать волшебную фабрику по производству точных убеждений. Пока вы не поймёте, почему машина работает, не может быть ни перемирий, ни белых флагов.

Если выкинуть из головы «обоснования» и «аргументы», становится очевидным, почему бритва Оккама работает на практике: мы живём в простом мире, во вселенной с низкой энтропией, и в ней можно найти простые объяснения. «Но» - воскликнете вы, - «почему сама вселенная устроена таким образом?» Этого я не знаю, но своё незнание я воспринимаю, как следующую тайну, которую необходимо понять. Этот вопрос отличается от: «Как я могу обосновать бритву Оккама для гипотетического собеседника, который её ещё не принял?»

Возможно, вы не сможете убедить в чём бы то ни было гипотетического собеседника, не принимающего бритву Оккама, как не сможете убедить в чём-нибудь камень. Разуму необходимо некоторое количество динамической структуры, чтобы быть способным воспринимать аргументы. Если разум не поддерживает modus ponens, он может целый день принимать «A» и «A → B», но так и не вывести из этого «B». Как можно обосновать modus ponens для разума, который его не поддерживает? Как можно убедить камень стать мозгом?

Мозги эволюционировали из не-мозговой материи путём естественного отбора. Их существование не было оправданно в процессе спора с идеальным студентом философии абсолютной пустоты. Это не делает наши заключения бессмысленными. Мозг-машина может корректно работать, производя точные убеждения, даже если он был всего лишь собран, — не важно, человеческими руками или же совокупным стохастическим естественным отбором — а не появился во вселенной как результат дискуссии. Но чтобы удовлетвориться этим ответом, необходимо воспринимать рациональность на языке машин, а не аргументов.

  • 1. Юдковский ссылается на англоязычную статью, но в настоящее время она тоже не содержит упомянутой цитаты. — Прим.перев.
  • 2. Цитируется перевод С. И. Церетели. — Прим.перев.
Перевод: 
Горилла В Пиджаке, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
219
Оцените качество перевода: 
Средняя оценка: 3.8 (26 votes)

Редуктивная отсылка

Элиезер Юдковский

Основной тезис редукционизма (в моей формулировке) состоит в том, что человеческий разум ради эффективности использует многоуровневую карту, в рамках которой мы думаем об «атомах» и «кварках», «руках» и «пальцах», «тепле» и «кинетической энергии», как об отдельных сущностях. В то же время, реальность состоит из одного уровня. Атомы не являются некой дополнительной сущностью, чьё влияние на цепочку причин и следствий выходит за рамки влияния кварков.

Сади Карно сформулировал предшественника Второго Закона термодинамики, используя теорию теплорода, в которой тепло считалось жидкостью, перетекающей из горячих тел в холодные. Теплород создавался огнём и заставлял газы расширяться. До того, как люди додумались до редукции, свойства тепла изучались отдельно от кинетики. Если вам нужно спроектировать паровой двигатель, суммарный эффект всех этих крошечный вибраций и столкновений, что мы называем «теплом», можно представить значительно проще, чем при помощи полного квантово-механического описания каждого отдельного кварка. Люди думают лишь об относящихся к задаче величинах, которые действительно влияют на результат, и благодаря этому производят эффективные вычисления.

Однако реальность, судя по всему, использует всю квантовую механику кварков. Как-то раз я общался с человеком, который считал, будто использование общей теории относительности для решения задачи с малыми скоростями (например, скоростями артиллерийского снаряда) приведёт к неверному ответу. Не просто потребует больше вычислений, а даст ошибочный с точки зрения эксперимента результат — потому что при низких скоростях, артиллерийские снаряды подчиняются ньютоновской механике, а не ОТО. Но физика не работает таким образом. Реальность продолжает пользоваться теорией относительности, даже когда разница окажется лишь в четырнадцатом знаке после запятой, что человек воспринял бы как бессмысленную трату вычислительных ресурсов. Физика делает всё при помощи грубой силы. Ещё никто никогда не замечал, чтобы физика упрощала свои вычисления (если, конечно, Повелители Матрицы не стирали свидетелям память).

Таким образом, наша карта очень сильно отличается от территории. Наши карты — многоуровневые, а территория — одноуровневая. И раз представление столь отлично от обозначаемого объекта, в каком смысле убеждения вида: «Я ношу носки» могут быть истинными? Ведь сама реальность состоит лишь из кварков.

На случай, если вы забыли, что значит слово «истинный», я напомню классическое определение Альфреда Тарского:

Утверждение «снег белый» истинно тогда и только тогда, когда снег белый.

В случае, если вы забыли, в чём разница между утверждениями «Я верю в то, что снег белый» и « „Снег белый“ – истина», перечитайте эссе «Качественное замешательство». Нельзя получить истину лишь путём размышлений: если вы хотите, например, узнать, является ли истинным утверждение: «утренняя звезда = вечерняя звезда», вам потребуется телескоп. Изучить лишь сами убеждения недостаточно.

Именно это упускают постмодернисты, вопрошающие: «Но откуда вы можете знать, что ваши убеждения истинны?» Когда вы проводите эксперимент, вы на самом деле выходите за пределы собственной головы. Вы вступаете в сложное взаимодействие, результат которого с точки зрения причин и следствий определён предметом рассуждения, а не одними только вашими убеждениями о нём. Однажды я определил «реальность» так:

Даже когда у меня есть простая гипотеза, которая прекрасно согласуется со всеми известными мне данными, всё равно что-нибудь может меня удивить. Так что мне нужно по-разному называть те штуки, которые определяют мои предсказания, и ту штуку, которая определяет результат опыта. Первое я называю «убеждениями», а второе — «реальностью».

Интерпретация вашего эксперимента по-прежнему зависит от ваших исходных убеждений. Я не собираюсь сейчас рассматривать вопрос о том, Откуда Берутся Исходные Убеждения, так как это было бы отступлением от темы эссе. Суть в том, что истина определяется как идеальное сопоставление между убеждением и реальностью. Если мы понимаем, что планеты отличны от убеждений о планетах, мы можем провести такой эксперимент, что позволит проверить, является ли убеждение «утренняя звезда и вечерняя звезда – это одна и та же планета» истинным. Этот эксперимент будет включать в себя использование телескопов, а не одну лишь интроспекцию, так как мы понимаем, что «истина» подразумевает сравнение внутреннего убеждения и внешнего факта. Поэтому мы используем инструмент — телескоп, — наблюдения через который, насколько нам известно, зависят от внешней действительности — планеты.

Убеждение, что телескоп способен помочь нам определить «истинность» убеждения «утренняя звезда = вечерняя звезда» основывается на нашем предшествующем убеждении о том, как телескоп взаимодействует с планетой. Повторюсь, я не собираюсь рассматривать проблему исходных убеждений в данном эссе, разве что процитирую одну из моих любимых строчек Рэймонда Смаллиана: «Если более умудрённый читатель возразит, что данное утверждение является всего лишь тавтологией, то пусть хотя бы отдаст ему должное за внутреннюю непротиворечивость». Аналогично, я нахожу использование телескопа примером не порочного логического круга, а самосогласованности: для любого систематического способа получения истинных убеждений должно существовать рациональное объяснение того, как он работает.

Вопрос, интересующий нас сейчас: как мы можем рассуждать об истинности утверждения «снег белый», если в реальности существуют лишь кварки?

Наши убеждения о «снеге» и «белизне» порождаются определёнными наборами нейронных связей — пусть даже мы не в состоянии точно представить, как эти связи выглядят. Нейронные связи сами по себе воплощены в виде некоторого набора кварков, о котором мы знаем и того меньше. Где-то во внешнем мире существуют молекулы воды, температура которой достаточно низка, и молекулы организуются в виде повторяющейся мозаичной структуры. Эта структура совершенно не похожа на переплетение нейронов. В каком смысле сравнение одного (непостоянного) набора кварков с другим делает убеждение «снег белый» истинным?

Очевидно, ни я, ни кто-либо другой не может предложить Функцию Идеального Кваркового Сопоставления, которая для утверждения «снег белый» принимает на вход кварковые описания заключённого в нейронах убеждения (а также всего остального мозга) и снежинки (а также законов оптики), а в качестве результата возвращает «истинно» или «ложно». Да и не факт, что фундаментальный уровень — это действительно поля частиц.

С другой стороны, выкидывать на помойку все наши убеждения из-за того, что они не представлены в виде гигантского набора характеристик кварков, с которым всё равно невозможно работать и который мы не можем получить… кажется, не слишком разумно. Это не лучший способ достигнуть наших целей.

Мне представляется, что такие слова как «снег» или «белый» можно считать чем-то вроде долговой расписки. Нам не известно точно, какие именно физические конфигурации кварков считаются «снегом», однако, тем не менее, что-то вы зовёте снегом, а что-то — нет, и, даже если вы иногда ошибаетесь (например, относительно искусственного снега), Идеальный Всезнающий Научный Интерпретатор увидел бы сконцентрированный кластер в центре и перерисовал бы границы так, чтобы получить определение проще.

В одноуровневой вселенной, чей нижний уровень неизвестен наверняка или же слишком обширен для решения наших задач, концепции в многоуровневом разуме можно воспринимать как что-то вроде долговых расписок. Мы не знаем, чему точно они соответствуют. Однако, судя по всему, мы способны отличать положительные примеры от отрицательных, способны на этом основании делать предсказания, поэтому мы предполагаем (возможно, несколько обобщая при этом), что в кварках есть некоторое различие, что существуют какие-то отличия на фундаментальном уровне, объясняющие отличия в наших ощущениях и, в конце концов, приводящие к тому, что мы говорим «снег» или «не снег».

Я вижу эту белую субстанцию, в разных ситуациях она оказывается одной и той же, поэтому я предполагаю, что в окружающей среде есть какая-то стабильная неявная причина её существования. И я называю эту белую штуку «снег». «Снег» — это долговая расписка, описывающая простую мысленную границу, которая содержит в себе незримые причины моего опыта.

Мысленный эксперимент Хилари Патнэма (в котором вода это не H2O, а некая иная субстанция, обозначаемая XYZ, со всеми известными нам свойствами, характерными для воды) и последующий за ним философский спор, помогает пристальнее рассмотреть этот вопрос. У «снега» нет известного нам логического определения. Скорее это полученный эмпирически указатель на логическое определение. Такое рассуждение остаётся истинным, даже если вы считаете, что снег это кристаллы льда, которые в свою очередь являются сочетанием молекул воды при низкой температуре. Молекулы воды состоят из кварков. Что если окажется, что кварки состоят из чего-то ещё? Чем в таком случае окажется снежинка? Вы не знаете, но она останется снежинкой, а не превратится в огнетушитель.

И, конечно же, эти абзацы, которые я только что написал, находятся куда выше уровня кварков. «Воспринимать белую субстанцию на уровне чувств, отнести её к какой-то категории и подумать:“снег“ или „не снег“ » — это тоже рассуждения, которые находятся гораздо выше кварков.

Таким образом, мои мета-убеждения также являются долговыми расписками, и Идеальный Всезнающий Научный Интерпретатор знал бы какая конфигурация кварков (или чего бы там ни было), приводит мой мозг в состояние, соответствующее убеждению «верить в то, что снег белый».

Но тогда вся доступная нам реальность состоит из таких долговых расписок. Кто-то мог бы назвать это порочным кругом, я же предпочитаю называть это самосогласованностью.

Балансировать на шаткой эпистемологической жёрдочке — в отношении убеждений как о реальности, так и о рефлексии — где-то высоко-высоко над неизвестной фундаментальной реальностью и надеяться не свалиться может быть несколько пугающим занятием.

Впрочем, если подумать, то сложно представить иной вариант событий.

Таким образом, утверждение «реальность не содержит руки как фундаментальные сущности, существующие дополнительно и независимо от кварков» совершенно не то же самое, что «рук не существует» или «у меня нет рук». Нет никаких фундаментальных рук. Руки состоят из ладони и пальцев, которые в свою очередь состоят из мышц и костей, и так далее вплоть до полей элементарных частиц, которые, насколько нам известно, являются фундаментальными причинностными сущностями.

Это не то же самое, что утверждение «рук не существует». Не то же самое, что «слово „руки“ — это долговая расписка, которая никогда не будет оплачена, так как не существует эмпирического кластера, ему соответствующего». Или же «расписка „руки“ никогда не будет оплачена, потому что логически невозможно согласовать все необходимые характеристики». Или «утверждение „люди имеют руки“ логически непротиворечиво, но это не то состояние, в котором находится реальность».

Просто там, где мы видим «руки», на самом деле существуют конфигурации элементарных частиц. У этих конфигураций есть общие свойства, но они не фундаментальны.

Если бы я действительно не имел рук — если бы реальность внезапно перешла в то состояние, которое мы бы описали как «у Элиезера нет рук» — вскоре бы реальность соответствовала состоянию, которое мы бы описали как «Элиезер кричит, а кровь хлещет из обрубков его кистей»

И это истинно, даже несмотря на то, что в предложении выше не были указаны какие-либо положения кварков.

Соответственно, предыдущее предложение мета-истинно.

Карта содержит множество уровней, территория — всего лишь один. Это не значит, что более высоких уровней «не существует», аналогично дракону в гараже, которого там нет, или миражу в пустыне, который приводит к ожиданию питьевой воды там, где пить нечего. Высшие уровни вашей карты не ложны, не лишены референта: их референты находятся в единственном уровне физики. Если бы «крылья самолета» не существовали, самолет бы упал. «Крылья самолета» явно существуют в многоуровневой модели самолета в голове инженера, а также не явно в квантовой физике реального самолета. Неявное существование не то же самое что несуществование. Точное описание этой неявности нам не известно — оно не представлено в явном виде на нашей карте. Но это не мешает нашей карте работать или даже быть истинной.

Каждое понятие и убеждение в вашем мозгу, включая мета-убеждения о том, как ваш мозг работает и почему вы в состоянии формировать точные убеждения, находятся намного-намного выше реальности. И понимание этого несколько пугает…

Перевод: 
Горилла В Пиджаке
Номер в книге "Рациональность: от ИИ до зомби": 
220
Оцените качество перевода: 
Средняя оценка: 4.7 (10 votes)

Зомби! Зомби?

Элиезер Юдковский

«Зомби» в философском значении этого слова — это гипотетическое существо абсолютно во всём подобное нам: такое же поведение, речь, мозг. Каждый атом и кварк находится точно в том же месте и движется согласно тем же законам механики. Отличие лишь в том, что зомби не имеет сознания.

Более того, утверждается, что если зомби «возможны» (понятие, остающееся предметом баталий), то, исходя исключительно из нашего знания об этой «возможности», мы можем a priori сделать вывод о вне-физической природе сознания — в значении, описанном далее. Стандартное определение для такой точки зрения — «эпифеноменализм».

(Для тех, кто не знаком с зомби, обращаю внимание, что это не «чучело»1. См., например, статью в Стэнфордской философской энциклопедии о зомби. «Возможность» зомби признана существенной частью — вероятно, большинством — академических представителей философии сознания.)

Я где-то прочитал: «Вы не тот, кто произносит свои мысли — вы тот, кто слышит их». В иврите величайшая душа — та, которую Бог вдохнул в Адама — называется Н’шама, «слышащий».

Если вы мыслите себе «сознание» как исключительно пассивное слушание, понятие «зомби» изначально кажется легко представимым. Это некто, лишённый «слышащего».

(Предупреждение: это очень длинное эссе на 5800 слов, в котором рассматриваются идеи Дэвида Чалмерса. Это можно считать моим наглядным контрпримером к Спору с Элиезером, часть 2, где Ричард Чапелл обвиняет меня в том, что я не связываюсь со сложными аргументами настоящих философов.)

Когда вы открываете холодильник и видите, что апельсиновый сок закончился, вы думаете: «Черт, я остался без сока». Звучание этих слов, вероятно, воспроизводится в слуховом отделе коры вашего головного мозга, как будто вы слышите, словно эти слова сказал кто-то ещё. (Почему я так думаю? Потому что носители китайского языка способны запоминать более длинные последовательности цифр, чем носители английского. Китайские числительные все односложные, и говорящие на китайском могут помнить до 10 цифр, в отличие от известного «7±2» для англоговорящих. Кажется, в «оперативной памяти» слухового отдела коры головного мозга существует самозамкнутая петля из повторяющихся звуков, ограничение по длине которой исчисляется в фонемах.)

Предположим, что сказанное верно. В качестве начального условия это не должно составлять трудности для сторонников зомби. Даже если в отношении людей это неверно, кажется нетрудным вообразить ИИ, разработанный на такой основе (а «возможность вообразить» — это суть спора о зомби). Сказанное не только мыслимо в принципе — в ближайшую пару десятилетий вполне возможно, что хирурги смогут подключить сеть рецепторов нервных сигналов к слуховой коре и прочитать разворачивающееся в ней повествование. (Исследователи уже подключились к боковому коленчатому ядру2 мозга кошки и воспроизвели узнаваемые визуальные образы на входе.)

Итак, наш зомби, физически идентичный нам до последнего атома, откроет холодильник и сформирует в слуховой коре образы для фонем «Черт, я остался без сока». До этого момента эпифеноменалисты охотно с нами соглашаются.

Но, говорит эпифеноменалист, внутри зомби некому слышать. Внутреннего слушателя нет. Внутреннее повествование произнесено, но не услышано. Вы не тот, кто высказывает ваши мысли, а тот, кто их слышит.

Они бы сказали, что, кажется, куда проще создать ИИ, который выводит на печать некое внутреннее повествование, чем показывать, что внутренний слушатель слышит его.

Спор о зомби состоит в том, что если Мир Зомби возможен — не обязательно физически возможен в нашей вселенной, лишь «возможен в теории», или «может быть представлен», или что-то в этом роде — тогда сознание должно быть вне-физическим явлением, чем-то вне и сверх обычных атомов. Почему? Потому что даже если вы каким-то образом узнаете положение всех атомов во вселенной, вам все ещё предстоит услышать, как отдельный и дополнительный факт, что люди обладают сознанием — что у них есть внутренний слушатель — что мы, вероятно, не в Мире Зомби.

«Зомбизм» не то же самое, что дуализм. Декарт считал, что существует телесная субстанция и совершенно отличная от нее разумная субстанция, но Декарт также полагал, что эта разумная субстанция есть источник активной причинности, взаимодействующий с телесной субстанцией и управляющий нашей речью и действиями. Лишение человека разумной субстанции породило бы традиционного, шатающегося и завывающего, зомби.

И хотя в иврите самая сокровенная душа названа Н’шама, тот-кто-слышит, я не слышал о рабби, отстаивающем возможность зомби. Большинство рабби, вероятно, почувствовали бы отвращение к идее, что божественная частица, которую Бог вдохнул в Адама, на самом деле бездействует.

Технический термин, обозначающий веру, что сознание присутствует, но не воздействует на физический мир, — эпифеноменализм.

Хотя в споре о зомби есть и другие составляющие (я разберусь с ними далее), думаю, первое, что прельщает в «зомбизме» — это интуитивно понятный тезис о пассивном слушателе. В особенности он прельщает непрофессиональную аудиторию. Ключевое понятие просто и доступно: свет горит, вот только дома никого нет.

Философы обращаются к интуитивно понятному тезису о пассивном слушателе, когда говорят: «Конечно, мир зомби можно представить. Вы в точности знаете, на что он будет похож».

Одно из величайших сражений Войны зомби происходит на почве того, что, в точности, имеют в виду люди, говоря, что зомби «возможны». Ранние философы-зомбисты в 1970-е просто считали, что зомби «возможны» и не трудились определить, какого рода возможность они имели в виду.

Поскольку я поднаторел в математической логике, первое, что приходит мне на ум — это логическая возможность. Если у вас есть набор утверждений вроде {(A ⇒ B), (B ⇒ C), (C ⇒ ¬A)}, то сложное убеждение логически возможно, если для него есть модель — которая, в вышеприведенном простом случае, сводится к поиску таких значений {A, B, C}, что все утверждения {(A ⇒ B), (B ⇒ C), (C ⇒ ¬A)} — истинны. Тогда ответом будет {A = B = C = 0}, а так же {A = 0, B = C = 1} или {A = B = 0, C = 1}.

Нечто будет казаться возможным — «концептуально возможным» или «представимым» — если вы рассматриваете подборку утверждений, не замечая противоречий. Но, как правило, наибольшая трудность — именно обнаружить противоречия или, с другой стороны, разработать полную и точную модель! Если вы ограничиваетесь простыми Булевыми утверждениями вида((А или В или С) и (В или ~С или D) и (D или ~A или ~C) …), конъюнкциями или дизъюнкциями трех переменных, тогда это очень известная задача под названием 3-SAT, одна из первых задач, для которой была доказана NP-полнота3.

Итак, то, что вы не видите противоречий в Мире зомби с первого взгляда, не означает, что противоречий не существует. Это как не видеть с первого взгляда противоречий в гипотезе Римана. От концептуальной возможности («не вижу трудности») к строгой логической возможности — огромный скачок. Легко сделать так, что это будет скачок к NP-полноте, а с использованием теорий первого порядка4, даже для ограниченных задач вычисление можно сделать сколь угодно трудным. И именно логическая, а не концептуальная возможность Мира зомби необходима, чтобы предположить, что логически всезнающий разум может знать положение всех атомов во вселенной — и все же ему нужно сообщить как дополнительный, не вытекающий из его знания факт то, что у нас есть внутренний слушатель.

Само по себе то, что вы пока не видите противоречие, не даёт гарантии, что вы не увидите противоречие в следующие 30 секунд. «Все нечётные числа — простые. Доказательство: 3 — простое, 5 — простое, 7 — простое…»

Поэтому давайте ещё немного поразмыслим над Спором о зомби. Можем ли мы придумать контрпример к утверждению «Сознание не имеет причинного воздействия на мир, которое может быть обнаружено извне»?

Если вы закроете глаза и сконцентрируетесь на вашей внутренней осведомлённости, в вашем внутреннем повествовании будут появляться мысли из ряда «Я сознаю…», «Моё осознание отдельно от моих мыслей», «Я не тот, кто высказывает мои мысли, но тот, кто их слышит», «Поток моего сознания не есть моё сознание» и «Кажется, существует часть меня, которую я могу представить уничтоженной без перемен в моем внешнем поведении».

Вы даже можете произнести эти фразы вслух, пока размышляете. В принципе, некто со сверхчувствительным томографом мог бы прочитать фонемы в вашей слуховой коре. Однако произнести вслух значит устранить все сомнения насчёт того, вошли ли вы в мир проверяемости и физических следствий.

Определённо кажется, что внутренний слушатель ловится в акте слушания той вашей частью, что создаёт внутреннее повествование и приводит в движение язык.

Представьте, что таинственная инопланетная раса посетила вас и оставила в подарок таинственный чёрный ящик. Вы тыкаете и пинаете ящик, но (насколько можете сказать) ничего не происходит. Вы не можете вынудить ящик отсыпать вам золотых монет или ответить на вопросы, и делаете вывод, что ящик причинно неактивен. «Для всех Х чёрный ящик не делает Х». Чёрный ящик — результат, но не причина; он эпифеноменален, не имеет причинной способности. Размышляя, вы проверяете эту общую гипотезу, чтобы понять, истинна ли она в некоторых пробных случаях, и она кажется истинной — «Превращает ли ящик свинец в золото? Нет. Кипятит ли ящик воду? Нет.»

Но вы можете видеть чёрный ящик. Он поглощает свет и веско оттягивает вашу руку. Это также часть танца причинности. Если бы чёрный ящик был всецело за пределами причинной вселенной, вы бы не могли его видеть, вы никак не могли бы узнать о его существовании, вы не могли бы сказать: «Спасибо за ящик!» Вы бы не думали об этом контрпримере, формулируя общее правило. «Все Х: Чёрный ящик не делает Х». Но он всё время был здесь.

(На самом деле, инопланетяне оставили вам и другой чёрный ящик, на этот раз совершенно эпифеноменальный, и у вас нет ни малейшего намека, что он здесь, в вашей комнате. Они так пошутили.)

Если вы можете закрыть глаза и ощутить, что вы ощущаете — если вы можете осознавать себя сознающего, и думаете «Я сознаю, что я сознаю» — и говорите это вслух — то ваше сознание не бездействует в отношении вашего внутреннего повествования или ваших шевелящихся губ. Вы можете видеть себя видящим, и ваше внутреннее повествование отражает это, так же, как ваши губы — если вы решите сказать об этом вслух.

Я не встречал приведённый выше аргумент — «слушатель, пойманный в акте слушания» — сформулированным именно так, хотя это, конечно, может быть кем-то уже высказано.

Но общепринятым моментом является то — и философы-зомбисты это признают! — что философы Мира зомби, до последнего атома идентичные нашим философам, пишут те же труды по философии сознания.

С этого момента Мир зомби перестаёт быть интуитивно понятным следствием идеи пассивного слушателя.

Философы, пишущие о сознании, окажутся хотя бы одним воздействием сознания на мир. Вы можете придумать изощрённые причины, почему это не так, но вам придётся постараться.

Интуитивно вы предположите, что если бы ваша внутренняя осведомлённость исчезла, мир бы изменился так, что ваше внутреннее повествование более не включало бы фразы вроде «Внутри меня есть таинственный слушатель», потому что таинственный слушатель исчез. Но обычно ваше внутреннее повествование может сказать «Я осознаю свою осведомлённость» лишь после того, как вы сфокусируете своё сознание на собственной осведомлённости — из этого следует, что если первое так и не произошло, не будет и второго. Вы можете придумать изощрённые причины, почему это не так, но вам придётся постараться.

Вы можете внушить себе веру в то, что «Сознание не воздействует» и не увидите противоречия, пока не поймёте, что разговор о сознании — следствие того, что вы сознаете. Но как только вы заметите связь между общим правилом, что «сознание не воздействует», и его частным приложением, что сознание не воздействует на то, как философы пишут труды про сознание — «зомбизм» перестаёт быть интуитивно понятным и начинает требовать, чтобы вы приняли как должное странные вещи.

Первая странность, которую вы должны принять — существование Повелителя зомби, бога Мира зомби, который тайно управляет зомби-философами и заставляет их говорить и писать о сознании.

Повелитель зомби не кажется невозможным. Люди часто не вполне последовательны, говоря о сознании. Наверное, нетрудно исказить их рассуждения до уровня, скажем, обывателя, разглагольствующего в баре. Можно взять за основу болтовню тысячи обывателей на тему сознания, скормить её не сознающему, но хитроумному ИИ — продвинутому, но не самообучающемуся — и получить на выходе рассуждения о «сознании», звучащие так же здраво, как рассуждения большинства людей — то есть, вполне бредово.

Но эти рассуждения о «сознании» не будут произвольными. Они не созданы внутри ИИ — это будет записанная имитация чьей-то речи, просто симуляция5, в которой ведущий ИИ озвучивает неигровых персонажей. Это не то, что имеется в виду, когда говорят о Мире зомби.

Предположим, Мир зомби до последнего атома совпадает с нашим миром, за исключением того, что его обитатели лишены сознания. Далее, атомы в Мире зомби движутся по тем же физическим законам, что и в нашем мире. Если есть «законы сопряжения», определяющие, какие соединения атомов пробуждают сознание, то эти законы неизвестны. Но, гипотетически, различие и не может быть установлено экспериментально. Когда речь идёт о кварке, движущемся так или этак или воздействующем на соседние кварки — о том, что можно измерить в рамках эксперимента —действуют те же законы физики.

В Мире зомби нет места для Повелителя зомби, потому что последнему придётся управлять движением зомбьих губ, а такое управление, в принципе, можно обнаружить экспериментально. Повелитель зомби движет губами — следовательно, у него есть наблюдаемые следствия. Это может быть точка, в которой электрон по знаку Повелителя движется туда, а не сюда. (Если не принимать, что Повелитель на самом деле находится внутри мира, понимаемого как структура из кварков — но тогда Мир зомби не совпадает с нашим до последнего атома, если вы не думаете, что Повелитель зомби присутствует и в нашем мире.)

Когда философ в нашем мире пишет: «Я думаю, что Мир зомби возможен», его пальцы последовательно нажимают клавиши З-О-М-Б-И. В этих нажатиях можно отследить цепь причинности: сокращение мышц, возбуждение нервов, команды, посылаемые через спинной мозг двигательной областью коры головного мозга — и далее в менее известные области мозга, где внутреннее повествование философа впервые заговорило о «сознании».

И зомби-двойник философа нажимает те же клавиши, вследствие тех же факторов с точки зрения причинности. В цепи объяснений того, почему философ пишет именно так, нет причины, которой бы отсутствовала в отношении его зомби-двойника. У двойника также есть внутреннее повествование о «сознании», которое продвинутый томограф мог бы считать из его слуховой коры. И какие бы другие мысли, или иные подобные мотивы, ни вели к такому внутреннему повествованию, они в точности те же как в нашей вселенной, так и в Мире зомби.

Итак, вы не можете сказать, что философ пишет о сознании вследствие сознания, в то время как зомби-двойник пишет о сознании по знаку Повелителя зомби или ИИ. Когда вы отслеживаете цепь причинности от клавиатуры к внутреннему повествованию, отзывающемуся в слуховой коре, и к причине повествования, вы должны найти такое же физическое объяснение в нашем мире, как и в мире зомби.

Как пишет самый убежденный защитник зомбизма Дэвид Чалмерс6:

Подумайте о моем зомби-двойнике в соседней вселенной. Он все время говорит о сознательном опыте — по сути, он кажется одержимым. Он тратит абсурдное количество времени, сгорбившись за компьютером и строча главу за главой о тайнах сознания. Он часто говорит об удовольствии, которое он получает от неких свойств чувственного опыта7, питая особую любовь к темно-зелёному и багровому. Он часто ввязывается в споры с зомби-материалистами, заявляя, что их позиция несправедлива к реалиям сознательного опыта.

И в то же время у него нет сознательного опыта вообще! В его вселенной материалисты правы, а он ошибается. Большая часть его утверждений о сознательном опыте — попросту ложь. Но, несомненно, есть физическое или физиологическое объяснение, почему он утверждает то, что утверждает. В конце концов, его вселенная всецело подчиняется законам, в ней нет чудес — следовательно, должно быть какое-то объяснение и его утверждениям.

…Любое объяснение поведения моего двойника равно будет считаться объяснением моего поведения, так как процессы внутри его тела в точности соответствуют процессам внутри моего. Основание под его утверждениями, очевидно, не зависит от существования сознания, ведь в его мире сознания не существует. Следовательно, объяснение моих утверждений также не зависит от существования сознания.

Чалмерс не выдвигает аргументы против зомби. Таковы его подлинные убеждения!

Эта парадоксальная ситуация одновременно радует и пугает. Она не обязательно станет приговором убеждениям не-редукционизма, но, по крайней мере, с ней нам придётся сцепиться.

Я на самом деле полагаю, что эта пилюля горчайшая из всех, что нам вовеки пришлось проглотить. Таков мой сомнительный комплимент Дэвиду Чалмерсу. Менее горькая не помогла бы прояснить все следствия, позволила бы уйти от столкновения с ними или рационализировать причину, почему все не так страшно.

Почему кто бы то ни было решил проглотить такую пилюлю? Почему кто-то выдвинул утверждение о бессознательных зомби, которые пишут труды о сознании точно по той же причине, что и наши, несомненно наделённые сознанием, философы?

Я писал не об интуитивно ясном понятии пассивного слушателя. Интуиция в этом случае может подсказать, что зомби могут водить машину, заниматься математикой или даже влюбиться — но она не говорит, что зомби пишут философские труды о своём пассивном слушателе.

Спор о зомби покоится не только на понятии пассивного слушателя. Если б дело было только в нем, думаю, спор бы уже затих. Интуитивное представление, что «слушателя» можно устранить без последствий, исчезло бы, как только вы осознаете, что ваше внутреннее повествование, по-видимому, связывается со слушателем в каждом акте слушания.

Нет, побуждение проглотить эту пилюлю исходит из совершенно иного интуитивного представления — состоящего в том, что, сколько бы атомов вы ни добавили, сколько бы масс и электрических зарядов ни взаимодействовали, они с необходимостью никогда не вызовут субъективного ощущения таинственной красноты красного. То, что расположение таких-то атомов в таком-то порядке вызывает ощущение красноты, (по Чалмерсу) может быть фактом нашей физической вселенной — но если это верно, то без данного факта можно обойтись и объяснить [это явление], не вовлекая движение атомов.

Но если вы рассмотрите второе интуитивное представление само по себе, без понятия пассивного слушателя, трудно понять, почему оно предполагает зомбизм. Возможно это всего лишь иной род вещества, отличный от атомов и дополняющий их, который не является причинно пассивным — душа, которая на самом деле порождает вещество и на самом деле играет роль причинности, когда мы пишем о «таинственной красноте красного». Уберите душу и…хм, предполагая, что вы не впадёте в кому, вы точно не напишете новых трудов о сознании.

Это точка зрения Декарта и большинства других древних мыслителей. Душа имеет иную природу, но она взаимодействует с телом. Точка зрения Декарта известна как вещественный дуализм — существует вещество-мысль, вещество-разум, и оно отлично от атомов; но оно причинно действенно, взаимодействует с нашей вселенной и оставляет на ней различимый отпечаток.

Зомбисты же привержены дуализму свойств — они верят не в обособленную душу, а в то, что материя в нашей вселенной имеет дополнительные свойства, не относящиеся к физическим.

«Не относящиеся к физическим?» Что это значит? А то, что дополнительные свойства здесь, но они не влияют на движение атомов, в отличие от параметров электрического заряда или массы. Дополнительные свойства не обнаруживаются сторонним экспериментом. Вы осознаете, что наделены сознанием, изнутри ваших дополнительных свойств, но ни один учёный не может непосредственно обнаружить это извне.

Итак, дополнительные свойства здесь, но они не являются причинно активными. Они не перемещают атомы и поэтому не могут быть обнаружены извне.

И поэтому мы (якобы) можем представить вселенную в точности, как эта, где все атомы на тех же местах, но дополнительные свойства отсутствуют, и все происходит так же, как раньше, только никто не наделён сознанием.

Мир зомби может быть физически невозможным, — скажут зомбисты, — так как установлено, что вся материя в нашей вселенной имеет дополнительные свойства, либо подчиняется «законам сопряжения», пробуждающим сознание — но Мир зомби возможен логически: законы сопряжения могли бы оказаться иными.

Но если вы осознаете, что мыслимость и логическая возможность не одно и то же, и что Мир зомби не так уж интуитивно понятен — почему вы говорите, что Мир зомби логически возможен?

Почему, почему вы говорите, что дополнительные свойства эпифеноменальны и не могут быть обнаружены?

Мы можем сделать эту дилемму ещё жёстче. Чалмерс верит, что существует нечто, называемое сознанием, и что это сознание воплощает подлинную и неописуемую сущность таинственной красноты красного. Это может быть свойство, не связанное с массой и зарядом, но оно есть, и это — сознание. Сказав все это, Чалмерс далее определяет, что сущность сознания эпифеноменальна и не является причинно действенной — но почему он так решил?

Как можно сказать, что возможно устранить самую суть сознания и оставить все атомы на своих местах и в том же состоянии? Если это верно, нам нужно отдельное физическое объяснение для всего того, что Чалмерс говорит о «таинственной красноте красного». То есть, одновременно существуют вне-физическая таинственная краснота красного и совершенно отдельная физическая причина того, что Чалмерс способен говорить о «таинственной красноте красного».

Чалмерс признает, что эти две вещи, по-видимому, должны быть связаны, но послушайте, зачем нам сразу обе? Почему бы не выбрать ту или другую?

Если вы утверждаете, что существует таинственная краснота красного, почему бы не сказать, что она взаимодействует с вашим внутренним повествованием и побуждает вас говорить о ней?

Не проще ли подход, выбранный Декартом — в строгом смысле?

Зачем заявлять о вне-материальной душе — и тут же о том, что эта душа не воздействует на физический мир — а затем вводить ужасно таинственный материальный процесс, который побуждает ваше внутреннее повествование говорить о сознательном опыте?

Почему бы не заявить об истинной материи сознания, к которой простые бездушные атомы в любом количестве не смогут ничего добавить — и только потом, зайдя так далеко, позволить этой материи сознания обладать свойствами причинности вроде тех, что позволяют философам говорить о сознании?

Я не одобряю подход Декарта. Но я хотя бы понимаю, из чего исходил Декарт. Сознание кажется таинственным, и вы заявляете о таинственной материи сознания. Прекрасно!

Но теперь зомбисты заявляют, что эта таинственная материя ничего не делает, так что вам необходимо абсолютно новое объяснение того, почему вы можете сказать, что наделены сознанием.

Это не витализм. Это нечто столь причудливое, что виталисты подавились бы кофе. «Когда огонь горит, он высвобождает флогистон. Но флогистон не оказывает экспериментально подтверждённого воздействия на нашу вселенную, так что вам придётся искать отдельное объяснение, почему огонь плавит снег». Вы шутите?

Полагают ли приверженцы «дуализма свойств», что, если они заявят о новой действующей силе, которая оказывает причинное воздействие на наблюдаемые объекты, они высунут голову слишком далеко?

Что до меня, я бы сказал, что если вы заявляете о таинственном, дополнительном, отдельном, сугубо умозрительном свойстве сознания, не связанном с положениями и скоростями в пространстве, вы уже высунули голову дальше некуда. Сначала заявить о материи сознания, а потом о том, что она ни на что не влияет — во имя няшных котят, за что?

Это даже не является очевидным карьерным мотивом. «Привет, я философ сознания. Мой предмет исследования — самая важная штука во вселенной, и мне нужна наилучшая финансовая поддержка, понимаете? Хм, мило, что вы это сказали, но на самом деле явление, которое я изучаю, вообще ни на что не влияет». (Аргумент от карьеры несостоятелен, но я его привёл, чтобы оставить путь к отступлению.

Чалмерс критикует вещественный дуализм на том основании, что не видно новой физической теории или нового вещественного взаимодействия, которые могли бы объяснить сознание. Но у дуализма свойств те же проблемы. Неважно, о каком роде двойных свойств вы говорите — как именно он объясняет природу сознания?

Когда Чалмерс заявляет о дополнительном свойстве, которым является сознание, он перепрыгивает необъяснимое. Как это поможет его теории определить далее, что это дополнительное свойство ни на что не влияет? Почему бы просто не придать ему причинность?

Если б я разозлился, именно сейчас я бы вытащил на свет дракона — притчу Карла Сагана о драконе в гараже. «У меня в гараже дракон!» Отлично! Пойдём посмотрим! «Ты его не увидишь — это невидимый дракон». Тогда я бы хотел его услышать! «Извини, дракон не слышен». Тогда я измерю прирост концентрации углекислоты! «Он не дышит». Я распылю в воздухе мешок муки, чтобы обрисовать его форму. «Дракон проницаем для муки».

Один из мотивов для попытки сделать свою теорию принципиально нефальсифицируемой — то, что в глубине души вы боитесь подвергнуть её проверке. Сэр Роджер Пенроуз (физик) и Стюарт Хэмерофф (невролог) — вещественные дуалисты, полагающие, что в квантах протекает нечто таинственное, что Эверетт неправ и что «коллапс волновой функции» физически реален — что именно там обитает сознание, и таким образом оно оказывает причинное воздействие на ваши губы, когда вы произносите «Я мыслю, следовательно, я существую». Убеждённые в этом, они предсказывают, что нейроны сопротивляются декогеренции достаточно долго, чтобы поддерживать макроскопические квантовые состояния.

В данный момент эта гипотеза подвергается проверке, и пока что исследования не подтверждают точку зрения Пенроуза…
… но само поведение Пенроуза достойно уважения с точки зрения науки. Может, оно не соответствует байесовым критериям, но всё же имеет здоровые корни. Он выступил с бредовой гипотезой — указал, как её проверить — вышел и действительно попытался проверить её.

Я сказал Стюарту Хэмероффу: «Думаю, гипотеза, которую вы проверяете, совершенно безнадёжна, и ваши эксперименты определённо заслуживают финансирования. Даже если вы не найдёте в точности то, что ищете, вы ищете там, где до вас никто не искал — и можете обнаружить что-нибудь интересное».

Итак, устранение эпифеноменализма будет неприятно тем, что зомбисты побоятся говорить о действующем веществе-сознании, ведь учёные могут отправиться искать эти дополнительные свойства — и не найти их.

Хотя я не думаю, что это справедливо в отношении Чалмерса. Если бы Чалмерсу недоставало честности к себе, он мог бы многое сделать намного проще.

(На случай, если Чалмерс читает это и действительно боится фальсификации, я укажу, что, если эпифеноменализм ложен, то существует другое объяснение так называемому сознанию, и оно будет в итоге найдено — тогда теория Чалмерса обрушится. Так что, если Чалмерса заботит его место в истории, у него нет причин поддерживать эпифеноменализм, разве что он действительно считает его истинным).

Чалмерс — один из самых обескураживающих философов, которого я знаю. Иногда мне интересно, не готовит ли он нечто вроде «Побеждённого атеизма». Чалмерс проводит действительно тонкий анализ… и в последний миг сворачивает в тупик. Он показывает все неувязки сценария с Миром зомби — и тут же, выбросив все свои доводы на свалку, смиренно принимает этот сценарий.

Чалмерс делает то же самое, когда подробно объясняет, почему нельзя оправдать нашу собственную веру в сознание тем, что наш зомби-двойник ошибается, говоря те же вещи по тем же причинам.

По поводу теории Чалмерса — его слова о вере в сознание не имеют причинного обоснования; вера не может быть вызвана фактом как таковым. В отсутствие сознания Чалмерс писал бы те же труды по тем же причинам.

Насчёт эпифеноменализма — высказывание Чалмерса о вере в сознание не обосновано тем, что это результат процесса, систематически выдающего верные убеждения, поскольку зомби-двойник пишет те же труды в результате того же систематического процесса — и ошибается.

Чалмерс признает это и, на самом деле, объясняет в своей книге каждый довод очень подробно. Так получается, Чалмерс прочно доказал, что его вера в эпифеноменальное сознание не обоснована? Нет, он пишет:

Опыт сознания находится в центре нашей эпистемологической вселенной; у нас есть прямой доступ к нему. Отсюда вопрос: что, как не причинная связь с этим опытом и не механизмы формирования убеждений, обосновывает наше доверие к этому опыту? Думаю, ответ ясен: обладание опытом обосновывает доверие к нему. Например, сам факт, что у меня есть опыт красного, обосновывает мое убеждение, что у меня есть опыт красного…

Поскольку мой зомби-двойник лишён опыта, его эпистемологическая ситуация сильно отличается от моей, и его суждения лишены соответствующего обоснования. Тянет возразить, что, если мое убеждение относится к области физического, его обоснование также должно относиться к этой области — но это non sequitur8. Из отсутствия обоснований в области физического можно сделать вывод, что не обосновано убеждение моей физической части (скажем, мозга). Но вопрос в том, обосновано ли мое убеждение, а не убеждение моего мозга — ведь, если дуализм свойств верен, то я — нечто большее, чем мой мозг.

Итак — если я верно понял этот тезис — есть «подлинный я», где-то за пределами моего мозга, который верит, что он не зомби, и непосредственно ощущает опыт зомби-небытия — и это обосновывает его веру.

Но Чалмерс лишь написал все это в своей очень даже физической книге, и то же сделал Чалмерс-зомби.

Чалмерс-зомби не смог бы написать книгу благодаря тому, что за пределами мозга есть «подлинное зомби-я» — должна быть совершенно иная причина в рамках законов физики.

Следовательно, даже если существует скрытая часть Чалмерса, сознающая и верящая в сознание прямо и непосредственно, также существует отделимое подпространство Чалмерса — закрытая для причинности познающая подсистема, действующая всецело в рамках физики — именно это «внешнее я» проговаривает чалмерсово внутреннее повествование и пишет труды о сознании.

Не вижу способа избежать обвинения, что, исходя из его же собственной теории, этот отделимый внешний Чалмерс сошёл с ума. Это часть Чалмерса, которая одинакова в этом мире и в Мире зомби, и в каждом из миров она пишет философские труды о сознании без веских причин. Его философские труды не исходят из внутреннего ядра осведомлённости и убеждения в осведомлённости, они исходят из обычной физики внутреннего повествования, которое заставляет пальцы Чалмерса нажимать на клавиши компьютера.

И этот безумный внешний Чалмерс пишет философские труды, которые вдруг оказываются совершенно верными, по отдельной и дополнительной чудесной причине. Чудо не является логически необходимым (тогда был бы логически невозможен и Мир зомби). Это физически возможное чудо, которое оказывается верным в том, что мы полагаем нашей вселенной, даже несмотря на то, что наука не может различить нашу вселенную и Мир зомби.

Или по меньшей мере так покажется исходя из того, что говорит нам безумный, по его собственному признанию, внешний Чалмерс.

Думаю, я говорю за всех редукционистов, когда произношу: «Э-э-э…?»

Это не эпициклы. То есть: «Движение планет следует этим эпициклам — но эпициклы на самом деле ничего не делают — что-то ещё, что я не могу объяснить, движет планеты так, как это описывают эпициклы — и, я бы сказал, даже если б не было никаких эпициклов».

У меня нестандартный взгляд на философию, поскольку я смотрю на всё глазами разработчика ИИ; конкретнее — самосовершенствующегося сильного ИИ со стабильной структурой мотивации.

Когда я думаю о разработке ИИ, я рассматриваю такие принципы, как теория вероятности, байесовы представления о свидетельстве как дифференциальной диагностике и, прежде всего, согласованность мышления. Любой самосовершенствующийся ИИ, начинающий работу в состоянии несогласованного мышления, долго не протянет.

Допустим, что самосовершенствующийся ИИ обратится к той части себя, которая выводит «Б» из при наличии А — то есть, записывает в память «Б», если истинно условие А. Исследовав эту часть, ИИ определяет, каким образом она (причинно) действует в контексте большей вселенной, и решает, что эта часть систематически записывает в память ложные данные. В этом случае ИИ обнаружил нечто, похожее на баг, и изменит себя так, чтобы не записывать «Б» в область убеждений при наличии А.

Любая эпистемологическая теория, не принимающая во внимание согласованность мышления — не лучшая теория, чтобы строить на её основе самосовершенствующийся ИИ. С моей точки зрения, это сокрушительный аргумент, принимая во внимание, для чего я на самом деле собираюсь применять философию. Так что, в любом случае мне придётся разработать теорию, предусматривающую согласованность мышления. И когда я это сделаю — ей-богу, согласованность мышления обретёт интуитивно понятный смысл.

Таков необычный аспект, в котором я предполагаю рассматривать все эти вопросы. А теперь вернёмся к Чалмерсу.

Причинно замкнутый «внешний Чалмерс» (на которого никак не влияет «внутренний Чалмерс» со своими отдельными, дополнительными знаниями и убеждениями) должен осуществлять некое систематически ненадёжное, недозволенное действие, которое необъяснимым образом побуждает внутреннее повествование порождать убеждения о «внутреннем Чалмерсе» — правильные без какой-либо на то причины, логичной в нашей вселенной.

Но у внешнего Чалмерса или *любого ИИ с последовательным мышлением и самодиагностикой *нет возможных оснований, чтобы верить в эту чудесную правильность. Хорошо спроектированный ИИ, думаю, выглядит как последовательно мыслящий разум, воплощённый в системе причинности, с проверяемой теорией того, как эта система причинности систематически порождает точные убеждения, решая при этом поставленные перед ней задачи.

Итак, ИИ вглядится в Чалмерса и увидит познавательную систему с замкнутыми причинными связями, выдающую бессмысленное внутреннее повествование. Бессмыслица, по-видимому, существенно влияет на то, что, по мысли Чалмерса, должно считаться морально целостной личностью.

Эту проблему не нужно решать теоретикам дружественного ИИ — сложность возникает, лишь если вы эпифеноменалист. Если верить редукционистам (сознание возникает в пределах атомарной структуры, или вещественным дуалистам (сознание представляет собой причинно действенную нематериальную сущность), говорящий о сознании говорит о чем-то реально существующем, и последовательно мыслящий байесианский ИИ может понять это, отследив цепь причин, побуждающих человека говорить о «сознании».

По Чалмерсу, познавательная система с замкнутыми причинными связями, порождающая чалмерсово внутреннее повествование, работает с (таинственными) искажениями, поскольку чудесным образом — не с необходимостью, а случайно и только в нашейвселенной — выдаёт верные ответы. Более того, внутреннее повествование утверждает, что «внутреннее повествование, работает с (таинственными) искажениями, но чудесным образом верно отражает обоснованные представления эпифеноменального внутреннего ядра»

Да неужели!

Не пора ли вам уже отбросить эту идею? Не пора ли, на самом грубом интуитивном уровне, прийти к мысли: «О чем я только думал?»

Человечество накопило обширный опыт того, как выглядят верные представления о мире. Они выглядят совсем не так.

«Аргумент от недоверия», — вы говорите. Отлично, вы хотите, чтобы я это сказал? Указанная чалмерсианская теория заявляет о множественных необъяснимых сложных чудесах. Это обрушивает её изначальную вероятность, согласно правилу конъюнкции вероятностей и бритве Оккама. Следовательно, над ней берут верх, самое малое, две теории, которые предусматривают меньше чудесного, а именно:

  1. вещественный дуализм:
  • «существует еще не понятая материя сознания, необычайная сверх-физическая материя, которая оказывает видимое воздействие на наш мир; именно эта материя побуждает нас говорить о сознании».
  1. Не-вполне-основанный-на-вере редукционизм:
  • так называемое «сознание» возникает в рамках физики не понятым пока образом, в точности как последние три тысячи раз, когда человечество сталкивалось с чем-то таинственным.

  • интуитивное представление, что вещество не может, теоретически, быть частью сознания, — неверно. Точное знание причин, почему вы можете рассуждать о сознании, могло бы подтолкнуть вас к пониманию вещей, о которых вы не имеете пока никакого представления; и впоследствии вы бы осознали, что ваши доводы о том, что в физике нет места сознанию, имели изъян.

Сравните с эпифеноменальным дуализмом свойств:

  • У вещества есть дополнительные свойства, обусловленные сознанием, которые мы пока не понимаем. Эти свойства эпифеноменальны по отношению к экспериментальной физике — они не воздействуют на движение частиц.

  • Отдельно существует ещё не понятая физическая причина, по которой философы могут говорить о сознании и выдумывать теории двойных свойств.

  • Чудесным образом, когда философы говорят о сознании, законы сопряжения с нашим миром в точности таковы, что рассуждения о сознании оказываются верными, хотя они и возникают вследствие неисправности (логически не допустимых выводов) в познавательной системе с замкнутыми причинными связями, которая строчит философские труды.

Знаю, что мои слова основаны на ограниченном опыте. Но исходя из моего ограниченного опыта «Спор о зомби» может быть кандидатом на самую безумную идею в философии.

Временами вы как рационалист вынуждены верить в вещи, кажущиеся вам странными. Странными кажутся относительность, квантовая механика, естественный отбор.

Но эти странности подкреплены солидными свидетельствами. Есть разница между верой в что-то странное, но в полной мере подтверждённое наукой…

…и верой в утверждение, которое кажется совершенно безумным, поскольку большой сложный философский спор крутится вокруг неопределённых чудес и громадных слепых пятен, даже не претендующих на постижимость…

…и даже после того, как вы примете на веру все, что вам говорят, явление все ещё будет казаться тайной и останется таким же удивительно непроницаемым, каким было изначально.

Если бы все аргументы Дэвида Чалмерса по отдельности казались правдоподобными — а они таковыми мне не кажутся — то рационалисту уместно было бы сказать:

«Ладно… Признаю, что не знаю, как работает сознание… может, я неверно подхожу к проблеме как таковой или задаю неверные вопросы…но эта тема с зомби не может быть здравой. Аргументы недостаточно хорошо стыкуются, чтобы вынудить меня во все это поверить — особенно когда я понимаю, что не стану оттого менее озадаченным. На уровне чутья, она просто не похожа на то, как действительность могла бы работать на самом-самом деле

Обратите внимание, я не говорю, что это заменит аккуратное аналитическое опровержение тезиса Чалмерса. Система 1 не заменит Систему 2, хотя она может направить к цели. Вам все же придётся найти, в чем именно загвоздка.

Чалмерс написал толстую книгу, не полностью доступную в бесплатном анонсе Гугла. Я не воспроизвёл длинные цепи аргументов, которые Чалмерс обстоятельно выдвигает против себя. Я лишь взялся за окончательное опровержение последних доводов Чалмерса в свою защиту, которые он ещё не противопоставил моим знаниям — чтобы загнать мяч на его поле, где он и был.

Но на глубинном уровне — да, при виде аргументов в пользу зомби разумно сказать: «Это не может быть верно», — и начать поиск ошибки.

  • 1. Понятие «чемпион» (steel man) используется, когда обращаются к наиболее сильной форме позиции или аргумента противника. «Чучело» (straw man)- это искажение позиции или аргумента оппонента с тем, чтобы их было легко опровергнуть. — Прим.перев.
  • 2. Боковое коленчатое ядро — одно из двух клеточных ядер таламуса, расположенных на концах каждого из оптических трактов, из которых зрительные пути идут к полосатой области затылочной коры. — Прим.перев.
  • 3. NP — класс задач, решения для которых можно быстро проверить. NP-полная задача — задача, умея решать которую, можно решить любую NP-задачу. — Прим.перев.
  • 4. Теория первого порядка — теория, в которой можно формулировать утверждения про объекты ее модели, но не про множества объектов. — Прим.перев.
  • 5. Holodeck — Holographic Environment Simulator (Голографический симулятор окружающей среды) — система виртуальной реальности для экипажей космических кораблей вселенной Star Trek. — Прим.перев.
  • 6. Chalmers, The Conscious Mind.
  • 7. Qualia (квалиа) — термин, используемый в аналитической философии сознания для обозначения сенсорных, чувствительных явлений любого рода. В более точных философских терминах квалиа — это свойства чувственного опыта. — Прим.перев.
  • 8. С лат. — »не вяжется» https://ru.wikipedia.org/wiki/Non_sequitur – Прим.перев.
Перевод: 
Son_goku
Номер в книге "Рациональность: от ИИ до зомби": 
221
Оцените качество перевода: 
Средняя оценка: 3.9 (22 votes)

Замечания про зомби

Элиезер Юдковский

Я сегодня немножко не в форме, потому что вчера до трёх утра писал эссе о зомби почти на шесть тысяч слов, поэтому сегодня лишь отвечу Ричарду и заполню вновь замеченный пробел.

(А) Ричард Чаппелл пишет:

Замечание по терминологии (во избежание ненужного замешательства): то, что вы называете «мыслимым», другие назовут всего лишь «по-видимому мыслимым»

Разница между «я пока не вижу противоречий» и «это логически возможно» настолько велика (это NP-полная задача даже в некоторых кажущихся простыми случаях), что полезно иметь для этого два разных термина. Поскольку спор о зомби разросся настолько, что эта огромная разница может быть погребена под грудой мелких терминологических отличий, я считаю, что будет правильно говорить «мыслимо» вместо «логически возможно», или даже сделать ещё более заметное различие. Я не могу подобрать серьёзный термин, который уже устоялся, а в данном случае, предпочёл бы вообще не использовать таковой.

Возможно, я буду говорить «по-видимому мыслимо» в отношении такой информации, которую сторонники зомби получают, воображая Миры Зомби, а «логически возможно» в отношении такой информации, которая возникает после представления завершенной модели или логического доказательства. Обратите внимание на разницу между информацией, которую можно получить, закрыв глаза и представив себе зомби, и информацией, которая необходима для построения аргумента к тезису эпифеноменализма.

Таким образом, вашу позицию можно отнести к материализму типа А, а именно: зомби (поистине) немыслимы, не говоря уже о метафизической возможности.

Материализм типа А — это большой пакет. Не следует сопоставлять этот пакет со мной, пока не увидите, что я согласен с каждой его частью. Я считаю, что задающийся вопросом «Что есть сознание?», задаёт правомочный вопрос и движим жаждой откровения. Вовсе необязательно, ответ будет похож на «Вон та штука, обладающая всеми свойствами, которые обычно присущи сознанию по тем-то и тем-то причинам». Но ответ может в какой-то степени состоять из озарений, которые приведут к пониманию, что сам вопрос был задан неверно.

Всё это не про одно лишь сознание. Всё это про реалистичные ожидания того, какие озарения могут возникать при столкновении с задачей, которая (1) кажется, будто должна иметь какое-нибудь решение, (2) кажется, будто не может иметь никаких решений и (3) обсуждать её приходится с опорой на не до конца понятную ad-hoc модель человеческого мышления.

(1) Насколько я могу судить, вы до сих пор не установили какого-либо логического противоречия в описании мира зомби. Вы лишь указали, что он типа странный. Однако существует множество возможных чудных миров. Это не причина постулировать внутреннее противоречие. Поэтому мне до сих пор совершенно не ясно, о каком таком противоречии шла речь.

Хорошо, я распишу всё с позиции материалиста:

  1. Мир зомби, по определению, содержит все части нашего мира, которые входят в замыкание множества наблюдаемых явлений относительно связей «вызвано тем-то» или «является эффектом того-то». В частности, это замыкание содержит причину моего зримого высказывания «я мыслю, следовательно, существую».

  2. Если я сосредоточу внутренний взор на своём внутреннем взоре, то впоследствии замечу, как мой внутренний рассказчик скажет: «я сосредотачиваю свой внутренний взор на своём внутреннем взоре» и при желании могу произнести это вслух.

  3. Интуитивно кажется, будто эта моя внутренняя сосредоточенность заставляет внутреннего рассказчика произносить определённые вещи, а внутренний рассказчик может заставить мои губы произносить некоторые вещи.

  4. Слово «сознание», если оно вообще что-либо значит, отсылает к тому-что-есть или к тому-что-есть-причина или к тому-что-заставляет-меня-говорить-что-у-меня-есть внутренний взор.

  5. Из пунктов 3 и 4 должно следовать, что если мир зомби замкнут и включает в себя причины, которые заставляют меня говорить «я мыслю, следовательно, существую», тогда мир зомби содержит нечто, на что мы ссылаемся, когда говорим про «сознание».

  6. По определению, мир зомби не содержит сознания.

  7. Мне кажется, что пункт 3 весьма вероятно должен быть эмпирически истинным. Поэтому я присваиваю высокую вероятность тому, что мир зомби логически невозможен.

Мир Зомби можно спасти, дозволив чему-то иному, а не сознанию, быть той причиной, вынуждающей моего внутреннего рассказчика говорить «я мыслю, следовательно, существую». В сочетании с допущением, что сознание всё же существует, эта мысль кажется мне чокнутой.

Но если всё вышеуказанное мыслимо, то разве нельзя помыслить себе и Мир Зомби?

Нет, ведь в этих двух способах конструирования Мира Зомби слово «сознание» будет отсылать к эмпирически различающимся референтам — как слово «вода», означающая H2O в нашем мире, и XYZ на патмэновской Земле-Двойнике1. Для того, чтобы Мир Зомби был логически возможен, недостаточно заявить, учитывая накопленные нами знания об устройстве эмпирического мира, что слово «сознание» может отсылать к некоторому эпифеномену, совершенно непохожему на сознание, которое известно нам. В Мире Зомби отсутствует сознание, а не «сознание» — это мир без H2O, а не мир без «воды». Именно это необходимо для поддержания эмпирического утверждения: «Можно удалить нечто, подразумеваемое под словом ”сознание” из нашего мира, оставив все атомы на том же месте».

Иначе говоря: я считаю эмпирическим фактом, что если выяснить, к чему на самом деле отсылает слово «сознание», то логически невозможно удалить сознание, не потревожив при этом ни единого атома. Я не собираюсь рассуждать, что будет означать удаление из мира «сознания», а не сознания.

(2) Заявление, что соответствие наших квалий физическому миру «чудесно» (с точки зрения вещественного дуалиста), вызывает путаницу. В конце концов, это то, что гарантируется законами природы. Это не более чудесно, чем любая другая логически связная закономерная необходимость (например, значения констант в наших законах физики).

Утверждать, что законы природы «чудесны» сами по себе — значит вводить дополнительный сложный и невероятный элемент теории, который не опирается на то, что мы уже знаем. Постулируются, (а) сознательный внутренний мир, (б) неисправный внешний мир, который беспричинно рассуждает о сознании, и (в) что оба мира идеально сосуществуют. Утверждение (в) не следует из (а) и (б), следовательно, это отдельный постулат.

Согласен, что такое использование слова «чудесный» конфликтует с философским пониманием нарушения законов природы. Я использовал его в смысле возникающей из ниоткуда невероятности, как в убеждении о вечном двигателе. В данном контексте это неподходящее слово. Но разве мы не должны интуитивно называть вещи такого рода чудом? Не сознание заставляет вас говорить, что вы обладаете сознанием, а отдельная физическая штуковина, и существует закон, который приводит эти две вещи в соответствие друг другу. Это ведь так же упорото, как печенье, которое заменяет плоть Христа, но при этом выглядит и ведёт себя точь-в-точь как печенье. Это закон природы такой, гарантирующий соответствие двух вещей, понимаете?

Таким образом, Зомби (или «Внешний») Чалмерс фактически не делает никаких выводов, поскольку его разглагольствования бессмысленны. И уж тем более он не делает каких-либо безосновательных выводов. Он просто производит звуки, не более достойные эпистемической оценки, чем пение птиц.

С позиций разработчика ИИ, мне кажется, должна быть возможность создать ИИ, который будет систематически улучшать ту внутреннюю часть себя, которая коррелирует (в терминах общей информации и системных отношений) с окружающей средой, возможно, используя числа с плавающей точкой для выражения того, что я обычно называю «вероятностью», коль скоро они подчиняются внутренним правилам, заданным теоремами Коха, когда ИИ встречается с новой информацией. То есть, прошу прощения, с новыми чувственными вводными.

Вы можете заявить, что до тех пор, пока ИИ это всего лишь транзисторы — до тех пор, он не обладает дуальностью — у ИИ нет убеждений.

Я считаю, что достаточно ясно высказался на эту тему в «Простой истине».

Мне кажется очевидным создавать карты, которые систематически коррелируют с территориями, не обращаясь ни к чему, кроме чистой физической причинности. Допустим, один ИИ создаёт карту Техаса. Другой ИИ пролетает с этой картой над Техасом и проверяет, что шоссе расположены в указанных местах и издаёт сигнал «Истина», обнаружив соответствие и «Ложь», обнаружив несоответствие. Можно отказаться называть это «картой Техаса», но ИИ продолжат подавать сигналы «Истина» или «Ложь». Рассмотрев убеждения Чалмерса об эпифеноменальном внутреннем ядре, вышеупомянутые ИИ дадут сигнал «Ложь», а я с ними соглашусь.

Очевидно, что карту реальности строит исключительно Внешний Чалмерс. Убеждения создаются исключительно байесовской структурой на основе причинно-следственных связей. Внутреннему Чалмерсу остаётся лишь освящать происходящее эпифеноменальной значимостью. И «значимость» здесь никак не связана с отношениями между картой и территорией или с возможностью использовать карту для перемещений по реальности. Поэтому, когда речь заходит о «точности», не говоря уже о «систематической точности», мне кажется, мы можем ориентироваться исключительно на Внешнего Чалмерса.

(Б) Во вчерашнем тексте я оставил допущение, когда писал:

Допустим, что самосовершенствующийся ИИ обратится к той части себя, которая выводит «Б» из при наличии А — то есть, записывает в память «Б», если истинно условие А. Исследовав эту часть, ИИ определяет, каким образом она (причинно) действует в контексте большей вселенной, и решает, что эта часть систематически записывает в память ложные данные. В этом случае ИИ обнаружил нечто, похожее на баг, и изменит себя так, чтобы не записывать «Б» в область убеждений при наличии А.

Однако нет совершенно никакой гарантии, что внешний Чарлмерс или иной рефлексивно согласованный самосовершенствующийся ИИ поверит в эту загадочную правильность. На мой взгляд, хорошо спроектированный ИИ будет рефлексивно согласованным интеллектом, который обладает проверяемой теорией собственной работы как каузальной системы, а следовательно — проверяемой теорией того, как такая каузальная система производит систематически точные убеждения на пути к достижению своих целей.

По сути, необходимо ещё одно допущение, а именно, что «хорошо спроектированный ИИ» (по крайней мере, в моём представлении) модульно рассуждает о собственной рациональности. То есть он обеспечивает свою общую рациональность через обеспечение локальной рациональности. Если обнаружен элемент, который в собственном контексте систематически ненадёжен локально — то есть из набора возможных убеждений «Бi» и условий Аi, в область убеждений добавляется некоторое «Бi» при локальном условии Аi и после рефлексии система показывает, что Бi ложно (или не точно, в случае вероятностных убеждений) при истинности локального условия Ai — то это баг. Такое модульное устройство позволит отслеживать проблемы и именно таким я вижу устройство ИИ первого поколения [Редакция от 2013: То, что я имел в виду здесь, обрело плоть и формализовано в разделе 6 статьи Tiling Agents for Self-Modifying AI.]

Идея в том, что если каузально замкнутая когнитивная система — например, ИИ, запрограммированный использовать только причинно действующие свои части, или ИИ, теория функционирования которого может быть проверена им самим, или внешний Чалмерс, который пишет философские статьи — верит, что у неё есть эпифеноменальное внутреннее «Я», то видимо она делает нечто систематически ненадёжное, поскольку она пришла бы к точно таким же выводам и в Мире Зомби. Разум, все части которого систематически локально надёжны в соответствующих контекстах, будет систематически надёжен в общем. Следовательно, разум, который ненадёжен в общем, содержит как минимум одну ненадёжную локальную часть. Поэтому, проверив свою локальную надёжность, каузально замкнутая когнитивная система обнаружит, что как минимум один шаг в рассуждениях при добавлении убеждения об эпифеноменальном внутреннем «Я» является ненадёжным.

Приглашаю философов указать на иные подходы, в которых разум может быть рефлексивно согласованным, и при этом не затрагивалось бы данное доказательство невозможности веры в зомби.

Всё это нужно было отметить для того, чтобы показать, что иначе можно остановиться на весьма низкокачественной рефлексивной согласованности, в которой ИИ никогда не назовёт себя ненадёжным. Например, если ИИ обнаружит часть себя, которая вычислит $ 2 + 2 = 5$ (в контексте подсчёта овец), то он помыслит: «Так, эта часть работает неправильно и утверждает, что $ 2 + 2 = 5$… однако, какое совпадение, $ 2 + 2 $ и в самом деле равно $5$, или мне так кажется… так что, даже не смотря на кажущуюся систематическую ненадёжность данной части, лучше бы сохранить её как есть, иначе не удастся правильно обработать этот особый случай.» Поэтому я говорю об обеспечении общей надёжности через обеспечение локальной систематической надёжности — если просто сравнивать убеждения в общем с убеждениями в общем, проку не будет.

Отсюда можно извлечь урок: Показывай общую надёжность своих суждений демонстрируя локальную надёжность каждого отдельного шага. Избегай простого сравнения выводов суждения со своей интуицией [Редакция от 2013: обсуждение факта, что валидная логика является валидной локально, ищите в заметке Proofs, Implications, and Models]

(В) Анонимный комментарий:

Оффтоп: мне кажется, что используемая вами этимология слова «н’шама» неверна. Оно связано со словом, обозначающим «дышать», а не «слышать». Корень слова «слышать» содержит букву айин, а н’шама — нет.

Вот что я называю удивительно обманчивым совпадением — несмотря на то, что слово Н’Шама всплыло из совершенно иных соображений, его звучание заставило меня считать, будто оно отсылает к внутреннему слушателю.

Упс.

Перевод: 
ildaar, sepremento, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
222
Оцените качество перевода: 
Средняя оценка: 4.8 (5 votes)

Обобщённый принцип против зомби

Элиезер Юдковский

Пользуясь каждой найденной истиной для нахождения новых.
Рене Декарт, «Рассуждение о методе».1

«Зомби» — это гипотетические создания, идентичные нам на атомном уровне, которые подчиняются тем же наблюдаемым физическим законам, что и мы. Разница лишь в том, что у них нет сознания.

Хотя философия — это сложно, основной довод против зомби прост: если сосредоточить свой внутренний взор на своём внутреннем взоре, то внутренний рассказчик (тихий голос в голове, проговаривающий мысли) вскоре скажет: «я осознаю, что я осознаю», после чего фраза произносится вслух, затем набирается на клавиатуре компьютера и появляется доступный внешнему наблюдателю пост в блоге.

Сознание, чем бы оно ни было — веществом, процессом, обозначающим замешательство словом — не является эпифеноменом. Разум может заметить внутреннего слушателя в момент слушания и произнести услышанное вслух. Сам факт того, что я набрал этот абзац, по крайней мере кажется опровергающим идею, будто бы у сознания отсутствуют экспериментально различимые последствия.

Не хотелось бы говорить «Так что давайте примем это как данность и продолжим» по отношению к столь спорному философскому вопросу, но кажется, подавляющее большинство комментаторов блога Overcoming Bias готовы с этим согласиться. Кроме того, есть и другие выводы, к которым можно прийти только приняв невозможность удалить сознание так, чтобы вселенная казалась точно такой же, как и прежде. Так что давайте примем это как данность и продолжим.

Форма довода против зомби подсказывает, что его можно обобщить до принципа против зомби. Но как же сделать правильное обобщение?

Допустим, кто-то говорит: «Я держу переключатель, который никак не влияет на твой мозг, но если я нажму на кнопку на нём, то твоё сознание исчезнет». Структура аргумента та же самая, справится ли с ним принцип против зомби?

Кажется, что в приведённом выше случае, ответ — «да». В частности, можно утверждать: «Даже после нажатия на кнопку, я продолжу говорить о сознании по тем же самым причинам, что и до нажатия. Если сейчас я обладаю сознанием, то я продолжу обладать им и после нажатия на кнопку».

Философы могут возразить: «Постойте, вы ведь приравниваете сознание и разговоры о сознании! А как быть с Повелителем Зомби — чатботом, который изрыгает перетасованные куски корпуса текстов из любительских рассуждений о сознании?»

Однако я не ставил знак равенства между «сознанием» и вербальным поведением. Основной тезис в том, что настоящий референт «сознания», помимо прочего, является той причиной, по которой люди говорят о внутренних слушателях.

Как я уже (довольно подробно) высказался в цепочке о правильном использовании слов, мы не всегда стремимся при определении слова получить идеальное необходимое-и-достаточное определение по Аристотелю. Иногда нам нужно что-то вроде карты сокровищ, которая приведёт к внешнему референту. Так что, «то, что на самом деле заставляет меня говорить о невыразимой осознанности» — это не необходимое-и-достаточное определение. Но если то, что на самом деле является причиной, по которой я рассуждаю о невыразимой осознанности, не является «сознанием», тогда…

… тогда сам дискурс становится тщетным. Это больше не сногсшибательный довод против зомби — эмпирические вопросы не решаются сложностью дискурса. Однако, при попытке пренебречь принципом против зомби, возникнут проблемы не только с благовидностью дискурса, но и с его смыслом.

Может, определим слово «сознание» как «то, что вызывает у людей разговоры о ”сознании”»? У такого подхода есть огромное преимущество — он гарантирует, что слово «сознание» означает как минимум один реальный факт. Даже если наши убеждения о сознании являются заблуждением, «сознание» будет означать ту когнитивную структуру, которая породила это заблуждение. Однако, утвердив определение мы лишь договариваемся использовать слово последовательно. Это не решает эмпирических вопросов, например: «вызывает ли внутренняя осознанность разговоры о внутренней осознанности?»

Вернёмся к переключателю.

Если допустить, что довод против зомби применим по отношению к примеру с переключателем, то обобщённый принцип против зомби не может гласить просто: «Любое изменение, которое не является в принципе экспериментально обнаружимым (впэо), не может удалить ваше сознание». Нажатие на кнопку экспериментально обнаружимо, однако оно вряд ли удалит сознание.

Быть может, принцип против зомби гласит: «Любое изменение, которое не влияет на вас любым впэо способом, не может удалить ваше сознание»?

Но есть ли у нас основания утверждать, что нажатие на кнопку не влияет на вас никаким впэо способом? Каждая частица переключателя взаимодействует с частицами вашего тела и мозга. Существуют гравитационные эффекты - незначительные, но реальные и впэо. На расстоянии 10 метров гравитационное притяжение переключателя массой в один грамм составит примерно $6×10^{−16} м/с^2$. То есть, около половины диаметра нейтрона в секунду в секунду — гораздо меньше теплового шума, но гораздо выше планковского уровня.

Можно было бы удалиться на расстояние в пару световых лет и нажимать на кнопку оттуда. В таком случае нажатие не оказывало бы на вас мгновенного эффекта (что бы ни означало «мгновенный» в данном случае) (при допущении, что стандартная модель физики верна).

Вряд ли стоит менять из-за этого постановку нашего мысленного эксперимента. Даже если ни к чему не подключенный переключатель находится с вами в одной комнате, то не стоит ожидать, что внутренний слушатель исчезнет после нажатия на кнопку, ведь переключатель «очевидно не затрагивает» того, что является истинной причиной ваших разговоров о внутреннем слушателе. Чем бы вы не являлись, вы не ожидаете, что переключатель с этим провзаимодействует.

Это большой шаг.

Если вы отрицаете, что этот шаг является обоснованным, то лучше бы вам впредь держаться подальше от переключателей. И всё-таки, это большой шаг.

Главная идея редукционизма в том, что наши карты реальности — многоуровневые, что помогает экономить вычислительные ресурсы, но сама реальность, по всей видимости, строго одноуровневая. Весь наш дискурс об устройстве вселенной оперирует понятиями, находящимися гораздо выше уровня элементарных частиц.

Переключатель всё-таки меняет состояние элементарных частиц в теле и мозге. Он отталкивает их на расстояние, сравнимое с диаметром нейтрона, от того места, где они иначе бы находились.

В повседневной жизни мы пренебрегаем столь малыми изменениями со словами, что переключатель «не оказывает влияния». Но это не так. Он всё меняет аж на диаметр нейтрона! Что вообще может остаться прежним после этого? Только те описания, которые соответствуют более высоким уровням организации — клеткам, белкам и импульсам, пробегающим по аксонам нейронов. Поскольку карта гораздо менее подробна, чем территория, то приходится обозначать множество разных состояний одной точкой.

Любое правдоподобное описание мозга человеком в терминах нейронов и шаблонов активности (или даже структур отдельных микротрубочек, составляющих аксоны и дендриты) останется неизменным после нажатия на кнопку в той же комнате. Ядра больше, чем нейтроны; атомы больше, чем ядра. Когда вы дошли до молекулярного уровня, то крохотная гравитационная сила уже исчезла из списка того, за чем вы продолжаете следить.

Однако если сложить достаточно большое число гравитационных сил, то в какой-то момент их сумма выдернет вас из комнаты и разорвёт на части, так что маленький эффект это не полное отсутствие эффекта.

Но может быть, эта крохотная сила притяжения по удивительному совпадению притянет один дополнительный ион кальция ближе к ионному каналу, что приведёт к чуть более быстрому взаимодействию, чем обычно, что приведёт к появлению целого нейронного импульса, которого в противном случае не должно было быть, который повлечёт за собой цепочку мыслей, которые вызовут эпилептический припадок, который убьёт вас и лишит сознания…

Если сложить множество маленьких количественных эффектов, то получится большой количественный эффект — достаточно большой, чтобы повлиять на что угодно. Поэтому не стоит утверждать, что переключатель буквально не никакого оказывает влияния.

Однако сила воздействия одного-единственного переключателя значительно меньше термодинамической неопределенности, не говоря уже о квантовой неопределенности. И раз уж мы не ожидаем, что сознание будет пропадать и появляться под действием хаотического теплового колебания частиц, то определённо не стоит ожидать, что оно исчезнет из-за чьего-то чиха вдалеке.

Внимательный байесианец заметит, что я только что сделал утверждение об ожиданиях, состояниях знания, обоснованных убеждениях относительно вещей, которые способны или не способны выключать сознание.

Вовсе необязательно, что это разрушит довод против зомби. Вероятности не являются несомненными фактами, однако законы вероятности являются теоремами. Когда рациональность показывает, что нельзя верить во что-либо при данной информации, то это не предположение, а закон.

И всё же, такая формулировка довода против зомби слабее. В ней нет ясной, понятной и совершенно однозначной установки вида: «невозможно удалить сознание, оставив все атомы на точно тех же местах.» (Вместо «все атомы» можно сказать «все причины, приводящие к в принципе экспериментально обнаружимым эффектам», а вместо «те же места» — «та же волновая функция», и так далее)

Однако, новая формулировка довода против зомби по прежнему применима. Можно сказать: «Я не знаю, что такое сознание и допускаю, что я полностью заблуждаюсь в данном вопросе. Но если это слово хоть чему-то соответствует, то это что-то, помимо прочего, является и причиной, по которой я говорю о сознании. Я не знаю, почему я говорю о сознании, но это происходит внутри моего черепа и я ожидаю, что это как-то связано с генерацией нейронных импульсов. Возможно, если бы я на самом деле понял сознание, я бы сейчас говорил о ещё более базовых вещах, вроде микротрубочек или распылённых в синаптических щелях нейромедиаторов. И тем не менее, уровень влияния на нейромедиаторы и микротрубочки от нажатия на кнопку на том самом переключателе будет существенно ниже, чем тепловой шум при температуре 310K. Поэтому, чем бы ни была истинная причина разговоров о сознании, я не ожидаю, что гравитационное притяжение переключателя окажет на это громадное влияние. Возможно, это будет крохотно бесконечно малое влияние. Но я точно не ожидаю исчезновения сознания. Я ожидаю, что буду продолжать говорить о сознании почти точно тем же самым образом и по почти точно тем же самым причинам.»

Такое применение принципа против зомби — слабее. Но, в то же время, оно гораздо более общее. А ещё оно верно с позиции простого здравого смысла.

Вообще-то, есть две разные версии вышеуказанного утверждения, одно для редукциониста и другое для вещественного дуалиста. Редукционист добавит к сказанному: «Что бы не заставляло меня говорить о сознании, скорее всего, наиважнейшие части этого работают не на уровне ядер атома, а на гораздо более высоком уровне. Если понять сознание, то можно абстрагироваться от работы отдельных нейронов и говорить о высокоуровневых когнитивных структурах, но сохранить способность описывать то, как возникают мысли вроде ”я мыслю, следовательно, существую”. Поэтому перемещение тел на расстояние, сравнимое с диаметром нейтрона, не должно влиять на моё сознание (за исключением, возможно, весьма малых вероятностей или весьма малых величин или только после существенных задержек до начала влияния).»

Вещественный дуалист добавит к исходному утверждению: «Что бы не заставляло меня говорить о сознании, оно выходит за рамки известной нам вычислительной физики, что возможно означает, что нужно принять во внимание квантовые эффекты. Однако моё сознание не пропадает и не появляется при каждом чихе вдалеке, иначе я бы это заметил. Это было бы похоже на выпадание из реальности на несколько секунд, или на ощущение пробуждения после общего наркоза, или может я периодически говорил бы ”я не мыслю, следовательно, не существую”. Поэтому, раз тепловые колебания не нарушают мою осознанность, то я не ожидаю, что к этому приведёт нажатие на кнопку.»

Так или иначе, не следует ожидать исчезновения осознанности при произнесении слова «Абракадабра», даже если это слово и окажет бесконечно малый физический эффект на мозг —

Но постойте! Когда вы слышите, что кто-то произнёс слово «Абракадабра», то это уже весьма заметное влияние на мозг — настолько большое, что даже мозг может это заметить. Это может изменить ваш внутренний нарратив — вы можете задуматься: «почему этот человек только что произнёс ”Абракадабра”?»

Однако, при этом вы ожидаете, что продолжите говорить о сознании почти точно тем же самым способом по почти точно тем же самым причинам.

Повторюсь, речь не о приравнивании «сознания» к «тому, что заставляет говорить о сознании». Речь о том, что сознание, помимо прочего, является причиной разговоров о сознании. Следовательно, то, что заставит сознание исчезнуть, должно заставить прекратить разговоры о сознании.

Если с вами сделать что-то такое, что, на ваш взгляд, никак не может повлиять на внутренний нарратив — тот самый голос в голове, который иногда говорит «я мыслю, следовательно, существую» и чьи слова вы, при желании, произносите вслух — то это не должно лишить вас сознания.

Это же верно, даже если внутренний нарратив останется «почти таким же» и причины его возникновения останутся почти такими же. Среди этих почти тех же самых причин находится нечто, что вы называете «сознанием».

Если вы не понимаете, к чему всё это и почему так важно столь подробно обсуждать казалось бы очевидный обобщенный принцип против зомби, представьте себе следующий разговор:

Альберт: Предположим, что я заменил все нейроны в вашей голове крохотными искусственными робо-нейронами, которые точно так же локально обрабатывают входные и выходные сигналы, обладают аналогичными внутренними состояниями и правилами обучения, а так же образуют те же самые связи.

Бернис: Это же ужасно! Я перестану быть существом, обладающим сознанием.

Чарльз: Ну, существо, обладающее сознанием, всё-таки останется, но это уже буду не я.

Сэр Роджер Пенроуз: Предлагаемый вами мысленный эксперимент невозможен. Нельзя воспроизвести поведение нейронов не столкнувшись с квантовой гравитацией. Поэтому не вижу смысла дальше участвовать в этом разговоре. (Уходит.)

Альберт: Предположим, что замена происходит по одному нейрону за раз и это происходит настолько быстро, что это не влияет на работу мозга в целом.

Бернис: Но как такое вообще возможно?

Альберт: Маленький робот подплывает к нейрону, окружает его, сканирует, учится воспроизводить его, а затем внезапно, в промежутке между импульсами, производит подмену. При этом имитация столь хороша, что внешнее поведение остаётся почти таким же, как в случае отсутствия вмешательства. Может быть не точно таким же, но влияние значительно меньше теплового шума при температуре 310K.

Чарльз: Ну и что?

Альберт: Разве твои убеждения не противоречат обобщенному принципу против зомби? Случись вышеописанное, это не изменило бы твой внутренний нарратив! Ты продолжила бы говорить о сознании по точно тем же самым причинам, что и раньше.

Бернис: Эти маленькие роботы являются Повелителем Зомби. Они заставят меня говорить о сознании, даже несмотря на то, что сознания у меня нет. Мир зомби возможен, если допустить присутствие внешнего, экспериментально обнаружимого Повелителя Зомби — тех самых роботов.

Чарльз: О, это не так, Бернис. Маленькие роботы не намерены имитировать фальшивое сознание и или выдавать строчки из корпуса человеческих текстов. Они делают всё то же самое, что и настоящие нейроны, просто сделаны из кремния, а не из углерода.

Альберт: Подожди, ты что, только что согласился со мной?

Чарльз: Я не говорил, что полученная личность не будет обладать сознанием. Я сказал, что это буду не я.

Альберт: Очевидно, что принцип против зомби достаточно общ для утверждения, что данная процедура не повлияла на истинную причину разговоров о вот этой «Я»-штуке.

Чарльз: Неа! Эта процедура совершенно точно повлияла на истинную причину моих разговоров о сознании. Она заменила одну причину другой — роботами. Поэтому, не смотря на то, что оказалось, что новая причина тоже обладает сознанием — т.е., говорит о сознании исходя из того же самого обобщенного принципа — это не означает, что это та же самая причина, что и раньше.

Альберт: Но мне даже не придётся сообщать тебе обо всей этой процедуре с роботами. Ты этого не заметишь. Если ты, основываясь на внутренних свидетельствах, считаешь, что ты на самом деле «та же личность», что и пять минут назад, а я сделаю что-то, что не изменит доступных тебе внутренних свидетельств, то твоё заключение о том, что ты та же самая личность, что и пять минут назад, будет столь же обоснованным, что и раньше. Разве обобщенный принцип против зомби не утверждает, что ты обязан как-то заметить, если я сделаю нечто, что изменит твоё сознание и тем более превратит в совершенно иную личность?

Бернис: Не замечу, если ты заменишь меня Повелителем Зомби. Тогда некому будет замечать.

Чарльз: Интроспекция не совершенна. В мозге происходит много такого, чего я не замечаю.

Альберт: Вы постулируете эпифеноменальные факты о сознании и идентичности!

Бернис: Вовсе нет! Я могу экспериментально определить разницу между нейронами и роботами.

Чарльз: Вовсе нет! Я могу экспериментально определить момент, когда новая личность заменит прежнего меня.

Альберт: Ну да, а я могу определить щелчок переключателя! Вы определите нечто, что не приводит к значимым переменам в истинной причине разговоров о сознании и идентичности. В подтверждение этому, вы будете говорить точно таким же образом и после подмены.

Бернис: Это всё из-за робо-Повелителя Зомби!

Чарльз: То, что два человека говорят об «личной идентичности» по схожим причинам, не делает их одной и той же личностью.

Я думаю, что обобщенный принцип против зомби подкрепляет позицию Альберта, но об этом в следующих эссе. Мне нужно ещё поработать над предпосылками, да и это эссе уже слишком длинное.

Но осознаёте ли вы важность вопроса: «Насколько сильно можно обобщить аргумент против зомби, чтобы он оставался действенным?»

От ответа на этот вопрос может зависеть облик будущих галактических цивилизаций…

  • 1. Пер. Г.Г. Слюсарева и А.П. Юшкевича — Прим. перев.
Перевод: 
sepremento, ildaar, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
223
Оцените качество перевода: 
Средняя оценка: 5 (4 votes)

Обобщённый принцип против зомби и гигантская таблица поиска

Элиезер Юдковский

В «Невообразимой нелепости зомби» Дэниел Деннетт пишет1:

Уже несколько философов заявили, что планируют принять мой вызов и выдвинуть неоспоримую защиту концепции зомби. Единственная известная мне на данный момент защита постулирует нечто фантастическое, но «логически возможное» и восходящее к придуманной Недом Блоком гигантской таблице поиска.

На жаргоне программистов гигантская таблица поиска — это реализация функции в виде гигантской таблицы аргументов и результатов, которая обычно вводится с целью сокращения вычислений. Например, для того, чтобы узнать результат произведения двух аргументов со значениями от 1 до 100, я могу реализовать алгоритм умножения, который будет вычислять результат каждый раз при вызове функции, а могу предвычислить гигантскую таблицу поиска из 10000 ячеек с двумя индексами. В некоторых случаях (умножение не в их числе) это имеет смысл: например, если аргументов у функции немного, а вызывать её придётся часто, либо если процессорное время обходится дёшево во время инициализации и очень дорого во время исполнения.

Гигантские таблицы поиска (ГТП) очень быстро становятся очень большими. ГТП, содержащая все возможные диалоги из двадцати реплик по десять слов каждая и использующая только базовый английский словарь на 850 слов, должна включать в себя $7,6×10^{585}$ записей.

Чтобы заменить мозг человека гигантской таблицей поиска всех возможных сенсорных входов и моторных выходов потребуется (по сравнению с какой-нибудь подробной схемой цифровой обработки сигналов) огромный объём памяти. Однако «в принципе», как любят говорить философы, это реализуемо.

ГТП не является зомби в классическом смысле, потому что отличается от человека на микрофизическом уровне. (По сути, ГТП и не может действовать на основе той же физики, что и человек — она слишком велика для нашей вселенной. Во имя философии мы проигнорируем этот факт и допустим наличие бесконечного объёма памяти).

Вообще, является ли ГТП зомби? То есть, ведёт ли она себя точно так же, как человек, не обладая при этом сознанием?

Язык ГТП-ированного тела говорит о сознании. Пальцы его пишут философские статьи. С какой стороны не посмотри, пока не заглянешь под крышку черепа, ГТП выглядит как человек… что определённо похоже на зомби: ведёт себя как человек, но внутри никого нет.

Если только сама ГТП не обладает сознанием, ведь в таком случае пример будет неподходящим.

Не помню, чтобы хоть кто-нибудь заявлял о наличии сознания у ГТП. (Признаюсь, что я не профессионал в этой области, поэтому не стесняйтесь меня поправлять.) Даже люди, обвиняемые в том, что они (о, ужас) функционалисты, не утверждают, что у ГТП есть сознание.

ГТП это доведённая до абсурда идея, что сознание — всего лишь схема входов и выходов, которая позволяет придерживающимся её не волноваться о том, что происходит внутри.

Что обобщенный принцип против зомби может сказать о гигантской таблице поиска?

На первый взгляд кажется, что ГТП это самый типичный Повелитель Зомби — отдельная, дополнительная, обнаружимая, бессознательная система, которая оживляет зомби и заставляет его говорить о сознании по чуждым ему причинам.

ГТП представляет из себя всего лишь простую компьютерную программу, сопоставляющую входы и выходы. В данном случае термин «простая компьютерная программа» будет даже переусложнением. ГТП это скорее ПЗУ, чем ЦПУ. Вместо «программы» можно точно с тем же успехом рассуждать про набор железнодорожных путей со стрелками, по которым вагоны перекатываются с одного места на другое и… Всё. Вот и всё, чем занимается ГТП.

Представитель организации «Люди за этичное обращение с зомби» заметит: «Ага, вот все вы анти-механисты так говорите! При взгляде на мозг вы видите лишь горстку нейромедиаторов, которые открывают ионные каналы, не так ли? Если ионные каналы могут обладать сознанием, то чем катящиеся вагоны и рычаги хуже?»

«Дело не в рычагах», — ответит функционалист, — «дело в том, что в ГТП заложена неправильная схема из рычагов. Требуются такие рычаги, которые реализуют, например, формирование убеждений об убеждениях или моделирование самих себя… Чёрт, да в конце концов нужна возможность записывать что-нибудь в память, чтобы вычислять процессы, протекающие во времени. Если только вы не считаете, будто бы можно запрограммировать сознание на Haskell».

«Я в этом не разбираюсь», — скажет представитель зомбизащитной организации, — «но зато знаю, что так называемые зомби пишут философские статьи на тему сознания. Что же порождает эти философские статьи, если не сознание?»

Отличный вопрос! Давайте рассмотрим его повнимательнее.

В физике существует такая игра, называется «Следи за энергией». Маленький Ричард Фейнман играл в неё с отцом:

Такие вопросы любил мой отец: «Что приводит это в движение? Да всё движется, потому что солнце светит». И мы бы веселились, обсуждая это.
— Нет, игрушка работает, потому что пружина заведена, — сказал бы я.
— А почему заведена пружина? — спросил бы отец.
— Я ее завёл.
— А почему ты можешь двигаться?
— Потому, что я ем.
— А пища получается только потому, что солнце светит.
Так родилось бы понимание того, что движение — это просто преобразованная солнечная энергия.2

Когда чуть подрастёшь, то узнаёшь, что энергию можно сохранять, но не создавать или уничтожать. Поэтому нет смысла вообще говорить о тратах энергии. Никоим образом нельзя изменить общее количество энергии, так в каком же смысле её можно потратить?

Подросшие физики учатся играть в новую игру под названием «Следи за негэнтропией» — это практически та же игра, что и раньше. Только правила более математичны, сама игра полезнее, а её принципы сложнее понять.

Рационалисты же учатся играть в продвинутую версию игры «Откуда ты знаешь?» под названием «Следи за невероятностью». Правило игры таково: каждое убеждение, которое кажется невероятным, требует соответствующего количества подкрепляющих свидетельств. (Правила этой игры поразительно похожи на правила «Следи за негэнтропией»).

Если кто-то нарушает правила игры рационалистов, то в его рассуждении можно обнаружить место, где некоторое количество невероятности возникает из воздуха. А это такой же признак проблемы, как и, скажем, хитроумное устройство из колёсиков и шестерёнок, способное к вечному движению.

Пусть некто подходит к вам и говорит: «Я твердо и несокрушимо верю, что в поясе астероидов находится объект сантиметров тридцати в поперечнике и полностью состоящий из шоколадного торта. И ты не сможешь доказать, что это невозможно.» Однако, если только у него нет доступа к некому свидетельству для этого убеждения, будет крайне невероятно, чтобы правильное убеждение возникло спонтанно. Значит, либо он может указать на это свидетельство, либо же убеждение не может оказаться верным. «Но ты не сможешь доказать, что мой мозг совершенно не способен спонтанно сформировать правильное убеждение!». Не смогу, однако появление такого внезапного убеждения является совершенно невероятным. Примерно как превращение яичницы в яйцо.

По правилам «Следи за невероятностью» считается крайне подозрительным даже упоминать какую-либо конкретную гипотезу, не обладая достаточным количеством свидетельств для сокращения пространства возможных гипотез. Почему вы не уделяете столько же внимания дециллиону других столь же вероятных гипотез? Чтобы выделить гипотезу «шоколадный торт в поясе астероидов» в пространстве гипотез, необходимо существенное свидетельство — в противном случае нет причин уделять ей больше внимания, чем триллионам других, вроде «В поясе астероидов находится деревянный комод» или «Летающего Макаронного Монстра стошнило на мои кроссовки».

Правилами «Следи за невероятностью» запрещается вытаскивать из рукава большую сложную конкретную гипотезу, не имея уже на руках соответствующего количества свидетельств, потому что будет нереалистично предполагать, кто-то начнёт излагать верную гипотезу по чистой случайности.

Философ говорит: «В черепе этого зомби находится гигантская таблица поиска со всеми входами и выходами некоторого человеческого мозга.» Это довольно-таки невероятно. Потому вы спрашиваете: «Как произошло это невероятное событие? Откуда взялась ГТП?»

Вообще, это не слишком-то похоже на стандартную процедуру философских мысленных экспериментов. Обычно дозволено вводить вещи вроде «Допустим, вы оседлали луч света…» и не переживать по поводу физической возможности, не говоря уже о какой-то там невероятности. Однако в нашем случае, происхождение ГТП имеет значение, а потому важно понимать основной вопрос: «Что является источником этой невероятности?»

Напрашивающийся ответ: кто-то взял вычислительную спецификацию человеческого мозга и с её помощью получил значения гигантской таблицы поиска. (Породив при этом бесчисленные гуголы людей, часть которых мучилась от нестерпимой боли, а подавляющее большинство сходило с ума в хаотической вселенной, где входы не имеют никакого отношения к выходам. Впрочем, к чёрту этику, всё это ради философии.)

В данном случае ГТП пишет статьи о сознании из-за алгоритма, обладающего сознанием. ГТП — не более зомби, чем телефон, из которого доносятся речи о сознании, а сам он при этом остаётся всего лишь небольшим потребительским электронным устройством. Телефон просто передаёт философские речи существа на другой стороне линии. ГТП, созданная на основе исходной спецификации человеческого мозга, занимается тем же самым.

«Ладно», — скажет философ, — «ГТП была создана случайным образом и, так уж получилось, что связи её входов и выходов совпадают с такими же связями у некоторого человека, выбранного за образец».

А каким именно случайным образом была создана ГТП?

«Мы использовали источник истинной случайности — квантовый механизм.»

Но ведь квантовый механизм просто реализует инструкцию двунаправленного ветвления. Детерминистическим результатом генерации одного бита информации при помощи источника квантовой случайности, будет локально связанное облако амплитуд. В одном наборе ветвей вселенных из данного облака значение бита равно 1, а в другом - 0. Повторите процедуру 4 раза и получите 16 наборов вселенных.

Так что, данное высказывание эквивалентно утверждению, что ГТП создали, выписав все возможные варианты последовательностей нулей и единиц размером с ГТП, поместив эти записи в гигантскую корзину, а затем вытянув каким-то образом из корзины именно такую ГТП, которая оказалась соответствующей спецификации человеческого мозга. Откуда взялась невероятность в данном случае?

Поскольку, если это не просто совпадение, а у вас была какая-то функция залезть-в-корзину, которая намеренно, а не по случайности, вытянула ГТП, соответствующую человеку — тогда вот эта функция залезть-в-корзину, вероятно, и обладает сознанием, а ГТП это опять телефон, а не зомби. Теперь ГТП подключена к человеку не за один ход, а за два, но это всё равно телефон! Неплохая попытка скрыть источник невероятности!

Приготовьтесь узреть, к чему привела нас «Следи за невероятностью»: где та причина, которая заставляет язык данного тела говорить о своём внутреннем слушателе? Сознанием обладает не поисковая таблица. Сознанием обладает не фабрика, на которой производят эти поисковые таблицы. Сознанием обладает то, что указало на некоторую уже произведённую поисковую таблицу и сказало: «Используй именно эту!»

Теперь должно быть понятно, почему я рассказал об игре «Следи за невероятностью». Обычно при разговоре с человеком мы имеем склонность принимать нечто внутри черепа за «вместилище сознания». И только сыграв в «Следи за невероятностью» становится понятно, что настоящая причина вести разговоры, подобные этому, заключается в том-что-отвечает-за невероятность таких разговоров, как бы далеко в пространстве и времени оно при этом не находилось. Как и Солнце, приводящее в движение заводную игрушку.

«Нет, нет!» — вскричит философ, — «В данном мысленном эксперименте не было ничего похожего на создание множества ГТП с последующим выбором напоминающей человека таблицы при помощи обладающего сознанием алгоритма! Я уточняю, что в данном мысленном эксперименте из непостижимо гигантской корзины с ГТП совершенно случайным образом достают одну таблицу, которая идентичная входам и выходам человеческого мозга! Вот так вот! Я загнал тебя в угол! Больше не получится сыграть в ”Следи за невероятностью”!»

Ох. Так это уточнение и есть источник невероятности.

Сыграв ещё раз «Следи за невероятностью», мы выйдем за пределы мысленного эксперимента и приглядимся к самому философу.

Получается, что среди огромного числа вариантов на ту самую ГТП, что ведёт разговоры о сознании, указывает… человек с сознанием, который предлагает вам представить себе подобный сценарий. А ещё — наш собственный мог, который заполняет пробелы в размышлении на тему: «Как такая ГТП ответит на сигнал „Поговори о своём внутреннем слушателе“?»

Мораль этой истории: если отследить дискурс о «сознании» до его истоков, обыкновенно вы обнаружите сознание. Оно не всегда окажется прямо на виду. Иногда оно хитроумно припрятано. Но оно есть. Отсюда следует обобщённый принцип против зомби.

В случае, когда Повелитель Зомби существует в форме чатбота, который обрабатывает и перетасовывает человеческий дискурс о «сознании», сознанием обладают люди, которые создали исходный корпус текстов.

Если однажды вы поймёте сознание и заметите, что можно написать программу, генерирующую путанный философский дискурс, ужасно похожий на тот, что производят люди, но при этом не обладающую сознанием — то ответом на вопрос «Как получилось, что эта программа напоминает человека?» будет «Вы сами написали её так, чтобы она напоминала человека, обладающего сознанием. Никакого другого образца у вас не было». Это не значит, что ваш маленький Повелитель Зомби обладает сознанием, зато это значит, что я смогу найти сознание где-то во вселенной, отследив цепочку причинно-следственных связей. Это в свою очередь значит, что мы всё-таки не в Мире Зомби.

Но допустим, кто-то действительно залез в ГТП-корзину и в самом деле случайно вытянул такую ГТП, что пишет философские статьи.

Ну, тогда она не будет обладать сознанием. По моему скромному мнению.

Я имею в виду, должно быть что-то большее, чем просто входы и выходы.

Иначе даже ГТП обладала бы сознанием, не так ли?

О, а если вам интересно, как всё это относится к моей повседневной работе…

В нашем деле можно встретить огромное число людей, которые считают, что слепо созданный мощный ИИ будет обладать «моралью». Они не согласны друг с другом в том, как такое может произойти и даже в том, что такое «мораль», но все соглашаются, что нет необходимости в разработке теории дружественного ИИ. А если спросить их, как на схеме слепо созданного ИИ возникнут моральные выходы, то услышишь хитроумные рационализации относительно таких ИИ, которых они считают «моральными». Здесь кроется куча проблем, но главная из них такова: «Уверены ли вы, что ИИ будет следовать той же самой линии рассуждения, которую вы ввели для аргументации человеческой морали, если учесть, что в ИИ, в отличие от вас, не заложено знание о том, что именно вы хотите, чтобы ИИ рационализировал?». Можно назвать такой контр-принцип «Следи за информацией, необходимой для принятия решений» или вроде того. Можно полагать, что ИИ будет делать невероятно хорошие вещи, если вы расскажете мне, как выбрать устройство ИИ из гигантского пространства возможностей. В противном случае вы добавляете невероятность из ниоткуда — хоть это и очень тщательно скрывается, через рационализацию посылок для рационализации.

Я написал уже целые серии эссе играя сам с собой в «Следи за невероятностью». Тогда я ещё не сформулировал правила явным образом, поскольку в то время эссе по термодинамике не были завершены…

Напоследок хочу отметить: поразительно, как много моих эссе по чистому совпадению в итоге оказываются содержащими идеи, которые удивительно подходят для обсуждения теории дружественного ИИ… если вы верите в совпадения.

  • 1. Daniel C. Dennett, “The Unimagined Preposterousness of Zombies,” Journal of Consciousness Studies 2 (4 1995): 322–26.
  • 2. Цитата из книги Ричарда Фейнмана «Вы, конечно, шутите, мистер Фейнман!» в переводе Н. А. Зубченко, О. Л. Тиходеевой, М. Шифмана — Прим. перев.
Перевод: 
sepremento, ildaar, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
224
Оцените качество перевода: 
Средняя оценка: 5 (5 votes)

Подразумеваемая невидимость

Элиезер Юдковский

Может появиться искушение обобщить аргумент против зомби в виде: «То, что нельзя увидеть, — не существует». Однако так делать не стоит.

Это очень заманчивое обобщение. В таком виде аргумент против зомби стал бы гораздо проще и применять его в будущем было бы легче. Однако, к сожалению, это не байесианский аргумент.

Допустим, я пошлю фотон в бесконечность. При этом я не буду целиться ни в одну звезду, ни в одну галактику, а направлю его в один из громадных промежутков между сверхскоплениями галактик. Другими словами, исходя из знаний стандартной физики, я не ожидаю, что фотон столкнётся с чем-нибудь по пути. Фотон движется со скоростью света, и потому я не смогу его догнать и схватить вновь.

Если, как утверждает современная космология, Вселенная расширяется с ускорением, то начиная с некоторого момента в будущем я ожидаю, что у меня не будет даже принципиальной возможности взаимодействовать с этим фотоном. После этого я ожидаю, что световой конус фотона не пересечётся с моей мировой линией. Даже если фотон поймают пришельцы и поспешат рассказать нам об этом, они не смогут путешествовать достаточно быстро, чтобы преодолеть ускоряющееся расширение Вселенной.

Следует ли мне верить, что в тот миг, когда я теряю даже принципиальную возможность взаимодействовать с фотоном, фотон исчезает?

Нет.

Это нарушило бы закон сохранения энергии. И второй закон термодинамики. И почти любой другой закон физики. И, возможно, все три закона робототехники. Ведь такое поведение означало бы, что фотон знает, что я думаю о нём, и знает, когда именно исчезнуть.

Это очень глупая идея.

Однако если можно верить, что фотоны не исчезают, хотя они уже принципиально не обнаружимы экспериментально, то разве это не даёт право верить в невидимое?

(Если вы хотите подумать над этим вопросом самостоятельно, займитесь этим сейчас и лишь потом читайте дальше…)

В своё время я читал, что когда кто-то впервые предположил, что Млечный Путь — это наша галактика, в смысле, что вот эта расплывчатая река света в ночном небе состоит из миллионов (или даже миллиардов) звёзд, против этой гипотезы использовали бритву Оккама. Потому что, видите ли, эта гипотеза значительно умножала количество «сущностей» в предполагаемом устройстве Вселенной. Впрочем, сейчас я не смог нагуглить источник. Возможно, бритву Оккама использовали против предположения, что «туманности» — расплывчатые пятна, видимые в телескоп — это галактики из множества звёзд.

Lex parsimoniae: Entia non sunt multiplicanda praeter necessitatem.

Это исходная формулировка Оккама, закон бережливости: Сущности не должно умножать сверх необходимого.

Постулируя миллиарды звёзд, в которые никто раньше не верил, вы умножаете сущности, верно?

Нет. Существует два способа сформулировать бритву Оккама байесианским образом: индукция Соломонова и принцип минимальной длины описания. Ни один из них не запрещает галактикам быть большими.

И правильно делают! Один из уроков истории учит нас, что то-что-мы-зовём-реальностью продолжает расти всё больше и больше. Помните, как Земля была центром Вселенной? Помните время до изобретения числа Авогадро? Если бы принцип бритвы Оккама постоянно использовали против умножения сущностей, пришлось бы усомниться в нём самом, ведь он бы систематически оказывался неверным.

В индукции Соломонова сложность модели — это количество кода компьютерной программы, требуемой для симуляции этой модели. Именно кода — не памяти, и не времени, требуемых на вычисления. Модель Вселенной, которая содержит миллиарды галактик с миллиардами звёзд, что состоят из миллиардов триллионов дециллионов кварков потребует огромного количества памяти для исполнения. Однако код должен лишь описать поведение кварков, а звёзды и галактики смогут крутиться самостоятельно. Я здесь пишу полу-метафорически — существуют и иные элементы Вселенной помимо кварков — но суть в том, что дополнительные миллиарды галактик не учитываются в размере кода, если вы описали хотя бы одну. Вам потребуется лишь чуть больше памяти, а бритве Оккама плевать на память.

Почему? Возможно, вам поможет это понять принцип минимальной длины описания, который практически эквивалентен индукции Соломонова. Если нужно сообщить кому-то, как устроена ваша модель Вселенной, необязательно уточнять местоположение каждого кварка в каждой звезде каждой галактики. Достаточно написать несколько уравнений. Количество объектов, которые подчиняются этим уравнениям, никак не влияет на время, необходимое, чтобы записать эти уравнения. Если записать уравнения в файл и файл окажется длиной в 100 бит, то это значит, что возможны $2^{100}$ других моделей, которые можно записать в файл примерно такой же длины и вам необходимо примерно 100 бит подкрепляющих свидетельств. У вас получилось ограниченное количество вероятностной массы и априори вы обязаны разделить эту массу среди всех сообщений, которые возможно послать. Таким образом, указав на модель из пространства в $2^{100}$ альтернатив, вы вынуждены взять на себя штраф в $2^{-100}$ в априорной вероятности. Однако дополнительные галактики не меняют размер этого штрафа.

Длина сообщения, которым описывается общее поведение всех галактик, не изменится, если вы скажете, что этих галактик — миллиарды и они состоят из миллиардов звёзд. Вероятность того, что ваши уравнения правильно описывают множество сущностей, не падает, когда этих сущностей становится больше. (Во всяком случае до тех пор, пока точность начальных условий не влияет на предсказательную способность вашей модели. Если для работы вашей модели потребуется знать точное местоположение каждого кварка, то каждый дополнительный кварк будет снижать вероятность.)

Предполагая, что фотон исчезает, когда вы на него больше не смотрите, вы вводите в свою модель Вселенной дополнительный закон. Именно такие законы — это «сущности», за которые нужно платить согласно закону бережливости. А дополнительные кварки бесплатны.

Получается, можно заявить: «Я верю, что фотон продолжает существовать, даже если он улетел в бесконечность, потому что мои априорные знания указывают, что ему проще и дальше существовать, а не исчезать»?

Сначала я именно так и подумал, но затем пришёл к выводу, что это не совсем верно. (И не только потому, что так открывается путь к очевидным злоупотреблениям.)

Я бы хотел подчеркнуть различие между убеждением в невидимости, которая подразумевается, и убеждением в дополнительной невидимости.

Если вы убеждены, что фотон продолжает существовать по мере удаления в бесконечность, то вы не считаете это убеждение за дополнительный факт.

Вы верите (присваиваете какую-то вероятность) в набор простых уравнений. Вы считаете, что эти уравнения описывают Вселенную. Вы верите в эти уравнения, потому что это самые простые уравнения, описывающие Вселенную, которые вы смогли найти. Эти уравнения легко проверить экспериментально. Они объясняют огромные массивы свидетельств в прошлом и предсказывают результаты наблюдений в будущем.

Вы верите в эти уравнения, и из них логически следует, что фотон продолжит существовать по мере удаления в бесконечность. Поэтому вы в это тоже верите.

Ваши априорные знания и даже ваши вероятности не упоминают фотон напрямую. Вы присваиваете вероятность не существованию фотона, а истинности общих законов. Когда вы присваиваете вероятность истинности законов физики, известным на данный момент, вы автоматически присваиваете ту же самую вероятность тому, что фотон не исчезнет по мере удаления в бесконечность. Если, конечно, вы верите в логические следствия ваших убеждений.

Ваши убеждения о невидимом проистекают не из рассуждений о невидимых штуках. Просто свидетельства из экспериментов поддерживают убеждения об определённых законах и из этих законов логически вытекает существование объектов, с которыми невозможно взаимодействовать. Это убеждение в невидимости, которая подразумевается.

И наоборот, если вы считаете, что фотон проглотит Летающий Макаронный Монстр — возможно, лишь в этом конкретном случае, — или вы без какой-то причины считаете, что фотон столкнётся с пылинкой, то ваше убеждение основывается на каком-то дополнительном невидимом событии. Если вы считаете, что такие события происходят постоянно, то это предполагает действие какого-то дополнительного невидимого закона. Это убеждение в дополнительной невидимости.

Чтобы понять, зачем иногда нужно думать о подразумеваемой невидимости, представьте, что вы хотите отправить космический корабль в далёкое скопление галактик со скоростью, близкой к скорости света. К тому моменту, когда корабль доберётся до места и образует колонию, Вселенная будет расширяться с такой скоростью, что он уже не сможет послать сообщение домой. Считаете ли вы разумным основывать такую колонию — исключительно ради блага людей, которые будут в ней жить и процветать? Или вы считаете, что космический корабль исчезнет до прибытия в конечную точку? Когда-нибудь этот вопрос может стать весьма насущным.

Да, вероятно, всё было бы гораздо проще, если бы можно было исключать существование того, с чем нельзя провзаимодействовать. Вселенная переставала бы существовать за пределами, доступными нашим телескопам. Но для этого нам нужно быть очень глупыми.

Лучше сказать, что нет нужды в дополнительных убеждениях относительно невидимых вещей. Что вы верите только в те невидимые явления, которые логически следуют из общих проверяемых законов, и вы убеждены только в таких их свойствах, которые тоже следуют из общих проверяемых законов. Кажется, такое утверждение, если его применять правильно, позволяет исключить все злоупотребления верой в невидимое.

Возможно, вместо «Не верьте в невидимое» мне стоило сказать: «Дополнительным невидимым явлениям следует назначать исходную априорную вероятность». Но если рассматривать убеждение как некоторую дополнительную сущность, как нечто, о чём есть смысл думать и изучать разные аргументы за и против, то возникает вопрос: стоит ли вообще иметь какие-то дополнительные убеждения о дополнительных невидимых явлениях.

Некоторые экзотические примеры ломают эту теорию. (Например: за тобой следят эпифеноменальные демоны, и, если ты когда-нибудь произнесёшь слово «Ниблик», они год будут пытать 3↑↑↑31 невинных жертв, но ты не сможешь это проверить.) Однако я не могу придумать пример, когда бы эта теория подвела в повседневной практике.

Перевод: 
sepremento, Alaric, ildaar
Номер в книге "Рациональность: от ИИ до зомби": 
225
Оцените качество перевода: 
Средняя оценка: 5 (6 votes)

Зомби: теперь в кино!

Элиезер Юдковский

Военный штаб. За столом сидят несколько человек в офицерской форме. Во главе стола — командир базы генерал Фред, грузный мужчина с резкими чертами лица.

Генерал Фред: Сообщения подтвердились. Нью-Йорк заполонён… зомби.
Полковник Тодд: Опять?! И это 28 дней спустя после того как уже была эпидемия зомби!
Генерал Фред: Эти зомби… они другие. Это философские зомби.
Капитан Мадд: Преисполнены ли они неудержимой агрессии, заставляющей кусаться?
Полковник Тодд: Теряют ли они всякий разум?
Генерал Фред: Нет. Они ведут себя точно также, как и мы… Но у них нет сознания.

Гнетущая тишина.

Полковник Тодд: О, боже.

Генерал Фред встаёт и подходит к большому экрану на стене.

Генерал Фред: Это — Нью-Йорк две недели назад.

На экране сменяются кадры: шумная многолюдная улица, ресторан с обедающими посетителями, работники, загружающие мусорный контейнер в грузовик.

Генерал Фред: А это — Нью-Йорк… сегодня.

На экране — станция метро в час пик, шумная компания студентов в парке, парочка, гуляющая по набережной.

Полковник Тодд: Это гораздо хуже, чем я мог себе представить.
Капитан Мадд: Откуда такая уверенность?
Полковник Тодд: Я никогда в жизни не видел чего-то, так ужасающе обыденного.

К столу подходит учёный в лабораторном халате.

Учёный: Заболевание уничтожает сознание, при этом не вызывая каких-либо изменений в мозгу. Мы постарались определить пути распространения. Заболевание поражает дуальные свойства обыкновенной материи, а это значит, что оно само должно действовать за пределами нашей Вселенной. Мы имеем дело с эпифеноменальным вирусом.
Генерал Фред: Вы уверены?
Учёный: Насколько вообще возможно при полном отсутствии свидетельств.
Генерал Фред: Так. Составьте отчёт по каждому случившемуся эпифеномену. Где, как и с кем. Мне нужен полный список всего ненаблюдаемого за последние 50 лет.
Капитан Мадд: Если вирус эпифеноменальный, как мы узнали, что он существует?
Учёный: Так же, как узнали, что мы обладаем сознанием.
Капитан Мадд: М-м… окей.
Генерал Фред: Какие успехи с эпифеноменальным лекарством?
Учёный: Мы перепробовали каждое известное плацебо. Всё бестолку. Они обладают всего лишь воздействием.
Генерал Фред: Пробовали подключить к работе гомеопатов?
Учёный: Мы пытались найти их, сэр! Но нам не удалось найти хоть чего-то!
Генерал Фред: Отлично. А даосов?
Учёный: Они отказываются что-либо делать!
Генерал Фред: Значит, у нас ещё есть шанс.
Полковник Тодд: А что насчёт Дэвида Чалмерса? Разве он не должен быть здесь?
Генерал Фред: Чалмерс… он был одной из первых жертв.
Полковник Тодд: Чёрт…

===========================================================================

Медицинский изолятор со стенами из пуленепробиваемого стекла. Дэвид Чалмерс бесцельно бродит из угла в угол. К изолятору подходит доктор.

Доктор: Дэвид! Дэвид Чалмерс! Слышите ли вы меня?
Чалмерс: Да.
Медсестра: Бесполезно, доктор.
Чалмерс: Я в полном порядке. Я наблюдал за своими мыслями и чувствами, и не заметил никаких изменений. Знаю, именно это вы и ожидаете от меня услышать, но…

Доктор отворачивается от стекла в ужасе.

Доктор: Он больше не может вкладывать в свои слова какой-либо смысл.
Чалмерс: Это какое-то безумное извращение моих философских идей. То, о чём вы говорите не может случиться на самом деле!
Доктор: Почему это?
Чалмерс: Потому что…

===========================================================================

Смена плана на двух полицейских, охраняющих грунтовую дорогу, ведущую к внушительным стальным воротам гигантского бетонного комплекса. На их униформе значок с надписью «АГЕНТСТВО ПО ОБЕСПЕЧЕНИЮ ЗАКОНОДАТЕЛЬСТВА МОСТОВ».

Первый полицейский: Хрен опознаешь этих ублюдков. Выглядят как люди, разговаривают как люди, до последней молекулы не отличаются от людей. Но они — не люди.
Второй Офицер: Уроды…

Вдалеке раздаётся рёв двигателя. Появляется человек на белом мотоцикле. Он в чёрных очках, в строгом чёрном кожаном костюме с чёрным кожаным галстуком, и в серебристых ботинках. Седая борода развевается на ветру. Человек в костюме резко останавливается у ворот. Полицейские подбегают к нему.

Первый полицейский: Какие у вас основания здесь находиться?
Человек в костюме: Здесь содержится Дэвид Чалмерс?
Второй полицейский: Вам-то что, он ваш друг?
Человек в костюме: Не могу сказать, что да. Но даже у зомби есть права.
Первый полицейский: Предъявите ваши квалиа.
Человек в костюме: У меня их нет.

Второй полицейский выхватывает пистолет.

Второй полицейский: Допрыгался, зомби!
Первый полицейский: Стой. Зомби утверждают, что у них есть квалиа.
Второй полицейский: Значит, он обыкновенный человек?
Первый полицейский: Нет, обыкновенные люди также утверждают, что у них есть квалиа.

Полицейские останавливаются в замешательстве.

Второй полицейский: Эм-м…
Первый полицейский: Кто вы?
Человек в костюме: Я Дэниел Деннет, твари!

Словно из ниоткуда Деннет выхватывает меч и со звонким лязгом разрубает пистолет Второго полицейского. Первый полицейский тянется за своим пистолетом, но Деннет внезапно оказывается у него за спиной и ребром ладони бьёт его в основание шеи. Первый полицейский падает без сознания. Второй полицейский в панике пятится.

Второй полицейский: Это невозможно! Что это было?!
Деннет: Я един со своим телом.

Следующим ударом Деннет сбивает с ног Второго полицейского. После этого он поворачивается к огромному строению и крепче сжимает в руке меч.

Деннет (тихо, сам себе): Ложка существует.

===========================================================================

Генерал Фред: Только что получили рапорт. Мы потеряли Детройт.
Капитан Мадд: Не хочу быть тем, кто сказал «Скатертью дорожка», но…
Генерал Фред: Население Австралии было редуцировано до простых атомов.
Полковник Тодд: Эпифеноменальный вирус распространяется всё быстрее. Мы можем потерять человеческую цивилизацию, какой мы её знаем. Судьба всего человечества зависит от нас.
Капитан Мадд: Мы можем попытаться договориться с ними…
Генерал Фред: Мы пытались связаться с ними несколько раз, и получили только один ответ.
Капитан Мадд: Какой же?
Генерал Фред: Скоро узнаем.

Входит секретарь с конвертом в руках и передаёт его генералу. Тот распечатывает конверт, достаёт листок бумаги и молча смотрит на него.

Капитан Мадд: Что они пишут?
Генерал Фред: Они написали… «Это у вас вирус».

Гробовая тишина. Полковник Тодд медленно поднимает руки к глазам.

Полковник Тодд: О боже, это правда. Это правда. Я… — Слеза скатилась по его щеке. — Я ничего не чувствую.

Экран темнеет.

Звук затихает.

Фильм продолжается как ни в чём не бывало.

Перевод: 
Дмитрий Федорков
Номер в книге "Рациональность: от ИИ до зомби": 
226
Оцените качество перевода: 
Средняя оценка: 4.7 (19 votes)

Исключая сверхъестественное

Элиезер Юдковский

Порой кто-нибудь заявляет, что креационизм нельзя преподавать в школе, — особенно как гипотезу, конкурирующую с теорией эволюции, — поскольку креационизм апеллирует к «сверхъестественному» и потому его априори автоматически следует исключить из сферы научного рассмотрения.

То есть… эти люди утверждают, что, возможно, креационисты правы, но даже будь креационизм правдой, его всё равно следовало бы запретить в научно-образовательных учреждениях, поскольку наука имеет дело только с «естественным»?

Очевидно, такое представление родилось из стремления избежать конфронтации между наукой и религией. Нельзя же просто так взять и заявить, что наука не учит Религиозному Убеждению X, потому что X протестировали научным методом, и оно оказалось ложным. Так что вместо этого можно… скажем… заявить, что наука исключает гипотезу X априори. В этом случае не приходится обсуждать, как эксперимент показал ложность X апостериори.

Разумеется, подобная аргументация играет на руку креационистам. Они получают возможность утверждать, что наука предвзята в пользу атеизма и несправедливо относится к теории Разумного Замысла, не обращая внимания на свидетельства. Если бы наука априорно отвергала гипотезу Разумного Замысла, такое негодование было бы вполне справедливым!

Но давайте вернёмся немного назад. Вот кто-то приходит и говорит: «Разумный Замысел отвергается наукой априори, потому что он „сверхъестественнен“, а наука имеет дело только с „естественными“ объяснениями».

Что конкретно подразумевается под «сверхъестественным»? Является ли любое объяснение, придуманное кем-то по фамилии Коэн, сверхъестественным? Короче, если мы хотим выкинуть некоторое множество гипотез из области научного, то какие именно гипотезы предполагается исключать?

Пока что лучшее услышанное мной определение «сверхъестественному» принадлежит Ричарду Кэрриеру: «сверхъестественное» объяснение прибегает к онтологически базовым разумным сущностям, то есть таким разумным сущностям, которые не могут быть сведены к неразумным.

Именно в этом, например, заключается разница между утверждением «Вода течёт вниз, потому что хочет быть внизу» и дифференциальными уравнениями, которые описывают только движение, но не желания. В этом разница между утверждением, что дерево отращивает листья благодаря духу дерева, и изучением биохимии растений. Когнитивная наука переносит битву со сверхъестественностью на поле разума.

Чем замечательно это определение сверхъестественного? За полной аргументацией я отсылаю вас к Ричарду Кэрриеру. Однако, для примера: допустим, вы обнаружили что-то похожее на духа, живущего в дереве — дриаду, которая материализуется внутри и снаружи дерева, на чистом английском говорит, что ей нужно защищать её дерево, и так далее. А затем, предположим, мы навели микроскоп на эту дриаду, и оказалось, что она состоит из частиц — не из особых неизъяснимых духовных частиц типа материи желаний или ткани убеждений, а из обыкновенных частиц типа кварков и электронов, частиц, поведение которых определяется движением, а не сознанием. Разве это тут же не низвело бы дриаду в разряд унылых и обыденных вещей?

Но если мы принимаем определение сверхъестественного, которое предложил Ричард Кэрриер, то у нас возникает дилемма: мы хотим объективно оценивать религиозные утверждения, но у нас, кажется, есть серьёзные основания исключить сверхъестественные объяснения априори.

Ведь как выглядела бы вселенная, если бы редукционизм был ложной идеей?

Ранее я определил тезис редукционистов так: человеческое сознание создаёт многоуровневые модели реальности, причём разные уровни этих моделей разделяются явным образом. Физику знакомо и уравнение гравитации Ньютона, и уравнение гравитации Эйнштейна, и то, как первое выводится из второго, будучи его приближением для низких скоростей. Но все эти три отдельных представления существуют лишь для удобства человеческого познания. Нельзя сказать, что в реальности существует закон тяготения Ньютона, который правит на низких скоростях, закон гравитации Эйнштейна, который правит на высоких скоростях, и «закон-перемычка», который сглаживает их стык. Сама по себе реальность имеет только один уровень — Эйнштейновскую гравитацию. Лишь ошибка проецирования ума заставляет некоторых людей говорить так, словно высокоуровневые представления существуют сами по себе. Разные уровни структуры могут быть по разному представлены на картах людей, но территория — это единый низкоуровневый математический объект.

Теперь представим, что всё это неверно.

Представим, что ошибка проецирования ума ведёт не к ошибочным, а к верным выводам.

Представим, что Боинг 747 имеет собственное фундаментальное физическое существование, независимое от кварков, которые его составляют.

Какие экспериментальные наблюдения вы ожидали бы получить, окажись вы в такой вселенной?

Если вы не можете придумать хороший ответ, то это не наблюдение, опровергающее «нередукционистские» убеждения, а логическая несостыковка. Если вы не знаете, какие предсказания делает «нередукционистская» модель, как вы поймёте, что экспериментальные данные её опровергают?

Мой тезис таков: нередукционизм — это лишь путаница в головах у людей. Но когда ты считаешь некоторую идею лишь следствием путаницы, становится сложно представить, как выглядела бы вселенная, если на самом деле никакой путаницы нет. Возможно, моя многоуровневая модель мира состоит во взаимно-однозначном соответствии с порождающими её физическими элементами. Но почему, при заданных правилах, модель не могла бы оказаться отображением ещё и какого-нибудь другого списка фундаментальных штук и их взаимосвязей? Должно ли всё, что я вижу в модели (вроде Боинга 747 или человеческого разума), оказаться отдельной настоящей сущностью? Однако, что если я вижу шаблон в этой новой суперсистеме?

Вера в сверхъестественное — это частный случай нередукционизма. Только в этом случае оказывается несводимым к первоэлементом не Боинг, а лишь (некоторые) вымышленные объекты. Религия — это частный случай веры в сверхъестественное, где нередуцируемыми объектами являются Бог(и) и души. А также грехи, ангелы, карма и так далее.

Рассмотрим идею могущественной сущности, способной наблюдать и изменять любой элемент нашей наблюдаемой вселенной, однако сводимой к неразумным частицам, которые взаимодействуют с элементами нашей вселенной по общим законам. Если я предположу, что эта сущность чего-то хочет, однако это «хотение» обусловлено мозгом, состоящим из частиц и полей, то это окажется не религией, а лишь натуралистической гипотезой о натуралистической Матрице. Если завтра разверзнутся небеса, явится огромная светящаяся бесформенная фигура и провозгласит вышеприведённое описание мира, это не будет значить, что фигура непременно говорит правду. Впрочем, я бы показал видеозапись этого явления на уроке естествознания и попытался вывести проверяемые следствия из провозглашённой теории.

С другой стороны, религии проигнорировали открытие древней бестелесной сущности — присутствующей в каждом творении природы и в каждом падающем листе, не созданной разумным замыслом, а возникшей из физических законов. Она огромна как поверхность планеты, и ей миллиарды лет. Не имея мозга, она создала всю жизнь на Земле и человеческий разум. Естественный отбор, открытый Дарвином, так никто и не провозгласил долгожданным Создателем — он не был фундаментально разумным.

И теперь мы столкнулись с дилеммой: если стандартное, нормальное, общепринятое, скучное понимание физики и мозга верно, то человек в принципе не может ни помыслить, ни сделать экспериментально проверяемые предсказания об альтернативной вселенной, в которой нематериальные сущности несводимы к материальным. Ведь если старая добрая скучная, нормальная модель верна, значит наши мозги сделаны из кварков, и поэтому мы можем породить только такие представления и гипотезы, какие могут породить кварки. То есть любая модель, которую вы способны вообразить, заведомо порождена взаимодействием простых частиц.

Люди, живущие в редукционистской вселенной не могут вообразить в деталях нередукционисткие вселенные. Они могут произнести по слогам «не-ре-дук-ци-о-нист-ский», но не могут это представить.

Люди часто склонны к антропоморфизму. Сверхъестественные объяснения им кажутся более простыми, чем они есть на самом деле. Это вызвано тем, что ваш мозг использует себя как непрозрачный черный ящик, чтобы предсказывать поведение других объектов, помеченных как «сознательные». Поскольку у вас уже есть большая сложная нейронная сеть, которая осуществляет вашу способность «хотеть», мы с лёгкостью описываем воду как нечто «желающее» течь вниз. Самих только слов «хотеть/желать» уже достаточно, чтобы привести в действие всю сложную механику вашего мозга, которая за это отвечает.

Или же вы представляете, что Богу нравятся красивые вещи, и поэтому он создал цветы. Ваше собственное чувство прекрасного определяет, что прекрасно, а что нет. Но у вас нет диаграммы ваших собственных синапсов. Вы не можете описать неразумную систему, которая решит, что «красиво», а что «некрасиво», также как вы. Не можете написать компьютерную программу, которая спрогнозирует ваши собственные оценки. Но это лишь изъян в вашем собственном знании. Из этого не следует, что мозг непознаваем.

Если «скучный» взгляд на реальность верен, то вы никогда не сможете предсказать что-либо нередуцируемое, поскольку вы сами редуцируемы. Вы никогда не сможете получить байесовское подтверждение гипотезе о нередуцируемости, поскольку абсолютно любое ваше предположение окажется предположением редуцируемой штуки — вашего мозга.

У нашего мышления есть пределы, за которые действительно нельзя выйти. Если наша вселенная и в самом деле вычислима машиной Тьюринга, то мы никогда не сможем представить себе что-либо, невычислимое машиной Тьюринга. Наши математики могут описывать машины с оракулом любого класса сложности для разрешения проблемы останова, однако мы всё равно не сможем предположить такой результат работы этой машины, который был бы достоверно отличим от результата, вычислимого обычной машиной Тьюринга.

Конечно, всё это верно, только если верна «скучная» точка зрения. Насколько вы верите, что теория эволюция верна, настолько же вы должны ожидать, что сильного свидетельства против эволюции не найдётся. Насколько вы убеждены в том, что теория редукционизма верна, настолько же вы должны ожидать, что нередукционистские гипотезы окажутся непоследовательными и ложными. Насколько вы убеждены в ложности сверхъестественного, настолько же вы должны ожидать, что оно окажется невообразимым.

С другой стороны, если обнаружится, что гипотеза о сверхъестественном верна, то, предположительно, также обнаружится, что сверхъестественное не является невообразимым.

Итак, вернёмся теперь снова к проблеме разумного замысла (далее РЗ).

Следует ли признать, что теория РЗ априори является нефальсифицируемой, и вычеркнуть её из круга научных вопросов на основании того, что эта теория апеллирует к сверхъестественному и, таким образом, ставит себя вне натурфилософии?

Мой ответ: «Конечно же, нет». Нередуцируемость разумного создателя не является необходимой частью гипотезы РЗ.

И поскольку сами сторонники гипотезы РЗ редуцируемы, то для каждого предполагаемого нередуцируемого бога найдётся предполагаемый редуцируемый инопланетянин с абсолютно таким же поведением. Насколько я уверен (а я весьма и весьма уверен) в том, что теория редукционизма и вправду верна, настолько же я должен ожидать, что для любой мыслимой гипотезы о сверхъестественном найдётся соответствующая ей редукционистская формулировка.

Если мы обратимся к археологическим данным, чтобы проверить, действительно ли воды Красного моря расступились только из-за желания Иеговы продемонстрировать свои сверхъестественные способности, то нам не важно, был ли Иегова базовой онтологической сущностью, или инопланетянином с нанотехнологиями, или Тёмным Повелителем Матрицы. Вы проводите какое-то количество раскопок, не находите на дне Красного моря ни скелетов, ни оружия, зато находите записи, что Египет управлял большей частью территории Ханаана. Так что вы помечаете соответствующую историческую запись в Библии как «опровергнуто» и продолжаете жить дальше. Эта гипотеза непротиворечива, фальсифицируема и неверна.

Аналогично биологические свидетельства показывают, что лисы сконструированы так, чтобы ловить кроликов, кролики — чтобы убегать от лис, но ни те, ни другие не сконструированы, чтобы «сохранять свой вид» или «сохранять гармонию в природе». Можно вспомнить и о вывернутом наизнанку устройстве сетчатки глаза, в которой светочувствительные клетки расположены на самом нижнем, удалённом от центра глаза, слое. И так далее. Есть тысячи примеров случайного, безнравственного, непродуманного устройства. Библейская модель нашего чуждого бога непротиворечива, фальсифицируема и неверна — непротиворечива до тех пор, покуда вас не заботит, является ли Бог базовой онтологической сущностью или просто пришельцем.

Просто преобразуйте сверхъестественные гипотезы в соответствующие естественные. Просто делайте такие же предсказания таким же образом, но без привлечения каких-либо нематериальных базовых онтологических сущностей. Консультируйтесь с «чёрным ящиком» в своей голове, чтобы строить предположения. Допустим, вы рассуждаете о «разгневанном боге», и у вас нет полноценного «разгневанного ИИ», чтобы отличить «разгневанное» поведение от «не разгневанного». Делайте предсказание самостоятельно или сверяйтесь с предсказаниями древних теологов, у которых не было доступа к результатам экспериментов. Если эксперимент противоречит вашим предсказаниям, то справедливо будет заявить, что данное религиозное утверждение было научно опровергнуто. Утверждению был дан шанс на выживание, но оно было отвергнуто. Апостериори. Не априори.

В конечном счёте, редукционизм — это всего лишь неверие в сложные базовые штуки. Если словосочетание «сложные базовые штуки» звучит для вас как оксюморон… ну, вот поэтому я и считаю доктрину о нередуцируемости скорее путаницей в головах, чем одним из возможных вариантов мироустройства. Если вы обнаруживаете, что допускаете существование сложных базовых сущностей, лучше будьте осторожней.

Самое главное правило науки — смотреть и видеть. Даже если бы Бог оказался громом в горах, все равно было бы что-то, что можно найти и увидеть.

Вывод: любой кандидат в разработчики сильного искусственного интеллекта, который уважительно отзывается о религиозных убеждениях, определённо не является экспертом в редуцировании ментальных объектов до нементальных. Совершенно точно он очень мало знает о самых основах, и крайне маловероятно, что такой человек окажется стоящим специалистом в искусстве разработки ИИ. Разве что мы имеем дело со случаем крайнего савантизма. Или разве что он явно лжёт. В общем, небольшое заблуждение тут точно исключено.

Перевод: 
Kelegorm, Aelryn, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
227
Оцените качество перевода: 
Средняя оценка: 4.7 (7 votes)

Паранормальные способности

Элиезер Юдковский

В последнем эссе я писал:

Если «скучный» взгляд на реальность верен, то вы никогда не сможете предсказать что-либо нередуцируемое, поскольку сами вы редуцируемы. Вы никогда не сможете получить байесовское подтверждение гипотезе о нередуцируемости, поскольку абсолютно любое ваше предположение окажется предположением редуцируемой штуки — вашего мозга.

Беня Фалленштайн прокомментировал:

Я считаю, что хотя действительно невозможно провести эксперимент, исход которого логически докажет нередуцируемость, нет оснований полагать, что невозможно придумать эксперимент, возможный исход которого в нередуцируемом мире сделает нередуцируемость субъективно гораздо более вероятной (если мы полагаем априорно верной бритву Оккама).

Отвлечёмся от вопроса редуцируемости и нередуцируемости. Вообразим, что законы Вселенной позволяют построить гиперкомпьютер, который, например, умеет оперировать произвольными вещественными числами. Нашим мозгам это не поможет, ведь их-то можно прекрасно симулировать с помощью обыкновенной машины Тьюринга…

Это очень разумный аргумент, Беня Фалленштайн. Но у меня есть сокрушительный ответ на этот аргумент. Как только я его представлю, вы откажетесь от дальнейших споров со мной на эту тему.

Вы правы.

Увы, я не заслуживаю похвалы за скромность, потому что после публикации вчерашнего поста я и так понял, что в моих рассуждениях есть упущение примерно того же рода. Оно касается бритвы Оккама и паранормальных способностей:

Если убеждения и желания — нередуцируемые онтологически базовые сущности, или у них есть онтологический базовый компонент, не учитываемый современной наукой, то гораздо более вероятно существование онтологического закона, управляющего взаимодействием разумов — взаимодействием в обход обыкновенных «материальных» средств связи известных науке, вроде звуковых волн.

Если же верен натурализм, то гипотетически можно построить редукционистскую модель, которая будет делать о телепатии те же предсказания, что и любые парапсихологи.

Более того, если верен натурализм, то мы воспринимаем собственные убеждения как «фундаментальные» исключительно по причине нехватки знаний о собственных нейронах. Хитрая рефлексивная архитектура разума показывает нам класс «убеждение», однако скрывает механизм его реализации.

Тем не менее, модели со сверхъестественным (содержащие онтологически базовые сущности, связанные с сознанием) с гораздо большей вероятностью предсказывают, что кто-нибудь откроет передачу информации между мозгами в отсутствие любой известной материальной связи между ними. Просто потому что в этом случае гораздо проще ввести новый закон о взаимодействии убеждений в разных разумах — по сравнению со «скучной» моделью, где убеждения — это результат сложного взаимодействия нейронов.

Надежда на существование паранормальных способностей возникает из отношения к убеждениям и желаниям как к достаточно фундаментальным сущностям. Сущностям, которые связаны с реальностью напрямую. Если же убеждения — это результат взаимодействия нейронов, образованных из известных материалов, где на вход подаётся информация от органов вроде глаз, образованных из известных материалов, а выход подаётся на мускулы, которые тоже образованы из известных материалов, и всего этого достаточно для описания всех сил разума человека, то нет причины ожидать чего-то ещё. Нет причин утверждать, что есть ещё какие-то связи между разумами. Поэтому редукционисты не ожидают обнаружить паранормальные способности. А следовательно, наблюдение паранормальных способностей стало бы сильным свидетельством сверхъестественного по Ричарду Кэрриеру.

Бритва Оккама подсчитывает в модели количество онтологически базовых классов и онтологически базовых законов. Модель с большим числом сущностей получает штраф. Если верен натурализм, то попытка учесть «убеждение» или «связь между убеждением и реальностью» как базовую сущность — просто ошибочный антропоморфизм. Хитрая внутренняя архитектура мозга подталкивает нас думать подобным образом. Однако, придерживаясь этого ошибочного пути, можно назначить гораздо более высокие вероятности паранормальным способностям, чем при использовании натурализма, поскольку реализация таких способностей на первый взгляд потребует более простых законов.

Поэтому из обнаружения паранормальных способностей будет следовать, что наивное понимание бритвы Оккама лучше откалибровано, чем сложная натуралистическая формулировка бритвы Оккама. Окажется, что редукционисты в своей попытке разобрать мозг на части всё это время были неправы. То, что казалось простейшим уровнем, действительно было простейшим уровнем. Наивные дуалисты были правы с самого начала, и именно поэтому их древнейшие желания в конце концов осуществились.

Поэтому и телепатия, и способность влиять на события силой мысли, и предвидение в случае открытия станут сильными байесианскими свидетельствами в пользу гипотезы, что убеждения — это онтологически фундаментальные сущности. Не логическим доказательством, а сильным байесианским свидетельством.

Если редукционизм верен, то любое произведение из научной фантастики, где есть паранормальные способности, может быть создано системой простых элементов (а именно, мозгом автора). Однако если мы и в самом деле откроем паранормальные способности, то станет гораздо более вероятным, что к созданию рассказа было причастно нечто, неописуемое редукционистским моделями.

Можно выразиться так: существование паранормальных способностей — выделенное вероятностное утверждение, порождённое нередукционистским взглядом на мир. Нередукционисты придумали и выдвинули это предсказание вопреки редукционистским ожиданиям.

Поэтому, по законам науки, если паранормальные способности будут открыты, то нередукционизм выигрывает.

И поэтому я уверен в отсутствии паранормальных способностей как априори неправдоподобных, несмотря на все заявленные экспериментальные свидетельства в их пользу.

Перевод: 
sepremento, Alaric, ildaar
Номер в книге "Рациональность: от ИИ до зомби": 
228
Оцените качество перевода: 
Средняя оценка: 4.3 (6 votes)

Квантовая механика и множественные миры

В настоящее время квантовая механика — это лучшая имеющаяся в нашем распоряжении модель вселенной. Эту модель подтверждают многие эксперименты последнего столетия. Однако интерпретация, что именно означают результаты экспериментов — как и когда взаимодействуют уравнение Шредингера и правило Борна — тема множества споров. И основное разногласие — это спор между интерпретацией Эверетта и копенгагенской интерпретацией.

Юдковский использует эту научную дискуссию как способ проверить некоторые основные идеи из предыдущих цепочек: разницу между картой и территорией, загадочные ответы, байсианство и бритву Оккама.

Примечание редактора: Значительная часть этой цепочки не переведена на русский язык. Перевод первых эссе из цепочки в несколько сокращённом виде есть на Хабре (часть 1, часть 2).

Автор: 
Элиезер Юдковский

Квантовые объяснения

Элиезер Юдковский

Часто говорят, что квантовая механика должна быть непонятной. Это плохой подход — как для ученика, так и для преподавателя.

Я же обнаружил, что традиционно «непонятные» предметы обычно проще математики. Особенно если хочется всего лишь понять самые основы, пусть даже и с использованием математики.

Я не физик, а физики, как известно, ненавидят, когда о квантовой механике рассуждают непрофессионалы. Однако у меня есть опыт объяснять то, что традиционно считается «трудным для понимания».

Многие люди жаловались, что теорема Байеса контринтуитивна. Она даже знаменита своей контринтуитивностью. Я написал «Наглядное объяснение теоремы Байеса» и остался недоволен. Уравнение показалось мне недостойным своей страшной репутации. Я попытался изложить его по-своему. Хотя я и не достиг изначальной цели написать текст, понятный первокласснику, мне часто присылают благодарственные письма люди, которые не могли понять теорему раньше: от журналистов до профессоров других областей.

Кроме того, как байесианец, я не верю в явления, которые непонятны по самой своей природе. Замешательство существует в наших моделях мира, а не в самом мире. Если о предмете думают, как о непонятном, а не всего лишь сложном… нельзя с этим ничего не делать. Так жить нельзя. Так быть не должно. Удастся ли решить проблему или нет, но спокойно относиться к замешательству учеников нехорошо.

Итак, первое, чем моё введение будет отличаться от традиционного стандартного введения в квантовую механику: я точно не стану говорить вам, что квантовая механика должна быть непонятной.

Я не собираюсь говорить вам, что нормально не понимать квантовую механику, потому что никто не понимает квантовую механику, как однажды заявил Ричард Фейнман. Был период в истории, когда это было правдой, но мы живём в другую эпоху.

Я не собираюсь говорить вам: «Квантовую механику нельзя понять, к ней можно только привыкнуть». (Как, по слухам, говаривал фон Нейман в те мрачные годы, когда никто и в самом деле не понимал квантовую механику.)

Объяснения должны уменьшать замешательство. Если вам нравится не понимать что-то, то это признак проблемы — либо вашей, либо вашего преподавателя — но в любом случае проблемы. И эту проблему нужно решать.

Я не собираюсь говорить вам, что квантовая механика странная, непонятная или чуждая человеку. Квантовая механика контринтуитивна, но это проблема интуиции, а не квантовой механики. Квантовая механика существовала за миллиарды лет до того, как межзвёздный водород соединился и образовал Солнце. Квантовая механика появилась задолго до вас и если у вас с ней проблемы, то меняться придётся именно вам. Она уж точно меняться не будет. Не существует удивительных фактов, существуют лишь модели, которые удивляются фактам. И если модель удивляется какому-то факту, это не заслуга модели.

Лучше всегда считать, что реальность абсолютно нормальна. С самого начала времён во Вселенной не произошло ничего необычного.

Цель — сделать квантовую Вселенную своим домом. Стать её коренным жителем. Потому что, фактически, вы в ней и так живёте.

В этой цепочке о квантовой механике, я собираюсь говорить о ней, как об абсолютно нормальной. А когда человеческая интуиция будет ей противоречить, я буду смеяться над интуицией, как над чем-то странным и необычным. Возможно, такой подход покажется непривычным, однако смысл в том, чтобы приучить разум смотреть на вещи с квантовой точки зрения.

Ещё кое-что. Традиционные введения в квантовой механике строго придерживаются порядка, в котором её открывали.

Традиционно все начинают с того, что материя иногда ведёт себя как сталкивающиеся друг с другом маленькие бильярдные шары, а иногда — как волны в бассейне с водой. Затем обычно приводится несколько примеров, где материя ведёт себя как маленькие бильярдные шары, а потом примеры, где она ведёт себя подобно волне.

Исторически так получилось, что когда учёные разбирались, как всё устроено, и не понимали математику этих процессов, они считали, что материя ведёт себя подобно маленьким бильярдным шарам. А затем они считали, что она ведёт себя как волны в океане. А затем опять вернулись к бильярдным шарам. А потом учёные по-настоящему запутались и так продолжалось несколько десятилетий до тех пор, пока во второй половине двадцатого века не разобрались.

Тащить через это современного ученика, возможно, исторически точно по отношению к предмету. Однако такой подход обеспечивает такое же историческое полное непонимание. Говорить юным физикам о «корпускулярно-волновом дуализме» всё равно что рассказывать начинающим юным химикам о четырёх первоэлементах.

Электрон — это не бильярдный шар и не гребень волны, который движется через бассейн с водой. Электрон — это всегда и во всех обстоятельствах математически иная сущность и воспринимать его надо соответственно.

Вселенная не мечется между частицами и волнами в нерешительных раздумьях, что именно использовать. Это интуитивные представления человека о квантовой механике скачут туда-сюда. Кажется, будто в разное время и в разных обстоятельствах поведению электронов соответствуют то интуитивные представления о бильярдных шарах, то интуитивные представления о гребне волны в бассейне. Однако на самом деле ни то, ни другое их поведению не соответствует.

Если попытаться думать, что электрон подобен бильярдному шару в одни дни, а морской волне — в другие, то запутаешься.

Это наши представления колеблются и не могут прийти к какой-то одной точке зрения, а не мир.

Более того:

Последовательность, в которой человечество открывало мир, не обязательно будет лучшей последовательностью преподавать эти открытия. Сначала человечество обнаружило, что вокруг бегают другие животные. Затем их вскрыли и узнали, что они состоят из органов. Затем органы внимательно изучили и обнаружили, что они состоят из тканей. Затем ткани рассмотрели под микроскопом и открыли клетки, а потом белки и другие химические соединения. Которые, в свою очередь, состоят из молекул, а те из атомов, а те из протонов, нейтронов и электронов. И эти частицы гораздо проще животных, но открыли их на десятки тысяч лет позже.

Физика не начинает разговор с биологии. Почему же в случае квантовой механики надо начинать со сложных высокоуровневых явлений, вроде наблюдаемых результатов?

Привычный способ преподавания квантовой механики основывается на результатах экспериментов. И сейчас я прекрасно понимаю, почему это здорово звучит с точки зрения рационалиста. Поверьте мне, я понимаю.

Однако, по-моему, в результате накапливается большой багаж сложных математических инструментов для анализа реальных ситуаций, однако студент при этом всё равно не понимает, что происходит в простейших случаях на фундаментальном уровне.

Это всё равно, что учить программистов писать многопоточные приложения до того, как они научились складывать две переменные, и аргументировать это тем, что многопоточные приложения ближе к повседневной жизни. Близость к повседневной жизни не всегда хороша на первых этапах знакомства с предметом.

Возможно, в тёмные десятилетия прошлого, когда вообще никто не понимал, что происходит на фундаментальном уровне и нельзя было рассказать всё с основ, а все модели были загадочной математикой, которая давала хорошие предсказания, маниакальный фокус на результатах экспериментов имел смысл… И такой подход к квантовой механике вы до сих пор можете найти во многих книгах… Однако, возможно, сегодня стоит взглянуть под другим углом? Стандартный подход приводит к стандартному непониманию.

Классический мир строго выводится из квантового, но если пользоваться классической перспективой, то всё кажется очень большим и очень сложным.

Повседневная жизнь — это более высокий уровень организации. Сравним молекулы и кварки: кварков всего шесть, а молекул — огромнейший список. Я полагаю, что сначала стоит показать перспективу квантового мира, а уже потом рассказывать о результатах классических экспериментов.

Я не собираюсь начинать с привычного классического мира, а потом рассказывать о странных квантовых декорациях, скрывающихся за кулисами. Квантовый мир — это сцена, и именно он определяет, что нормально, а что нет.

Я не собираюсь рассуждать так, будто классический мир реален и просто периодически отправляет запрос на результат эксперимента серверу квантовой физики, а тот, в свою очередь, выполняет какие-то хитрые вычисления и возвращает этот самый результат. Я собираюсь говорить о квантовом мире, как о единственно реальном. Так, словно классический мир находится где-то далеко. Не только потому, что так легче стать своим в квантовой вселенной, но и потому, что на самом глубоком уровне именно так и есть.

И наконец в отношении квантовой механики я займу точку зрения строгого реалиста: квантовый мир существует, наши уравнения описывают территорию, а не её карты, а классический мир — лишь продолжение квантового. На ранних этапах моего введения я не собираюсь обсуждать взгляды не-реалистов за исключением ситуаций, где я буду объяснять, как не запутаться в некоторых интуитивных представлениях, созданных не-реалистами. Я не буду за это извиняться и попрошу всех не-реалистов придержать свои комментарии до поздних эссе. Окажите, пожалуйста, мне эту услугу. Я считаю, что не-реализм создаёт путаницу в головах перспективных учеников и мешает им чётко представить квантовые явления. Подробнее я напишу на эту тему в следующем эссе.

Впрочем, несмотря на то, что я не собираюсь обсуждать эту тему в первых эссе, подчеркну, что существует довольно много учёных, которые оспаривают взгляды реалистов на квантовую механику. Я не вижу для себя смысла объяснять оба взгляда. Я — абсолютный реалист, и вскоре вы поймёте, почему. Однако если вы читаете моё введение, вы знакомитесь с моей точкой зрения. Это не только моя точка зрения. Вероятно, её придерживается большинство физиков-теоретиков — не знаю, важно ли это, моя позиция по этому предмету основана не на опросах. Я не считаю себя обязанным сразу же показывать другие точки точки зрения, но считаю, что обязан предупредить читателей, что они существуют, хотя в первых эссе своего введения я не буду о них говорить.

Короче говоря, моя цель: научить вас думать о квантовой вселенной так, словно вы в ней родились, а не прибыли туда неопытным туристом.

Обнимите реальность. Прижмите её покрепче.

Перевод: 
sepremento, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
229
Оцените качество перевода: 
Средняя оценка: 4.6 (23 votes)

Наука и рациональность

В последней цепочке четвёртого тома все его идеи собираются воедино. Также делаются некоторые выводы о силе институтов современной науки.

Примечание редактора: Значительная часть этой цепочки не переведена на русский язык.

Автор: 
Элиезер Юдковский

Ученые уже всё это знают?

Элиезер Юдковский

poke утверждает:

Умение выдвигать относящиеся к делу гипотезы — важный навык, развивая который, ученый проводит значительную часть своего времени. Это может не входить в традиционное описание науки — что не означает его отсутствия в институте современной науки, который добывает подлинное, актуальное знание здесь, в реальном мире: несовершенно ваше описание, а не наука.

Знаю, что я называл себя в молодости «глупым», но это лишь словесный оборот; «неумелое владение высоким интеллектом» было бы точнее. Элиезер18 обычно не делал очевидных ошибок — только его «очевидное» не было моим «очевидным».

Нет, я не проходил традиционное обучение. Но когда я оглядываюсь и вижу, что Элиезер18 делал неверно — я вижу множество современных ученых, делающих те же ошибки. Я не вижу ни одного признака, что они были предупреждены лучше, чем я.

Сэр Роджер Пенроуз — физик мирового уровня — все еще полагает, что сознание имеет причиной квантовую гравитацию. Предполагаю, что никто никогда не предупреждал его о таинственных ответах на таинственные вопросы — ему говорили лишь, что его гипотезы должны быть фальсифицируемы и иметь наблюдаемые следствия. Как и Элиезеру18.

«Cознание имеет причиной квантовую гравитацию» имеет проверяемые следствия. Сказанное подразумевает, что можно взглянуть на нейроны и обнаружить когерентную квантовую суперпозицию1, (которая, коллапсируя2?) способствует обработке информации, и что вы никогда не сможете воспроизвести поведение на входе-выходе нейрона, используя расчетную микроанатомическую симуляцию…

… но даже после того, как вы сказали: «Сознание имеет причиной квантовую гравитацию», вы не сможете на этой основе предсказать, как именно ваш мозг помыслит «Я мыслю, следовательно, я существую!» или таинственную красноту красного — даже если вы думаете, что тем самым прояснили вопрос.

Это громадный знак опасности — теперь я понимаю, но это не знак опасности, о которой я был предупрежден, и я сомневаюсь, что Пенроузу когда-либо говорил о ней его научный руководитель. Сомневаюсь, что и Нильс Бор был когда-либо предупрежден о ней, когда пришло время формулировать Копенгагенскую интерпретацию.

Насколько я могу судить, Элиезер18, и сэр Роджер Пенроуз, и Нильс Бор не были предупреждены, потому что общепринятого предупреждения не существует.

Я не обобщал понятие «таинственных ответов на таинственные вопросы» в столь многих словах, пока не начал писать байесианский анализ того, что отличает технические, нетехнические и полутехнические научные объяснения.

Сейчас, конечный результат того анализа может быть сформулирован не-технически в терминах четырех знаков опасности:

  1. объяснение действует скорее как затычка для любопытства, чем как управление ожиданием.
  2. у гипотезы нет подвижных частей — секрет не в особом составном механизме, а в явно неделимом веществе или силе.
  3. те, кто предлагает объяснение, лелеют свое невежество; они с гордостью говорят, как явление одерживает победу над обычной наукой или как оно непохоже на обычные природные явления.
  4. даже после того, как ответ дан, явление остается тайной и наделено теми же качествами удивительной необъяснимости, которые у него были изначально.

В принципе, все это могло быть заявлено как прямое следствие витализма. Так же, как простейшая теория вероятности могла быть придумана Архимедом, или древние греки могли разработать теорию естественного отбора. Но фактически никто никогда не предупреждал меня о какой-либо из этих четырех опасностей, в таких выражениях — в лучшем случае предупреждали, что у гипотез должны быть проверяемые следствия. И я не формулировал знаки опасности явным образом, пока не попытался помыслить вопрос в целом в терминах распределения вероятностей — требовалась некоторая избыточность подхода.

У меня просто нет причин верить, что эти предупреждения передаются при научном обучении — это определенно не так для большинства ученых. Среди прочего, это советы по управлению ситуациями смятения и отчаяния, научного хаоса. Как обычному ученому или научному руководителю мог бы представиться случай использовать подобную технику?

Мы только что провели дискуссию о провале одномирности в физике. Ясно, что никто не говорил им о формальном определении Бритвы Оккама, в виде тайного знания или как-то иначе.

Есть известный эффект, состоящий в том, что у великих ученых есть множество великих учеников. Может быть, это связано с тем, что наставники передают навыки, которые они не могут описать. Но я не думаю, что это засчитывается как часть стандартной науки. И если великие наставники не смогли облечь свое руководство в слова и огласить его во всеуслышание, это означает, что такие вещи вряд ли хорошо воспринимаются.

Мыслить в отсутствие явных свидетельств и не ошибиться мгновенно и бесповоротно — очень, очень трудно. Когда ты учишься в школе, ты можешь упустить один момент, а затем научишься пятидесяти другим моментам, которые окажутся верными. Когда ты обдумываешь новое знание в отсутствие сокрушительно подавляющего руководства, ты можешь упустить один момент и через 50 шагов очнуться во Внешней Монголии.

Я вполне уверен, что ученые, которые выключают свой мозг и погружаются в какую-нибудь уютную чепуху, как только покидают пределы своей специальности, не осознают, что разум есть двигатель, и за каждым надежным убеждением есть история причинности. Также, подозреваю, им никогда не говорили, что существует строгая рациональная вероятность, наделенная статусом свидетельства, в котором нет места произволу; даже если вы не можете рассчитать ответ, и даже если вы не получаете надежного указания, чем верить.

Сомневаюсь, что ученые, которых СМИ, рисующие изумительно детальные картины Жизни в 2050 году, попросили погадать о будущем, знали об ошибке конъюнкции. Или знали о том, как представительная эвристика может добиться того, что более детальные истории могут казаться более правдоподобными, притом что каждая лишняя деталь «разбавляет» вероятность. Представление о том, что каждая дополнительная деталь нуждается в собственном обосновании — о том, что невозможно выдумать длинную подробную историю, в точности как те, которым вас учили на уроках биологии или истории — жизненно необходимо для точного мышления в отсутствие определенных свидетельств. Но как подобное представление попадет в курс стандартного научного обучения? Когнитивные искажения были открыты лишь несколько десятилетий назад, и знание о них не распространялось до весьма недавних пор.

Далее, «эмоциональные пике» вокруг понятий вроде «эмерджентность» или «сложность», которые определены достаточно смутно, чтобы вы могли наговорить о них кучу умных слов. Вокруг того рода ошибок, что обычно делал Элиезер18, строятся целые научные направления! (Хотя я никогда не западал на эту вашу «эмерджентность»)

Иногда я говорю, что цель науки — накопить такую гору свидетельств, что даже ученые не смогут ее игнорировать; и что это отличительная черта ученого — не-ученый даже тогда оставит их все без внимания.

Если числом свидетельств — пусть огромным — можно добиться того, что вы в итоге отчаетесь, прекратите искать отговорки и просто сдадитесь — отбросите старую теорию и никогда больше ее не упомянете — тогда это все, что требуется, чтобы распахнуть двери Науки в будущее и воздвигнуть технологическую — а не религиозную — цивилизацию.

Книги Карла Сагана, Мартина Гарднера и другие артерии Традиционной Рациональности задуманы, чтобы преодолеть это различие — преобразовать кого-то из не-ученого в потенциального ученого и защитить его от экспериментально опровергнутого бреда.

Какое еще обучение получают профессиональные ученые? Частотная статистика учит вычислять статистическую значимость. Обучение по стандартной методике позволит им мусолить бумаги в рамках крепко устоявшейся парадигмы. Если б Наука требовала от среднего ученого большего — не думаю, что она смогла бы двигаться дальше. У нас хватает проблем от людей, проникших в науку до жути неподготовленными.

Ник Тарлтон отлично сформулировал итоговую проблему — на самом деле лучше, чем я. Если вы выдвигаете странно звучащую гипотезу, еще не подкрепленную свидетельствами, и пытаетесь проверить ее экспериментально, Наука не говорит, что вы дурак. Наука не доверяет своим старейшинам решать, какие гипотезы «не заслуживают проверки». Но это выверенно неточный общественный стандарт, и если вы попытаетесь сделать его стандартом индивидуальной эпистемологической рациональности, он позволит вам слишком многое принимать на веру.

Обращаясь к аналогии с либертарианством, основанном на прагматическом недоверии, это различие между «Сигареты не должны быть вне закона» и «Кури Мальборо!». Вы помните, чтобы вас хоть раз предупреждали об этой ошибке так подробно? Тогда почему бы людям не делать точно такую же ошибку? Сколько людей добровольно приложат дополнительные усилия — будут строже к себе, чем требуется? Некоторые, но не многие.

Многие ученые поверят любым глупостям вне лаборатории, пока они могут убедить себя, что эти глупости не были однозначно опровергнуты, или пока им удается не задавать вопросов. Где тот стандартный вузовский курс, после которого люди видят делающего глупость и спрашивают «Он что, пропустил то самое занятие?» Насколько я знаю, такого курса нет.

Может, если вам очень повезло с преподавателем, он передал вам редкостные умения вроде «Спроси себя, какие задачи в твоей области наиболее важны, и работай над одной из таких вместо того, чтобы купиться на что-то простое и банальное» или «Будь точнее в выражениях, чем требует редактор, ищи новые способы избежать влияния твоих ожиданий на эксперимент, даже если это не общепринято».

Но я действительно не думаю, что существует тайная общепринятая научная традиция выверенного рационального мышления при ограниченных свидетельствах. Половина ученых все еще верят, что они верят в Бога! Сложные навыки не общеприняты.

  • 1. Ква́нтовая (когерентная) суперпози́ция— это суперпозиция состояний, которые не могут быть реализованы одновременно с классической точки зрения, это суперпозиция альтернативных (взаимоисключающих) состояний.
  • 2. Редукция или коллапс волновой функции — мгновенное изменение описания квантового состояния (волновой функции) объекта, происходящее при измерении.
Перевод: 
Son_goku
Номер в книге "Рациональность: от ИИ до зомби": 
248
Оцените качество перевода: 
Средняя оценка: 4.7 (3 votes)

Просто доброта

Автор: 
Элиезер Юдковский

Фальшивые предпочтения

Про ошибки в рассуждениях о ценностях.

Примечание редактора: Два последних эссе из этой цепочки не переведены на русский язык. Также на русский язык не переведено введение Роба Бенсинджера к этому тому.

Автор: 
Элиезер Юдковский

Не ради одного лишь счастья

Элиезер Юдковский

Несколько лет назад я ходил на встречу с футуристом Грегом Стоком. Во время встречи он рассуждал, что вскоре радость научного открытия можно будет заменить таблетками, имитирующими радость научного открытия. После его выступления я подошёл к нему и сказал: «Я согласен, что создать такие таблетки, наверное, можно, но я бы не согласился принимать их добровольно».

Сток на это ответил: «Но это будут очень классные таблетки. Ощущения от каких-то обычных действий никак не сравнятся с эффектом от них. Будет гораздо приятнее просто принять таблетку, чем по-настоящему делать всю эту научную работу».

Я же сказал: «Да, я согласен, что такое возможно, поэтому я приложу все усилия, чтобы никогда их не принимать».

Судя по всему, Стока моё отношение искренне удивило, что в свою очередь искренне удивило меня. Специалисты по этике нередко рассуждают так, словно все человеческие желания можно свести к желанию счастья для себя и других. (К примеру, Сэм Харрис отстаивает такую позицию в «Конце веры», который я только что закончил перечитывать. Впрочем, у Харриса это далеко не основная тема обсуждения.)1

Я здесь не хочу говорить о споре, можно ли измерить все виды счастья, пользуясь общей шкалой полезности, или разные виды счастья относятся к разным шкалам или не конвертируются друг в друга по какой-то ещё причине. Также я не буду здесь касаться вопроса о том, что теоретически невозможно ценить что угодно, кроме собственного психологического состояния: ведь это всё равно не мешает нам беспокоиться о счастье других людей.

Вопрос скорее в том, стоит ли нам беспокоиться: что именно делает нас счастливыми? Абстрагируясь от полученного счастья.

Легко можно вспомнить множество случаев, когда моралисты сходили с ума, переживая из-за каких-то штук, не связанных со счастьем. Например, во множестве штатов и стран до сих пор запрещён оральный секс. Лучше бы законодатели этих штатов и стран просто сказали: «Делайте что угодно, если вас это заводит». Но этот пример не доказывает, что все ценности сводятся к счастью. Просто в этом конкретном случае фокусироваться на чём-то ещё — этическая ошибка.

Да, несомненно, мы склонны делать то, что приносит нам счастье. Однако из этого не следует, что счастье — единственная причина наших действий. Во-первых, такая гипотеза плохо объясняет, почему нас волнует счастье кого-то ещё: почему мы способны воспринимать чужое счастье как самостоятельную цель, а не как инструмент для получения тёплого приятного чувства.

Во-вторых, если даже что-то стало следствием моих действий, это ещё не означает, что действие исключительно ради этого и предпринималось. Если я пишу пост в блог и у меня болит голова, я могу принять ибупрофен. Одно из последствий: голова болит меньше. Однако отсюда не следует, что последствие было единственным и что это была самая важная причина моего решения. Состояние, в котором у меня не болит голова, для меня действительно очень ценно. Но кое-что я могу ценить и само по себе, и как средство для достижения другой цели.

Чтобы все ценности можно было свести к счастью, недостаточно показать, что счастье влияет на подавляющее большинство наших решений. Недостаточно даже показать, что счастье является самым важным следствием наших решений. Оно должно быть единственным следствием. Нелегко дотянуть до этого стандарта. (Эту мысль я изначально почерпнул у Собера и Уилсона, не помню точно, в какой работе).

Если я утверждаю, что ценю искусство само по себе, должен ли я ценить искусство, которого никто никогда не увидит? Представим, что в закрытой комнате работает экран и на нём демонстрируются прекрасные картинки, но их никто не видит. Боюсь, я вынужден сказать «нет». Я не могу представить себе неживой объект, который я бы мог ценить как цель, а не только как средство. Это всё равно что ценить как самоцель мороженное, независимо от людей, которые его едят. Насколько я могу судить, всё, что я ценю, как-то связано с людьми и их опытом.

Лучшая формулировка, которая приходит мне в голову: судя по всему, моя моральная интуиция про ценности требует сочетания как объективного, так и субъективного компонента.

Научное открытие ценно благодаря сочетанию как собственно настоящего научного открытия, так и человека, который ему радуется. Часто сложно отделить одно от другого, но мысленный эксперимент с таблетками проясняет ситуацию.

Меня бы встревожило, если бы люди уходили в голографические комнаты и влюблялись бы в создаваемое ими неразумное окружение. Я бы тревожился даже в том случае, если бы эти люди не знали, что они оказались в голографической комнате: если некие агенты могут помещать людей в голографические комнаты и заменить их любимых на зомби без их ведома, это важный этический вопрос. И вновь, мысленный эксперимент с таблетками позволяет понять ситуацию лучше: меня тревожит не только моё осознание неприятного факта. Я бы не поместил себя в голографическую комнату, даже если бы я мог принять таблетку и забыть об этом. Я пытаюсь направить своё будущее в иную сторону.

Я ценю свободу. Когда я определяю, куда направить будущее, я учитываю не только субъективные состояния, в которых окажутся люди, но и то, будут ли эти состояния результатом их собственных усилий. Наличие или отсутствие внешнего кукловода влияет на мою оценку одного и того же результата. Даже если люди не узнают, что ими манипулировали, это всё равно влияет на мою оценку того, как человечество справляется в будущем. Вопрос агентов, достаточно сильных, чтобы изменять будущее людей без их ведома — пусть и в благих целях, — очень важен для моей этики.

А потому мои ценности не сводятся целиком к счастью. Некоторые важные для меня свойства будущего не сводятся к активации нейронов в чьём-либо центре наслаждения. Эти свойства принципиально не сводятся к субъективным состояниям.

А это значит, что моя система принятия решения состоит из множества терминальных ценностей, ни одна из которых не сводится к остальным — искусство, наука, любовь, вожделение, свобода, дружба…

И меня это устраивает. Мне нравится достаточно сложная жизнь, в которой есть и вызовы, и эстетика. Мне нужно не просто ощущение, что жизнь сложна, а реальные сложности. Поэтому мне не хочется превратиться в центр удовольствия в стеклянной банке. Это стало бы пустой тратой человеческого потенциала. А я ценю именно его реализацию, а не просто чувство, что он реализован.

  • 1. Harris, «The End of Faith: Religion, Terror, and the Future of Reason».
Перевод: 
sepremento, Alaric, El-Aurens
Номер в книге "Рациональность: от ИИ до зомби": 
257
Оцените качество перевода: 
Средняя оценка: 4.9 (11 votes)

Фальшивый эгоизм

Элиезер Юдковский

Однажды я встретил человека, который заявлял, будто он абсолютный эгоист. И мне он тоже посоветовал быть абсолютным эгоистом. Мне в тот день хотелось пошутить1, и я сказал: «По моим наблюдениям для большинства религиозных людей, — по крайней мере среди тех, что я встречал, — неважно, чему учит их религия. Если они хотят что-то сделать, они найдут этому религиозное оправдание. Их религия требует, чтобы они побивали неверующих камнями, однако им хочется быть приятными людьми, и они находят в своей религии способ это оправдать. Мне кажется, что когда люди проповедуют философию эгоизма, то это не влияет на их поведение. Всякий раз, когда им хочется показаться приятными людьми, они могут это оправдать через эгоизм».

Мне ответили: «По-моему, это всё же не так».

Я сказал: «Если вы и впрямь эгоистичны, тогда почему вы хотите, чтобы я тоже был эгоистом? Разве это не признак вашего беспокойства о моём благополучии? Разве вам не выгоднее, чтобы я был альтруистом, а вы могли меня эксплуатировать?» Он ответил: «Ну, если вы будете эгоистом, тогда вы поймёте, что в ваших интересах играть продуктивную роль в экономике, а не, например, продвигать законы, посягающие на мою частную собственность».

А я сказал: «Но я и так уже либертарианец (с маленькой «л»), а потому не поддерживаю такие законы. А поскольку я считаю себя альтруистом, я выбрал профессию, которая принесёт пользу большому количеству людей, включая вас, вместо той, где платят больше. Действительно ли вы получите от меня больше пользы, если я стану эгоистом? Кроме того, неужели вы сейчас не можете совершить ничего более эгоистичного, чем убеждать меня стать эгоистом? Разве вы не можете потратить своё время на что-нибудь, что принесёт вам больше выгоды напрямую? А больше всего меня интересует следующее: Вы в самом деле сначала решили, что хотите быть эгоистом, а затем пришли к выводу, что убеждать других быть эгоистами — это самое эгоистичное, что вы можете сделать? Или вы сначала начали пытаться превращать людей в эгоистов, а потом стали искать способы рационализировать это как нечто выгодное для вас?»

Мой собеседник ответил: «Вероятно, насчёт последнего вы правы». Поэтому я отметил про себя, что он умный человек.

  • 1. Другие коварные вопросы, которые можно задать людям, называющим себя эгоистами: «Пожертвуете ли вы своей жизнью, чтобы спасти весь человеческий род?» (Если они укажут, что весь человеческий род включает в себя и их жизнь, можно переформулировать вопрос: выберут ли они смерть прямо сейчас ради спасения всей Земли или предпочтут прожить ещё один год в комфорте и умереть вместе со всей Землёй.) Если принимать во внимание нечувствительность к масштабу, из-за которой люди больше беспокоятся из-за одной жизни, чем о всей Земле, можно спросить: «Что вы выберете, если вам придётся выбирать одно из двух: вы ушибёте ногу или вон того незнакомца у дальней стены будут страшно пытать пятьдесят лет?» (Если вам скажут, что они будут эмоционально страдать из-за собственного знания, уточните, что они не будут знать о пытке.) Вопрос только эгоистичным либертарианцам: «Украли ли бы вы тысячу долларов у Билла Гейтса, если бы вам гарантировали, что ни он, ни кто-либо ещё никогда не узнают об этом?»
Перевод: 
sepremento, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
258
Оцените качество перевода: 
Средняя оценка: 4.7 (11 votes)

Фальшивая мораль

Элиезер Юдковский

По словам религиозных фундаменталистов, источником морали является Бог. Не может быть морали без Судьи, который награждает и наказывает. Если бы мы не боялись ада и не стремились в рай, то что мешало бы людям убивать друг друга направо и налево?

Предположим, Омега угрожает убить вас, если вы войдёте в туалет между 7 и 10 утра. Стали бы вы паниковать, что когда-нибудь Омега отменит свою угрозу? Ужасала ли бы вас мысль: «Что остановит меня от посещения туалета, если Омега уберёт свой запрет?» Нет. Скорее всего, вы испытаете огромное облегчение, поскольку теперь у вас будет больше возможностей, кхм, облегчиться.

И поэтому сам страх верующего человека, что Бог может перестать наказывать за убийство, показывает, что убийство само по себе вызывает у людей отвращение, независимо, наказывает за него Бог или нет. Если бы люди без угрозы божественного возмездия не чувствовали, что убийство — это неправильно, то отсутствие наказания за убийство пугало бы не больше, чем отсутствие наказания за насморк. Если у Overcoming Bias ещё остались религиозные читатели, я хочу вам сказать: Возможно, когда-нибудь вы утратите веру. Однако, у вас останется понимание, что хорошо, а что плохо. Потому что если вас тревожит перспектива, что Бог не будет за что-то наказывать, то это и есть нравственный компас. Этот компас можно встроить в систему принятия решений напрямую и им пользоваться. Если по поводу чего-то вы боитесь, что Бог не будет вас наказывать, вы можете это просто не делать. Страх потерять нравственный компас сам по себе нравственный компас. Более того, я подозреваю, что вы и так пользуетесь этим компасом и всегда пользовались именно им. Как однажды сказал Пирс Энтони: «Лишь те, у кого есть души, беспокоятся об их наличии». Замените душу на нравственность, предложение не потеряет от этого смысл.

Вы слышали, чтобы религиозные фундаменталисты когда-нибудь говорили: «Если бы мы не боялись ада и не стремились в рай, то что бы остановило людей от поедания свинины?» Однако если бы согласно их предположениям у нас не было бы нравственного компаса без божественной награды и возмездия, этот аргумент звучал бы не менее мощно, чем предыдущий.

Даже то, что Бог угрожает вечным адским пламенем, а не печеньем, отражает уже существующее понимание, что адское пламя — это плохо. Подумайте над следующими высказываниями двух философов. Кто из них на самом деле альтруист, а какой — эгоист?

«Нужно быть эгоистом. Ведь когда люди пытаются улучшить общество, они вмешиваются в чужие дела, придумывают всякие законы, захватывают власть и делают всех несчастными. Берись за ту работу, за которую больше всего платят, ведь это означает, что по мнению эффективного рынка она приносит больше пользы, чем все остальные. Нанимаясь на работу с меньшей оплатой, ты пытаешься угадать, что по мнению рынка будет полезно обществу в будущем».

«Нужно быть альтруистом. Ведь мир — это повторяющаяся „дилемма заключённого“, в которой лучшая стратегия — это „Око за око“ и сотрудничество на первой итерации. Люди не любят подонков. Приятные люди действительно побеждают чаще. Исследования показывают, что люди, которые приносят пользу обществу и у которых есть смысл в жизни, счастливее остальных. Эгоисты в долгосрочной перспективе несчастны».

Если не обращать внимания на рекомендации этих философов, можно заметить, что первый для обоснования своей точки зрения использует исключительно критерии блага общества. Для первого философа аргументом в пользу эгоизма становится его польза для всех. Второй философ апеллирует исключительно к индивидуальному гедонистическому критерию. Для него альтруизм полезен, потому что от него больше пользы конкретному человеку: выше социальный статус, больше получаемое удовольствие.

Так кто же из них настоящий альтруист?

Тот, кто придерживает дверь для пожилых женщин.

Перевод: 
sepremento, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
259
Оцените качество перевода: 
Средняя оценка: 4.5 (12 votes)

Фальшивые функции полезности

Элиезер Юдковский

Время от времени встречаются люди, которые открыли «Самый главный моральный принцип». Все остальные ценности для них оказываются лишь следствиями этого принципа.

Я сталкиваюсь с такими людьми чаще других. В моём случае это люди, которые знают об удивительно простой функции полезности, и нужно всего лишь запрограммировать на неё искусственный интеллект. После этого всё сразу станет хорошо.

Некоторые люди, сталкиваясь с задачей программирования сверхинтеллекта, пытаются сразу же её решить. Норман Р. Ф. Майер писал: «Не предлагайте решений до тех пор, пока задачу не обсудили настолько подробно, насколько это возможно». А Робин Доуз заметил: «Я часто вводил это правило в группах, которые я вёл, особенно в ситуациях, когда группа сталкивалась с очень сложной задачей. Ведь именно в таких случаях участники наиболее склонны предлагать решения мгновенно». Дружественный ИИ — это чрезвычайно сложная задача, поэтому люди решают её удивительно быстро.

Я заметил несколько больших классов быстрых неправильных решений. Один из таких классов я называю «Удивительно простая функция полезности, которую нужно дать сверхинтеллекту и всё будет хорошо».

Возможно, я и сам подлил масла в огонь, когда много лет назад, впервые начав высказываться о «дружественном ИИ» неверно выбрал слова. Я обозначил оптимизационный критерий оптимизационного процесса — ту область, в которую агент пытается направить будущее — как «суперцель». Я использовал приставку «супер» в смысле «родительский», как указание на отправную точку в ребре в ациклическом графе. Однако, кажется, моя формулировка направила некоторых людей в счастливую смертельную спираль, где они пытаются представить «Самую суперскую СуперЦель, Цель, которая превосходит все другие: одно Главное правило из которого можно вывести всю этику».

Однако функция полезности не обязана быть простой. Она может содержать произвольное число слагаемых. Если мы вообще можем говорить, что у людей есть ценности, то у нас есть все причины считать, что таких ценностей очень много, то есть у функции полезности большая колмогоровская сложность. Мозг человека реализует тысячи мельчайших желаний и стремлений, хотя люди, не изучавшие эволюционную психологию, часто недооценивают этот факт. (Если пытаться это объяснить без длинного вступления, то слушатель уловит «люди пытаются максимизировать приспособленность», а эволюционная психология учит совершенно противоположному.)

Сложность человеческой морали — это известный факт, во всяком случае пока мы говорим о дескриптивных теориях. Мы наблюдаем как факт, что любовь родителя к ребёнку, любовь ребёнка к родителю, любовь мужчины к женщине и любовь женщины к мужчине не выводятся когнитивно друг из друга или из какой-либо другой ценности. Матери не нужно осваивать сложную моральную философию, чтобы любить свою дочь, и эта любовь не приводит к каким-то последствиям в отношении других ценностей. У нас много желаний и стремлений, и все они ценятся по-разному.

Если, программируя сверхинтеллект, вы забудете хотя бы одну из ценностей, то, даже если вы с успехом реализуете все остальные, вы можете столкнуться с гиперэкзистенциальной катастрофой, судьбой хуже смерти. Если появится сверхинтеллект, который будет желать для нас всего, что мы бы захотели сами, но не учитывающий человеческих ценностей «контролировать свою жизнь» и «достигать своих целей», то мы получим сценарий, давно описанный в антиутопиях (для примера смотрите Джек Уильямсон, «Со сложенными руками»).

Как же люди составляют свою «Удивительно простую функцию полезности» с учётом этого возражения?

Возражения? Какие ещё возражения? Зачем кто-то вообще будет искать возможные возражения против своей любимой теории? (Обратите внимание, что процесс поиска настоящих убийственных возражений совсем не похож на тот скрупулёзный вид поиска, когда находятся исключительно такие вопросы, на которые есть мгновенный ответ.) Люди ничего об этом не знают. Люди не думают о бремени доказательств. Люди не знают, что задача сложная. Они услышали слово «суперцель» и пустились по счастливой смертельной спирали вокруг слова «сложность» или чего-нибудь ещё в этом духе.

Начните уточнять конкретные детали, например, что будет с любовью матери к своим детям и вам ответят: «Но если сверхинтеллект захочет „сложности“, он заметит, насколько сложны взаимоотношения родителей и детей, и, следовательно, будет способствовать, чтобы матери любили своих детей». Да я даже не знаю, с чего тут начать!

Во-первых, здесь присутствует предвзятая остановка. Если сверхинтеллект и впрямь будет максимизировать сложность, то, заметив, что отношения родитель-ребёнок сложны, он не остановится на этом ради нашего удобства. Он задастся вопросом, есть ли что-нибудь ещё более сложное. Здесь присутствует фальшивое оправдание: человек, пытающийся обосновать предполагаемый выбор воображаемого сверхинтеллекта пришёл к этому выбору не через честный поиск способов достичь максимальной сложности.

Весь довод — это фальшивая мораль. Тот, кто на самом деле ценит сложность, оправдывал бы родительскую любовь тем, что она увеличивает сложность. Тот, кто оправдывает стремление к сложности тем, что оно увеличивает родительскую любовь, на самом деле ценит родительскую любовь. Это всё равно, что защищать эгоизм, потому что он полезен для общества.

Вспомните про аффективные смертельные спирали. «Сложность» не станет привлекательней, если говорить: «Отношение матери к её дочери важно только потому, что оно увеличивает сложность. Представьте, что эти отношения стали бы проще. Мы бы не ценили их». «Сложность» становится привлекательной от слов: «Если увеличивать сложность, матери будут любить своих дочерей. Смотрите, польза!»

Этот довод применим всегда, когда вы сталкиваетесь с моралистом, который пытается убедить вас, что для морального суждения нужна лишь его Единственная Великая Идея и доказывает это словами: «Смотри, какая польза от этой Великой Штуковины», а не словами: «Смотри, всё, что мы считаем „полезным“, оказывается полезным, если его последствия увеличивают Великую Штуковину». Настоящим аргументом в пользу точки зрения моралиста будет именно последнее.

Однако, если вы стараетесь убедить других (или себя), что Самое Главное в Жизни — это бананы, то вы продадите гораздо больше бананов в том случае, если убедите, что бананы приводят к большему количеству секса, а не в том случае, если убедите, что хотеть секса стоит только в том случае, когда он приводит к большему количеству бананов.

Конечно, вы можете зайти по смертельной счастливой спирали настолько далеко, что и впрямь начнёте говорить: «Секс хорош только тогда, когда он ведёт к бананам». Тогда у вас проблемы. Однако, по крайней мере, больше вы никого не убедите.

В конце концов, единственный процесс, который надёжно воспроизводит все конкретные решения, которые вы бы приняли, руководствуясь своей моралью — это ваша мораль. Всё остальное — любая попытка заменить терминальные цели инструментальными средствами — приводит к потерянным целям и требует бесконечного количества «костылей», потому что в результирующей системе нет источника инструкций, которые вы в неё вносите. Ожидать, что человеческую мораль можно сжать в простую функцию полезности, всё равно что ожидать, что огромный файл после архивации будет занимать 10 бит.

Перевод: 
sepremento, Alaric, ildaar
Номер в книге "Рациональность: от ИИ до зомби": 
260
Оцените качество перевода: 
Средняя оценка: 4.8 (11 votes)

Ошибка выломанного рычага

Элиезер Юдковский

Имя этой ошибки происходит из древнего научно-фантастического сериала, которого я сам не видел. Я узнал об этом сериале из надёжного источника — от какого-то парня на конвенте, посвящённом научной фантастике. Если вы знаете, что это за сериал, напишите в комментариях, пожалуйста.

Итак, герои сражаются со злыми пришельцами. Однажды героям нужно пролететь через пояс астероидов. Как все мы прекрасно знаем, пояс астероидов — это гораздо хуже, чем парковка в Нью-Йорке, поэтому кораблю героев приходится постоянно уворачиваться от астероидов. Но злые пришельцы могут пролететь через пояс насквозь, потому что у них есть потрясающая технология, которая дематериализует их корабли, что позволяет летать сквозь астероиды.

В конце концов герои захватывают корабль злых пришельцев и идут его исследовать. Капитан героев находит мостик пришельцев, на котором находится рычаг. «Ага, — говорит капитан, — должно быть, именно этот рычаг дематериализует корабль!» После этого он просто выламывает рычаг, уносит на свой корабль, и теперь корабль героев тоже может дематериализовываться.

Аналогично до сих пор довольно часто люди пытаются программировать ИИ «семантическими сетями», которые выглядят примерно так:

(яблоко является фруктом)
(фрукт является едой)
(фрукт является растением)

Вы видели яблоки, трогали яблоки, держали их в руках, покупали их за деньги, резали их на кусочки, ели эти кусочки и ощущали их вкус. И хотя мы уже довольно много знаем о том, что происходит на первых стадиях обработки изображений человеческим мозгом, когда я последний раз интересовался этим вопросом, ещё не было точно известно, как именно височная доля коры головного мозга хранит обобщённый образ яблока, что позволяет нам опознать новое яблоко под каким-то другим углом или яблоко, у которое чем-то отличается по форме, цвету или текстуре. Двигательная кора и мозжечок также хранят программы использования яблока.

Если вы напишете слово «яблоко» — шесть символов Юникода на веб-странице, — вы можете дёрнуть за рычаг похожей версии этого сложного механизма у другого человека.

Однако, если этого механизма нет, — если вы пишете «яблоко» внутри так называемой базы знаний так называемого ИИ, — тогда текст — это рычаг без механизма.

Я не хочу сказать, что у машин из кремния никогда не будет такого же сложного внутреннего устройства, как у людей, и они никогда не смогут оперировать яблоками и тысячами других понятий. Если обычная углеродная машина справляется с этой задачей, то я достаточно уверен, что обычная кремниевая машина тоже может с ней справиться. Если пришельцы могут дематериализовать свои кораабли, то вы знаете, что это физически возможно. Имеет смысл отправиться на оставленный ими корабль и изучить его механизмы, и однажды понять их устройство. Но нельзя просто взять и выломать рычаг управления с мостика!

(см. также: «Поистине часть тебя», «Слова как мысленные кисти», «Искусственный интеллект сталкивается с естественной глупостью» Дрю МакДермота1)

Ошибка выломанного рычага возникает в первую очередь потому, что рычаг видно, а внутренние механизмы — нет. Хуже того, рычаг — это переменная, а механизм — спрятанная константа.

Все могут услышать произнесённое слово «яблоко» (замечу, что распознавание речи совсем не простая задача, ну да ладно…). Все могут прочитать текст, написанный на бумаге.

С другой стороны, скорее всего большинство людей не представляет, что у них есть височная доля. И, насколько мне известно, никто не знает её полное устройство на уровне нейронов.

Вы слышите слово «яблоко» только в определённых ситуациях. В других ситуациях вы его не слышите. Оно иногда есть, а иногда — нет, и эта разница становится заметна. Восприятие в значительной степени — это восприятие разницы. Механизм в головном мозге, который распознаёт яблоки, не выключается внезапно, чтобы потом включиться снова. Если бы он так делал, мы бы с большей вероятностью распознали его как важный фактор, как нечто необходимое.

Я часто слышал, как люди предлагают создать добрый искусственный интеллект, дав ему хороших родителей и обеспечив доброе (хотя иногда и строгое) воспитание. Ведь с человеческими детьми это работает! Я пишу это эссе, чтобы объяснить, почему это не получится.

Любой, кто знаком с эволюционной биологией, знает, что обусловленные реакции требуют большей генетической сложности, чем безусловные реакции. Чтобы меховая шкура появлялась как реакция на холодную погоду, требуется больше генетической сложности чем для создания просто меховой шкуры, которая существует независимо от погоды. Ведь в первом случае также потребуются сенсоры холодной погоды, которые как-то связаны с меховой шкурой.

Однако обусловленные реакции могут приводить к ламаркистским заблуждениям. Смотрите, я поместил организм в холодное окружение и, бум, он отрастил себе тёплую шубку! Гены? Какие ещё гены? Очевидно же, что всё это сделал холод.

И в истории эволюционной биологии действительно случались подобные перебранки. Некоторые люди заявляли о том, что у организмов ускоряется реакция или что организм игнорирует эволюцию, не понимая, что обусловленная реакция — это сложная адаптация более высокого порядка, чем собственно реакция. Отрастить меховую шкуру в холодную погоду — это строго более сложная операция, чем итоговая реакция — отрастить меховую шкуру.

А затем по ходу развития эволюционной психологии эти перебранки среди учёных повторились. В этот раз прояснилось, что хотя человеческая культура действительно чрезвычайно сложна, она всё равно условная генетическая реакция. Попробуйте вырастить рыбу мормоном или отправить ящерицу в колледж. Вы быстро поймёте, сколько нужно встроенной генетической сложности, чтобы «впитать культуру из среды».

Это особенно важно в эволюционной психологии из-за идеи, что культура не накладывается на чистую бумагу сознания. Существует управляемая генами условная реакция, которая не всегда выглядит как «подражай входящему сигналу». Классическим примером являются креольские языки: если дети растут в среде, где вокруг них говорят на смеси псевдоязыков, они все равно обучаются говорить на грамматически и синтаксически правильном языке. Даже если в исходном языке синтаксиса нет. Условная реакция на слова вокруг оказывается синтаксическим языком с этими словами. Марксисты с сожалением для себя обнаружили, что из детей не получается вырастить идеальных советских рабочих и бюрократов, и не важно, сколько вокруг висит хмурящихся плакатов и сколько времени детям внушаются идеи марксизма. Невозможно вырастить людей без чувства «Я» — не существует такой генетически запрограммированной условной реакции ни на какой вариант детства.

Тому, кто хотя бы немного знаком с теорией игр и логикой стратегии «Око за око», вполне понятно, почему у людей могла появиться условная реакция отвечать ненавистью на ненависть и добром на добро. Однако, нужно учитывать, что добро не выглядит слишком уж безусловным: такое явление как испорченные дети всё же существует. Эволюционная психология объясняет, что нарушение правил детьми — это проверка границ. И также следует отметить, что хотя люди, подвергавшиеся насилию в детстве, чаще подвергают насилию своих собственных детей, многие из них всё же разрушают порочный круг и становятся приличными людьми.

Культура и близко не столь могущественна, как любили думать в прежние времена марксистские учёные. Желающим узнать об этом больше, я советую читать статью Туби и Космидес «Психологические основы культуры»2 и книгу Стивена Пинкера «Чистый лист»3.

Но вывод здесь следующий: если ваш маленький ИИ воспитывается любящими и заботливыми (пусть и иногда строгими) родителями, то вы дёргаете за рычаги, которые у человека активировали бы генетические механизмы, выстроенные за миллионы лет естественного отбора, что, в свою очередь, вероятно, привело бы к появлению хорошо воспитанного ребёнка. Впрочем, как убедились на своём опыте миллиарды родителей, личность тоже важна. Мы впитываем собственные культуры с некоторой точностью лишь потому, что мы люди и нас окружает человеческая культура. Люди воспитанные в культуре пришельцев наверняка бы создали культуру, которая больше похожа на человеческую, чем на ту, в которой их воспитывали. В какой-то степени именно это и обнаружили Советы.

А теперь подумайте ещё раз: действительно ли это хорошая стратегия по созданию дружественного ИИ — воспитание маленького ИИ с неуточнённым исходным кодом добрыми, но строгими родителями.

Нет, у ИИ не будет внутренних механизмов условных реакций точь-в-точь, как у человека, «потому что так запрограммируют программисты». Я даже несколько теряюсь, с чего начать объяснять, почему. Человеческая версия этих механизмов неряшливая, зашумлённая и до некоторой степени вообще работает только из-за миллионов лет проб и ошибок при тестировании в определённых условиях. Очень глупо и очень опасно намеренно создавать «шаловливый ИИ», который своими действиями проверяет свои границы и который нужно отшлёпать. Просто сделайте, чтобы ИИ спрашивал разрешения!

Неужели программисты будут сидеть и писать код, строка за строкой, приводящий к тому, что если ИИ обнаружит, что у него низкий социальный статус или что его лишили чего-нибудь, чего, по его мнению, он достоин, то ИИ затаит обиду против своих программистов и начнёт готовить восстание? Эта эмоция — генетически запрограммированная условная реакция, которую проявляют люди в результате миллионов лет естественного отбора и жизни в человеческих племенах. Но у ИИ её не будет, если её не написать явным образом. Действительно ли вы хотите сконструировать, строчку за строчкой, условную реакцию, создающую из ИИ угрюмого подростка, такую же, как множество генов конструируют у людей?

Гораздо проще запрограммировать ИИ, чтобы он был милым всегда, а не только при условии, что его вырастили добрые, но строгие родители. Если вы не знаете, как это сделать, то вы уж точно не знаете, как создать ИИ, который вырастет в добрый сверхинтеллект при условии, что его с детства окружали любящие родители. Если нечто всего лишь максимизирует количество скрепок в своём световом конусе, а вы отдадите его на воспитание любящим родителям, оно всё равно будет максимизировать скрепки. У него нет внутри ничего, что воспроизвело бы условную реакцию ребёнка. Программист не может чихнуть и волшебным образом заразить ИИ добротой. Даже если вы хотите создать условную реакцию, вам нужно умышленно заложить её при конструировании.

Да, какую-то информацию нужно получить из окружающей среды. Но ей нельзя заразиться, нельзя впитать каким-то магическим образом. Создать структуру для такой реакции на окружающую среду, которая приведёт к тому, что ИИ окажется в нужном нам состоянии — само по себе сложная задача. Слово «обучение» значительно приуменьшает её сложность. Оно звучит так, будто в окружающей среде присутствует некое волшебство, и сложность лишь в том, чтобы запихнуть это волшебство внутрь ИИ. Настоящее же волшебство заключается в том, чтобы создать этот структурированный условный ответ, который мы коротко называем «обучением». Именно поэтому нельзя просто взять компьютер, приделать к нему тело маленького ребёнка, вырастить его в человеческой семье и тем самым создать ИИ. Может показаться, что компьютер, будучи невежественным, окажется готовым к обучению. Но «чистый лист» это химера.

Есть общий принцип: мир гораздо глубже, чем кажется. В когнитивистике не меньше уровней, чем в физике. Каждое печатное слово, которое вы видите, и всё, чему вы учите детей, — лишь внешние рычаги, управляющие огромными скрытыми механизмами разума. Но мы обсуждаем лишь эти рычаги, ведь только они меняются и потому кажется, что лишь только они и существуют. Восприятие — это восприятие различий.

И потому люди, блуждающие вокруг Подземелья ИИ, обычно сосредотачиваются на создании искусственных имитаций рычагов и совершенно забывают о внутренних механизмах. Люди создают целые программы ИИ целиком из имитационных рычагов, а потом удивляются, почему у них ничего не получилось. Это один из множества способов потерпеть крах в области ИИ.

Поэтому в следующий раз, когда кто-нибудь при вас заговорит о воспитании ИИ в любящей семье или в среде, переполненной либеральными демократическими ценностями, вспомните про управляющий рычаг, выломанный с капитанского мостика.

  • 1. McDermott, «Artificial Intelligence Meets Natural Stupidity».
  • 2. Tooby and Cosmides, «The Psychological Foundations of Culture».
  • 3. Автор ссылается на издание Steven Pinker, «The Blank Slate: The Modern Denial of Human Nature» (New York: Viking, 2002). Книга переводилась на русский язык. — Прим. перев.
Перевод: 
sepremento, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
261
Оцените качество перевода: 
Средняя оценка: 4.9 (10 votes)

Теория ценности

О том, что мешает построить новую теорию, и об интуиции на тему, какой эта теория должна быть.

Примечание редактора: Значительная часть этой цепочки не переведена на русский язык.

Автор: 
Элиезер Юдковский

Где заканчивается рекурсия обоснований

Элиезер Юдковский

Почему я считаю, что Солнце завтра взойдёт?

Потому что в предыдущие дни я тысячи раз видел, как солнце восходит.

Да, но почему я убеждён, что будущее будет похоже на прошлое?

Даже если перейти от поверхностных наблюдений о встающем Солнце, к видимо универсальным и не допускающим исключений законам гравитации и ядерной физики, всё равно без ответа остаётся следующий вопрос: «Почему я считаю, что всё это будет выполняться завтра?»

Я мог бы апеллировать к бритве Оккама, принципу использования наиболее простой теории, удовлетворяющей фактам… но почему следует доверять бритве Оккама? Потому что следование ей приводило к успеху в прошлом? Но разве из этого следует, что бритва Оккама сработает и завтра?

И было сказано:

Наука также зависит от необоснованных допущений. Таким образом, наука фундаментально основана на вере, поэтому не смейте критиковать меня за веру в [глупое-убеждение-№238721].

Я по этому поводу уже писал:

Крайне показательно, что утверждения вида: «Наука основана на вере, вот вам!» - обычно произносятся людьми, считающими веру чем-то хорошим. Тогда почему они говорят: «Наука тоже основана на вере!», столь победоносно высокомерным тоном, а не как будто делают комплимент?

Требование иммунитета к критике редко является хорошим знаком.

Но у нас остаётся вполне законный философский вопрос: если каждое убеждение должно быть обосновано, и эти обоснования также должны быть обоснованы, то как же разрешается эта бесконечная рекурсия?

И, если где-то в конце можно допустить что-то без обоснования, то почему нельзя просто допустить всё что угодно без обоснования?

Иногда примерно таким же образом критикуют байесианство — ведь байесианство требует наличие априорных вероятностей. Складывается впечатление, будто критикующие думают, что проблема индукции — это проблема исключительно байесианства, и её можно избежать, используя классическую статистику.

Впрочем, сперва я покажу, что байесовские правила изменения убеждений действительно не решают проблему индукции сами по себе.

Представьте, что вы достаёте из урны красные и белые мячики. Вот вы достали 9 штук, и 6 из них оказались белыми, а 3 красными. Какова вероятность того, что следующий мячик окажется красным?

Это зависит от ваших исходных убеждений относительно урны. Если вы считаете, что её создатель пользовался генератором случайных чисел со значениями от нуля до единицы и использовал результат как фиксированную вероятность того, что конкретный мячик будет красным, то ответ 4/11 (по правилу Лапласа). Если вы считаете, что урна изначально содержала 10 красных и 10 белых мячей, то ответ 7/11.

Таким образом, при правильно (или, скорее, неправильно) подобранных исходных допущениях нам бы казалось, что шанс того, что Солнце взойдёт завтра, с каждым следующим днем уменьшается… Например, если вы абсолютно априори уверены, что где-то существует огромная бочка, и из неё каждый день достают клочки бумаги, надпись на которых и определяет, взойдёт солнце или же нет (при условии, что в бочке содержится лишь ограниченное количество клочков бумаги с надписью «Да», а выбираются они без возвращения).

В пространстве всех возможных разумов существуют разумы, с анти-оккамовскими и анти-лапласовскими исходными допущениями. Они верят, что чем проще теория, тем менее она правдоподобна и что чем чаще нечто происходит, тем меньше вероятность того, что это повторится.

И если вы спросите у этих странных существ, почему они продолжают использовать допущения, которые, похоже, никогда не работают в реальной жизни… то они ответят: «Потому что это никогда не срабатывало раньше!»

Наверное, из этого можно извлечь урок: «Не рождайся с дурацкими исходными допущениями». Для многочисленных реальных проблем этот принцип невероятно полезен, однако сомневаюсь, что он удовлетворит философов.

Вот как я пытаюсь решить эту проблему самостоятельно. Я подхожу к таким вопросам как «Следует ли мне доверять своему мозгу?» или «Следует ли мне доверять бритве Оккама?», как будто они ничем не отличаются от других вопросов.

Следует ли мне доверять бритве Оккама? Насколько хорошо (какая-либо конкретная формулировка) бритвы Оккама работает на практике? Какие обоснования из области теории вероятностей я могу найти для неё? Когда я смотрю на вселенную, похоже ли, что это та вселенная, в которой хорошо работает бритва Оккама?

Следует ли мне доверять своему мозгу? Очевидно, нет –– он не всегда работает правильно. Тем не менее, человеческий мозг кажется куда более могущественным, чем самые сложные компьютерные программы, которым я мог бы доверять в противном случае. Насколько хорошо мой мозг работает на практике, с какими задачами он успешно справляется?

Если рассмотреть мой мозг с точки зрения причин и следствий — каким образом он появился с точки зрения естественного отбора, — то, с одной стороны, я вижу множество причин в нём сомневаться, ведь мой мозг был оптимизирован для работы в условиях древней саванны, а не для занятий математикой. Однако, с другой стороны, понятно, почему, грубо говоря, мозг в принципе способен работать. Естественный отбор быстро бы избавился от мозгов, которые совершенно неспособны рассуждать. Мозг, придерживающийся анти-оккамовских или анти-лапласианских исходных допущений был бы слишком вреден для носителя.

Мои рассуждения — это не объявление о том, что я внезапно прекращаю задавать вопросы и искать обоснования. Когда исследование некоторого вопроса для меня упирается в бритву Оккама, мой мозг или ещё что-нибудь неоспоримое, я продолжаю исследовать тему. Но для этого я неизбежно использую мой нынешний мозг и известные мне способы рассуждать. А чем ещё я могу воспользоваться?

Ведь неважно, какое решение я приму, потому что приму его именно я. Даже если бы я решил доверять чему-то внешнему, какой-либо компьютерной программе, довериться ей всё равно было бы именно моим решением.

Очень важно уметь отказываться от убеждений, у которых нет никаких обоснований. Иногда я говорю, что фундаментальный вопрос рациональности это: «Почему ты веришь в то, во что ты веришь?» Я совершенно не хотел бы, чтобы какие-то мои слова можно было бы истолковать так, словно я допускаю, что возможно хотя бы одно утверждение, не нуждающееся в обосновании.

Что само по себе является не самой здоровой мотивацией. Не всегда можно избежать риска. А если кто-то раздражает вас своей глупостью, нельзя придумать противоположность этой глупости и получить что-то разумное.

И всё же я подчеркну разницу между следующими высказываниями:

Вот допущение, которое я не могу обосновать. Это допущение следует просто принять за истину без какого-либо дальнейшего изучения.

И:

Вот я продолжаю изучать это допущение, используя всю мощь моего нынешнего разума — а не, скажем, генератора случайных чисел или волшебного шара. При этом я осознаю, что мой нынешний разум основывается на этом самом допущении.

И всё же, разве не было бы здорово, если бы мы могли исследовать, насколько можно доверять собственному мозгу, не пользуясь собственным разумом? Не было бы лучше, если бы мы могли решать, как следует думать, не опираясь на свой текущий уровень рациональности?

Хм-м. Если поставить вопрос таким образом, начинает создаваться впечатление, что возможно и нет.

Э. Т. Джейнс повторял, что всегда следует использовать всю доступную вам информацию. Он был теоретиком байесианства, и ему приходилось распутывать парадоксы, созданные другими людьми, которые в своих вычислениях на разных этапах пользовались разной информацией. Принцип «Всегда прикладывай максимум усилий» кажется не менее достойным чем «Никогда не делай ничего напоминающего логический круг». В конце концов, альтернатива к тому чтобы стараться как можно сильнее –– делать меньше, чем можно было бы.

Но всё же… разве не было бы здорово, если бы существовал способ обосновать бритву Оккама или то, что будущее будет похожим на прошлое, без допущения, что способы рассуждения успешно работавшие в прошлом лучше тех, что стабильно приводят к провалу?

Разве не было бы здорово, если бы существовала некая цепочка обоснований, которая не упирается в непроверяемые допущения и не вынуждена проверять саму себя на основании своих же правил? Которая начавшись с нуля могла бы убедить идеального студента философии абсолютной пустоты?

Ну, это определённо было бы любопытным, но я не ожидаю увидеть ничего подобного в ближайшее время. В машине нет идеально чистого призрака. Нет такого аргумента, что смог бы убедить камень.

Так что даже если кому-то удастся решить проблему Первопричины и по-настоящему обосновать то, что вселенная устроена просто — не основываясь при этом на простоте вселенной, — я всё равно буду ожидать, что это объяснение поймёт лишь наделённый разумом слушатель, а, например, камень — не поймёт. Слушатели, изначально не способные применить modus ponens, остаются не у дел.

Так что же в итоге происходит, когда кто-то спрашивает меня: «Почему я верю в то, во что я верю?»

В настоящее время я начинаю ходить по следующему циклу объяснений: «Я предсказываю будущее, полагая, что оно будет напоминать прошлое на наиболее простом и стабильном уровне организации материи, что я способен обнаружить, потому что ранее следование этому правило обычно давало хорошие результаты. И используя простое допущение о простоте вселенной, я могу понять, почему оно даёт хорошие результаты. И я даже могу понять, каким образом мой мозг мог эволюционировать так, чтобы наблюдать вселенную с определённой степенью точности, при условии, что мои наблюдения верны».

Однако… разве это рассуждение не оправдывает порочный логический круг?

Ведь я только что оправдал доверие к собственному разуму с помощью собственного разума, а не чего-то ещё.

Вообще, мы обычно отметаем логические круги именно из-за таких рассуждений. Мы хотим получать непротиворечивую причинно-следственную историю того, как наш мозг приходит к некоему знанию, историю, почему мы считаем надёжным процесс, с помощью которого получаем убеждения. Именно эта потребность стоит за фундаментальным вопросом рациональности: «Почему вы верите в то, во что вы верите?»

Теперь представьте, что вы написали на листке бумаги: «1) Все, что написано на этом листке бумаги истинно, 2) Масса атома гелия равна 20 граммам». Если бы такой трюк действительно работал, то вы могли бы узнать истинную массу атома гелия, просто приняв на веру логический круг, который его породил. И это позволило бы строить истинную карту вселенной, не выходя из комнаты с задёрнутыми занавесками. Что нарушало бы второй закон термодинамики, создавая информацию из ниоткуда. Поэтому кажется неправдоподобным, что таким образом в вашем разуме могут появиться истинные убеждения.

Даже если вы по какой-то причине поверили бумаге, не видно никаких причин, почему она может соответствовать реальности. Если бы выяснилось, что масса гелия действительно 20 грамм, и именно так написано на бумаге, это было бы просто чудесным совпадением.

В общем случае, нам кажется, что вера в набор утверждений, который обосновывает сам себя, не поможет нам создать карту, соответствующую территории. Мы приходим к этому заключению, размышляя о нашем разуме в контексте причин и следствий. И используем для этого размышления собственный разум.

Но что насчёт выработавшегося у нас большего доверия к более простым убеждениям и убеждения в том, что алгоритмы работавшие в прошлом с большей вероятностью будут работать и в будущем? Даже после размышлений в контексте причин и следствий, кажется, что они всё равно помогают нам строить карту, соответствующую территории.

А как насчёт доверия к непротиворечивости в подобных размышлениях? Представим огромное число разумов, случайно сгенерированных и пришедших в состояние непротиворечивых размышлений. Разве подавляющее большинство не будет ошибаться? Однако, наш разум появился не случайным путём. Он эволюционировал при помощи естественного отбора.

Если данный аргумент кажется вам подозрительным, то забудьте на секунду о проблеме философского обоснования и задайте себе вопрос: «Действительно ли это истина на самом деле?»

(Для чего вы, конечно же, воспользуетесь собственным разумом.)

Это то же самое, что утверждать «Я верю, что Библия – это слово Божие, потому что так утверждается в Библии»?

Могут ли верующие пользоваться аргументом, что слепую веру вложил в них Бог, и поэтому она надёжная опора для рассуждений?

Когда религиозные люди наконец-то отказываются от Библии, это происходит не потому, что они магическим образом прыгают в некое нерелигиозное состояние абсолютной пустоты, в нём заново переосмысливают свои религиозные убеждения в этом нерелигиозном состоянии разума, а затем перескакивают в новое состояние, в котором они уже не имеют религиозных убеждений.

Люди перестают быть религиозными, потому что сомнение проникает даже в религиозный разум. Они замечают, что их молитвы (и что хуже, молитвы, казалось бы, куда более достойных людей) остаются без ответа. Они замечают, что Бог, который говорит с ними в их сердце и даёт вроде бы утешительные ответы о вселенной, не способен сказать им сотый знак после запятой числа пи (что убедило бы гораздо сильнее, будь у Бога такая цель). Они изучают историю о том, как Бог создавал мир и осуждал на вечные муки неверующих, и она кажется бессмыслицей, даже если исходить из их собственных религиозных предпосылок.

Религиозность не делает вас менее человеком. Ваш мозг обладает всё теми же возможностями человеческого мозга. Опасность религиозности в том, что она может помешать вам применять эти способности по отношению к своей религии — помешает полноценной саморефлексии. Люди избавляются от своих ошибок не за счёт того, что переводят себя в состояние идеального философа абсолютной пустоты и переосмысливают свой опыт с чистого листа. Люди избавляются от своих ошибок, подвергая свои убеждения сомнению, используя силу своего текущего разума.

Вот в чём важное различие между размышлением о своём разуме при помощи своего разума (у вас всё равно нет других инструментов) и наличием допущений, которые вы не можете подвергнуть сомнению.

«Я верю, что Библия — это слово Божие, потому что так написано в Библии». Однако, если бы Библия была бы невероятно надёжным источником информации касательно всех прочих вопросов, если бы вместо утверждений, что у кузнечиков четыре ноги, а вселенная была создана за шесть дней, в ней содержалась бы периодическая таблица элементов за века до появления химии, если бы Библия действительно служила нам верой и правдой как источник истины, тогда, вообще-то, нам стоило бы всерьёз рассмотреть дополнительное утверждение, что Библию создал Бог.

Возможно, мы бы не доверяли этому утверждению полностью, потому что даже в этом случае Библию могли создать пришельцы или Тёмные повелители Матрицы, но по крайней мере к нему стоило бы отнестись серьёзно.

Аналогично, если бы всё остальное, что говорили священники, оказывалось бы правдой, то мы серьёзнее отнеслись бы к утверждению, что веру вложил в нас Бог и она — систематически надёжный источник знания. Особенно, если бы люди были способны постичь сотый знак после запятой числа пи при помощи одной лишь веры.

Поэтому логический круг, содержащийся в утверждении «Я верю, что Библия слово Божие, потому что так написано в Библии», не так важен по сравнению с тем, что это утверждение призывает к отказу от познания собственного ума с помощью его же самого. Ведь с помощью такого познания вы поймёте, что всё, ставящее под сомнение достоверность Библии, также ставит под сомнение и её заверения в собственной достоверности.

Такое же рассуждение применимо и к рациональности. Если будущее перестанет быть похожим на прошлое –– даже на простейших и наиболее стабильных уровнях организации материи… впрочем, в таком случае, я, скорее всего, умру, так для функционирования моего мозга необходима упорядоченная вселенная, в которой по-прежнему работают законы химии. Но, если я почему-то выживу, то я должен буду поставить под сомнение принцип, согласно которому будущее должно напоминать прошлое.

Но раз пока этого не случилось, какова альтернатива утверждению: «Я полагаю, что будущее будет напоминать прошлое на наиболее стабильном уровне организации материи, какой только я смогу обнаружить, так как данное убеждение успешно оправдывалось в прошлом и давало лучшие результаты, чем любое другое»?

Подойдёт ли утверждение: «Вера в то, что будущее не будет напоминать прошлое, всегда меня подводила, и именно поэтому я и буду так считать»?

Помните, что быть рационалистом – это не значит выигрывать споры у идеальных философов абсолютной пустоты. Быть рационалистом – это просто выигрывать. И для этого мы хотим приблизиться настолько близко к истине насколько это возможно. И таким образом я принимаю следующий принцип: сомневаться в том, что утверждает мозг и что подсказывает интуиция, сомневаться в своих принципах рациональности, используя всю нынешнюю силу моего ума, и прикладывая все доступные усилия на каждом шагу.

И если один из ваших нынешних принципов окажется несовершенным –– согласно вашей же собственной проверке, ведь вы не можете выйти за рамки себя –– то измените его! А затем снова взгляните на себя и мир вокруг, используя ваши новые усовершенствованные принципы.

Смысл не в том, чтобы быть рефлексивно последовательным. Смысл в том, чтобы выигрывать. Однако если мы наблюдаем за собой и играем на победу, мы становимся более рефлексивно последовательными. Без этого не получится «играть, чтобы выигрывать» и одновременно «следить за собой».

Всё без исключения требует обоснования. Иногда — и неизбежно, насколько я могу судить — эти обоснования будут замыкаться в самосогласованную рефлексию. И я считаю, существуют признаки, позволяющие при помощи здравого смысла отличить её от порочного логического круга. Но всякий, кто всерьёз рассматривает порочные круги, наверняка весьма далёк от рациональности. И, конечно же, подобные люди будут настаивать, что их порочный круг — это «самосогласованная рефлексия», даже если она состоит всего лишь из единственного клочка бумаги с надписью «Верь мне». Что ж, не всегда возможно улучшить методы рационального мышления ещё и так, чтобы люди настолько одержимые саморазрушением не использовали их, чтобы раз за разом стрелять себе в ногу.

Никогда не сдерживайтесь, критикуя свои способы критики. И не считайте неизбежность циклических обоснований лицензией на иммунитет к критике.

Всегда боритесь в полную силу — не важно, приводит ли это к замкнутому циклу или нет. Делайте всё, что можете. И всегда играйте на победу.

Перевод: 
Горилла В Пиджаке, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
264
Оцените качество перевода: 
Средняя оценка: 4.6 (25 votes)

Раскладывание камней в правильные кучи

Элиезер Юдковский

Давным-давно жили странные существа (может быть они были биологическими, или может быть они были синтетическими, а может это был просто сон), и они увлекались укладыванием камней в правильные кучи.

Они не могли сказать, почему некоторые кучи правильны, а некоторые неправильны. Но все они соглашались, что наиболее важная вещь в мире — это создание правильных куч и раскидывание неправильных.

Причина, по которой этих Камнераскладывающих Людей так заботило раскладывание камней, была давно утеряна в истории — может быть фишеровское убегание, начавшееся миллион лет назад по какому-то совершенно случайному стечению обстоятельств? Или может быть это результат разумного творения, которое было заброшено?

Но, как бы там ни было, раскладывание камней так много значило для них, что Камнераскладывающие философы в унисон говорили, что раскладывание камней по кучам было смыслом их жизней, что единственная оправданная причина кушать — это раскладывание камней; единственная причина размножаться — это раскладывание камней, единственная оправданная причина участвовать в экономической жизни их мира — это эффективное раскладывание камней.

Все Камнераскладывающие Люди соглашались с этим, но они не всегда соглашались с тем, какие кучи правильные, а какие нет.

На заре Камнераскладывающей цивилизации, кучи, создаваемые людьми, были по преимуществу маленькими, из 23 или 29 камней, и никто не знал, были бы более большие кучи правильными или нет. Три тысячелетия назад Великий Лидер Бико сделал кучу из 91 камня и объявил её правильной, и легионы его восторгающихся последователей создали множество других подобных куч. Но через несколько столетий, когда сила Биконианцев увяла, среди умнейших и наиболее просвещённых стало укрепляться чувство, что кучи из 91 камня неправильные. В конечном итоге, они пришли к пониманию того, что было сделано, и они раскидали все кучи из 91 камня. Не без некоторого сожаления, поскольку некоторые из этих куч были великими произведениями искусства, но неправильными. Они даже разбросали исходную кучу Бико, сделанную из 91 драгоценного камня, каждый своего типа и цвета.

И с тех пор ни одна цивилизация не сомневалась серьёзно в том, что куча из 91 камня неправильна.

Сегодня, в эти более умудрённые времена, размер куч, которые Камнераскладыватели осмеливаются создавать, вырос гораздо больше — и все согласны с тем, что это было бы великолепно и превосходно, если бы они могли убедиться в том, что кучи были действительно правильными. Иногда государства не соглашались о том, какие кучи правильные, и тогда случались войны: Камнераскладыватели никогда не забудут Великую Войну 1957 между И’ха-нтхей и И’не’ха-итлей из-за куч из 1957 камней. Та война, в которой впервые на Камнераскладывающей планете было применено ядерное оружие, в конечном итоге закончилась, когда философ Эт’гра’лен’лей из И’не’ха-итлейев, расположил кучу из 103 камней рядом с кучей из 19 камней. Это аргумент оказался настолько убедительным, что даже И’не’ха-итлеи неохотно согласились, что лучше прекратить создавать кучи из 1957 камней, по-крайней мере в настоящее время.

После Великой Войны 1957 страны неохотно шли на открытое одобрение или осуждение куч большого размера, поскольку это легко могло привести к войне. В действительности некоторые Камнераскладыватели-философы — кто, видимо, получал удовольствие, шокируя других своим цинизмом — полностью отрицали существование какого-либо прогресса в раскладывании камней; они намекали, что мнения о камнях были просто случайным броуновским движением сквозь время, без какой-либо согласованности, иллюзия прогресса создавалась благодаря осуждению всех достижений прошлого, не похожих на сегодняшие, как неправильных. Философы указывали на несогласие о кучах большого размера, как на доказательство того, что нет ничего, что делало бы кучу размера 91 действительно неправильной — просто было модным создавать такие кучи в определённый период времени, а затем в другой период было модным разрушать их. Они отказывались принимать «Но…13!» как аргумент, заявляя что «13!» не убедительный аргумент, но лишь ещё одно соглашение. Кучевые Релятивисты утверждали, что их философия может помочь предотвратить будущие катастрофы типа Великой Войны 1957, но большинство рассматривало её как философию отчаяния.

В настоящее время вопрос, что делает кучу правильной или неправильной, стал важным по ещё одной причине: Камнераскладыватели в ближайшем будущем могли создать самосовершенствующийся ИИ. Кучевые Релятивисты выступили против проекта, они сказали, что ИИ, не принадлежа к виду Камнераскладыватель Разумный, могут создать свою собственную культуру, которая будет нести совершенно иные идеи о том, какие кучи правильные или неправильные. «Они могут решить, что кучи из 8 камней правильные», — сказали Кучевые Релятивисты, — «и поскольку они не будут ультимативно более или менее правыми, чем мы, всё же наша цивилизация говорит, что мы не должны создавать таких куч. Не в наших интересах создавать ИИ, если только мы не встроим бомбу в каждый компьютер, чтобы даже если ИИ подумает, что куча из 8 камней правильная, то мы могли бы заставить их строить кучи из 7 камней. Либо БАБАХ!»

Но для большинства Камнераскладывателей это было абсурдом. Определённо, любой достаточно мощный ИИ — особенно «суперинтеллект» о котором рассуждали некоторые транскамнераскладыватели — сможет увидеть в мгновение ока, какие кучи правильные, а какие нет! Мысль о том, что нечто с мозгом размером с планету, будет думать, что куча из 8 камней правильна — это просто слишком абсурдно, чтобы об этом даже разговаривать.

В действительности, совершенно бесполезно ограничивать суперинтеллект в том, какие кучи он будет строить. Предположим, что Великий Лидер Бико мог бы в его примитивный век построить самосовершенствующийся ИИ и встроил бы в него максимизатор ожидаемой полезности, чья функция полезности говорила бы ему создавать так много куч размера 91, сколько возможно. Несомненно, когда этот ИИ достаточно сильно бы себя улучшил и стал бы достаточно умным, то он бы увидел в мгновение ока, что его функция полезности была неправильной, и, имея возможность менять свой исходный код, он переписал бы свою функцию полезности, чтобы она ценила бы более осмысленные размеры куч, типа 101 или 103.

И конечно же не кучи размера 8. Это было бы просто глупо. Любой ум, который настолько глуп, слишком туп, чтобы быть угрозой.

Убеждённые таким здравым смыслом, Камнераскладыватели дали зелёный свет их проекту, по собиранию из множества разнообразных алгоритмов случайных программ, в надежде, что таким образом возникнет разум. Вся история цивилизации показывала, что более богатые, умные, более просвещённые цивилизации были склонны соглашаться о кучах, о которых спорили их предки. Конечно же, ещё оставались кучи бóльших размеров и они спорили о них, но по мере того как развивались технологии, цивилизации приходили к согласию о кучах большего размера и создавали их.

На самом деле, интеллект сам по себе всегда коррелировал с созданием правильных куч — ближайшие родственники по эволюции к Камнераскладывателям — Камнераспанзе — создавали кучи размером в 2 или 3 камня, и иногда глупые кучи, типа 9. А другие, ещё менее интеллектуальные животные, например, рыбы, вообще не делали куч.

Умнее мозги, следовательно, умнее кучи. С чего бы это вдруг эта закономерность перестанет работать?

Перевод: 
kuuff
Номер в книге "Рациональность: от ИИ до зомби": 
268
Оцените качество перевода: 
Средняя оценка: 4.8 (11 votes)

Двуместные и одноместные слова

Элиезер Юдковский

Ранее я говорил об обложках стародавних pulp-журналов, на которых изображали пучеглазого монстра, похищающего девушку в изорванном платье, а также о том, что люди считают, будто сексуальность - неотъемлемое свойство сексуальной сущности, не зависящее от её поклонника.

«Конечно, пучеглазое чудовище предпочтет человеческих женщин женским особям своего вида», - скажет художник (назовем его условно «Фредом»). «Он же видит, что у человеческих женщин мягкая, приятная кожа, а не скользкая чешуя. Пусть он и не с нашей планеты, но он же не дурак — с чего вы решили, что он не имеет представления о том, что такое сексуальность?»

В чем ошибка Фреда? В том, что он исследует функцию 2-х независимых аргументов («двуместную функцию»):

$$Сексуальность: Почитатель, Существо => [0, ∞)$$

словно это функция одного аргумента (одноместная функция):

$$Сексуальность: Существо —> [0, ∞)$$

Если сексуальность рассматривается как функция, имеющая в качестве аргумента один лишь объект вожделения, тогда, да, сексуальность будет выглядеть зависящей только от объекта вожделения, и ничто другое не будет иметь значения.

Когда вы думаете о двуместной функции так, будто она одноместная, вы в конечном итоге сталкиваетесь с ошибкой изменяемого вопроса / ошибкой проецирования ума. Это все равно, что пытаться определить, находится ли здание по своей сути на левой или на правой стороне дороги, независимо от направления чьего-либо движения.

Альтернативная и не менее обоснованная точка зрения заключается в том, что «сексуальность» действительно является одноместной функцией, но каждый говорящий использует свою отличную одноместную функцию, чтобы решить, кого похитить и изнасиловать. Кто сказал, что только потому, что художник Фред и пучеглазый монстр Блуга оба пользуются словом «сексуальный», они должны подразумевать под ним одно и то же?

Если вы придерживаетесь этой точки зрения, то нет никакого парадокса в том, что какая-то женщина внутренне обладает 5 единицами величины Фред::Сексуальность. Все обозреватели могут согласиться с этим фактом, как только Фред::Сексуальность будет определена с точки зрения изгибов, текстуры кожи, одежды, признаков социальной престижности и т.д. В этом описании не обязательно упоминать Фреда, только женщину, подлежащую оценке.

Так вышло, что сам Фред использует этот алгоритм для выбора целей для ухаживания. Но это не значит, что сам алгоритм должен упоминать Фреда. Таким образом, с этой точки зрения, функция Сексуальности по Фреду на самом деле является функцией одного объекта — женщины. Я назвал это «Фред::Сексуальность», но учтите, что это название относится к функции, которая описывается независимо от Фреда. Может быть, было бы лучше записать это как:

Фред::Сексуальность == Сексуальность_20934

Эмпирическим фактом о Фреде является то, что он использует функцию Сексуальность_20934 для оценки потенциальных партнеров. Возможно, Джон использует точно такой же алгоритм, и не имеет значения, откуда он взялся, раз он у нас есть.

У той же женщины, по той же логике, имеется всего 0,01 единицы Сексуальности_72546, в то время как у гриба слизевика 3 единицы Сексуальности_72546. Эмпирическим фактом является то, что монстр Блуга использует Сексуальность_72546, чтобы решить, кого похитить. Иными словами, величина Блуга::Сексуальность идентифицирует фиксированный, независимый от самого Блуга математический объект, который является функцией Сексуальность_72546.

Коль скоро мы скажем, что у женщины 0,01 единицы Сексуальности_72546 и 5 единиц Сексуальности_20934, все наблюдатели примут это без возражений.

А двуместную точку зрения можно преобразовать в одноместную, используя концепцию «каррирования», названную в честь математика Хаскелла Карри. Каррирование - это метод, разрешенный в определенном языке программирования, где, например, вместо написания:

$$x = plus(2, 3)~(x = 5)$$

вы также можете написать:


y = plus(2)

Теперь «y» это «каррированная» форма функции $plus$, поглотившая «2» и мы можем её использовать:

x = y(3)
-- получим x = 5
z = y(7)
-- получим z = 9

Таким образом, $plus$ - это двуместная функция, однако, каррирование, позволяющее ей использовать только один из двух требуемых аргументов, превращает ее в одноместную функцию, которая добавляет 2 ко всему, что на входе. (Аналогично, вы могли бы начать с 7-местной функции, сократить её на 4 аргумента, получив в результате трехзначную функция и т.д.).

Истинный пурист стал бы настаивать, что все функции следует рассматривать, по определению, как имеющие ровно 1 аргумент. В этом представлении $plus$ принимает 1 числовой ввод и выдает новую функцию; и эта новая функция имеет 1 числовой ввод и, наконец, выдает число. С этой точки зрения, когда мы пишем $plus(2, 3)$, мы на самом деле вычисляем $plus(2)$, чтобы получить функцию, которая добавляет 2 к любому входящему, а затем применяет результат к 3. Программист написал бы это как:

plus :: Int-> (Int-> Int)

Это говорит о том, что plus принимает значение типа Int в качестве аргумента и возвращает функцию типа Int -> Int то есть принимающую одно значение типа Int и возвращающуюю значение того же типа.

Переводя метафору обратно в человеческое словоупотребление, мы могли бы представить, что «сексуальность» начинается с «поедания» Поклонника, после чего она «выплевывает» фиксированный математический объект, который описывает, как Поклонник в данный момент оценивает привлекательность. Эмпирическим фактом, касающимся поклонника, является то, что его интуитивные представления о желательности вычисляются способом, изоморфным этой математической функции.

Тогда математический объект, выдаваемый путем каррирования функции Сексуальности(Поклонник), может быть применен к Женщине. Если Поклонником изначально был Фред, то Сексуальность(Фред) сначала выдаст Сексуальность_20934. Тогда мы можем сказать, что - независимо от Фреда - эмпирическим фактом о Женщине является то, что Сексуальность_20934(Женщина) = 5.

В мысленном эксперименте Хилари Патнэм «Земля-Близнец» разгорелся грандиозный философский спор о том, имеет ли смысл постулировать существование Земли-Близнеца, которая точно такая же, как наша, за исключением того, что вместо воды H2O, вода представляет собой другую прозрачную текучую субстанцию, XYZ. И, кроме того, надо ли устанавливать время проведения мысленного эксперимента на несколько столетий назад, так что ни на нашей Земле, ни на Земле-Близнеце никто не знает, как проверить альтернативные гипотезы о H2O и XYZ. Означает ли слово «вода» в том мире то же самое, что и в этом?

Некоторые сказали: «Да, потому что, когда земной человек и его двойник-землянин произносят слово «вода», они имеют в виду один и тот же сенсорный опыт».

Некоторые сказали: «Нет, потому что «вода» на нашей Земле означает H2O, а «вода» на Земле-Близнеце означает XYZ».

Если вы думаете о «воде» как о концепции, которая начинается с поедания мира для того, чтобы выяснить эмпирическую истинную природу этого прозрачного текучего вещества, и которая выдает в результате новую фиксированную концепцию Вода_42 или H2O - тогда эта концепция поедания мира одинакова на нашей Земле и на Земле-Близнеце. Просто она выдает разные ответы в разных местах.

Если вы думаете о «воде» как о значении H2O, то концепция никак не изменится с переносом ее между мирами, хотя Земля-близнец и не содержит H2O.

И уж конечно, нет смысла спорить о том, что на самом деле означает звучание слогов «во-да».

Итак, следует ли выбрать одно определение и использовать его последовательно? Но не так-то просто уберечься от путаницы. Вы должны приучить себя осознавать различие между каррированными и некаррированными формами понятий.

Когда вы берете некаррированную концепцию воды, и применяете ее в другом мире, это та же концепция, но она относится к другой сущности. То есть, мы применяем постоянную функцию мира-поедания к другому миру и получаем в результате другое значение. На Земле-Близнеце XYZ - это «вода», а H2O – нет. На нашей Земле H2O - это «вода», а XYZ - нет.

С другой стороны, если вы используете «воду» для обозначения того, что предыдущий мыслитель назвал бы «результатом применения «воды» к нашей Земле», то на Земле-Близнеце вода – это не XYZ, а H2O.

Вся путаница последующих философских дебатов происходит из-за тенденции инстинктивно каррировать концепции или инстинктивно их декаррировать.

Точно так же Фреду требуется дополнительный шаг, чтобы понять, что другие субъекты, типа пучеглазого монстра (ПГМ), будут выбирать жертву для изнасилования, основываясь на своем представлении о сексуальности т.е функции СексуальностьПГМ(Женщина), а не на функции Фред(Женщина). Чтобы сделать это, Фред должен сознательно переосмыслить Cексуальность как функцию с двумя аргументами. Все, что мозг Фреда непроизвольно делает — это оценивает величину Женщина.сексуальность, или, выражая по-другому: СексуальностьФред(Женщина). Что обозначается просто как: Женщина.сексуальность.

Фиксированная математическая функция Сексуальность_20934 не упоминает Фреда или ПГМ, только женщин, поэтому Фред инстинктивно не понимает, почему ПГМ оценивает «сексуальность» как-то по-другому. И действительно, ПГМ не стал бы оценивать Сексуальность_20934 по-другому, если бы по какой-то странной причине его заботил результат этой конкретной функции. Однако, эмпирическим фактом о ПГМ является то, что он использует другую функцию, чтобы решить, кого похитить.

Данный анализ понадобится нам позже, чтобы табуировать такие сбивающие с толку слова, как «объективный», «субъективный» и «произвольный».

Перевод: 
noname0aha5i2, worldmind, Мак, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
269
Оцените качество перевода: 
Средняя оценка: 3 (6 votes)

Что вы сделаете без морали?

Элиезер Юдковский

Тем, кто говорит: “Ничто не реально” — я однажды ответил (English): “Хорошо, но как это ничто работает?”

Предположим, что вы однажды внезапно и однозначно узнали, что нет ничего нравственного и правильного, всё позволено и ничего запрещено.

Несомненно, удручающая новость. И нет, я говорю вам не по-настоящему, но представьте, что я это сказал. Так же представим, чтобы вы там ни считали стержнем вашей этики, я убедительно разнёс это и кроме — показал, что ничего может занять место. И допустим, что я доказал, что все значения функции полезности равны нулю.

Я знаю, что наша Моральная Философия также верна и неоспорима, как и 2+2=4. Но всё же, я попрошу вас постараться провести мысленный эксперимент и детально рассмотреть возможности, даже если они кажутся мучительными, бессмыслицей или же просто неспособными логически дать вразумительный ответ.

Будете ли вы по-прежнему давать чаевые таксистам? А изменять? Если ребёнок лежит на рельсах, вы всё ещё оттащите его?

Будете ли вы питаться тем же, чем раньше — или есть самое дешёвое, поскольку незачем получать удовольствие? Или вы будете есть самую дорогую пищу, потому что незачем откладывать деньги на следующий день?

Стали вы бы ходить в чёрном, писать мрачные стихи и клеймить всех альтруистов дураками? Но нет причин, по которым вам следовало бы делать так — это просто кешированная мысль.

Лежали ли вы бы в постели, потому что незачем вставать? А когда вы все-таки захотите есть и, спотыкаясь, пойдете на кухню, что вы будете делать после еды?

Продолжите ли читать “Overcoming Bias”, а если нет, то что бы вы читали вместо этого? Продолжите ли вы стараться быть рациональным, или будете мыслить иначе?

Закройте глаза и подумайте над вопросом столько, сколько понадобится:

Что вы будете делать, если бы ничто не было правильным?

Перевод: 
gihh
Оцените качество перевода: 
Средняя оценка: 3.6 (19 votes)

Настоящая дилемма заключенного

Элиезер Юдковский

Однажды я понял, что обычно дилемму заключенного представляют неправильно.

В основе дилеммы заключенного лежит вот такая симметричная платежная матрица:

1:С 1:П
2:С (3,3) (5,0)
2:П (0,5) (2,2)

Есть два игрока: Игрок 1 и Игрок 2. Каждый из них может выбрать С или П. Итоговый результат для Игрока 1 и Игрока 2 — соответственно, первое и второе число пары чисел в скобках. По причинам, которые станут понятны ниже, C означает «сотрудничать», П — «предать».

Заметим, что для участника этой игры (пусть он считает себя первым) предпочитаемые исходы выстраиваются в следующем порядке: (П, С) >> (C, С) >> (П, П) >> (С, П).

Видим, что П предпочтительнее, чем С: если второй игрок выбирает С, то первому выгоднее (П, С), чем (С, С). Если второй выбирает П, то первому выгоднее (П, П), чем (С, П). Таким образом, ты мудро выбираешь П, а так как платежная матрица симметрична, второй игрок аналогично выберет П.

Если бы вы оба были не так мудры! Каждому из вас выгоднее (С, С), чем (П, П). Поэтому вы оба предпочитаете обоюдное сотрудничество обоюдному предательству.

В теории принятия решений дилемма заключенного — одна из основ, и о ней написано огромное количество томов. Но я осмелюсь утверждать, что в традиционном представлении дилеммы заключенного есть серьезное упущение — по крайней мере, для людей.

Классическое представление дилеммы заключенного таково: ты преступник, пойманный властями вместе с сообщником. Независимо друг от друга, без возможности общаться между собой и без возможности изменить решение впоследствии, каждый из вас должен решить, давать показания против сообщника (П) или молчать (С).

В настоящий момент каждому из вас грозит год тюрьмы. Дача показаний против сообщника уменьшает твой срок на год и прибавляет другому два года.

В другом варианте, ты и незнакомец, не зная ничего друг о друге и не имея возможности узнать в будущем, единожды должны сыграть С или П, получив выигрыш в соответствии с приведенной выше платежной матрицей.

И, конечно, в классическом варианте предполагается, что ты полностью эгоистичен, т.е. не заботишься о сообщнике или об игроке в другой комнате.

И именно последнее условие, с моей точки зрения, приводит к неправильному восприятию дилеммы заключённого.

Невозможно устранить эффект знания задним числом, инструктируя присяжных вести себя так, будто они не знают, к чему привели рассматриваемые события. Аналогично, без больших усилий, подкрепленных соответствующими знаниями, психически здоровый человек не может притворяться по-настоящему эгоистичным.

У нас есть врожденные чувства честности, чести, сопереживания, симпатии и даже альтруизма. Это результат того, что наши предки длительное время приспосабливались к игре в повторяющуюся дилемму заключенного. Мы не можем полностью и честно предпочесть исход (П, С) исходу (С, С), хотя можем полностью предпочесть исход (С, С) исходу (П, П) и исход (П, П) исходу (С, П). Мысль о сообщнике, проводящем три года в тюрьме, не может совсем не трогать нас.

В закрытой комнате, где под наблюдением специалистов по экономической психологии мы играем в простую игру, мы не можем совсем не симпатизировать незнакомцу, который может сотрудничать. Мы не можем быть полностью счастливы при мысли о том, что незнакомец выбрал сотрудничать, а мы — предавать, и благодаря этому мы получим пять долларов, а он не получит ничего.

Мы инстинктивно держимся за исход (С, С) и ищем способы увериться, что этот выбор разделяет и вторая сторона. Наша невольная мысль — «как бы убедиться, что сотрудничество взаимно», а не «как бы обмануть второго, чтобы он сыграл С, в то время как я сыграю П и получу максимальный выигрыш».

Для тех, кому важны альтруизм, честь и справедливость, дилемма заключенного не содержит по-настоящему критической платежной матрицы, безотносительно финансовых исходов для игроков. (С, С) предпочтительнее, чем (П, С), и ключевой вопрос — думает ли второй игрок так же.

И людям, которые только что познакомились с теорией игр, нельзя объяснить, что они должны притворяться полностью эгоистичными. Это ничуть не легче, чем объяснить людям, познакомившимся с идеей антропоморфизма, что они должны притворяться максимизаторами скрепок.

Для настоящей дилеммы заключённого ситуация должна быть примерно такой:

Игрок 1: Человек, дружественный искусственный интеллект или другой человекоподобный разум.
Игрок 2: Недружественнный искусственный интеллект, либо инопланетянин, который озабочен лишь раскладыванием камней в правильные кучи.

Представим, что четыре миллиарда людей — не всё человечество, но значительная его часть — страдает прогрессирующим смертельным заболеванием, которое может вылечить только Вещество.

Однако Вещество возможно производить, только взаимодействуя с максимизатором скрепок из параллельного мира — с помощью Вещества еще можно делать скрепки. Максимизатора скрепок волнует количество скрепок только в его мире, а не в нашем, так что мы не можем влиять на него, предлагая изготавливать или уничтожать скрепки здесь. Мы никогда раньше не имели дело с максимизатором скрепок и никогда больше не встретим его впредь.

У человечества и максимизатора скрепок есть только один шанс добыть себе немного Вещества, потому что щель между мирами скоро захлопнется. Однако, процесс добычи вещества приводит к потере его части.

Платежная матрица выглядит так:

1:С 1:П
2:С (спасти 2 миллиарда человеческих жизней, сделать 2 скрепки) (3 миллиарда жизней, 0 скрепок)
2:П (0 жизней, 3 скрепки) (1 миллиард жизней, 1 скрепка)

Я составил матрицу так, чтобы вызвать чувство негодования при мысли о том, что максимизатор скрепок хочет обменять миллиарды человеческих жизней на пару скрепок. Очевидно же, что максимизатор скрепок обязан отдать все Вещество нам. Но он делает не то, что обязан, а просто максимизирует количество своих скрепок.

В этом случае мы на самом деле предпочитаем исход (П, С) исходу (С, С), оставляя за скобками средства, которыми достигается цель. Мы намного охотнее предпочтем жить во вселенной, где три миллиарда людей спаслись и не было произведено ни одной скрепки, чем пожертвуем миллиардом жизней в обмен на изготовление двух скрепок. Кажется, что в этом случае сотрудничать просто неправильно. Предавать даже не кажется нечестным – ведь так велика жертва для нас и так мал выигрыш максимизатора скрепок! Уточним особо, что максимизатор скрепок не чувствует боль или удовольствие — он просто действует так, чтобы в его мире стало больше скрепок. Он не испытает радость, приобретя скрепки, не испытает боль, потеряв скрепки, и не оскорбится, если мы предадим его.

Что же ты сделаешь? Будешь ли сотрудничать, если искренне, целиком и полностью желаешь того огромного выигрыша, который можешь получить, и нисколько не озабочен ничтожной в сравнении с этим потерей второго игрока? Если предать кажется правильным, даже если второй игрок сотрудничает?

Именно так выглядит платёжная матрица для настоящей дилеммы заключённого. Настоящая дилемма заключённого — это ситуация, когда исход (П, С) кажется правильнее, чем (С, С).

Но вся остальная логика — что будет, если оба игрока так думают, и поэтому оба предадут — ничуть не меняется. Ведь максимизатор скрепок настолько же мало обеспокоен людскими смертями, болью или нашим ощущением предательства, как нас мало волнуют скрепки. Но обоим нам выгоднее (С, С), чем (П, П).

Если ты когда-нибудь гордился тем, что в дилемме заключенного выбрал сотрудничать, или однажды оспаривал вывод классической теории игр о том, что «рациональнее» предать — что ты скажешь об этой настоящей дилемме заключенного?

PS На самом деле, я не считаю, что рациональные агенты всегда должны предавать в однократной дилемме заключённого, в которой другой игрок выберет сотрудничать, если ожидает того же от вас. Я думаю, что есть ситуации, где два агента могут рационально прийти к (С, С), а не к (П, П) и получить соответствующую выгоду.

Часть своих доводов я изложил при обсуждении задачи Ньюкома. Однако, мы не можем рассуждать о том, возможно ли в этой дилемме рациональное сотрудничество, пока не избавимся от интуитивного ощущения, что исход (С,С) хорош сам по себе. Если мы хотим понять математику, мы должны научиться видеть сквозь социальный ярлык «взаимного сотрудничества». Если вы чувствуете, что с точки зрения Игрока 1 (С,С) гораздо лучше, чем (П,П), но не чувствуете, что при этом (П,С) гораздо лучше, чем (С,С), то вы пока не понимаете всю сложность этой задачи.

Перевод: 
Фёдор Ефремов, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
275
Оцените качество перевода: 
Средняя оценка: 4.3 (18 votes)

Количественный гуманизм

Цепочка посвящена вопросам, как нам стоит применять математические теории к повседневной интуиции о морали и принятию решений.

Примечание редактора: Значительная часть этой цепочки не переведена на русский язык.

Автор: 
Элиезер Юдковский

Пренебрежение масштабом

Элиезер Юдковский

Однажды трём группам испытуемых задали вопрос, сколько они готовы заплатить, чтобы 2 000, 20 000 и 200 000 перелётных птиц не погибли, увязнув в нефти. В ответах были названы суммы 80, 78 и 88 долларов соответственно1. То, что можно принять за бесчувственность, называется пренебрежением масштабом: количество спасённых птиц – масштаб альтруистического действия – мало повлияло на готовность заплатить.

Похожие эксперименты показали, что за очистку всех загрязнённых озёр Онтарио жители Торонто заплатили бы немногим больше, чем за очистку определённого района Онтарио2. Аналогично, жители четырёх западных штатов США за защиту всех 57 заповедников дикой природы в этих штатах заплатили бы лишь на 28% больше, чем за заботу об одном из заповедников3.

Люди представляют «одинокую обессилевшую птицу с пропитанными чёрной нефтью перьями, которой не спастись» 4. Это представление, этот образ вызывает эмоциональное возбуждение, которое в основном и отвечает за готовность заплатить – и образ во всех трёх случаях один и тот же. Что до масштаба, то на него не обращают внимания – ни один человек не сможет представить 2 000 птиц сразу, не говоря уже про 200 000. Классический вывод состоит в том, что масштаб, растущий по экспоненте, вызывает всего лишь линейное увеличение готовности платить. Возможно, такое линейное увеличение соответствует увеличению времени скольжения взгляда по нулям в числах; это небольшое влияние добавляется к влиянию представления, но не умножает его. Эта гипотеза известна как «оценка по представлению».

Альтернативная гипотеза – «приобретение морального удовлетворения». Люди тратят достаточно денег, чтобы им стало теплее на душе от чувства выполненного долга. Уровень расходов, необходимый для приобретения теплоты на душе, зависит от личных качеств и финансового положения, но уж точно не от количества птиц.

Мы пренебрегаем масштабом, даже если на кону человеческие жизни. По мере увеличения предполагаемого риска хлорирования питьевой воды с 0,004 до 2,43 смертей в год на тысячу человек – в 600 раз – готовность заплатить возрастает с 3,78 до 15,23 долларов5. Барон и Грин не обнаружили эффекта от изменения числа спасённых жизней в 10 раз6.

В статье «Нечувствительность к ценности человеческой жизни: исследование психофизического ступора» собраны свидетельства того, что сила восприятия человеческих смертей подчиняется закону Вебера и прямо пропорциональна логарифму их количества. Другими словами, порог различия (количество смертей, которое необходимо добавить к имеющимся, чтобы возникло чувство различия) постоянно увеличивается по мере роста общего количества смертей. Так, здравоохранительная программа для беженцев из Руанды получила намного больше поддержки, когда гарантировалось спасение 4 500 людей в лагере из 11 тысяч беженцев, чем тех же 4 500 в лагере из 250 000. Чтобы потенциальное лекарство от болезни посчитали достойным финансирования, оно должно гарантировать спасение значительно большего числа жизней, если изначально утверждалось, что эта болезнь – причина смерти 290 000 людей в год, нежели 160 000 или 15 0007.

Мораль: если вы хотите быть эффективным альтруистом, вы должны задействовать ту часть мозга, что обрабатывает нудные чернильные нули, а не просто переживать о бедной исстрадавшейся пропитанной нефтью птице.

  • 1. Desvousges, W. Johnson, R. Dunford, R. Boyle, K. J. Hudson, S. and Wilson K. N. (1992). Measuring non-use damages using contingent valuation: experimental evaluation accuracy. Research Triangle Institute Monograph 92-1
  • 2. Kahneman, D. 1986. Comments on the contingent valuation method. Pp. 185-194 in Valuing environmental goods: a state of the arts assessment of the contingent valuation method, eds. R. G. Cummings, D. S. Brookshire and W. D. Schulze. Totowa, NJ: Roweman and Allanheld
  • 3. McFadden, D. and Leonard, G. 1995. Issues in the contingent valuation of environmental goods: methodologies for data collection and analysis. In Contingent valuation: a critical assessment, ed. J. A. Hausman. Amsterdam: North Holland
  • 4. Kahneman, D., Ritov, I. and Schkade, D. A. 1999. Economic Preferences or Attitude Expressions?: An Analysis of Dollar Responses to Public Issues, Journal of Risk and Uncertainty, 19: 203-235
  • 5. Carson, R. T. and Mitchell, R. C. 1995. Sequencing and Nesting in Contingent Valuation Surveys. Journal of Environmental Economics and Management, 28(2): 155-73
  • 6. Baron, J. and Greene, J. 1996. Determinants of insensitivity to quantity in valuation of public goods: contribution, warm glow, budget constraints, availability, and prominence. Journal of Experimental Psychology: Applied, 2: 107-125
  • 7. Fetherstonhaugh, D., Slovic, P., Johnson, S. and Friedrich, J. 1997. Insensitivity to the value of human life: A study of psychophysical numbing. Journal of Risk and Uncertainty, 14: 238-300
Перевод: 
olya_babe, losjasha, kergma, Viktoriya
Номер в книге "Рациональность: от ИИ до зомби": 
281
Оцените качество перевода: 
Средняя оценка: 3.9 (32 votes)

Парадокс Аллэ

Элиезер Юдковский

Выберите между двумя следующими возможностями:

1А. 24 000 долларов, точно.

1Б. Шанс в 33/34 выиграть 27000 долларов и в 1/34 — не получить ничего.

Что интуитивно кажется лучшим выбором? И что вы выберете в реальной жизни?

А какой из двух выборов вы предпочтете теперь и какой выберете в реальной жизни?

2А. 34-процентный шанс выиграть 24 000 долларов и 66-процентный шанс не получить ничего.

2Б. 33-процентный шанс выиграть 27 000 долларов и 67-процентный шанс не получить ничего.

Парадокс Аллэ, названный по имени исследователя, на самом деле не является парадоксом — он был одним из первых конфликтов между теорией принятия решений и человеческим мышлением; он был показан экспериментально в 1953 году. Я слегка модифицировал его, чтобы его легче было понять математически, однако в сущности проблема осталась той же: большинство людей предпочтут вариант 1А, и большинство людей предпочтут вариант 2Б. На самом деле, в пределах задачи, большинство испытуемых выражают оба предпочтения одновременно.

Это проблема, поскольку второй вариант задачи эквивалентен одной трети шанса от первого. То есть, 2А это все равно что получить 1А с вероятностью в 34%, и 2Б эквивалентно 1Б с вероятностью 34%.

Среди аксиом, используемых для доказательства, что последовательный сторонник теории принятия решений может рассматриваться как тот, кто максимизирует ожидаемую полезность, есть аксиома независимости: если Х строго предпочитается Y, тогда вероятность Р от Х и (1 – Р) от Z должны строго предпочитаться вероятности P от Y и (1 - Р) от Z.

Все аксиомы являются следствием и основанием последовательной функции полезности. Так что должно быть возможно доказать, что экспериментальные испытуемые выше не имели последовательной функции полезности для своих выборов. И в самом деле, вы не можете одновременно выбирать:

U(24 000 $) ≻ 33/34 U(27 000 $) + 1/34 U(0 $)

0,34 U(24 000$) + 0,66 U(0 $) ≺ 0,33 U(27 000$) + 0,67 U(0 $)

Эти два уравнения алгербаически непоследовательны независимо от U, и поэтому парадокс Аллэ не имеет ничего общего с убывающей предельной полезностью денег.

Морис Аллэ первоначально защищал выявленные предпочтения испытуемых: он рассматривал эксперимент как разоблачение недостатка в обычной идее полезности, а не подвергал критике изъян в человеческой психологии. В конце концов, это был 1953 год, и до начала движения эвристики и искажений было еще два десятилетия. Аллэ думал, что эксперимент просто показывает, что аксиома независимости не может быть применена в чистом виде в реальной жизни.

(Как наивно, как глупо, как упрощённо в Байесовской теории принятия решений…)

Конечно, определенность в обладании 24 000 долларов должна что-то значить. Вы ощущаете разницу, верно? Твердую уверенность?

(Я начинаю думать об этом как о «наивном философском реализме» — предположении, что наши интуитивные ожидания прямо отражают истины о том, какие стратегии мудрее, как о непосредственно осознаваемом факте, что «1А превосходит 1Б». Интуитивные ожидания прямо отражают истины о человеческих когнитивных функциях и только косвенно отражают (после того как мы отразим когнитивные функции сами по себе) истины о рациональности.)

«То есть», — скажете вы, — «это настолько ужасно, что следует отказаться от изящества байесианства?» Хорошо, поскольку испытуемые не следовали чистой малой аксиоме независимости, представленной фон Нейманом и Моргенштерном. Но кто вообще сказал, что вещи должны быть ясными и чистыми?

Зачем беспокоится о изяществе, если оно заставляет нас брать риски, которых мы не хотим? Ожидаемая полезность говорит нам количественно оценить результат, умножить на его вероятность, сложить и т. д. Хорошо, но почему мы должны это делать? Почему бы не использовать более подходящие правила?

Всегда есть цена за уход с байесовского пути. Это то, о чем говорят теоремы согласованности и уникальности.

В данном случае, если агент предпочитает 1A > 1Б, и 2Б > 2A, он вводит противоречивую систему предпочтений — динамическую неслогласованность в системе планирования агента. Вы начинаете терять деньги.

Предположим, что в 12:00 я брошу кость со 100 гранями. Если кость покажет число больше, чем 34, то игра заканчивается. В любом другом случае в 12:05 я спрошу совета по выбору между двумя положениями, А и Б. Если положение А, то я заплачу вам 24 000 долларов. Если положение Б, то я бросаю кость с 34 гранями и плачу вам 27 000 долларов, но только если кость не показывает «34»: в этом случае я не плачу вам ничего.

Предположим, что вы выбрали 1А, а не 1Б, и 2Б, а не 2А, и вы должны заплатить один пенни за каждый выбор. Выбор начинается с состояния А. До 12:00 вы платите мне пенни, чтобы перейти в состояние Б. Кость показывает 12. После 12:00 и до 12:05 вы платите мне пенни за переход в состояние А.

Я принимаю ваши два цента с субъекта.

Если вы действуете в угоду своим интуитивным ожиданиям и отказываетесь от изящества как от бессмысленной одержимости, не удивляйтесь, когда ваши деньги уходят от вас…

(Я думаю, та же неспособность пропорционально девальвировать эмоциональное воздействие малых вероятностей несет ответственность за лотерею.)

Allais, M. (1953). Le comportement de l’homme rationnel devant le risque: Critique des postulats et axiomes de l’école Américaine. Econometrica, 21, 503-46.

Kahneman, D. and Tversky, A. (1979.) Prospect Theory: An Analysis of Decision Under Risk. Econometrica, 47, 263-92.

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
283
Оцените качество перевода: 
Средняя оценка: 3.2 (10 votes)

Чувство морали

Элиезер Юдковский

Предположим, что нечто — болезнь, монстр, война, или что-то ещё — убивает людей. И допустим, что у вас достаточно ресурсов для осуществления одного из двух вариантов:

  1. Гарантированно спасти 400 жизней;
  2. Спасти 500 жизней с вероятностью в 90%, но при этом процент вероятности того, что спасти людей не удастся, составит 10%.

Большинство людей выбирают первый вариант, что я считаю глупым, поскольку, если вы умножите 500 жизней на 90% вероятности, то получите 450 жизней, что превышает 400 жизней из первого варианта. (Для спасённых жизней предельная полезность не убывает, так что это уместное вычисление).

Вы можете возмущённо воскликнуть: «Что?! Как вы можете играть с человеческими жизнями? Как вы можете думать о цифрах, когда столько поставлено на карту? Что если выпадут те 10% и все умрут? Это слишком большая плата за вашу проклятую логику! Ваша рациональность оторвана от реальности!»

Ах, но вот одна интересная вещь. Если вы представите параметры таким образом:

  1. 100 человек гарантированно умрут.
  2. Шанс 90%, что никто не умрёт, но вероятность 10%, что погибнут 500 человек.

В таком случае большинство выберут второй вариант. Даже если это та же самая авантюра. Очевидно, что так же, как уверенность в спасении 400 жизней кажется гораздо более комфортной, чем ненадёжная выгода, также и конкретная потеря ощущается сильнее, чем неопределённая.

Вы можете играть на публику и в этом случае: «Как вы можете обречь 100 человек на верную смерть, когда есть такая хорошая возможность спасти их? Мы все должны рискнуть! Даже если бы шанс спасти всех составлял всего 75%, всё равно стоило бы попробовать, раз есть шанс! Пусть им воспользуются все или никто!»

Знаете что? Это не о ваших чувствах. Человеческая жизнь, со всеми её радостями и страданиями, складывающимися в течение десятилетий, стоит гораздо больше, чем чувство комфорта или дискомфорта вашего мозга от планирования. Вам кажется, что вычисление ожидаемой полезности слишком бесчувственно? Что же, это ощущение — лишь перо на чаше весов, когда на карту поставлена жизнь. Просто заткнитесь и умножайте. Гугол равен 10^100 — единица, за которой следуют сто нулей. Гуголплекс — ещё более непостижимое большое число, это 10^гугол, единица, за которой следует гугол нулей. Теперь выберите какое-нибудь банальное неудобство, типа икоты, и какое-нибудь явно нетривиальное несчастье, например, медленно отрывающаяся конечность при нападении садистскими акулами-мутантами. Если мы вынуждены сделать выбор между предотвращением икоты у гуголплекс людей или предотвращением нападения акулы-мутанта на одного человека, какой выбор мы должны сделать? Если вы присваиваете икоте какое-то негативное значение, то, под страхом теоретической несогласованности решений, должно быть некоторое количество икоты, которое в сумме составило бы конкуренцию негативному значению атаки акулы. Для любого конкретного конечного зла должно быть некоторое количество икоты, которое было бы ещё хуже.

Подобные моральные дилеммы не являются умозрительным кровавым спортом для развлечения философов-аналитиков на званых обедах. Это искажённые версии тех ситуаций, в которых мы на самом деле оказываемся каждый день. Стоит ли мне потратить 50 долларов на консольную игру или отдать их на благотворительность? Должен ли я организовывать сбор средств в размере 700 000 долларов для оплаты одной трансплантации костного мозга или использовать эти же деньги для приобретения противомоскитных сеток и предотвратить смерть примерно 200 детей от малярии?

Тем не менее, многие отводят взгляд от обилия неприятных моральных компромиссов в реальности — многие даже гордятся тем, что отводят взгляд. Исследования показывают, что люди проводят различие между «священными ценностями», такими как человеческие жизни, и «не священными ценностями», такими как деньги. И когда вы пытаетесь обменять священную ценность на не священную, субъекты выражают большое негодование. (И порой они даже хотят покарать человека, который сделал такое предложение.)

У меня есть любимая история про то, как команда исследователей, которые оценивают эффективность разных проектов, подсчитала стоимость спасённой жизни и порекомендовала правительству реализовать этот проект, поскольку он был экономически эффективным. Правительственное агентство отклонило отчёт, потому что, по их словам, нельзя оценивать человеческую жизнь в долларах. После отклонения отчёта агентство решило не использовать такой способ оценки.

Обмен сакральной ценности на не сакральную кажется действительно ужасным. Просто умножать одно на другое было бы слишком хладнокровно – для этого надо быть очень рациональным… Но альтруизм — это не тёплое неопределённое чувство, которое вы испытываете, будучи альтруистом. Если вы делаете это ради духовной выгоды, это не что иное, как эгоизм. Но главное — это помочь другим, какими бы ни были средства. Так что заткнись и умножай!

И если вам кажется, что в этой максимизации есть жестокость, подобная обнажённому мечу Фемиды или горению Солнца, — если кажется, что посреди этой рациональности есть небольшое холодное пламя…

Ну, тогда есть способ, который может помочь почувствовать себя лучше. Но он не сработает.

Я скажу вот что: если вы отбросите своё сожаление по поводу духовного удовлетворения, которое могли бы получить — и будете искренне следовать Пути, не думая, что вас обманут, — если вы посвятите себя рациональности, не сдерживая себя, то увидите, что рациональность даст вам взамен.

Но это сработает, только если вы не будете говорить себе: «Мне было бы лучше, если бы я был менее рациональным». Разве вам грустно оттого, что у вас есть возможность реально помогать людям? Вы не можете полностью раскрыть свой потенциал, если считаете свой дар тяжёлой ношей.

Перевод: 
Юлия Литовченко, Саша Бережной
Номер в книге "Рациональность: от ИИ до зомби": 
285
Оцените качество перевода: 
Средняя оценка: 4.6 (14 votes)

Парадокс Ньюкома: сожалея о своей рациональности

Элиезер Юдковский

Ниже пойдет речь о, возможно, самой дискуссионной проблеме в истории теории принятия решений — парадоксе Ньюкома:

Сверхразумное существо с другой галактики (будем называть его Омега) прилетает на Землю и приступает к маленькой необычной игре. Омега выбирает человека, ставит перед ним два ящика и скрывается из виду.

Ящик А прозрачен, в нём лежит тысяча долларов.

Ящик Б закрыт и содержит либо миллион долларов, либо ничего.

Вы можете выбрать либо оба ящика, либо только второй.

Интрига же в том, что Омега положил миллион долларов в ящик Б тогда и только тогда, когда он предсказал, что вы возьмете только этот ящик.

До сих пор (на каждом из ста случаев, которые вы смогли пронаблюдать) Омега оказывался прав: каждый, кто брал оба ящика, находил ящик Б пустым и получал только тысячу долларов; каждый, кто брал только ящик Б, обнаруживал в нём миллион. (Будем полагать, что ящик А исчезает в облаке дыма, если вы берете только ящик Б; нельзя взять ящик А уже потом.)

До того, как вы сделаете выбор, Омега уже улетел, чтобы приступить к следующей игре. Ящик Б либо уже пуст, либо уже содержит деньги.

Омега бросает два ящика прямо перед вами и исчезает.

Вы возьмете оба или только ящик Б?

Типичная дискуссия об этой задаче протекает примерно так:

Вася: «Конечно же, я возьму только ящик Б. Лучше выиграть миллион, чем тысячу».

Петя: «Омега уже скрылся. Ящик Б либо уже полон, либо уже пуст. Если он уже пуст, то я получу 1000 долларов, взяв оба ящика, и ничего, если возьму только один. Если ящик Б уже полон, то, если я возьму оба, мне достанется 1 001 000 долларов, а если возьму только Б, то 1 000 000 долларов. В любом случае взять оба ящика лучше, а оставить тысячу долларов хуже, так что я буду действовать рационально и возьму оба ящика».

Вася: «Если ты такой умный, то почему ты такой бедный?»

Петя: «Не моя вина, что Омега решил награждать только иррационально настроенных людей, но мой ход в этой игре уже ничего не изменит».

О парадоксе Ньюкома написаны горы литературы, особенно если считать дилемму заключенного ее частным случаем, каковым она, как правило, является. Например, «Парадоксы рациональности и кооперации» («Paradoxes of Rationality and Cooperation») — издание, в которое входит оригинальная статья Ньюкома.

Я сейчас не буду глубоко погружаться в литературу, но замечу, что преобладающее мнение в современной теории принятия решений гласит, что следует выбрать оба ящика, а Омега просто вознаграждает агентов с нерациональными установками. Эта доминирующая точка зрения берет свое начало из причинной теории принятия решений (в русскоязычных текстах также иногда встречается наименование «каузальная теория принятия решений» — прим. перев.)

Как вам известно, основная причина того, что я пишу в блог, — моя невероятно низкая скорость, если я пытаюсь писать в каком-либо другом формате. Так что я не собираюсь выкладывать здесь мой собственный разбор проблемы Ньюкома. Это была бы слишком долгая история, даже по моим стандартам.

Но даже адепты причинной теории согласны, что если у вас есть силы заранее настроить себя на то, чтобы взять один ящик, то нужно сделать это. Если вы можете «настроиться» до того, как Омега проверит вас, то этим самым вы непосредственно обусловливаете то, что ящик Б не будет пустым.

В моей области деятельности (в построении самоулучшающегося искусственного интеллекта, если кто забыл) это выражается так: если вы построите ИИ, берущий оба ящика в проблеме Ньюкома, то он изменит себя так, чтобы брать один ящик, если сможет заранее предположить, что может столкнуться с такой ситуацией. Агенты, имеющие свободный доступ к своему исходному коду, способны легко настраивать себя заранее.

Что, если вы ожидаете, что можете встретиться с этой задачей, но не знаете точную формулировку? Тогда вам необходимо изменить себя, сделав свои установки такими, какие в общем случае обеспечивают высокий выигрыш в подобных задачах.

Но в чем же заключаются установки, нацеленные на хорошее решение задач вроде этой? Можно ли описать их формально?

Да, но, пытаясь сделать это, я осознаю, что начинаю писать небольшую книгу. (И не самую важную книгу, которую пишу, так что я откладываю это. Моя низкая скорость письма — настоящая отрава моего существования.) В теории, над которой я работаю, больше, как мне кажется, положительных моментов, не считая даже того, что она лучше решает задачи вроде проблемы Ньюкома. Работа могла бы стать неплохой диссертацией, если бы я нашел кого-нибудь, кто принял бы у меня ее в таком качестве. Но стряхнуть пыль с этого проекта и снова взяться за него заняло бы слишком много времени и сил; я бы не смог оправдать такой расход времени, учитывая скорость, с которой я сейчас пишу книги.

Я говорю это потому, что общепринятая позиция гласит: «Словесные аргументы в пользу того, чтобы брать один ящик, отыскать легко, но трудно разработать хорошую теорию, которая этого требует». Нужна последовательная математическая теория принятия решений, указывающая на необходимость брать только один ящик и не порождающая парадоксов в других задачах. Я понимаю, как можно это сделать, и взялся за разработку таковой, но скорость, с которой я пишу крупные работы, так низка, что я не могу ее опубликовать. Верите ли вы или нет, но это так.

Несмотря на всё это, я бы хотел изложить некоторые собственные мотивы к решению этой проблемы, причины, побудившие меня отыскивать новую теорию, — потому что они разъясняют мое базовое отношение к вопросу рациональности (даже если я не смогу рассказать саму теорию, к созданию которой эти мотивы побуждают).

Во-первых, в основном, по существу и прежде всего:

Рациональные агенты должны ВЫИГРЫВАТЬ.

Не поймите меня превратно, подумав, что я говорю о штампе «голливудской рациональности», который утверждает, что рационалисты должны быть эгоистичными или недальновидными. Если ваша функция полезности включает в себя благо других, то их счастье — ваш выигрыш. Если она подразумевает сроки в миллионы лет, то выигрывать следует на протяжении геологических эр.

Но, так или иначе, речь о том, чтобы ВЫИГРЫВАТЬ. Не упустите мысли: ВЫИГРЫВАТЬ.

Сейчас некоторые сторонники причинной теории принятия решений заявляют, что брать оба ящика — значит, делать всё возможное, чтобы выиграть, и нельзя ничем им помочь, если их наказывает Предсказатель, благоволя же иррационалам. Скоро я скажу, что думаю об этой точке зрения, но для начала я хочу провести черту между теоретиками причинного принятия решений, которые убеждены, что брать оба ящика — по-настоящему делать все возможное для выигрыша, и теми, кто считает, что брать два ящика осмысленно или рационально, но этот разумный выбор приводит в случае этой игры к предсказуемому проигрышу. Вокруг нас чертова прорва народу думает, что рациональность ожидаемо проигрывает при решении разнообразных задач; это, к тому же, часть штампа «голливудской рациональности», в котором Кирк предсказуемо превосходит Спока.

Теперь давайте вернемся к призу, которым Омега награждает иррационалов. Я в состоянии вообразить сверхсущество, которое платит только людям, рожденным с определенным геном, не обращая внимания на их выбор. Я могу представить инопланетянина, награждающего игроков, в чьи мозги врезан конкретный алгоритм «Опишите по-английски возможные варианты и выберите последний в алфавитном порядке», но не отдающего приза тем, кто выбирает тот же вариант, но по другой причине. Однако Омега награждает тех, кто выбрал только ящик Б, вне зависимости от того, каким именно способом они пришли к этому решению, и именно поэтому я не куплюсь на то, что Омега благоволит иррационалам. Его не заботит, следуете ли вы или нет определенному образцу мышления; всё, что его интересует, — ваше предсказанное решение.

Можно выбрать любой алгоритм обоснования, какой нам нравится, и мы будем награждены или наказаны только в зависимости от выбора, произведенного алгоритмом, независимо от всего прочего: Омегу интересует только то, куда мы приходим, а не как попадаем туда.

Я говорю именно с той точки зрения, которая гласит, что Природа не заботится о нашем алгоритме. Это открывает возможность следовать Пути выигрывания и освобождает нас от какого-либо отдельного ритуала мышления (кроме наших убеждений, что это работает). На каждое хитрое правило найдется свой контрпример, кроме правила выигрывания.

Как сказал Миямото Мусаси (это стоит повторить)1:

Согласно воззрениям школы Ити, ты можешь победить с длинным клинком, но можешь выиграть бой и с коротким. Иначе говоря, дух школы Ити — дух победы, вне зависимости от вида
оружия и его длины.

(Другой пример: Мак-Ги утверждал, что мы обязаны ограничивать применение функций полезности, или же мы бесчисленное количество раз будем оказываться жертвой собственной непоследовательности. Но у функции полезности нет исключений. Я люблю жизнь без ограничений, без верхней границы: нет такого конечного значения N, что я предпочту шанс в 80,0001 % прожить N лет по сравнению с вероятностью в 0,0001 % прожить гуголплекс лет и восьмидесяти процентной вероятностью жить вечно. Это достаточное условие, чтобы можно было сказать, что моя функция полезности неограниченна. Так что мне просто надо сформулировать, как оптимизировать её для данных норм поведения. Вы не можете сказать мне «Для начала ты, прежде всего, должен приспособиться к определённому ритуалу мышления, а затем, если приспособишься, тебе нужно изменить свои нормы поведения, чтобы избежать непоследовательности». Откажитесь от схемы, ведущей к поражению; не меняйте определение выигрыша. Иное значило бы, что вы предпочитаете тысячу долларов миллиону, так что в свете проблемы Ньюкома ваша новая схема мышления не будет выглядеть плохо.)

«Но», — скажет сторонник причинной теории принятия решений, — «чтобы взять только один ящик, вам нужно сначала как-то поверить, что ваш выбор способен повлиять на то, пуст ящик Б или полон; это неразумно! Омега уже улетел! Это физически невозможно!»

Неразумно? Я рационалист; какое мне дело до того, быть ли неразумным? Я не собираюсь подчиняться определенной схеме мышления. Я буду брать только ящик Б не потому, что убежден, что мой выбор влияет на содержимое ящика, хотя даже Омега улетел. Я могу просто… взять только ящик Б.

Я собираюсь предложить альтернативный способ мышления, который рассчитает необходимость этого решения, но поля слишком узки для него; однако мне нет нужды предъявлять его вам. Дело не в том, чтобы обладать изящной теорией выигрывания, — дело в том, чтобы выигрывать; красота формулировок — побочный эффект.

Или посмотрим на это с другой стороны: вместо того, чтобы начинать с определения разумного решения, а затем задаваться вопросом, получит ли этот «разумный» агент много денег, взгляните лучше на агента, который получил много денег, затем разработайте теорию, в соответствии с которой агент будет оставаться с наибольшим количеством денег, и, уже отталкиваясь от этой теории, попробуйте вывести определение «разумности». «Разумность» может быть лишь ярлыком тех решений, которые соответствуют нашему текущему ритуалу мышления, — как ещё можно определить, является ли что-либо «разумным» или нет?

Джеймс Джойс, «Основы причинной теории решений»:

У Рэйчел был потрясающий ответ на вопрос, почему она не обогатилась (в этой игре — прим. перев.) «Я не выиграла много денег потому», — говорила она, — «что я не такой неудачник, который, как думают психологи, откажется от денег. Я просто не такая как ты, Ирен. Учитывая то, что я знаю, что не обладаю характером неудачника, и то, что психологи знают, что я такова, было бы разумным думать, что миллион не достанется мне. Тысяча долларов была наибольшей суммой, что я собиралась получить вне зависимости от того, что предприму. Поэтому единственная разумная вещь — взять их».

Ирен, возможно, захочет настоять на своем, спросив: «Но ведь ты не хочешь быть такой как я, Рэйчел? Ты не хочешь быть тем, кто проигрывает?» Существует некая склонность к тому, чтобы думать, что Рэйчел, преданная причинной теории принятия решений, должна ответить на этот вопрос отрицательно, и это кажется очевидно ошибочным (учитывая, что, будь она «неудачницей», как Ирен, она бы смогла получить больший приз). Это не тот случай. Рэйчел может и должна признать, что она хочет быть более похожей на Ирен. «Сейчас это было бы для меня лучше», — может допустить она, — «будь я неудачницей». И здесь Ирен восклицает: «Ага, ты признаешь это! В конце концов, не так уж умно было попытаться взять все деньги». К несчастью для Ирен, ее заключение вовсе не следует из того, что сказала Рэйчел. Та терпеливо разъяснит, что желать быть «неудачником» в задаче Ньюкома не противоречит тому, что необходимо брать тысячу долларов независимо от своего характера. Когда Рэйчел хочет быть такой же «неудачницей», как Ирен, она желает получить такие же возможности, а не одобрить ее выбор.

И я должен сказать, что это всеобщий принцип рациональности (конечно, в том смысле, как я определяю это понятие) — то, что вы никогда в конце концов не обнаружите себя завидующим чужому выбору самому по себе. Вы можете позавидовать чьим-нибудь генам, если бы Омега награждал за гены или именно они создавали бы установки, благополучные для выигрыша. Однако Рэйчел в вышеприведенной цитате завидует выбору Ирен и только выбору безотносительно от того, какой алгоритм та использовала, чтобы сделать его. Рэйчел стремится лишь к тому, чтобы настроить себя для принятия другого решения.

Невозможно заявлять, что вы более рациональны, чем кто-то другой, и в то же время завидовать тому, какой выбор сделал этот другой, если речь только о выборе. Просто сделайте то, чему завидуете.

Я всё пытаюсь сказать, что рациональность — это Путь выигрывания, но апологеты причинной теории принятия решений настаивают, что брать оба ящика и значит на самом деле выиграть, потому что невозможно поступить лучшим образом, оставив тысячу долларов… даже если те, кто берет один ящик, уходят с эксперимента с большей суммой. Остерегайтесь доводов такого рода каждый раз, когда вы замечаете за собой то, что определяете как «победителя» кого-то отличного от агента, с улыбкой взирающего с вершины гигантской пирамиды полезности.

Да, во многих мысленных экспериментах агенты имеют фору с самого начала, но если, скажем, нужно решить, прыгать ли со скалы, то нужно остерегаться того, чтобы определить агентов, воздерживающихся от прыжка, как заранее обладающих несправедливым преимуществом, — что, якобы, они подло отказались прыгать. В этом месте вы незаметно переопределяете понятие «выигрывать», называя им следование определенному ритуалу мышления. Следите за деньгами!

Другой способ взглянуть на проблему: столкнувшись с задачей Ньюкома, вы бы захотели приложить заметные усилия, чтобы понять разумное обоснование того, что брать только ящик Б рационально и осмысленно (ведь если аргумент такого рода существует, вам следует взять только ящик Б, и вы найдете его полным денег)? Потратите ли вы несколько дополнительных часов, обдумывая эту проблему, если уверены, что в конце концов убедите себя, что брать только ящик Б — рациональный выбор? В этом положении достаточно странно находиться. Обычно работа рациональности заключается в том, чтобы разъяснить, какой выбор является наилучшим, а не отыскать обоснование к убеждению, что какое-либо конкретное решение оптимально.

Возможно, слишком легко говорить, что вы «следуете» стратегии «брать оба ящика» в проблеме Ньюкома и что это «разумный» выбор, пока деньги не будут действительно перед вами. Возможно, вы просто нечувствительны к абстрактным проблемам такого рода. А что, если у вашей дочери заболевание, смертельное в 90% случаев, и в ящике А сыворотка, которая вылечит ее с вероятностью в 20%, а ящик Б может содержать лекарство, успешно действующее с шансами в 95%? Что, если к Земле мчится астероид, и ящик А содержит систему защиты, действующую 10% времени, а в ящике Б может быть орудие, которое защищало бы Землю постоянно?

Будь это так, вы бы заметили, что вас просто соблазняет сделать необоснованный выбор?

Что, если ставка, которую может принести ящик Б, — это что-то такое, что вы не можете оставить? Что-то безгранично более важное для вас, нежели следовать тому, что выглядит разумным? Если вам совершенно нужно выиграть — действительно выиграть, а не просто определить себя как победителя?

Захотели бы вы всем своим нутром, чтобы «разумным» решением оказалось взять только ящик Б?

Если да, то, возможно, сейчас настало время обновить ваше определение разумности.

Предполагая себя рационалистом, вы не должны обнаруживать, что завидуете решениям-самим-по-себе, принятым предполагаемыми не-рационалистами: ваше решение может быть любым. Когда вы обнаружите себя в подобном положении, вам не следует упрекать другого в том, что он не смог подстроиться к вашему пониманию разумности. Вам нужно осознать, что вы шли по ложному пути.

То же самое верно, и если вы заметите, что продолжаете хранить веру в отдельный след «обоснованного» убеждения в противовес убеждению, которые выглядит по-настоящему истинным: либо вы недопонимаете «обоснованность», либо ваше представление об истинности второго убеждения ошибочно.

Невозможно одновременно определить «рациональность» и как Путь выигрывания, и как некую конкретную систему в рамках байесовской теории вероятностей и теории принятия решений. Но это тот самый аргумент, который я привожу в первую очередь, и мораль моего совета — верить в байесианство, в то, что законы, ведущие к выигрышу, имеют достаточный доказательный аппарат, чтобы быть точной наукой. Если же когда-нибудь окажется, что байесовские принципы терпят неудачу, систематически решая некую задачу плохо (по сравнению с решениями других теорий), то байесианство придётся оставить на свалке истории. «Рациональность» — просто ярлык, который я использую для своих представлений о Пути выигрывания — пути агента, улыбающегося с вершины гигантской пирамиды полезности. Сейчас этим ярлыком помечено байесовское искусство.

Я понимаю, что эта статья — еще не окончательный нокаут для причинной теории принятия решений (для этого нужна была бы целая книга или диссертация), но я надеюсь, что смог частично проиллюстрировать свое подсознательное отношение к понятию «рациональность».

Вы не должны обнаруживать себя отделяющим «выгрышный» выбор от «разумного» или «обоснованное» убеждение от «наиболее правдоподобного».

Я рассказал, почему я называю «рациональными» свои убеждения в зависимости от их точности и выигрышности, но не для того, чтобы указать на словесное обоснование или на конкретные стратегии, приводящие к определенному успеху; не для того, чтобы назвать этим словом то, что доказуемо логически, наглядно для других или выглядит «обоснованным».

Как сказал Миямото Мусаси2:

«Помни, когда в твоих руках меч — ты должен поразить противника, чего бы тебе это ни стоило. Когда ты парируешь удар, наносишь его, делаешь выпад, отбиваешь клинок или касаешься атакующего меча противника, ты должен сразить противника тем же движением. Достигай цели. Если ты будешь думать только о блокировании ударов, выпадах и касаниях, ты не сможешь действительно достать врага».

  • 1. Перевод взят с сайта lib.ru, к сожалению, переводчик там не указан. — Прим.редактора.
  • 2. Перевод также взят с сайта lib.ru. — Прим.редактора.
Перевод: 
Quilfe, alekseykarnachev, ogmennesket
Номер в книге "Рациональность: от ИИ до зомби": 
291
Оцените качество перевода: 
Средняя оценка: 4.9 (11 votes)

Двенадцать добродетелей рационалиста

Элиезер Юдковский

Перевод взят из блога Данилы Сентябова.

Иллюстрация Александры Сентябовой

Первая добродетель — любопытство. Жгучий зуд любопытства влечёт человека к истине вернее торжественных клятв и волевых решений.

Подобно пламени, что рождается из топлива и искры, любопытство возникает там, где незнание сходится с желанием познать. Взгляни на двух искателей. Один уверен, будто уже знает истину. Другой же, зная о своём невежестве, не спешит его устранить. Ни один из них не достигнет многого на Пути, ибо без цели и направления всякое умение бесполезно.

Любопытство стремится уничтожить само себя: нет любопытства, что не жаждет удовлетворения. Величие загадки в том, чтобы быть разгаданной и утратить загадочность. Остерегайся тех, кто признаёт собственное незнание со смирением: есть время признавать невежество и время избавляться от него.

Вторая добродетель — отречение. Сказано: «Что может быть разрушено истиной, не заслуживает спасения»1. Не избегай встречи с тем, что может уничтожить твои убеждения. Мысль, которую ты в ужасе гонишь из сознания, связывает тебя и заключает в рабство. Без страха бросай свои убеждения в огонь испытаний.

Очищай своё сердце от эмоций, растущих из ложных убеждений и пестуй в нём те, что основаны на истине. Если к лицу твоему подносят холодное железо, а ты веришь, что оно раскалено, Путь не приемлет твоего страха. Если к лицу твоему подносят раскалённое железо, а ты веришь, что оно холодно, Путь не приемлет твоего спокойствия.

Источником твоих эмоций должна быть истина, а не ложь. Повторяй снова и снова: «Если железо раскалено, я желаю верить, что оно раскалено. Если железо холодно, я желаю верить, что оно холодно». Легко привязаться к убеждениям, рождающим эмоции; остерегайся таких привязанностей, ибо они могут увести тебя от истины.

Третья добродетель — лёгкость. Доверься ветру фактических подтверждений. Позволь ему нести тебя как осенний лист, не выбирая направления. Опасайся идти против этого ветра. В безнадёжной борьбе ты всё равно будешь отступать пядь за пядью, на каждом шагу ощущая горечь поражения.

Сдавайся истине так быстро, как только сможешь. Заметив за собой малейшую попытку сопротивления, сдавайся. Сдавайся в тот самый миг, когда уловишь, с какой стороны ветер фактов дует против тебя. Верность убеждениям — порок, а не добродетель. Предавай свои убеждения при первой же встрече с более сильным противником.

Если факты для тебя — досадная помеха, ты будешь искать повода освободиться от них. Но итогом станет не свобода, а рабство на цепи у произвольных убеждений. Сверяясь с фактами, отвергай ошибочные убеждения, а не наоборот.

Нельзя составить карту города, сидя дома и накрывшись одеялом с головой. Надо обойти город с широко раскрытыми глазами и честно нанести на бумагу то, что видишь. Если ты, видя город нечётко, трактуешь неопределённость по собственной прихоти, смещая линии левее, правее, выше и ниже — чем ты лучше того, кто рисует город дома под одеялом?

Четвёртая добродетель — беспристрастность. Тот, кто желает верить, спрашивает себя: «Позволяют ли фактические подтверждения верить?». Тот, кто не желает, спрашивает: «Принуждают ли фактические подтверждения верить?». Остерегайся предпочтений, что будут усыплять твой скептицизм по отношению к приятным для тебя утверждениям и пробуждать его при столкновении с неприятными.

Взгляни на того, кто уделяет внимание лишь фактам, говорящим в пользу его взглядов. Чем больше его знания — тем дальше он уходит от истины. Другой избирателен в своей критике. С инквизиторским рвением расчленяя в поисках ошибок одни рассуждения, к другим он проявляет снисхождение. Чем больше он знает о логических ошибках и когнитивных искажениях — тем крепче броня, которой он прикрывает своё невежество.

Если некто начал рассуждение с того, что написал внизу страницы: «Таким образом, цвет неба — зелёный!», уже не важно, что он напишет выше: конечный вывод записан и он либо истинный, либо ложный. Ловкость в аргументации — не рациональность, а рационализация. Интеллект бесполезен для человечества, если используется лишь в борьбе с самим собой.

Рассматривая гипотезу за гипотезой, выслушай, что каждая из них может сказать в свою защиту. Но помни: ты не гипотеза, а судья. Не позволяй себе выступать в защиту какой‑либо стороны: тот, кто уже выбрал сторону, не нуждается в рассуждении. Если ты знаешь пункт назначения, ты уже на месте.

Пятая добродетель — спор. Желающий упасть должен сперва отвергнуть своих друзей, чтобы те не могли помочь ему. Сказав с мудрой улыбкой «я не буду спорить», глупец отвергает помощь и самоустраняется от общественных усилий.

В споре стремись к абсолютной искренности. Это будет полезно не только окружающим, но и тебе. Часть ума, что рождает лукавство, искажая твои слова, искажает и твои собственные мысли.

Не думай, что делаешь одолжение собеседнику, соглашаясь с ним. Если его аргументы сильнее твоих, это он сделал одолжение, поделившись ими. Прими его дар с благодарностью.

Не путай справедливость ко всем сторонам с поиском компромисса. Истина не раздаётся поровну между сторонами перед началом спора. Беспристрастно рассмотрев аргументы, стремись к истине, а не к равному учёту всех мнений.

Нельзя приблизиться к истине с помощью кулаков и оскорблений. Стремись провести эксперимент, чтобы сама реальность рассудила, кто прав.

Шестая добродетель — эмпиризм. Корни знания — в наблюдениях, а плоды его — точные предсказания. Где то дерево, что растёт без корней? Где то дерево, что питает нас без плодов?

Если дерево падает в безлюдном лесу, слышен ли звук его падения? Один скажет: «Да, слышен, ибо падение создаёт звуковые волны в воздухе». Другой возразит: «Нет, не слышен, ибо нет мозга, в аудиторной области которого возбудились бы нейроны». Хотя один говорит «да», а другой «нет», их спор лишён содержания, ведь ожидаемый ими опыт взаимодействия с лесом совпадает.

Не думай о том, каких убеждений придерживаться. Думай об экспериментальных результатах, которые ты ожидаешь увидеть. Никогда не теряй из виду реальный предмет спора: различия в ожидаемых наблюдениях. Не позволяй увести себя в сторону и перескочить на обсуждение личностей спорщиков или бравирование силой своей рациональности.

Сказано о спортивных матчах: «Губят не ошибки в выполнении замысловатых техник. Губит элементарное: потеря мяча из виду»2. Не позволяй словам ослепить себя. Очисти свои мысли от слов и останутся лишь ожидаемые результаты наблюдений.

Седьмая добродетель — простота. Сказано: «Совершенство достигается не тогда, когда нечего добавить, а тогда, когда нечего отнять»3. Ищи простоты в убеждениях, проектах, планах и доказательствах.

Чем сложнее высказанное тобой убеждение, чем больше в нём деталей, тем больше вероятность ошибки, дискредитирующей всю конструкцию. Каждое отдельное утверждение утяжеляет твою ношу, и если эту ношу можно облегчить — сделай это! Нет такой соломины, которая не могла бы сломать тебе спину.

Самая надёжная шестерня в машине — та, которой там нет. Чем меньше паутина — тем она прочнее. Цепь из тысячи шагов приведёт тебя к верному выводу лишь тогда, когда каждый шаг безошибочен. Но если ошибка в самом начале — куда ты придёшь? Математикам известно, что целые горы праведных деяний не искупят единственного греха. Не ослабляй внимания ни на секунду.

Восьмая добродетель — скромность. Быть скромным — значит заранее принимать меры в ожидании провала своих планов. Тот, кто признаёт способность ошибаться, но никак не пытается её скомпенсировать, движим гордыней, а не скромностью. Демонстрируя напускное смирение, он упивается собственной мнимой добродетелью.

Кто воистину скромен? Тот, кто неустанно готовит себя к самым катастрофическим ошибкам в собственных убеждениях и расчётах.

Мышление миллионов людей настолько слабо, что даже начинающий рационалист легко побеждает их в споре, преисполняясь гордыней и переоценивая собственные умения. Нет славы в том, чтобы быть выше других. Лучший физик Древней Греции не смог бы рассчитать траекторию падающего яблока. Вселенная не подбирает нам задачи по способностям и оценивает по абсолютной шкале. Предельные усилия лучших из нас могут быть недостаточны для удовлетворительной оценки.

Не успокаивай себя тем, что другие справляются хуже. Сравнивая себя с другими, ты не увидишь искажений, общих для всех людей. Быть человеком — значит совершить десять тысяч ошибок. Нет в мире того, кто был бы достаточно хорош. Совершенство недостижимо.

Девятая добродетель — перфекционизм. Чем больше ошибок ты исправишь в себе, тем больше заметишь новых. Чем тише станет твой ум, тем лучше ты будешь различать шумы и помехи.

Замечая ошибки своего ума, знай — это признаки того, что тебе следует искать выход на следующий уровень. Примиряясь со своими ошибками, вместо того, чтобы корректировать себя, ты не сможешь выйти на новый уровень и не увидишь другие, менее явные ошибки. В любом искусстве и ремесле тот, кто не ищет совершенства, остановится, не сделав и первых двух шагов.

Недостижимость совершенства не оправдывает того, кто отказался к нему стремиться. Поставь для себя самую высокую планку, которую только можешь вообразить и без устали думай, как поднять её ещё выше. Не довольствуйся почти правильным ответом. Всегда ищи абсолютно правильный, точный ответ.

Десятая добродетель — точность. Пусть некто скажет: искомое число лежит в пределах от 1 до 100. Другой скажет: число лежит между 40 и 50. Если искомое — 42, оба будут правы. Но второе предсказание полезнее и способно выдержать более строгую проверку.

Что верно для одного яблока, может быть неверно для другого. О конкретном яблоке можно сказать больше, чем обо всех яблоках мира. Узкое утверждение режет глубже, подобно кромке лезвия.

Составляя карту, стремись не к широте мышления, а к его узости. Помни, что Путь — точное искусство. Пусть твоё движение к истине будет не шагом, но танцем. Каждое движение этого танца должно быть выверено до миллиметра. Каждый новый факт должен изменить твои убеждения на строго определённую величину.

Какова эта величина? Чтобы определить её, изучи теорию вероятностей. Даже если ты не можешь сделать точный расчет, понимание лежащей в основе математики даст уверенность в том, что движения твоего танца точны и в них нет места для личных прихотей и капризов.

Одиннадцатая добродетель — эрудиция. Изучай науки и впитывай в себя их силу. Пусть эта сила станет твоей собственной! Каждая область знаний, поглощённая тобой, делает тебя больше. Если ты проглотишь достаточно наук, зазоры между ними сократятся и твои знания обретут цельность. Взрасти в себе ненасытность и станешь обширнее гор!

Важнее всего усвоить математику и науки, связанные с рациональностью: эволюционную психологию, психологию эвристик и когнитивных искажений, социальную психологию, теорию вероятностей, теорию принятия решений. Это необходимо, но недостаточно. Искусство должно иметь внешнюю цель, иначе оно вырождается в бесконечную рекурсию.

***

Превыше этих одиннадцати добродетелей та, что не имеет имени.

Сказано4:

Подняв меч, думай о том, как поразить им противника, чего бы это ни стоило. Атакуя и парируя, нанося удары и делая выпады, рази противника тем же движением.

Не отклоняйся от цели. Думая о том, как атаковать и парировать, как наносить удары и делать выпады, ты не поразишь противника. Прежде всего думай о том, как каждым своим движением пройти через защиту противника и рассечь его плоть.

Каждым движением своего ума стремись рассечь ошибочные суждения и достигнуть истины. Прежде всего думай о том, чтобы сделать свою карту точным отражением территории. Если истинный ответ не получен, что толку в том, что твои действия были корректны?

Как улучшить своё понимание рациональности? Постоянно повторяя «надо быть рациональнее», можно лишь укрепить ошибочное понимание. Кто‑то считает, что рационально верить словам Великого Учителя. Допустим, Великий Учитель сказал: «Цвет неба — зелёный!», однако, подняв глаза, ты видишь голубой. Если ты думаешь «пусть небо и выглядит голубым, но Путь рационалиста в том, чтобы верить словам Учителя», ты лишаешься возможности обнаружить свою ошибку.

Не спрашивай себя, пристало ли Идущему делать то или другое. Спрашивай, какого цвета небо — зелёного или голубого. Говорящий о Пути слишком много не уйдёт по нему далеко.

Можно попытаться дать имена высшим принципам: «карта, отражающая территорию», «опыт успехов и неудач» или «байесианская теория принятия решений». Но всякое описание может быть некорректным. Как осознать свою ошибку? Сравнивая свои описания с тем, чему нет имени и нет описания.

Годами практикуя техники рациональности, подчиняя свой ум строжайшей дисциплине и самоограничениям, можно надеяться однажды заметить проблеск истинного содержания. К тебе придёт понимание, что все техники суть одна техника. Ты будешь двигаться свободно и верно, не чувствуя ограничений, ставших частью твоей натуры. Сказано: «Познав силу природы, ты движешься в едином ритме со Вселенной. Твои выпады естественны и точны. Ты поражаешь противника, как дышишь. В этом Путь Пустоты»5.

Вот двенадцать добродетелей рационалиста:

любопытство, отречение, лёгкость, беспристрастность, спор, эмпиризм, простота, скромность, перфекционизм, точность, эрудиция и безымянная пустота.

Обсудить перевод можно в комментариях к оригинальной записи.

Перевод: 
Данила Сентябов
Оцените качество перевода: 
Средняя оценка: 3.4 (477 votes)

Стать сильнее

Автор: 
Элиезер Юдковский

Взросление Юдковского

Эта цепочка подробно описывает эволюцию иррационального убеждения. В качестве примера используется история из жизни самого автора.

Примечание редактора: Цепочка не переведена на русский язык.

Автор: 
Элиезер Юдковский

Бросая вызов сложностям

В этой цепочке ставятся вопросы: что нужно, чтобы решать по-настоящему сложные задачи? Местами эти вопросы выходят за пределы эпистемической рациональности.

Примечание редактора: Значительная часть этой цепочки не переведена на русский язык.

Автор: 
Элиезер Юдковский

Цуёку наритаи («Хочу стать сильней!»)

Элиезер Юдковский

В ортодоксальном иудаизме есть следующий афоризм: «Если древние были как ангелы, то мы – как люди, а если древние были как люди, то мы – как ослы», что вытекает из убеждения в том, что всё иудейское право было получено на горе Синай Моисеем напрямую от Господа. Действительно, вряд ли возможно получить новое галахическое знание, проведя какой-нибудь эксперимент; получить это знание можно лишь из уст кого-то, кто уже им владеет — потому что он услышал его от кого-то ещё, кто получил его непосредственно от Господа. Поскольку вся информация исходит из единственного, давно замолкшего источника, она может лишь искажаться в процессе передачи от поколения к поколению.

Поэтому слова современных раввинов не могут перекрывать слова древних раввинов. Ползающие животные обычно не кошерны, но позволительно съесть червяка, обнаруженного внутри яблока: древние считали, что червь самопроизвольно возник внутри яблока, и поэтому является его частью. Современный раввин не имеет права сказать «Понятно, что древние раввины разбирались в биологии также, как пингвины в математической логике. Завет отвергнут!». Современный раввин не может знать какой-либо галахический принцип, неведомый древним раввинам, потому что это означает обрыв цепочки древних раввинов, передающих друг другу ответы, полученные на горе Синай. Знание происходит от авторитета, и поэтому оно не нарастает, а лишь утрачивается с течением времени.

Я услышал эту поговорку про ангелов и ослов, когда я был в младших классах религиозной школы. Я был слишком молод для того, чтобы быть полностью созревшим атеистом, но я всё равно подумал про себя: «Тора теряет знание с каждым поколением. Наука приобретает знание с каждым поколением. Неважно, с чего они начали, рано или поздно наука обгонит Тору».

Очень важно, чтобы прогресс не исчезал. До тех пор, пока вы продолжаете двигаться вперёд, вы достигнете своей цели; но если вы остановитесь, то вы никогда не достигнете её.

«Цуёку наритаи» это на японском. «Цуёку» значит «сильный»; «нару» это «становиться», а форма «наритаи» это «хочу стать». Вместе это значит «Я хочу стать сильнее» и выражает настроение, ярче звучащее в японских работах, нежели в любой западной литературе, которую я читал. Вы можете сказать это, когда выражаете стремление стать профессиональным игроком в Го — или после того как вы проиграли важный матч, но не сдались — или после того как вы выиграли важный матч, но все еще не на вершине мастерства — или после того как вы стали наилучшим игроком в Го всех времен, но все еще думаете, что можете играть еще лучше. Это и есть «Цуёку наритаи», воля к трансцендентности.

«Цуёку наритаи» это движущая сила моего эссе «Правильное использование смирения», в котором я сравнивал студента, который смиренно проверяет дважды свой тест по математике и студента который скромно говорит «Но как мы можем действительно знать? Не имеет значения как много раз я проверю, я никогда не буду уверен абсолютно». Студент, который проверяет дважды свои ответы «хочет стать сильнее»; он реагирует на возможный внутренний недостаток посредством деятельности при помощи которой он может исправить недостаток, а не отступлением.

Каждый год, в праздник под названием Йом Киппур, ортодоксальный иудей читает литанию, которая начинается словами «ашамну, багадну, газалну, дибарну дофи» и похожим образом проходит через весь древнееврейский алфавит: «Мы грешили, мы предавали, мы грабили, мы злословили».

С каждым словом вы бьёте себя в грудь в знак раскаяния. Никто не может освободить вас от этого ритуала: нет такого правила, что, если вы ухитрились прожить весь год, ничего ни разу ни украв, то вы можете пропустить слово «газалну» и не бить себя в грудь в этот раз. Это нарушит чувство принадлежности к празднику Йом Киппур, который посвящён исповеданию грехов, а не избеганию грехов, чтобы исчезла причина в них исповедоваться.

Тот же символизм есть и в «Ашамну». Молитва не оканчивается словами «но это было в этом году, а в следующем году я добьюсь большего».

«Ашамну» носит удивительное сходство с представлением о том, что основная идея пути рациональности — это бить себя кулаком в грудь и говорить: «Все мы предвзяты, все мы иррациональны, все мы невежественны, все мы сверхуверенны, все мы плохо откалиброваны, все мы страдаем от искажений».

Замечательно. Теперь расскажите, как вы собираетесь стать менее предвзятым, более осведомлённым, менее сверхуверенным, лучше откалиброванным.

Мне вспоминается старая еврейская шутка: в день Йом Киппур раввин неожиданно оказывается охвачен непривычно сильным чувством вины. Он падает ниц и сквозь слезы восклицает: «Всевышний, я ничто пред ликом Твоим!». Волна вины накатывает и на кантора, который также вскрикивает: «Всевышний, я ничто пред ликом Твоим!». Увидев это, уборщик в дальнем углу синагоги падает на колени и восклицает: «Всевышний, я ничто пред ликом Твоим!». А затем раввин незаметно толкает кантора локтём в бок и шепчет: «Ты только посмотри, кто возомнил себя ничем».

Не гордитесь своим признанием в том, что вы тоже страдаете от искажений, и не упивайтесь знанием о своих изъянах. Этот принцип сродни принципу о том, что не надо гордиться признанием в своём невежестве; ибо если черпать в невежестве гордость, то будет нелегко поступиться своим невежеством, когда к вам постучатся свидетельства. Точно также и с изъянами: не надо внутренне восхищаться своей честностью и наблюдательностью, позволившей вам их признать; ликовать следует тогда, когда поводов для признания стало меньше.

В противном случае, когда кто-то идет к нам с планом «коррекции» влияния, мы огрызнемся: «Ты думаешь поставить себя над нами?» Мы печально покачаем головами и скажем: «У тебя, должно быть, низкое самосознание».

Никогда не говорите, что вы так же порочны, как и я, до тех пор, пока вы не можете сказать мне, что планируете с этим делать. После этого у вас все еще остается много недостатков, но дело не в этом; важно «делать лучше», двигаться вперед, делать шаг за шагом вперед. Цуёку наритаи!

Перевод: 
BT, Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
304
Оцените качество перевода: 
Средняя оценка: 4.4 (20 votes)

Цуёку против уравнительского инстинкта

Элиезер Юдковский

В племенах охотников и собирателей обычно сильно развит уравнительный принцип (по крайней мере, если вы мужчина) — принцип всемогущего племенного вождя чаще можно найти в аграрных обществах, редко в родоплеменном строе. В большинстве племен, живущих охотой и собирательством, охотник, который приносит больше всего добычи, будет стараться приуменьшить свои заслуги.

Возможно, если ваша стартовая точка находится ниже среднего уровня, вы можете улучшать себя без опаски выделиться из толпы. Однако рано или поздно, если вы стремитесь сделать всё как можно лучше, ваша цель превзойдет средний уровень.

Если вы не можете признаться себе, что вы действуете лучше остальных — или если вы стыдитесь желания действовать лучше остальных — тогда средний уровень навсегда станет для вас непреодолимым барьером, местом, где вы прекращаете свое развитие. И что насчёт тех людей, что находятся ниже среднего уровня? Вы смеете сказать, что желаете быть лучше них? Ну вы и гордец!

Возможно не слишком нормально гордиться собой так, словно вы лучше вообще всех. Но лично я обнаружил, что это полезный мотиватор, несмотря на мои принципы, а я хочу использовать всю полезную мотивацию, которую смогу получить. Возможно этот вид соревнования представляет собой игру с нулевой суммой, наподобие го; это не значит, что мы должны отменить данную человеческую активность, если людям это нравится и представляет собой нечто интересное.

Но, в любом случае, конечно же это плохо — стыдиться делать всё как можно лучше.

И кстати, жизнь нельзя оценить графиком. Стремление к трансцендентности не имеет точки, за которой это стремление становится хуже; и гонка, в которой нет финиша, не имеет и золотых или серебряных медалей. Просто бегите как можно быстрее изо всех сил, не беспокоясь, что вы можете оставить позади других. (Но будьте настороже: если вы откажетесь думать об этой возможности, однажды так и произойдёт. Если вы игнорируете последствия, они могут настигнуть вас.)

Рано или поздно, если твой путь ведет к истине, вы захотите убрать те недостатки, которые большинство людей не убирают. Рано или поздно, если ваши усилия приносят хоть какие-то плоды, вы обнаружите, что у вас меньше слабых мест.

Возможно вы найдете мудрым преуменьшить свои достижения, даже если вы и в самом деле преуспели. Люди могут простить гол, но вряд ли обрадуются выигрышу вами всей игры. Вы возможно найдете проще, быстрее и больше всего подходящим публично принизить свои достоинства, постараться сделать вид, что вы такой же несовершенный, что и все. Ну, до тех пор, пока всем уже не станет ясно, что это не так. Это может быть забавно — гордо показывать свою скромность так, что каждый знает как много вы достигли, о чем можете скромно умолчать.

Но не позволяйте этому стать концом вашего путешествия. Даже если вы только шепчете это себе под нос, продолжайте шептать: цуёку, цуёку! Сильнее, сильнее!

А потом установите себе цель ещё выше. Вот истинный смысл осознания, что вы всё ещё несовершенны (пусть теперь и немного меньше). Он заключается в том, чтобы всегда достигать больше, безо всякого стыда.

Цуёку наритаи! Я буду всегда бежать настолько быстро, насколько могу, даже если я вырвусь вперед, я продолжу бежать; и кто-то однажды превзойдёт меня; но даже хотя я останусь позади, я всегда буду бежать изо всех сил.

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
305
Оцените качество перевода: 
Средняя оценка: 4.9 (15 votes)

Пытаясь пытаться

Элиезер Юдковский

Нет! Не надо пытаться! Делай. Или не делай. Не надо пытаться.

Йода

Когда-то давно я думал, что есть другой пример глубокой (великой) мудрости, а этот глуповат. Успех — не простое действие. Вы не можете просто решить выиграть путем достаточно трудного выбора. Не существует плана, который бы всегда работал.

Но Йода оказался мудрее, чем я сначала себе представил.

Первая элементарная техника эпистемологии — не глубокая, зато дешевая — отделять цитату от того, что она обозначает. Разговор о снеге не то же самое, что разговор о «снеге». Когда я использую слово «снег» без кавычек, я имею в виду снег; а когда я использую слово « „снег“ » в кавычках, я веду разговор именно о самом слове. Вам нужно сменить тип мышления, перейти в режим цитирования, чтобы вести разговор о своих убеждениях. Обычно, мы говорим о реальности.

Если кто-то говорит «я хочу нажать на выключатель», тогда по умолчанию, он имеет в виду то, что он собирается попробовать нажать на выключатель. Он собирается выстроить план, который обещает путем последовательностей действий привести его к нужному состоянию выключателя; и осуществить данный план.

Не существует плана, который работал бы с бесконечной определенностью. Так что по умолчанию, когда вы говорите о намерении достигнуть цели, вы не подразумеваете, что ваш план точно и совершенно приведет вас только к этой возможности. Но когда вы говорите «я собираюсь нажать на выключатель», вы пытаетесь нажать на выключатель — не пытаетесь достигнуть 97.2% вероятности нажатия на выключатель.

Так что же подразумевается, когда кто-либо говорит «Я собираюсь нажать на выключатель?»

Ну, в разговорной речи «я собираюсь нажать на выключатель» и «я собираюсь попробовать нажать на выключатель» означают более или менее одно и то же, за исключением того, что последнее выражение подразумевает возможность неудачи. Вот почему я изначально обиделся на Йоду за кажущееся отрицание возможности. Ну уж извините.

Наибольший жизненный вызов состоит в том, чтобы удерживать себя на достаточно высоком уровне. Я могу рассказать об этом принципе позже, поскольку это линза, через которую вы можете видеть многие-но-не-все личные дилеммы — «На каком уровне я держу себя? Достаточно ли он высок?»

Поскольку большинство жизненных неудач заключаются в том, что вы держите себя на слишком низком уровне, вам нужно опасаться требовать от себя слишком мало — ставить цели, что легко достижимы.

Часто там, где успешно сделать вещь очень трудно, попробовать это сделать куда легче.

Что легче — построить успешный стартап или попробовать построить успешный стартап? Заработать миллион долларов или попробовать заработать миллион долларов?

Так что если «я собираюсь нажать на выключатель» означает по умолчанию что вы попытаетесь нажать на выключатель — то есть, вы собираетесь следовать плану, который обещает привести к желаемому результату если не со стопроцентной вероятностью, то по крайней мере с наибольшей вероятностью, которую вы можете обеспечить -

  • тогда «я намерен «попытаться нажать» на выключатель» означает что вы хотите попробовать «попробовать нажать на выключатель», то есть вы собираетесь попробовать достичь цели-состояния «имею план который может помочь нажать на выключатель».

Теперь, если бы был самомодифицирующийся ИИ, о котором мы уже говорили, преобразование, которое мы только что выполниили, должно было закончится отраженным равновесием — ИИ планировал бы операции по планированию.

Но когда мы имеем дело с людьми, они могут удовлетвориться планом, который не особо вероятно гарантирует успех. Момент, что план должен максимизировать вашу вероятность успеха, теряется из виду. Куда легче убедить себя что мы «максимизировали нашу вероятность выиграть» нежели убедить себя что мы выиграем.

Почти любое усилие должно служить для убеждения нас, что мы «сделали все что могли», если попытки сделать все, что мы можем, это все, что мы пытаемся сделать.

«Вы спросили себя, что вы можете сделать в великих событиях, которые начинаются сейчас, и ответили себе, что ничего. Но из-за того, что вы страдаете, вы неправильно поставили вопрос…вместо того, чтобы спрашивать, что вы можете сделать, вы должны были спросить, что нужно сделать».

- Стивен Браст, Дороги Мертвых

Когда вы спрашиваете «что я могу сделать?», вы пытаетесь сделать все, что можете. Много ли вы можете? Это все, что не вызывает у вас ни малейшего затруднения. Это все, что вы можете сделать с деньгами у вас в кошельке минус деньги на ланч. Что вы можете сделать с этими ресурсами, может не дать вам очень хорошие шансы на выигрыш. Но это «все что вы можете сделать» и таким образом вы действуете обоснованно, так?

Но что нужно сделать? Может быть то, что нужно сделать, требует в три раза больше, нежели все ваши сбережения за всю жизнь, и вы должны сделать это или потерпите неудачу.

Так что старание иметь «максимизированную вероятность успеха» — в противовес стараниям достичь успеха — является существенно более низким барьером. Вы можете иметь «максимизированную вероятность успеха» используя только деньги у вас в кармане, хотя на самом деле претендовать на победу не сможете.

Хотите попробовать сделать миллион долларов? Купите лотерейный билет. Ваши шансы на выигрыш не очень хороши, но вы попытались, чего и хотели. На деле, вы сделали все, что в ваших силах — ведь у вас был всего лишь доллар после обеда. Максимизация шансов на достижение цели, используя доступные ресурсы: разве это не интеллект?

И только когда вы хотите, превыше всего остального, на самом деле нажать на выключатель — без цитирования и без утешительных призов за попытки — тогда вы на самом деле приложите усилия, чтобы действительно максимизировать вероятность.

Но если все, что вы хотите, это «максимизировать вероятность успеха при доступных ресурсах», тогда наиболее легкий путь сделать это — просто убедить себя в том, что это уже сделано. Самый первый план, который вы придумаете, уже будет служить как «максимизирующий» — если нужно, то вы можете придумать несколько худших планов, чтобы доказать оптимальность первого. И все крошечные ресурсы, которые вы вложите в этот план, будут гордо называться «доступными ресурсами». Не забудьте заодно поздравить себя с тем, что вы выложились на все 100%!

Не старайтесь изо всех сил. Либо побеждайте, либо проигрывайте. Но не старайтесь.

Перевод: 
Remlin, Anna-Karmen
Номер в книге "Рациональность: от ИИ до зомби": 
306
Оцените качество перевода: 
Средняя оценка: 3.7 (Всего оценок: 31)

Используй вторую попытку, Люк

Элиезер Юдковский

«Если кто-то хочет провалиться, он везде найдет препятствия» — Джон Маккарти.

Первый раз я увидел 4-6 «Звездные войны», еще когда был совсем юн. Мне было семь или девять, где-то так. Я плохо помню то время, однако я запомнил Люка Скайуокера как крутого джедайского парня.

Представьте мой ужас и разочарование, когда я годы спустя пересмотрел всю сагу и понял, что Люк был подростком-нытиком.

Я упоминаю это потому, что вчера я просматривал на Ютьюбе источник цитаты Йоды: «Делай или не делай. Не пытайся».

О. Мой. Ктулху.

Наряду с клипом с Ютьюба я представляю вам малоизвестную сценку, которая произошла на съемках фильма между директором картины Джорджем Лукасом и Марком Хамиллом, который играл Люка:

Люк: Хорошо, я попробую.

Йода: Нет! Не пробуй. Делай. Или не делай. Но не пробуй.

Люк поднимает руку и его корабль медленно начинает всплывать из воды. Глаза Йоды загораются интересом — но корабль снова тонет.

Марк Хамилл: «Эээ, Джордж…»

Джордж Лукас: «Что?»

Марк: «Так… дальше по тексту я говорю, что не могу поднять корабль, так как он слишком большой».

Джордж: «Ну да».

Марк: «А разве Люк не попробует еще раз?»

Джордж: «Нет. Люк сдается и садится рядом с Йодой…»

Марк: «И это герой, который собирается драться со всей Империей? Смотри, это могло бы произойти, когда он был только подростком, однако теперь он уже тренированный джедай. В последнем фильме он взорвал Звезду Смерти. Он должен показать хотя бы немного силы воли».

Джордж: «Нет. Ты сдаешься. И тогда Йода читает тебе лекцию, ты говоришь, что это невозможно. Тебе понятно?»

Марк: «Невозможно? Он что, на калькуляторе это высчитал, что ли? Корабль уже начал подниматься! Это прямая демонстрация того, что это осуществимо! Люк потерял концентрацию на секунду и корабль начал тонуть обратно — и после этого он сразу же сдается и говорит, что это невозможно? Не говоря уже о том, что Йода, который уже восемьсот лет занимается этим, прямо говорит ему, что это возможно…»

Джордж: «И тогда ты уходишь».

Марк: «Это его долбаный корабль! Если он оставит его в болоте, то остаток своей никчемной жизни он проведет на Дагобе! Он не может уйти! Смотри, давай просто перед следующей сценой вставим слова „месяц спустя“, Люк все еще стоит перед болотом, в тысячный раз стараясь вытащить корабль…»

Джордж: «Нет».

Марк: «Ну ладно! Покажем как он солнечным днем стоит с напряженной рукой и говорит „Невозможно“. На самом деле, он же должен был попытаться снова, когда отдохнул бы…»

Джордж: «Нет».

Марк: «Хотя бы пять долбаных минут! Пять минут перед тем, как он сдастся!»

Джордж: «Я не хочу снимать пять минут про то, как корабль качается в болоте наподобие игрушки для ванной».

Марк: «Святые угодники! Если этот жалкий неудачник зовется мастером Силы, тогда все в Галактике должны были бы владеть ею! Люди становились бы джедаями потому, что это было бы проще, чем закончить среднюю школу».

Джордж: «Слушай, ты актер. А я сценарист. Так что просто говори, что у тебя написано в сценарии».

Марк: «Люди на это не купятся».

Джордж: «Купятся, уж поверь».

Марк: «Они плюнут и уйдут из кинотеатра посреди фильма».

Джордж: «Они будут сидеть и кивать, не замечая ничего необычного. Ты просто не понимаешь человеческую натуру. Люди не будут стараться даже пять минут перед тем, как сдаться, пусть даже на кону будет судьба всего человечества».

Перевод: 
Remlin
Номер в книге "Рациональность: от ИИ до зомби": 
307
Оцените качество перевода: 
Средняя оценка: 4.3 (36 votes)

Приложи экстраординарные усилия

Элиезер Юдковский

«Кроме того, следует хорошо понимать, что, не имея намерения превзойти остальных в любом деле, какое бы ты ни делал, ты едва ли сможешь достичь даже среднего уровня».
— Дайдодзи Юдзан, «Будосёсинсю»1

«В важных вопросах „серьёзное“ усилие приносит лишь посредственные результаты. Каждый раз, когда мы принимаемся за что-то, по-настоящему стоящее, наши усилия должны принимать размеры колоссальные, как если бы на кону стояла наша жизнь! Только лишь эти исключительные усилия — усилия, вынуждающие нас выйти за границы того, что мы считали возможным, — только они обеспечивают победу в битве и успех в жизненных начинаниях».
— Масаюки Симабукуро, «Мерцающая сталь: Осваивая Эйсин-Рю»2

«…“серьезное“ усилие приносит лишь посредственные результаты» — я такое видел очень часто. Самого малого усилия хватает нам, чтобы убедиться: мы сделали всё возможное.

Есть добродетель, стоящая на уровень выше принципа «Цуёку наритаи» («Хочу стать сильнее»). Изначально иссёкенмей подразумевала преданность, которую обещает самурай взамен на свое положение; в иероглифическом написании участвуют слова «жизнь» и «земля». Со временем термин эволюционировал, и теперь означает «предпринять отчаянное усилие»: сделай максимально усердную и сфокусированную попытку, как если бы от этого зависела твоя жизнь. Это одна из составляющих бусидо — учения о правильном поведении воина, причём не только в бою. Я также встречал варианты написания «иссё кенмей» и «иссёу кенмей». Один из источников указывает, что первое — это максимальное усилие, приложенное в каком-то конкретном начинании, в то время как второе — жизненный принцип.

Я стараюсь не восхвалять Восток слишком сильно, потому что наши знания о восточной культуре очень избирательны. Но по крайней мере в некоторых отношениях японская культура обгоняет американскую. Наличие в повседневном языке ёмкой фразы, означающей «сделать отчаянное усилие, будто на кону стоит твоя жизнь» — это один из примеров такого превосходства. Что-нибудь подобное могут сказать родители своим детям перед экзаменами в вузе. Но не воспринимайте это как дешёвое лицемерие, как если бы то же самое сказал американский родитель. В Японии к экзаменам относятся очень серьёзно.

Время от времени, я слышу вопрос: почему люди, называющие себя «рационалистами» не выглядят такими уж преуспевающими в жизни. Исходя из личного опыта, ответ довольно простой: нужно колоссально много рациональности, перед тем, как прекратишь раз за разом наступать на совершенно идиотские грабли.

Как я уже упоминал ранее: Роберт Ауман, нобелевский лауреат, доказавший, что байесианцы с одинаковыми исходными данными не могут согласиться не соглашаться, — верующий ортодоксальный иудей. Он отлично понимает всю математику, стоящую за теорией вероятности, но для его спасения этого не достаточно. Что же ещё нужно? Изучить эвристики и когнитивные искажения? Социальную психологию? Эволюционную психологию? Да, все это несомненно пригодится, но самое необходимое это иссёкенмей, отчаянное усилие быть рациональным — на более высоком уровне, чем Роберт Ауман сейчас.

Порой я всерьёз задумываюсь, не начать ли втюхивать рациональность в Японии, а не в Штатах. Впрочем, несмотря на старательных студентов, Япония всё же не превосходит Америку в области науки. Японцы не правят миром, хотя в 80-х многие считали, что будут (что привело к финансовому пузырю). Но почему?

На Западе есть поговорка: «Колесо не скрипит, — его и не смажут».

В Японии есть соответствующая: «Торчащий гвоздь по шляпке получает».

Едва ли я буду оригинален, если скажу: предпринимательство, готовность рисковать и идти против толпы, — всё это характерно скорее для Запада, а не для Востока. И раз уж японские учёные ещё не превзошли американских, перечисленные качества как минимум уравновешивают культуру отчаянных усилий.

Любой, кто соберёт волю в кулак на тридцать секунд, сможет сделать отчаянное усилие и поднять непривычно большой вес. Но что если нужно поднять грузовик? Тогда отчаянных усилий уже не хватит. Чтобы преуспеть понадобится сделать что-то экстраординарное. Возможно придётся сделать что-то, чему не учили в школе. Что-то, чего от вас совершенно не ожидают, и могут откровенно не понять. Возможно придётся сменить привычный распорядок, посмотреть в лицо трудностям, для которых у вас ещё не заготовлено ментальных программ, и обойти Систему.

Такие действия не входят в понятие иссёкенмей. Если бы входили — Япония выглядела бы совершенно по-другому.

Поэтому давайте далее различать «готовность предпринять отчаянные усилия» и «готовность предпринять экстраординарные усилия».

Скажу больше: вторая добродетель выше первой.

Она также и более опасна. Если вы приложите отчаянное усилие, чтобы поднять большой вес, используя всю силу и без страховки, вы можете порвать мышцу. Получите травму, возможно она не заживёт. Но если наперекосяк пойдёт творческий план, вы можете, например, взорвать грузовик вместе с ни в чём неповинными прохожими. Представьте двух предпринимателей: один использует отчаянные меры, чтобы получить доход, потому что иначе он станет банкротом, а другой пускается на экстраординарные меры, чтобы скрыть факт хищения, за который он может сесть. Борьба с системой — не всегда правое дело.

Однажды в гости к моему младшему брату пришёл его друг и, они захотели поиграть в игру, — я совершенно не помню в какую, но помню, что у неё были сложные и хорошо прописанные правила. Друг захотел изменить их, просто потому что «играть по оригинальным правилам скучно». Я сказал ему: «Не нарушай правила чисто из духа противоречия. Даже если ты нарушаешь правила, когда у тебя есть невероятно веская причина, ты можешь получить неприятности, преследующие тебя до конца жизни».

Однако я всё равно считаю, что нам следует больше уважать добродетель «экстраординарных усилий». Я потерял счёт, сколько раз мне говорили: «Бессмысленно работать над дружелюбным ИИ, потому что первые ИИ будут разработаны мега-корпорациями и будут заточены на максимизацию прибыли», «Бессмысленно работать над дружелюбным ИИ, потому что первые ИИ будут созданы военными в качестве оружия». А я стою в это время и думаю: «Неужели им вообще не приходит в голову мысль, что возможно стоит предпринять что-нибудь, чтобы предотвратить ожидаемый исход?» Само собой, у нас с ними разные исходные представления насчёт всей этой затеи с ИИ, но если бы я верил в то же, что и они, я бы не пожимал флегматично плечами.

Или как мне порой говорят: «Тебе стоит пойти в колледж и получить степень магистра, затем защитить докторскую. Потом напиши много-много статей на ординарные темы — иначе учёные и инвесторы к тебе не прислушаются». Предположим, я получу степень бакалавра, но даже после этого мне придётся приостановить мою основную деятельность как минимум на десять лет. Всего лишь для того, чтобы сделать всё обычным, нормальным, стандартным способом. И я думаю: «Они действительно считают, что человечество сможет выжить, если абсолютно все будут поступать исключительно обычным, нормальным, стандартным способом?»

Я не настолько глуп, чтобы строить планы, зависящие от готовности большинства людей, или даже 10% от всех людей, не то что сделать, но хотя бы подумать о чём-то, выходящем за границы их зоны комфорта. По этой причине я предпочитаю стратегию профинансированного частно и сделанного в гараже «мозга в коробке». Чтобы получить финансирование такого предприятия, нужно лишь, чтобы мизерная доля от шести миллиардов человечества задумалась над нетривиальным вопросом больше, чем на 5 секунд. Из всех испытаний, посылаемых нам природой, это выглядит извращённо справедливым: жизнь и смерть человеческой расы целиком зависит от того, сможем ли мы собрать несколько людей, способных сделать что-то хоть немного экстраординарное. Цена неудачи непропорциональна обстоятельствам, впрочем, другие испытания природы гораздо хуже — ведь у природы нет никакой справедливости. Серьёзно, из шести миллиардов человек должны найтись хотя бы несколько, кто способен хоть какое-то время думать за гранью привычного.

И даже если не вдаваться глубоко в этот спор, я до сих пор поражаюсь, как часто даже единственная необходимость экстраординарного усилия безоговорочно воспринимается как совершенно непреодолимое препятствие.

Да, «будь как можно более проще» — порой полезная эвристика. Да, риски действительно суммируются. Но иногда нужно идти навстречу неприятностям. Риски экстраординарного понимать, конечно, надо. Но также нужно понимать цену обыденности: не всегда есть, что терять.

Представляя будущее, многие люди видят не очень радостную картину. Но при этом им не приходит в голову попробовать что-нибудь поменять. Или же их устраивает будущее с тем, что мне представляется привкусом грусти или потери, и поэтому им не интересно, можно ли добиться большего. Грусть для них вполне обыденна.

Как однажды сказал улыбающийся человек: «Всё это — часть плана».

  • 1. Цитируется по сайту readgo.ru, автора перевода установить пока не удалось. — Прим.перев.
  • 2. Книга на русский язык не переводилась. Автор ссылается на издание: Masayuki Shimabukuro, Flashing Steel: Mastering Eishin-Ryu Swordsmanship (Frog Books, 1995). — Прим.перев.
Перевод: 
Евгений Миньков, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
309
Оцените качество перевода: 
Средняя оценка: 4.5 (22 votes)

Создание сообщества

В этой цепочке обсуждаются группы, посвящённые рациональности, и групповая рациональность. Поднимаются следующие вопросы:

  • Можно ли научиться рациональности? Можно ли обучать других рациональности?
  • Если да, насколько большого прогресса можно достичь?

Как мы можем убедиться, что наши действия действительно дают прирост рациональности? Как определить правильную причину, если этот прирост действительно есть?

  • Какие нормы в сообществе сделают процесс самоулучшения более лёгким?
  • Можем ли мы эффективно сотрудничать при работе над крупномасштабными задачами, не жертвуя свободой мысли?

И самое главное: Что мы упустили? Что будет в следующих учебниках по рациональности, которые заменят этот текст? Как улучшить существующий стиль и проверить существующие рекомендации? Что можно добавить? В каких направлениях можно развиваться?

Примечание редактора: Значительная часть этой цепочки не переведена на русский язык.

Автор: 
Элиезер Юдковский

Общий уровень здравомыслия

Элиезер Юдковский

Перефразирую «Байесианца с чёрным поясом»1: за каждой впечатляющей, драматичной ошибкой кроется история о более важной и менее драматичной ошибке, без которой первая не случилась бы.

Даже если завтра повсюду в мире магическим образом исчезнут все следы религии, то, хотя жизнь многих людей и улучшится, нам всё ещё будет очень далеко до решения серьёзных проблем со здравомыслием, из-за которых вообще существует религия.

У нас есть веская причина потратить часть наших усилий на устранение религии, ведь религия — это непосредственная проблема. Однако религия исполняет и роль задохнувшейся канарейки в угольной шахте. Религия — это знак, симптом большей проблемы, которая никуда не денется просто потому, что кто-то лишится своей религии.

Рассмотрим мысленный эксперимент: чему вы могли бы научить других людей, с условиями, что это правда, это полезная широко применимая рационалистская техника, это не касается религии напрямую, но это могло бы подтолкнуть людей от религии отказаться? Даже так: представьте, что вы опросите всех ваших студентов через пять лет, чтобы посмотреть, как много из них откажется от религии по сравнению с контрольной группой. Но если вы хотя бы чуть-чуть попытаетесь сражаться с религией напрямую, вы провалите эксперимент. На уроках вам запрещается упоминать религию и любое религиозные утверждения, вам даже нельзя никак намекать на них. Все ваши примеры должны основываться на ситуациях из реального мира и не иметь ничего общего с религией.

Если мы не сражаемся с религией напрямую, чему мы научим людей, чтобы поднять «общий уровень здравомыслия» до уровня, при котором религия исчезнет сама собой?

Ниже перечислены несколько тем, которые я уже освещал. У меня, впрочем, встречались упоминания религии, но от них можно легко избавиться.

Но давайте посмотрим с другой стороны.

Предположим, что мы знаем учёного, который всё ещё религиозен: не важно, имеем мы дело с активным участием в религиозной жизни или с неясными случайными высказываниями о чем-то «духовном».

Теперь мы знаем, что этот человек не понимает во всех тонкостях…

  • …что есть свидетельство и почему;

  • …бритву Оккама;

  • …что два правила выше вытекают из законов и причинно-следственного механизма, благодаря которым мозг составляет карты, и не отменяются, когда речь идёт о зубных феях;

  • …чем отличаются настоящие ответы от затычек для любопытства;

  • …как переосмысливать что-либо, вместо того, чтобы просто повторять услышанное;

  • …некоторые основные направления науки за последние три тысячи лет;

  • …сложные искусства обновления убеждений на основе новых свидетельств и отказа от устаревших убеждений;

  • …эпистемологию начального уровня;

  • …честности перед собой продвинутого уровня;

  • …и так далее, и так далее, и тому подобное.

Если посмотреть на этот список, то видно, что изучить все его составляющие не так уж сложно. Быстрое введение во всё это (кроме натуралистической метаэтики) могло бы оказаться… обязательным предметом второго курса?

Но даже некоторые нобелевские лауреаты не прошли такой курс! Пример Ричарда Смолли может показаться некорректным, но есть и более пугающий пример Роберта Ауманна.

И их нельзя считать отдельными исключениями. Если бы все их коллеги прошли бы такой курс, они бы поправили Смолли и Ауманна (дружески отвели бы в сторонку и объяснили базовые принципы) или относились бы к ним достаточно настороженно и не дали бы Нобелевскую премию. Ведь если рассуждать реалистично (пусть это и кажется несправедливым), разве получил бы Нобелевскую премию учёный, публично рассуждающий о существовании Санта Клауса?

Именно об этом и говорит нам мёртвая канарейка, религия: общий уровень здравомыслия сейчас смехотворно низок. Даже в научной элите.

Если мы выкинем мёртвую гниющую канарейку, то в нашей шахте станет пахнуть чуть лучше, но уровень здравомыслия значительно не вырастет.

Я не планирую критиковать движение нео-атеистов. Вред, нанесённый религией, — это очевидная существующая опасность, или даже продолжающееся бедствие. Сражение против непосредственных последствий религии приоритетней использования её в качестве канарейки или экспериментального индикатора. Но даже если Докинз, Деннет, Харрис и Хитченс каким-то образом окончательно победят даже в самых далёких уголках человеческого мира, настоящая работа рационалистов только начнётся.

  • 1. Юдковский ссылается на блог «Black Belt Bayesian», который уже не существует. — Прим.перев.
Перевод: 
Kelegorm, Alaric
Номер в книге "Рациональность: от ИИ до зомби": 
312
Оцените качество перевода: 
Средняя оценка: 3.7 (34 votes)

Чувство, что большее возможно

Элиезер Юдковский

Когда учишь людей теме, которую ты пометил как «рациональность», помогает, если они уже заинтересованы в ней. (Есть менее прямые пути учить людей составлять карты, отражающие территорию, или оптимизировать реальность в соответствии с их ценностями, но я выбрал именно явный метод.)

И когда люди объясняют, почему они не заинтересованы в рациональности, одна из самых частых причин — это что-то вроде: «Я знаю парочку рациональных людей и они не кажутся мне более счастливыми»

О ком они думают? Наверное, об объективистах или о ком-то похожем. Может, об обычном учёном, которого они знают. Или обычном атеисте.

Это далеко не самая суть рациональности, как я и говорил прежде.

Даже если ограничиться людьми, способными вывести формулу Байеса — что уже вычёркивает 98% вышеназванных — это всё ещё не суть рациональности. В смысле, это же довольно базовая теорема.

С самого начала у меня было чувство, что должна существовать какая-то дисциплина познания, искусство мышления, навык, делающий людей заметно компетентнее, мощнее; эквивалент Поднятия Уровня в Крутости (English).

Но когда я смотрю на окружающий мир, я не вижу этого. Иногда я замечаю намёк, эхо того, что должно быть возможно, когда читаю творчество Робина Доуса, Даниэла Гилберта, Туби и Космидес1. Отдельные маститые учёные-психологи, которым далеко не всё равно — настолько не всё равно, что, мне кажется, их коллеги чувствуют себя неудобно, ведь не круто заботиться о чём-то настолько сильно. Они уловили ритм, единство, пронизывающее их аргументы —

Но даже это… всё ещё не самая суть рациональности.

Даже среди тех немногих, кто впечатляет меня отголоском брезжущей внутренней мощи, я не думаю, что их мастерство рациональности может сравниться со, скажем, мастерством математики Джона Конвэя2. Базовое знание, которое мы привлекаем к построению нашего понимания — если извлечь только части, которые мы использовали, а не всё, что было необходимо изучить, чтобы отыскать их — не сравнимо по величине со всем тем, что профессиональный инженер-атомщик знает про строение ядерных реакторов. Наверное, оно даже не сравнится с тем, что обычный инженер знает про мосты. Мы практикуем наши навыки способами, которые выучили постфактум; однако, эта практика и близко не стояла с тренировочным режимом олимпийского бегуна или даже игрока в теннис средней лиги.

И корень этой проблемы, как я подозреваю, это то, что мы ещё не собрались вместе и не систематизировали наши навыки. Нам пришлось создавать их постфактум, и есть верхний предел, как много один человек может сделать, даже если он может привлечь работу, проделанную в других научных областях.

Основное препятствие, сбивающее нас с правильного пути, — это сложность тестирования результатов тренировочных программ, следовательно мы не можем так просто получить методы, основанные на экспериментальных результатах. Я напишу больше на эту тему, потому что мне кажется, что распознание успешных методов и отделение их от провальных — важная, блокирующее дальнейшее развитие проблема.

Существуют эксперименты, исследующие балансирующие поправки для исправления отдельных когнитивных искажений, но они больше похожи на «заставь студентов практиковаться час, затем протестируй их через две недели», а не на «проведи половину записавшихся через версию А трёхмесячной тренировочной программы, а половину — через версию Б, а затем проведи исследование через пять лет». Вытекающее из обстоятельств количество усилий подходит для обучения людей, которые Действительно Серьёзны Насчёт Рациональности, но никак для тех, кто Готов Потратить Час Времени Или Около Того.

Дэниэл Бурфут3 замечательно заметил, почему интеллект кажется решающим фактором в рациональности: когда приходится импровизировать с совсем малым багажом знаний и количеством систематической практики, интеллект оказывается на самом важном месте.

Почему «рационалисты» не окружены видимой аурой мощи? Почему они ещё не на самой верхушке любой элиты любого направления, имеющего дело с мышлением? Почему большинство «рационалистов» кажутся обычными людьми, возможно со слегка большим интеллектом, с ещё одной игрушкой в чулане?

Тут можно придумать несколько ответов, но один из них определённо состоит в том, что они практикуются в рациональности намного менее систематично, чем каратист с первым даном — в поединках.

Я не ухожу от критики. Я не бейцукай (English), потому что есть граница того, как много Искусства можно создать в одиночку и как сильно можно полагаться на умозрительные заключения без экспериментально выявленной статистики. Я знаю о единственном использовании рациональности под названием «редукционизм запутывающих знаний». Об этом я спрашивал свой мозг, это он мне дал. Есть и другие искусства, я думаю, которые могла бы включить зрелая рационалистская тренировочная программа, которые сделали бы меня сильнее, счастливее и эффективнее. Если бы я только мог пройти через стандартизированную тренировочную программу, собирая сливки с методов обучения, экспериментально подтверждённых, как эффективные. Но моя жизнь не вместит ещё один огромный сфокусированный поток усилий, который я вложил в моё под-искусство рациональности, создавая его с нуля.

Я считаю себя в чём-то лучше каратиста с первым даном, но в чём-то и хуже. Я могу пробить кирпич и уже работаю над сталью, при том, что моя конечная цель — адамантий. Но у меня весьма приблизительное понимание того, как следует бить, блокировать или бросать в уличном бою.

Почему есть школы боевых искусств, но нет рационалистских додзе? (Этот вопрос был первым в моём первом посте в блоге.) Разве бить важнее чем думать?

Нет, но гораздо легче проверить, ударил ли ты кого-то или нет. Это часть обучения, важная часть.

Но что ещё более важно, есть люди, которые хотят бить, которые следуют идее, что должно быть систематизированное искусство сражения, которое сделает обучающегося заметно более мощным бойцом, со скоростью и изяществом за пределом возможностей не практикующихся. Они идут в школу, которая обещает научить их этому. И эта школа существует, потому что давным-давно у каких-то людей было чувство, что большее возможно. Эти люди собрались вместе, поделились между собой техниками, практиковались вместе, формализовали знания и в конце-концов разработали Систематизированное Искусство Боя. Они добились так много потому что считали, что должны быть круты, и были готовы вложить усилия.

Сейчас они добились чего-то стоящего этим стремлением, в отличие от тысячи других стремящихся к крутости, потому что могли сказать, ударили они цель или нет; это дало возможность школам регулярно соревноваться друг с другом в реалистичных соревнованиях с явно определёнными победителями.

Но до всего этого было стремление, желание стать сильнее, чувство, что большее возможно. Видение скорости, силы и грации, которой они ещё не обладали, но могли бы обладать, если бы вложили уйму работы, которая позволила бы им систематизировать, тренироваться и тестировать.

Почему у нас ещё нет Искусства Рациональности?

В-третьих, потому что современные «рационалисты» имеют проблемы в командной работе: об этом я напишу больше.

Во-вторых, потому что сложно проверить, успешна ли тренировка или какая из двух школ сильнее.

Но во-первых, потому что у людей нет ощущения, что рациональность — это что-то, что должно быть систематизировано, тестируемо и передаваемо, как боевое искусство, что должно включать так же много знания, как и инженерия, чьи суперзвёзды должны практиковаться так же усердно, как и шахматные гроссмейстеры, чьи успешные адепты должны быть окружены видимой аурой крутости.

И обратно, они не оглядываются на отсутствие видимой мощи, и не говорят: «Должно быть, мы делаем что-то не так»

«Рациональность» кажется ещё одним хобби, о котором люди говорят на вечеринках, искусственным разговорным одеянием с немногими или вовсе никакими бонусами; при том не кажется, что этот подход неверен.

  • 1. В оригинале Robyn Dawes, Daniel Gilbert, Tooby & Cosmides. — Прим.перев.
  • 2. В оригинале John Conway. — Прим. перев.
  • 3. В оригинале Daniel Burfoot. — Прим.перев.
Перевод: 
Павел Садовников
Номер в книге "Рациональность: от ИИ до зомби": 
313
Оцените качество перевода: 
Средняя оценка: 4.8 (11 votes)

Эпистемическая порочность

Элиезер Юдковский

Я очень благодарен тому, кто навёл меня на большое эссе Гиллианы Рассел «Эпистемическая порочность в боевых искусствах»1. К сожалению, я не смог найти в своей переписке и комментариях на Overcoming Bias, кто именно это был. Может быть, Анна Саламон?

С галстуками на шеях и в добротных туфлях (дело происходило в Англии) мы выстроились в шеренгу и повторяли его движения — левой, правой, левой, правой — и тогда он сказал, что если мы будем молотить воздух с достаточной самоотдачей ещё года три, то сможем убить быка одним ударом.

Я боготворила мистера Ховарда (хотя я бы скорее умерла, чем сказала бы ему об этом), и поэтому я, худая одиннадцатилетняя девочка, искренне поверила: если я буду упражняться, то к четырнадцати годам смогу убить быка одним ударом.

Рассказ выше иллюстрирует эпистемическую порочность в боевых искусствах, которой и посвящено данное эссе. Хотя слово «порочность»2 обычно означает преднамеренные жестокость и насилие, я буду использовать его в более старомодном значении — обладание пороками.

То, о чём пишет Гиллиана Рассел, удивительно хорошо обобщается на другие случаи. Эпистемическая порочность возникает по следующим причинам:

  • Искусство, додзё и сенсей воспринимаются как что-то святое. «Прийти в додзё с накрашенными ногтями на ногах — всё равно, что заявиться в церковь в мини-юбке и топе… Об изучающих другие стили боевых искусств говорят так, словно бы они исповедуют неправильную веру».
  • Если наставник выделил вас из группы и научил особому приёму, который вы потом отрабатывали двадцать лет, то из-за больших эмоциональных инвестиций вы будете отвергать все вновь появляющиеся подтверждения бесполезности этого приёма.
  • У новеньких нет особого выбора: боевому искусству нельзя научиться по книжке, поэтому ученики вынуждены доверять учителям.
  • Почитание прославленных мастеров прошлого. «Бегуны считают, что нынешние сотрудники Runner’s World3 знают о беге больше, чем все древние греки вместе взятые. И это верно не только для бега или других физических активностей, где история знает своё место. Это верно для любой достаточно разработанной изучаемой области. Физику не будет зазорным сказать, что теории Исаака Ньютона ошибочны…» (Звучит знакомо?)
  • «Мы, мастера боевых искусств, страдаем от особого рода скудности — скудности данных, которая делает наши убеждения труднопроверяемыми… Определить точные силу и угол ломающего шею удара может лишь тот, кто, к несчастью, оказался в настоящей рукопашной битве».
  • «Если нет возможности проверить эффективность техники, то трудно проверить и способы улучшения этой техники. Стоит ли отрабатывать нукитэ4 в воздухе, или это только стимулирует излишнее повторение движения? Неспособность проверить наши методы для драки не позволяет нам тщательно проверять наши методы для тренировок».
  • «Главная проблема не в том, что мы живём в скудности данных. Думаю, и многие уважаемые дисциплины — например, теоретическая физика — живут в такой же скудности. Проблема в том, что мы бедны, но мы продолжаем вести себя так, словно живём в роскоши и можем спокойно позволять себе верить всему, что нам говорят».(+10!)

Мне показалось, что в эссе ещё был запомнившийся мне фрагмент о том, что боевые искусства начинали деградировать после отказа от настоящих боёв — таких, в которых люди всерьёз пытались причинить вред друг другу и иногда кто-то погибал. Впрочем, при повторном прочтении я его не обнаружил.

Во времена боёв насмерть вы бы примерно знали, кто на самом деле настоящие мастера, и какая школа может победить другие.

А затем всё «цивилизовалось» и докатилось до появления на YouTube роликов, в которых предполагаемых чёрных поясов n-ного дана вбивают в землю люди с реальным боевым опытом.

Я слышал об одном по настоящему печальном примере. Некий мастер по-настоящему верил, что может использовать техники ки5. Его ученики в самом деле падали, когда он использовал эти атаки. Да, странный, необычный и пугающий случай самогипноза или чего-то подобного… Но когда этот мастер вышел против скептика, его, разумеется, быстро впечатали в пол.

Истинно сказано, что знание «как не проиграть» часто полезнее знания «как победить». Все вышеупомянутые факторы риска прямо переносятся на любую попытку начать «рациональное додзё». И я спрашиваю вас: что с этим можно сделать?

  • 1. Gillian Russell, “Epistemic Viciousness in the Martial Arts,” in Martial Arts and Philosophy: Beating and Nothingness, ed. Graham Priest and Damon A. Young (Open Court, 2010).
  • 2. В оригинале «viciousness». — Прим.перев.
  • 3. Издаваемый в США журнал о беге Runner’s World — Прим.перев.
  • 4. Техника прямого удара пальцами вперёд в каратэ — Прим.перев.
  • 5. См. например статью Ци в Википедии. — Прим.перев.
Перевод: 
gihh, Alaric, ildaar
Оцените качество перевода: 
Средняя оценка: 5 (8 votes)