Игра Ауманна о согласии

Материал из Вики LessWrong.ru
Перейти к: навигация, поиск

Игра Ауманна — общее название для нескольких игр, вдохновленных применением т. н. «стандартного протокола экономистов» к теореме Ауманна о согласии. Общая суть игр состоит в том, что участники в несколько раундов по очереди называют свои оценки вероятности истинности какого-то факта, каждый раз обновляя эти оценки на основе оценок, озвученных другими участниками в предыдущем раунде.

Вопреки названию, процедура игры не описывается ни теоремой Ауманна, ни «стандартным протоколом». Математическая модель игры или оптимальная стратегия в нее в настоящее время еще не построена.

Игра Стивена Кааса

Игра в том виде, как ее проводил Стивен Каас, начинается с того, что ведущий публикует список из нескольких десятков утверждений, которые могут быть истинны либо ложны (например, «степной мамонт весил больше, чем весит синий кит»). Лучше всего, если никто из участников не знает, истинны ли они.

В комментариях к соответствующей публикации участники оставляют свои честные оценки вероятности (в виде чисел — например, 15 %, 42 %, 99 %) того, что каждое утверждение из списка истинно (одна оценка для каждого утверждения). При этом ничего другого, кроме оценок вероятностей, писать не позволяется (исключение: если непонятна суть вопроса или важные детали, которые повлияли бы на ответ, то можно задавать уточняющие вопросы).

Через некоторое время после своего первого сообщения участник может опубликовать свои обновленные оценки. Очередность ходов не обязана соблюдаться. Каждый игрок может давать оценки несколько раз.

Участникам не разрешается использовать никакие внешние источники, кроме своих собственных знаний, а также оценок вероятностей, оставленных выше другими игроками. Причем предполагается, что именно через публикацию своих оценок вероятностей участники неявным образом обмениваются доступной им информацией, что позволяет каждому из них обновить собственную оценку в следующем раунде.

В идеальном сценарии предполагается, что в конце концов оценки всех участников по каждому событию должны сойтись.

Через некоторое время ведущий публикует правильные ответы. После этого производится подсчет очков для каждого участника (в зачет идет только последнее сообщение от каждого из них). Итоговая сумма для каждого из них равна Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle S=\sum_i 10 \cdot \log_{10}q_i} , где Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle q_i = p_i} если Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle i} -й факт был на самом деле ложным и Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle q_i = 1 - p_i} , если Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle i} -й факт был на самом деле истинным, а Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle p_i}  — оценка вероятности (в диапазоне Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle [0, 1]} ) истинности Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle i} -го факта.

Таким образом, наилучшим результатом будет 0 децибелл; наихудшим — минус бесконечность децибелл. Для участника, который для каждого факта объявляет вероятность Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle p_i = 50 \% = 0.5} , значение Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle q_i} всегда будет равно 0.5; таким образом, его результат за каждый вопрос будет равен приблизительно −3дБ (точнее, −3.01…дБ).

Игра Скотта Гаррабранта

Эта разновидность игры похожа на предыдущую, но имеет ряд отличий.

Игра проводится очно: все игроки присутствуют в одном оффлайн- или онлайн-пространстве одновременно, и обычно ходят с соблюдением очередности. При этом участники должны закончить с текущим вопросом (перестать обновлять свои оценки вероятностей), прежде чем переходить к следующему.

Вместо утверждения, которое может быть истинным или ложным, ведущий задает открытый вопрос; при этом каждому из участников он дает взакрытую один из заранее подготовленных вариантов ответа (например, «Какой город является столицей Австралии?», «Бангкок»/«Сидней»/«Канберра»/«Кальдера»). Известно, что все варианты разные и ровно один из них является верным. Каждый знает только, какой вариант дали именно ему, и не знает вариантов, выданных другим.

Каждый игрок должен давать оценку вероятности того факта, что полученный именно им вариант ответа верен.

В идеальном сценарии предполагается, что в конце концов сумма оценок вероятностей всех участников сойдется к 100 %.

Очки начисляются по следующим правилам (где N — число игроков). Если ответ, полученный участником, был верным, то он получает за этот вопрос Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle 100 \cdot \log_2 (N \cdot p)} очков; если ответ был неверен, то Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle 100 \cdot \log_2 \frac{N}{N-1}\cdot(1-p)} очков.

Участник, который на каждый вопрос всегда дает ответ Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle \frac1N} , будет получать 0 очков.

Игра Ауманна и теорема Ауманна

Оба варианта игры были вдохновлены процедурой применения т. н. «стандартного протокола экономистов», позволяющего всем участникам протокола сформировать друг с другом общее знание о своих оценках вероятностей некоего события A (теорема Ауманна утверждает, что если агентам удастся сформировать общее знание о постериорах события, то эти постериоры будут у них совпадать).

Однако, «стандартный протокол» в приложении к теореме Ауманна является чисто механистичной процедурой, автоматически приводящий к нужному результату, если условия теоремы выполняются. В случае игр Ауманна процесс игры является в большей степени интуитивным, и требует скорее некоторого неформализованного мастерства, нежели строгого следования алгоритму.

В частности, в процессе игры невозможно соблюсти следующие требования:

  • Совпадение приоров игроков (и общее знание об этом);
  • Общее знание, что все игроки являются идеальными байесианцами;
  • Общее знание о характере доступной каждому игроку информации (об их разбиениях на множестве возможных миров).

Кроме того, во втором варианте игры участники называют свои оценки постериоров для разных событий, которые нельзя однозначно конвертировать друг в друга (кроме ситуации, когда участвует ровно два игрока).

Таким образом, в играх Ауманна используется не «стандартный протокол» как таковой (поскольку применение «стандартного протокола» является скорее упражнением на внимательность и подсчет вероятностей, чем игрой); при том что «стандартный протокол» также не является единственным способом обеспечить условия теоремы Ауманна (общее знание агентов о постериорах друг друга).

Эвристики, применимые в игре

Хотя оптимальной стратегии получения максимально возможного числа очков в этой игре не существует, известно несколько эвристик, которые могут быть полезны:

  • Если вы не знаете вообще ничего по существу вопроса, начинайте с оценки 50 % в первом варианте игры и Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle \frac{100\%}{N}} во втором.
  • Если кто-то из участников называет числа, близкие к 0 % или 100 %, то можно предположить, что этот человек достаточно сильно (и обоснованно) уверен в своем мнении; и к этому экспертному мнению стоит прислушаться (в первом варианте игры — сместить свою оценку ближе к озвученной; во втором — повышать/понижать оценку верности своего варианта соответственно). Однако, стоит делать поправку на реальную откалиброванность этого участника (если вы что-то знаете о ней или выяснили по результатам прошлых раундов).

См. также

Статьи по теме

  • The Aumann Game — первый пост Стивена Кааса с описанием правил и самой игрой в комментариях
  • Aumann Agreement Game — описание игры Скотта Гаррабранта, записанное Абрамом Демски