Ожидаемая полезность

Материал из Вики LessWrong.ru
Перейти к: навигация, поиск

Ожидаемая полезность некоторого действия, которое может предпринять некоторый агент - это величина математического ожидания прироста функции полезности от выполнения этого действия. Фактически, это оценка того, насколько данное действие будет "полезным" для агента в среднем, с учетом того, что точные последствия его действий не детерминированы, а могут быть различными.

Формальное и неформальное значение[править]

В строгом смысле под ожидаемой полезностью подразумевают именно величину математического ожидания полезности (т.е. сумму/интеграл по всем возможным исходам величины прироста функции полезности для каждого из исходов, взвешенную на байесовскую вероятность реализации именно этого исхода). Такое определение используется при описании формальных агентов (например, идеальный байесовский агент в каждый момент времени выбирает то действие, которое имеет максимальную ожидаемую полезность).

В неформальном смысле люди могут говорить об ожидаемой полезности как о своей интуитивной оценке того, насколько хорошие или плохие последствия, и с какой вероятностью, будут у того или иного действия:

  • "Покупка лотерейного билета имеет отрицательную ожидаемую полезность" означает, что хотя выигрыш (в т.ч. крупный) в лотерее вполне реален, но проигрыш случается гораздо чаще, причем на длинной дистанции (получая то выигрыши, то проигрыши в разных тиражах) большинство участников окажутся скорее в минусе. Конечно, при этом небольшое количество людей могут либо сорвать джек-пот, либо проиграться в пух и прах, почти ни разу не выиграв - но таких будет явное меньшинство.
  • "Мытье рук после прихода с улицы имеет большую ожидаемую полезность" означает, что хотя регулярная покупка мыла требует некоторых не очень крупных финансовых затрат, а сам процесс мытья рук отнимает небольшое количество бесценного времени, но регулярное их мытье надежно защищает от заражения большим числом бактерий, вирусов, грибов и паразитов, а также от попадания в организм чисто химических токсинов; при том, что без мытья рук человек довольно часто заражался бы или получал отравления, что достаточно часто приносило бы ему ощутимый вред, в худшем случае вплоть до летального исхода. Т.е. в этом случае общий баланс затрат и пользы для действия ("помыть руки") оказывается значительно лучше, чем для альтернативного действия ("не помыть руки"), по крайней мере на долгой дистанции.
  • "Получение водительских прав имеет положительную ожидаемую полезность" означает, что, судя по грубым прикидкам, возможность водить автомобиль принесет человеку довольно много пользы (в плане удобства и свободы передвижения; возможно, экономии денег и чисто эстетических ощущений от езды на автомобиле); причем эта польза окупит как финансовые и временные затраты на обучение в автошколе, так и вред от несколько увеличившейся вероятности пострадать в ДТП в течение долгого водительского стажа. Т.е. ожидается, что польза будет достаточно велика, и она перевесит находящиеся на другой чаше весов, во-первых, неизбежные затраты (на обучение вождению, приобретение и обслуживание автомобиля), во-вторых - достаточно маловероятные риски других негативных последствий.

Для некоторых действий можно дать более-менее надежную оценку хотя бы того, будет ли ожидаемая полезность положительной или отрицательной, а также большой или малой (например, зная, что возможная польза будет велика, и наступит с большой вероятностью, а возможный вред - либо сравнительно низок, либо довольно маловероятен). Для других действий получить такую оценку можно на основе некоторой статистики. Для третьих - дать такую оценку очень сложно.

Субъективная природа ожидаемой полезности[править]

Ожидаемая полезность даже в формальном смысле имеет характер субъективной оценки, а не объективной величины. Так, при расчете математического ожидания полезности действия обычно используется байесовская вероятность, которая сама является субъективной величиной (т.к. зависит от того, какую информацию получил агент на основе своего прошлого субъективного опыта).

Субъективность оценки ожидаемой полезности живыми людьми в реальном мире усугубляется еще тремя факторами. Во-первых, люди в принципе не имеют консистентной функции полезности, и не могут дать точной оценки полезности для каждого конкретного исхода. Во-вторых, люди часто не могут представить себе и перечислить все возможные исходы, к которым может привести соответствующее действие. В-третьих, люди довольно плохо считают, особенно в уме, и имеют проблемы с тем, чтобы рассчитать взвешенную сумму полезностей нескольких исходов. Впрочем, неточность формального подхода люди могут до некоторой степени скомпенсировать хорошо откалиброванным навыком интуитивной оценки последствий тех или иных действий.

См. также[править]