Функция полезности

Материал из Вики LessWrong.ru
Перейти к: навигация, поиск
На эту тему существует тэг на LessWrong.com: Utility Function

Функция полезности - некоторая функция, которая позволяет формализовать предпочтения того или иного агента. Функция полезности задается на множестве различных исходов (состояний мира) и для каждого исхода/мира задает число ("полезность"), определяющее, насколько это состояние мира является желательным для агента. Предполагается, что исходы с большей полезностью, для агента всегда более предпочтительны, чем исходы с меньшей; исходы с равными значениями ФП, для агента предпочтительны в равной степени. Условной единицей измерения ФП является утилон.

Поскольку исходы действий обычно нельзя предсказать наверняка, при совершении выбора рациональные агенты обычно руководствуются ожидаемой полезностью: суммой значений функции полезности для рассматриваемых исходов, взвешенных на вероятности исходов.

Теорема фон Неймана-Моргенштерна[править]

Согласно этой теореме, если поведение некоторого агента удовлетворяет определенным свойствам, то для этого агента можно задать определенную функцию полезности, и описывать его поведение как "агент стремится максимизировать данную функцию полезности" (агент будет называться VNM-рациональным). А именно, требуется выполнение следующих свойств (аксиом):

  1. Аксиома полноты. Для любых двух исходов и должно выполняться либо , либо , либо , т.е. отношение нестрогого порядка "предпочтительнее" должно быть задано для всех упорядоченных пар исходов (либо один из исходов является для агента более предпочтительным, либо ему всё равно, какой из них будет реализован).
  2. Аксиома транзитивности. Если и , то .
  3. Аксиома независимости. Пусть и - некоторая вероятность. Тогда для любого исхода должно выполняться . Т.е. если один из исходов предпочтительнее другого, то и вероятностное наступление первого исхода предпочтительнее наступления второго (с той же вероятностью) независимо от того, какова будет третья альтернатива.
  4. Аксиома непрерывности. Пусть , тогда существует такое число , что . Т.е. существует такая вероятность , что для агента будет безразлично, реализуется ли ситуация, в которой гарантированно наступит исход , либо неопределенная ситуация, в которой наступит либо исход (с вероятностью ), либо исход (с вероятностью ).

На системе целей и предпочтений, соответствующих указанным требованиям, функция полезности задается единственным способом (с точностью до прибавления константы и умножения на положительный скаляр).

Для предпочтений реальных людей нельзя гарантировать выполнение ни одного из этих требований, поэтому люди не являются VNM-рациональными.

Релевантные искажения[править]

Тот факт, что люди не являются VNM-рациональными (что на их системе целей и ценностей нельзя задать корректную функцию полезности), проявляется, в частности, в следующих когнитивных искажениях:

  1. Избегание потерь — склонность людей избегать потерь в большей мере, чем стремиться к приобретениям.[1]
  2. Гиперболическое дисконтирование - то, насколько исход является предпочтительным для человека, зависит не только от его содержания, но и от того, насколько момент его наступления отдален в будущем от настоящего момента.
  3. Пренебрежение масштабом - предпочтения людей часто оказываются не аддитивными.

Примечания[править]

  1. Возможная критика концепции избегания потерь, хотя непонятно, насколько достоверная: The Loss of Loss Aversion: Will It Loom Larger Than Its Gain?


Статьи по теме[править]

См. также[править]