Функция полезности

На эту тему существует тэг на LessWrong.com: Utility Function

Функция полезности - некоторая функция, которая позволяет формализовать предпочтения того или иного агента. Функция полезности задается на множестве различных исходов (состояний мира) и для каждого исхода/мира задает число ("полезность"), определяющее, насколько это состояние мира является желательным для агента. Предполагается, что исходы с большей полезностью, для агента всегда более предпочтительны, чем исходы с меньшей; исходы с равными значениями ФП, для агента предпочтительны в равной степени. Условной единицей измерения ФП является утилон.

Поскольку исходы действий обычно нельзя предсказать наверняка, при совершении выбора рациональные агенты обычно руководствуются ожидаемой полезностью: суммой значений функции полезности для рассматриваемых исходов, взвешенных на вероятности исходов.

Теорема фон Неймана-Моргенштерна[править]

Согласно этой теореме, если поведение некоторого агента удовлетворяет определенным свойствам, то для этого агента можно задать определенную функцию полезности, и описывать его поведение как "агент стремится максимизировать данную функцию полезности" (агент будет называться VNM-рациональным). А именно, требуется выполнение следующих свойств (аксиом):

Аксиома полноты. Для любых двух исходов Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A} и Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle B} должно выполняться либо Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A > B} , либо Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A < B} , либо Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A = B} , т.е. отношение нестрогого порядка "предпочтительнее" должно быть задано для всех упорядоченных пар исходов (либо один из исходов является для агента более предпочтительным, либо ему всё равно, какой из них будет реализован).
Аксиома транзитивности. Если Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A > B} и Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle B > C} , то Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A > C} .
Аксиома независимости. Пусть Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A > B} и Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle p \in (0, 1]} - некоторая вероятность. Тогда для любого исхода Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle C} должно выполняться Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle p A + (1 - p) C > p B + (1 - p) C} . Т.е. если один из исходов предпочтительнее другого, то и вероятностное наступление первого исхода предпочтительнее наступления второго (с той же вероятностью) независимо от того, какова будет третья альтернатива.
Аксиома непрерывности. Пусть Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A > B > C} , тогда существует такое число Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle p \in (0, 1)} , что Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle B = p A + (1-p) C} . Т.е. существует такая вероятность Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle p} , что для агента будет безразлично, реализуется ли ситуация, в которой гарантированно наступит исход Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle B} , либо неопределенная ситуация, в которой наступит либо исход Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A} (с вероятностью Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle p} ), либо исход Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle C} (с вероятностью Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle 1 - p} ).

На системе целей и предпочтений, соответствующих указанным требованиям, функция полезности задается единственным способом (с точностью до прибавления константы и умножения на положительный скаляр).

Для предпочтений реальных людей нельзя гарантировать выполнение ни одного из этих требований, поэтому люди не являются VNM-рациональными.

Релевантные искажения[править]

Тот факт, что люди не являются VNM-рациональными (что на их системе целей и ценностей нельзя задать корректную функцию полезности), проявляется, в частности, в следующих когнитивных искажениях:

Избегание потерь — склонность людей избегать потерь в большей мере, чем стремиться к приобретениям.^[1]
Гиперболическое дисконтирование - то, насколько исход является предпочтительным для человека, зависит не только от его содержания, но и от того, насколько момент его наступления отдален в будущем от настоящего момента.
Пренебрежение масштабом - предпочтения людей часто оказываются не аддитивными.

Примечания[править]

↑ Возможная критика концепции избегания потерь, хотя непонятно, насколько достоверная: The Loss of Loss Aversion: Will It Loom Larger Than Its Gain?

Статьи по теме[править]

Von Neumann-Morgenstern utility theorem - о теореме фон Неймана-Моргенштерна
Utility function - статья о функции полезности на Arbital.com
Rescuing the utility function
Coherent decisions imply consistent utilities

См. также[править]

Ценности

[loss_aversion-1] Возможная критика концепции избегания потерь, хотя непонятно, насколько достоверная: The Loss of Loss Aversion: Will It Loom Larger Than Its Gain?

[1]

Функция полезности

Содержание

Теорема фон Неймана-Моргенштерна[править]

Релевантные искажения[править]

Примечания[править]

Статьи по теме[править]

См. также[править]

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты