Функция полезности — различия между версиями

Материал из Вики LessWrong.ru
Перейти к: навигация, поиск
м (Ссылка на когнитивные искажения)
 
(не показаны 4 промежуточные версии 2 участников)
Строка 1: Строка 1:
 
{{LwComWikiLink|Utility Function}}
 
{{LwComWikiLink|Utility Function}}
Функция полезности присваивает количественные значения («[[утилон]]ы») возможным исходам, таким образом, что исходы с большим количеством полезности оказываются предпочтительнее, чем исходы с меньшим количеством полезности.
+
'''Функция полезности''' - некоторая функция, которая позволяет формализовать предпочтения того или иного агента. Функция полезности задается на множестве различных исходов (состояний мира) и для каждого исхода/мира задает число ("полезность"), определяющее, насколько это состояние мира является желательным для агента. Предполагается, что исходы с б''о''льшей полезностью, для агента всегда более предпочтительны, чем исходы с меньшей; исходы с равными значениями ФП, для агента предпочтительны в равной степени. Условной единицей измерения ФП является [[утилон]].
  
 
Поскольку исходы действий обычно нельзя предсказать наверняка, при совершении выбора [[Рациональный агент|рациональные агенты]] обычно руководствуются [[Ожидаемая полезность|ожидаемой полезностью]]: суммой значений функции полезности для рассматриваемых исходов, взвешенных на [[Вероятность|вероятности]] исходов.
 
Поскольку исходы действий обычно нельзя предсказать наверняка, при совершении выбора [[Рациональный агент|рациональные агенты]] обычно руководствуются [[Ожидаемая полезность|ожидаемой полезностью]]: суммой значений функции полезности для рассматриваемых исходов, взвешенных на [[Вероятность|вероятности]] исходов.
  
== Ссылки ==
+
== Теорема фон Неймана-Моргенштерна ==
  
[https://en.wikipedia.org/wiki/Von_Neumann%E2%80%93Morgenstern_utility_theorem Von Neumann–Morgenstern utility theorem]
+
Согласно этой теореме, если поведение некоторого агента удовлетворяет определенным свойствам, то для этого агента можно задать определенную функцию полезности, и описывать его поведение как "агент стремится максимизировать данную функцию полезности" (агент будет называться '''VNM-рациональным'''). А именно, требуется выполнение следующих свойств (аксиом):
 +
# Аксиома полноты. Для любых двух исходов <math>A</math> и <math>B</math> должно выполняться либо <math>A > B</math>, либо <math>A < B</math>, либо <math>A = B</math>, т.е. отношение нестрогого порядка "предпочтительнее" должно быть задано для всех упорядоченных пар исходов (либо один из исходов является для агента более предпочтительным, либо ему всё равно, какой из них будет реализован).
 +
# Аксиома транзитивности. Если <math>A > B</math> и <math>B > C</math>, то <math>A > C</math>.
 +
# Аксиома независимости. Пусть <math>A > B</math> и <math>p \in (0, 1]</math> - некоторая вероятность. Тогда для любого исхода <math>C</math> должно выполняться <math>p A + (1 - p) C > p B + (1 - p) C</math>. Т.е. если один из исходов предпочтительнее другого, то и вероятностное наступление первого исхода предпочтительнее наступления второго (с той же вероятностью) независимо от того, какова будет третья альтернатива.
 +
# Аксиома непрерывности. Пусть <math>A > B > C</math>, тогда существует такое число <math>p \in (0, 1)</math>, что <math>B = p A + (1-p) C</math>. Т.е. существует такая вероятность <math>p</math>, что для агента будет безразлично, реализуется ли ситуация, в которой гарантированно наступит исход <math>B</math>, либо неопределенная ситуация, в которой наступит либо исход <math>A</math> (с вероятностью <math>p</math>), либо исход <math>C</math> (с вероятностью <math>1 - p</math>).
  
[[Ценности]]
+
На системе целей и предпочтений, соответствующих указанным требованиям, функция полезности задается единственным способом (с точностью до прибавления константы и умножения на положительный скаляр).
  
[https://arbital.com/p/utility_function/  Utility function ]
+
Для предпочтений реальных людей нельзя гарантировать выполнение ни одного из этих требований, поэтому люди не являются VNM-рациональными.
  
[https://arbital.com/p/rescue_utility/  Rescuing the utility function ]
+
== Релевантные искажения ==
  
[https://arbital.com/p/expected_utility_formalism/?l=7hh   Coherent decisions imply consistent utilities ]
+
Тот факт, что люди не являются VNM-рациональными (что на их системе целей и ценностей нельзя задать корректную функцию полезности), проявляется, в частности, в следующих [[Когнитивное искажение|когнитивных искажениях]]:
 +
# [https://en.wikipedia.org/wiki/Loss_aversion Избегание потерь] — склонность людей избегать потерь в большей мере, чем стремиться к приобретениям.<ref name="loss aversion">Возможная критика концепции избегания потерь, хотя непонятно, насколько достоверная: [https://onlinelibrary.wiley.com/doi/pdf/10.1002/jcpy.1047 The Loss of Loss Aversion: Will It Loom Larger Than Its Gain?]</ref>
 +
# [https://en.wikipedia.org/wiki/Hyperbolic_discounting Гиперболическое дисконтирование] - то, насколько исход является предпочтительным для человека, зависит не только от его содержания, но и от того, насколько момент его наступления отдален в будущем от настоящего момента.
 +
# [https://en.wikipedia.org/wiki/Scope_neglect Пренебрежение масштабом] - предпочтения людей часто оказываются не аддитивными.
 +
 
 +
== Примечания ==
 +
{{примечания}}
 +
 
 +
== Статьи по теме ==
 +
* [https://en.wikipedia.org/wiki/Von_Neumann%E2%80%93Morgenstern_utility_theorem Von Neumann-Morgenstern utility theorem] - о теореме фон Неймана-Моргенштерна
 +
* [https://arbital.com/p/utility_function/  Utility function] - статья о функции полезности на Arbital.com
 +
* [https://arbital.com/p/rescue_utility/  Rescuing the utility function]
 +
* [https://arbital.com/p/expected_utility_formalism/?l=7hh Coherent decisions imply consistent utilities]
 +
 
 +
== См. также ==
 +
* [[Ценности]]
  
 
[[Категория:Теория принятия решений]]
 
[[Категория:Теория принятия решений]]
 +
[[Категория:Понятия]]

Текущая версия на 20:58, 29 ноября 2023

На эту тему существует тэг на LessWrong.com: Utility Function

Функция полезности - некоторая функция, которая позволяет формализовать предпочтения того или иного агента. Функция полезности задается на множестве различных исходов (состояний мира) и для каждого исхода/мира задает число ("полезность"), определяющее, насколько это состояние мира является желательным для агента. Предполагается, что исходы с большей полезностью, для агента всегда более предпочтительны, чем исходы с меньшей; исходы с равными значениями ФП, для агента предпочтительны в равной степени. Условной единицей измерения ФП является утилон.

Поскольку исходы действий обычно нельзя предсказать наверняка, при совершении выбора рациональные агенты обычно руководствуются ожидаемой полезностью: суммой значений функции полезности для рассматриваемых исходов, взвешенных на вероятности исходов.

Теорема фон Неймана-Моргенштерна[править]

Согласно этой теореме, если поведение некоторого агента удовлетворяет определенным свойствам, то для этого агента можно задать определенную функцию полезности, и описывать его поведение как "агент стремится максимизировать данную функцию полезности" (агент будет называться VNM-рациональным). А именно, требуется выполнение следующих свойств (аксиом):

  1. Аксиома полноты. Для любых двух исходов Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A} и Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle B} должно выполняться либо Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A > B} , либо Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A < B} , либо Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A = B} , т.е. отношение нестрогого порядка "предпочтительнее" должно быть задано для всех упорядоченных пар исходов (либо один из исходов является для агента более предпочтительным, либо ему всё равно, какой из них будет реализован).
  2. Аксиома транзитивности. Если Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A > B} и Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle B > C} , то Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A > C} .
  3. Аксиома независимости. Пусть Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A > B} и Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle p \in (0, 1]} - некоторая вероятность. Тогда для любого исхода Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle C} должно выполняться Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle p A + (1 - p) C > p B + (1 - p) C} . Т.е. если один из исходов предпочтительнее другого, то и вероятностное наступление первого исхода предпочтительнее наступления второго (с той же вероятностью) независимо от того, какова будет третья альтернатива.
  4. Аксиома непрерывности. Пусть Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A > B > C} , тогда существует такое число Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle p \in (0, 1)} , что Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle B = p A + (1-p) C} . Т.е. существует такая вероятность Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle p} , что для агента будет безразлично, реализуется ли ситуация, в которой гарантированно наступит исход Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle B} , либо неопределенная ситуация, в которой наступит либо исход Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A} (с вероятностью Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle p} ), либо исход Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle C} (с вероятностью Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle 1 - p} ).

На системе целей и предпочтений, соответствующих указанным требованиям, функция полезности задается единственным способом (с точностью до прибавления константы и умножения на положительный скаляр).

Для предпочтений реальных людей нельзя гарантировать выполнение ни одного из этих требований, поэтому люди не являются VNM-рациональными.

Релевантные искажения[править]

Тот факт, что люди не являются VNM-рациональными (что на их системе целей и ценностей нельзя задать корректную функцию полезности), проявляется, в частности, в следующих когнитивных искажениях:

  1. Избегание потерь — склонность людей избегать потерь в большей мере, чем стремиться к приобретениям.[1]
  2. Гиперболическое дисконтирование - то, насколько исход является предпочтительным для человека, зависит не только от его содержания, но и от того, насколько момент его наступления отдален в будущем от настоящего момента.
  3. Пренебрежение масштабом - предпочтения людей часто оказываются не аддитивными.

Примечания[править]

  1. Возможная критика концепции избегания потерь, хотя непонятно, насколько достоверная: The Loss of Loss Aversion: Will It Loom Larger Than Its Gain?


Статьи по теме[править]

См. также[править]