Функция полезности — различия между версиями
Muyyd (обсуждение | вклад) |
м (Ссылка на когнитивные искажения) |
||
(не показаны 4 промежуточные версии 2 участников) | |||
Строка 1: | Строка 1: | ||
{{LwComWikiLink|Utility Function}} | {{LwComWikiLink|Utility Function}} | ||
− | Функция полезности | + | '''Функция полезности''' - некоторая функция, которая позволяет формализовать предпочтения того или иного агента. Функция полезности задается на множестве различных исходов (состояний мира) и для каждого исхода/мира задает число ("полезность"), определяющее, насколько это состояние мира является желательным для агента. Предполагается, что исходы с б''о''льшей полезностью, для агента всегда более предпочтительны, чем исходы с меньшей; исходы с равными значениями ФП, для агента предпочтительны в равной степени. Условной единицей измерения ФП является [[утилон]]. |
Поскольку исходы действий обычно нельзя предсказать наверняка, при совершении выбора [[Рациональный агент|рациональные агенты]] обычно руководствуются [[Ожидаемая полезность|ожидаемой полезностью]]: суммой значений функции полезности для рассматриваемых исходов, взвешенных на [[Вероятность|вероятности]] исходов. | Поскольку исходы действий обычно нельзя предсказать наверняка, при совершении выбора [[Рациональный агент|рациональные агенты]] обычно руководствуются [[Ожидаемая полезность|ожидаемой полезностью]]: суммой значений функции полезности для рассматриваемых исходов, взвешенных на [[Вероятность|вероятности]] исходов. | ||
− | == | + | == Теорема фон Неймана-Моргенштерна == |
− | + | Согласно этой теореме, если поведение некоторого агента удовлетворяет определенным свойствам, то для этого агента можно задать определенную функцию полезности, и описывать его поведение как "агент стремится максимизировать данную функцию полезности" (агент будет называться '''VNM-рациональным'''). А именно, требуется выполнение следующих свойств (аксиом): | |
+ | # Аксиома полноты. Для любых двух исходов <math>A</math> и <math>B</math> должно выполняться либо <math>A > B</math>, либо <math>A < B</math>, либо <math>A = B</math>, т.е. отношение нестрогого порядка "предпочтительнее" должно быть задано для всех упорядоченных пар исходов (либо один из исходов является для агента более предпочтительным, либо ему всё равно, какой из них будет реализован). | ||
+ | # Аксиома транзитивности. Если <math>A > B</math> и <math>B > C</math>, то <math>A > C</math>. | ||
+ | # Аксиома независимости. Пусть <math>A > B</math> и <math>p \in (0, 1]</math> - некоторая вероятность. Тогда для любого исхода <math>C</math> должно выполняться <math>p A + (1 - p) C > p B + (1 - p) C</math>. Т.е. если один из исходов предпочтительнее другого, то и вероятностное наступление первого исхода предпочтительнее наступления второго (с той же вероятностью) независимо от того, какова будет третья альтернатива. | ||
+ | # Аксиома непрерывности. Пусть <math>A > B > C</math>, тогда существует такое число <math>p \in (0, 1)</math>, что <math>B = p A + (1-p) C</math>. Т.е. существует такая вероятность <math>p</math>, что для агента будет безразлично, реализуется ли ситуация, в которой гарантированно наступит исход <math>B</math>, либо неопределенная ситуация, в которой наступит либо исход <math>A</math> (с вероятностью <math>p</math>), либо исход <math>C</math> (с вероятностью <math>1 - p</math>). | ||
− | + | На системе целей и предпочтений, соответствующих указанным требованиям, функция полезности задается единственным способом (с точностью до прибавления константы и умножения на положительный скаляр). | |
− | + | Для предпочтений реальных людей нельзя гарантировать выполнение ни одного из этих требований, поэтому люди не являются VNM-рациональными. | |
− | + | == Релевантные искажения == | |
− | [https://arbital.com/p/expected_utility_formalism/?l=7hh | + | Тот факт, что люди не являются VNM-рациональными (что на их системе целей и ценностей нельзя задать корректную функцию полезности), проявляется, в частности, в следующих [[Когнитивное искажение|когнитивных искажениях]]: |
+ | # [https://en.wikipedia.org/wiki/Loss_aversion Избегание потерь] — склонность людей избегать потерь в большей мере, чем стремиться к приобретениям.<ref name="loss aversion">Возможная критика концепции избегания потерь, хотя непонятно, насколько достоверная: [https://onlinelibrary.wiley.com/doi/pdf/10.1002/jcpy.1047 The Loss of Loss Aversion: Will It Loom Larger Than Its Gain?]</ref> | ||
+ | # [https://en.wikipedia.org/wiki/Hyperbolic_discounting Гиперболическое дисконтирование] - то, насколько исход является предпочтительным для человека, зависит не только от его содержания, но и от того, насколько момент его наступления отдален в будущем от настоящего момента. | ||
+ | # [https://en.wikipedia.org/wiki/Scope_neglect Пренебрежение масштабом] - предпочтения людей часто оказываются не аддитивными. | ||
+ | |||
+ | == Примечания == | ||
+ | {{примечания}} | ||
+ | |||
+ | == Статьи по теме == | ||
+ | * [https://en.wikipedia.org/wiki/Von_Neumann%E2%80%93Morgenstern_utility_theorem Von Neumann-Morgenstern utility theorem] - о теореме фон Неймана-Моргенштерна | ||
+ | * [https://arbital.com/p/utility_function/ Utility function] - статья о функции полезности на Arbital.com | ||
+ | * [https://arbital.com/p/rescue_utility/ Rescuing the utility function] | ||
+ | * [https://arbital.com/p/expected_utility_formalism/?l=7hh Coherent decisions imply consistent utilities] | ||
+ | |||
+ | == См. также == | ||
+ | * [[Ценности]] | ||
[[Категория:Теория принятия решений]] | [[Категория:Теория принятия решений]] | ||
+ | [[Категория:Понятия]] |
Текущая версия на 20:58, 29 ноября 2023
Функция полезности - некоторая функция, которая позволяет формализовать предпочтения того или иного агента. Функция полезности задается на множестве различных исходов (состояний мира) и для каждого исхода/мира задает число ("полезность"), определяющее, насколько это состояние мира является желательным для агента. Предполагается, что исходы с большей полезностью, для агента всегда более предпочтительны, чем исходы с меньшей; исходы с равными значениями ФП, для агента предпочтительны в равной степени. Условной единицей измерения ФП является утилон.
Поскольку исходы действий обычно нельзя предсказать наверняка, при совершении выбора рациональные агенты обычно руководствуются ожидаемой полезностью: суммой значений функции полезности для рассматриваемых исходов, взвешенных на вероятности исходов.
Содержание
Теорема фон Неймана-Моргенштерна[править]
Согласно этой теореме, если поведение некоторого агента удовлетворяет определенным свойствам, то для этого агента можно задать определенную функцию полезности, и описывать его поведение как "агент стремится максимизировать данную функцию полезности" (агент будет называться VNM-рациональным). А именно, требуется выполнение следующих свойств (аксиом):
- Аксиома полноты. Для любых двух исходов Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A} и Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle B} должно выполняться либо Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A > B} , либо Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A < B} , либо Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A = B} , т.е. отношение нестрогого порядка "предпочтительнее" должно быть задано для всех упорядоченных пар исходов (либо один из исходов является для агента более предпочтительным, либо ему всё равно, какой из них будет реализован).
- Аксиома транзитивности. Если Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A > B} и Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle B > C} , то Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A > C} .
- Аксиома независимости. Пусть Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A > B} и Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle p \in (0, 1]} - некоторая вероятность. Тогда для любого исхода Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle C} должно выполняться Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle p A + (1 - p) C > p B + (1 - p) C} . Т.е. если один из исходов предпочтительнее другого, то и вероятностное наступление первого исхода предпочтительнее наступления второго (с той же вероятностью) независимо от того, какова будет третья альтернатива.
- Аксиома непрерывности. Пусть Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A > B > C} , тогда существует такое число Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle p \in (0, 1)} , что Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle B = p A + (1-p) C} . Т.е. существует такая вероятность Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle p} , что для агента будет безразлично, реализуется ли ситуация, в которой гарантированно наступит исход Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle B} , либо неопределенная ситуация, в которой наступит либо исход Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle A} (с вероятностью Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle p} ), либо исход Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle C} (с вероятностью Невозможно разобрать выражение (MathML с переходом в SVG или PNG (рекомендуется для современных браузеров и инструментов повышения доступности): Недопустимый ответ («Math extension cannot connect to Restbase.») от сервера «https://en.wikipedia.org/api/rest_v1/»:): {\displaystyle 1 - p} ).
На системе целей и предпочтений, соответствующих указанным требованиям, функция полезности задается единственным способом (с точностью до прибавления константы и умножения на положительный скаляр).
Для предпочтений реальных людей нельзя гарантировать выполнение ни одного из этих требований, поэтому люди не являются VNM-рациональными.
Релевантные искажения[править]
Тот факт, что люди не являются VNM-рациональными (что на их системе целей и ценностей нельзя задать корректную функцию полезности), проявляется, в частности, в следующих когнитивных искажениях:
- Избегание потерь — склонность людей избегать потерь в большей мере, чем стремиться к приобретениям.[1]
- Гиперболическое дисконтирование - то, насколько исход является предпочтительным для человека, зависит не только от его содержания, но и от того, насколько момент его наступления отдален в будущем от настоящего момента.
- Пренебрежение масштабом - предпочтения людей часто оказываются не аддитивными.
Примечания[править]
- ↑ Возможная критика концепции избегания потерь, хотя непонятно, насколько достоверная: The Loss of Loss Aversion: Will It Loom Larger Than Its Gain?
Статьи по теме[править]
- Von Neumann-Morgenstern utility theorem - о теореме фон Неймана-Моргенштерна
- Utility function - статья о функции полезности на Arbital.com
- Rescuing the utility function
- Coherent decisions imply consistent utilities