Открыть главное меню

Вики LessWrong.ru β

Изменения

Функция полезности

4697 байт добавлено, 20:58, 29 ноября 2023
м
Ссылка на когнитивные искажения
{{LwComWikiLink|Utility Function}}
'''Функция полезности''' присваивает количественные значения - некоторая функция, которая позволяет формализовать предпочтения того или иного агента. Функция полезности задается на множестве различных исходов (состояний мира) и для каждого исхода/мира задает число («[[утилон]]ы»"полезность") возможным исходам, таким образомопределяющее, насколько это состояние мира является желательным для агента. Предполагается, что исходы с большим количеством полезности оказываются предпочтительнееб''о''льшей полезностью, для агента всегда более предпочтительны, чем исходы с меньшим количеством полезностименьшей; исходы с равными значениями ФП, для агента предпочтительны в равной степени. Условной единицей измерения ФП является [[утилон]].
Поскольку исходы действий обычно нельзя предсказать наверняка, при совершении выбора [[Рациональный агент|рациональные агенты]] обычно руководствуются [[Ожидаемая полезность|ожидаемой полезностью]]: суммой значений функции полезности для рассматриваемых исходов, взвешенных на [[Вероятность|вероятности]] исходов.
 
== Теорема фон Неймана-Моргенштерна ==
 
Согласно этой теореме, если поведение некоторого агента удовлетворяет определенным свойствам, то для этого агента можно задать определенную функцию полезности, и описывать его поведение как "агент стремится максимизировать данную функцию полезности" (агент будет называться '''VNM-рациональным'''). А именно, требуется выполнение следующих свойств (аксиом):
# Аксиома полноты. Для любых двух исходов <math>A</math> и <math>B</math> должно выполняться либо <math>A > B</math>, либо <math>A < B</math>, либо <math>A = B</math>, т.е. отношение нестрогого порядка "предпочтительнее" должно быть задано для всех упорядоченных пар исходов (либо один из исходов является для агента более предпочтительным, либо ему всё равно, какой из них будет реализован).
# Аксиома транзитивности. Если <math>A > B</math> и <math>B > C</math>, то <math>A > C</math>.
# Аксиома независимости. Пусть <math>A > B</math> и <math>p \in (0, 1]</math> - некоторая вероятность. Тогда для любого исхода <math>C</math> должно выполняться <math>p A + (1 - p) C > p B + (1 - p) C</math>. Т.е. если один из исходов предпочтительнее другого, то и вероятностное наступление первого исхода предпочтительнее наступления второго (с той же вероятностью) независимо от того, какова будет третья альтернатива.
# Аксиома непрерывности. Пусть <math>A > B > C</math>, тогда существует такое число <math>p \in (0, 1)</math>, что <math>B = p A + (1-p) C</math>. Т.е. существует такая вероятность <math>p</math>, что для агента будет безразлично, реализуется ли ситуация, в которой гарантированно наступит исход <math>B</math>, либо неопределенная ситуация, в которой наступит либо исход <math>A</math> (с вероятностью <math>p</math>), либо исход <math>C</math> (с вероятностью <math>1 - p</math>).
 
На системе целей и предпочтений, соответствующих указанным требованиям, функция полезности задается единственным способом (с точностью до прибавления константы и умножения на положительный скаляр).
 
Для предпочтений реальных людей нельзя гарантировать выполнение ни одного из этих требований, поэтому люди не являются VNM-рациональными.
== Релевантные искажения ==
1) [https://en.wikipedia.org/wiki/Loss_aversion Избегание потерь] — склонность людей избегать потерь в большей мере, чем стремиться к приобретениям.<br>
(возможная критика концепции избегания потерь, хотя непонятно, насколько достоверная: [https://onlinelibrary.wiley.com/doi/pdf/10.1002/jcpy.1047 The Loss of Loss Aversion: Will It Loom Larger Than Its Gain?])
2Тот факт, что люди не являются VNM-рациональными (что на их системе целей и ценностей нельзя задать корректную функцию полезности) , проявляется, в частности, в следующих [[Когнитивное искажение|когнитивных искажениях]]:# [https://en.wikipedia.org/wiki/Loss_aversion Избегание потерь] — склонность людей избегать потерь в большей мере, чем стремиться к приобретениям.<ref name="loss aversion">Возможная критика концепции избегания потерь, хотя непонятно, насколько достоверная: [https://onlinelibrary.wiley.com/doi/pdf/10.1002/jcpy.1047 The Loss of Loss Aversion: Will It Loom Larger Than Its Gain?]</ref># [https://en.wikipedia.org/wiki/Hyperbolic_discounting Гиперболическое дисконтирование]- то, насколько исход является предпочтительным для человека, зависит не только от его содержания, но и от того, насколько момент его наступления отдален в будущем от настоящего момента.# [https://en.wikipedia.org/wiki/Scope_neglect Пренебрежение масштабом] - предпочтения людей часто оказываются не аддитивными.
3) [https://en.wikipedia.org/wiki/Scope_neglect Пренебрежение масштабом]== Примечания =={{примечания}}
== Статьи по теме ==
* [https://en.wikipedia.org/wiki/Von_Neumann%E2%80%93Morgenstern_utility_theorem Von Neumann-Morgenstern utility theorem] - теорема о том, что если поведение некоторого агента удовлетворяет определенным свойствам, то для этого агента можно задать определенную функцию полезности, и описывать его поведение как "агент стремится максимизировать данную функцию полезности"теореме фон Неймана-Моргенштерна
* [https://arbital.com/p/utility_function/ Utility function] - статья о функции полезности на Arbital.com
* [https://arbital.com/p/rescue_utility/ Rescuing the utility function]
[[Категория:Теория принятия решений]]
[[Категория:Понятия]]