264
правки
Изменения
Агент
,Ссылка на ожидаемую полезность
* Агент получает входящую информацию с помощью некоторых сенсоров, и на основе полученной информации обновляет свое распределение вероятности с помощью [[Теорема Байеса|теоремы Байеса]] ("делает байесовские обновления");
* Предпочтения агента выражены в виде [[Функция полезности|функции полезности]], сопоставляющей каждому состоянию мира его полезность для агента;
* Агент совершает действия, основываясь на своем текущем представлении (распределении вероятности) о состоянии мира с тем, чтобы [[ожидаемая полезность ]] (математическое ожидание функции полезности) после действия была максимальна.
Идеальный байесов агент обычно считается математической моделью идеального рационалиста. В реальности этот идеал недостижим, поскольку требует бесконечного объема памяти для хранения апостериорных вероятностей всех возможных состояний миров с бесконечной точностью, а также бесконечного быстродействия для операций с такими объемом данных. Однако, такой математический идеал может служить ориентиром для людей-рационалистов, с поправкой на естественные особенности человеческого мышления.