Почему байесовская вероятность важнее других проявлений рациональности?

Автор Тема: Почему байесовская вероятность важнее других проявлений рациональности?  (Прочитано 28767 раз)

kuuff

  • Старожил
  • *****
  • Сообщений: 2 133
  • +220/-52
    • Просмотр профиля
1+1=2; ((A=>B) and (B=> C)) => (A => C); вид случайного распределения(нормальное, пуасоново, равномерное и т.д.); матожидание.
1+1=2 -- это девиз рационалистов Древнего Египта, транзитивность -- рационалистов Древней Греции. Распределения -- это для рационалистов XIX, может первой половины XX века.

Мера неуверенности != вероятность.

Мера неуверенности - в математике рассматривается нечеткой логикой и нечеткими множествами.
Нечёткая логика -- это одна из многих попыток уложить реальные рассуждения в формальную систему. Байесианство -- это другая такая попытка. И этими двумя попытками всё не ограничивается. Вы можете почитать об этом у Judea Pearl в "Probabilistic Reasoning in Intelligent Systems", он там даёт некий метавзгляд на эти теории.

К мере неуверенности не применимы Байесовские законы, потому что мера неуверенности не является вероятностью.
А вот тут вы просто рассуждаете не зная. Вам давали ссылки, где разбиралась мера неуверенности и законы, которые позволяют эту меру неуверенности пересчитывать численно.

Например, кластеризация чисел на целые, положительные, отрицательные, дробные, простые, иррациональные, Фибоначчи, Мерсенна делается на основе поведения чисел. На основе законов, которыми описывается данная группа чисел.
Это математика. Это не реальность, а искусственный мир, который существует только в голове у человека и который живёт по своим законам.

Также неявно подразумевается, что все знания появляются в результате наблюдения за реальностью. Это не так.
Значительная часть знаний появляется в результате наблюдения за моделями. И исследования этих моделей.
Большая часть точных наук построена в результате исследования моделей.
В некотором смысле, исследования моделей не создают новых знаний. Те же математики, рассуждая о некой аксиоматической системе, считают что аксиомы задают множество истинных утверждений. Что оно уже есть, уже задано. То же самое и с любой моделью: она определяет все выводы, даже если мы до них ещё не доковырялись.
Такой взгляд далеко не всегда удачный и удобный, но вы попробуйте посмотреть с этой точки зрения, и попробуйте увидеть мир с этой точки зрения. Мне кажется, это поможет вам отделить мух от котлет. Во всяком случае, это позволит вам окинуть взором ограничения, которые накладывает умозрительный метод познания, метод нацеленный на исследования моделей. Это позволит вам увидеть, как этот метод вынужден взаимодействовать с другими методами, и может ли он при этом обойтись без статистики.

LswAgnostic

  • Ветеран
  • ****
  • Сообщений: 313
  • +29/-12
    • Просмотр профиля
Заботал теорию. Действительно, есть направление, когда в качестве правдоподобия используется число схожее с вероятностью и формула расчета, схожая с формулой Байеса.

В тоже время, это один из вариантов моделирования правдоподобия, не самый удачный.

Плюсы байесовского коэффициента правдоподобия:
- простой: коэффициент правдоподобия записывается одним числом, вклад в комплексную величину считается линейным
- легкий для обучения людей: формулы расчета схожи с расчетом вероятности
- есть примеры использования в computer science: наивный байесовский фильтр спама

Минусы байесовского коэффициента правдоподобия:
- считает исходные величины - независимыми между собой
- считает вклад элементарных величин - линейным
- считает случайные величины распределенными - равномерно
- не используется в современном computer science. Не используется в экспертных системах, в machine learning-е, в программах-ботах
- программы основанные на других коэффициентах правдоподобия показывают лучшие результаты, чем код, основанный на байесовском коэффициенте правдоподобия

Цитировать
Программные спам-фильтры, построенные на принципах наивного байесовского классификатора, делают «наивное» предположение о том, что события, соответствующие наличию того или иного слова в электронном письме или сообщении, являются независимыми по отношению друг к другу. Это упрощение в общем случае является неверным для естественных языков таких как английский, где вероятность обнаружения прилагательного повышается при наличии, к примеру, существительного.

Пример, показывающий неудачность байесовского коэффициента правдоподобия.
Цитировать
Пусть вероятность брака у первого рабочего p_1=0,9, у второго рабочего — p_2=0,5, а у третьего — p_3=0,2. Первый изготовил n_1 = 800 деталей, второй — n_2=600 деталей, а третий — n_3=900 деталей. Начальник цеха берёт случайную деталь, и она оказывается бракованной. Спрашивается, с какой вероятностью эту деталь изготовил третий рабочий?

Формула Байеса работает для решения данной задачи при условии, что:
- независимы между собой - брак в работе, складывание деталей в общую группу, выбор детали для тестирования
- вероятность брака равномерна
- детали смешиваются в кучу равномерно
- начальник цеха равномерно выбирает деталь для тестирования

Как только эти условия меняются на другие, перестает работать и формула Байеса.
Например, в задаче могут быть следующие уточнения:
- вероятность брака растёт к вечеру,
- детали выкладываются в линию - сначала первого, затем второго, и далее - третьего рабочего;
- начальник цеха выбирает деталь с нормальным распределением от середины

Задача не решается через байеса, но решается через:
- нейронные сети, имеющие нелинейные операторы
- fuzzy logic (нечеткие множества)
- частотную вероятность





« Последнее редактирование: 08 Мая 2016, 11:48 от LswAgnostic »

Muyyd

  • Ветеран
  • ****
  • Сообщений: 756
  • +45/-1
    • Просмотр профиля
Похоже мы рассматриваем разные задачи. Или разные области применения. Или еще что-то. Я тут уже за рамками своей компетентности. Можно открыть амазон или genlib со словом bayes и посмотреть литературу, где используется байесовский вывод (много литературы). В The Oxford Handbook of Thinking and Reasoning лишь одна глава посвящена байесовскому выводу (Bayesian inference)
Цитировать
Key Words: Bayesian inference, rational models, inductive inference, learning

Conclusions and Future Directions

The Bayesian toolkit offers several contributions to understanding human thinking and reasoning. It provides a unifying mathematical language for framing cognition as the solution to inductive problems and for building principled quantitative models of thought with a minimum of free parameters and ad hoc assumptions. Deeper, it offers a framework for understanding why the mind works the way it does, in terms of rational inference adapted to the structure of real-world environments, and what the mind knows about the world—abstract schemas and intuitive theories revealed only indirectly through how they constrain generalizations. The new tools we obtain by adopting this perspective allow us to integrate symbolic representations with statistical learning, identify human inductive biases and understand their origins, and connect cognitive psychology with other scientific disciplines.
Most important, the Bayesian approach lets us move beyond classic “either-or” dichotomies that have long shaped and limited debates in cognitive science: “empiricism versus nativism,” “domain-general versus domain-specific,” “logic (rules, symbols) versus probability (statistics, numbers).” Instead we can ask harder questions of reverse engineering, with answers potentially rich enough to help us build more human-like artificial intelligence. The future directions for Bayesian models involve grappling with some of the central questions of cognitive science. How can domain-general mechanisms of learning and representation build domain-specific systems of knowledge? How can structured symbolic knowledge be acquired by statistical learning? The answers that are emerging from current research suggest new ways to think about the development of a cognitive system. Powerful abstractions can be learned surprisingly quickly, together with or prior to learning the more concrete knowledge they constrain. Structured symbolic representations need not be rigid, static, hardwired, or brittle. Embedded in a probabilistic framework, they can grow dynamically and robustly in response to the sparse, noisy data of experience.
Так же там есть глава "causal learning"
Цитировать
Key Words: causal learning, rationality, associative models, causal models, causal Bayes nets, Bayesian causal models, temporal contiguity, causal invariance, intervention, empirical knowledge

Еще есть глава "rational argument"

Цитировать
Abstract
Argumentation is an integral part of how we negotiate life in a complex world. In many contexts it matters, furthermore, that arguments be rational, not that they are simply convincing. Rational debate is subject to both procedural norms and to epistemic norms that allow the evaluation of argument content. This chapter outlines normative  rameworks for argumentation (dialectical, logical, and Bayesian); it then summarizes psychological research on argumentation, drawn from cognitive psychology, as well as a number of applied domains.
Key Words: argumentation, logic, probability, evidence, reasoning, inference, belief change

Theoretical Frameworks
...
An individual’s degree of belief in the claim is represented by a probability. Bayes’ theorem, which follows from the fundamental axioms of probability theory, then provides a normative standard for belief revision; it thus provides a formal tool for evaluating how convinced that individuals should be about the claim in light of that particular piece of evidence. There are three probabilistic quantities involved in Bayes’ theorem that determine what degree of conviction should be associated with a claim once a piece of evidence has been received: prior degree of belief in the claim, how likely the evidence would be if the claim were true, and how likely it would be if the claim were false...

И, в целом, теорема Байеса там упоминается регулярно.
Надеюсь, вам стало понятней, почему байесовская вероятность занимает центральное место в lw рациональности? Это разумеется, не показывает, что байесовская рациональность самая рациональная рациональность. С другой стороны, если появится другая модель рациональности, основанная на, например, fuzzy logic, я бы, наверное, с интересом исследовал бы ее.

LswAgnostic

  • Ветеран
  • ****
  • Сообщений: 313
  • +29/-12
    • Просмотр профиля

Софизм серого. Статья про то, что убеждения не делятся исключительно на "точно произойдет" (1), может быть да\может быть нет (.5), точно нет (0). В скобках, разумеется, вероятности.
Infinite Certainty В рамках байесовской эпистемологии, в соответствии с законами вероятности принято назначать логическим истинам вероятность 1. В рамках фреймворка "вероятность - мера уверенности" с вероятностями 1 возникают некоторые сложности. Эта статья описывает некоторые из них.


Согласен, что у утверждений есть коэффициент правдоподобия.

Закономерная неуверенность. Статья о том, как при столкновении со случайными событиями люди склонны принимать решения по "случайному" алгоритму, вместо того, чтобы действовать по упорядоченному.
Лотереи: бессмысленная трата надежды. Статья об эффекте уверенности и оценке шанса на примере лотереи. "Но шанс то есть?" - так люди говорят.
Absolute Authority. Про чудовщных размеров разрыв между людьми, привыкшими к уверенности и наукой, утверждения которой часто носят вероятностный характер, как и большая часть человеческого знания.


Согласен, что байесовский коэффициент правдоподобия может показывать лучшие результаты, чем Система 1 людей.
Не согласен, что на сегодняшний момент байесовский коэффициент является лучшей моделью правдоподобия.

0 And 1 Are Not Probabilities . Знаменитое  доказательство Кокса (и разные его расширения и переделки) показывает, что все способы репрезентации неуверенности, подчиняющиеся разумным правилам будут изоморфны друг другу. И если перевести вероятности путем десятичного логарифма в децибелы, то будет видно, что 1 и 0 превращаются в бесконечности, что, в свою очередь требует свидетельство бесконечной силы.

Теорема Кокса говорит о чуть другом. Она говорит о том, что если выбрать удобный для расчетов коэффициент правдоподобия, то для его расчета будут использоваться формулы, схожие с формулой Байеса.
Но "удобный для расчетов" != "дающий лучшие результаты".

Современные представления говорят о том, что лучшие результаты показывают ансамбли. Набор независимых противоречивых между собой моделей. В тоже время Кокс при исследованиях и доказательстве исходил из того, что правдоподобие обязано быть непротиворечивым.

https://en.wikipedia.org/wiki/Ensemble_learning

kuuff

  • Старожил
  • *****
  • Сообщений: 2 133
  • +220/-52
    • Просмотр профиля
Мне кажется, что кто-то увяз в деталях и не видит за деревьями леса.

Вы систематически демонстрируете неспособность уложить в единую систему разные системы знаний. Это НЕ свидетельство глупости -- это лишь свидительство того, что вы проглотили за последнее время слишком большой объём информации, слишком много разных новых систем. И если так, то я бы рекомендовал плюнуть на всё и заняться применением всей этой теории на практике. Если вы реально обладаете теми знаниями, ссылки на которые вы приводите, то вы сможете неплохо зарабатывать денег. А года через два-три, максимум пять, те вопросы, которые вы ставите сейчас, для вас уже не будут вопросами.

LswAgnostic

  • Ветеран
  • ****
  • Сообщений: 313
  • +29/-12
    • Просмотр профиля
Вы систематически демонстрируете неспособность уложить в единую систему разные системы знаний. [..] И если так, то я бы рекомендовал плюнуть на всё и заняться применением всей этой теории на практике.

Неожиданный переход )

Вы систематически демонстрируете неспособность уложить в единую систему разные системы знаний.

Ты это так говоришь, как будто противоречивость в знаниях - это что-то плохое. Почему ты знаешь, что плохо иметь противоречия в знаниях?


А года через два-три, максимум пять, те вопросы, которые вы ставите сейчас, для вас уже не будут вопросами.

Что изменится?

ps
Предлагаю перейти на ты. Удобно?
« Последнее редактирование: 09 Мая 2016, 00:36 от LswAgnostic »

kuuff

  • Старожил
  • *****
  • Сообщений: 2 133
  • +220/-52
    • Просмотр профиля
Неожиданный переход )
Простите. Это ad hominem, но очень сложно что-то объяснять человеку не думая при этом о том, что творится в его голове. А если думать о том, что творится в голове у человека, очень сложно не начать говорить об этом.
Ты это так говоришь, как будто противоречивость в знаниях - это что-то плохое. Почему ты знаешь, что плохо иметь противоречия в знаниях?
Противоречия в мировоззрении -- это что-то плохое, да. Они мешают видеть противоречия, вылезающие из противоречивого набора аксиом. Именно поэтому всю дорогу человечество занимается подчастую вещами, которые выглядят полным идиотизмом. Типа критянина, который заявил, что все критяне лжецы. Или брадобрея, который должен брить тех и только тех, кто не бреется сам. Или создают теорию относительности или квантовую механику, потому что иначе никак не удаётся разрешить наблюдаемые противоречия.

Но проблема даже не в противоречиях самих по себе, а в том, что есть два типа противоречий:
1. неибежные противоречия на стыках разных теорий, которые по разному описывают реальность
2. противоречия внутри теории, которые фальсифицируют теорию и отправляют её в утиль.

Первые надо отличать от вторых. Потому что, противоречие первого типа неустранимо и не так страшно, оно требует определённой аккуратности в движениях, но не более того. Противоречие же второго типа требует пересмотра теории. И если мы не отличаем вторые от первых, то мы либо проходим мимо критических противоречий, либо начинаем доказывать, что байесианство построено неверно, потому что противоречиво.

Первые противоречия со временем категоризируются, выделяются классы систематических "ошибок", эти ошибки приписываются теориям -- то есть, голова видит противоречие в описаниях одного и того же явления разными теориями, классифицирует это противоречие, и говорит что-нибудь типа "ааа... это систематическая ошибка теории X, в данной ситуации верный ответ даёт теория Y", или "ммм... невозможно окончательно классифицировать противоречие: недостаточно данных... вот если бы я знал то-то и то-то, то я бы смог классифицировать противоречие и выбрать правильную теорию для данного случая."
Что изменится?
Произойдёт выход на следующий уровень. Это испытывал каждый, даже испытывал многократно, но не каждый осознавал опыт. Память человеческая не столь убога как компьютерная, и знания хранясь там постоянно меняются, они наполняются глубинным смыслом, там проставляются связи этих знаний с другими, вырабатываются дополнительные знания, и умения этими знаниями пользоваться, существующие умения уходят на уровень навыков и применяются уже неосознанно, то есть не забивая сознание этими процессами, оставляя больше простора для рефлексии, осознания того что творится в голове. Происходит своего рода кристаллизация, и оттуда становится возможным (и даже неизбежным) движение на более высокий уровень.

LswAgnostic

  • Ветеран
  • ****
  • Сообщений: 313
  • +29/-12
    • Просмотр профиля
Противоречие же второго типа требует пересмотра теории.

Почему вы знаете, что противоречивость в теории требует её пересмотра?

ps
Цитировать
A paraconsistent logic is a logical system that attempts to deal with contradictions in a discriminating way. Alternatively, paraconsistent logic is the subfield of logic that is concerned with studying and developing paraconsistent (or "inconsistency-tolerant") systems of logic.
Цитировать
Applications

Paraconsistent logic has been applied as a means of managing inconsistency in numerous domains, including:[16]
- Semantics. Paraconsistent logic has been proposed as means of providing a simple and intuitive formal account of truth that does not fall prey to paradoxes such as the Liar. However, such systems must also avoid Curry's paradox, which is much more difficult as it does not essentially involve negation.
- Set theory and the foundations of mathematics (see paraconsistent mathematics). Some believe[who?] that paraconsistent logic has significant ramifications with respect to the significance of Russell's paradox and Gödel's incompleteness theorems[dubious – discuss].
- Epistemology and belief revision. Paraconsistent logic has been proposed as a means of reasoning with and revising inconsistent theories and belief systems.
- Knowledge management and artificial intelligence. Some computer scientists have utilized paraconsistent logic as a means of coping gracefully with inconsistent information.[17]
- Deontic logic and metaethics. Paraconsistent logic has been proposed as a means of dealing with ethical and other normative conflicts.
- Software engineering. Paraconsistent logic has been proposed as a means for dealing with the pervasive inconsistencies among the documentation, use cases, and code of large software systems.[8][9]
- Electronics design routinely uses a four valued logic, with "hi-impedance (z)" and "don't care (x)" playing similar roles to "don't know" and "both true and false" respectively, in addition to True and False. This logic was developed independently of Philosophical logics.


https://en.wikipedia.org/wiki/Paraconsistent_logic



Добавлено 09 Мая 2016, 02:15:
В некотором смысле, исследования моделей не создают новых знаний. Те же математики, рассуждая о некой аксиоматической системе, считают что аксиомы задают множество истинных утверждений. Что оно уже есть, уже задано. То же самое и с любой моделью: она определяет все выводы, даже если мы до них ещё не доковырялись.

Согласен с точки зрения классической математики и не согласен с точки зрения конструктивной математики (интуиционистской логики).

Имхо, конструктивная математика точнее отражает реальность, чем классическая математика.

Конструктивная математика
Интуционизм
Интуционистское исчисление

Добавлено 09 Мая 2016, 02:44:
Произойдёт выход на следующий уровень. Это испытывал каждый, даже испытывал многократно, но не каждый осознавал опыт.

Почему вы знаете, что так происходит всегда? Почему вы верите, что это произойдет в данном случае? Нет ли в этом "ошибки выжившего"?

Имхо, опасно исходить из презумпции, что в Системе 1 желаемый результат достигается сам собой.

Я исхожу из того, что дискуссия с вами помогает мне в интеграции знаний и переводе их в навык. Спасибо вам за конструктивный диалог!


ps
Личная история от того, кто "не выжил":

Цитировать
За это время Форд многое узнал о программировании и базах данных, потратил уйму времени на изучение информатики. И всё это для того, чтобы делать одни и те же вещи, а потом забывать об этом, и делать их снова. Это словно фильм День сурка о фильме День сурка. Он продолжал читать свои письма и понимал, что все двадцать лет говорил о: [..]

Иногда он говорил другим людям, как нужно себя вести, иногда они говорили ему. Само содержание этих споров не сильно изменилось.
https://habrahabr.ru/company/pechkin/blog/282223/
« Последнее редактирование: 09 Мая 2016, 02:54 от LswAgnostic »

Muyyd

  • Ветеран
  • ****
  • Сообщений: 756
  • +45/-1
    • Просмотр профиля
Почему вы знаете, что противоречивость в теории требует её пересмотра?
Хоть вопрос и не мне адресован, но он навел меня на мысли, и я ими поделюсь.

Трудно сказать, что за вопрос вы задавали, так как вы в байесовкую эпистемологию, похоже, не слишком погружены. Но вот что (т.е. прочитав вопрос, я подумал: "вижу байесовскую структуру в этом вопросе"; я не настолько крутой байесовский рационалист, чтобы на ходу произвоть то, что вы увидите дальше) я услышал:
  Опишите цепочку событий-свидетельств, в ходе наблюдения за ходом которых, увеличилось ваше ожидание того, что действия, предсказанные более противоречивыми теориями будут скорее приводить к появлению вариантов реальности, располагающихся ниже в иерархии предпочтений, а действия, предсказанные менее противоречивыми теориями - к располагающимся выше.

Это скорее то, что мог бы один супер умный байесовский максимизатор функции ожидаемой полезности спросить другого (или скорее моделируемый мной в теченкии некоторого времени супер умный байесовский максимизатор функции ожидаемой полезности; я всего лишь человек). На лессвронг.ком людей описывают, как "Just as evolving organisms are adaptation-executors and not fitness-maximizers, so minds are behavior-executors and not utility-maximizers."

Добавлено 09 Мая 2016, 08:25:
  Опишите цепочку событий-свидетельств, в ходе наблюдения за ходом которых, увеличилось ваше ожидание того, что действия, предсказанные более противоречивыми теориями будут скорее приводить к появлению вариантов реальности, располагающихся ниже в иерархии предпочтений, а действия, предсказанные менее противоречивыми теориями - к располагающимся выше.
На что можно было бы ответить:
Я ожидаю, что действия, предсказанные более противоречивыми теориями будут скорее приводить к появлению вариантов реальности, располагающихся ниже в иерархии предпочтений, а действия, предсказанные менее противоречивыми теориями - к располагающимся выше, потому что это является следствием привилегированной гипотезы о непротиворечивости территории, т.е. я стремлюсь менять свою карту в сторону большего соответствия территории, в первую очередь, во-вторую - привилегирировать менее противоречивые теории. Exploration and Exploitation, знаешь ли.
« Последнее редактирование: 09 Мая 2016, 08:25 от Muyyd »

LswAgnostic

  • Ветеран
  • ****
  • Сообщений: 313
  • +29/-12
    • Просмотр профиля
мог бы один супер умный байесовский максимизатор функции ожидаемой полезности спросить другого

Согласен с такой переформулировкой. Спасибо за перевод из одного понятийного базиса в другой.

Я ожидаю, что действия, предсказанные более противоречивыми теориями будут скорее приводить к появлению вариантов реальности, располагающихся ниже в иерархии предпочтений, а действия, предсказанные менее противоречивыми теориями - к располагающимся выше, потому что это является следствием привилегированной гипотезы о непротиворечивости территории, т.е. я стремлюсь менять свою карту в сторону большего соответствия территории, в первую очередь, во-вторую - привилегирировать менее противоречивые теории. Exploration and Exploitation, знаешь ли.

Из теоремы Геделя о неполноте следует, что всякая карта будет: или противоречивой, или неполной, но не то и другое - одновременно.

Какой выбор рационального агента дает большую максимальную полезность? Почему?:
- поддерживание и использование неполной и непротиворечивой карты
- поддерживание и использование полной и противоречивой карты

Производительность Системы 2: 1-5 последовательных выводов в секунду.
Производительность Системы 1: 1e6-1e12 параллельных сопоставлений в секунду.
Систему 1 можно натренировать на выделение противоречий.
Система 1 не способна переформулировать модели для устранения противоречий.
Система 2 способна переформулировать модели для устранения противоречий.

Переформулирование модели с целью устранения противоречия является затратной операцией:
- 1e3-1e4 выводов на переформулирование. 1-3 часа загрузки Системы 2 (1-3 часа жизни)
- 1e4-1e6 предъявлений Системой 2 Системе 1 для перекалибровки Системы 1 и приобретение нового навыка. (1-300 часов жизни)

Какой выбор дает большую максимальную полезность на длительном периоде? В каких условиях выгоднее одно, в каких - другое?:
- Устранение противоречий в своей модели раз за разом
- Однократное освоение навыка "оперирование противоречивыми моделями" + Оперирование противоречивыми моделями раз за разом
« Последнее редактирование: 09 Мая 2016, 12:03 от LswAgnostic »

Muyyd

  • Ветеран
  • ****
  • Сообщений: 756
  • +45/-1
    • Просмотр профиля
Я не понимаю теорему Геделя на формальном уровне. Ровно как и спецификацию кода Bayesian superintelligence, модифицирующего свой код в соответствии с его ожиданиями того, как эти модификации оптимизируют его возможность максимизировать ожидаемую полезность. Вполне возможно, что Bayesian superintelligence придется решать эту проблему, но мне тут предпочтительней молчать, чтобы не выглядеть идиотом еще больше, чем сейчас.

Однако, если речь идет про мапирование (увеличение соответствия между моделью реальности в мозге отдельного человека и реальностью)  в исполнении людей, то тут мне приходят в голову другие варианты.

А именно, из байесовской интерпретации второго закона термодинамики следует фундаментальная неполнота модели реальности (карты) для любого человека. Если я спрошу: "Сколько кошачьих волосков разбросано по моей квартире", то у вас наверняка будут некоторые предположения (относительно которых у вас будет разные уровни уверенности\неуверенности), но вероятность угадать точное число больше, чем вероятность саморазложения воды в стакане на лед и электричество, но вполне понятно, что угадать будет трудно.

Также, ограничения вычислительных способностей человеческого мозга (не знаю, можно ли в данном случае говорить "с необходимостью", но очень хочется) является сильным свидетельством в пользу ожидания найти множество противоречий в карте любого мозга.

Модели реальности в любом человеческом мозге содержат и противоречия и неполны.

Советую вам ознакомиться с статьей «Dual-Process Theories of Deductive Reasoning: Facts and Fallacies» или посмотреть видео Частые заблуждения про две системы мышления. Вы делаете специфические утверждения о работе двух систем, и у меня чувство (хоть я и не знаком с этой теорией достаточно чтобы указать конкретно) что с вашими рассуждениями что-то не так.

Что касается проблемы по приоритезации задач с точки зрения применения к ним Системы 1 или Системы 2, то у меня есть мнение, но ничего нового сказать не могу.

kuuff

  • Старожил
  • *****
  • Сообщений: 2 133
  • +220/-52
    • Просмотр профиля
Почему вы знаете, что противоречивость в теории требует её пересмотра?
Потому что формальная логика -- это очень полезно. Это очень удобно. Формальная логика даёт критерии верности и неверности. Выбирая между разными стратегиями поведения я могу проверить каждую из них на непротиворечивость и отместь те, которые не прошли проверку. Это реально удобно. Ради этого логику и придумали. И ради возможности применять логику все знания причёсывают до состояния, когда они станут логически непротиворечивыми. Пускай даже и не всегда, а лишь в рамках какой-то области применимости.
https://en.wikipedia.org/wiki/Paraconsistent_logic
Я некоторое время сильно радовался такой штуке как троичная логика. И не только логика: троичная уравновешенная система счисления, троичные логические элементы для построения троичного компьютера... Я до сих пор полагаю, что IT совершили ошибку, выбрав в качестве базы двоичную систему счисления, надо было брать троичную, и строить троичные компьютеры. Двоичные было проще придумать, и при малом масштабе выгоды от троичности были невелики, если вообще были. Но когда речь пошла об увеличении разрядности операндов/адресов памяти до 16 бит, 32, 64, 128... троичность дала бы заметную экономию в количестве транзисторов.
Но, фишка в том, что со временем я начал серьёзно подозревать, что от расширения множества {true, false} конечным набором других значений, ничего принципиально не меняется. То есть, количество транзисторов может и станет чуть меньше, а вот с точки зрения программиста всё останется как было.
Согласен с точки зрения классической математики и не согласен с точки зрения конструктивной математики (интуиционистской логики).
Я не просил соглашаться. Я предлагал лишь смотреть иногда на ситуацию через эту призму. Она иногда вскрывает неожиданные свойства ситуации.

Почему вы знаете, что так происходит всегда? Почему вы верите, что это произойдет в данном случае? Нет ли в этом "ошибки выжившего"?
Потому что у меня есть некое более глубокое понимание того, что именно происходит. Оно мутное понимание, я не могу его вербализовать полностью, но это понимание говорит, что человек не может освоить инструмент не пользуясь этим инструментом. Это понимание описывает мне, что именно происходит в процессе использования инструмента, особенно сложного инструмента.

Имхо, опасно исходить из презумпции, что в Системе 1 желаемый результат достигается сам собой.
А я не говорю, что он будет достигнут сам собой. Вам придётся работать.

Если я играю в шахматы, не читая учебников, не слушая лекций, разборов партий, не решая задачек. Просто играю в шахматы. Значит ли это что мой уровень игры в шахматы растёт сам по себе? Я ведь не работаю над ним.

Личная история от того, кто "не выжил":
https://habrahabr.ru/company/pechkin/blog/282223/
Любопытная история. Я иногда занимаюсь "рыбалкой": роюсь по жёсткому диску, и иногда нахожу очень внезапные вещи. Но у меня не было столь постоянных интересов как у героя той истории, поэтому моя жизнь была гораздо разнообразнее. И поэтому проблемы "топтаться на одном месте" у меня не случалось. Хотя... В отношении музыки творится именно это. Я сейчас пытаюсь настроить пианино дома, так же как я пытался делать это десять лет тому назад. Но, я всё же отмечу, с некоторыми приниципиальными изменениями: сегодня я заказал в китае специализированный ключ для кручения колков, вместо всяких неспециализированных ключей, которые я использовал тогда, сегодня в дополнении к слуху, у меня есть программа-тюнер пианино, а к этой программе пара прочитанных статеек о том, чем реальный строй пианино отличается от теоретического, в котором каждая следующая нота имеет частоту в корень двенадцатой степени из двух выше, чем предыдущая. Я знаю свои идеи-фикс. И эти идеи развиваются вместе со мной, даже если я их не пытаюсь воплотить в реальность.

Но, как бы там ни было, вы зря пытаетесь обобщить мой совет на эту историю. Это немного другой случай. Мой совет был дан под ситуацию (реальную или существующую только в моём воображении), которая характеризуется большим объёмом знаний свалившимся в голову сравнительно недавно -- за последние месяцы/годы. Герой же той истории... Знаете, у советских психологов было понятие "зона ближайшего развития" -- я не помню кто из них рассуждал об этом (может Выготский?), но суть в том, что для того, чтобы развитие шло надо в эту зону хотя бы иногда соваться. А эта история сложила у меня впечатление, что Форд совался за развитием в зону вчерашнего развития -- не в зону ближайшего развития, даже не в зону сегодняшнего, а в зону вчерашнего развития. Он искал развития там, где оно когда-то было. В качестве примера, пускай и искусственного, это как если бы человек, изучив таблицу умножения, научившись решать задачи при помощи умножения/деления, может быть даже справляясь с уравнениями, стал бы искать дальнейшего развития в математике заучивая таблицу умножения дальше -- таблицу умножения до 20, до 30, до 100... Двигаясь таким путём он быть может стал бы чудо-вычислителем, который в уме считает быстрее калькулятора, но математиком он бы не стал.

Кстати, с тем примером в шахматах, я подозреваю, что "просто играть в шахматы" для меня уже не зона ближайшего развития, и если я хочу развития, мне придётся читать книжки, смотреть обзоры партий на ютубе, искать живых оппонентов с которыми можно не только играть, но и обсуждать игры, и пр...

LswAgnostic

  • Ветеран
  • ****
  • Сообщений: 313
  • +29/-12
    • Просмотр профиля
Советую вам ознакомиться с статьей «Dual-Process Theories of Deductive Reasoning: Facts and Fallacies» или посмотреть видео Частые заблуждения про две системы мышления. Вы делаете специфические утверждения о работе двух систем, и у меня чувство (хоть я и не знаком с этой теорией достаточно чтобы указать конкретно) что с вашими рассуждениями что-то не так.

Спасибо, что поделились своим ощущением и подкрепили его ссылкой.  Помогает мне видеть слепые пятна в своих рассуждениях.

Виды представления знания, упорядоченные по предсказательной силе на единицу вычислительной мощности, требуемой для их использования (лучше - ниже).
- Наблюдения
- Категории и их характеристики
- Модели

В статье «Dual-Process Theories of Deductive Reasoning: Facts and Fallacies» представлено знание об особенностях работы мозга. Знание представлено в виде "категории и их характеристики".

Знание о работе мозга может быть представлено другим способом в виде моделей.

Система 1 - это черный ящик, хардварно реализующий вычисления алгоритмов.
Каждая операция алгоритма представлена в виде хардварного узла. Узлы работают параллельно.
Каждый узел подобен алгоритмической операции "если, то". Узел делает сопоставление с образцом, выбирает соответствующий ответ и передает его на следующий уровень.
Ограниченны способности по вычислению алгоритмов с циклами и рекурсиями (N-итераций цикла/рекурсии увеличивает в N раз количество требуемых узлов).
Программирование Системы 1 подобно программированию ПЛИС, FBD и т.д.

Система 2 - это черный ящик, софтварно реализующий вычисления алгоритмов.
Операция вычисляются последовательно. Есть 5-10 ячеек оперативной памяти.
В качестве операций используются подпрограммы из Системы 1.
Программирование Системы 2 подобно программированию на простых универсальных языках типа Алгол/C.

Данные модели объясняют:
- почему Система 1 не способна перемножить два двухзначных числа и способна распознавать лица
- почему Система 2 не способна перемножить 2 пятизначных числа в уме и способна это сделать при использовании внешней памяти (листка бумаги для записи)

Добавлено 09 Мая 2016, 14:27:
Если я играю в шахматы, не читая учебников, не слушая лекций, разборов партий, не решая задачек. Просто играю в шахматы. Значит ли это что мой уровень игры в шахматы растёт сам по себе? Я ведь не работаю над ним.

В каких-то случаях будет расти, в каких-то - не будет.
Рациональнее исходить из допущения, что не будет расти.

Рациональнее подходить к своему развитию рационально. )
1. Выделить свою зону ближнего развития (как вы ранее упомянули).
2. Построить предположение: реализации каких алгоритмов не хватает вашей Системе 1.
3. Оценить какие из алгоритмов уместнее получить следующими.
4. Переформулить алгоритм в вид доступный для выполнения Системой 1.
5. С помощью Системы 2 целенаправленно натаскать Систему 1 на выполнение недостающего алгоритма.
6. Проверить с помощью реальности предположения из п.2.
7. Начать с начала

Кстати, с тем примером в шахматах, я подозреваю, что "просто играть в шахматы" для меня уже не зона ближайшего развития, и если я хочу развития, мне придётся читать книжки, смотреть обзоры партий на ютубе, искать живых оппонентов с которыми можно не только играть, но и обсуждать игры, и пр...

Обращаю внимание на противоречие в ваших высказываниях.
Ранее высказывался тезис(привожу в свернутой форме) "Что об этом говорить, иди - делай", сейчас высказывается тезис "Для развития буду обсуждать".
Как устраняется это противоречие?
« Последнее редактирование: 09 Мая 2016, 14:47 от LswAgnostic »

kuuff

  • Старожил
  • *****
  • Сообщений: 2 133
  • +220/-52
    • Просмотр профиля
Обращаю внимание на противоречие в ваших высказываниях.
Ранее высказывался тезис(в свернутой форме) "Что об этом говорить, иди - делай", сейчас высказывается тезис "Для развития буду обсуждать".
Как устраняется это противоречие?
Это работало. Я фактически с нуля научился играть. Полгода назад я играл с программой на первом (нижнем) уровне сложности и выигрывал менее чем в 50% случаев. Два месяца назад я перешёл на четвёртый уровень сложности, и выигрывал там примерно в 50% случаев. И до сих пор я выигрываю на четвёртом уровне сложности примерно в 50% случаев. Что наводит на подозрения, что метод уже не работает. Я не пытался оценить прогресс применяя статистику и рисуя графики, но из того, что я наблюдаю -- нет никакого прогресса уже два месяца. Может быть и есть какой-то скрытый прогресс, который проявится позже, но поскольку я не вижу какие-такие скрытые процессы могут протекать, я подозреваю, что я достиг потолка текущего метода обучения.
Собственно даже уже не подозреваю, а совершенно определённо уверен. Я буквально вчера прочитал рассказ о том, как отец с дочкой наперегонки учились играть в шахматы, и этот рассказ превратил мои подозрения о том, что метод исчерпал себя, в уверенность. Увлекательный рассказ о разных стилях научения -- дочка училась легко и непринуждённо, чуть ли не имплицитно, папашка же кряхтел и грыз гранит теории. Дочка выигрывала, напевая песенки, а отец проигрывал несмотря на полное погружение в процесс игры и максимальное напряжение всех своих интеллектуальных способностей. Но -- честь и хвала папашке, -- он, потратив три года, научился обыгрывать свою дочку. Потому что он несмотря ни на что лез в зону ближайшего развития и развивался, а дочурка его этого не делала, просто играла в шахматы.
У папашки был создан новый "этаж" смыслов -- стратегия, дочка же продолжила мыслить на предыдущем этаже, на котором она была несомненно лучше, чем её папа, но без более высоких надстроек ей без шансов.

LswAgnostic

  • Ветеран
  • ****
  • Сообщений: 313
  • +29/-12
    • Просмотр профиля
Увлекательный рассказ о разных стилях научения -- дочка училась легко и непринуждённо, чуть ли не имплицитно, папашка же кряхтел и грыз гранит теории.

Важно учитывать различия в возможностях трансформации Системы 1 у ребенка и у взрослого.
В возрасте ребенка Система 1 способна достраивать сразу несколько уровней нейронной сети.
В возрасте взрослого Система 1 способна достраивать только по одному уровню за раз.

Допустим, для понимания иностранного языка необходимо 6 уровней НС: распознавание звуков, распознавание фонем, распознавание слов, распознавание понятий, распознавание грамматики, распознавание структуры предложений.

При предьявлении ребенку предложений на иностранном языке и получении положительного подкрепления, Система 1 ребенка способна с нуля самостоятельно выстроить 6 уровней НС.
Система 1 взрослого на такое не способна.
Для обучения взрослого необходимо с помощью Системы 2 разбить задачу на подзадачи, одна подзадача на один уровень. Предъявить их последовательно Системе 1, положительно подкрепляя и формируя НС: уровень за уровнем.

И до сих пор я выигрываю на четвёртом уровне сложности примерно в 50% случаев. Что наводит на подозрения, что метод уже не работает.

В вашем случае может сработать отработка конкретных навыков с временным понижением уровня оппонента.
Фокусировка на отработке конкретных навыков "Атака", "Наращивание сил в точке", "Выигрыш преимущества", "Быстрый размен", "Выделение угроз", "Защита от угроз". Понижение уровня помогает удерживать фокусировку, не отвлекаясь на другие моменты игры.
При отработке атакующих навыков игра ведется максимально активно. С фокусировкой на том, чтобы каждый ход увеличивал угрозу для оппонента.
При отработке защитных навыков игра ведется пассивно. С фокусировкой на усиление каждым ходом своей обороны и без реализации своих угроз.

Добавлено 09 Мая 2016, 16:20:
мне тут предпочтительней молчать, чтобы не выглядеть идиотом еще больше, чем сейчас.

Почему "молчание" предпочтительнее, чем "выглядеть идиотом"?

Почему с точки зрения рационального агента стратегия "отсутствие формирования гипотез о неизведанном" дает большую максимизацию пользы, чем стратегия "формирование самостоятельных гипотез, часть из которых окажется позже ошибочной"?
Как формулируется в данном случае "польза"? Каким способом измеряется?

Добавлено 09 Мая 2016, 16:29:
Я тут уже за рамками своей компетентности.

Имхо, это очень хорошее состояние. Оно помогает перейти от навыка "тиражирования готовых знаний" к развитию навыка "создание нового знания". При рациональности важно уметь самостоятельно размышлять. Самостоятельно наблюдать, определять понятия, моделировать, тестировать модели и применять их на практике.  Часть подходов, например, Табуирование, направлено на развитие этих навыков.
« Последнее редактирование: 09 Мая 2016, 16:29 от LswAgnostic »