Последние сообщения

Последние сообщения

Страницы: 1 ... 6 7 [8] 9 10
71
Общение / Re: Краткая история человечества
« Последний ответ от Gradient 07 Июля 2019, 16:05 »
Добавлю немного взгляда со стороны машинного обучения =)
В машинном обучении есть такая штука как обученная модель. Мы берём данные наблюдений и подбираем некий алгоритм, который мог бы их сгенерировать - такой алгоритм называется обученной моделью. Никто не ставит целью сгенерировать датасет идеально точно - надо лишь сделать функцию ошибки поменьше. В смысле, схема такая: есть известные данные, есть наша модель, есть некоторые неизвестные данные. Мы запускаем модель на известных данных, и она предсказывает неизвестные - например, по положению Юпитера минуту назад предсказывает его положение через минуту.
Этот этап аналогичен формированию гипотезы на базе наблюдений.
Следующий этап - кроссвалидация. У нас есть некие данные, которых не было на этапе обучения. Мы запускаем модель на этих данных и проверяем, чему равна, допустим, среднеквадратическая ошибка.
Этот этап аналогичен эксперименту.
А затем, если нас устраивает точность, мы эту модель пускаем в продакшн - и это аналогично тому, как если бы мы по итогам экспериментов назвали гипотезу теорией.

Я это к чему всё говорил. Каждый раз, когда теория с эпициклами проваливалась - выяснялась её недостаточная точность - эту теорию, с точки зрения машинного обучения, отправляли на помойку, а в прод пускали другую теорию - в которой на один эпицикл больше. Эксперимент над одной теорией про эпициклы не позволял сказать что-либо о других теориях, основанных на эпициклах.
Конкретную обученную модель вполне можно опровергнуть (увидеть, что она в среднем даёт неудовлетворительное качество прогноза). Опровергнуть, возможно, нельзя всё семейство моделей, то есть все теории, основанные на эпициклах.

Потом. Теория - это не просто что-то, что верно или неверно. У теории есть уровень точности - среднеквадратическая ошибка, например, на отложенной выборке. Поэтому если некая теория работает неудовлетворительно, но альтернатив нет... Появился над-теория: "Теория Х верна в случаях А, Б, В, в остальных случаях аппроксимируем искомую величину белым шумом". Мы выкинули из прода теорию Х, и поместили туда эту над-теорию.

Кроме того, есть такой подход к созданию моделей, как бустинг. В реальной жизни это выглядит так: мы сделали теорию, она прогнозирует траектории планет, но допускает какие-то систематические промахи. Мы говорим: ну, значит, там есть ещё какое-то воздействие. Именно оно объясняет эти ошибки! Назовём его тёмной материей! И создаём новую теорию, которая прогнозирует эти ошибки. Дальше смотрим - а даже сумма из этих двух теорий даёт не вполне точный прогноз. И придумываем новую теорию, которая прогнозировала бы эти ошибки.
Получается стопка теорий, и это похоже на эпициклы. Но это в целом работает.
А потом приходит какой-нибудь новый теоретик и находит, как 2-3 слоя "эпициклов" заменить одной теорией, которая проще, чем эти слои в сумме. И получается новая теория, которая обычно прогнозирует лучше. Просто потому, что обычно более простые теории, при прочих равных, дают лучший прогноз.

Заменить неправильные факты на правильные можно, но в таком случае мы получим иную теорию - в том смысле, что она не будет с точностью до бита совпадать со старой и не будет давать точно такие же прогнозы. Но она может быть из того же семейства - то есть формулы такие же, а константы другие. А может выйти, что при замене верных фактов на неверные, мы не сможем подобрать константы. Если y=x^2, то какие коэффициенты не подбирай, линейная зависимость будет предсказывать Y достаточно плохо.

Так что если у нас теория плохо предсказывает, мы можем её загнать в рамки или усилить "эпициклами", то есть бустингом. И держать постоянно в уме, что она не очень точная. И отбросить её, когда появится что-то получше.
72
Общение / Re: Краткая история человечества
« Последний ответ от kuuff 02 Июля 2019, 13:46 »
Ну да, примерно так. Неверные факты можно выкинуть и заменить верными. Теории как правило переживают такую операцию без особых потерь.
73
Общение / Re: Краткая история человечества
« Последний ответ от Pony 02 Июля 2019, 12:29 »
Э... А я не поняла. Теория - это такая точка зрения? "Я художник, я так вижу"? В пень факты, я так вижу, а факты меня не устраивают. Чем теория тогда отличается от фэнтези, например? А Харари именно это и делает: искажает, игнорирует или выдумывает несуществующие факты.
74
Общение / Re: когда знания стали опасны
« Последний ответ от kuuff 27 Июня 2019, 18:20 »
А, ну то, что СМИ перевирают, это вполне нормально и естественно. Особенно это нормально и естественно, если мы говорим про США, где вообще помпезно презентовать результаты своей деятельности -- это национальная особенность.

Но в любом случае, нам рано или поздно придётся столкнутся с текстами написанными ботами. И я думаю, что скорее рано, чем поздно. Может через десять лет, может через двадцать, но постепенно мы выйдем на то, что приходя на новостной сайт, я буду смотреть персонализованный аналог телевизионных новостей, с интерактивным ведущим, который будет реагировать на мои замечания и либо пропускать какие-то детали, либо наоборот подсыпать ещё деталей.
75
Общение / Re: Краткая история человечества
« Последний ответ от kuuff 27 Июня 2019, 18:15 »
kuuff, если мы лишаем себя возможности сказать "здесь я совершенно не согласен", "здесь я согласен на 90%", "здесь я полностью согласен" - то мы уравниваем все теории. И теория "Лысые не должны занимать высокие государственные посты т.к. мы видим что их правление ведет к неудачам" становится в один ряд с какой-нибудь теорий Цивилизаций Шпенглера.

Да, мы уравниваем теории, но уравниваем их по одному не очень существенному показателю. Высота болида формулы 1 равна высоте ребёнка. Мы их уравняли? Да. Но разве это так важно?

С теорией бессмысленно соглашаться или не соглашаться, можно соглашаться или не соглашаться с конкретным применением этой теории. Классическая гравитация Ньютона или ОТО. С какой я больше согласен? А это совершенно не важно, потому что в любом конкретном случае я буду выбирать теорию, которая даст мне удовлетворительный результат минимумом усилий. В одних случаях это будет гравитация Ньютона, в других Эйнштейна.

Это не значит, что не существует бесполезных теорий, но у нас нет надёжного способа априорно судить о том, что полезно, а что нет.

Кроме того Харари изучал именно историю, археология, антропология и история - это не совсем гуманитарные науки, и именно они критиковали его книгу.
О, гуманитарность наук здесь не при чём. Совершенно та же самая штука ярко работает в математике, где теория Галуа запиленная для решения какой-то дурацкой задачи -- поиска корней многочлена в радикалах, -- внезапно оказыается прорывной теорией, с далекоидущими последствиями. Или геометрия Лобачевского, которая выглядела как совершенно бесполезное теоретизирование, но вдруг нашла применение в ОТО. Или основания математики, которые шатаются, меняются, но основное здание математики остаётся неизменным. Казалось бы, каждое изменение оснований должно приводить к коренной перестройке математики, но нет, ничего подобного.

Кроме того, теорию невозможно опровергнуть фактами. Да, я знаю, Юдковский думает иначе, но он ошибается. Вся история науки показывает, что теории неопровержимы фактами. Птомлеевская система нарашивала эпициклы, когда сталкивалась с фактами противоречащими ей, и это позволяло ей существовать. Чтобы птомлеевскую систему опровергнуть, потребовалась система Коперника, и то ей удалось это не сразу, а когда концентрические окружности были заменены эллипсами (то есть теория Коперника, столкнувшись с противоречащими ей фактами, просто впитала их, и продолжила существовать, как ни в чём не бывало). Или взять закон Менделя -- Мендель ведь настолько был убеждён в правоте своей теории, что он подтасовывал данные, чтобы доказать её. Я не помню деталей, но он не сразу нашёл горох, чтобы поставить на нём убедительный эксперимент без фальсификаций, до гороха он на чём-то другом доказывал свой закон, и современные биологи сказали, что данные полученные Менделем могли быть получены только подтасовкой (если интересны подробности, вы скажите, я одолею свою лень и найду их).

В ГПиМРМ Поттер как-то приводит пример с Нептуном, про который астрономы не знали, но который влиял на движение других планет. И астрономы ведь не вышвырнули свои теории гравитации из-за того, что данные не сходились. А ось вращения Солнца? Современные модели формирования планетарной системы не могут объяснить неперпендикулятность оси вращения солнца плоскости эклиптики. Современные модели построены на ОТО, они не предсказывают факты и даже не объясняют задним числом факты, значит ОТО следует выкинуть в окно? Не, этот факт просто положили в сторонку, и продолжили пользоваться ОТО. Сейчас нашли возможное объяснение в виде планеты, которая была захвачена Солнцем давным давно, и которая вращается вне плоскости эклиптики, и делая так в течение миллиардов лет поворачивает всю плоскость. Но десятилетями этого объяснения не было, и это не мешало ОТО доминировать.

И кстати, Томас Кун своими этапами научных эволюций заявил именно это, теория не может быть опровергнута фактами. Правда Кун рассматривал исключительно удобные ему науки, типа физики, где всегда есть ровно одна парадигма, в гуманитарных науках же всегда есть ещё одна парадигма. В естественных науках это тоже попадается (скажем модифицированный закон гравитации Эйнштейна, который позволяет описывать движение звёзд некоторых галактик без привлечения тёмной материи), но там, обычно, благодаря наличию формул и вообще высокой степени формализации, возможно чётко установить связь между разными теориями и объяснить как из одной вытекает другая и обратно. В том смысле, что в физике можно объяснить почему есть две парадигмы, и зачем они нужны две разные. В гуманитарных науках это не всегда возможно чётко проследить.
76
Общение / Re: Краткая история человечества
« Последний ответ от valergrad 24 Июня 2019, 18:46 »
kuuff, если мы лишаем себя возможности сказать "здесь я совершенно не согласен", "здесь я согласен на 90%", "здесь я полностью согласен" - то мы уравниваем все теории. И теория "Лысые не должны занимать высокие государственные посты т.к. мы видим что их правление ведет к неудачам" становится в один ряд с какой-нибудь теорий Цивилизаций Шпенглера.
Кроме того Харари изучал именно историю, археология, антропология и история - это не совсем гуманитарные науки, и именно они критиковали его книгу.
77
Общение / Re: когда знания стали опасны
« Последний ответ от valergrad 24 Июня 2019, 14:47 »
AlphaZero.

Ну я не знаю есть ли где-то статья которая собрала бы все в кучу. Скажем если ты пойдешь в вики https://en.wikipedia.org/wiki/AlphaZero
то там есть ряд замечаний по этому поводу. Но я просто интересуюсь этой темой, постоянный обитатель каналов, форумов и дискордов о шахматном программировании поэтому в курсе.
Если вкратце в эпохальном матче AlphaZero против Stockfish.

1. У Stockfish почему-то была взята сильно устаревшая версия.
2. Стокфиш почему-то был лишен дебютной книги ( у программы на нейронных сетях некое подобие дебютной книги зашито в мегабайтах их весов, так что это несимметричное ограничение).
3. Стокфиш почему-то был лишен эндшпильных баз ( как позже выяснилось это тоже несимметричное ограничение ).
4. Стокфиш играл на более слабом компьютере
5. Даже на этом слабом компьютере ему были установлены очень странные настройки ( например всего 1 гигабайт на хэш - напрямую влияет на его силу).
Это все поставило под сомнения превосходство Альфы над Стокфишем.
Самое главное: на просьбу дать бинарник программы чтобы поучаствовать в каком-либо из официальных чемпионатов уже на нормальных настройках - было отвечено категорическим отказом. Так что мы точно уже никогда не узнаем в какую на самом деле силу играл АльфаЗеро.

Некое представление может дать следующий тест. Авторы опубликовали архитектуру нейронной сети и алгоритм. Программа была воссоздана ( русским программистом кстати ) под названием LeelaChessZero. Шахматное сообщество помогло ее натренировать - это заняло много месяцев, а не несколько часов т.к. у шахматного сообщества гораздо меньше компьютерных мощностей чем у гугла. После полугода тренировки LeelaChessZero сыграла матч в тех же условиях с той же старой версией стокфиша - и добилась лучшего результата чем AlphaZero т.е. предположительно она играет сильней. Но в матче на нормальных настройках против последней версии стокфиша - эта же версия проиграла.
( Через несколько месяцев она сумела превзойти и последнюю версию стокфиша).


Starcraft.
Статьи выходили под заголовками "Нейросеть обыгрывает лучших игроков в старкрафт". О чем почему-то забывали часто упомянуть в этих статьях.

1. "про-игрок" был действительно "про", но играл не за свою расу ( почему нельзя было пригласить игрока своей расы - непонятно).
2. предвосхищая обвинения в "программа просто выиграла за счет реакции" они опубликовали табличку с графиками APM живого игрока и программы. Табличка была из серии "классический пример как ввести в заблуждение и попытаться внушить ложный вывод таблицей".
3. таким образом программа действительно просто использовала стократное превосходство в реакции и точности над живым человеком ( в том числе и потому что ей не нужно было осуществлять какие-то движения мышкой и клавиатурой, она напрямую вызывала функции ядра игры).
4. В дополнение ко всему было использование "всевидение" т.е. видение все карты в целом, что человеку в принципе недоступно - он видит информацию через монитор на котором в один момент времени отображается только один кусочек карты. Характерно, что когда в последней игре "всевидение" отключили - эту игру человек легко выиграл, причем метод которым он воспользовался может применить любой квалифицированный игрок.

В целом если сложилось впечатление что я критикую их достижения - вовсе нет. Это выдающиеся результаты в любом случае. Просто нужно отличать насколько они выдающиеся на самом деле от того, как их рекламируют маркетологи. Разница между "обыграть сильнейшего игрока в старкрафт" от "обыграть сильного игрока в старкрафт который играл без подготовки и за чужую расу, используя всевидение и 100-кратное преимущество в скорости реакции" довольно велика.

Особенно нужно быть подозрительным если как в случае с GPT просто говорится "у нас есть что-то выдающееся, но мы вам это не покажем".
78
Общение / Re: Краткая история человечества
« Последний ответ от kuuff 23 Июня 2019, 16:02 »
Одно из главных моих интеллектуальных достижений в процессе получения гуманитарного образования -- это мысль о том, что гуманитарные теории не для того, чтобы соглашаться с ними или не соглашаться. Гуманитарная теория -- это своего рода точка зрения, которая позволяет посмотреть на объект исследования с другого угла. Основная фишка в том, что описывая проблему в рамках разных теорий, мы замечаем гораздо больше нюансов в этой проблеме. Чем больше теорий мы используем для анализа проблемы, тем больше нюансов мы видим. Не все эти нюансы мы будем затем учитывать, решая проблему, но решение о том, что учитывать, а что игнорировать, надо принимать в каждой конкретной проблеме, а не один раз и навсегда.

Собственно, такое положение дел неизбежно в гуманитарных науках, потому что они работают с очень сложными вещами, в которых очень много внутренних взаимосвязей, отследить все невозможно хотя бы из-за их количества, но есть ещё и проблемы методологические: не на все взаимосвязи есть практические методы, позволяющие их заметить и исследовать. Ни одна теория не может описывать проблему сколь-нибудь полно.
79
Общение / Re: когда знания стали опасны
« Последний ответ от kuuff 23 Июня 2019, 16:02 »
достижения нейронных сеток в шахматах, доте и старкрафте ( AlphaZero, OpenAI, OpenMind ) были серьезно сфальсифицированы т.е. преувеличены, эксперты в каждой области были весьма недовольны

Где можно об этом почитать подробнее?
80
Общение / Re: когда знания стали опасны
« Последний ответ от valergrad 23 Июня 2019, 15:32 »
Просто коммент: совершенно не уверен что тексты сгенеренные нейросетками так хороши, что их невозможно отличить.  По моему опыту в нейросетях сейчас маркетинг идет на три головы вперед реальных достижений. Так достижения нейронных сеток в шахматах, доте и старкрафте ( AlphaZero, OpenAI, OpenMind ) были серьезно сфальсифицированы т.е. преувеличены, эксперты в каждой области были весьма недовольны, хотя публика "схавала". Не исключено что и чудесная сеть генерирующая связный текст "которую мы вам не дадим" это просто миф и уровень текста там лишь немногим лучше выпущенной в публичный доступ. Выпущенную в публичный доступ каждый может потестить самостоятельно - до связного текста ей как до луны, а тайная отличается лишь в несколько раз большим числом параметров.

Конечно рано или поздно и этот барьер будет преодолен... но не уверен что в тот момент нас будет волновать именно жалкая человеческая политика.
Страницы: 1 ... 6 7 [8] 9 10