когда знания стали опасны

Главное > Общение

<< < (4/5) > >>

valergrad:
AlphaZero.

Ну я не знаю есть ли где-то статья которая собрала бы все в кучу. Скажем если ты пойдешь в вики https://en.wikipedia.org/wiki/AlphaZero
то там есть ряд замечаний по этому поводу. Но я просто интересуюсь этой темой, постоянный обитатель каналов, форумов и дискордов о шахматном программировании поэтому в курсе.
Если вкратце в эпохальном матче AlphaZero против Stockfish.

1. У Stockfish почему-то была взята сильно устаревшая версия.
2. Стокфиш почему-то был лишен дебютной книги ( у программы на нейронных сетях некое подобие дебютной книги зашито в мегабайтах их весов, так что это несимметричное ограничение).
3. Стокфиш почему-то был лишен эндшпильных баз ( как позже выяснилось это тоже несимметричное ограничение ).
4. Стокфиш играл на более слабом компьютере
5. Даже на этом слабом компьютере ему были установлены очень странные настройки ( например всего 1 гигабайт на хэш - напрямую влияет на его силу).
Это все поставило под сомнения превосходство Альфы над Стокфишем.
Самое главное: на просьбу дать бинарник программы чтобы поучаствовать в каком-либо из официальных чемпионатов уже на нормальных настройках - было отвечено категорическим отказом. Так что мы точно уже никогда не узнаем в какую на самом деле силу играл АльфаЗеро.

Некое представление может дать следующий тест. Авторы опубликовали архитектуру нейронной сети и алгоритм. Программа была воссоздана ( русским программистом кстати ) под названием LeelaChessZero. Шахматное сообщество помогло ее натренировать - это заняло много месяцев, а не несколько часов т.к. у шахматного сообщества гораздо меньше компьютерных мощностей чем у гугла. После полугода тренировки LeelaChessZero сыграла матч в тех же условиях с той же старой версией стокфиша - и добилась лучшего результата чем AlphaZero т.е. предположительно она играет сильней. Но в матче на нормальных настройках против последней версии стокфиша - эта же версия проиграла.
( Через несколько месяцев она сумела превзойти и последнюю версию стокфиша).

Starcraft.
Статьи выходили под заголовками "Нейросеть обыгрывает лучших игроков в старкрафт". О чем почему-то забывали часто упомянуть в этих статьях.

1. "про-игрок" был действительно "про", но играл не за свою расу ( почему нельзя было пригласить игрока своей расы - непонятно).
2. предвосхищая обвинения в "программа просто выиграла за счет реакции" они опубликовали табличку с графиками APM живого игрока и программы. Табличка была из серии "классический пример как ввести в заблуждение и попытаться внушить ложный вывод таблицей".
3. таким образом программа действительно просто использовала стократное превосходство в реакции и точности над живым человеком ( в том числе и потому что ей не нужно было осуществлять какие-то движения мышкой и клавиатурой, она напрямую вызывала функции ядра игры).
4. В дополнение ко всему было использование "всевидение" т.е. видение все карты в целом, что человеку в принципе недоступно - он видит информацию через монитор на котором в один момент времени отображается только один кусочек карты. Характерно, что когда в последней игре "всевидение" отключили - эту игру человек легко выиграл, причем метод которым он воспользовался может применить любой квалифицированный игрок.

В целом если сложилось впечатление что я критикую их достижения - вовсе нет. Это выдающиеся результаты в любом случае. Просто нужно отличать насколько они выдающиеся на самом деле от того, как их рекламируют маркетологи. Разница между "обыграть сильнейшего игрока в старкрафт" от "обыграть сильного игрока в старкрафт который играл без подготовки и за чужую расу, используя всевидение и 100-кратное преимущество в скорости реакции" довольно велика.

Особенно нужно быть подозрительным если как в случае с GPT просто говорится "у нас есть что-то выдающееся, но мы вам это не покажем".

kuuff:
А, ну то, что СМИ перевирают, это вполне нормально и естественно. Особенно это нормально и естественно, если мы говорим про США, где вообще помпезно презентовать результаты своей деятельности -- это национальная особенность.

Но в любом случае, нам рано или поздно придётся столкнутся с текстами написанными ботами. И я думаю, что скорее рано, чем поздно. Может через десять лет, может через двадцать, но постепенно мы выйдем на то, что приходя на новостной сайт, я буду смотреть персонализованный аналог телевизионных новостей, с интерактивным ведущим, который будет реагировать на мои замечания и либо пропускать какие-то детали, либо наоборот подсыпать ещё деталей.

valergrad:
Вспомнил что я расписывал про слабость AI для Старкрафта, у которого маркетологи сильно преувеличили реальную силу в новостях год назад.
На днях вышло доказательство моих слов: новая версия программы от DeepMind после того как в ней убрали "читерство" сделала большой шаг назад. После года "доработки" сейчас ее уровень игры в районе 6000 MMR, это даже не уровень грандмастер лиги ( у топовых человеческих игроков 6700-7000).

https://www.youtube.com/watch?v=mpAUufSzaUo

Моя фраза:

--- Цитировать --- Разница между "обыграть сильнейшего игрока в старкрафт" от "обыграть сильного игрока в старкрафт который играл без подготовки и за чужую расу, используя всевидение и 100-кратное преимущество в скорости реакции" довольно велика.
--- Конец цитаты ---

Оказалась верна. И за год эту разницу не покрыли даже на 5%.

Alaric:
valergrad
Я тут подумал, что с другой стороны, в реальных задачах то же "всевидение" и "скорость реакции" у ИИ - "это не баг, это фича". В смысле, если мы вдруг фантазируем, скажем, ИИ, который играет на бирже или вообще вмешивается в политику, то никто же его не будет ограничивать одним экраном монитора и никто не будет ему тормозить реакцию до человеческой.

Это я к тому, что тут вопрос, какое явление мы хотим проиллюстрировать. Если мы, допустим, обсуждаем опасность ИИ, цели которого не соответствуют целям человечества, то скорость реакции - это вполне "законное преимущество".

valergrad:
"В смысле, если мы вдруг фантазируем, скажем, ИИ, который играет на бирже или вообще вмешивается в политику, то никто же его не будет ограничивать одним экраном монитора и никто не будет ему тормозить реакцию до человеческой."

Это верно. Но речь о том, что как только реакцию понизили до околочеловеческого уровня ( на самом деле она все еще намного выше чем даже у самых топовых игроков, но уже не 100 раз, а скажем, в 5) стала очевидна скажем так "тупость" этого ИИ которого первый же неожиданный маневр человека выводит из колеи. Например, эта нейронная сеть за миллион или сколько там игр не освоила концепцию "невидимых" юнитов. Я наблюдал, кстати, поведение людей в похожих ситуациях. Умный человек понимает, что нужен способ их детектить буквально после первой же проигранной таким образом игры, сразу же гуглит, спрашивает или исследует этот вопрос сам. Тем не менее я видел людей которые не задаются этим вопросом пока не потерпят, скажем, с десяток поражений от "невидимок". Меня всегда подобное поражало, но это действительно так ( и это имхо один из способов измерять интеллект ). Но миллион игр? Это уже за гранью. При этом за счет многократного превосходства в скорости реакции она все равно побеждала 99% игроков.

Теперь представим себе нейронную сеть которая показала блестящие биржевые результаты, скажем, анализируя новостные ленты. Лучше чем 99.9% людей. За счет своей скорости реакции и способности работать 24 часа в сутки. Мы ее внедряем повсеместно.... а потом оказывается что она не понимает концепцию "1-го апреля". И 1-го апреля следующего года мы получаем мировой финансовый крах.

Поэтому, нужно быть очень аккуратно относится к тому, если превосходство было получено скажем так, методом грубой силы. Чем грубее сила используется - тем более скептически нужно относиться к этому. Грубая сила хороша для проверки различных способов обучения, но финальная, лучшая версия, должна побеждать не с помощью ее.

В копилку кстати "пессимистических" новостей об AI. Помните AlphaZero который "разгромил" Stockfish? У меня еще были претензии к условиям матча. Тем не менее 15-й чемпионат шахматных программ в прошлом году все же выиграла улучшенная версия AlphaZero - в начале этого года и там все было честно и не подкопаешься. Но в только что завершимшемся 16-м чемпионате чемпионство завоевала улучшенная версия Stockfish - проанализировав поражения, ее авторы программ улучшили ее и она смогла взять реванш. Таким образом, "алгоритмическая" версия смогла обойти "нейронную", после того как "нейронная" показала ей ее слабости ( люди этого уже сделать на таком уровне, понятно, не могли). Как бы не оказалось, что после прогресса и бума 2013-2019 мы опять не застрянем с машинным обучением как это уже было не раз. Только на более высокой ступеньке, конечно, с большим количеством задач которые мы умеем решать.

Навигация

[0] Главная страница сообщений

[#] Следующая страница

[*] Предыдущая страница

Перейти к полной версии