Разбор аргументов против того, чтобы принимать безопасность ИИ всёрьёз |
2024-11-04 |
Иошуа Бенджио |
Выменец Максим |
kellendros95 |
просмотр |
ЧаВо по катастрофическим рискам ИИ |
2024-11-04 |
Иошуа Бенджио |
Выменец Максим |
kellendros95 |
просмотр |
Убеждения должны окупаться |
2024-10-15 |
Элиезер Юдковский |
BT |
Alaric |
просмотр |
Солнце большое, но суперинтеллекты не оставят Земле и немного света |
2024-09-27 |
Элиезер Юдковский |
Выменец Максим |
kellendros95 |
просмотр |
Суть твоя — физика |
2024-09-17 |
Элиезер Юдковский |
К. Кирдан |
KKirdan |
просмотр |
Нет универсально убедительных аргументов |
2024-09-17 |
Элиезер Юдковский |
К. Кирдан |
KKirdan |
просмотр |
Жить во многих мирах |
2024-09-17 |
Элиезер Юдковский |
К. Кирдан |
KKirdan |
просмотр |
ЧаВо по теории принятия решений |
2024-08-23 |
Люк Мюльхаузер |
Выменец Максим |
kellendros95 |
просмотр |
Стандартная аналогия |
2024-07-15 |
Zack_M_Davis |
Выменец Максим |
kellendros95 |
просмотр |
И все шогготы лишь играют |
2024-07-15 |
Zack_M_Davis |
Выменец Максим |
kellendros95 |
просмотр |
Значение успеха LLM для согласования — дебаты в одном акте |
2024-07-15 |
Zack_M_Davis |
Выменец Максим |
kellendros95 |
просмотр |
"Неправильное обобщение" — неправильный термин |
2024-07-14 |
Нейт Соарес |
Выменец Максим |
kellendros95 |
просмотр |
Стиль мышления для Безопасности ИИ |
2024-07-13 |
unknown |
Выменец Максим |
kellendros95 |
просмотр |
Ошибка безвредной сверхновой |
2024-05-21 |
unknown |
Выменец Максим |
kellendros95 |
просмотр |
В остаточном потоке трансформеров представлена геометрия состояний их убеждений |
2024-05-21 |
Адам Шай |
Выменец Максим |
kellendros95 |
просмотр |
Каузальная точка зрения на взлом вознаграждения |
2024-05-18 |
Том Эверитт, Льюис Хэммонд, Риз Уорд, Райан Кэри, Джеймс Фокс, Себастьян Бенталл, Мэтт МакДермотт, Шреш Малик. |
Выменец Максим |
kellendros95 |
просмотр |
Каузальная точка зрения на стимулы |
2024-05-18 |
Том Эверитт, Льюис Хэммонд, Риз Уорд, Райан Кэри, Джеймс Фокс, Себастьян Бенталл, Мэтт МакДермотт, Шреш Малик. |
Выменец Максим |
kellendros95 |
просмотр |
Каузальная точка зрения на агентность |
2024-05-18 |
Том Эверитт, Льюис Хэммонд, Риз Уорд, Райан Кэри, Джеймс Фокс, Себастьян Бенталл, Мэтт МакДермотт, Шреш Малик. |
Выменец Максим |
kellendros95 |
просмотр |
Каузальность: быстрое введение |
2024-05-18 |
Том Эверитт, Льюис Хэммонд, Риз Уорд, Райан Кэри, Джеймс Фокс, Себастьян Бенталл, Мэтт МакДермотт, Шреш Малик. |
Выменец Максим |
kellendros95 |
просмотр |
Вступление «Введения в каузальные основания безопасного СИИ» |
2024-05-18 |
Том Эверитт, Льюис Хэммонд, Риз Уорд, Райан Кэри, Джеймс Фокс, Себастьян Бенталл, Мэтт МакДермотт, Шреш Малик. |
Выменец Максим |
kellendros95 |
просмотр |
Обоснования безопасности: как показать безопасность продвинутого ИИ |
2024-04-23 |
Джошуа Клаймер, Ник Габриэли, Дэвид Крюгер и Томас Ларсен |
Выменец Максим |
kellendros95 |
просмотр |
GPT-2030 и катастрофические стремления - четыре зарисовки |
2024-03-25 |
Якоб Стейнхардт |
Выменец Максим |
kellendros95 |
просмотр |
Внутренние стремления и внешние злоупотребления - переплетённые риски ИИ |
2024-03-25 |
Якоб Стейнхардт |
Выменец Максим |
kellendros95 |
просмотр |
"Эмпиризм!" как анти-эпистемология |
2024-03-20 |
Элиезер Юдковский |
Выменец Максим |
kellendros95 |
просмотр |
Обзор катастрофических рисков ИИ: Источники |
2024-03-08 |
Дэн Хендрикс, Мантас Мазейка, Томас Вудсайд |
|
kellendros95 |
просмотр |
Обзор катастрофических рисков ИИ: Часто задаваемые вопросы |
2024-03-08 |
Дэн Хендрикс, Мантас Мазейка, Томас Вудсайд |
Выменец Максим |
kellendros95 |
просмотр |
Обзор катастрофических рисков ИИ: 7. Заключение |
2024-03-08 |
Дэн Хендрикс, Мантас Мазейка, Томас Вудсайд |
Выменец Максим |
kellendros95 |
просмотр |
Обзор катастрофических рисков ИИ: 6. Обсуждение связей между рисками |
2024-03-08 |
Дэн Хендрикс, Мантас Мазейка, Томас Вудсайд |
Выменец Максим |
kellendros95 |
просмотр |
Обзор катастрофических рисков ИИ: 5. Мятежные ИИ |
2024-03-08 |
Дэн Хендрикс, Мантас Мазейка, Томас Вудсайд |
Выменец Максим |
kellendros95 |
просмотр |
Обзор катастрофических рисков ИИ: 4. Организационные риски |
2024-03-08 |
Дэн Хендрикс, Мантас Мазейка, Томас Вудсайд |
Выменец Максим |
kellendros95 |
просмотр |