Вход
Топ раздела
За неделю
Общий

AlphaZero за 4 часа научилась безупречно играть в шахматы

Новости городские, российские, международные. От цен на нефть, до глобального потепления!

Модераторы: Laisa, Messir, Zorg

СообщениеОптимист Мой Господин Мой Господин 59
Оставил 17069 сообщений с 22 мар 2007
ФР: 621723
8 декабря 2017 в 15:18

Читать статью строго под эту музыку! :D

Нейросеть AlphaZero всего за четыре часа научилась безупречно играть в шахматы
Спустя 20 лет после того, как компьютерная программа DeepBlue победила чемпиона мира Гарри Каспарова, в шахматах грянула новая революция.

Алгоритму AlphaZero, разработанному Google и DeepMind, хватило всего четырех часов игры с самим собой, чтобы самостоятельно синтезировать шахматные знания человечества за полтора тысячелетия и достичь уровня, который не только превосходит людей, но и позволяет громить чемпионов среди компьютерных алгоритмов.

Все блестящие хитрости и утонченности, которые программисты использовали для создания шахматных движков, были отправлены на свалку истории, отмечает портал Chess24.com.
Нейросеть победила сильнейшую шахматную компьютерную программу Stockfish 8 в ста партиях, не проиграв ни одной. Играя белыми, AlphaZero добилась 25 побед при 25 ничьих. Без преимущества первого хода ей удалось выиграть три партии при 47 ничьих. Итого в ста играх нейросеть одержала 28 побед, сведя остальные 72 вничью.

Как утверждают разработчики, AlphaZero достигла этого уровня всего через четыре часа после того, как в нее были загружены только базовые правила игры в шахматы, без дополнительных сведений о тактике, алгоритмах и дебютах.

В отличие от традиционных шахматных программ, AlphaZero выбирает ход не за счет перебора возможных вариантов, а применяя собственные алгоритмы, выработанные при самообучении. Для сравнения: AlphaZero рассматривала 80 тысяч позиций за секунду, тогда как Stockfish - до 70 миллионов.

Ранее детище DeepMind потратило два часа на постижение сеги (японские шахматы) и за восемь часов научилась безупречной игре в го.

По мнению компании-разработчика, в будущем подобные нейро-алгоритмы смогут решать важные исследовательские задачи, включая разработку новых лекарств и материалов.

http://www.newsru.com/sport/08dec2017/deep.html

Это может конечно и не так важно, как выступление Коли из Ургеноя, но всё-таки. Для тех кто не очень впечатлился: эту нейросеть никто не учил, загрузили базовые правила - 4 часа и уровень гроссмейстер+. 2000 лет человечества уложились в несколько часов.
Кстати, AlphaZero универсальна - в отличие от AlphaGo (или AlphaGoZero), она не заточена под одну определённую игру - спектр возможностей, куда её можно приткнуть, огромен...
Начало конца? :roll:
0
Бессмертный

СообщениеБессмертный Astor Astor 241
Оставил 8649 сообщений с 18 мар 2007
ФР: 400020
8 декабря 2017 в 20:33

Мой Господин,
Начало конца?

Естественно. Даже ожидаемо.
Ньюанс маленький - "не дождётесь"! В смысле рано паниковать. Лет двадцать у нас есть.
0
Продвинутый

СообщениеПродвинутый Timoha07 Timoha07 46
Оставил 508 сообщений с 26 ноя 2012
ФР: 40297
9 декабря 2017 в 18:29

AlphaZero
- случайно не в Кибердайне разработана, а подругому называется Скайнет?
0

СообщениеОптимист Мой Господин Мой Господин 59
Оставил 17069 сообщений с 22 мар 2007
ФР: 621723
9 декабря 2017 в 23:00

Timoha07, Astor, ну "Терминатор" - это для антуражу. :)
Да и угроза далеко не только в том, будто бы ИИ захочет нас уничтожить (хотя и такой вариант не исключён), но вот, например, коллапс экономики из-за этого очень даже возможен.
Для понимания масштабов трагедии, рекомендую почитать эту статью: Автономные грузовики размажут наше общество по асфальту. Или тут, хороший заголовок: Truck drivers like me will soon be replaced by automation. You're next (Дальнобойщики, такие как я, скоро будут замещены автоматами. Ты следующий). И это не просто потенциальная угроза "когда-то может быть в неопределённом будущем", а уже вполне реальная проблема: первые караваны беспилотников (хотя, пока с сопровождением) уже рассекают дороги США. То же произойдёт с массой других профессий, а ряд оставшихся ждёт пусть и не скорое исчезновение, но серьёзное сокращение штата.
Но это ещё не всё. Допустим, перешёл например тот же Apple на максимально возможное автоматизированное производство: айфончики собираются на полностью автоматизированных заводах, инженерная часть и софт сами собой клепаются. Ну бухгалтерия и маркетинг тоже само собой. Никому зарплату платить не надо, даже аренда помещений ужата до минимума. Из живых сотрудников остались только акционеры. Красота! Только вот буржуи вскоре обнаружат, что айфоны покупать то некому: работы то не у кого нет. И даже украсть неоткуда. И останутся сами капиталисты без особой прибыли. Вот и наступит тот самый коллапс: экономика может быть просто уничтожена. Что дальше - непонятно.
Можно конечно привести контраргументы, провести параллели из истории про замещения кучеров, машинисток, телефонистов и ряда других профессий. Но это всё происходило в разные периоды, да ещё и растянутые на десятилетия. Было время на переквалификацию и всё такое. Здесь же процесс может быть ограничен лишь несколькими годами и для огромного числа людей сразу.
Вариант переделки налоговой системы и введение безусловного дохода (для всех или для некоторых), предлагаемый в качестве панацеи, представляется мне сомнительным шагом. Причём, достаточно сложным.
В общем, перспективы могут быть те ещё, и без всяких "Скайнет".

Кстати, ещё интересный момент: например, фейковые новости, как известно, есть уже сейчас, но скоро, благодаря нейросетям, могут выйти на качественно новый уровень. Смотрит сюда:

Настоящее видео - то что слева. Преобразование зимнего оригинала в "летний режим" происходит в реальном времени. И развиваются подобные технологии очень быстро - лет 5 назад я бы не поверил, что такое станет возможным уже сейчас. Что будет ещё через 5-10 лет, боюсь даже предположить.

Ни в коем случае не являюсь луддитом - запрещать развитие подобных технологий нельзя, да и малореально - но надо что-то думать и делать, как с этим всем жить. Многие не считают эту проблему серьёзной и актуальной, но когда гром грянет - креститься уже будет скорее всего поздно.
0
Бессмертный

СообщениеБессмертный Astor Astor 241
Оставил 8649 сообщений с 18 мар 2007
ФР: 400020
10 декабря 2017 в 00:24

Мой Господин, совершенно согласен. Когда люди остаются без дела, они начинают маятся дурью. Дури будет много.
И возможно "фейковая реальность" станет очень востребована для купирования этой проблемы.
Нечто подобное (даже очень похожее) описана у Лема в повести футурологический конгресс
!971 год, а каков прогноз!
0
Почётный форумовец

СообщениеПочётный форумовец gas69rus gas69rus 206
Оставил 5556 сообщений с 20 дек 2009
ФР: 503471
10 декабря 2017 в 22:13

И все эти новшества сгинут на просторах России благодаря дуракам и дорогам и ворам. И компьтер в очередной раз выдаст "данной ситуации не может быть" и уйдёт в аварийный режим или заблокирует все дальнейшие действия. Этому есть даже подтверждения. На всех иномарках при конфликте датчиков коленвала и распредала авто заводится сначала принимая один сигнал как достоверный, потом другой. А вот на российском авто ГАЗ с мозгами фирмы бош, авто просто не заводится. Как то так.
0

СообщениеОптимист Мой Господин Мой Господин 59
Оставил 17069 сообщений с 22 мар 2007
ФР: 621723
11 декабря 2017 в 02:15

Astor писал(а):Мой Господин, совершенно согласен. Когда люди остаются без дела, они начинают маятся дурью. Дури будет много.
И возможно "фейковая реальность" станет очень востребована для купирования этой проблемы.
Нечто подобное (даже очень похожее) описана у Лема в повести футурологический конгресс
!971 год, а каков прогноз!

Это классика! И довольно точно попавшая в цель. Не в деталях, конечно, но общее направление довольно близкое к происходящему.

gas69rus писал(а):И все эти новшества сгинут на просторах России благодаря дуракам и дорогам и ворам. И компьтер в очередной раз выдаст "данной ситуации не может быть" и уйдёт в аварийный режим или заблокирует все дальнейшие действия.

Охоспадди! Как всё таки анекдоты влияют на мировоззрение. :)

Насчёт собственно новости. Ради интереса почитал побольше и расспросил знакомых любителей шахмат: говорят, шахматный мир в шоке. Эта хрень не только сама вывела довольно крутые приёмы, которые чёрте сколько лет обкатывали на теории и практике, но и показала несколько новых интересных комбинаций - что для такой изъезженной вдоль и поперёк игры, как шахматы, очень себе прорыв.
Также не обошлось и без критики в интернете. Например, есть мнение, будто железо было очень разное - дескать, у AlphaZero оно было на порядок мощнее, да ещё и сильно специализированное. Загуглил по железу - не нашёл нужной инфы. Также упирают на то что программа-оппонент (Stockfish) играла не в полную силу, поскольку была лишена дебютной книги и эндшпильных таблиц, хотя была разработана именно с их активным применением.
Впрочем, есть и контраргументы этой критики. Кто-то утверждает, что в данном случае глупо мерить производительность флопсами - слишком разные системы. Кто-то говорит про не особую критичность дебютных и эндшпильных книг, да и что для самой AlphaZero их тоже никто не предоставлял - так что всё по честному.
Ну и контраргументы контраргументов. Всё как обычно. :)
В общем, пока есть и сомнения тоже - куда ж без них? Также интересный момент: создатели нейросети пока почему-то отказались от комментариев прессе.
0
Приближенный к ...

СообщениеПриближенный к ... mcyr mcyr 85
Оставил 3040 сообщений с 27 мар 2007
ФР: 147591
11 декабря 2017 в 09:48

Если эта хрень такая "умная", то логично следующим этапом приспособить ее к игре на бирже.
Вот где будет шухер!
Кстати, обучилась она все-таки не за 4 часа, а за 24
0

СообщениеОптимист Мой Господин Мой Господин 59
Оставил 17069 сообщений с 22 мар 2007
ФР: 621723
11 декабря 2017 в 10:29

mcyr писал(а):Если эта хрень такая "умная", то логично следующим этапом приспособить ее к игре на бирже.
Вот где будет шухер!

Мне кажется, полноценная и самостоятельная игра на бирже - всё же существенно сложнее: хотя бы потому что надо разбирать естественные языки. И процесс самообучения не так то прост: если шахматные правила очень простые, и эмуляция шахматной доски с фигурами не представляет трудностей, то как реализовать реалистичную эмуляцию всех этих финансовых потоков?
Впрочем, как вспомогательный инструмент, ИИ на биржах давно применяют. Но там не такое самообучение как у AlphaZero, а "скармливание" адаптированной аналитики с результатами прошлого, чтобы система сама вывела закономерности. Кстати, когда Nvidia выпустила свой DGX - первые предзаказы почти полностью от биржевиков были. :D
Впрочем, думаю, Вы лучше знаете. :)

mcyr писал(а):Кстати, обучилась она все-таки не за 4 часа, а за 24

Везде пишут про 4 часа.
Ещё пишут, что после победы над Stockfish, она за 2 часа научилась играть на безупречном уровне в сёгу (японская настольная игра).
0
Гуру

СообщениеГуру cancerwa cancerwa 17
Оставил 893 сообщений с 12 авг 2009
ФР: 24480
11 декабря 2017 в 13:10

За 4 часа научилась играть в шахматы. Доска 8х8 и ходы делаются конкретным образом.
За 8 часов научилась играть в го. Доска 19х19 и ходы делаются практически в любое место.
Как бы это говорит о переборе вариантов, мне кажется.
0

СообщениеОптимист Мой Господин Мой Господин 59
Оставил 17069 сообщений с 22 мар 2007
ФР: 621723
11 декабря 2017 в 13:56

cancerwa писал(а):Как бы это говорит о переборе вариантов, мне кажется.

Количество всевозможных позиций в шахматах ~10^43. Долго перебирать бы пришлось даже на всех компьютерах мира! :D
0
Гуру

СообщениеГуру cancerwa cancerwa 17
Оставил 893 сообщений с 12 авг 2009
ФР: 24480
11 декабря 2017 в 19:26

Мой Господин писал(а):
cancerwa писал(а):Как бы это говорит о переборе вариантов, мне кажется.

Количество всевозможных позиций в шахматах ~10^43. Долго перебирать бы пришлось даже на всех компьютерах мира! :D

"Это число, однако, включает также ситуации, исключаемые правилами игры и поэтому недосягаемые в дереве возможных ходов. В настоящее время появился ряд работ, уточняющих или даже опровергающих это число."

Шахматы просчитаны уже давно. И более примитивными прогами.
А вот топ-про в го смогла осилить только AlphaGo в 2016.
0
Приближенный к ...

СообщениеПриближенный к ... mcyr mcyr 85
Оставил 3040 сообщений с 27 мар 2007
ФР: 147591
11 декабря 2017 в 21:12

Мой Господин писал(а):Мне кажется, полноценная и самостоятельная игра на бирже - всё же существенно сложнее: хотя бы потому что надо разбирать естественные языки.
И процесс самообучения не так то прост: если шахматные правила очень простые, и эмуляция шахматной доски с фигурами не представляет трудностей, то как реализовать реалистичную эмуляцию всех этих финансовых потоков?
Впрочем, как вспомогательный инструмент, ИИ на биржах давно применяют. Но там не такое самообучение как у AlphaZero, а "скармливание" адаптированной аналитики с результатами прошлого, чтобы система сама вывела закономерности. Кстати, когда Nvidia выпустила свой DGX - первые предзаказы почти полностью от биржевиков были. :D
Впрочем, думаю, Вы лучше знаете. :)

Ну, черт его знает, как это можно реализовать! Если б я знал - я бы не здесь находился! :)
Естественные языки тут не главная проблема, если вообще проблема. Торговлю с голоса уже врядли можно где найти - везде электронные торги. Поток ордеров виден всем желающим, сделки тоже. И даже новости вовсе необязательно читать - цена рванулась вверх, толпа начала покупать, какая разница по какой причине?
Правило-то главное всего одно: купить дешевле и продать дороже. Ну есть еще правила биржи, их по части собственно торговли не так уж много.
Только в отличие от шахмат участников не двое, а могут быть миллионы, и все они действуют исходя из своих собственных интересов и вовсе не всегда разумно.
Вот если эта хрень придумает как этим воспользоваться...
Мой Господин писал(а):
mcyr писал(а):Кстати, обучилась она все-таки не за 4 часа, а за 24

Везде пишут про 4 часа.
Ещё пишут, что после победы над Stockfish, она за 2 часа научилась играть на безупречном уровне в сёгу (японская настольная игра).

Насколько я понял - статья разработчиков:
https://arxiv.org/pdf/1712.01815.pdf
0
Гуру

СообщениеГуру cancerwa cancerwa 17
Оставил 893 сообщений с 12 авг 2009
ФР: 24480
11 декабря 2017 в 21:51

2 часа в сёги, 4 в шахматы и 8 в го ушло на достижение рейтинга Эло программ-чемпионов по этим дисциплинам.
Поскольку два равных игрока имеют равные шансы 50/50 на победу, то для стабильного превосходства проге надо еще время, примерно еще такое же. Там графики на Фигуре 1 есть.
Поэтому 24 часа - это время обучения проги шахматам, сёги и го вместе взятым до момента превосходства над соответствующими прогами-чемпионами.
0

СообщениеОптимист Мой Господин Мой Господин 59
Оставил 17069 сообщений с 22 мар 2007
ФР: 621723
11 декабря 2017 в 22:32

cancerwa писал(а):Шахматы просчитаны уже давно. И более примитивными прогами.

Может, конечно, у нас разные понимания слова "просчитаны", но в классическом смысле просчитаны лишь эндшпильные таблицы до 7 фигур. Ну ещё дебютные книги есть.

mcyr писал(а):Ну, черт его знает, как это можно реализовать! Если б я знал - я бы не здесь находился! :)
Естественные языки тут не главная проблема, если вообще проблема. Торговлю с голоса уже врядли можно где найти - везде электронные торги. Поток ордеров виден всем желающим, сделки тоже. И даже новости вовсе необязательно читать - цена рванулась вверх, толпа начала покупать, какая разница по какой причине?
Правило-то главное всего одно: купить дешевле и продать дороже. Ну есть еще правила биржи, их по части собственно торговли не так уж много.
Только в отличие от шахмат участников не двое, а могут быть миллионы, и все они действуют исходя из своих собственных интересов и вовсе не всегда разумно.
Вот если эта хрень придумает как этим воспользоваться...

Ну ежели так, то да. Полагаю примерно так оно и есть: скармливаем всю эту статистику и нехай зверюшка учится. :) Если новости или типа того не столь обязательно читать - тогда вообще не вопрос.
А количество участников - важно лишь в плане ресурсов.

mcyr писал(а):Насколько я понял - статья разработчиков:
https://arxiv.org/pdf/1712.01815.pdf

Оттуда: "Figure 1 shows the performance of AlphaZero during self-play reinforcement learning, as
a function of training steps, on an Elo scale (10). In chess, AlphaZero outperformed Stockfish
after just 4 hours (300k steps);"
А про 24 часа - это скорее образно.
0
Приближенный к ...

СообщениеПриближенный к ... mcyr mcyr 85
Оставил 3040 сообщений с 27 мар 2007
ФР: 147591
12 декабря 2017 в 00:39

Про 24 часа был неправ! Признаю
:roll:
0
Бессмертный

СообщениеБессмертный Astor Astor 241
Оставил 8649 сообщений с 18 мар 2007
ФР: 400020
13 декабря 2017 в 00:38

В таких программах компьютер учат правильно ошибаться. То есть отметать заведомо плохие варианты.
Что они плохие подсказывает совесть.
И когда комп пошлёт своего создателя, закричит на весь мир Уа-у! то это и будет рождение маленького (вес, рост) интеллекта.
0

СообщениеОптимист Мой Господин Мой Господин 59
Оставил 17069 сообщений с 22 мар 2007
ФР: 621723
14 декабря 2017 в 14:29

Astor писал(а):И возможно "фейковая реальность" станет очень востребована для купирования этой проблемы.

Нейросеть создала фейковое порно с Галь Гадот и Скарлетт Йоханссон
:D
0
Почётный форумовец

СообщениеПочётный форумовец gas69rus gas69rus 206
Оставил 5556 сообщений с 20 дек 2009
ФР: 503471
14 декабря 2017 в 15:55

Ну вот и движемся мы к матрице, осталось ещё разработать систему объемной голографии. И пойди потом разбери окружающий тебя мир окружает или картинка. Вот хакеры по веселятся. Неограниченный ресурс приколов и розыгрышей вплоть до техногенных аварий.
0



Кто сейчас на форуме

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 11