Историческая? AI AlphaZero от DeepMind демонстрирует человеческую интуицию

Команда AlphaZero за работой Кредит: DeepMind
Пожалуйста, поделитесь этой историей!
На этот раз это всего лишь шахматная игра, но действительно ли мы хотим, чтобы ИИ «с готовностью жертвовал своими солдатами ради лучшей позиции в схватке… уделяя гораздо меньше внимания отдельным фигурам»? Интуиция - это характеристика человеческой души, которую инертный ИИ никогда не сможет воспроизвести. ⁃ Редактор TN

Программа DeepMind по искусственному интеллекту AlphaZero теперь демонстрирует признаки человеческой интуиции и творчества, которые разработчики назвали «поворотным моментом» в истории.

Компьютерная система поразил мир в прошлом году когда он освоил игру в шахматы с нуля всего за четыре часа, несмотря на то, что не запрограммирован на победу.

Но теперь, после года испытаний и анализа шахматными гроссмейстерами, машина выработала новый стиль игры, непохожий на что-либо еще, предполагая, что программа теперь импровизирует как человек.

В отличие от лучшей шахматной машины в мире - Stockfish, которая вычисляет миллионы возможных результатов во время игры, AlphaZero учится на своих прошлых успехах и неудачах, делая свои ходы на основе туманного ощущения, что все это сработает в долгосрочной перспективе. , по мнению экспертов DeepMind.

Когда AlphaZero противостоял Stockfish в играх 1,000, он проиграл всего шесть, убедительно выиграв 155 раз, и оставаясь в поединке.

Тем не менее, именно способ, которым он играл, поразил разработчиков. В то время как шахматные компьютеры предпочитают держаться за свои фигуры, AlphaZero с готовностью пожертвовал своими солдатами ради лучшей позиции в перестрелке.

Выступая перед The ​​Telegraph, профессор Дэвид Сильвер, который возглавляет исследовательскую группу по подкреплению в DeepMind, сказал: «У него очень тонкое чувство интуиции, которое помогает ему сбалансировать все различные факторы.

«У него есть нейронная сеть с миллионами различных настраиваемых параметров, каждый из которых изучает свои собственные правила того, что хорошо в шахматах, и когда вы объединяете их все вместе, вы получаете что-то, что выражает довольно похожим на мозг способом нашу человеческую способность взгляните на позицию и скажите: «Ага, это правильный поступок».

«Мое личное убеждение заключается в том, что мы увидели нечто переломное, когда начинаем понимать, что многие способности, такие как интуиция и творчество, которые, как мы ранее думали, принадлежали исключительно человеческому разуму, фактически доступны для машинного интеллекта. также. И я думаю, что это действительно захватывающий момент в истории ».

AlphaZero начинался как «tabula rasa» или система чистого листа, запрограммированная только с основными шахматными правилами и научившаяся выигрывать, играя в миллионы игр против себя в процессе проб и ошибок, известных как обучение подкреплению.

Это тот же самый способ, которым человеческий мозг учится, корректируя тактику на основе предыдущего выигрыша или проигрыша, что позволяет ему искать только 60 тысяч позиций в секунду, по сравнению с примерно 60 миллионом Stockfish.

Всего за несколько часов программа самостоятельно открыла и разыграла общие человеческие открытия и стратегии, прежде чем приступить к разработке собственных идей, таких как быстрое копание в руках короля противника и придание гораздо меньшей ценности отдельным фигурам.

Новый стиль игры был проанализирован шахматным гроссмейстером Мэтью Сэдлером и международным мастером женщин Наташей Реган, которые говорят, что это не похоже ни на один традиционный шахматный движок.

«Это как открыть секретные записные книжки какого-то великого игрока из прошлого», - сказал Садлер.

Риган добавил: «Было интересно увидеть, чем анализ AlphaZero отличается от анализа лучших шахматных движков и даже лучших гроссмейстеров. AlphaZero может стать мощным обучающим инструментом для всего сообщества ».

Гарри Каспаров, бывший чемпион мира по шахматам, который классно проиграл шахматной машине Deep Blue в 1997, сказал: «Вместо того, чтобы обрабатывать человеческие инструкции и знания с огромной скоростью, как все предыдущие шахматные машины, AlphaZero генерирует свои собственные знания.

«Он играет в очень динамичном стиле, очень похожем на мой собственный. Значение выходит далеко за рамки моей любимой шахматной доски».

Прочитайте полную историю здесь…

Подписаться
Уведомление о
гость

0 Комментарии
Встроенные отзывы
Посмотреть все комментарии