Хотя системы искусственного интеллекта могут соответствовать многим человеческим возможностям, они учатся в 10 раз дольше. Теперь, копируя способ работы мозга, Google DeepMind создал машину, которая сокращает разрыв.
Интеллектуальные машины имеют людей в поле зрения. Машины глубокого обучения уже обладают сверхчеловеческими навыками, когда дело доходит до таких задач, как распознавание лиц, игра в видеоигры и даже древняя китайская игра в Го. Так что легко думать, что люди уже вооружены.
Но не так быстро. Интеллектуальные машины все еще отстают от людей в одной важной области производительности: скорости, с которой они учатся. Например, когда дело доходит до освоения классических видеоигр, лучшим машинам с глубоким обучением требуется около 200 часов игры, чтобы достичь того же уровня навыков, который люди достигают всего за два часа.
Поэтому компьютерным ученым очень хотелось бы иметь какой-то способ ускорить скорость обучения машин.
Сегодня Александр Притцель и его друзья из филиала Google DeepMind в Лондоне утверждают, что именно это и сделали. Эти ребята создали машину глубокого обучения, которая способна быстро усваивать новый опыт и затем воздействовать на них. Результатом является машина, которая учится значительно быстрее, чем другие, и имеет потенциал, чтобы соответствовать людям в не слишком отдаленном будущем.
Сначала немного предыстории. Глубокое обучение использует слои нейронных сетей для поиска шаблонов в данных. Когда один слой обнаруживает шаблон, который он распознает, он отправляет эту информацию на следующий уровень, который ищет шаблоны в этом сигнале и так далее.
Таким образом, при распознавании лиц один слой может искать края на изображении, следующий слой - для круговых рисунков краев (типа глаз и рта), а другой - для треугольных рисунков, например, созданных двумя глазами и ртом. Когда все это происходит, окончательный результат является признаком того, что лицо было обнаружено.
Конечно, дьявол кроется в деталях. Существуют различные системы обратной связи, которые позволяют системе учиться, регулируя различные внутренние параметры, такие как прочность связей между слоями. Эти параметры должны изменяться медленно, поскольку большое изменение в одном слое может катастрофически повлиять на обучение в последующих слоях. Вот почему глубокие нейронные сети нуждаются в таком большом обучении и почему это занимает так много времени.
Притцель и его коллеги решили эту проблему с помощью техники, которую они называют нейронным эпизодическим контролем. «Нейронный эпизодический контроль демонстрирует резкое улучшение скорости обучения в широком диапазоне сред», - говорят они. «Очень важно, что наш агент может быстро использовать очень успешные стратегии, как только они будут испытаны, вместо того, чтобы ждать много шагов оптимизации».
Основная идея подхода DeepMind - быстро скопировать способ обучения людей и животных. По общему мнению, люди могут справляться с ситуациями двумя разными способами. Если ситуация знакома, наш мозг уже сформировал ее модель, которую он использует, чтобы определить, как лучше себя вести. При этом используется часть мозга, называемая префронтальной корой.
Прочитайте полную историю здесь…
Также см Новый AI от Google становится умнее благодаря рабочей памяти