Глубокое обучение и обучение с подкреплением тесно связаны с вычислительной мощью искусственного интеллекта (ИИ). Они представляют собой автономные функции машинного обучения, которые открывают путь для компьютеров к созданию собственных принципов при выработке решений. Эти два вида обучения также могут сосуществовать в нескольких программах. Как правило, глубокое обучение использует текущие данные, а обучение с подкреплением — метод проб и ошибок при составлении прогнозов. Далее мы подробнее рассмотрим эти различия.
Что такое глубокое обучение?
Глубокое обучение также называют глубоким структурированным обучением или иерархическим обучением. Впервые оно было представлено в 1986 году Риной Дехтер, профессором информатики. Оно использует текущую информацию в алгоритмах обучения для поиска соответствующих закономерностей, которые важны для прогнозирования данных. В такой системе используются различные уровни искусственных нейронных сетей, аналогичных нейронам человеческого мозга. С помощью сложных связей алгоритм может быть способен обрабатывать миллионы информации и концентрироваться на более конкретном прогнозе.
Этот вид обучения может быть применен, когда разработчики хотят, чтобы программа определяла фиолетовый цвет на различных фотографиях. В этом случае программе подается ряд изображений (отсюда и «глубокое» обучение) с фиолетовым цветом и без него. Посредством кластеризации программа сможет выявить закономерности и понять, когда отмечать фиолетовый цвет. Глубокое обучение используется в различных программах распознавания, таких как анализ изображений, и в задачах прогнозирования, например, в прогнозировании временных рядов.
Что такое обучение с усилением?
Обучение с подкреплением, как правило, выдает прогнозы методом проб и ошибок. Что касается его истории с точки зрения ИИ, то оно было разработано в конце 1980-х годов; в его основе лежат результаты экспериментов на животных, концепции оптимального управления и методы временного разрыва. Наряду с контролируемым и неконтролируемым обучением, подкрепление является одной из фундаментальных парадигм машинного обучения. Как следует из названия, алгоритм обучается через вознаграждение.
Например, ИИ разрабатывается для игры с человеком в определенную мобильную игру. Каждый раз, когда ИИ проигрывает, алгоритм пересматривается, чтобы максимизировать его результат. Таким образом, этот вид техники учится на своих ошибках. После многочисленных циклов ИИ развивается и становится лучше, обыгрывая человеческих игроков. Обучение с подкреплением применяется в различных передовых технологиях, таких как совершенствование робототехники, поиск текстов и здравоохранение.
Разница между глубоким обучением и обучением с усилением
Техника обучения
Глубокое обучение способно выполнять целевое поведение, анализируя существующие данные и применяя полученные знания к новому набору информации. С другой стороны, обучение с подкреплением способно изменять свой ответ путем адаптации непрерывной обратной связи.
Существование данных
Глубокое обучение работает с уже существующими данными, поскольку они необходимы для обучения алгоритма. Что касается обучения с подкреплением, то оно носит исследовательский характер и может быть разработано без имеющегося набора данных, поскольку учится методом проб и ошибок.
Приложение
Глубокое обучение используется для распознавания изображений и речи, предварительного обучения глубоких сетей и задач уменьшения размерности. Для сравнения, обучение с подкреплением используется для взаимодействия с внешними стимулами с оптимальным управлением, например, в робототехнике, планировании работы лифтов, телекоммуникациях, компьютерных играх и искусственном интеллекте в здравоохранении.
Также известен как
Глубокое обучение также известно как иерархическое обучение или глубокое структурированное обучение, в то время как обучение с подкреплением не имеет других широко известных терминов.
Машинное обучение
Глубокое обучение — один из многочисленных методов машинного обучения. С другой стороны, обучение с подкреплением — это область машинного обучения; это одна из трех фундаментальных парадигм.
Мозг человека
По сравнению с глубоким обучением, обучение с подкреплением ближе к возможностям человеческого мозга, поскольку этот вид интеллекта может быть улучшен благодаря обратной связи. Глубокое обучение в основном предназначено для распознавания и в меньшей степени связано с взаимодействием.
История
Глубокое обучение было впервые представлено в 1986 году Риной Дехтер, в то время как обучение с подкреплением было разработано в конце 1980-х годов на основе концепций экспериментов на животных, оптимального управления и методов временной разницы.