Перейти к содержимому

Разница между глубоким обучением и обучением с усилением

    Глубокое обучение и обучение с подкреплением тесно связаны с вычислительной мощью искусственного интеллекта (ИИ). Они представляют собой автономные функции машинного обучения, которые открывают путь для компьютеров к созданию собственных принципов при выработке решений. Эти два вида обучения также могут сосуществовать в нескольких программах. Как правило, глубокое обучение использует текущие данные, а обучение с подкреплением — метод проб и ошибок при составлении прогнозов. Далее мы подробнее рассмотрим эти различия.

    Что такое глубокое обучение?

    Глубокое обучение также называют глубоким структурированным обучением или иерархическим обучением. Впервые оно было представлено в 1986 году Риной Дехтер, профессором информатики. Оно использует текущую информацию в алгоритмах обучения для поиска соответствующих закономерностей, которые важны для прогнозирования данных. В такой системе используются различные уровни искусственных нейронных сетей, аналогичных нейронам человеческого мозга. С помощью сложных связей алгоритм может быть способен обрабатывать миллионы информации и концентрироваться на более конкретном прогнозе.

    Этот вид обучения может быть применен, когда разработчики хотят, чтобы программа определяла фиолетовый цвет на различных фотографиях. В этом случае программе подается ряд изображений (отсюда и «глубокое» обучение) с фиолетовым цветом и без него. Посредством кластеризации программа сможет выявить закономерности и понять, когда отмечать фиолетовый цвет. Глубокое обучение используется в различных программах распознавания, таких как анализ изображений, и в задачах прогнозирования, например, в прогнозировании временных рядов.

    Что такое обучение с усилением?

    Обучение с подкреплением, как правило, выдает прогнозы методом проб и ошибок. Что касается его истории с точки зрения ИИ, то оно было разработано в конце 1980-х годов; в его основе лежат результаты экспериментов на животных, концепции оптимального управления и методы временного разрыва. Наряду с контролируемым и неконтролируемым обучением, подкрепление является одной из фундаментальных парадигм машинного обучения. Как следует из названия, алгоритм обучается через вознаграждение.

    Например, ИИ разрабатывается для игры с человеком в определенную мобильную игру. Каждый раз, когда ИИ проигрывает, алгоритм пересматривается, чтобы максимизировать его результат. Таким образом, этот вид техники учится на своих ошибках. После многочисленных циклов ИИ развивается и становится лучше, обыгрывая человеческих игроков. Обучение с подкреплением применяется в различных передовых технологиях, таких как совершенствование робототехники, поиск текстов и здравоохранение.

    Разница между глубоким обучением и обучением с усилением

    Техника обучения

    Глубокое обучение способно выполнять целевое поведение, анализируя существующие данные и применяя полученные знания к новому набору информации. С другой стороны, обучение с подкреплением способно изменять свой ответ путем адаптации непрерывной обратной связи.

    Существование данных

    Глубокое обучение работает с уже существующими данными, поскольку они необходимы для обучения алгоритма. Что касается обучения с подкреплением, то оно носит исследовательский характер и может быть разработано без имеющегося набора данных, поскольку учится методом проб и ошибок.

    Приложение

    Глубокое обучение используется для распознавания изображений и речи, предварительного обучения глубоких сетей и задач уменьшения размерности. Для сравнения, обучение с подкреплением используется для взаимодействия с внешними стимулами с оптимальным управлением, например, в робототехнике, планировании работы лифтов, телекоммуникациях, компьютерных играх и искусственном интеллекте в здравоохранении.

    Также известен как

    Глубокое обучение также известно как иерархическое обучение или глубокое структурированное обучение, в то время как обучение с подкреплением не имеет других широко известных терминов.

    Машинное обучение

    Глубокое обучение — один из многочисленных методов машинного обучения. С другой стороны, обучение с подкреплением — это область машинного обучения; это одна из трех фундаментальных парадигм.

    Мозг человека

    По сравнению с глубоким обучением, обучение с подкреплением ближе к возможностям человеческого мозга, поскольку этот вид интеллекта может быть улучшен благодаря обратной связи. Глубокое обучение в основном предназначено для распознавания и в меньшей степени связано с взаимодействием.

    История

    Глубокое обучение было впервые представлено в 1986 году Риной Дехтер, в то время как обучение с подкреплением было разработано в конце 1980-х годов на основе концепций экспериментов на животных, оптимального управления и методов временной разницы.

    Глубокое обучение против обучения с подкреплением

    Резюме

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *

    Adblock
    detector