ассистент кафедры «Информационные технологии», Ферганский филиал ТУИТ им. Мухаммада Ал-Хоразмий, Узбекистан, г. Фергана
Взаимосвязи и различия между “deep learning” и “machine learning”
АННОТАЦИЯ
В этой статье объясняется, что machine learning и deep learning - это схожие, но совершенно разные понятия.
ABSTRACT
This article provides information on how machine learning and deep learning are similar but clearly different concepts.
Ключевые слова: Нейроны, проблема классификации, кодирование, топологии нейронной сети
Keywords: Neurons, classification problem, coding, neural network topology
Машинное обучение предоставляет машине или алгоритму возможность изучать перестановки и комбинации заданного обстоятельства и реагировать соответствующим образом. Существует неопределенность в обстоятельствах и, следовательно, реакции. Это неизвестно, чему машина должна научиться. Машины учатся на огромном количестве исторических обстоятельств и реакций, предоставленных им в машиночитаемом формате. Мы просто назвали эти данные.
Машины стремятся максимизировать желаемый результат. Статистическое моделирование в значительной степени зависит от контекста и допущений. Например, математика за линейной регрессией и логистической регрессией очень разные. Машинное обучение обобщает их под контролем обучения и оптимизирует для минимальной ошибки. Все машины используют числовую математику для итеративного поиска неизвестных параметров.
Machine learning объяснил
Алгоритмы машинного обучения часто делятся на (данные обучения помечены ответами) и не проверяются (существующие теги не отображаются в алгоритме обучения). Затем контролируемые задачи машинного обучения делятся на классификацию (прогнозирование нечисловых ответов, таких как вероятность пропущенных платежей по ипотеке) и регрессию (прогнозирование числовых ответов, например количества виджетов, в следующем месяце в вашем магазине. Манхэттен продан). Обучение без учителя делится на группы (поиск групп похожих объектов, таких как кроссовки, кроссовки и классическая обувь), ассоциация (поиск последовательностей общих объектов, таких как кофе и сливки) и измерения. убывание (проекция, выбор объектов) и функция извлечения)
Алгоритмы регрессии
Проблема регрессии - это проблема управляемого обучения, которая требует модели, которая требует оценки числа. Самый простой и быстрый алгоритм - это линейная регрессия (по крайней мере, квадратная), но на этом не стоит останавливаться, потому что он часто дает плохой результат. Другими распространенными алгоритмами регрессии для машинного обучения (исключая нейронные сети) являются простой байесовский алгоритм, дерево решений, соседи K-Close, LVQ (исследование векторной величины), LARS Lasso, Elastic Net, Random Forest, AdaBoost и XGBoost. Вы заметите, что алгоритмы машинного обучения противоречат друг другу между регрессией и классификацией.
Алгоритмы классификации
Проблема классификации, как правило, представляет собой проблему управляемого обучения, которая требует вероятности для каждого класса, выбирая между двумя или более классами. За исключением нейронных сетей и углубленного изучения, которые требуют гораздо более высокого уровня вычислительных ресурсов, наиболее распространенными являются алгоритмы: наивный байесовский алгоритм, дерево решений, логистическая регрессия, соседи K-Close и эталонная векторная машина (SVM). Вы также можете использовать методы ансамбля (примеры комбинаций), такие как случайный лес, другие методы загрузки и методы улучшения, такие как AdaBoost и XGBoost.
Методы оптимизации
Машинное обучение может анализировать время и передачу, когда продукты перемещаются по цепочке поставок. Он может сравнить эти данные с эталонными показателями и историческими показателями, чтобы выявить потенциальные задержки и узкие места, а также внести предложения по ускорению цепочки поставок.
Планирование движения товаров на основе спроса
Эффективные цепочки поставок полагаются на то, что продукты находятся в нужном месте в нужное время. Машинное обучение может оценить требования клиентов и оптимизировать цепочку поставок. Это соответствует своевременной поставке товаров с требованиями рынка.
Управление поставщиками и документацией
Работа с поставщиками является одной из самых сложных частей SCM. Машинное обучение может анализировать типы контрактов, документации и других областей, которые приводят к наилучшим результатам от поставщиков, и использовать их в качестве основы для будущих соглашений и администрирования.
Алгоритмы кластеризации
Кластеризация - это неконтролируемая проблема обучения, которая требует модели для поиска групп в похожих точках данных. Самый популярный алгоритм - K-Means Clustering; среди других - кластеризация в средней части, DBSCAN (пространственная кластеризация приложений, основанных на плотности шума), GMM (гауссовские смешанные модели) и HAC (кластер иерархической агломерации).
Есть 5 основных шагов, используемых для выполнения задачи machine learning:
Сбор данных: будь то необработанные данные из Excel, Access, текстовые файлы и т. д. Этот шаг (сбор прошлых данных) формирует основу будущего обучения. Чем лучше разнообразие, плотность и объем соответствующих данных, тем лучше становятся перспективы обучения для машины.
Подготовка данных. Любой аналитический процесс зависит от качества используемых данных. Нужно потратить время на определение качества данных, а затем принять меры для устранения таких проблем, как пропущенные данные и обработка выбросов. Поисковый анализ, возможно, является одним из методов детального изучения нюансов данных, тем самым увеличивая питательную ценность данных.
Обучение модели. Этот шаг включает в себя выбор подходящего алгоритма и представление данных в форме модели. Очищенные данные разбиты на две части - обучаем и тестируем (пропорция зависит от предварительных условий); первая часть (данные обучения) используется для разработки модели. Вторая часть (данные испытаний), используется в качестве справочной.
Оценка модели: для проверки точности используется вторая часть данных (данные об удержании / тестировании). Этот шаг определяет точность выбора алгоритма в зависимости от результата. Лучший тест для проверки точности модели - увидеть ее производительность на данных, которые вообще не использовались при построении модели.
Повышение производительности. Этот шаг может включать в себя выбор другой модели или введение дополнительных переменных для повышения эффективности. Вот почему значительное количество времени нужно потратить на сбор и подготовку данных.
Характеристика техники для mаchine learning
Характерный признак - это признак, который измеряется индивидуально или особенность наблюдаемого явления. Понятие «знак» связано с понятием объясняющих переменных, используемых в статистических методах, таких как линейная регрессия. Векторы объектов объединяют все элементы строки в числовой вектор. Частью метода выбора функции является выбор минимальной группы независимых переменных, которые объясняют проблему. Если между двумя переменными существует сильная корреляция, их следует объединить по отдельности или одну из них следует удалить. Иногда люди анализируют ключевые компоненты, чтобы преобразовать соответствующие переменные в ряд линейно не связанных переменных.
Deep learning объяснил
Алгоритмы углубленного обучения обрабатывают данные через несколько уровней алгоритмов нейронной сети, каждый из которых передает упрощенные данные на следующий уровень. Большинство алгоритмов машинного обучения хорошо работают в наборах данных с сотнями функций или столбцов. Однако неструктурированный набор данных имеет много особенностей, как на рисунке, потому что операция неуместна или абсолютно невозможна. 800 пикселей, 1000 пикселей изображения в цвете RGB имеют 2,4 миллиона функций - слишком много для управления традиционными алгоритмами машинного обучения. Алгоритмы углубленного обучения проходят через каждый слой нейронной сети и постепенно получают больше информации об изображении. Первые слои учатся определять низкоуровневые элементы, такие как ребра, а следующие слои объединяют элементы из предыдущих слоев в более целостном виде. Например, средний слой может идентифицировать части, чтобы описать части объекта на фотографии, такие как ноги или ветви, в то время как глубокий слой определяет законченный объект, такой как собака или дерево.
Обучающие нейронные сети
Управление нейронной сетью осуществляется так же, как и обучение других машин: вы предоставляете сети набор обучающих данных, сравниваете выходной сигнал сети с желаемым выходным сигналом, создаете вектор ошибок и вносите исправления в сеть. вектор ошибок, который вы вводите. Объединенные наборы образовательных данных до внесения изменений называются периодами.
Топологии нейронной сети
Теперь, когда мы знаем нейроны, нам нужно знать об общих топологиях нейронных сетей. В сети с прямым подключением нейроны делятся на отдельные уровни: входной уровень, n уровней скрытой обработки и выходной уровень. Выход каждого слоя перемещается только на следующий этап. В сети с прямым соединением для быстрого соединения некоторые соединения могут проходить через один или несколько промежуточных уровней. В повторяющихся нейронных сетях нейроны могут влиять на себя прямо или косвенно со следующей стадии.
Список литературы:
1. Szegedy, Christian; Toshev, Alexander; Erhan, Dumitru. Deep neural networks for object detection // Advances in Neural Information Processing Systems. — 2013. — С. 2553–2561.
2.https://www.dataversity.net/deep-learning-machine-learning-differences-recent-views-ongoing-debate/
3.https://www.infoworld.com/article/3512245/deep-learning-vs-machine-learning-understand-the-differences.html