СВЕРТОЧНЫЕ НЕЙРОННЫЕ СЕТИ ДЛЯ РЕШЕНИЯ ЗАДАЧ КОМПЬЮТЕРНОГО ЗРЕНИЯ

CONVOLUTIONAL NEURAL NETWORKS FOR SOLVING COMPUTER VISION PROBLEMS
Цитировать:
Сайфутдинов А.В. СВЕРТОЧНЫЕ НЕЙРОННЫЕ СЕТИ ДЛЯ РЕШЕНИЯ ЗАДАЧ КОМПЬЮТЕРНОГО ЗРЕНИЯ // Universum: технические науки : электрон. научн. журн. 2023. 10(115). URL: https://7universum.com/ru/tech/archive/item/16127 (дата обращения: 18.12.2024).
Прочитать статью:
DOI - 10.32743/UniTech.2023.115.10.16127

 

АННОТАЦИЯ

Компьютерное зрение и нейронные сети являются предметом любого научного обсуждения, связанного с обработкой образов и изображений средствами вычислительной техники. Отмечено, что сверточная нейронная сеть представляет собой отдельный класс нейронных сетей, специализация которые направлена непосредственно на обработку изображений. Сделан вывод о том, что использование сверточных нейронных сетей в рамках компьютерного зрения позволяет осуществлять работу с задачами самого различного уровня сложности, выполняя как анализ изображения на камерах видеонаблюдения, так и анализ медицинских снимков.

ABSTRACT

Computer vision and neural networks are the subject of any scientific discussion related to the processing of images and images using computer technology. It is noted that a convolutional neural network is a separate class of neural networks, the specialization of which is aimed directly at image processing. It is concluded that the use of convolutional neural networks within the framework of computer vision makes it possible to work with tasks of various levels of complexity, performing both image analysis on CCTV cameras and analysis of medical images.

 

Ключевые слова: сверточные нейронные сети, нейронные сети, машинное зрение, распознавание образов, классификация образов

Keywords: convolutional neural networks, neural networks, computer vision, pattern recognition, pattern classification

 

Любая система компьютерного зрения в своем составе содержит целый ряд технологи, методик и алгоритмов, на основании которых вычислительными машинами выполняется обработка изображений, либо видеофайлов, получаемых из самых различных источников. Применение инструментария компьютерного зрения сегодня получило довольно обширное распространение, и применяется в самых различных сферах – транспортные и пассажирские перевозки, видеонаблюдение и обеспечение безопасности, реализация роботов и автоматизированных машин, организация контроля качества в рамках производственных процессов, обработка медицинских снимков для выявления заболеваний и т.д. Сверточные нейронные сети, несмотря на то, что были созданы довольно давно, использоваться в рамках компьютерного зрения стали относительно недавно, но при этом получили широкую популярность по причине того, что как никогда подходят для использования в данной сфере [8]. Именно вопрос использования сверточных сетей в компьютерном зрении в современных реалиях будет рассмотрен в рамках данной статьи.

Нельзя провести полную аналогию между человеческим и компьютерным зрением. Человек может уловить высокоуровневые признаки, за счет чего может с легкостью отличать различные объекты, опираясь на существующий жизненный опыт и знания. Машина же не сможет выполнить подобную идентификацию, если у нее не будет необходимых исходных данных. Именно в обучении компьютера распознавать предоставляемые ему изображения и заключается задача, которую выполняют специалисты в области машинного зрения [4].

Особенности восприятия зрения компьютером заключается в том, что для него любое изображение – это набор цифр, которые обозначают соотношение трех цветов – красного, зеленого и синего, и описывают определенный пиксель изображения. Компьютер может подробно описать каждую точку на изображении, однако не может представить всю картину на данном изображении, по причине того, что у него отсутствует рецептивное поле, при котором он сможет выполнить обработки больших областей изображения и оперировать высокоуровневыми признаками [2]. Для получения таких возможностей компьютер обучают различать характеристики объекта, и сверточные нейронные сети стали одним из популярных инструментов в данной области.

Сверточная нейронная сеть представляет собой отдельный класс нейронных сетей, специализация которые направлена непосредственно на обработку изображений – фотографий или видеозаписей. Это нейросети, которые могут отлично улавливать локальный контекст на непрерывной в пространстве информации, носители которой находятся рядом – как пиксели на изображении, которые находятся рядом и обладают определенными визуальными характеристиками.

Наиболее распространенными направлениями использования сверточных нейронных сетей сегодня считается выполнение распознавания и классификации образов. Например, нейросеть может отличить машину от автобуса либо определить окраску автомобиля [10].

Сверточная нейронная сеть в своей основе может быть представлена как нейронная сеть, которая в своей работе использует множество копий одного и того же нейрона, что позволяет ей имея ограниченный набор входных параметров выполнять качественный анализ больших изображений.

Обучение сверточной нейронной сети происходит чаще всего с использованием цветных изображений в формате RGB, в которых цветопередача происходит в трех каналах: красному, зелёному и синему. Для нейросети данное изображение представляет в виде трехмерного массива чисел, которые в математике называют тензорами. Цвет передается на основании целых чисел в диапазоне от 0 до 255, а для каждого пикселя формируется массив матриц, демонстрирующий яркость в данном диапазоне [11].

Говоря о структуре сверточной нейронной сети, то можно провести сравнение с воронкой – сначала она описывает общую картину, после чего происходит смещение фокуса на детали. Точно также работает зрение человека – сначала он видит куст на обочине тропинки, и только потом замечает сидящих в ветвях птиц и растущие под кустом мелкие цветочки. Данные подход называют обучением представления. Реализация данной структуры выполняется посредством нескольких слоев, причем по чем больше число данных слоев, тем более мощной считается сверточная сеть. К числу основных элементов сверточной нейронной сети относят сверточный слой, пулинг, нормализация по батчу и полносвязный слой [5].

 

Рисунок 1. Операции над изображением, выполняемые сверточной нейронной сетью

 

Для того, чтобы сверточная нейронная сеть смогла распознать на изображении дерево, ей необходимо выполнить набор типовых процедур для каждого слоя изображения [1]. Ключевая процедура называется свёртка. При выполнении данной операции нейронной сеть выполняется удаление лишней информации, после чего остается лишь полезная информация, на основании которой может быть выполнен анализ изображения. Подобной информацией может являться конкур анализируемого объекта, либо какие-то ровные области по соседству с данным объектом и т.д. [7] Свертка может быть создана для каждого выделяемого признака, которые будут подбираться нейросетью при реализации процедур распознавания и классификация для каждого слоя изображения. После того, как был построен сверточный слой, реализуется слой пулинга. Здесь из числа выделенных на сверточном слое признаков происходи выбора наиболее важных признаков и удаление несущественных. Процедуры свертки и пулинга могут быть применены к полученным слоям с целью формирования иерархии признаков для анализируемого изображения. Например, анализируя изображение лужайки нейронная сеть сможет отделить траву от кустов и деревьев, а деревья разделить на хвойные и лиственные и т.д. [9]

При выполнении операций распознавания и классификации образов на изображении на первых слоях нейросети происходит анализ небольших участков изображения, размерами 2×2 или 3×3 пикселя. Это позволяет выполнить анализ мелких деталей на изображении, таких как изменение цветов или перепады цвета, на основании которых будут формироваться границы различных объектов. По мере продвижения к следующим слоям происходи анализ уже больших участков, что позволяет выявить формы объектов, и по итогу сформировать более сложные признаки, и определить, что же именно представлено на изображении [6].

Операция свертки, используемая в роли основания для работы сверточных нейронных сетей, сама по себе довольно мощный инструмент, который используется в самых различных областях знаний [3]. Базовой областью использования свертки является математика, однако, как следует из выполненного анализа, она стала базой для работы нейронных сетей, что позволило им функционировать просто отлично, особенно в рамках процедур распознавания образов в машинном зрении

Использование сверточных нейронных сетей в рамках компьютерного зрения позволяет осуществлять работу с задачами самого различного уровня сложности, выполняя как анализ изображения на камерах видеонаблюдения, так и анализ медицинских снимков. Уже сегодня множество специалистов называет их инструментом будущего, который может быть использован для самых различных сфер применения, что требует их более детального и качественного изучения.

 

Список литературы:

  1. Бредихин А. И. Алгоритмы обучения сверточных нейронных сетей // Вестник Югорского государственного университета. – 2019. — №1. — С. 14-18.
  2. Варшавский П.Р., Кожевников А.В. Реализация программных средств для классификации данных на основе аппарата сверточных нейронных сетей и прецедентного подхода // Программные продукты и системы. – 2020. — №4. — С.32-33.
  3. Вялов В. А., Андреев А. Ю. Использование сверточных нейронных сетей для распознавания оптических изображений кораблей // Труды Крыловского государственного научного центра. – 2020. – №3. С. 62-66.
  4. Годунов А.И., Баланян С.Т., Егоров П.С. Сегментация изображений и распознавание объектов на основе технологии сверточных нейронных сетей // Надежность и качество сложных систем. – 2021. – №3. – С. 71-73.
  5. Кабанова В.В., Логунова О.С.  Применение искусственного интеллекта при работе с мультимедийной информацией // Вестник Череповецкого государственного университета. – 2022. – №6. – С. 44-46.
  6. Мингалев А.В., Белов А.В., Габдуллин И.М., Агафонова Р.Р., Шушарин С.Н. Распознавание тест-объектов на тепловизионных изображениях // Компьютерная оптика. – 2019. – №3. – С. 92-95.
  7. Сирота А.А., Дрюченко М.А., Иванков А.Ю. Стегоанализ цифровых изображений с использованием методов поверхностного и глубокого машинного обучения: известные подходы и новые решения // Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии. – 2021. – №1. – С. 53-55.
  8. Созыкин А.В.  Обзор методов обучения глубоких нейронных сетей // Вестник Южно-Уральского государственного университета. Серия: Вычислительная математика и информатика. – 2017. – №3. С. 11-14.
  9. Соробин, А. Б. Сверточные нейронные сети: примеры реализаций: учебно-методическое пособие / А. Б. Соробин. – Москва: РТУ МИРЭА, 2020. – 159 с.
  10. Трубин А. Е., Морозов А. А., Зубанова А. Е., Ожередов В. А., Корепанова В. С., Курилин С. П. Методика предобработки данных машинного обучения для решения задач компьютерного зрения // Прикладная Информатика. – 2022. – №4. – С 36-39.
  11. Частикова В.А., Титова А.А., Войлова Д.О. Аналитический обзор методов идентификации личности на основе биометрических характеристик // Вестник Адыгейского государственного университета. Серия 4: Естественно-математические и технические науки. – 2022. – №1. – С. 24-27.
Информация об авторах

инженер-программист Suol Innovations Ltd, Кипр, г. Пафос

Software engineer Suol Innovations Ltd, Cyprus, Paphos

Журнал зарегистрирован Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор), регистрационный номер ЭЛ №ФС77-54434 от 17.06.2013
Учредитель журнала - ООО «МЦНО»
Главный редактор - Ахметов Сайранбек Махсутович.
Top