ОБЩАЯ ХАРАКТЕРИСТИКА МЕТОДОВ ЗАЩИТЫ И КЛАСТЕРНОГО АНАЛИЗА ДЛЯ ЗАДАЧИ ГОЛОСОВОЙ АУТЕНТИФИКАЦИИ

GENERAL CHARACTERISTICS OF PROTECTION METHODS AND CLUSTER ANALYSIS FOR THE TASK OF VOICE AUTHENTICATION
Кулемзин Д.В.
Цитировать:
Кулемзин Д.В. ОБЩАЯ ХАРАКТЕРИСТИКА МЕТОДОВ ЗАЩИТЫ И КЛАСТЕРНОГО АНАЛИЗА ДЛЯ ЗАДАЧИ ГОЛОСОВОЙ АУТЕНТИФИКАЦИИ // Universum: технические науки : электрон. научн. журн. 2023. 1(106). URL: https://7universum.com/ru/tech/archive/item/14880 (дата обращения: 18.12.2024).
Прочитать статью:
DOI - 10.32743/UniTech.2023.106.1.14880

 

АННОТАЦИЯ

В настоящее время существует целый ряд систем аутентификации личности. Данное направление уверенно заняло свое место в информационных системах, деятельность которых можно встретить в различных видах государственных услуг, в том числе в сфере безопасности. Биометрическая аутентификация диктора по голосу является одним из видов такого процесса. Этот метод не требует больших финансовых и технологических ресурсов, в отличии от других видов биометрической аутентификации.

В статье рассмотрены и проанализированы основные процедуры классификации голосовых сигналов, а также раскрыты характерные признаки для каждого из классов. Представлены, как основные недостатки приведенных методов, так и их преимущества.

В ходе проведенного исследования выделен как наиболее перспективный для дальнейшего глубокого изучения и совершенствования иерархические методы кластерного анализа голосовых сигналов, такие как AGNES (AGlomerative NESting), DIANA (Divisive ANAlysis), BIRCH (Balanced Iterative Reducing and Clustering using Hierarchies), ROCK (RObust Clustering using linKs) и Chameleon.

Указанные в статье методы и типы кластеризации, и проведенный анализ их функционирования указывает на актуальность проведения дальнейшего исследования с целью разработки новых алгоритмов и методов голосовой аутентификации.

ABSTRACT

Currently, there are a number of identity authentication systems. This direction has confidently taken its place in information systems, the activities of which can be found in various types of public services, including in the field of security. Biometric speaker authentication by voice is one type of such a process. This method does not require large financial and technological resources, unlike other types of biometric authentication.

The article discusses and analyzes the main procedures for the classification of voice signals, as well as reveals the characteristic features for each of the classes. Both the main disadvantages of the above methods and their advantages are presented.

In the course of the study, hierarchical methods of cluster analysis of voice signals, such as AGNES (AGlomerative NESting), DIANA (Divisive ANAlysis), BIRCH (Balanced Iterative Reducing and Clustering using Hierarchies), ROCK (RObust Clustering) were identified as the most promising for further in-depth study and improvement. using linKs) and Chameleon.

The methods and types of clustering indicated in the article, and the analysis of their functioning indicates the relevance of further research in order to develop new algorithms and methods of voice authentication.

 

Ключевые слова: голосовая аутентификация, кластерный анализ, защита информации, диктор, Евклидово расстояние, расстояние Чебышева.

Keywords: voice authentication, cluster analysis, information security, speaker, Euclidean distance, Chebyshev distance

 

Классификация голосовых сигналов предусматривает разделение имеющихся в базе данных голосовых сигналов на ряд классов и установление характерных признаков для каждого из классов. При наличии в данном голосовом сигнале тех или иных признаков система относит его к тому или иному классу и ассоциирует с ним. Довольно часто в литературе данную процедуру отождествляют с кластеризацией, а классы, на которые разделяется общая база, называют кластерами. В таком случае процедуру отнесения объекта к тому или иному кластеру называют кластерным анализом. Тем не менее, эти процедуры различаются. Покажем это, проанализировав каждую из них.

Сейчас есть несколько способов классификации. Они могут быть использованы для разных задач, которые связаны с распознанием. Если рассматривать научную литературу, [3 c.41-54] то в ней часто можно встретиться с такой классификацией, в которой все процедуры делятся на 2 группы. Первая группа – дискриминативные процедуры. Ко второй группе относятся генеративные процедуры. Генеративными процедурами называются такие процедуры, которые используются для моделирования данных, которые используются для обучения. К примеру, они могут быть использованы для определения вероятности. В качестве примера такой модели можно привести модель гауссовых смесей. Дискриминативные модели используются для того, чтобы построить границы между классами. Использоваться они могут, к примеру, в методе опорных векторов.

В качестве основных этапов или уровней при реализации такой системы можно отметить:

Уровень первый – это уровень обработки сигналов. Данный этап или данный уровень используется для того, чтобы обрабатывать имеющиеся сигналы. У имеющихся сигналов выделяются такие признаки, которые необходимы для решения задач аутентификации. В целом можно говорить о том, что составляется последовательность векторов для каждого участка сигнала.

Уровень второй - это уровень моделей. На данном этапе происходит сравнение моделей пользователей, они могут создаваться и храниться. Если новый пользователь регистрируется в системе, то в таком случае этот уровень используется для того, чтобы обрабатывать полученные сигналы. В данном случае моделирование может быть представлено как в виде простого копирования векторов, так и при использовании той модели, которая есть в системе. После этого появляется возможность определить, какие сходства есть между сохраненными моделями.

Уровень третий – это уровень принятия решений. Данный уровень необходим для того, чтобы принять решения. Для того, чтобы принять решения могут быть использованы разные уровни модели, но тут стоит отметить, что при необходимости можно задавать разные ограничения. Довольно часто данный уровень приобретает функции моделирования пространства дикторов [4 c.43].

Кластеризация или кластерный анализ - совокупность математических методов, предназначенных для формирования относительно «удаленных» друг от друга групп «близких» между собой объектов по информации о расстоянии или связи (меры расстояний) между ними.

В качестве основной задачи, которая стоит перед классификацией, можно отметить обработку данных. Если сравнивать классификацию и кластеризацию, то в качестве основного отличия данных понятий можно отметить, что при кластеризации те группы, которые создаются, являются не строгими, а это значит, что они могут меняться в зависимости от работы алгоритма.

Среди совокупности метрик, которые могут использоваться при кластерном анализе выделяют следующие:

1. Евклидово расстояние. Данная функция выступает в качестве самой распространенной при определении расстояния. Она позволяет с геометрической точки зрения рассматривать расстояние, которое есть в пространстве между объектами. Для ее вычисления можно воспользоваться следующей формулой:

                                                  (1)

Если рассматривать евклидову меру с геометрической точки зрения, то найденное расстояние будет бессмысленным в том случае, если признаки будут определены в разных единицах измерения. Использоваться полученное расстояние может при определении:

а) свойств объекта, которые имеют одну и ту же важность в классификации;

б) таких признаков пространства, которые совпадают с геометрическим пространством.

2. Квадрат евклидово расстояния. Используется в том случае, если необходимо придать вес объекту, при этом объекты должны быть удалены друг от друга. Для его вычисления можно воспользоваться такой формулой как:

                                                (2)

3. Взвешенное евклидово расстояние. Его можно использовать тогда, когда необходимо определить характеристики объектов. При  этом та роль, которую играют характеристики, отличается. Для его вычисления можно воспользоваться такой формулой как:

                                                  (3)

4. Расстояние городских кварталов. Это расстояние является средней разниц признаков по каждой координате. В большинстве случаев эта мера расстояния приводит к таким же результатам, как и при использовании евклидово расстояния. Однако для этой меры влияние отдельных больших разностей (выбросов) уменьшается из-за того, что они не возводяться в квадрат. Для его вычисления можно воспользоваться такой формулой как:

                                                        (4)

5. Расстояние Чебышева. Это расстояние целесообразно использовать, если необходимо определить два объекта как «различные», если они различаются по любой координате. Расстояние Чебышева вычисляется по формуле:

                                                       (5)

6. Степенное расстояние. Применяется в случае, когда нужно увеличить или уменьшить вес, относящийся к характеристике, для которой соответствующие объекты значительно различаются. Степенное расстояние определяется по следующей формуле:

                                                      (6)

Подпись: где r и р - параметры, определяемые пользователем или экспертом.

Параметр p отвечает за постепенное взвешивание разностей по отдельным координатам пространства признаков, в то время как параметр r - по прогрессивному взвешиванию больших расстояний между объектами. Если оба параметра равны 2, то данный вид расстоянии трансформируется в расстояние Евклида.

Выбор той или иной метрики в полной мере зависит от исследователя, поскольку результаты кластеризации могут существенно отличаться при использовании различных мер. Таким образом, выбор мер расстояния и весовых коэффициентов для классификации признаков - очень важный этап, поскольку от этих процедур зависит состав и количество сформированных иерархий защиты информации [2 c.113].

Типичными иерархическими методами кластеризации является AGNES (AGlomerative NESting), DIANA (Divisive ANAlysis), BIRCH (Balanced Iterative Reducing and Clustering using Hierarchies), ROCK (RObust Clustering using linKs) и Chameleon [5 c.62-69].

Неиерархические методы имеют более высокую устойчивость к выбросам, неудачного выбора метрики, включение незначимых переменных в базу кластеризации и др.

Вообще большинство аглометративных и дивизивных методов базируются на расстояниях между объектами. Такие методы удобно применять для фильтрации зашумленных данных или выбросов и формирования кластеров произвольной формы. Типичными алгоритмами данной группы являются алгоритмы DBSCAN и OPTICS, в которых кластеры наращиваются согласно анализу связей на основе плотности данных. В другом алгоритме данной группы - DENCLUE - кластеризации базируется на анализе функции плотности распределения данных.

Группа сетевых методов кластеризации разделяет пространство признаков на конечное количество ячеек, которые формируют сетевое структуру. Таким образом, все процедуры кластеризации выполняются уже не в общем пространстве признаков, а в так называемом сетевом пространстве. Основным преимуществом такого подхода является скорость выполнения алгоритма, которая обычно не зависит от количества анализируемых данных, а зависит только от количества ячеек в каждом измерении сетевого пространства. Типичным примером сетевого метода является метод STING. В то же время алгоритм WaveCluster, предусматривающий вейвлет-преобразования данных, относят как к сетевым методам, так и к методам, которые базируются на плотности данных.

Методы, основанные на моделях, построенные на гипотетической модели каждого кластера и подбирают данные, который наиболее точно подходят под описанную модель. Такие алгоритмы могут локализовать кластеры, строя функцию плотности, которая отражает пространственное распределение точек данных. Это также приводит к автоматическому определению количества кластеров с учетом шумов и выбросов, обеспечивая таким образом надежные результаты кластеризации. Примером такого алгоритма может служить алгоритм ЭМ, который выполняет анализ максимизации ожидания на основе статистического моделирования. COBWEB также является алгоритмом данного класса, который выполняет оценку вероятности, и использует определенные концепции в качестве моделей кластеров [6 c.418].

Также есть специальные алгоритмы кластеризации, которые используются в некоторых отдельных случаях. К примеру, алгоритм SOM (self-organizing feature map) базируется на нейронных сетях и проецирует данные с большой размерностью на двухмерные и трехмерные пространства признаков, что значительно улучшает визуализацию данных. Данный алгоритм является примером проекционного кластерного анализа. Для векторного квантования очень широко применяется алгоритм кластеризации LBG, предложенный как усовершенствование метода Ллойда. Он представляет собой конечную последовательность шагов, в каждом из которых используется новый элемент квантования, с полным искажением, которое меньше или равен предыдущему [1 c. 28].

Выбор метода и алгоритма кластеризации в каждом конкретном случае определяется типом данных, которые анализируются, и практической целью применения процедуры кластеризации. Во многих случаях при использовании кластерного анализа в качестве описательного или исследовательского средства достаточно часто возможно использование нескольких алгоритмов для одного набора данных, для выбора наилучшего.

Если рассматривать методы кластеризации, которые могут использоваться для задачи аутентификации диктора, то необходимо учитывать то, что системе необходимо будет выделить из общей базы данных ряд записей. Это должно происходить в соответствии с выделенными характеристик голосовых сигналов, которые будут формировать пространство признаков. В то же время система не обязательно должна знать, какое точно количество дикторов на данный момент содержится в базе. Учитывая вышесказанное, логичным представляется использование для задачи аутентификации диктора иерархических методов кластеризации.

 

Список литературы:

  1. Ахмад Х.М. Математические модели принятия решений в задачах распознавания говорящего // Вестник ТГТУ. - 2008. - Том 14 - №1. - С. 28.
  2. Волосюк Ю.В. Анализ алгоритмов кластеризации для задач интеллектуального анализа данных // Сборник научных трудов Военного института Киевского национального университета имени Тараса Шевченко. - 2014. - Вып. 47. - С. 113.
  3. Первушин Е.А. Обзор основных методов распознавания дикторов // атематические структуры и моделирование, вып. 24 , 2011.- С. 41-54
  4. Первушин Е.А. Обзор основных методов распознавания дикторов // атематические структуры и моделирование, вып. 24 , 2011.- С. 43
  5. Яшина Е.С., М.А. Щербак Использование метода кластеризации в информационно-аналитической системе // Радиоэлектронные и компьютерные системы. - 2016. - № 2. - С. 62-69.
  6. Jiawei Han, Micheline Kamber Data Mining : Concepts and Techniques, Second Edition. - University of Illinois at Urbana-Champaign, USA - 2006. - р. 418.
Информация об авторах

аспирант, Ростовский экономический государственный университет, РФ, г. Ростов-на-Дону

Postgraduate student, Rostov Economic State University, Russian Federation, Rostov-on-Don

Журнал зарегистрирован Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор), регистрационный номер ЭЛ №ФС77-54434 от 17.06.2013
Учредитель журнала - ООО «МЦНО»
Главный редактор - Ахметов Сайранбек Махсутович.
Top