ИСПОЛЬЗОВАНИЕ ГЕНЕРАТИВНОГО ИИ ПРИ АНАЛИЗЕ ДАННЫХ ВЕБ-АНАЛИТИКИ

USING GENERATIVE AI IN ANALYZING WEB ANALYTICS DATA
Алексеев Д.В.
Цитировать:
Алексеев Д.В. ИСПОЛЬЗОВАНИЕ ГЕНЕРАТИВНОГО ИИ ПРИ АНАЛИЗЕ ДАННЫХ ВЕБ-АНАЛИТИКИ // Universum: технические науки : электрон. научн. журн. 2024. 2(119). URL: https://7universum.com/ru/tech/archive/item/16815 (дата обращения: 18.12.2024).
Прочитать статью:
DOI - 10.32743/UniTech.2024.119.2.16815

 

АННОТАЦИЯ

Появление и использование искусственного интеллекта (ИИ) существенно изменили подход компаний к организации и управлению ежедневными рабочими процессами. Внедрение разнообразных приложений и инструментов ИИ дало возможность предприятиям принимать более обдуманные решения и автоматизировать многократно повторяющиеся задачи, что повысило эффективность и результативность операций. Хотя на сегодняшний день существует большое разнообразие алгоритмов ИИ, генеративный ИИ заслужил признание и активное применение в различных отраслях.

Благодаря популярности таких известных инструментов генеративного ИИ, как Midjourney и ChatGPT, компании теперь способны быстрее генерировать новые идеи, контент и решения, чем когда-либо прежде. Это улучшает процесс принятия решений, оптимизирует операции и позволяет предприятиям оставаться конкурентоспособными на постоянно меняющемся рынке за счёт создания новых продуктов и услуг. Генеративный ИИ переворачивает представление о правилах игры в деловом мире, и его потенциал будет в полной мере осознан в 2024 году.

Цель работы заключается в рассмотрении использования генеративного ИИ при анализе данных веб-аналитики. При написании работы, автор исследовал научную литературу отечественных и зарубежных авторов.

ABSTRACT

The emergence and use of artificial intelligence (AI) have significantly changed the approach of companies to the organization and management of daily work processes. The introduction of a variety of AI applications and tools has enabled enterprises to make more informed decisions and automate repetitive tasks, which has increased the efficiency and effectiveness of operations. Although there is a wide variety of AI algorithms today, generative AI has earned recognition and active application in various industries.

Thanks to the popularity of well-known generative AI tools such as Midjourney and ChatGPT, companies are now able to generate new ideas, content, and solutions faster than ever before. This improves decision-making, optimizes operations, and allows businesses to remain competitive in an ever-changing market by creating new products and services. Generative AI is upending the idea of the rules of the game in the business world, and its potential will be fully realized in 2024.

The purpose of the work is to consider the use of generative AI in the analysis of web analytics data. When writing the work, the author researched the scientific literature of domestic and foreign authors.

 

Ключевые слова: ИИ, генеративный ИИ, AI, искусственный интеллект, веб-аналитика.

Keywords: AI, generative AI, AI, artificial intelligence, web analytics.

 

Введение

Генеративный ИИ играет ключевую роль в эволюции анализа социальных данных. В этой публикации  рассмотрим влияние генеративного ИИ на анализ данных и проанализируем, каким образом компании используют эту технологию для усовершенствования социального мониторинга в будущем.

Генеративный искусственный интеллект принадлежит к категории технологий, успешно создающих новый контент на основе имеющейся информации. В отличие от обычных моделей искусственного интеллекта, ориентированных на анализ и интерпретацию данных, генеративный ИИ идет дальше, порождая уникальные результаты.

 

Рисунок 1. Рынок AI в России

 

В своей сути генеративный ИИ опирается на алгоритмы машинного обучения, в основе которых лежат нейронные сети. Эти сети обучаются на обширных наборах данных и приобретают умение распознавать шаблоны и структуры в данных. После обучения такие модели способны генерировать новые данные, которые впечатляюще похожи на обучающий набор. Например, генеративная модель ИИ, обученная на тысячах изображений, может создавать оригинальные произведения искусства, отражающие стиль определенного художника.

Заметным прорывом в области генеративного ИИ является разработка моделей, таких как GPT (Generative Pretrained Transformer), способных генерировать тексты. Эти модели проявляют удивительное понимание контекста, стиля и даже абстрактных идей, что позволяет им порождать точные и детализированные результаты.

Генеративный ИИ находит широкое применение в творчестве, создании контента, дизайне и других областях. Его инновационные и творческие возможности выдвигают его вперед среди прочих разработок искусственного интеллекта, расширяя границы машинного творчества [2].

 

Рисунок 2. Инвестиции на создание решений с применением ИИ

 

1. Обзор рынка 

Обзор рынка генеративного ИИ в области анализа данных демонстрирует впечатляющий рост. В 2022 году объем глобального рынка генеративного искусственного интеллекта в сфере анализа данных составил 2,02 миллиона долларов США. Однако, согласно прогнозам, к 2032 году он вырастет до 211,94 миллионов долларов США, демонстрируя годовой темп роста (CAGR) на уровне 59,2% в период с 2023 по 2032 год. Генеративный искусственный интеллект, способный порождать новые данные, включая текст, графику и программный код, нашел применение в выявлении мошенничества, улучшении рекомендаций по продуктам и обучении моделей машинного обучения. Его способность генерировать и извлекать информацию из данных стала ключевым фактором в улучшении анализа данных и бизнес-аналитики.

 

Рисунок 3. Объем рынка генеративного ИИ в сфере анализа данных в 2019-2032 годах (млн долларов США)

 

Использование генеративного ИИ в анализе данных становится особенно значимым для отрасли здравоохранения. В этой сфере генеративный ИИ используется для обработки огромных объемов данных, анализа и выявления закономерностей. Также позволяет ИТ-отделам создавать симуляции и модели, обеспечивая более точные прогнозы. Применение генеративного ИИ в медицинской сфере привело к повышению эффективности, снижению цен и улучшению качества медицинской помощи. От персонализированной медицины до эпидемиологии и разработки лекарств – такие способности как извлекать ценные данные из огромных объемов информации делают его ценным инструментом для успеха в сфере здравоохранения.

Разработка новых генеративных алгоритмов ИИ активно продолжается. С появлением новых технологий появляются и новые алгоритмы, позволяющие применять креативные методы извлечения информации из данных. Очевидно, что будущие стратегии анализа данных компаний будут сильно опираться на генеративный ИИ. Он становится ключевым элементом для оставания конкурентоспособными и использования данных с максимальной эффективностью и точностью.

В области аналитики данных, глобальный рынок генеративного ИИ в 2022 году сегментирован по развертыванию на облачные и локальные системы. Облачные системы в данной сфере становятся доминирующим методом развертывания, благодаря их гибкости и масштабируемости, что делает их предпочтительным вариантом для генеративных приложений ИИ.

Технология машинного обучения является одной из самых широко используемых в генеративном ИИ в аналитике данных. Это объясняется тем, что машинное обучение является мощным инструментом, способным извлекать уроки из данных и делать прогнозы. Генеративный ИИ используется для создания синтетических данных, которые в дальнейшем могут быть использованы для обучения моделей машинного обучения [1].

2. Общая характеристика генеративного искусственного интеллекта

Согласно исследованию компании Valoir, ИИ в состоянии автоматизировать до 40% рабочего дня среднестатистического сотрудника. Широкое распространение генеративного ИИ повысило осведомленность общественности о его потенциале увеличения производительности и эффективности, а также о сопутствующих рисках.

Gartner утверждает, что генеративный ИИ будет оказывать всё большее воздействие на предприятия в ближайшие пять лет. Аналитическая компания прогнозирует:

  • К 2024 году 40% корпоративных приложений будут обладать встроенным разговорным ИИ, в то время как в 2020 году таких приложений было менее 5%.
  • К 2025 году 30% предприятий будут иметь стратегию разработки и тестирования, основанную на использовании ИИ, в сравнении с 5% в 2021 году.
  • К 2026 году ИИ для генеративного дизайна станет автоматизировать до 60% процессов разработки новых веб-сайтов и мобильных приложений.
  • К 2026 году более 100 миллионов людей будут взаимодействовать с роботами-коллегами при совместной работе.
  • К 2027 году около 15% новых приложений будут автоматически генерироваться ИИ без участия человека, что на текущий момент практически не встречается.
  • К 2025 году более 55% всего анализа данных глубокими нейронными сетями будет происходить на периферии, в то время как в 2021 году этот показатель составлял менее 10%.

Генеративный ИИ находится на пике ожиданий в цикле развития технологий Gartner "Hype Cycle for Emerging Technologies 2023".

IDC отмечает, что технологическая индустрия переживает переломный момент. Никогда ещё не наблюдалось появление технологии, которая была бы настолько поддержана руководством, с четко определенными бизнес-результатами и быстрым внедрением. Три широких типа использования генеративного ИИ, выделенные IDC для организаций, включают отраслевые, бизнес-функциональные и производственные сценарии.

IDC отмечает, что для генеративного ИИ ключевую роль играют данные. Когда компания провела опрос среди клиентов относительно их данных, полученные результаты вызвали тревогу:

  • 82% организаций выразили опасения относительно изолированных данных (по результатам исследования «Future Enterprise Resiliency & Spending Survey»).
  • 41% отметили, что данные изменяются быстрее, чем они успевают их обрабатывать (данные отчета «Global Data Valuation Survey»).
  • 24% не доверяют своим данным (по результатам исследования «Future Enterprise Resiliency & Spending Survey»).
  • 29% испытывают трудности с качеством данных (данные отчета «Future Enterprise Resiliency & Spending Survey»).

Согласно отчету IDC, генеративный ИИ на предприятиях широко применяется в областях генерации кода, управления корпоративным контентом, маркетинга и разработки приложений для клиентов.

Исследование Forrester указывает на следующее поколение современной разработки программного обеспечения, где генеративные ИИ-боты TuringBots ускорят и улучшат процесс разработки ПО. Определение ботов Тьюринга включает их как «ПО на базе ИИ, дополняющее автоматизированные и полуавтономные возможности команд разработки приложений, инфраструктуры и операций по планированию, анализу, проектированию, кодированию, тестированию, доставке и развертыванию, обеспечивая вспомогательную интеллектуальную оценку кода, процессов разработки и приложений». По оценкам Forrester, боты Тьюринга будут создавать 10% кода и тестов по всему миру. В исследовании подчеркивается, что генеративный ИИ помогает компаниям минимизировать риски и принимать успешные решения в развивающихся технологиях. В исследовании Forrester, посвященном влиянию генеративного ИИ на маркетинг, отмечаются его преимущества в масштабировании и точности: усиление человеческой интуиции за счет машинного интеллекта, улучшение возможностей творческих работников и увеличение масштаба и скорости для качественного креатива.

Компания Constellation Research предсказывает, что генеративный ИИ станет определяющим в будущем труда. Их исследование отмечает, что скорость выполнения многих рабочих задач может увеличиться в 1,3–5 раз. Рекомендации аналитиков по внедрению генеративного ИИ на цифровом рабочем месте включают в себя:

  • Четкие принципы управления ИИ;
  • Обучение и тренинг;
  • Структуры управления ИИ;
  • Наблюдение и контроль;
  • Сотрудничество и обратная связь;
  • Разработка четких этических рекомендаций;
  • Оценка этических аспектов;
  • Мониторинг предвзятости ИИ;
  • Обеспечение прозрачности;
  • Соблюдение нормативных требований [6].

3. Генеративные модели ИИ

Генеративный искусственный интеллект обычно функционирует путем обучения модели глубокого обучения на наборе данных изображений, что позволяет создавать новые изображения. Он использует различные модели генеративного ИИ, такие как BERT, Transformer и авторегрессивные модели. Однако среди наиболее известных моделей можно выделить генеративно-состязательные сети (GAN) и вариационные автоэнкодеры (VAE).

GAN состоит из двух основных компонентов: генератора и дискриминатора. Генератор обучается создавать новые изображения, которые максимально приближены к изображениям из обучающего набора, в то время как дискриминатор обучается отличать настоящие изображения от поддельных, созданных генератором. В процессе состязательного обучения генератор стремится создавать изображения, которые обманут дискриминатор, в то время как дискриминатор стремится точно определить поддельные изображения. Таким образом, генератор постепенно улучшает свои навыки и создает более реалистичные изображения.

VAE, в свою очередь, работают путем изучения вероятностного отображения из многомерного входного пространства (например, фотографии) в маломерное скрытое пространство и обратно. В процессе обучения VAE анализирует шаблоны и особенности изображений, чтобы понять вероятностное распределение изображений. После обучения модель может создавать новые изображения, используя скрытое пространство и сопоставляя его с исходным.

После завершения обучения модели GAN или VAE способны создавать новый контент или изображения, имитирующие те, что были в обучающем наборе. Эта технология применяется для создания реалистичных компьютерных изображений, улучшения качества изображений низкого разрешения и создания новых изображений на основе текстовых описаний [7].

Для анализа данных генеративный искусственный интеллект используется в различных сферах:

  • Корпоративная бизнес-аналитика: Генеративный ИИ помогает получать более развернутую информацию для анализа, что является основой для прогнозирования действий.
  • Анализ маркетинга, продаж и клиентского опыта: Генеративный ИИ улучшает анализ персонализированных профилей клиентов и настроений при взаимодействии с ними.
  • Геопространственная аналитика: Повышает понимание пространственных закономерностей, улучшает обработку географических данных на более детальном уровне.
  • Генерация синтетических и тестовых данных: Используется для создания синтетических данных, когда доступ к личным данным ограничен.
  • Интегрированный офисный пакет и аналитика корпоративного программного обеспечения: Генеративные помощники предоставляют объяснения наборов данных на естественном языке.

К преимуществам генеративного ИИ в анализе данных можно отнести то, что:

  • Пользователи могут получать результаты с объяснениями на естественном языке.
  • Мультимодальные генеративные модели расширяют возможности работы с неструктурированными данными.
  • Большие модели поддерживают автоматизацию и анализ в реальном времени.
  • Генеративные модели выявляют закономерности и взаимосвязи в массивных данных, недоступные обычному анализу.
  • Некоторые инструменты генеративного ИИ создают точные аналоги синтетических данных для безопасного анализа данных в регулируемых отраслях [3].

4. Лучшие решения с генеративным ИИ для анализа данных

Количество поставщиков генеративного ИИ, которые разработали базовые и доработанные модели для анализа данных, сегодня довольно велико. В зависимости от отрасли и конкретной ситуации использования, представлены различные решения для использования генеративного ИИ:

  • ChatGPT и GPT-4: Пользователи имеют возможность выполнять разнообразные задачи по анализу данных непосредственно в ChatGPT, а также встраивать и настраивать эти модели в соответствии с бизнес-потребностями. Многие поставщики аналитики данных успешно интегрировали или интегрируют функциональность OpenAI в личные инструменты, включая Tableau и Qlik.
  • Cohere: В зависимости от выбранного продукта от Cohere, можно  проводить анализ настроений клиентов в социальных сетях, задавать конкретные вопросы, извлекать информацию из документов или создавать собственные приложения для анализа текстов.
  • Anthropic: Чат-бот Claude от Anthropic наиболее подходит для разговорного анализа текста. По информации на сайте Anthropic, у Claude есть контекстное окно примерно из 100 000 токенов или 70 000 слов, что обеспечивает ему значительные возможности для запоминания информации.
  • Copilot, генеративный ИИ-ассистент от Microsoft, был внедрен в несколько продуктов Microsoft, включая Microsoft 365 и Microsoft Power BI. В Excel и Power BI пользователи получают поддержку искусственного интеллекта при анализе данных и создании визуализаций.
  • Синтетический RAIC: Этот инструмент основан на возможностях генеративного ИИ и используется для геопространственного анализа. RAIC способен извлекать информацию из неструктурированных данных, включая записи с беспилотных летательных аппаратов и спутниковые снимки.
  • Syntho: Syntho Engine генерирует двойников синтетических данных, применяемых для демонстрации продукта или для более безопасного анализа данных. Клиентская база компании включает работников здравоохранения, образования, инфраструктуры и других государственных структур, где требуется сочетание передовых методов анализа данных с соблюдением нормативных требований [4,5].

Заключение

Таким образом использование генеративного искусственного интеллекта (ГИИ) в анализе данных веб-аналитики представляет собой инновационный подход, позволяющий значительно улучшить процесс анализа и понимание пользовательского поведения в онлайн среде. Этот метод позволяет выявлять скрытые закономерности, моделировать поведение пользователей и предсказывать тенденции на основе созданных данных. Также он способствует созданию более точных прогнозов и предложений для улучшения пользовательского опыта и эффективности веб-ресурсов.

Однако, несмотря на потенциальные преимущества, использование генеративного искусственного интеллекта требует внимательного анализа и оценки нюансов безопасности данных, этических аспектов и управления информацией. Тем не менее, использование генеративного искусственного интеллекта при анализе данных веб-аналитики представляет собой мощный инструмент для улучшения понимания пользовательского поведения, оптимизации веб-ресурсов и создания персонализированных стратегий, способствуя эффективному развитию онлайн-присутствия и улучшению пользовательского опыта.

 

Список литературы:

  1. Dhapte A., Generative Al in Data Analytics Market Overview // Market research future. 2024. [Электронный ресурс] - Режим доступа:   https://www.marketresearchfuture.com/reports/generative-ai-in-data-analytics-market-12184 – (дата обращения  01.01.2024).
  2. Generative AI for data analytics // Talkwalker. 2023. [Электронный ресурс] - Режим доступа:  https://www.talkwalker.com/blog/generative-ai-for-data-analytics – (дата обращения  01.01.2024).
  3. Rumiantsau M., Generative AI for Data Analytics: Making Data Insights Accessible // Narrative.by. 2023. [Электронный ресурс] - Режим доступа:  https://www.narrative.bi/analytics/generative-ai-for-data-analytics-making-data-insights-accessible#the-challenges-of-traditional-data-analysis – (дата обращения  01.01.2024).
  4. Sergiienko B., How to Use Generative AI in Data Analytics for Enhanced Decision-Making and Strategic Growth // Master of code. 2023. [Электронный ресурс] - Режим доступа:  https://masterofcode.com/blog/generative-ai-for-data-analytics – (дата обращения  01.01.2024).
  5. Shelby H., Generative AI and Data Analytics: Best Practices // Eweek. 2023. [Электронный ресурс] - Режим доступа:  https://www.eweek.com/artificial-intelligence/generative-ai-data-analytics/ – (дата обращения  01.01.2024).
  6. Будущее генеративного ИИ: оценки ведущих мировых аналитиков // Itweek. 2023. [Электронный ресурс] - Режим доступа:  https://www.itweek.ru/ai/article/detail.php?ID=227435 – (дата обращения  01.01.2024).
  7. Варианты использования и применения генеративного ИИ // Neuroni.co. [Электронный ресурс] - Режим доступа:  https://neuroni.co/ru/articles/generative-ai-use-cases-and-applications – (дата обращения  01.01.2024).
Информация об авторах

эксперт по цифровому маркетингу и веб-аналитике, Директор диджитал-агентства «Юла», РФ, г. Москва

An expert in digital marketing and web analytics, founder of the Yula digital agency, Russia, Moscow

Журнал зарегистрирован Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций (Роскомнадзор), регистрационный номер ЭЛ №ФС77-54434 от 17.06.2013
Учредитель журнала - ООО «МЦНО»
Главный редактор - Ахметов Сайранбек Махсутович.
Top