Искусственный интеллект как сервис. Различные парадигмы и эффект масштабирования AIAAS систем в окружении интернета вещей

Artificial intelligence as a service. Different paradigms and an effect of scalability of AIAAS systems in the iot environment

Крюков Д.А. Москалев А.О. Муратова Е.В.

25.05.2017 1882

№ 5 (38)

10. Информатика, вычислительная техника и управление

Цитировать:

Крюков Д.А., Москалев А.О., Муратова Е.В. Искусственный интеллект как сервис. Различные парадигмы и эффект масштабирования AIAAS систем в окружении интернета вещей // Universum: технические науки : электрон. научн. журн. 2017. № 5 (38). URL: https://7universum.com/ru/tech/archive/item/4831 (дата обращения: 15.12.2025).

Прочитать статью:

Keywords: artificial intelligence, machine learning, cloud computing, scaling, internet of things

АННОТАЦИЯ

Авторы статьи ставят цель описать различные виды и способы применения облачно-интеллектуальных услуг, а также продемонстрировать почему некоторые их парадигмы не находят широкого применения в коммерческом секторе. Кроме этого, авторы рассказывают о более комплексных системах на базе модели «ИИ как сервис» и о влиянии эффекта масштабируемости на эти системы. В конце, авторы предлагают и описывают концептуальную модель такой системы.

ABSTRACT

Authors of the article have a goal to describe the different types and methods of using cloud-based intellectual services, and to explain why some of their paradigms are not widely used in the commercial sector. In addition, the authors write about more complex systems based on the "AI as a Service" model, and about the impact of the scalability effect on these systems. In the end, the authors suggest and describes a concept of such system.

Искусственный интеллект (ИИ) становится доступнее. Практическое применение решений на базе ИИ остаётся не менее важным вопросом, чем технологические аспекты его работы. Начиная со второй половины 20 века велись попытки создать искусственный разум, воссоздать программным путём структуры человеческого мозга, научить машину понимать естественную речь, анализировать информацию и самостоятельно делать выводы. Сфера ИИ даже успела пережить несколько падений и подъёмов – появилось понятие «зима искусственного интеллекта», описывающее упадок данного направления в 80-90-ых годах. Сейчас, по мнению многих экспертов, пришло время говорить о «весне искусственного интеллекта», и действительно, в последние 3-4 года разработки, связанные с интеллектуальным программным обеспечением, пользуются большой популярностью, в них инвестируют миллионы долларов, а акселераторы по всему миру открывают отдельные треки для предпринимателей и разработчиков «умных» решений [10]. Такие компании как Google, Amazon и IBM, видя коммерческий потенциал данного направления, создают собственные сервисы на базе ИИ. Например, созданная Google нейронная сеть Deep Mind впервые в истории смогла обыграть человека в Го [8].

Нейронные сети, к слову, являются одним из главных драйверов «бума» ИИ, вместе с машинным обучением они находят широкое применение в сфере прикладного маркетинга, биотехнологий, анализа дынных и в финансовом секторе. Нужно заметить, что последний является чуть ли не крупнейшим потребителем «умных» решений. Действительно, в сфере финансовых технологий, ИИ способен обеспечить широкую автоматизацию интеллектуальной деятельности, может быстро принимать качественные решения и оценивать риски. В ближайшие 20 лет финансовые аналитики могут быть полностью вытеснены ИИ, как фотопленка когда-то была вытеснена цифровой фотографией.

Причины столь высокого спроса на «умные» решения в рассматриваемой области также можно объяснить количеством данных, которыми обладают финансовые организации. Под современным ИИ в корпоративном секторе сейчас, как правило, понимают нейронные сети, алгоритмы машинного и глубокого обучения (ML и DL соответственно), интеллектуальный анализ данных (статистическое моделирование, распознавание паттернов и т.п.) и смежные области [5]. Все вышеперечисленные технологии требуют для своей работы большие объемы структурированных данных, чем больше, тем лучше. Нейронные сети и ML/DL алгоритмы сначала обучаются на тренировочной выборке, а потом, если удаётся сохранить ту же точность, используются для процессинга новой информации, находя закономерности и детектируя аномалии. Практически это реализуется на базе фреймворков для выполнения распределенных вычислений (Hadoop/Spark и подобные), такие программные каркасы предоставляют Java, Python, Scala и R интерфейсы, через которые и происходит внедрение большинства «умных» решений. Для работы с такими системами, помимо навыков программирования на вышеперечисленных языках, требуется хорошая математическая подготовка, ведь даже самый простой вероятностный классификатор является достаточно сложным, если не обладать базовыми знаниями математического анализа, теории вероятности и статистики [1]. Необходимыми навыками обладают далеко не все программисты, и найти нужного специалиста «всё-в-одном» может быть нелегко и дорого. Парадигма MLaaS (Machine Learning as a Service), машинное обучение как сервис, призвана решить данную проблему. Компания IBM разработала систему Watson, предлагающую набор интеллектуальных сервисов, доступных через интерфейсы прикладного программирования. Сейчас Watson предлагает сервисы распознавания естественного языка, машинного перевода, анализа тональности текста, распознавания изображений и интеллектуальных ботов. Большим преимуществом подобных платформ является огромный объем информации, который они способны аккумулировать за счет эффекта масштабирования. Тысячи приложений отправляют свои данные, которые потом используются как обучающая выборка для дополнительной «тренировки» системы. С помощью такого подхода удаётся решить проблему нехватки данных [4]. Google, например, позволяет каждому пользователю вносить изменения в автоматический перевод сервиса Google Translate, таким образом, формируя новые обучающие выборки, удаётся достичь высокую точность перевода. Минус же такого подхода состоит в необходимости давать MLaaS системе на вход только структурированные данные, в добавок, ограниченные жесткими требованиями. Большие данные, в этом плане, сдерживают развитие данной парадигмы, так как автоматическое структурирование данных является пока весьма сложной с техническом точки зрения задачей. Сейчас, для решения подобной проблемы используют так называемое машинное обучение без учителя, суть которого состоит в попытках автоматической кластеризации информации, но итоговая точность часто бывает неудовлетворительна, и, если данные изначально проклассифицированы неправильно, обучающие выборки так же будут неправильными, а это в свой очередь потребует полного ручного переобучения системы.

Другой важный тип проблем, с которыми сталкиваются MLaaS сервисы и который также можно отнести к проблемам структурирования, – очистка данных. Особенно остро это ощущается в областях распознавания естественной речи и изображений. MLaaS системы неплохо решают тривиальные для машинного обучения задачи, но если во входных данных присутствует большой процент «шума», то отсутствие полноценных возможностей ручной настройки сильно сказываются на итоговой точности, велика вероятность появления ошибок второго рода [2]. Популярности MLaaS системам также не добавляет тот факт, что они часто построены на том же открытом наборе технологий, который используют рядовые ML-инженеры, то есть в принципе своей работы такая система не использует каких-либо проприетарных программных библиотек или особых технических решений [7]. Как видно, машинное обучение как сервис, обладает множеством недостатков, но при это может выигрывать от эффекта масштабирования. К тому же, MLaaS остаётся малозаметной на рынке ИИ по той же причине, по которой она появилась – алгоритмы машинного обучения сложны, и разработчикам, без серьезной предметной подготовки, нелегко применять их на практике, а при наличии этой подготовки, уже нет смысла платить за доступ к API сторонних сервисов.

Таким образом, любой глобальный оператор модели MLaaS сталкивается с трудностями, связанными со структуризацией данных, а также с технической сложностью базовых принципов работы интеллектуальных систем. Востребованными, на наш взгляд, в свете развития интернета вещей, могут стать более комплексные системы, основывающиеся на парадигме AIaaS – ИИ как сервис. Интернет вещей (IoT) является мощнейшим источником трафика и данных. Выгодно использовать этот фактор для достижения синергии между миром IoT и ИИ можно, например, в области компьютерного зрения и разработки самоуправляемых автомобилей. Сейчас такие компании как Tesla, BMW, Google, Toyota, российский КАМАЗ и многие другие ведут разработки собственных беспилотных систем. На рисунке 1 показаны основные игроки данного рынка, а также количество уже использующихся тестовых экземпляров. Автопилоты Tesla в день проезжают около миллиона километров, автомобили Google за такой же промежуток времени проезжают около трёх миллионов километров в симуляторе, при этом можно обоснованно предположить, что между пройденными километрами и точностью автопилота есть прямая зависимость [9]. Глобальный оператор самоуправляемого транспорта, на наш взгляд, смог бы использовать всю выгоду масштабирования, так как в его распоряжении оказались бы гигантские обучающие выборки, а поскольку входные данные (дорожные знаки, дорожная разметка, силуэту транспортных средств и т.п.) в большинстве случаев единообразны и правила дорожного движения четко регламентированы, проблема структуризации данных не стояла бы так остро. Кроме того, такой глобальный автопилот смог бы взаимодействовать с окружением через интернет вещей. Беспилотный транспорт, например, может опрашивать находящиеся в определенном радиусе смартфоны, чтобы по гео-меткам определить число и плотность пешеходов. Глобальный автопилот также может взаимодействовать с сетью дорожных камер, чтобы получать информацию о происшествиях, авариях и других непредвиденных дорожных ситуациях.

Рисунок 1. Разработчики беспилотных автомобилей и количество тестируемых экземпляров

Важным моментом является возможность взаимодействия всех транспортных средств на базе подобной системы. Сейчас, к примеру, оно ограничивается инструментами компьютерного зрения – автопилот воспринимает другой автопилот как самый обычный автомобиль [6]. Соединяя автопилоты в сеть, глобальный оператор мог бы агрегировать гигантские объемы информации. С их помощью, в свою очередь, было бы возможно выявлять аномалии в движении транспортных средств, предупреждать остальных водителей о потенциальной опасности, бороться с пробками, выдавая рекомендации по построению маршрутов движения. С помощью обширной сети автопилотов также возможно собирать информацию о состоянии дорожного полотна, и практически в режиме реального времени планировать ремонтные и муниципальные работы. Стандарты безопасности функционирования подобной системы во многом могут быть схожи с таковыми для распределенных вычислений, а именно: избыточность, дублирование важных узлов, балансировка нагрузки, процедуры аварийного оповещения и автоматического восстановления.

Сдерживающими же факторами перехода от гетерогенных интеллектуальных систем автопилота к единой платформе по модели AIaaS, могут стать пропускная способность телекоммуникационных сетей и отсутствие широко-используемой открытой платформы интернета вещей. Сейчас проблема решается путем наделения автопилота высокой степенью автономности, но с течением времени, можно ожидать уменьшения влияния данных негативных факторов и увеличения глубины взаимодействия между элементами интеллектуальных систем через интернет вещей.

В заключении, хотелось бы ещё раз отметить влияние эффекта масштабируемости, достигаемого использованием парадигмы AIaaS, на развитие различных областей ИИ. Стоит сказать, что спросом будут пользоваться скорее комплексные системы, чем точечные решения типа MLaaS. Возвращаясь к пользе эффекта масштабируемости, взаимодействие открытых систем способно предоставить огромное количество ценных данных и увеличить точность работы «умных» систем. Сфера компьютерного зрения и беспилотного транспорта является лишь одним примером, иллюстрирующим эту синергию. Разработчики платформ решений на базе ИИ также не должны забывать о возможности взаимодействия с интернетом вещей, который отлично помогает решить проблему нехватки данных.

Список литературы:

1. А. Гелиг, А. Матвеев. Введение в математическую теорию обучаемых распознающих систем и нейронных сетей. / Учебное пособие. – СПбГУ [СПб], 2014. – 57 с.
2. Л. П. Коэльо, В. Ричард. Построение систем машинного обучения на языке Python. – М: ДМК Пресс , 2016. – 97 с.
3. М. Тим Джонс. Программирование искусственного интеллекта в приложениях. / Учебное пособие. – М: ДМК Пресс, 2015. – 129 с.
4. Э. Алпайдин. Машинное обучение. Новый искусственный интеллект. – М: Альпина Паблишер, 2017. – 191 с.
5. Ян Эрик Солем. Программирование компьютерного зрения на Python. / Учебное пособие. – М: ДМК Пресс, 2016. – 211 с.
6. B. Cross, Five AI Startup Predictions for 2017 / [электронный ресурс] – режим доступа: http://bradfordcross.com/blog/2017/3/3 (дата обращения: 03.05.2017).
7. BBC News, Google achieves AI 'breakthrough' by beating Go champion / [электронный ресурс] – режим доступа: http://www.bbc.com/news/technology-35420579 (дата обращения: 29.04.2017).
8. F. Lambert. Google’s self-driving car vs Tesla Autopilot: 1.5M miles in 6 years vs 47M miles in 6 months. / Electrek Magazine, April 2016.
9. L. Kolodny, Y Combinator has a new AI track, and wants startups building ‘robot factory’ tech to apply. / TechCrunch, March 2017.

Информация об авторах