Ключевые слова: аномалия, выброс, временные ряды, правило трех сигм, язык R
Выявление аномалий в многомерных временных рядах с помощью пакета на языке R
УДК 004.4
DOI: 10.26102/2310-6018/2021.34.3.001
Задача поиска аномалий в данных встречается при реализации систем предиктивной аналитики, ставшей очень популярной за последние несколько лет. Предиктивная аналитика – это возможность организаций предсказывать данные на небольшой период времени, тем самым заранее угадывая возможные кризисы или непредвиденные случаи в работе систем на основе уже существующих и поступающих данных. Но предиктивная аналитика достаточно сложна, и поэтому ее реализация также сопряжена с трудностями. Когда компании применяют традиционный подход к предиктивной аналитике (то есть относятся к ней как к любому другому типу аналитики), они часто сталкиваются с препятствиями. Именно поэтому данная область нуждается в инструментах выявления аномалий в данных. Эти инструменты должны помогать выявлять выделяющиеся значения для того, чтобы проводить зависимости с факторами их возникновения и выявлять их в будущем. В данной статье описан пакет на языке R (совокупность R функций, данных и документации к ним, собранных в единое целое), разработанный для выявления аномалий в многомерных временных рядах. Данный пакет способен выявлять аномалии с помощью трех различных методов: метода n-сигм, CUSUM-метода и метода центральных моментов 4 порядка. Также данный пакет производит поиск комплексных аномалий, которые являются прямым показателем ошибки в системе благодаря тому, что аномалии обнаружены в многомерных данных.
1. Антоненко С.В. Эффективность банковских систем безопасности, основанных на машинном обучении. Материалы II международной научно-практической конференции «Тенденции и перспективы развития банковской системы в современных экономических условиях» Брянск, 17-18 декабря 2019 г. - Брянский государственный университет имени академика И.Г. Петровского. 2020; 97-102.
2. Временной ряд (Time series data) [Электронный ресурс]. Логином. Доступно по: https://wiki.loginom.ru/articles/time-series.html (дата обращения: 12.03.2021).
3. Рафикул И., Назим С., Мохаммад Али М., Прохоллад С., Бушра Р. Комплексное исследование обнаружения аномалий во временных рядах данных социальных сетей в Интернете. Международный журнал компьютерных приложений. 2017;180(3):13-22.
4. Экономико-математический словарь - Многомерные временные ряды [Электронный ресурс]. Академик. Доступно по: https://economic_mathematics.academic.ru/2615/Многомерные_временные_ряды (дата обращения: 12.03.2021).
5. Ван Квонг С., Щербаков М. В. Метод управления данными, для прогнозирования оставшегося срока полезного использования многокомпонентных систем. Каспийский журнал: Контроль и высокие технологии. 2019;1:33–44.
6. Чандола В., Банерджи А., Кумар В. Обнаружение аномалий: обзор. ACM Computing Surveys. 2009;41(3).
7. Эффективные подходы к обнаружению аномалий временных рядов [Электронный ресурс]. Towards data science. Доступно по: https://towardsdatascience.com/effective-approaches-for-time-series-anomaly-detection-9485b40077f1 (дата обращения: 12.03.2021).
8. Поиск аномалий (Anomaly Detection) [Электронный ресурс]. Академик. Доступно по: https://dyakonov.org/2017/04/19/поиск-аномалий-anomaly-detection/ (дата обращения: 12.03.2021).
9. Хе К., Чжэн Ю. Дж., Чжан К.Л., Ван Х. Ю., "MTAD-TF: Обнаружение аномалий многомерного временного ряда с использованием комбинации временного шаблона и шаблона признаков". Complexity; 2020;2020. DOI: https://doi.org/10.1155/2020/8846608.
10. Ефимов А.И. Методы применения нейронных сетей для оценки и повышения фотореалистичности виртуальной реальности. ИВД. 2019;3(54). Доступно по: https://cyberleninka.ru/article/n/metody-primeneniya-neyronnyh-setey-dlya-otsenki-i-povysheniya-fotorealistichnosti-virtualnoy-realnosti (дата обращения: 12.03.2021).
Ключевые слова: аномалия, выброс, временные ряды, правило трех сигм, язык R
Для цитирования: Раюшкин Э.С., Щербаков М.В., Казаков И.Д., Колесникова В.О. Выявление аномалий в многомерных временных рядах с помощью пакета на языке R. Моделирование, оптимизация и информационные технологии. 2021;9(3). URL: https://moitvivt.ru/ru/journal/pdf?id=948 DOI: 10.26102/2310-6018/2021.34.3.001
Поступила в редакцию 14.03.2021
Поступила после рецензирования 20.08.2021
Принята к публикации 31.08.2021
Опубликована 30.09.2021