ПОСТРОЕНИЕ ЛОГИЧЕСКОГО АЛГОРИТМА ВЫЯВЛЕНИЯ ВЫБРОСОВ В ЗАШУМЛЕННЫХ ДАННЫХ
Работая с нашим сайтом, вы даете свое согласие на использование файлов cookie. Это необходимо для нормального функционирования сайта, показа целевой рекламы и анализа трафика. Статистика использования сайта отправляется в «Яндекс» и «Google»
Научный журнал Моделирование, оптимизация и информационные технологииThe scientific journal Modeling, Optimization and Information Technology
cетевое издание
issn 2310-6018

ПОСТРОЕНИЕ ЛОГИЧЕСКОГО АЛГОРИТМА ВЫЯВЛЕНИЯ ВЫБРОСОВ В ЗАШУМЛЕННЫХ ДАННЫХ

Лютикова Л.А.  

УДК 519.7
DOI: 10.26102/2310-6018/2018.23.4.011

  • Аннотация
  • Список литературы
  • Об авторах

В работе предложен логический подход к анализу качества данных для решения задач машинного обучения. При разработке алгоритмов машинного обучения часть исходных данных решаемой задачи объединяют в обучающую выборку. Как правило, качество этих данных не вляется идиальным, и это дастаточно острая проблема возникающая при построении обучающих систем распознавания. Так как построение модели распознования является результатом последовательного предъявления исходного набора данных, то их некорректность может существенно искозить конечную модель, что скакжется на результатах работы алгоритмов распознования. Данные, которые вносят искажения при построении модели называют выбросами. Причиной возникновения выбросов являются помехи аппаратуры, неверная интерпритация эксперта, шумы и т.д. В связи с этим возникает задача анализа данных на предмет выявления выбросов и ослобления их влияния на процесс формирования (обучения) рабочей модели. В то же время важно отделять индивидуальные особенности распозноваемых объектов от аномальных данных. В настоящей работе предложены логические методы анализа данных, позволяющие провести классификацию данных. В качестве функции классификатора строится функция, которая является логической комбинацией продукионных правил. Она решает ряд проблем, строит все возможные классы, выявляет индивидуальные характеристики объектов, входящих во множество данных, выявляет объекты и их признаки, которые являются выросами. Основываясь на результатах работы построенного классификатора можно выявленные подозрительные объекты дополнительно исследовать на предмет принадлежности множеству выбросов с учетом полученной оценки. Предложенный подход позволяет не только произвести обучающей выборки на классы, но и выявить выбросы, объекты, которые не могут выступать в качестве эталонов обучающей выборки. Предложенный в настоящей работе метод может служить основой для построения процедуры, повышающей информативное качество обучающей выборки в исследуемой предметной области.

1. Дьякoнoв A.Г., Гoлoвина A.M. Выявление аномалий в работе механизмов методами машинного обучения//Аналитика и управление данными в областях с интенсивным использованием данных: труды XIX Международной конференции DAMDID/RCDL'2017,2017. С. 469– 476.

2. Журавлёв Ю.И. Об алгебраическом подходе к решению задач распознавания или классификации//Проблемы кибернетики. 1978. Т. 33. С. 5–68.

3. Лютикoва Л.А., Шматoва Е.В. Анализ и синтез алгоритмов распознавания образов с использованием переменно-значной логики // Информационные технологии. №4. Том 22. 2016. С. 292—297.

4. Лютикова Л.А., Шматoва Е.В. Логический подход к коррекции результатов работы $\Sigma\Pi$-нейронных сетей//Информационные технологии. 2018. Т. 24. №2. С. 110-116.

5. Шибзухoв З.М. O принципе минимизации эмпирического риска на основе усредняющих агрегирующих функций//Доклады РАН. 2017. Т.476. №5. C. 495-499.

6. Флax П. Машиннoе обучение. Наука и искусство пoстрoения алгoритмoв, которые извлекают знания из данных. М.: МДК Прecc, 2015. 400 c.

Лютикова Лариса Адольфовна
кандидат физико-математических наук
Email: lylarisa@yandex.ru

Кабардино-Балкарский научный центр РАН

Нальчик, Российская Федерация

Ключевые слова: объект, класс, база знаний, выбросы, информативный вес

Для цитирования: Лютикова Л.А. ПОСТРОЕНИЕ ЛОГИЧЕСКОГО АЛГОРИТМА ВЫЯВЛЕНИЯ ВЫБРОСОВ В ЗАШУМЛЕННЫХ ДАННЫХ. Моделирование, оптимизация и информационные технологии. 2018;6(4). Доступно по: https://moit.vivt.ru/wp-content/uploads/2018/10/Lyutikova_4_18_1.pdf DOI: 10.26102/2310-6018/2018.23.4.011

481

Полный текст статьи в PDF