Использование методов машинного обучения для прогнозирования раскрываемости преступлений на основе документов первичного учета
Работая с сайтом, я даю свое согласие на использование файлов cookie. Это необходимо для нормального функционирования сайта, показа целевой рекламы и анализа трафика. Статистика использования сайта обрабатывается системой Яндекс.Метрика
Научный журнал Моделирование, оптимизация и информационные технологииThe scientific journal Modeling, Optimization and Information Technology
cетевое издание
issn 2310-6018

Использование методов машинного обучения для прогнозирования раскрываемости преступлений на основе документов первичного учета

idБулгаков Д.Ю.

УДК 004.8
DOI: 10.26102/2310-6018/2021.33.2.030

  • Аннотация
  • Список литературы
  • Об авторах

Раскрываемость преступлений является одним из важных показателей деятельности органов внутренних дел. Несмотря на совершенствование методов противодействия преступности и документирования преступной деятельности, раскрываемость преступлений в Российской Федерации остается на уровне 51%–56%. В статье описан метод построения математической модели – цифрового двойника зарегистрированного преступления. В качестве исходных данных для построения модели использован массив сведений – документов первичного учета, в отношении 341 тысячи преступлений, совершенных на территории Приморского края за 11 лет – с 2010 по 2020 год. Модель позволяет: с достоверностью 88%, на основании формализованной первичной информации, содержащейся в статистических карточках Форма № 1 «На выявленное преступление», строить прогноз о том, будет преступление раскрыто или нет; проводить ревизию нераскрытых преступлений прошлых лет в целях определения преступлений, имеющих высокую вероятность раскрытия; выявлять признаки в статистических карточках, в наибольшей степени влияющие на прогноз раскрываемости преступлений. Модель основана на использовании алгоритмов машинного обучения «градиентный бустинг над решающими деревьями», реализованных в открытой библиотеке искусственного интеллекта CatBoost от компании Яндекс. Точность модели подтверждается составлением и проверкой прогноза раскрываемости в январе-июне 2021 года 16408 преступлений, совершенных на территории Приморского края.

Ключевые слова: цифровой двойник, прогностическая модель, преступность, статистические карточки, машинное обучение, искусственный интеллект, catBoost, градиентный бустинг, решающие деревья, значимость признаков

Для цитирования: Булгаков Д.Ю. Использование методов машинного обучения для прогнозирования раскрываемости преступлений на основе документов первичного учета. Моделирование, оптимизация и информационные технологии. 2021;9(2). URL: https://moitvivt.ru/ru/journal/pdf?id=1010 DOI: 10.26102/2310-6018/2021.33.2.030

1596

Полный текст статьи в PDF

Принята к публикации 11.08.2021

Опубликована 30.06.2021