Использование методов машинного обучения для прогнозирования раскрываемости преступлений на основе документов первичного учета
Работая с нашим сайтом, вы даете свое согласие на использование файлов cookie. Это необходимо для нормального функционирования сайта, показа целевой рекламы и анализа трафика. Статистика использования сайта отправляется в «Яндекс» и «Google»
Научный журнал Моделирование, оптимизация и информационные технологииThe scientific journal Modeling, Optimization and Information Technology
cетевое издание
issn 2310-6018

Использование методов машинного обучения для прогнозирования раскрываемости преступлений на основе документов первичного учета

idБулгаков Д.Ю.

УДК 004.8
DOI: 10.26102/2310-6018/2021.33.2.030

  • Аннотация
  • Список литературы
  • Об авторах

Раскрываемость преступлений является одним из важных показателей деятельности органов внутренних дел. Несмотря на совершенствование методов противодействия преступности и документирования преступной деятельности, раскрываемость преступлений в Российской Федерации остается на уровне 51%–56%. В статье описан метод построения математической модели – цифрового двойника зарегистрированного преступления. В качестве исходных данных для построения модели использован массив сведений – документов первичного учета, в отношении 341 тысячи преступлений, совершенных на территории Приморского края за 11 лет – с 2010 по 2020 год. Модель позволяет: с достоверностью 88%, на основании формализованной первичной информации, содержащейся в статистических карточках Форма № 1 «На выявленное преступление», строить прогноз о том, будет преступление раскрыто или нет; проводить ревизию нераскрытых преступлений прошлых лет в целях определения преступлений, имеющих высокую вероятность раскрытия; выявлять признаки в статистических карточках, в наибольшей степени влияющие на прогноз раскрываемости преступлений. Модель основана на использовании алгоритмов машинного обучения «градиентный бустинг над решающими деревьями», реализованных в открытой библиотеке искусственного интеллекта CatBoost от компании Яндекс. Точность модели подтверждается составлением и проверкой прогноза раскрываемости в январе-июне 2021 года 16408 преступлений, совершенных на территории Приморского края.

1. Форма федерального статистического наблюдения № 4-ЕГС «О состоянии преступности и результатах расследования преступлений» . Доступно по: http://crimestat.ru/analytics (дата доступа 20.05.2021).

2. Низамов В.Ю. К вопросу о понятии «раскрытие преступления» в криминалистике и уголовном процессе. Ленинградский юридический журнал. 2016;1(43):170-179.

3. Приказ Генеральной прокуратуры Российской Федерации, МВД России, МЧС России, Минюста России, ФСБ России, Минэкономразвития России, ФСКН России от 29.12.2005 № 39/1070/1021/253/780/353/399 «О едином учете преступлений». Доступно по: https://rg.ru/2006/01/25/uchet-prestupleniy-dok.html (дата обращения: 20.05.2021).

4. Овчинский В.С., Ларина Е.С. Искусственный интеллект: Большие данные. Преступность. – Москва: Книжный мир, 2018:1-416.

5. Ясницкий Л.Н., Ваулева С.В., Сафонова Д.Н., Черепанов Ф.М. Использование методов искусственного интеллекта в изучении личности серийных убийц. Криминологический журнал Байкальского государственного университета экономики и права. 2015;9(3):423-430.

6. Пьянков Д.Д., Малюгин М.И., Ясницкий Л.Н. Применение нейросетевых технологий в изучении факторов, влияющих на преступность в городах России. Искусственный интеллект в решении актуальных социальных и экономических проблем XXI века, 21–23 мая 2019 года. Пермь: Пермский государственный национальный исследовательский университет, 2019:126-132.

7. Попонина А.О. Прогнозирование уровня преступности в регионах России. Искусственный интеллект в решении актуальных социальных и экономических проблем XXI века, 21–23 мая 2019 года. Пермь: Пермский государственный национальный исследовательский университет, 2019:119-125.

8. Булгаков Д.Ю. Современные подходы к тестированию систем биометрической идентификации по изображению лица. Искусственный интеллект (большие данные) на службе полиции. Сборник статей международной научно-практической конференции. Москва: Академия управления МВД России, 2020:45-51.

9. Гордеев А.Ю. Перспективы развития и использования искусственного интеллекта и нейросетей для противодействия преступности в России (на основе зарубежного опыта). Научный портал МВД России. 2021;1(53):123-135.

10. Prokhorenkova L., Gusev G., Vorobev A., Dorogush A. V., Gulin A. Catboost unbiased boosting with categorical features. 2017. arXiv: 1706.09516.

11. Melnikov A.V., Narushev I.R., Kubasov I.A. Method for Evaluating Inhomogeneous Alternatives with the Hierarchical Structure of Unrelated Criteria Based on Medium-Consistent Matrix of Pair Comparisons. Journal of Computational and Engineering Mathematics. 2019;6(2):32-41. DOI: 10.14529/jcem190203.

12. Салахутдинова К.И., Лебедев И.С., Кривцова И.Е. Алгоритм градиентного бустинга деревьев решений в задаче идентификации программного обеспечения. Научно-технический вестник информационных технологий, механики и оптики. 2018:1016-1022. DOI: 10.17586/2226-1494-2018-18-6-1016-1022.

13. Соколов Е. Семинары по выбору моделей . 2015:1-9. Доступно по: http://www.machinelearning.ru/wiki/images/1/1c/Sem06_metrics.pdf (дата обращения: 20.05.2021).

Булгаков Дмитрий Юрьевич

Email: dbulgakov7@yandex.ru

ORCID | РИНЦ |

Федеральное казенное учреждение «Главный информационно-аналитический центр Министерства внутренних дел Российской Федерации»
Академия управления МВД России

Москва, Российская Федерация

Ключевые слова: цифровой двойник, прогностическая модель, преступность, статистические карточки, машинное обучение, искусственный интеллект, catBoost, градиентный бустинг, решающие деревья, значимость признаков

Для цитирования: Булгаков Д.Ю. Использование методов машинного обучения для прогнозирования раскрываемости преступлений на основе документов первичного учета. Моделирование, оптимизация и информационные технологии. 2021;9(2). URL: https://moitvivt.ru/ru/journal/pdf?id=1010 DOI: 10.26102/2310-6018/2021.33.2.030

905

Полный текст статьи в PDF

Принята к публикации 11.08.2021

Опубликована 30.06.2021