Ключевые слова: цифровой двойник, прогностическая модель, преступность, статистические карточки, машинное обучение, искусственный интеллект, catBoost, градиентный бустинг, решающие деревья, значимость признаков
Использование методов машинного обучения для прогнозирования раскрываемости преступлений на основе документов первичного учета
УДК 004.8
DOI: 10.26102/2310-6018/2021.33.2.030
Раскрываемость преступлений является одним из важных показателей деятельности органов внутренних дел. Несмотря на совершенствование методов противодействия преступности и документирования преступной деятельности, раскрываемость преступлений в Российской Федерации остается на уровне 51%–56%. В статье описан метод построения математической модели – цифрового двойника зарегистрированного преступления. В качестве исходных данных для построения модели использован массив сведений – документов первичного учета, в отношении 341 тысячи преступлений, совершенных на территории Приморского края за 11 лет – с 2010 по 2020 год. Модель позволяет: с достоверностью 88%, на основании формализованной первичной информации, содержащейся в статистических карточках Форма № 1 «На выявленное преступление», строить прогноз о том, будет преступление раскрыто или нет; проводить ревизию нераскрытых преступлений прошлых лет в целях определения преступлений, имеющих высокую вероятность раскрытия; выявлять признаки в статистических карточках, в наибольшей степени влияющие на прогноз раскрываемости преступлений. Модель основана на использовании алгоритмов машинного обучения «градиентный бустинг над решающими деревьями», реализованных в открытой библиотеке искусственного интеллекта CatBoost от компании Яндекс. Точность модели подтверждается составлением и проверкой прогноза раскрываемости в январе-июне 2021 года 16408 преступлений, совершенных на территории Приморского края.
1. Форма федерального статистического наблюдения № 4-ЕГС «О состоянии преступности и результатах расследования преступлений» . Доступно по: http://crimestat.ru/analytics (дата доступа 20.05.2021).
2. Низамов В.Ю. К вопросу о понятии «раскрытие преступления» в криминалистике и уголовном процессе. Ленинградский юридический журнал. 2016;1(43):170-179.
3. Приказ Генеральной прокуратуры Российской Федерации, МВД России, МЧС России, Минюста России, ФСБ России, Минэкономразвития России, ФСКН России от 29.12.2005 № 39/1070/1021/253/780/353/399 «О едином учете преступлений». Доступно по: https://rg.ru/2006/01/25/uchet-prestupleniy-dok.html (дата обращения: 20.05.2021).
4. Овчинский В.С., Ларина Е.С. Искусственный интеллект: Большие данные. Преступность. – Москва: Книжный мир, 2018:1-416.
5. Ясницкий Л.Н., Ваулева С.В., Сафонова Д.Н., Черепанов Ф.М. Использование методов искусственного интеллекта в изучении личности серийных убийц. Криминологический журнал Байкальского государственного университета экономики и права. 2015;9(3):423-430.
6. Пьянков Д.Д., Малюгин М.И., Ясницкий Л.Н. Применение нейросетевых технологий в изучении факторов, влияющих на преступность в городах России. Искусственный интеллект в решении актуальных социальных и экономических проблем XXI века, 21–23 мая 2019 года. Пермь: Пермский государственный национальный исследовательский университет, 2019:126-132.
7. Попонина А.О. Прогнозирование уровня преступности в регионах России. Искусственный интеллект в решении актуальных социальных и экономических проблем XXI века, 21–23 мая 2019 года. Пермь: Пермский государственный национальный исследовательский университет, 2019:119-125.
8. Булгаков Д.Ю. Современные подходы к тестированию систем биометрической идентификации по изображению лица. Искусственный интеллект (большие данные) на службе полиции. Сборник статей международной научно-практической конференции. Москва: Академия управления МВД России, 2020:45-51.
9. Гордеев А.Ю. Перспективы развития и использования искусственного интеллекта и нейросетей для противодействия преступности в России (на основе зарубежного опыта). Научный портал МВД России. 2021;1(53):123-135.
10. Prokhorenkova L., Gusev G., Vorobev A., Dorogush A. V., Gulin A. Catboost unbiased boosting with categorical features. 2017. arXiv: 1706.09516.
11. Melnikov A.V., Narushev I.R., Kubasov I.A. Method for Evaluating Inhomogeneous Alternatives with the Hierarchical Structure of Unrelated Criteria Based on Medium-Consistent Matrix of Pair Comparisons. Journal of Computational and Engineering Mathematics. 2019;6(2):32-41. DOI: 10.14529/jcem190203.
12. Салахутдинова К.И., Лебедев И.С., Кривцова И.Е. Алгоритм градиентного бустинга деревьев решений в задаче идентификации программного обеспечения. Научно-технический вестник информационных технологий, механики и оптики. 2018:1016-1022. DOI: 10.17586/2226-1494-2018-18-6-1016-1022.
13. Соколов Е. Семинары по выбору моделей . 2015:1-9. Доступно по: http://www.machinelearning.ru/wiki/images/1/1c/Sem06_metrics.pdf (дата обращения: 20.05.2021).
Ключевые слова: цифровой двойник, прогностическая модель, преступность, статистические карточки, машинное обучение, искусственный интеллект, catBoost, градиентный бустинг, решающие деревья, значимость признаков
Для цитирования: Булгаков Д.Ю. Использование методов машинного обучения для прогнозирования раскрываемости преступлений на основе документов первичного учета. Моделирование, оптимизация и информационные технологии. 2021;9(2). URL: https://moitvivt.ru/ru/journal/pdf?id=1010 DOI: 10.26102/2310-6018/2021.33.2.030
Принята к публикации 11.08.2021
Опубликована 30.06.2021