УДК 343.9 Криминология. Криминалистика
В криминалистике предиктивная аналитика позволяет выявлять закономерности в серии преступлений, прогнозировать место и время следующего преступления, определять профиль преступника, оптимизировать распределение ресурсов правоохранительных органов. Установлено, что преступления сильно сконцентрированы в пространстве и группируются в различных локациях и при этом по крайней мере половина преступлений совершается всего лишь в 5% уличных сегментов города. Причем существует высокая вероятность того, что повторная виктимизация других преступлений произойдет поблизости и в коротком промежутке времени. Для длительных периодов концентрация и локализация преступлений на городском ландшафте также оказывается стабильной.
предиктивная аналитика, машинное обучение, нейронные сети, искусственный интеллект, place-based and person-based systems.
В условиях растущей криминализации общества крайне важно применение инновационных методов расследования. Предиктивная аналитика представляет собой совокупность методов и инструментов, позволяющих прогнозировать будущие события на основе анализа данных о совершенных преступлениях и построена на методах машинного обучения, которое как научная дисциплина находится на стыке математической статистики, методов оптимизации и классических математических дисциплин.
Чаще всего используют следующие типы данных: данные о совершенных преступлениях, демографические данные и данные о мобильности населения. Поэтому самая большая проблема – отсутствие достоверных доступных данных в необходимом объеме.
Концептуальные основы предиктивной аналитики базируются на следующих постулатах:
- криминальное поведение детерминировано;
- существует взаимосвязь между характеристиками преступлений;
- закономерности преступного поведения поддаются формализации;
- прогнозирование возможно на основе анализа исторических данных.
За базис в исследованиях прогнозирования преступности берется тот факт, что преступления стабильно группируются как в пространстве, так и во времени [1]. Поведение человека в социуме может носить чисто случайный характер, но чаще всего повторяемо и прогнозируемо. Повторяющиеся события могут быть превращены в алгоритм поведения конкретного человека. Поэтому наибольший интерес представляют события, влекущие за собой нарушение привычного хода вещей, и этот процесс можно анализировать. В современных системах предиктивной аналитики выделяют две основные категории:
- Place-based системы – ориентированные на пространственный анализ и прогнозирование;
- Person-based системы – фокусирующиеся на анализе персональных данных.
Модели прогнозирования преступности на основе местоположения (Place-based), построенные по технологии машинного обучения, используют пространственно-временные закономерности преступлений в ретроспективе совместно с факторами внешней среды и предназначены для прогнозирования преступных инцидентов в конкретных локациях.
Анализ мест преступления проводится через функции объектов города, например, точки общественного питания, зоны отдыха, транспортные узлы, магистрали и т. п. [2]. Данные объекты можно рассматривать как аттракторы и генераторы преступлений при построении модели для определения взаимосвязи между будущими и прошлыми преступлениями через архитектурную среду и социальное взаимодействие жителей города. Проведенные исследования показали, что преступления сконцентрированы в пространстве и группируются таким образом, что по крайней мере половина преступлений совершается всего лишь в 5 % уличных сегментов города. Причем существует высокая вероятность того, что повторная виктимизация других преступлений произойдет поблизости от этих локаций и на коротком промежутке времени [3].
Такие модели позволяют получать краткосрочное прогнозирование, сфокусированное на выявлении мест с высокой вероятностью совершения преступлений в течение следующего дня или часа, может использоваться для эффективного распределения ресурсов полиции с целью максимально быстрого реагирования на преступления.
Разработаны несколько видов моделей краткосрочного прогнозирования преступности на основе только местоположения с использованием исторических данных о преступности. Первый вид моделей основан на оценке плотности ядра и использует оценочную плотность преступлений в ретроспективе в качестве меры риска совершения преступлений в конкретных локациях [4].
В работе [5] предложена модель последовательности афтершоков эпидемического типа при анализе повторения сходных по типу преступлений на близких временных отрезках, в соответствии с которой пространственно-временные закономерности совершения преступлений в одном месте увеличивают вероятность других инцидентов в близлежащих местах в краткосрочной перспективе.
К сожалению, следует признать, что возможны серьезные погрешности результатов моделирования из-за предвзятости в отчетности, когда определенные социальные группы людей сообщают о большем количестве преступлений, чем другие, или когда полиция по-разному регистрирует однотипные виды преступлений. Оценка вероятности совершения преступлений улучшается при учете мобильности людей. Однако данные о мобильности людей, собранные с помощью сотовых телефонов, могут быть искажены из-за того, что некоторые группы населения представлены неравномерно: не у всех категорий граждан есть сотовые телефоны или используются «одноразовые» сим-карты.
С точки зрения изменения стандартного поведения людей в повседневной жизни в моделях изучается фактор влияния возможности для совершения преступлений, например, чем больше присутствие людей в данном месте, тем больше преступлений определенного типа может произойти. При этом повседневная деятельность людей исследуется в парадигме использования данных о мобильности людей, извлекаемой из записей детализации вызовов сотовых операторов, из сервисов определения местоположения, таких как Foursquare (социальная сеть с функцией геопозиционирования, предназначенная для работы как с мобильными устройствами, так и с любыми сотовыми телефонами), или из социальных сетей, таких, как Twitter [6]. На основании этой информации вычисляется количество людей, присутствующих в определенном месте, энтропия посетителей и однородность или популярность региона. Эта информация повышает точность краткосрочного прогнозирования для определенных типов преступлений по сравнению с использованием только ретроспективных данных о преступлениях, а добавление таких данных о мобильности, как входящие и исходящие потоки передвижения людей, может еще больше повысить точность прогнозирования преступлений [7].
Одной из наиболее распространенных характеристик мобильности, используемых в этих исследованиях, является посещаемость конкретных локаций в городе в данный промежуток времени, причем увеличение посещаемости в определенном районе города пропорционально увеличению уровня имущественных преступлений, совершаемых в регионе [8]. Признак посещаемость извлекается из данных о регистрации и других характеристик переписи населения, поездок на метро и такси.
Анализ потоков мобильности позволяет создавать карты с указанием локаций, на которых вычисляют прогнозные оценки риска совершения преступлений. В работе [9] для составления прогнозов использован метод оценки плотности ядра на основе ретроспективы преступлений. Модель последовательности афтершоков эпидемического типа, предсказывающая повторную виктимизацию, проверена полицейским департаментом Лос-Анджелеса [10]. Модель перестановки пространства и времени для выявления статистически значимых кластеров преступности в Пуне (Индия) описана в работе [11]. В работе [12] показано применение иерархических рекуррентных нейронных сетей для моделирования сложной нелинейной пространственно-временной корреляции преступлений в связанных источниках данных, например, таких, как запросы на городские услуги.
Однако есть важные ограничения. Во-первых, потоки мобильности по данным соцсетей неполны, поскольку люди могут не отмечаться на Foursquare во всех посещенных местах. Во-вторых, для определения мест, посещаемых за поездку (сквозные потоки), моделируются траектории перемещения по городу с учетом кратчайших путей, что далеко не факт [13].
Рассмотрим наиболее популярные Place-based системы.
Программа PredPol [14] для прогнозирования преступлений разработана в институте чистой и прикладной математики (IPAM) Калифорнийского университета и реализована на основе искусственного интеллекта. Систему обучают на статистических данных о преступлениях, совершенных в населенном пункте за последние 3-5 лет. Алгоритму требуются только три параметра каждого правонарушения: тип, место и дата/время его совершения.
При обучении территория города делится на локации со сторонами по 152 метра и для каждой из них определяет вероятность совершения преступлений.
На основании вычисленных данных делается прогноз криминальной активности в выделенных локациях города, и на основании предсказаний в полиции составляют оптимальные маршруты патрулирования.
Первые версии PredPol были внедрены в 2011 году полицейским управлением города Санта-Крус в Калифорнии. Результат: в первый год число ограблений сократилось на 44%, а количество нападений с оружием уменьшилось на 25%. В дальнейшем эффективность применения системы снизилась, а в апреле 2020 года департамент полиции Лос-Анджелеса прекратил эксплуатацию программы.
HunchLab – продукт филадельфийского стартапа Azavea [15]. Цель – прогнозирование вероятности совершения определенного типа преступления в различных местах на определенный период времени. HunchLab, кроме данных о произошедших событиях (преступления, вызовы на помощь), использует при обучении местоположение баров, ресторанов, больниц, автобусных остановок, станций метро и т. д. Данные о вакансиях в барах и ресторанах позволяют делать выводы о том, что окружающая территория может быть неблагополучной. Географические особенности местности (высота над уровнем моря вблизи водоема) может указывать на богатые или бедные районы.
В качестве модели HunchLab использует стохастический градиентный бустинг (GBM) для деревьев решений, причем учитываются такие переменные, как дни недели, время суток, количество инцидентов в конкретном месте в прошлом, количество дней между событиями и т. д.
Несмотря на то, что нет данных о том, что с момента внедрения HunchLab уровень преступности снизился, этой программой пользуется полиция округа Сент-Луис, Пеории (Аризона), Филадельфии, Линкольна (Небраска), полиция округа Нью-Касл, штат Делавэр и полиция Нью-Йорка.
TrapWire [16] – глобальная система слежения с функцией распознавания лиц – создана для обнаружения потенциальных террористов, фотографирующих «важные объекты» (HVT), такие, как станции метро, городские площади и т. д. Для этого на всех HVT в США установлены камеры наружного наблюдения. Как только кто-то делает фотографию важного объекта, система составляет отчет о подозрительной активности, который регистрируется в общей базе данных. При этом идет поиск совпадения с лицами преступников, номерами угнанных машин и другими похожими инцидентами. Существуют сведения, что система способна выявлять модели поведения, потенциально ведущие к совершению преступлений.
ATACRAIDS – продукт компании Bair Analytics [17]. Основным источником являются исторические данные о преступлениях в определенном районе. Пользователи видят прогноз в виде температурной карты, где цветом выделены прогнозируемые локации. Какая-либо информация об анализе эффективности ATACRAIDS недоступна.
Программное обеспечение IBM Crime Insight and Prevention [18] использует некоторые конкретные типы входных данных:
- История преступлений: место, тип преступления, тяжесть, жертвы, подозреваемые, обвинительные приговоры, преступное поведение и характеристики, погода, температура, время года, месяц или неделя;
- Триггерные события: праздники, фестивали или дни выплаты зарплаты;
- Неструктурированные данные: изображения, аудио-, видеоматериалы и текст, содержащиеся в отчетах о происшествиях, показаниях свидетелей, допросы подозреваемых, информация о наводках, вызовах в службу поддержки, электронной почте, блогах и сообщениях в чатах.
Несмотря на то, что IBM неоднократно заявляла о снижении уровня преступности после внедрения своих систем – например, о снижении общего числа тяжких преступлений на 27% в Мемфисе и о снижении числа ограблений на 28% за год в Манчестере, штат Нью-Гэмпшир, неизвестно о каком-либо независимом анализе эффективности этой системы, и IBM не раскрывает, как определяется точность прогнозов для системы. Так что скорее всего это просто самореклама.
Программа Hitachi Visualization Predictive Crime Analytics [19] обрабатывает наборы данных, потенциально связанных с преступлениями, например, местоположение полицейских участков, дороги, расположение уличных фонарей, данные об условно-досрочном освобождении, данные о номерных знаках автомобилей и мотоциклов, сведения о стрельбе и т. д. Отличительная особенность этого инструмента заключается в использовании механизма обработки естественного языка при анализе социальных сетей и других общедоступных источников данных в режиме реального времени для выявления высокой концентрации тем и ключевых слов, которые могут привести к росту преступности. Информация о прогнозе преступлений визуализируется в виде «тепловых» карт местности.
Какие-либо независимые исследования эффективности Hitachi Visualization Predictive Crime Analytics неизвестны.
Person-based системы определяют, кто и с какой вероятностью станет жертвой или совершит преступление. Такие системы оценивают возраст, криминальную историю, данные о трудоустройстве и делают свой прогноз. Это может быть и предсказание рецидивов, и выявление связей в криминальном мире, и даже определение размера наказания для осужденных. При этом разработчики часто скрывают набор показателей и метод работы алгоритмов.
Palantir – комплексная аналитическая платформа, предназначенная для быстрого принятия решений в условиях постоянно растущего потока данных – изначально разрабатывалась как инструмент для спецслужб [20]. Palantir комбинирует информацию из множества разнородных источников данных и преобразуют ее в сложную структуру, которая отражает скрытые и явные связи между объектами. Поиск возможен по времени и месту, по названиям, по людям или событиям. Запрос может выглядеть так: «Покажи мне карту с метками всех преступлений, которые произошли в районе за последние полгода, и в чем разница с предыдущим полугодием». Анализ социальных связей идет от конкретных людей и позволяет выявлять скрытые паттерны взаимодействия в организованных группах преступников.
Palantir был внедрен в полиции Нового Орлеана. Местным аналитикам был предоставлен доступ к судебным выпискам, адресам телефонов и сведениям из социальных сетей жителей города. В первые два года число преступлений в Новом Орлеане действительно снизилось, и почти на треть. Однако потом результат программы перестал быть статистически значимым.
COMPAS [21] — программное обеспечение для оценки вероятности рецидива преступлений заключенных в течение двух лет после освобождения. Алгоритм COMPAS анализирует 137 параметров биографии осужденного, включая тяжесть предыдущих преступлений, уровень образования и доходов, его семейный статус и наличие зависимостей. Также программа учитывает результаты психологических тестов преступника, в том числе темперамент, готовность к риску, степень нарциссизма и склонности к чувству вины. Точность прогнозов COMPAS невелика и по некоторым оценкам составляет около 65%.
400 участников онлайн-опроса, которые не имели никакого отношения к уголовному правосудию, попросили угадать, совершил ли преступник в течение двух лет после освобождения повторное правонарушение. Им предоставляли информацию о заключенных, случайно выбранных из базы данных, но всего лишь семь позиций из 137 параметров, по которым проводит расчеты COMPAS. Средняя точность прогнозов людей составила 62,1%, что сравнимо с точностью предсказаний COMPAS.
Dragonfly Eye System [22] предназначена для оценки риска совершения преступления и использует технологию распознавания лиц по набору ключевых зон и параметров, например, по форме овала лица, высоте лба и структуре носогубных складок. При обучении системы использована огромная биометрическая база жителей Китая, состоящая из 1,7 миллиардов портретов – паспорт и водительские права нельзя получить без передачи биометрии. Система отслеживает действия человека и присваивает ему определенный рейтинг «подозрительности»: если кто-то купит кухонный нож, система не увидит в этом злого умысла. Однако если этот же человек следом приобретет молоток и мешок, алгоритм внесет его в список подозрительных лиц. Программа используется более чем в 30 городах Китая, однако про ее эффективность на данный момент ничего не известно.
В Великобритании разработана программа Most Serious Violence (MSV). Предполагалось, что алгоритм позволит вычислять вероятных преступников по 20 ключевым критериям. Во время экспериментального запуска показал точность до 75%, что на практике не позволяет установить момент, когда полицейские должны вмешаться для предупреждения преступления. Разработчики попытались ее исправить, но после корректировки ее точность упала до 9-19%.
Этичность использования person-based инструментов в целом вызывает много вопросов. В частности, Европарламент считает внесение человека в список подозрительных лиц дискриминацией на пустом месте и выступает за запрет предиктивной полиции на основе ИИ по отношению к личности. Однако, в документе нет запрета на предсказания преступлений с помощью place-based алгоритмов.
Заключение
Предиктивная аналитика представляет собой перспективное направление развития криминалистической науки. Ее внедрение требует комплексного подхода, включающего методологическое, технологическое и организационное обеспечение. Дальнейшее развитие технологий и методов анализа открывает новые возможности для предотвращения преступлений и обеспечения безопасности общества. Успешная реализация потенциала предиктивной аналитики зависит от качества данных, квалификации специалистов и эффективности взаимодействия всех участников процесса расследования. Дальнейшее развитие предиктивной аналитики позволит существенно повысить эффективность расследования серийных преступлений и обеспечить профилактику криминальных деяний.
Технические требования к системам предиктивной аналитики включают в себя высокую производительность, масштабируемость, надежность хранения данных. Учитывая работу таких систем с персональными данными граждан, особое внимание необходимо уделять вопросам безопасности. Кроме того, пользовательский интерфейс систем предиктивной аналитики должен разрабатываться с учетом использования в полицейских участках и ориентироваться на невысокий уровень компьютерной грамотности рядовых пользователей. Практическое применение систем предиктивной аналитики в криминалистике связано с рядом проблем и ограничений из-за следующих факторов риска: качество исходных данных невелико из-за неполноты получаемой информации, так как многие преступления не фиксируются или информация о них приходит с искажениями. Кроме очевидных направлений, таких, как развитие алгоритмов машинного обучения и автоматизации процессов анализа, дальнейшее совершенствование интеллектуальных систем поддержки принятия решений видится в интеграции разнородных источников информации, стандартизации данных, необходимости обучения специалистов, обладающих знаниями в смежных науках – криминалистике и машинном обучении.
1. Prathap BR (2022) Geospatial crime analysis and forecasting with machine learning techniques. In: Artificial intelligence and machine learning for EDGE computing. Elsevier, Amsterdam, pp. 87-102.
2. Weisburd D, Groff ER, Yang S-M. The criminology of place: street segments and our understanding of the crime problem. Oxford University Press, London. 2012. ISBN 9780199709106.
3. Brantingham P, Brantingham P. Criminality of place: crime generators and crime attractors. Eur J Crim Policy Res 3(3): 5-26. URL: https://link.springer.com/article/10.1007/BF02242925 (дата обращения: 20.11.2025).
4. Chainey S, Tompson L, Uhlig S (2008) The utility of hotspot mapping for predicting spatial patterns of crime. Security Journal; 21 (1) :4–28. URL: (https://discovery.ucl.ac.uk/id/eprint/112873/1/PREPRINT_-_Chainey,_Tompson_&_Uhlig_2008.pdf (дата обращения: 20.11.2025).
5. Mohler GO, Short MB, Malinowski S, Johnson M, Tita GE, Bertozzi AL, Brantingham PJ (2015) Randomized controlled field trials of predictive policing. Journal of the American Statistical Association; 110 (512): 1399-1411. URL: https://www.tandfonline.com/doi/full/10.1080/01621459.2015.1077710 (дата обращения: 20.11.2025).
6. Bogomolov A, Lepri B, Staiano J, Letouzé E, Oliver N, Pianesi F, Pentland A (2015) Moves on the street: classifying crime hotspots using aggregated anonymized data on people dynamics. Big Data, Volume 3, Number 3, 2015:148-158.
7. Kadar C, Feuerriegel S, Noulas A, Mascolo C (2020) Leveraging mobility flows from location technology platforms to test crime pattern theory in large cities. In: Proceedings of the international AAAI conference on web and social media, vol 14. aaai.org, pp. 339-350.
8. Caminha C, Furtado V, Pequeno THC, Ponte C, Melo HPM, Oliveira EQ, Andrade JSJr (2017) Human mobility in large cities as a proxy for crime. PLoS ONE 12(2):e0171609. URL: https://doi.org/10.1371/journal.pone.0171609 (дата обращения: 20.11.2025).
9. Chainey S, Tompson L, Uhlig S (2008) The utility of hotspot mapping for predicting spatial patterns of crime. Security Journal; 21 (1): 4-28.
10. Mohler GO, Short MB, Malinowski S, Johnson M, Tita GE, Bertozzi AL, Brantingham PJ (2015) Randomized controlled field trials of predictive policing. Journal of the American Statistical Association; 110 (512): 1399-1411.
11. Mondal S, Singh D, Kumar R (2022) Crime hotspot detection using statistical and geospatial methods: a case study of Pune City Maharashtra, India. GeoJournal:1-17.
12. Huang C, Zhang J, Zheng Y, Chawla NV (2018) DeepCrime: attentive hierarchical recurrent networks for crime prediction. In: Proceedings of the 27th ACM international conference on information and knowledge management. CIKM ’18. Association for Computing Machinery, New York, pp. 1423-1432. ISBN 9781450360142.
13. Huang C, Zhang C, Zhao J, Wu X, Yin D, Chawla N (2019) MiST: a multiview and multimodal spatial-temporal learning framework for citywide abnormal event forecasting. In: The world wide web conference. WWW ’19. Association for Computing Machinery, New York, pp. 717-728. ISBN 9781450366748.
14. Mati G. PredPol: Predictive analytics to place police officers at the right time and place to increase chances of preventing crime. URL: https://d3.harvard.edu/platform-digit/submission/predpol-predictive-analytics-to-place-police-officers-at-the-right-time-and-place-to-increase-chances-of-preventing-crime/ (дата обращения: 20.11.2025)
15. URL: http://www.hunchlab.com (дата обращения: 20.11.2025)
16. TRAPWIRE: Structured by the Experience. URL: https://ciobulletin.com/magazine/profile/trapwire-structured-by-the-experience (дата обращения: 20.11.2025).
17. Greg Hardesty. If you want to know all about crime in Fullerton, then check out this free website. URL: https://behindthebadge.com/want-know-crime-fullerton-check-website/ (дата обращения: 20.11.2025)
18. Brandon C. Welsh, Gregory M. Zimmerman & Steven N. Zane (2018) The Centrality of Theory in Modern Day Crime Prevention: Developments, Challenges, and Opportunities, Justice Quarterly, 35:1, 139-161, DOI:https://doi.org/10.1080/07418825.2017.1300312.
19. Bill Boyle. Hitachi Data Systems upgrades crime prediction system. URL: https://www.datacenterdynamics.com/en/news/hitachi-data-systems-upgrades-crime-prediction-system/ (дата обращения: 20.11.2025).
20. Palantir 101. Что позволено знать простым смертным о второй по крутоcти частной компании в Кремниевой Долине. URL: https://habr.com/ru/articles/271883/ (дата обращения: 20.11.2025).
21. Компьютер не смог эффективно выявить преступников-рецидивистов. URL: https://naked-science.ru/article/sci/kompyuter-ne-smog-effekti (дата обращения: 20.11.2025).
22. Вердикт алгоритмов: как технологии предсказывают преступления. URL: https://www.computerra.ru/280646/verdikt-algoritmov-kak-tehnologii-predskazyvayut-prestupleniya/ (дата обращения: 20.11.2025).
23. China's Minority Report-style security system uses AI to identify criminals on CCTV by comparing their faces to a database of 2 BILLION people within seconds. URL: https://www.dailymail.co.uk/sciencetech/article-5170167/China-unveils-Minority-Report-style-AI-security-system.html (дата обращения: 20.11.2025).
24. Полиция Великобритании два года разрабатывала ИИ-систему прогнозирования преступлений. Но применить её так и не смогли. URL: https://baza.io/posts/15fb90e7-e1aa-4a2b-b13a-703bff6e116 (дата обращения: 20.11.2025).



