Зроблено спробу визначити вид функціональної залежності між числом злочинів на території Росії і фактором часу. В процесі регресійного аналізу використані найбільш відомі функції, що застосовуються в економіці та біології. В результаті виконаного дослідження найбільш точний опис фактичного кількості злочинів в Російської Федерації отримано в сплайновой моделі з точками ДеМарко.

Анотація наукової статті з математики, автор наукової роботи - Кайбічев І.А., Кайбічева Е.И.


MATHEMATICAL MODELING OF TIME SERIES OF CRIMES IN RUSSIA

An attempt is made to find a type of functional relationship between the number of crimes in Russia and the time factor. The regression analysis uses the most well-known functions used in economics and biology. As a result of the study the most accurate description of the actual number of crimes in the Russian Federation is obtained in the spline model with DeMarco points.


Область наук:
  • Математика
  • Рік видавництва: 2019
    Журнал: Вісник Уральського інституту економіки, управління і права
    Наукова стаття на тему 'МАТЕМАТИЧНЕ МОДЕЛЮВАННЯ ТИМЧАСОВОГО РЯДУ КІЛЬКОСТІ ЗЛОЧИНІВ У РОСІЇ'

    Текст наукової роботи на тему «МАТЕМАТИЧНЕ МОДЕЛЮВАННЯ ТИМЧАСОВОГО РЯДУ КІЛЬКОСТІ ЗЛОЧИНІВ У РОСІЇ»

    ?УДК 343.9

    Кайбічев І.А., Кайбічева Е.И.

    МАТЕМАТИЧНЕ МОДЕЛЮВАННЯ ТИМЧАСОВОГО РЯДУ КІЛЬКОСТІ ЗЛОЧИНІВ У РОСІЇ

    Зроблено спробу визначити вид функціональної залежності між числом злочинів на території Росії і фактором часу. В процесі регресійного аналізу використані найбільш відомі функції, що застосовуються в економіці та біології. В результаті виконаного дослідження найбільш точний опис фактичної кількості злочинів в Російській Федерації отримано в сплайновой моделі з точками ДеМарко.

    Ключові слова: математична модель, кількість злочинів, часовий ряд, Російська Федерація.

    * * *

    Kabichev I.A., Kaibicheva E.I.

    MATHEMATICAL MODELING OF TIME SERIES OF CRIMES

    IN RUSSIA

    An attempt is made to find a type of functional relationship between the number of crimes in Russia and the time factor. The regression analysis uses the most well-known functions used in economics and biology. As a result of the study the most accurate description of the actual number of crimes in the Russian Federation is obtained in the spline model with DeMarco points. Keywords: mathematical model, number of crimes, time series, Russian Federation.

    • k k k

    Можливість кримінологічного моделювання піднята в роботі Т.В. Пилюгіна, Д.А. Натура "Використання математичного моделювання при прогнозуванні регіональної злочинності в питаннях її попередження" [Див .: 1]. При цьому розглянута регіональна злочинність на прикладі Краснодарського краю, зокрема дані з березня 2011 по лютий 2013 роки для апроксимації яких була використана лінійна модель [2]. Аналіз злочинів в Чикаго в період з 2001 по 2015 роки виконано Вахрушеве [3]. При цьому найкращі результати дала регресія на основі випадкових лісів.

    Розроблена в дослідженні [4] математична модель дозволяє прогнозувати кількість злочинів на заданому періоді часу на основі рекурентної

    формули, яка дозволяє розрахувати прогнозне значення на підставі даних цього місяця за минулий рік і трьох попередніх місяців розглянутого періоду.

    Така модель заснована на припущенні, що число злочинів залежить від часу. Ця гіпотеза потребує перевірки. Для цього виконаємо кореляційний аналіз даних по числу злочинів в Російській Федерації за період 2001-2017 років [5-21]. Розрахунок коефіцієнта лінійної кореляції Пірсона привів до значення 0,68. У нас всього 17 значень даних (п = 17). При малому обсязі вибірки виконують перерахунок коефіцієнта лінійної кореляції Пірсона [22]:

    Це дає результат Я. = -0,70. Маємо ситуацію середньої зв'язку.

    Виконаємо перевірку рівня значущості розрахованого коефіцієнта кореляції. Висуваємо дві гіпотези: АЛЕ - часової залежності числа злочинів немає (І. = 0), Н1 - такий зв'язок є (Я. Ф 0).

    Перевірку нульової гіпотези проводять за допомогою перетворення Фішера [22]:

    Таблиця 1

    лінійна модель

    u = -ln-- = - 0,86

    2 1-R '

    (2)

    Отримане значення порівнювали з критичним

    і «(п) = (3)

    де - квантилі нормованого розподілу, = 1,96 при рівні значимості а = 0,05 і = 2,576 для а = 0,01. Для нашого випадку маємо і0 01 (18) = 0,67,

    ;;:. 1 (3) = 0,51. Виконується нерівність ;; тому приймаємо гипот-

    зу Н1. Отже, ми встановили наявність тимчасової залежності числа злочинів з ймовірністю 0,99.

    Наявний статистичний матеріал не дає можливість перевірити результати роботи [4]. Однак наявні дані можна інтерпретувати за допомогою регресійного аналізу. Для цього розглянемо можливі класи функцій.

    лінійна модель

    Зв'язок між числом злочинів і фактором часу (задається номером року) аппроксимируем прямою лінією, коефіцієнти якої розрахуємо за допомогою регресійного аналізу [22]:

    Yм = --72,1743 * Х + 14738,3 (4)

    де Розум - модельне кількість злочинів (тис. од.), Х - номер року.

    Реальні значення змінної У, як правило, відрізняються від модельних величин Розум, розрахованих по функції регресії (таб. 1).

    Рік Y (тис.) Ym (тис.) E e2

    2001 2968,3 3317,5 -349,2 121958,6

    2002 2526,3 3245,4 -719,1 517034,9

    2003 2756,4 3173,2 -416,8 173703,2

    2004 2893,8 3101,0 -207,2 42933,0

    2005 3554,7 3028,8 525,9 276540,8

    2006 3855,4 2956,7 898,7 807744,0

    2007 3582,5 2884,5 698,0 487232,1

    2008 3209,9 2812,3 397,6 158081,3

    2009 2994,8 2740,1 254,7 64856,1

    2010 2628,8 2668,0 -39,2 1533,3

    2011 2404,8 2595,8 -191,0 36474,4

    2012 2302,2 2523,6 -221,4 49021,7

    2013 2206,2 2451,4 -245,2 60139,8

    2014 2190,6 2379,3 -188,7 35592,5

    2015 2388,5 2307,1 81,4 6628,3

    2016 2160,1 2234,9 -74,8 5596,7

    2017 2058,5 2162,7 -104,2 10865,3

    2018 1991,5 2090,6 -99,1 9813,4

    середнє 2704,1 2704,0 0,0 159208,3

    Як показник якості регресійній моделі часто використовують середнє значення квадрата помилки

    e2 = it e? nL-k

    i = 1

    (5)

    У нашому випадку середнє значення квадрата помилки для лінійної моделі склало 159208,3 (Табл. 1).

    Середнє значення помилки дорівнює 0. Коефіцієнт лінійної кореляції Пірсона між помилкою і номером року також дорівнює 0. Це дозволяє вважати помилку випадковою величиною.

    Мал. 1. Порівняння фактичних значень з лінійної моделлю

    Відзначимо, що лінійна модель не може пояснити наявний максимум, що припадає на 2006 рік (Рис. 1).

    сплайнова модель

    Використовуємо апроксимацію кусково-лінійною функцією, званої в математиці сплайном

    Y _ Г 277,6873 * X - +553185,2001 < X < 2006 ,,? М _ (-188,884 * X + 382757,7 2006 < X < 2018. (6)

    Сплайнова модель (Табл. 2) дає меншу середнє значення квадрата помилки (95696,9) в порівнянні з лінійною моделлю (4).

    Таблиця 2 сплайна модель

    Рік Y (тис.) Yм (тис.) І е2

    2001 2968,3 2467,0 501,3 251338,2

    2002 2526,3 2744,7 -218,4 47677,1

    2003 2756,4 3022,3 -265,9 70723,1

    2004 2893,8 3300,0 -406,2 165019,1

    2005 3554,7 3577,7 -23,0 529,6

    2006 3855,4 3855,4 0,0 0,0

    2007 3582,5 3666,5 -84,0 7058,6

    2008 3209,9 3477,6 -267,7 71679,9

    2009 2994,8 3288,7 -293,9 86404,6

    2010 2628,8 3099,9 -471,1 221899,5

    2011 2404,8 2911,0 -506,2 256215,8

    2012 2302,2 2722,1 -419,9 176310,3

    2013 2206,2 2533,2 -327,0 106934,7

    2014 2190,6 2344,3 -153,7 23631,1

    2015 2388,5 2155,4 233,1 54317,1

    2016 2160,1 1966,6 193,5 37459,6

    2017 2058,5 1777,7 280,8 78865,1

    2018 1991,5 1588,8 402,7 162178,3

    середнє 2704,1 2805,5 -96,1 95696,9

    Відзначимо, що середнє значення помилки одно -96,1. Коефіцієнт лінійної кореляції Пірсона між помилкою і номером року також дорівнює 0,227. Це не дозволяє вважати помилку випадковою величиною.

    Сплайнова модель також коректно описує максимум, що припадає на 2006 рік (Рис. 2).

    Сплайнова модель з точками Де-Марка

    У сплайновой моделі [6] був змодельований єдиний максимум, що припадає на 2006 рік. У технічному аналізі валютного і фінансового ринків часто

    Мал. 2. Порівняння фактичних значень з сплайновой моделлю

    застосовують точки Демарк [23]. У таких точках значення менше або більше двох сусідніх величин тимчасового ряду. Серед фактичних даних є дві точки мінімуму (2002 і 2014 рік) і дві точки максимуму (2006 і 2015 рік).

    Розглянемо апроксимацію сплайн-вої функцією

    Yм _

    -442 * Х + 887410,3, 332,275 * X- 662688, -208,1 * Х +421304, 197,9 * X - 396380, -129,238 * X + 262802,4,

    2001 < X < 2002,

    2002 < X < 2006, 2006 < X < 2014 року, 2014 < X < 2015,

    2015 < X <2018.

    (7)

    Використання точок ДеМарко (Таб. 3) зменшило середнє значення квадрата помилки до 37818,8.

    Відзначимо, що середнє значення помилки одно -132,2. Коефіцієнт лінійної кореляції Пірсона між помилкою і номером року також дорівнює -0,055. Це дозволяє вважати помилку випадковою величиною.

    Таблиця 3

    Сплайнова модель з точками ДеМарко

    Рік Y (тис.) Yм (тис.) І е2

    2001 2968,3 2968,3 0,0 0,0

    2002 2526,3 2526,3 0,0 0,0

    2003 2756,4 2858,6 -102,2 10439,7

    2004 2893,8 3190,8 -297,0 88238,7

    2005 3554,7 3523,1 31,6 997,0

    2006 3855,4 3855,4 0,0 0,0

    2007 3582,5 3647,3 -64,8 4199,0

    2008 3209,9 3439,2 -229,3 52578,5

    2009 2994,8 3231,1 -236,3 55837,7

    2010 2628,8 3023,0 -394,2 155393,6

    2011 2404,8 2814,9 -410,1 168182,0

    2012 2302,2 2606,8 -304,6 92781,2

    2013 2206,2 2398,7 -192,5 37056,3

    2014 2190,6 2190,6 0,0 0,0

    2015 2388,5 2388,5 0,0 0,0

    2016 2160,1 2259,3 -99,2 9833,2

    2017 2058,5 2130,0 -71,5 5115,8

    2018 1991,5 2000,8 -9,3 86,2

    середнє 2704,1 2836,3 -132,2 37818,8

    2003 2756,4 3142,5 -386,1 149101,3

    2004 2893,8 3060,6 -166,8 27806,1

    2005 3554,7 2982,8 571,9 327122,6

    2006 3855,4 2908,8 946,6 895995,2

    2007 3582,5 2838,5 744,0 553539,5

    2008 3209,9 2771,5 438,4 192193,1

    2009 2994,8 2707,6 287,2 82478,1

    2010 2628,8 2646,6 -17,8 317,3

    2011 2404,8 2588,3 -183,5 33677,7

    2012 2302,2 2532,5 -230,3 53058,2

    2013 2206,2 2479,1 -272,9 74494,8

    2014 2190,6 2427,9 -237,3 56334,5

    2015 2388,5 2378,8 9,7 93,3

    2016 2160,1 2331,7 -171,6 29444,7

    2017 2058,5 2286,4 -227,9 51933,5

    2018 1991,5 2242,8 -251,3 63162,3

    середнє 2704,1 2715,3 -10,7 178258,8

    Модель Ферхюльста дала найбільше середнє значення квадрата помилки (178258,8). При цьому модельні результати помітно відрізняються від фактичних (Рис. 4).

    Мал. 3. Порівняння фактичних значень

    зі сплайновой моделлю з точками ДеМарко

    Зауважимо, що облік точок ДеМарко дозволив більш точно змоделювати фактичні дані (Рис. 3).

    модель Ферхюльста

    Для апроксимації нашої ситуації використовуємо функцію Ферхюльста яка часто використовується в біології для опису динаміки популяції [24]:

    __93396,71_

    М _ 3417,3 - 3390,0 * ехр (-0,00235 * (X - 2000)) ()

    Відзначимо, що середнє значення помилки одно -11,3 (Таб. 4). Коефіцієнт лінійної кореляції Пірсона між помилкою і номером року також дорівнює -0,118. Це дозволяє вважати помилку випадковою величиною.

    Мал. 4. Порівняння фактичних значень з моделлю Ферхюльста

    В результаті виконаного дослідження найбільш точний опис фактичної кількості злочинів в Російській Федерації отримано в сплайновой моделі з точками ДеМарко.

    Запропонована математична модель числа злочинів в Російській Федерації може бути використана для прогнозування.

    Таблиця 4 Модель Ферхюльста

    Рік Y (тис.) Ym (тис.) E e2

    2001 2968,3 3320,5 -352,2 124041,4

    2002 2526,3 3229,1 -702,8 493865,0

    БІБЛІОГРАФІЧНИЙ СПИСОК

    1. Пилюгіна Т.В., Натура Д.А. Використання математичного моделювання при прогнозуванні регіональної злочинності в питаннях її попередження // Всеросійський кримінологічний журнал. 2017. Т. 11. № 1. C. 61-70.

    2. Пилюгіна Т.В., Пічкур Т. А., Вендіна А.А. Математичні методи прогнозування злочинності // ASPECTUS. 2015. № 1. С. 98-103.

    3. Вахрушев А.А. Прогнозування рівня злочинності на основі статистичних даних: Магістерська дисертація. СПб: Санкт-Петербурзький університет, 2016. 37 с.

    4. Айкожаев Н.М., Шестопалова О.Л. Математична модель прогнозування динаміки злочинів // Наукове товариство студентів XXI століття. Технічні науки: зб. ст. по мат. XLIV міжнар. студ. наук.-практ. конф. (Росія, Новосибірськ, 26 липня 2016 г.). 7 (43). https://sibac.info/archive/technic/7(43).pdf

    5. Російський статистичний щорічник 2003. Стат. зб. М .: Держкомстат Росії, 2003. 705 С.

    6. Російський статистичний щорічник 2004. Стат. зб. М .: Росстат, 2004. 725 с.

    7. Російський статистичний щорічник 2005. Стат. зб. М .: Росстат, 2005. 819 с.

    8. Російський статистичний щорічник 2006. Стат. зб. М .: Росстат, 2006. 806 с.

    9. Російський статистичний щорічник 2007. Стат. зб. М .: Росстат, 2007. 825 с.

    10. Російський статистичний щорічник 2008. Стат. зб. М .: Росстат, 2008. 847 с.

    11. Російський статистичний щорічник 2009. Стат. зб. М .: Росстат, 2009. 785 с.

    12. Російський статистичний щорічник 2010. Стат. зб. М .: Росстат, 2010. 813 с.

    13. Російський статистичний щорічник 2011. Стат. зб. М .: Росстат, 2011. 795 с.

    14. Російський статистичний щорічник 2012. Стат. зб. М .: Росстат, 2012. 786 с.

    15. Російський статистичний щорічник 2013. Стат. зб. М .: Росстат, 2013. 717 с.

    16. Російський статистичний щорічник 2014. Стат. зб. М .: Росстат, 2014. 693 с.

    17. Російський статистичний щорічник 2015. Стат. зб. М .: Росстат, 2015. 728 с.

    18. Російський статистичний щорічник 2016. Стат. зб. М .: Росстат, 2016. 725 с.

    19. Російський статистичний щорічник 2017. Стат. зб. М .: Росстат, 2017. 686 с.

    20. Російський статистичний щорічник 2018. Стат. зб. М .: Росстат, 2018. 694 с.

    21.Чісло зареєстрованих злочинів за видами. URL: http: // www.gks.ru/ Населення / Правопорушення / Основні показники злочинності / 10-01.doc.

    22. Харченко М.А. Кореляційний аналіз: Навчальний посібник для вузів. Воронеж: Видавничо-поліграфічний центр Воронезького державного університету, 2008. 31 с.

    23. Демарк Т.Р. Технічний аналіз нова наука. М .: Изд-во "Євро", 2012. 178 с.

    24. Соколов С.В. Моделі динаміки популяцій: Учеб. посібник. СПб .: Изд-во СПбГЕ-ТУ «ЛЕТІ», 2018. 61 с.

    REFERENCES

    1. Pilyugina T.V., Natura D.A. Ispol'zovanie matematicheskogo modelirovaniya pri prognozirovanii regional'noj prestupnosti v voprosah ee preduprezhdeniya // Vserossijskij kriminologicheskij zhurnal, 2017. T. 11. № 1. C. 61-70.

    2. Pilyugina T.V., Pichkureno T.A., Vendina A.A. Matematicheskie metody prognozirovaniya prestupnosti // ASPESTUS. 2015. № 1. S. 98-103.

    3. Vahrushev A.A. Prognozirovanie urovnya prestupnosti na osnove statisticheskih dannyh: magisterskaya dissertaciya. SPb .: Sankt-Peterburgskij universitet, 2016. 37 s.

    4. Ajkozhaev N.M., SHestopalova O.L. Matematicheskaya model 'prognozirovaniya dinamiki prestuplenij // Nauchnoe soobshchestvo studentov XXI stoletiya. Tekhnicheskie nauki: sb. st. po mat. XLIV mezhdunar. stud. nauch.-prakt. konf. (Rossiya, Novosibirsk, 26 iyulya 2016 g.). №2 7 (43). https: // sibac.info/ archive / technic / 7 (43). pdf.

    5. Rossijskij statisticheskij ezhegodnik 2003. Stat. sb. M .: Goskomstat Rossii, 2003. 705 S.

    6. Rossijskij statisticheskij ezhegodnik 2004. Stat. sb. M .: Rosstat, 2004. 725 s.

    7. Rossijskij statisticheskij ezhegodnik 2005. Stat. sb. M .: Rosstat, 2005. 819 s.

    8. Rossijskij statisticheskij ezhegodnik 2006. Stat. sb. M .: Rosstat, 2006. 806 s.

    9. Rossijskij statisticheskij ezhegodnik 2007. Stat. sb. M .: Rosstat, 2007. 825 s.

    10. Rossijskij statisticheskij ezhegodnik 2008. Stat. sb. M .: Rosstat, 2008. 847 s.

    11. Rossijskij statisticheskij ezhegodnik 2009. Stat. sb. M .: Rosstat, 2009. 785 s.

    12. Rossijskij statisticheskij ezhegodnik 2010. Stat. sb. M .: Rosstat, 2010. 813 s.

    13. Rossijskij statisticheskij ezhegodnik 2011. Stat. sb. M .: Rosstat, 2011. 795 s.

    14. Rossijskij statisticheskij ezhegodnik 2012. Stat. sb. M .: Rosstat, 2012. 786 s.

    15. Rossijskij statisticheskij ezhegodnik 2013. Stat. sb. M .: Rosstat, 2013. 717 s.

    16. Rossijskij statisticheskij ezhegodnik 2014. Stat. sb. M .: Rosstat, 2014. 693 s.

    17. Rossijskij statisticheskij ezhegodnik 2015. Stat. sb. M .: Rosstat, 2015. 728 s.

    18. Rossijskij statisticheskij ezhegodnik 2016. Stat. sb. M .: Rosstat, 2016. 725 s.

    19. Rossijskij statisticheskij ezhegodnik 2017. Stat. sb. M .: Rosstat, 2017. 686 s.

    20. Rossijskij statisticheskij ezhegodnik 2018. Stat. sb. M .: Rosstat, 2018. 694 s.

    21. Chislo zaregistrirovannyh prestuplenij po vidam. URL: http: // www.gks.ru/ Naselenie / Pravonarusheniya / Osnovnye pokazateli prestupnosti / 10-01.doc.

    22. Harchenko M.A. Korrelyacionnyj analiz: Uchebnoe posobie dlya vuzov. Voronezh: Izdatel'sko-poligraficheskij centr Voronezhskogo gosudarstvennogo universiteta, 2008. 31 s.

    23. DeMark T.R. Tekhnicheskij analiz novaya nauka. M .: Izd-vo "Evro", 2012. 178 s.

    24. Sokolov S.V. Modeli dinamiki populyacij: ucheb. posobie. SPb .: Izd-vo SPbGETU «LETI», 2018. 61 s.

    ВІДОМОСТІ ПРО АВТОРІВ

    КАЙБІЧЕВ Ігор Апполінарьевіч, доктор фізико-математичних наук, доцент, професор кафедри математики та інформатики, Уральський інститут ГПС МНС Росії, Єкатеринбург.

    E-mail: Ця електронна адреса захищена від спам-ботів. Вам потрібно увімкнути JavaScript, щоб побачити її.

    КАЙБІЧЕВА Катерина Ігорівна, кандидат економічних наук, старший викладач кафедри регіональної, муніципальної економіки і управління, Уральський державний економічний університет, м Єкатеринбург.

    Дата надходження статті: 10.12.2019


    Ключові слова: МАТЕМАТИЧНА МОДЕЛЬ / КІЛЬКІСТЬ ЗЛОЧИНІВ / ТИМЧАСОВОЇ РЯД / РОСІЙСЬКА ФЕДЕРАЦІЯ / MATHEMATICAL MODEL / NUMBER OF CRIMES / TIME SERIES / RUSSIAN FEDERATION

    Завантажити оригінал статті:

    Завантажити