این مقاله به مشکل پیش بینی جرم در زندگی واقعی می پردازد. با این حال ، داده های یادآوری شده فقط سی و پنج سری زمانی جرم کوتاه برای سه منطقه شهری تولید می کنند. ما یک تجزیه و تحلیل مقایسه ای از چهار روش پیش بینی گروه مبتنی بر یادگیری ماشین ساده و چهار ارائه می دهیم. علاوه بر این ، ما پنج روش پیش بینی را پیشنهاد می کنیم که مؤلفه فصلی سری زمانی را مدیریت می کنند. علاوه بر این ، ما برای مقایسه عملکرد روشهای پیش بینی و تکنیک های پیشنهادی از میانگین میانگین درصد خطای درصد و یک آزمایش فریدمن استفاده کردیم. نتایج نشان داد که میانگین حرکت ساده با تکنیک های حذف فصلی بهترین عملکرد را برای این سری ها ایجاد می کند. این نکته حائز اهمیت است که درصد بالایی از سری زمانی هیچ همبستگی خودکار و سطح بالایی از تقارن ندارد ، که به عنوان سر و صدای سفید تلقی می شود و بنابراین پیش بینی آن دشوار است.
1. مقدمه
ایمن نگه داشتن شهرها برای پلیس یک چالش است ، به ویژه هنگامی که جرم در همه اشکال آن افزایش می یابد. مردم از ترس زندگی می کنند و احساس ناامنی می کنند. عواملی مانند محیط زیست ، شایعات شبکه های اجتماعی ، ارتباطات بین فردی با همسایگان ، اقوام و عدم سیاست در یک منطقه می تواند درک ناامنی را تغییر دهد [1].
افرادی که قربانی جرم نشده اند ، می توانند از جرم و جنایت به همان اندازه افرادی که آن را متحمل شده اند ، بترسند ، افراد دوم با درک ناامنی از نظر روانشناختی تحت تأثیر قرار می گیرند [2]. طبق آمار مؤسسه ملی آمار و جغرافیا (INEGI) [3] در سال 2020 ، زنان با 72. 7 ٪ درک بالاتری از ناامنی داشتند ، در حالی که مردان 62 ٪ در درک ناامنی کسب کرده بودند. علاوه بر این ، از Inegi 2016 ، شایع ترین جنایات در مکزیکو ، اخاذی ، سرقت وسایل نقلیه ، حمله ، سرقت و سرقت در جاده های عمومی و حمل و نقل است. فرکانس های این جنایات در مقایسه با سال 2020 ، ناشی از بیماری همه گیر SARS-COV-2 (COVID-19) کاهش یافته است ، زیرا مردم در خانه های خود می ماندند و همین امر باعث افزایش اخاذی و خشونت خانگی می شود.
بزهکاری به دلیل سطح بالای خشونت در کشورهایی در آمریکای لاتین مشکلی است. برای اندازه گیری سطح بزهکاری ، برخی از کشورها اطلاعاتی را از پایگاه داده های پلیس جمع می کنند ، و برخی دیگر مانند نروژ ، دانمارک ، سوئد و فنلاند نظرسنجی ها را برای دانستن درک ایمنی از مردم خود هنگام بیرون رفتن در خیابان انجام می دهند تا استراتژی ها را اجرا کنند [4]واد
به دلیل بزهکاری ، دولت ها اعتبار خود را از دست می دهند و جوامعی که از این مشکل رنج می برند ، از رای گیری خودداری می کنند ، زیرا آنها مداخله دولت را برای جلوگیری از افزایش جرم نمی بینند [5].
آموزش و فقر برخی از عواملی است که بر بزهکاری تأثیر می گذارد ، از مطالعه ای که توسط Millán-Valenzuela و همکاران انجام شده است.[6] در ایتالیا و مکزیکو. این مطالعه نشان داد که مناطقی که رونق اقتصادی بیشتری دارند ، در مقایسه با برخی کشورهایی که فقر شدید است ، بالاترین میزان جرم را دارند. از طرف دیگر ، می توان فرض کرد که بزهکاری و آموزش از نزدیک مرتبط هستند. معمولاً ، جوانانی که تحصیلات خود را ترک می کنند یا با سطح پایین آموزش و پرورش درگیر جرم می شوند. از این رو ، کشوری با جامعه تحصیل کرده تر مستعد ابتلا به مشکلاتی مانند فقر و بزهکاری است. بنابراین ، آموزش می تواند یک اقدام خوب پیشگیری از جرم باشد.
به گفته داز و همکاران ، آمریکای لاتین بالاترین میزان جرم و جنایت جهان را دارد.[7]برخی از استراتژی های مفید پیشگیری عبارتند از: نظارت بر جرم ، بیماری ها و سازمان های جنایی جدید. به روزرسانی تحریم های جنایی ؛گسترش زندان ؛و جلسات محله ای به گونه ای که همسایگان با یکدیگر آشنا شوند و متحد تر باشند.
برای جمع آوری اطلاعات جنایی که در پایگاه داده های پلیس نگهداری نمی شوند ، کشورهایی از اروپای مرکزی و شرقی ، آفریقا ، آمریکای لاتین و آسیا مجموعه ای از نظرسنجی ها را انجام دادند و از مردم در مورد تجربیات خود با جرم سؤال کردند. این نظرسنجی ها در سال 2000 توسط مطالعه بین المللی قربانیان جنایی ، با حمایت موسسه بین منطقه ای سازمان ملل انجام شد.
در نتیجه ، اطلاعات بیشتری از آنچه در پایگاه داده های پلیس در دسترس است به دست آمد. این امر به این دلیل است که بعضی اوقات جنایات گزارش نشده است ، از ترس ، شرم ، یا به این دلیل که مردم می دانند سوء مدیریت پلیس یا فساد وجود دارد ، که باعث جرم بیشتر می شود. علاوه بر این ، آنها دریافتند که فعالیت جنایی در شهرهای پرجمعیت غالب است ، به عنوان مثال ، زیرا خدمات این شهر برای تعداد ساکنان آنها کافی نیست. علاوه بر این ، عدم کار ، آموزش و مسکن ، از جمله عوامل دیگر ، منجر به جرایم می شود [8].
پیشگیری از فعالیت های جنایی از طریق پیش بینی های مختلف و روش های پیش بینی ، از جمله مدل های رگرسیون و یادگیری ماشین مقابله شده است.
در این مقاله یک مطالعه پیش بینی شده با یک سری کوتاه از چهار جنایت با هشت روش پیش بینی اعمال شده برای سی و پنج سری زمان واقعی جرم و جنایت کوچک ارائه شده است. علاوه بر این ، ما پنج روش پیش بینی را پیشنهاد می کنیم که از مؤلفه فصلی سری زمانی استفاده می کنند. علاوه بر این ، ما عملکرد روشهای گروهی مبتنی بر یادگیری کلاسیک و ماشین را مقایسه می کنیم و تأثیر مؤلفه فصلی سری زمانی را در تکنیک های پیش بینی تجزیه و تحلیل می کنیم. سرانجام ، ما رتبه بندی میانگین SMAPE و میانگین رتبه آزمون فریدمن را مقایسه کردیم و تغییرات جزئی در رتبه بندی روش ها و تکنیک های پیش بینی پیدا کردیم. با این حال ، هر دو رفتار یکسان را حفظ می کنند.
باقیمانده این مقاله به شرح زیر است: بخش 2 وضعیت هنر را در مورد پیش بینی و پیش بینی جرم نشان می دهد. در بخش 3 ، ما مدل ها و روش های مورد استفاده برای تولید و پردازش سری های زمانی کوتاه را توصیف می کنیم ، که شامل استخراج و تهیه داده ها است. بخش 4 نتایج محاسباتی تنظیمات آزمایش را نشان می دهد. سرانجام ، بخش 5 و بخش 6 به ترتیب مباحث یافته ها و نتیجه گیری ها را نشان می دهد.
2. وضعیت هنر پیش بینی جرم
معمولاً ، جرایم در گروه ها انجام می شود زیرا انجام این کار باعث می شود آنها آسانتر شوند و شناسایی باند جنایتکار بر اساس تاریخ جنایی ، مکان ، تاریخ و سایر متغیرها برای این مطالعه ضروری باشد. تکنیک های اجرای مانند مدل های رگرسیون ، شبکه های عصبی ، روش های سری زمانی و مدل های ترکیبی پیش بینی یا پیش بینی رفتار این باندها یا مکانهایی را که می توانند تحت تأثیر جرم قرار بگیرند ، بهبود بخشیده است.
برخی از مطالعات با استفاده از هوش مصنوعی پیش بینی های موفقی مانند Ordóñez و همکاران را انجام داده اند.[9] ، که از ماشین های بردار پشتیبانی استفاده می کرد. آنها برای پیش بینی نزدیکی مقادیر و به دست آوردن نزدیکی به بالاترین نقطه سرقت های متعهد در یک سال خاص ، از رگرسیون خطی استفاده کردند. آنها دو مدل تولید کردند و دقت پیش بینی خود را با استفاده از خطای مربع مقایسه کردند.
Cichosz [10] پیش بینی خطر جرم را با استفاده از رگرسیون منطقی ، دستگاه بردار پشتیبانی ، درختان تصمیم گیری و جنگل تصادفی پیشنهاد داد. برای این مطالعه ، نویسنده اطلاعاتی را از یک پایگاه داده لندن ، با توجه به رفتار ضد اجتماعی ، میزان جرایم جنسی ، سرقت با خشونت ، خرید و فروش و انواع دیگر سرقت ها و سرقت ها ، با تمرکز بر داده های جغرافیایی منچستر ، لیورپول ، بورنموث و ویکفیلد ، با تمرکز بر داده های جغرافیایی ، و ویکفیلد ، با تمرکز بر داده های جغرافیایی ، لیورپول ، بورنموث و ویکفیلد. واد
ابزاری دیگر که در پیش بینی جرم مورد استفاده قرار می گیرد ، شبکه های عصبی عمیق است. در [11] ، چون و همکاران. از این تکنیک برای پیش بینی تعداد جرایم با استفاده از داده ها از سال 1997 تا 2017 ، با توجه به نوع جرم ، میزان شدت و تعداد هزینه های روبرو استفاده کرد. آنها از کد کیفری ، جنسیت ، سن ، نژاد و تاریخ ضبط استفاده کردند. این اطلاعات با موفقیت سطح جرم و جنایت را بر اساس سابقه هر شخص به مدت پنج سال پیش بینی کرد و بسته به شدت ، این جنایت را از 0 تا 3 نشان داد. آنها تشخیص می دهند که وقتی پیش بینی یک جرم سطح بالا پیدا می کند ، احتمال این جنایت برای چند سال آینده به صورت اعطا می شود.
وانگ و همکاران.[12] از Arima با اطلاعاتی از یک بانک اطلاعاتی پلیس لندن استفاده کرد تا تحقیقات پیش بینی را بر اساس داده های تاریخی از سال 2016 تا 2018 برای تجزیه و تحلیل و پیش بینی با استفاده از ARIMA با چهارده نوع مختلف از جرم انجام دهد. لیو و لو [13] از یک مدل ترکیبی و مدل استرما با LSTM برای پیش بینی جرم سانفرانسیسکو با استفاده از داده های تاریخی ایالات متحده از سال 2003 تا 2017 استفاده کردند. از این پایگاه داده ، نویسندگان از تعداد حوادث ، توضیحات ، روز هفته استفاده می کردند. تاریخ ، زمان ، وضوح ، منطقه و مکان ، x ، y. بهترین مدل آنها یک مدل ترکیبی بود که شامل پیشرفت هایی برای سازگاری با داده ها ، اضافه کردن یک عملکرد خطی و بهبود دقت در پیش بینی تعداد جرایم مرتکب شده برای یک ساعت خاص ، روز ، هفته ، ماه یا سال است.
با داده های جنایی از هند ، جه و همکاران.[14] مقایسه ای از آریما ، شبکه های عصبی و یادگیری ماشین را انجام داد. برای این مطالعه ، مدل های ARIMA نتایج بهتری نسبت به سایر روش ها تولید می کنند.
Yadav و Kumari [15] از مدل های اتورگرایی و عملکردهای عضویت فازی برای پیش بینی های جرم چند متغیره استفاده کردند. آنها از یک مجموعه داده از شهر دهلی در هند برای جرایم زیر استفاده کردند: جرم وسایل نقلیه ، آتش سوزی ، حمله ، آدم ربایی ، سرقت ، سرقت و حمله خشونت آمیز. آنها دریافتند که عضویت فازی پیش بینی جرم چند متغیره را ساده کرده است.
شی و همکاران.[16] مطالعه یک مدل آرماکس را که در مورد جنایات ایالات متحده در رابطه با سن ، دوره جرم متعهد و ویژگی های مشابه در مورد مجرم انجام شده است ، انجام داد. این خصوصیات به شناسایی روند جرم و رابطه با سایر جرایم برنامه ریزی شده کمک می کند ، از جمله موارد دیگر در هر مورد.
Melgarejo و همکاران.[17] از دو پایگاه داده مختلف استفاده کرد ، اولین مورد از سانفرانسیسکو در مورد جرم سرقت و دوم از کلمبیا در مورد سرقت تلفن همراه. نویسندگان از الگوریتم های خوشه بندی برای مطالعه پویایی گروه های جنایی برای تولید سری های زمانی استفاده کردند. علاوه بر این ، آنها باندهای جنایتکار را شناسایی کردند و شاخص پارتیشن فازی را به حداقل می رساند و پیش بینی کننده های تکاملی فازی را تولید می کردند. سرانجام ، آنها دریافتند که این خوشه بندی سری زمانی را برای تقویت پیش بینی های جرم با تجزیه و تحلیل غیر خطی بهبود می بخشد.
از طرف دیگر ، ایزونین و همکاران.[18] و Tkachenko و همکاران.[19] با مشکل پردازش مجموعه داده های کوتاه و مقادیر از دست رفته از دیدگاه رگرسیون مقابله کرد. آنها از تکنیک هایی مانند رگرسیون بردار پشتیبانی با هسته ، تقویت کننده تطبیقی و نزول شیب تصادفی ، شبکه های عصبی ، Perceptron چند لایه و جنگل تصادفی استفاده کردند. نویسندگان دارای یک مجموعه داده پزشکی برای پیش بینی غلظت کلسیم در داده های نظارت بر ادرار و آلودگی هوا به ترتیب هستند.
3. مدل ها و روش ها
این بخش شامل استخراج داده ها ، آماده سازی و روش آزمایش است. تمام این فرایندها با استفاده از R. انجام شد
3. 1استخراج داده ها
اول ، ما سری زمانی را با استفاده از نظرسنجی های فرکانس هر جرم در چندین بخش از هر شهر ساختیم. این بخش ها به جنبه های اجتماعی اقتصادی ، جمعیت شناختی و جغرافیایی هر شهر پاسخ می دهند. سپس ، ما این اطلاعات را با تولید سی و پنج سری از چهارده تا بیست و یک مشاهده متراکم کردیم.
3. 2تهیه داده ها
علاوه بر این ، ما متوجه شدیم که هر سری در عنصر دوم دارای یک مقدار دورتر است. بنابراین ، ما این مقدار را با مقدار متوسط سری تغییر دادیم.
سرانجام ، ما آزمایش های اولیه را انجام دادیم و متوجه شدیم که چندین سری خطای میانگین درصد میانگین متقارن (SMAPE) 200 را تولید می کند. این به دلیل مقادیر صفر در این سریال اتفاق افتاد. بنابراین ، ما برای جلوگیری از این مسئله ، هر مقدار از تمام سری های زمانی را به یک افزایش می دهیم. شکل 1 یک نمونه سری زمانی را برای هر یک از چهار نوع جرم نشان می دهد.
پس از پردازش ، سری زمانی را به قطار و تست تقسیم می کنیم. در اینجا ، ما یک افق برابر با سه (H = 3) را تنظیم می کنیم و آن را به عنوان تست تنظیم می کنیم و بقیه را به عنوان قطار می گذاریم (شکل 2 را ببینید). سری زمانی در https://mega. nz/folder/OSFWXIIA#VRNXAIFAJMSQ6_PPAFVJFQ در 28 مه 2022 قابل دسترسی است.
3. 3روشهای پیش بینی
ما از چهار روش پیش بینی ساده استفاده می کنیم: Arima ، Hol t-Winters (HW) ، شبکه های عصبی مصنوعی (ANN) و میانگین حرکت ساده (SMA).
علاوه بر این ، ما از چهار روش پیش بینی پیشرفته استفاده کردیم: Jaganathan ، که به مقام چهارم در مسابقات M4 (Makridakis) می رسد [20] ؛fforma ، که در M4 در رده دوم قرار دارد. ترکیبی ، که یک روش ساده پیش بینی ترکیبی است. و LightGBM ، که عملکرد آن در رقابت M5 به مقام اول رسید [21].
[Jaganathan] روشهای آماری و یادگیری ماشین بیشماری را ترکیب می کند [22]: ساده لوح/snaive ؛هموار سازی نمایی (ETS) ؛ETS مرطوب ؛ETS BADGED ؛هموار سازی نمایی ، هموار سازی نمایی پیچیده ، هموار سازی نمایی عمومی. الگوریتم پیش بینی چند تجمعی (MAPA) ؛پیش بینی سلسله مراتبی زمانی ؛میانگین متحرک یکپارچه خودکار (ARIMA) ؛تتا ؛تتا هیبرید ؛پیش بینی طرفدار ؛تجزیه فصلی و روند با استفاده از پیش بینی Loess ؛تبدیل جعبه- جعبه- COX ، خطاهای ARMA ، روند و اجزای فصلی (TBATs). دو-بردارهای فصلی هولت ؛و ماشین آلات یادگیری چند لایه.
[fforma] از روشهای پیش بینی زیر استفاده می کند [23]: پیاده روی ساده لوحانه ، تصادفی با رانش ، روش ساده لوحانه ، تتا ، الگوریتم خودکار ARIMA ، ETS ، TBATS ، تجزیه فصلی و روند STLM-AR و پیش بینی سری شبکه های عصبی (NNETAR)واد
[Hybrid] گروه ها [24]: AUTO ARIMA ، ETS ، THETA ، NNETAR ، تجزیه فصلی و روند با استفاده از Loess ، Tbats ، Snaive.
3. 4تکنیک های پیش بینی پیشنهادی
RE پیش بینی منظم بخش آموزش این سریال ، Arima ، HW ، Ann ، SMA ، Jaganathan ، Fforma ، Hybrid یا LightGBM است (شکل 3 را ببینید). معادله (1) را ببینید.
در جایی که پیش بینی_میته هر یک از روشهای پیش بینی شده قبلی ارائه شده است ، و سری بخش آموزش سری زمانی است.
ما تست های پیش بینی اولیه را انجام دادیم و دریافتیم که چندین روش پیش بینی عملکرد ضعیفی دارند. برای بهبود پیش بینی ، ما از تجزیه فوریه همانطور که توسط Hyndman در [25،26،27] پیشنهاد شده است برای تجزیه یک سری زمانی در روند ، فصلی و باقیمانده استفاده کردیم.
تکنیک های زیر از تجزیه فوریه برای استخراج مؤلفه فصلی بخش قطار یک سری استفاده می کنند. برای سادگی ، ما از اصطلاح فصلی استفاده خواهیم کرد.
REMS پیش بینی منظم سریال منهای مؤلفه فصلی است. شکل 4 طرح این تکنیک را نشان می دهد ، جایی که شکل 4A بخش قطار این سری را نشان می دهد ، شکل 4B جزء فصلی است و شکل 4C پیش بینی شکل 4A منهای شکل 4B را نشان می دهد ، به معادلات (2) - (4) مراجعه کنید.
تکنیک CAS یک پیش بینی مرکب از REMS به علاوه میانگین کل مؤلفه فصلی است (شکل 5 را ببینید). در اینجا ، ما از پیش بینی REMS (شکل 5a) استفاده می کنیم و میانگین مؤلفه فصلی (شکل 5b) را برای تولید پیش بینی نهایی اضافه می کنیم (شکل 5b). معادله (5) را ببینید.
CAHS همان CAS است ، اما به جای استفاده از میانگین کل مؤلفه فصلی ، ما از میانگین مقادیر H آخرین مؤلفه فصلی استفاده می کنیم (شکل 6 را ببینید). ما این تنوع را برای برجسته کردن آخرین گرایش های مؤلفه فصلی نشان داده شده در شکل 6b ، برای افزایش یا کاهش پیش بینی REMS (شکل 6A) برای تولید پیش بینی CAHS جدید در شکل 6C پیشنهاد می کنیم. معادله (6) را ببینید.
شکل 7 طرح Cremsplusfs را نشان می دهد. این تکنیک پیش بینی از REMS (شکل 7A) استفاده می کند و پیش بینی مستقل از مؤلفه فصلی (شکل 7B) را اضافه می کند تا یک پیش بینی ترکیبی را به دست آورد (شکل 7C). این نکته حائز اهمیت است که هر دو پیش بینی با استفاده از همان روش پیش بینی تولید می شوند. معادله (7) را ببینید.
بنابراین ، ما از هشت روش پیش بینی و پنج روش پیش بینی برای هر یک استفاده می کنیم و چهل پیکربندی آزمایش را تولید می کنیم.
4- نتیجه آزمایشی
در این بخش ، نتایج چهل پیکربندی آزمایش را با استفاده از میانگین میانگین درصد خطای متقارن (SMAPE) مورد استفاده در مسابقات M4 [20] و میانگین رتبه آزمون غیر پارامتری فریدمن ارائه می دهیم.
جدول 1 روش ها و تکنیک های پیش بینی در ستون های یک و دو را نشان می دهد که مطابق با متوسط SMAPE در ستون سه سفارش داده می شوند. در اینجا ، می توانیم ببینیم که روش پیش بینی که بهترین SMAPE را تولید می کند Arima است و پس از آن Jaganathan ، SMA و Hybrid ، در حالی که سه نفر اول از آنها به عنوان تکنیک پیش بینی استفاده می کنند. این روشها تا زمان پیش بینی پانزدهم ، که FForma است ، ادامه می یابد. از طرف دیگر ، آخرین موقعیت ها با تکنیک Cremsplusfs با Ann ، LightGBM و HW مطابقت دارد.
سرانجام ، جدول 2 میانگین رتبه یک آزمون غیر پارامتری فریدمن را به جدول 1 در ستون سه اضافه می کند ، که تنظیمات آزمایشی (جفت روش و تکنیک پیش بینی) را رتبه بندی می کند. علاوه بر این ، ما یک ستون پنجم را شامل می شویم که برای هر پیکربندی آزمایشی ، تغییرات موقعیت نشان داده شده در جدول 1 را نشان می دهد. در اینجا ، می بینیم که برخی از تنظیمات آزمایشی توسط چندین واحد رتبه بندی می کنند. با این حال ، عملکرد کلی یکسان است. ما میانگین رتبه آزمون فریدمن را با توجه به اینکه برای مقایسه آماری طراحی شده است ، قابل اطمینان تر از متوسط SMAPE است.
اکنون می توانیم ببینیم که اولین روش پیش بینی SMA است که پس از آن Arima ، Hybrid و Jaganathan تا زمان پیکربندی آزمایش چهاردهم با FFORMA انجام می شود. آخرین روش های پیش بینی LightGBM ، Ann و HW با Arima مخلوط شده است. ما می توانیم ببینیم که SMA CAHS ، SMA REMS و SMA CAS رتبه های خود را افزایش داده اند ، به ترتیب سیزده (× 13) ، پنج (5 × 5) و پنج (5 × 5) ، به این نکته اشاره می کنند که روشهای پیش بینی با روشهای پیش بینیبیشترین تغییرات در رده های برتر است.
5. بحث
ما گمان می کنیم که ANN و LightGBM بالاترین SMAPE و بدترین رتبه را تولید می کنند زیرا آنها داده های آموزشی کافی برای شناسایی الگوهای مداوم برای پیش بینی ندارند. علاوه بر این ، HW از هموار سازی نمایی استفاده می کند و با مؤلفه فصلی کار می کند. این نکته حائز اهمیت است که با توجه به اندازه سری زمانی ، در نظر می گیریم که شناسایی صحیح مؤلفه فصلی دشوار است ، که ممکن است منجر به عملکرد ضعیف شود.
از طرف دیگر ، SMA از پارامترهای پیچیده و جزء فصلی استفاده نمی کند. این فقط به آخرین مقادیر برای انجام پیش بینی نیاز دارد. علاوه بر این ، مدل های ARIMA سعی می کنند همبستگی های موجود در داده ها را توصیف کنند و از ترکیبی از تفاوت با Autoregression و یک مدل متوسط در حال حرکت تشکیل شده است. این قسمت ها به ترتیب توسط پارامترهای P ، D و Q به ترتیب در آرمیا (P ، D ، Q) توصیف شده است. این مهم است که برجسته کنیم که 85 ٪ از کل سری های زمانی توسط Arima به عنوان سر و صدای سفید طبقه بندی شده اند [28] ، به این معنی که آنها فاقد همبستگی هستند و با داشتن توزیع یکنواخت از داده ها ، مشابه یک فرآیند پیاده روی تصادفی ، تقارن بالایی دارند [26]بنابراین ، پیش بینی این سریال ها دشوار است زیرا آنها احتمال بالا رفتن یا پایین بودن این سریال را دارند.
این سری های زمانی از مدل Arima (0،0،0) استفاده می کنند که یک خط مستقیم با مقدار میانگین کل سری زمانی ، مشابه SMA پیش بینی می کند. علاوه بر این ، ARIMA می تواند مدل های مختلفی تولید کند و منجر به تغییر در عملکرد آن شود.
علاوه بر این ، هیبرید و جاگاناتان همچنین نمایش های خوبی را به نمایش گذاشتند اما برای بهترین آنها کافی نیست و طبق اصل پارسیمونی ، اگر چندین روش پیش بینی عملکردهای مشابهی را نشان می دهند ، باید از ساده ترین آنها استفاده کنیم.
با توجه به تکنیک های پیش بینی ، اکثر بهترین پنج روش تمایل به نادیده گرفتن از مؤلفه فصلی ، چه نادیده گرفتن آن به طور کامل (REM) یا استفاده از فقط میانگین آن (CAS) یا قطعه ای از آن (CAHS).
6. نتیجه گیری
در این مقاله ، ما در چندین بخش از سه شهر تامولیپاس ، مکزیکو ، مشکل پیش بینی سری زمانی جرم و جنایات کوتاه را برای جرایم مشترک (سرقت ، خرید ، وسایل نقلیه و سارق) حل می کنیم. برای این مشکل ، ما استفاده از روش های گروهی ساده و مبتنی بر یادگیری ماشین را پیشنهاد می کنیم. علاوه بر این ، برای هر یک از روشهای پیش بینی ، ما پنج روش پیش بینی مختلف را پیشنهاد می کنیم که حاکی از استخراج مؤلفه فصلی این سری است و در مجموع چهل پیکربندی آزمایش تولید می کند.
ما تنظیمات آزمایش را با استفاده از دو معیار ، میانگین SMAPE و میانگین رتبه آزمون فریدمن رتبه بندی می کنیم. همانطور که انتظار می رفت ، هر دو رتبه سفارشات مختلفی را تولید می کنند اما با همان الگوی ، یعنی SMA ، Arima ، Hybrid و Jaganathan به عنوان بهترین روش های پیش بینی و LightGBM ، Ann و HW به عنوان روش هایی با کمترین عملکرد ، Forma را در وسط قرار می دهند.
بهترین پنج تنظیمات آزمایشی تمایل به برکناری مؤلفه فصلی CAHS ، REMS و CAS دارند. همانطور که قبلاً در بخش 5 گفته شد ، بیشتر تنظیمات داخلی ARIMA تمایل به پیش بینی با استفاده از میانگین ساده از کل سری ها ، نادیده گرفتن مؤلفه فصلی حتی اگر از تکنیک پیش بینی مجدد استفاده کند. سرانجام ، بدترین تنظیمات آزمایش از این سریال با فصلی (Re) استفاده می کند یا فصلی را پیش بینی می کند و آن را به پیش بینی سریال منهای فصلی (Cremsplusfs) اضافه می کند.
بنابراین ، برای این مطالعه می توان نتیجه گرفت که بهترین روش پیش بینی عملکرد ، با شروع بهترین ، SMA ، Arima ، Hybrid و Jaganathan هستند. در مقابل ، بدترین روش های پیش بینی LightGBM و ANN است. بهترین تکنیک های پیش بینی تمایل به عدم توجه به مؤلفه فصلی دارند. علاوه بر این ، SMA ، Hybrid ، Fforma ، HW ، Ann و LightGM تمایل دارند با نادیده گرفتن مؤلفه فصلی و بدترین آنها در غیر این صورت بهترین عملکردهای خود را به نمایش بگذارند ، در حالی که جاگاناتان و آریما در مورد استفاده از مؤلفه فصلی رابطه معکوس دارند. با این حال ، اجزای داخلی ARIMA بیشتر سری های زمانی را به عنوان سر و صدای سفید (بدون همبستگی و تقارن زیاد) شناسایی می کنند ، و با تولید مدل های ARIMA (0/0) فصلی را نادیده می گیرند. علاوه بر این ، Jaganathan همچنین از Arima به عنوان بخشی از مؤلفه های خود استفاده می کند. از این رو ، ما آن را به طور مشابه در نظر می گیریم.
یادآوری این نکته حائز اهمیت است که این نتایج برای سریال های کوچک به اندازه کوچک است و ممکن است مختص این نوع سری های زمانی باشد. در کار آینده ، ما توصیه می کنیم از تکنیک های دیگری که شامل تمایل و باقیمانده ها و همچنین توسعه بیش از حد هیوریک برای یافتن تکنیک های پیش بینی بهتر و استفاده از مجموعه های بزرگتر از سری زمانی است ، استفاده کنید.
کمک های نویسنده
مفهوم سازی ، M. A. C.-N. و M. G. T.-B. ؛CURATION DATA ، M. A. C.-N. ، M. G. T.-B. و M. P. P.-F. ؛تجزیه و تحلیل رسمی ، M. P. P.-F. و به عنوان.؛تحقیقات ، M. A. C.-N. ، S. I.-M. و J. L.-M. ؛روش شناسی ، M. A. C.-N. ، M. P. P.-F. و J. D. T.-V. ؛مدیریت پروژه ، S. I.-M. و به عنوان.؛نرم افزار ، M. P. P.-F. و J. A. C.-R. ؛نظارت ، S. I.-M. و به عنوان.؛اعتبار سنجی ، M. G. T.-B. ، J. D. T.-V. و S. I.-M. ؛تجسم ، J. L.-M. ؛نوشتن-پیش نویس Original ، M. G. T.-B. ، M. P. P.-F. و J. A. C.-R. ؛نوشتن-بررسی و ویرایش ، J. D. T.-V. ، S. I.-M. و J. L.-M. همه نویسندگان نسخه منتشر شده نسخه خطی را خوانده و موافقت کرده اند.
بهترین استراتژی معاملات...
ما را در سایت بهترین استراتژی معاملات دنبال می کنید
برچسب :
نویسنده : صدرا ذوالریاستین
بازدید : 45
تاريخ : سه
شنبه
22 فروردين
1402 ساعت: 13:03