پیش بینی: اصول و تمرین (چاپ دوم)

ساخت وبلاگ

تاکنون ، ما توجه خود را به داده های غیر فصلی و مدل های ARIMA غیر فصلی محدود کرده ایم. با این حال ، مدل های ARIMA همچنین قادر به مدل سازی طیف گسترده ای از داده های فصلی هستند.

یک مدل ARIMA فصلی با استفاده از اصطلاحات فصلی اضافی در مدل های ARIMA که تاکنون دیده ایم تشکیل شده است. به شرح زیر نوشته شده است:

 

اریما ( underbrace<(p, d, q)>) ( underbrace<(P, D, Q)_>)
(<uparrow>) (<uparrow>)
بخش غیر فصلی قسمت فصلی از
از مدل از مدل

جایی که (m = ) تعداد مشاهدات در سال. ما از نمادهای بزرگ برای قسمت های فصلی مدل و نماد کوچک برای قسمت های غیر فصلی مدل استفاده می کنیم.

قسمت فصلی این مدل شامل اصطلاحاتی است که شبیه به اجزای غیر فصلی مدل است ، اما شامل پشتی های دوره فصلی است. به عنوان مثال ، یک مدل ARIMA (1،1،1) (1،1،1) (_ ) مدل (بدون ثابت) برای داده های سه ماهه ( (M = 4 )) است و می تواند به صورت نوشته شود[(1 - phi_b)~(1 - phi_b^) (1 - b) (1 - b^) y_ = (1 + theTa_B)~(1 + theta_b^) varepsilon_.]

شرایط فصلی اضافی به سادگی با اصطلاحات غیر فصلی ضرب می شود.

ACF/PACF

قسمت فصلی یک مدل AR یا MA در تاخیر فصلی PACF و ACF دیده می شود. به عنوان مثال ، یک مدل ARIMA (0،0،0) (0،0،1) (_ ) مدل را نشان می دهد:

  • سنبله در تاخیر 12 در ACF اما هیچ سنبله قابل توجهی دیگر وجود ندارد.
  • پوسیدگی نمایی در تاخیر فصلی PACF (یعنی در تاخیر 12 ، 24 ، 36 ، ...).

به همین ترتیب ، یک مدل ARIMA (0،0) (1،0،0) (_ ) نشان می دهد:

  • پوسیدگی نمایی در تاخیر فصلی ACF ؛
  • یک سنبله قابل توجه در تاخیر 12 در PACF.

در نظر گرفتن سفارشات فصلی مناسب برای یک مدل فصلی Arima ، توجه به تاخیر فصلی را محدود کنید.

روش مدل سازی تقریباً مشابه با داده های غیر فصلی است ، به جز این که ما باید اصطلاحات AR و MA فصلی و همچنین اجزای غیر فصلی مدل را انتخاب کنیم. این فرایند به بهترین وجه از طریق مثال نشان داده شده است.

مثال: تجارت خرده فروشی سه ماهه اروپا

ما روش مدل سازی فصلی ARIMA را با استفاده از داده های سه ماهه تجارت خرده فروشی اروپا از سال 1996 تا 2011 شرح خواهیم داد. داده ها در شکل 8. 17 ترسیم شده است.

Quarterly retail trade index in the Euro area (17 countries), 1996--2011, covering wholesale and retail trade, and the repair of motor vehicles and motorcycles. (Index: 2005 = 100).

شکل 8. 17: شاخص تجارت سه ماهه خرده فروشی در منطقه یورو (17 کشور) ، 1996-2011 ، پوشش عمده فروشی و خرده فروشی و تعمیر وسایل نقلیه موتوری و موتور سیکلت.(فهرست: 2005 = 100).

داده ها به وضوح غیر ثابت هستند، با مقداری فصلی، بنابراین ابتدا تفاوت فصلی را در نظر می گیریم. داده های متفاوت فصلی در شکل 8. 18 نشان داده شده است. به نظر می رسد اینها نیز ثابت نیستند، بنابراین ما یک تفاوت اول اضافی را که در شکل 8. 19 نشان داده شده است، می گیریم.

Seasonally differenced European retail trade index.

شکل 8. 18: شاخص تجارت خرده فروشی اروپا با تفاوت فصلی.

Double differenced European retail trade index.

شکل 8. 19: شاخص تجارت خرده فروشی اروپا با اختلاف دوگانه.

اکنون هدف ما یافتن یک مدل ARIMA مناسب بر اساس ACF و PACF نشان داده شده در شکل 8. 19 است. سنبله قابل توجه در تاخیر 1 در ACF نشان دهنده یک جزء MA(1) غیر فصلی است، و سنبله قابل توجه در تاخیر 4 در ACF نشان دهنده یک جزء MA(1) فصلی است. در نتیجه، ما با یک مدل ARIMA(0, 1, 1)(0, 1, 1) (_4) شروع می کنیم که نشان دهنده تفاوت اول و فصلی و اجزای MA(1) غیر فصلی و فصلی است. باقیمانده های مدل برازش شده در شکل 8. 20 نشان داده شده است.(با منطق مشابه اعمال شده در PACF، ما همچنین می توانستیم با مدل ARIMA(1, 1, 0)(1, 1, 0) (_4) شروع کنیم.)

Residuals from the fitted ARIMA(0,1,1)(0,1,1) 4$ model for the European retail trade index data.

شکل 8. 20: باقیمانده از مدل ARIMA(0, 1, 1)(0, 1, 1) (_4) نصب شده برای داده های شاخص تجارت خرده فروشی اروپا.

هر دو ACF و PACF جهش های قابل توجهی را در تاخیر 2 و افزایش تقریباً قابل توجهی در تاخیر 3 نشان می دهند، که نشان می دهد برخی اصطلاحات غیر فصلی اضافی باید در مدل گنجانده شوند. AICc مدل ARIMA(0, 1, 2)(0, 1, 1) (_4) 74. 36 است در حالی که برای ARIMA(0, 1, 3)(0, 1, 1) (_4) مدل 68. 53 است. ما مدل های دیگری را نیز با اصطلاحات AR امتحان کردیم، اما هیچ کدام که مقدار AICc کمتری نداشتند. در نتیجه، مدل ARIMA(0, 1, 3)(0, 1, 1) (_4) را انتخاب می کنیم. بقایای آن در شکل 8. 21 نشان داده شده است. همه میخ ها اکنون در محدوده های اهمیت قرار دارند، بنابراین به نظر می رسد که باقی مانده ها نویز سفید هستند. آزمون Ljung-Box همچنین نشان می دهد که باقیمانده ها هیچ خودهمبستگی باقیمانده ای ندارند.

Residuals from the fitted ARIMA(0,1,3)(0,1,1) 4$ model for the European retail trade index data.

شکل 8. 21: باقیمانده از مدل ARIMA(0, 1, 3)(0, 1, 1) (_4) نصب شده برای داده های شاخص تجارت خرده فروشی اروپا.

بنابراین، ما اکنون یک مدل ARIMA فصلی داریم که بررسی های لازم را پشت سر گذاشته و برای پیش بینی آماده است. پیش بینی های مدل برای سه سال آینده در شکل 8. 22 نشان داده شده است. پیش بینی ها از روند اخیر در داده ها پیروی می کنند، زیرا تفاوت مضاعف وجود دارد. فواصل پیش بینی بزرگ و به سرعت در حال افزایش نشان می دهد که شاخص تجارت خرده فروشی می تواند در هر زمانی شروع به افزایش یا کاهش کند - در حالی که نقطه روند رو به پایین را پیش بینی می کند، فواصل پیش بینی به داده ها اجازه می دهد در طول دوره پیش بینی روند صعودی داشته باشند.

Forecasts of the European retail trade index data using the ARIMA(0,1,3)(0,1,1)(_4) model. 80% and 95% prediction intervals are shown.

شکل 8. 22: پیش بینی داده های شاخص تجارت خرده فروشی اروپا با استفاده از مدل ARIMA (0،1،3) (0،1،1) (_ 4 ). فواصل پیش بینی 80 ٪ و 95 ٪ نشان داده شده است.

ما می توانستیم از Auto. arima () استفاده کنیم تا بیشتر این کارها را برای ما انجام دهیم. این همان نتیجه را می داد.

تابع Auto. arima () از NSDIFF () برای تعیین (d ) (تعداد اختلافات فصلی مورد استفاده) و NDIFF () برای تعیین (d ) (تعداد تفاوت های معمولی استفاده شده) استفاده می کند. انتخاب پارامترهای مدل دیگر ( (P ، Q ، P ) و (q )) همه با به حداقل رساندن AICC ، مانند مدل های ARIMA غیر فصلی تعیین می شوند.

مثال: فروش مواد مخدر کورتیکواستروئید در استرالیا

مثال دوم ما دشوارتر است. ما سعی خواهیم کرد فروش ماهانه داروهای کورتیکواستروئید در استرالیا را پیش بینی کنیم. اینها به عنوان داروهای H02 تحت طرح طبقه بندی شیمیایی آناتومیکی شناخته می شوند.

Corticosteroid drug sales in Australia (in millions of scripts per month). Logged data shown in bottom panel.

شکل 8. 23: فروش داروهای کورتیکواستروئید در استرالیا (در میلیون ها اسکریپت در ماه). داده های ثبت شده در صفحه پایین نشان داده شده است.

داده های ژوئیه 1991 تا ژوئن 2008 در شکل 8. 23 ترسیم شده است. افزایش کمی در واریانس با سطح وجود دارد ، بنابراین لگاریتم ها را برای تثبیت واریانس می گیریم.

داده ها به شدت فصلی و آشکارا غیر ثابت هستند ، بنابراین از تفاوت فصلی استفاده می شود. داده های مختلف فصلی در شکل 8. 24 نشان داده شده است. در این مرحله مشخص نیست که آیا ما باید تفاوت دیگری انجام دهیم یا نه. ما تصمیم می گیریم که نباشیم ، اما انتخاب آشکار نیست.

به نظر می رسد چند مشاهده آخر از داده های قبلی متفاوت (متغیر تر) است. این ممکن است به این دلیل باشد که گاهی اوقات داده ها هنگام گزارش فروش زودتر ، داده ها مورد تجدید نظر قرار می گیرند.

Seasonally differenced corticosteroid drug sales in Australia (in millions of scripts per month).

شکل 8. 24: فروش داروهای کورتیکواستروئید متفاوت فصلی در استرالیا (در میلیون ها اسکریپت در ماه).

در توطئه های داده های فصلی متفاوت ، سنبله هایی در PACF در تاخیر 12 و 24 وجود دارد ، اما هیچ چیز در تاخیر فصلی در ACF نیست. این ممکن است حاکی از یک دوره AR (2) فصلی باشد. در تاخیر غیر فصلی ، سه سنبله قابل توجه در PACF وجود دارد که یک دوره AR (3) احتمالی را نشان می دهد. الگوی موجود در ACF نشانگر هیچ مدل ساده ای نیست.

در نتیجه ، این تجزیه و تحلیل اولیه نشان می دهد که یک مدل ممکن برای این داده ها یک ARIMA (3،0،0) (2،1،0) (_ ) است. ما این مدل را به همراه برخی تغییرات در آن قرار می دهیم و مقادیر AICC نشان داده شده در جدول زیر را محاسبه می کنیم.

 

مدل AICC
Arima (3،0،1) (0،1،2) (_ ) -485. 5
Arima (3،0،1) (1،1،1) (_ ) -484. 2
Arima (3،0،1) (0،1،1) (_ ) -483. 7
Arima (3،0،1) (2،1،0) (_ ) -476. 3
Arima (3،0،0) (2،1،0) (_ ) -475. 1
Arima (3،0،2) (2،1،0) (_ ) -474. 9
ARIMA(3, 0, 1)(1, 1, 0) (_) -463. 4

از بین این مدل ها، بهترین مدل ARIMA(3, 0, 1)(0, 1, 2) (_) است (یعنی کوچکترین مقدار AICc را دارد).

Residuals from the ARIMA(3,0,1)(0,1,2) <12></p><p>$ model applied to the H02 monthly script sales data.

شکل 8. 25: باقیمانده های مدل ARIMA(3, 0, 1)(0, 1, 2) (_) برای داده های فروش ماهانه اسکریپت H02 اعمال می شود.

باقیمانده های این مدل در شکل 8. 25 نشان داده شده است. چند جهش قابل توجه در ACF وجود دارد و این مدل در تست Ljung-Box شکست خورده است. این مدل هنوز هم می تواند برای پیش بینی استفاده شود، اما فواصل پیش بینی ممکن است به دلیل باقیمانده های مرتبط دقیق نباشد.

در ادامه سعی خواهیم کرد از الگوریتم خودکار ARIMA استفاده کنیم. اجرای auto. arima() با تمام آرگومان های باقی مانده در مقادیر پیش فرضشان منجر به مدل ARIMA(2, 1, 1)(0, 1, 2) (_) شد. با این حال، این مدل همچنان در تست Ljung-Box با 36 تاخیر مردود است. گاهی اوقات نمی توان مدلی را پیدا کرد که تمام تست ها را پشت سر بگذارد.

ارزیابی مجموعه تست:

ما برخی از مدل های نصب شده تا کنون را با استفاده از یک مجموعه آزمایشی متشکل از داده های دو سال گذشته مقایسه خواهیم کرد. بنابراین، مدل ها را با استفاده از داده های جولای 1991 تا ژوئن 2006 برازش می کنیم و فروش اسکریپت را برای جولای 2006 تا ژوئن 2008 پیش بینی می کنیم. نتایج در جدول 8. 2 خلاصه شده است.

جدول 8. 2: مقادیر RMSE برای مدل های مختلف ARIMA به داده های فروش ماهانه اسکریپت H02 اعمال می شود.

مدل RMSE
Arima (3،0،1) (0،1،2) (_ ) 0. 0622
Arima (3،0،1) (1،1،1) (_ ) 0. 0630
ARIMA(2،1،3)(0،1،1) (_) 0. 0634
ARIMA(2،1،1)(0،1،2) (_) 0. 0634
ARIMA(2،1،2)(0،1،2) (_) 0. 0635
ARIMA(3, 0, 3)(0, 1, 1) (_) 0. 0637
Arima (3،0،1) (0،1،1) (_ ) 0. 0644
ARIMA(3, 0, 2)(0, 1, 1) (_) 0. 0644
Arima (3،0،2) (2،1،0) (_ ) 0. 0645
Arima (3،0،1) (2،1،0) (_ ) 0. 0646
ARIMA(4, 0, 2)(0, 1, 1) (_) 0. 0648
ARIMA(4, 0, 3)(0, 1, 1) (_) 0. 0648
Arima (3،0،0) (2،1،0) (_ ) 0. 0661
ARIMA(3, 0, 1)(1, 1, 0) (_) 0. 0679

مدل هایی که به صورت دستی و با () auto. arima انتخاب شده اند، هر دو بر اساس مقادیر RMSE خود در چهار مدل برتر قرار دارند.

هنگامی که مدل ها با استفاده از مقادیر AICc مقایسه می شوند، مهم است که همه مدل ها دارای ترتیب تفاوت یکسانی باشند. با این حال، هنگام مقایسه مدل ها با استفاده از یک مجموعه آزمایشی، مهم نیست که چگونه پیش بینی ها تولید شده اند - مقایسه ها همیشه معتبر هستند. در نتیجه، در جدول بالا، می توانیم برخی از مدل ها را فقط با تفاوت فصلی و برخی مدل ها را با تفاوت اول و فصلی بگنجانیم، در حالی که در جدول قبلی حاوی مقادیر AICc، ما فقط مدل هایی را با تفاوت فصلی مقایسه کردیم، اما تفاوت اول را نداشتیم.

هیچ یک از مدل هایی که در اینجا در نظر گرفته شده اند، تمام تست های باقیمانده را قبول نمی کنند. در عمل، ما معمولاً از بهترین مدلی که می توانیم پیدا کنیم، استفاده می کنیم، حتی اگر تمام تست ها را پاس نکرده باشد.

پیش بینی های مدل ARIMA(3, 0, 1)(0, 1, 2) (_) (که دارای کمترین مقدار RMSE در مجموعه آزمایشی و بهترین مقدار AICc در بین مدل هایی با تنها تفاوت فصلی است) نشان داده شده است. در شکل 8. 26.

Forecasts from the ARIMA(3,0,1)(0,1,2) <12></p><p>$ model applied to the H02 monthly script sales data.

شکل 8. 26: پیش بینی های مدل ARIMA(3, 0, 1)(0, 1, 2) (_) برای داده های فروش ماهانه اسکریپت H02 اعمال می شود.

بهترین استراتژی معاملات...
ما را در سایت بهترین استراتژی معاملات دنبال می کنید

برچسب : نویسنده : صدرا ذوالریاستین بازدید : 51 تاريخ : سه شنبه 22 فروردين 1402 ساعت: 15:12