راهنمای پیش بینی سری زمانی در R باید بدانید

ساخت وبلاگ

The Best Guide to Time Series Forecasting in R

پیش بینی تکنیکی است که در زمینه یادگیری ماشین برای پیش بینی های تجاری مورد استفاده قرار می گیرد. شرکت ها از پیش بینی های سری زمانی گذشته استفاده می کنند و برای آینده تصمیمات تجاری می گیرند. در این مقاله ، ما در مورد پیش بینی سریال های زمانی با جزئیات خواهیم دید.

از بهترین ها در تجارت علوم داده بیاموزید!

Caltech Data Science Bootcamp اکنون کاوش کنید

پیش بینی سری زمانی چیست؟

پیش بینی سری زمانی روش کاوش و تجزیه و تحلیل داده های سری زمانی ثبت شده یا جمع آوری شده در طی یک دوره زمانی مشخص است. این روش برای پیش بینی مقادیر و پیش بینی های آینده استفاده می شود. همه داده هایی که دارای مقادیر زمانی یا مقادیر تاریخ هستند زیرا ویژگی های آن می توانند به عنوان یک داده سری زمانی در نظر گرفته شوند. هر داده ای مناسب برای پیش بینی سری زمانی باید از مشاهدات در مورد یک بازه مداوم و مداوم باشد.

کار رویایی خود را با بهترین منابع شروع کنید!

برنامه تحصیلات تکمیلی Caltech در برنامه اکتشاف علوم داده

برنامه های پیش بینی سری زمانی

Time_Series

  • پیش بینی سری زمانی در پیش بینی قیمت سهام برای پیش بینی قیمت بسته شدن سهام در هر روز معین استفاده می شود.
  • تجارت الکترونیکی و شرکت های خرده فروشی از پیش بینی برای پیش بینی فروش و واحدهای فروخته شده برای محصولات مختلف استفاده می کنند.
  • پیش بینی آب و هوا برنامه دیگری است که می تواند با استفاده از پیش بینی سری زمانی انجام شود.
  • این توسط ادارات دولتی برای پیش بینی جمعیت یک کشور ، در هر منطقه خاص یا کل کشور استفاده می شود.

اجزای سری زمانی

برای استفاده از داده های سری زمانی و تهیه یک مدل ، باید با گذشت زمان الگوهای موجود در داده ها را درک کنید. این الگوها به چهار مؤلفه طبقه بندی می شوند که عبارتند از:

روند

این نشان دهنده تغییر تدریجی در داده های سری زمانی است. الگوی روند رشد یا کاهش طولانی مدت را نشان می دهد.

مرحله

اگر یک خط مستقیم باشد ، به مقادیر پایه برای داده های سری اشاره دارد.

فصلی

این نشان دهنده الگوهای کوتاه مدت است که در یک واحد زمان واحد رخ می دهد و به طور نامحدود تکرار می شود.

سر و صدا

این نشان دهنده تغییرات نامنظم است و کاملاً تصادفی است. این نوسانات پیش بینی نشده ، غیرقابل پیش بینی است و با مدل قابل توضیح نیست.

به یک متخصص علوم داده تبدیل شوید و شغل رویایی خود را بدست آورید

برنامه تحصیلات تکمیلی Caltech در برنامه اکتشاف علوم داده

روشهای پیش بینی سری زمانی

مدل آریما

ARIMA مخفف میانگین متحرک یکپارچه خودجوش است. این ترکیبی از مدل خودگردان (AR) و میانگین متحرک (MR) است. پیش بینی مدل AR با ترکیبی خطی از مقادیر گذشته متغیر مطابقت دارد. پیش بینی مدل متوسط در حال حرکت با ترکیبی خطی از خطاهای پیش بینی گذشته مطابقت دارد."من" مقادیر داده ای را نشان می دهد که با تفاوت بین مقادیر آنها و مقادیر قبلی جایگزین می شود.

مدل ساریما

ساریما مخفف میانگین متحرک یکپارچه خود برای یکپارچه فصلی است. این مدل ARIMA را با اضافه کردن ترکیبی خطی از مقادیر گذشته فصلی و خطاهای پیش بینی گسترش می دهد.

قارچ

روش وکتور Autoregression (VAR) مرحله بعدی در هر سری زمانی را با استفاده از یک مدل AR مدل می کند. مدل VAR هنگامی مفید است که شما علاقه مند به پیش بینی متغیرهای سری زمانی با استفاده از یک مدل واحد هستید.

LSTM

شبکه حافظه کوتاه مدت کوتاه مدت یا LSTM نوع خاصی از شبکه عصبی مکرر است که به وابستگی های طولانی مدت می پردازد. این می تواند اطلاعات مربوط به داده های گذشته را به خاطر بسپارد و قادر به یادگیری وابستگی به سفارش در مشکلات پیش بینی توالی است.

از بهترین ها در تجارت علوم داده بیاموزید!

Caltech Data Science Bootcamp اکنون کاوش کنید

پیش بینی سری زمانی با استفاده از مدل Arima

مدل های ARIMA توسط سه عامل طبقه بندی می شوند:

P = تعداد اصطلاحات اتورگرایی (AR)

د = برای دستیابی به ثابت بودن چند تفاوت غیر فصلی لازم است (I)

س = تعداد خطاهای پیش بینی تاخیر در معادله پیش بینی (MA)

در این نسخه ی نمایشی ، ما از یک مجموعه داده با اطلاعاتی در مورد فروش بلیط هوایی صنعت هواپیمایی از سالهای 1960-1960 استفاده خواهیم کرد. ما فروش بلیط های هواپیمایی سال 1961 را با استفاده از مدل ARIMA در R. پیش بینی خواهیم کرد.

Time_Series-2.

ایده این تجزیه و تحلیل شناسایی مؤلفه های سری زمانی است که عبارتند از:

  • روند
  • فصلی
  • رفتار تصادفی داده ها

سپس ، ما مقادیر مبتنی بر داده های تاریخی را پیش بینی می کنیم.

بسته پیش بینی را در RSTUDIO بارگیری کنید

مجموعه داده های مسافر هوا را بارگیری کنید و کلاس آن را مشاهده کنید

در اینجا ، TS نشان می دهد که این یک مجموعه داده سری زمانی است.

نمایش داده را نمایش دهید

Time_Series-3

بیایید مقادیر تاریخ خود را بررسی کنیم

بنابراین ، تاریخ شروع ما ژانویه 1949 است ، در حالی که تاریخ پایان دسامبر 1960 است.

با تجربه دنیای واقعی به یک دانشمند داده تبدیل شوید

برنامه کارشناسی ارشد دانشمند داده دوره کاوش می کند

دریابید که آیا مقادیر از دست رفته وجود دارد

خلاصه مجموعه داده ها را بررسی کنید

/Time_Series-4

مجموعه داده ها را ترسیم کنید

Time_Series-5

داده ها را به چهار مؤلفه تجزیه کنید

Time_Series-6.

اجزای مختلف را به صورت جداگانه ترسیم کنید

Time_Series-7

خط روند را در مجموعه داده اصلی ترسیم کنید

time series 10

از کارشناسان مشهور در Caltech یاد بگیرید!

برنامه Caltech Data Science Bootcamp برنامه کاوش

با چرخه یک طرح جعبه ایجاد کنید

Boxplot (AirPassengers~چرخه (AirPassengers ، xlab = "Date" ، YLAB = "شماره مسافر (1000's)" ، اصلی = "Boxplot ماهانه هوا از سال 1949"))

Time_Series-11

از طرح فوق می بینید که تعداد فروش بلیط در ماه ژوئن ، ژوئیه و آگوست نسبت به ماه های دیگر سالها بیشتر می شود.

با استفاده از عملکرد Auto. arima () مدل Arima را بسازید

Time_Series-12

باقیمانده ها را ترسیم کنید

Time_Series-13

مقادیر را برای 10 سال آینده پیش بینی کنید

Time_Series-14

با انتخاب مقادیر تاخیر مدل را تأیید کنید

Box. Test (MyModel $ Reain ، LAG = 5 ، Type = "Ljung-Box")

Time_Series-15

Box. Test (MyModel $ Reain ، LAG = 10 ، Type = "Ljung-Box")

time series16

Box. Test (MyModel $ مانده ، LAG = 15 ، نوع = "Ljung-Box")

Time_Series-17

با نگاهی به مقادیر P پایین ، می توان گفت که مدل ما نسبتاً دقیق است و می توان نتیجه گرفت که از مدل Arima ، که پارامترهای (2 ، 1 ، 1) به اندازه کافی داده ها را متناسب می کنند.

 

بیش از ده ها ابزار و مهارت های علوم داده با برنامه PG در علوم داده ها بیاموزید و توسط دانشکده Purdue به MasterClasses دسترسی پیدا کنید. اکنون ثبت نام کنید و یک ستاره درخشان را به رزومه علوم داده خود اضافه کنید!

 

نتیجه

پس از خواندن این مقاله ، می فهمید که سریال های زمانی ، برنامه های مختلف آن و مؤلفه های مختلف آن چیست. سرانجام ، ما به دنبال ایجاد یک مدل پیش بینی سری زمانی با استفاده از مدل ARIMA در R برای پیش بینی فروش بلیط های هواپیمایی بودیم.

حرفه علوم داده خود را با ما شروع کنید!

برنامه Caltech Data Science Bootcamp برنامه کاوش

اگر سؤالی در رابطه با این مقاله در مورد "پیش بینی سری زمانی" دارید ، لطفاً در بخش نظرات این مقاله از ما سؤال کنید. تیم متخصصان ما به شما در حل و فصل نمایش داده های خود در سریعترین زمان کمک می کنند!

برنامه تحصیلات تکمیلی پست ما را در Bootcamp آنلاین علوم داده در شهرهای برتر پیدا کنید:

نام تاریخ محل
برنامه تحصیلات تکمیلی در علوم داده گروه از 27 آوریل 2023 ، دسته آخر هفته آغاز می شود شهر شما دیدن جزئیات
برنامه تحصیلات تکمیلی در علوم داده گروه از اول مه 2023 ، دسته آخر هفته آغاز می شود شهر شما دیدن جزئیات
برنامه تحصیلات تکمیلی در علوم داده گروه از 10 مه 2023 ، دسته آخر هفته آغاز می شود شهر شما دیدن جزئیات

درباره نویسنده

بیسوال

Avijeet یک تحلیلگر ارشد تحقیق در Simpleilea است. علاقه مند به تجزیه و تحلیل داده ها ، یادگیری ماشین و یادگیری عمیق ، Avijeet نیز به سیاست ، کریکت و فوتبال علاقه مند است.

بهترین استراتژی معاملات...
ما را در سایت بهترین استراتژی معاملات دنبال می کنید

برچسب : نویسنده : صدرا ذوالریاستین بازدید : 36 تاريخ : شنبه 11 شهريور 1402 ساعت: 18:12