Sunday 29 October 2017

Autoregressiv Vs Moving Average


Hva er stasjonær autoregressiv AR, flytte gjennomsnittlig MA og stasjonære blandede ARMA prosesser. Stasjonær autoregressiv AR prosess Stasjonære autoregressive AR prosesser har teoretiske autokorrelasjonsfunksjoner ACFer som forfall mot null, i stedet for å kutte til null. Autokorrelasjonskoeffisientene kan alternere i tegn ofte, eller viser et bølgelignende mønster, men i alle tilfeller svinger de av mot null. AR-prosessene med rekkefølgen p har teoretiske partielle autokorrelasjonsfunksjoner PACF som avkortes til null etter lag p Lagets lengde på den endelige PACF-spissen er lik AR rekkefølge av prosessen, p Flytte gjennomsnittlig MA prosess De teoretiske ACFene av MA-bevegelige gjennomsnittsprosesser med rekkefølge q kuttes av til null etter lag q, MA-ordren til prosessen Imidlertid decayer de teoretiske PACFene mot null Laglengden til den endelige ACF Spike tilsvarer MA-rekkefølgen av prosessen, q Stasjonær blandet ARMA-prosess Stasjonære blandede ARMA-prosesser viser en blanding av AR og MA karakteristikk cs Både den teoretiske ACF og PACF svinger av mot null. Copyright 2016 Minitab Inc Alle rettigheter reservert. Autoregressive Integrert Moving Average - ARIMA. DEFINITION av Autoregressive Integrated Moving Average - ARIMA. A statistisk analysemodell som bruker tidsseriedata for å forutsi fremtidige trender Det er en form for regresjonsanalyse som forsøker å forutsi fremtidige bevegelser langs den tilsynelatende tilfeldige spasertur tatt av aksjer og finansmarkedet ved å undersøke forskjellene mellom verdier i serien i stedet for å bruke de faktiske dataværdiene. Lags av de forskjellige seriene refereres til som autoregressive og lags innenfor prognostiserte data refereres til som bevegelige gjennomsnitt. BREAKING DOWN Autoregressive Integrated Moving Average - ARIMA. Denne modell typen refereres generelt til som ARIMA p, d, q, med heltallene som refererer til de autoregressive integrerte og bevegelige gjennomsnittsdelene av Datasettet, henholdsvis ARIMA-modellering, kan ta hensyn til trender, sesongmessige sykluser, feil og ikke-sta torsjonale aspekter av et datasett når man lager prognoser. Innføring i ARIMA-ikke-sasonlige modeller. ARIMA p, d, q prognoselikning ARIMA-modeller er i teorien den mest generelle klassen av modeller for å prognose en tidsserie som kan gjøres stasjonær av differensiering om nødvendig, kanskje i sammenheng med ikke-lineære transformasjoner som logging eller deflatering om nødvendig En tilfeldig variabel som er en tidsserie er stasjonær hvis dens statistiske egenskaper er konstant over tid En stasjonær serie har ingen trend, dens variasjoner rundt dens gjennomsnitt har en konstant amplitude og det vinkler på en konsistent måte, dvs. at kortsiktige tilfeldige tidsmønstre alltid ser like ut i statistisk forstand. Den sistnevnte tilstanden betyr at dens autokorrelasjoner korrelasjoner med sine egne tidligere avvik fra middelet forblir konstant over tid, eller tilsvarende, at dets maktspektrum forblir konstant over tid En tilfeldig variabel av denne formen kan sees som vanlig som en kombinasjon av signal og nois e, og signalet hvis det er tydelig, kan være et mønster av rask eller langsom, gjennomsnittlig reversering eller sinusformet svingning, eller rask veksling i tegn, og det kan også ha en sesongkomponent. En ARIMA-modell kan ses som et filter som forsøker å separere signalet fra støyen, og signalet blir deretter ekstrapolert inn i fremtiden for å oppnå prognoser. ARIMA-prognosekvasjonen for en stasjonær tidsserie er en lineær ie-regresjonstypekvasjon hvor prediktorene består av lag av den avhengige variabelen og eller lags av prognosefeilene som er. Predittet av Y er en konstant og eller en vektet sum av en eller flere nylige verdier av Y og eller en vektet sum av en eller flere nylige verdier av feilene. Hvis prediktorene bare består av forsinkede verdier av Y er det en ren autoregressiv selvregressert modell, som bare er et spesielt tilfelle av en regresjonsmodell, og som kunne være utstyrt med standard regresjonsprogramvare. For eksempel er en første-ordens autoregressiv AR 1-modell for Y en enkel regresjonsmodell der den uavhengige variabelen bare er Y forsinket med en periode LAG Y, 1 i Statgraphics eller YLAG1 i RegressIt Hvis noen av prediktorene er lags av feilene, er en ARIMA-modell ikke en lineær regresjonsmodell fordi det ikke er noen måten å spesifisere siste periode s feil som en uavhengig variabel feilene må beregnes fra tid til annen når modellen er montert på dataene Fra et teknisk synspunkt er problemet med å bruke forsinkede feil som prediktorer at modellen s Forutsigelser er ikke lineære funksjoner av koeffisientene, selv om de er lineære funksjoner av de forrige dataene. Koeffisientene i ARIMA-modeller som inkluderer forsinkede feil må estimeres ved ikke-lineære optimaliseringsmetoder bakkeklatring i stedet for bare å løse et system av ligninger. Akronymet ARIMA står for Auto-Regressive Integrated Moving Average Lags av den stasjonære serien i prognosen ligningen kalles autoregressive termer, lags av prognosen feilene kalles mov Gjennomsnittlige vilkår og en tidsserie som må differensieres til å bli stasjonær, sies å være en integrert versjon av en stasjonær serie Tilfeldige gange og tilfeldige trendmodeller, autoregressive modeller og eksponensielle utjevningsmodeller er alle spesielle tilfeller av ARIMA models. A nonseasonal ARIMA modell er klassifisert som en ARIMA p, d, q modell, hvor. p er antall autoregressive termer. d er antall ikke-soneforskjeller som trengs for stasjonar, og. q er antall forsinkede prognosefeil i prediksjonsligningen. Forutsigelsesligningen er konstruert som følger. Først, la y betegne den forskjellen på Y som betyr. Merk at den andre forskjellen på Y d2-tilfellet ikke er forskjellen fra 2 perioder siden. Det er først den første - forskjell-av-første forskjell som er den diskrete analogen til et andre derivat, det vil si den lokale akselerasjonen av serien i stedet for dens lokale trend. Med hensyn til y er den generelle prognosekvasjonen her. De bevegelige gjennomsnittsparametrene er e definert slik at deres tegn er negative i ligningen, etter konvensjonen som er innført av Box og Jenkins. Noen forfattere og programvare inkludert R programmeringsspråket definerer dem slik at de har pluss tegn i stedet Når de faktiske tallene er plugget inn i ligningen, er det ingen tvetydighet, men det er viktig å vite hvilken konvensjon programvaren din bruker når du leser utdata. Ofte er parameterne angitt der med AR 1, AR 2, og MA 1, MA 2 osv. For å identifisere riktig ARIMA-modell for Y du begynner med å bestemme rekkefølgen på differensieringen du trenger å stasjonærisere serien og fjerne bruttoegenskapene til sesongmessigheten, kanskje sammen med en variansstabiliserende transformasjon som logging eller deflating Hvis du stopper på dette punktet og forutser at differensierte serier er konstante , du har bare montert en tilfeldig tur eller tilfeldig trendmodell. Den stasjonære serien kan imidlertid fortsatt ha autokorrelerte feil, noe som tyder på at noen AR-termer p 1 og eller noen nummer MA termer q 1 er også nødvendig i prognosekvasjonen. Prosessen med å bestemme verdiene p, d og q som er best for en gitt tidsserie, vil bli diskutert i senere deler av notatene hvis linker er øverst på denne siden, men en forhåndsvisning av noen av de typer ikke-sasonlige ARIMA-modellene som ofte oppstår, er gitt nedenfor. ARIMA 1,0,0 førsteordens autoregressive modell hvis serien er stasjonær og autokorrelert, kanskje det kan Forutsigbar som et flertall av sin egen tidligere verdi, pluss en konstant Forutsigelsesligningen i dette tilfellet er. Som er Y regressert i seg selv forsinket med en periode Dette er en ARIMA 1,0,0 konstant modell Hvis gjennomsnittet av Y er null , så vil ikke det konstante begrepet bli inkludert. Hvis hellingskoeffisienten 1 er positiv og mindre enn 1 i størrelsesorden, må den være mindre enn 1 i størrelsesorden dersom Y er stasjonær, beskriver modellen gjennombruddspraksis der neste periodes verdi skal Forutsatt å være 1 ganger så langt unna den gjennomsnittlige som denne periodens verdi Hvis 1 er negativ, forutser den middelreferanseadferd med skifting av tegn, dvs. det forutsier også at Y vil være under gjennomsnittlig neste periode hvis den er over gjennomsnittet denne perioden. I en andre rekkefølge autoregressiv modell ARIMA 2,0,0, ville det være en Y t-2 termen til høyre også, og så videre. Avhengig av tegn og størrelser av koeffisientene kunne en ARIMA 2,0,0 modell beskrive et system hvis Gjennomsnittlig reversering foregår i sinusformet oscillerende mote, som bevegelse av en masse på en fjær som er utsatt for tilfeldige sjokker. ARMA 0,1,0 tilfeldig spasertur Hvis serien Y ikke er stasjonær, er den enkleste mulige modellen for en random walk-modell, som kan betraktes som et begrensende tilfelle av en AR 1-modell hvor den autoregressive koeffisienten er lik 1, dvs. en serie med uendelig sakte gjennomsnittlig reversering. Forutsigelsesligningen for denne modellen kan skrives som Den gjennomsnittlige period-til-periode-endringen, dvs. den langsiktige driften i Y Denne modellen kan monteres som en ikke-avskjæringsregresjonsmodell der den første forskjellen i Y er den avhengige variabelen. Siden den bare inneholder en ikke-sesongforskjell og en konstant periode, er den klassifisert som en ARIMA 0,1,0-modell med konstant Den random-walk-uten-drift-modellen ville være en ARIMA 0,1,0-modell uten konstant. ARIMA 1,1,0 differensierte førsteordens autoregressive modell Hvis feilene i en tilfeldig turmodell er autokorrelert, kan problemet kanskje fastgjøres ved å legge til et lag av den avhengige variabelen til prediksjonsligningen - dvs. ved å regressere den første forskjellen på Y i seg selv forsinket med en periode. Dette ville gi følgende prediksjonsligning. Det kan omarrangeres til. Dette er en førsteordre autoregressiv modell med en rekkefølge av ikke-sekundær differensiering og en konstant periode - det vil si en ARIMA 1,1,0 modell. ARIMA 0,1,1 uten konstant enkel eksponensiell utjevning En annen strategi for å korrigere autokorrelerte feil i en tilfeldig gangmodell er foreslått av Simp le eksponentiell utjevningsmodell Husk at for noen ikke-stationære tidsserier, for eksempel de som har støyende svingninger rundt et sakte varierende middel, utfører ikke den tilfeldige turmodellen så vel som et glidende gjennomsnitt av tidligere verdier. Med andre ord, i stedet for å ta det siste observasjon som prognosen for neste observasjon, er det bedre å bruke et gjennomsnitt av de siste observasjonene for å filtrere ut støy og mer nøyaktig anslå det lokale gjennomsnittet. Den enkle eksponensielle utjevningsmodellen bruker et eksponentielt vektet glidende gjennomsnitt av tidligere verdier til oppnå denne effekten Prediksjonsligningen for den enkle eksponensielle utjevningsmodellen kan skrives i en rekke matematisk ekvivalente former, hvorav en er den såkalte feilkorreksjonsformen, der den forrige prognosen er justert i retning av feilen som den gjorde. Fordi e t-1 Y t-1 - t-1 per definisjon kan dette omskrives som det er en ARIMA 0,1,1-uten konstant prognosekvasjon med 1 1 - T Han betyr at du kan passe en enkel eksponensiell utjevning ved å spesifisere den som en ARIMA 0,1,1 modell uten konstant, og den estimerte MA 1-koeffisienten tilsvarer 1-minus-alfa i SES-formelen. Husk at i SES-modellen gjennomsnittlig alder av dataene i de 1-årige prognosene er 1, noe som betyr at de vil ha tilbøyelighet til å ligge bak trender eller vendepunkter med ca. 1 perioder. Det følger at gjennomsnittsalderen for dataene i de 1-årige prognosene for en ARIMA 0,1,1-uten-konstant modell er 1 1 - 1 For eksempel hvis 1 0 8 er gjennomsnittsalderen 5 Når 1 nærmer seg 1, blir ARIMA 0,1,1-uten-konstant modell en a veldig langsiktig glidende gjennomsnitt, og når 1 nærmer seg 0 blir det en tilfeldig tur uten drift. Hva er den beste måten å korrigere for autokorrelasjon, legge til AR-vilkår eller legge til MA-vilkår I de to foregående modellene diskutert ovenfor, Problemet med autokorrelerte feil i en tilfeldig gangmodell ble fikset på to forskjellige måter ved å legge til en forsinket verdi av den forskjellige serien til ligningen eller legge til en forsinket verdi av prognosen feil Hvilken tilnærming er best En regel for tommel for denne situasjonen, som vil bli nærmere omtalt senere, er at positiv autokorrelasjon vanligvis behandles best ved å legge til et AR-uttrykk til Modell og negativ autokorrelasjon behandles vanligvis best ved å legge til en MA-term. I forretnings - og økonomiske tidsserier oppstår negativ autokorrelasjon ofte som en artefakt av differensiering. Generelt reduserer differensierende positiv autokorrelasjon og kan til og med føre til en bytte fra positiv til negativ autokorrelasjon. ARIMA 0,1,1 modell, der differensiering er ledsaget av en MA-term, brukes hyppigere enn en ARIMA 1,1,0 modell. ARIMA 0,1,1 med konstant enkel eksponensiell utjevning med vekst Ved å implementere SES modellen Som en ARIMA-modell får du faktisk en viss fleksibilitet. Først og fremst kan den estimerte MA 1-koeffisienten være negativ, dette tilsvarer en utjevningsfaktor større enn 1 i en SES-modell, noe som er usuall y ikke tillatt ved SES-modellprosedyren. For det andre har du muligheten til å inkludere en konstant periode i ARIMA-modellen hvis du ønsker det, for å estimere en gjennomsnittlig ikke-null trend. ARIMA 0,1,1-modellen med konstant har Forutsigelsesligningen. Enhetsprinsippene fra denne modellen er kvalitativt lik SES-modellen, bortsett fra at bane av de langsiktige prognosene typisk er en skrånende linje hvis skråning er lik mu i stedet for en horisontal linje. ARIMA 0,2,1 eller 0,2,2 uten konstant lineær eksponensiell utjevning Lineære eksponensielle utjevningsmodeller er ARIMA-modeller som bruker to ikke-sekundære forskjeller i sammenheng med MA-termer. Den andre forskjellen i en serie Y er ikke bare forskjellen mellom Y og i seg selv forsinket av to perioder, men det er den første forskjellen i den første forskjellen - forandringen i endringen av Y ved periode t Således er den andre forskjellen på Y ved periode t lik Y t - Y t-1 - Y t-1 - Y t-2 Y t - 2Y t-1 Y t-2 A andre forskjell på en diskret funksjon er analog med et andre derivat av en kontinuerlig funksjon som måler akselerasjonen eller krumningen i funksjonen på et gitt tidspunkt. ARIMA 0,2,2-modellen uten konstant forutser at den andre forskjellen i serien tilsvarer en lineær funksjon av de to siste prognosefeilene. som kan omarrangeres som: hvor 1 og 2 er MA 1 og MA 2-koeffisientene. Dette er en generell lineær eksponensiell utjevningsmodell som i det vesentlige er den samme som Holt s-modellen, og Brown s-modellen er et spesielt tilfelle Det bruker eksponentielt vektede glidende gjennomsnitt for å anslå både et lokalt nivå og en lokal trend i serien. De langsiktige prognosene fra denne modellen konvergerer til en rett linje hvis skråning avhenger av den gjennomsnittlige trenden observert mot slutten av serien. ARIMA 1,1,2 uten konstant fuktet trend lineær eksponensiell utjevning. Denne modellen er illustrert i de tilhørende lysbildene på ARIMA-modeller. Det ekstrapolerer den lokale trenden i slutten av serien, men flater det ut på lengre prognoshorisont for å introdusere konservatisme, en praksis som har empirisk støtte. Se artikkelen om Why the Damped Trend fungerer av Gardner og McKenzie og Golden Rule-artikkelen av Armstrong et al for detaljer. Det er generelt tilrådelig å holde fast til modeller der minst en av p og q ikke er større enn 1, dvs. ikke prøv å passe på en modell som ARIMA 2,1,2, da dette sannsynligvis vil føre til overfitting og fellesfaktorproblemer som diskuteres mer detaljert i notatene om den matematiske strukturen til ARIMA-modellene. Implementering av ARIMA-modellers implementeringsmodeller som de som er beskrevet ovenfor, er enkle å implementere på et regneark. Prediksjonsligningen er bare en lineær ligning som refererer til tidligere verdier av originale tidsserier og tidligere verdier av feilene Dermed kan du sette opp et ARIMA prognose regneark ved å lagre dataene i kolonne A, prognoseformelen i kolonne B, og feildataene minus prognosene i kolonne C Fremskrivningsformelen i en typisk celle i kolonne B ville ganske enkelt være et lineært uttrykk som refererer til verdier i forrige rader med kolonne A og C, multiplisert med de relevante AR - eller MA-koeffisientene lagret i celler andre steder på regnearket.

No comments:

Post a Comment