Wednesday, October 5, 2016

Eksponensiële Geweegde Bewegende Gemiddelde Half Life

Bereken Historiese Volatiliteit Gebruik EWMA Volatiliteit is die mees algemeen gebruik word mate van risiko. Wisselvalligheid in hierdie sin kan óf historiese wisselvalligheid (een waargeneem uit die verlede data), of dit kan geïmpliseer wisselvalligheid Die historiese wisselvalligheid kan bereken word op drie maniere, naamlik (onderhou van markpryse van die finansiële instrumente.): Eenvoudige wisselvalligheid, eksponensieel Geweegde Moving Gemiddeld (EWMA) GARCH Een van die groot voordele van EWMA is dat dit gee meer gewig aan die onlangse opbrengste, terwyl die berekening van die opbrengs. In hierdie artikel, sal ons kyk na hoe wisselvalligheid word bereken deur gebruik te maak EWMA. So, laat ons begin: Stap 1: Bereken log opbrengste van die prys reeks As ons kyk na die aandeelpryse, kan ons die daaglikse lognormale opbrengste bereken met behulp van die formule ln (P i / P i -1), waar P verteenwoordig elke dae eindvoorraad prys. Ons moet die natuurlike log te gebruik, want ons wil die opbrengste voortdurend te vererger. Ons sal nou daagliks opbrengste vir die hele prys reeks. Stap 2: vierkant die opbrengs Die volgende stap is die neem van die vierkante van lang opbrengste. Dit is eintlik die berekening van eenvoudige variasie of wisselvalligheid wat deur die volgende formule te gebruik: Hier, jy verteenwoordig die opbrengs, en m verteenwoordig die aantal dae. Stap 3: Ken gewigte Ken gewigte sodanig dat onlangse opbrengste hoër gewig en ouer opbrengste het minder gewig. Vir hierdie het ons 'n faktor genoem Lambda (), wat 'n glad konstante of die aanhoudende parameter. Die gewigte word toegeken as (1-) 0. Lambda moet wees minder as 1. Risiko metrieke gebruik lambda 94. Die eerste gewig sal wees (1-0,94) 6, die tweede gewig sal wees 60,94 5,64 en so aan. In EWMA al die gewigte op te som tot 1, maar hulle dalende met 'n konstante verhouding van. Stap 4: Vermenigvuldig Opbrengste-kwadraat met die gewigte Stap 5: Neem die opsomming van R 2 w Dit is die finale EWMA variansie. Die wisselvalligheid sal die vierkantswortel van variansie wees. Die volgende kiekie toon die berekeninge. Die voorbeeld hierbo dat ons gesien het, is die benadering beskryf deur RiskMetrics. Die algemene vorm van EWMA kan voorgestel word as die volgende rekursiewe formule: 1 CommentExploring die eksponensieel Geweegde Moving Gemiddelde Volatiliteit is die mees algemene maatstaf van risiko, maar dit kom in verskeie geure. In 'n vorige artikel het ons gewys hoe om eenvoudige historiese wisselvalligheid te bereken. (Om hierdie artikel te lees, sien Die gebruik van Volatiliteit Om toekomstige risiko te meet.) Ons gebruik Googles werklike aandele prys data om daaglikse wisselvalligheid gebaseer op 30 dae van voorraad data bereken. In hierdie artikel, sal ons verbeter op eenvoudige wisselvalligheid en bespreek die eksponensieel geweeg bewegende gemiddelde (EWMA). Historiese Vs. Geïmpliseer Volatiliteit Eerste, laat sit hierdie metrieke in 'n bietjie van perspektief. Daar is twee breë benaderings: historiese en geïmpliseer (of implisiete) wisselvalligheid. Die historiese benadering veronderstel dat verlede is proloog ons geskiedenis te meet in die hoop dat dit voorspellende. Geïmpliseerde wisselvalligheid, aan die ander kant, ignoreer die geskiedenis wat dit oplos vir die wisselvalligheid geïmpliseer deur markpryse. Hulle hoop dat die mark weet die beste en dat die markprys bevat, selfs al is implisiet, 'n konsensus skatting van wisselvalligheid. (Vir verwante leesstof, sien die gebruike en beperkinge van Volatiliteit.) As ons fokus op net die drie historiese benaderings (op die bogenoemde links), hulle het twee stappe in gemeen: Bereken die reeks periodieke opgawes Pas 'n gewig skema Eerstens, ons bereken die periodieke terugkeer. Dis gewoonlik 'n reeks van die daaglikse opgawes waar elke terugkeer uitgedruk in voortdurend saamgestel terme. Vir elke dag, neem ons die natuurlike log van die verhouding van aandele pryse (dit wil sê die prys vandag gedeel deur die prys gister, en so aan). Dit veroorsaak 'n reeks van die daaglikse opbrengs van u ek u i-m. afhangende van hoeveel dae (m dae) ons meet. Dit kry ons by die tweede stap: Dit is hier waar die drie benaderings verskil. In die vorige artikel (Die gebruik van Volatiliteit Om toekomstige risiko Gauge), ons het getoon dat onder 'n paar aanvaarbare vereenvoudigings, die eenvoudige afwyking is die gemiddeld van die kwadraat opbrengste: Let daarop dat hierdie som elk van die periodieke opgawes, verdeel dan wat totaal deur die aantal dae of waarnemings (m). So, dit is regtig net 'n gemiddeld van die kwadraat periodieke opgawes. Anders gestel, is elke vierkant terugkeer gegee 'n gelyke gewig. So as alfa (a) is 'n gewig faktor (spesifiek, 'n 1 / m), dan 'n eenvoudige variansie lyk iets soos hierdie: Die EWMA Verbeter op Eenvoudige Variansie Die swakheid van hierdie benadering is dat alle opgawes verdien dieselfde gewig. Yesterdays (baie onlangse) terugkeer het geen invloed meer op die variansie as verlede maande terugkeer. Hierdie probleem is opgelos deur die gebruik van die eksponensieel geweeg bewegende gemiddelde (EWMA), waarin meer onlangse opbrengste het 'n groter gewig op die variansie. Die eksponensieel geweeg bewegende gemiddelde (EWMA) stel lambda. wat die smoothing parameter genoem. Lambda moet minstens een wees. Onder daardie toestand, in plaas van gelyke gewigte, elke vierkant terugkeer is geweeg deur 'n vermenigvuldiger soos volg: Byvoorbeeld, RiskMetrics TM, 'n finansiële risikobestuur maatskappy, is geneig om 'n lambda van 0,94, of 94. gebruik in hierdie geval, die eerste ( mees onlangse) kwadraat periodieke terugkeer is geweeg deur (1-0,94) (. 94) 0 6. die volgende kwadraat terugkeer is bloot 'n lambda-veelvoud van die vorige gewig in hierdie geval 6 vermenigvuldig met 94 5.64. En die derde voor dae gewig gelyk (1-0,94) (0.94) 2 5,30. Dis die betekenis van eksponensiële in EWMA: elke gewig is 'n konstante vermenigvuldiger (dit wil sê lambda, wat moet wees minder as een) van die dae gewig voor. Dit sorg vir 'n afwyking wat geweeg of voorkeur vir meer onlangse data. (Vir meer inligting, kyk na die Excel Werkkaart vir Googles Volatiliteit.) Die verskil tussen net wisselvalligheid en EWMA vir Google word hieronder getoon. Eenvoudige wisselvalligheid effektief weeg elke periodieke terugkeer deur 0,196 soos uiteengesit in kolom O (ons het twee jaar van die daaglikse aandeleprys data. Dit is 509 daaglikse opgawes en 1/509 0,196). Maar let op dat Kolom P ken 'n gewig van 6, dan 5.64, dan 5.3 en so aan. Dis die enigste verskil tussen eenvoudige variansie en EWMA. Onthou: Nadat ons die hele reeks (in kolom Q) het ons die variansie, wat is die kwadraat van die standaardafwyking som. As ons wil hê wisselvalligheid, moet ons onthou om die vierkantswortel van daardie afwyking te neem. Wat is die verskil in die daaglikse wisselvalligheid tussen die variansie en EWMA in Googles geval beduidende: Die eenvoudige variansie het ons 'n daaglikse wisselvalligheid van 2,4, maar die EWMA het 'n daaglikse wisselvalligheid van slegs 1.4 (sien die sigblad vir besonderhede). Blykbaar, Googles wisselvalligheid bedaar meer onlangs dus kan 'n eenvoudige variansie kunsmatig hoog wees. Vandag se afwyking is 'n funksie van Pior Dae Variansie Youll kennisgewing wat ons nodig het om 'n lang reeks van eksponensieel afneem gewigte bereken. Ons sal nie die wiskunde doen hier, maar een van die beste eienskappe van die EWMA is dat die hele reeks gerieflik verminder tot 'n rekursiewe formule: Rekursiewe beteken dat vandag se stryd verwysings (dit wil sê 'n funksie van die vorige dae variansie). Jy kan hierdie formule in die sigblad ook, en dit lei tot die presies dieselfde resultaat as die skuldbewys berekening Dit sê: Vandag se variansie (onder EWMA) gelyk yesterdays variansie (geweeg volgens lambda) plus yesterdays kwadraat terugkeer (geweeg deur een minus lambda). Let op hoe ons net bymekaar te tel twee terme: yesterdays geweegde variansie en yesterdays geweeg, vierkantig terugkeer. Net so is, lambda is ons glad parameter. 'N Hoër lambda (bv soos RiskMetrics 94) dui stadiger verval in die reeks - in relatiewe terme, gaan ons meer datapunte in die reeks en hulle gaan stadiger af te val. Aan die ander kant, as ons die lambda verminder, dui ons hoër verval: die gewigte val vinniger af en, as 'n direkte gevolg van die snelle verval, is minder datapunte gebruik. (In die sigblad, lambda is 'n inset, sodat jy kan eksperimenteer met sy sensitiwiteit). Opsomming Volatiliteit is die oombliklike standaardafwyking van 'n voorraad en die mees algemene risiko metrieke. Dit is ook die vierkantswortel van variansie. Ons kan variansie histories of implisiet (geïmpliseer wisselvalligheid) te meet. Wanneer histories meet, die maklikste metode is eenvoudig variansie. Maar die swakheid met 'n eenvoudige afwyking is alle opgawes kry dieselfde gewig. So staan ​​ons voor 'n klassieke kompromis: ons wil altyd meer inligting, maar hoe meer data het ons die meer ons berekening verwater deur verre (minder relevant) data. Die eksponensieel geweeg bewegende gemiddelde (EWMA) verbeter op eenvoudige variansie deur die toeken van gewigte aan die periodieke opgawes. Deur dit te doen, kan ons albei gebruik 'n groot monster grootte, maar ook 'n groter gewig te gee aan meer onlangse opbrengste. (Om 'n fliek handleiding te sien oor hierdie onderwerp, besoek die Bionic skilpad.) Eksponensiële bewegende gemiddelde - EMO laai die speler. Afbreek van Eksponensiële bewegende gemiddelde - EMO Die 12- en 26-dag EMA is die gewildste kort termyn gemiddeldes, en hulle word gebruik om aanwysers soos die bewegende gemiddelde konvergensie divergensie (MACD) en die persentasie prys ossillator (PPO) te skep. In die algemeen, is die 50- en 200-dag EMA as seine van 'n lang termyn tendense. Handelaars wat tegniese ontleding diens vind bewegende gemiddeldes baie nuttig en insiggewend wanneer dit korrek toegepas word, maar skep chaos wanneer onbehoorlik gebruik of verkeerd verstaan. Al die bewegende gemiddeldes wat algemeen gebruik word in tegniese ontleding is, volgens hulle aard, sloerende aanwysers. Gevolglik moet die afleidings wat op die toepassing van 'n bewegende gemiddelde op 'n bepaalde mark grafiek wees om 'n mark skuif bevestig of om sy krag te toon. Heel dikwels is, teen die tyd dat 'n bewegende gemiddelde aanwyser lyn het 'n verandering aan 'n beduidende stap in die mark weerspieël gemaak het die optimale punt van toegang tot die mark reeds geslaag. 'N EMO nie dien om hierdie dilemma te verlig tot 'n mate. Omdat die EMO berekening plaas meer gewig op die jongste data, dit drukkies die prys aksie 'n bietjie stywer en reageer dus vinniger. Dit is wenslik wanneer 'n EMO word gebruik om 'n handels inskrywing sein herlei. Interpretasie van die EMO Soos alle bewegende gemiddelde aanwysers, hulle is baie meer geskik vir trending markte. Wanneer die mark is in 'n sterk en volgehoue ​​uptrend. die EMO aanwyser lyn sal ook 'n uptrend en andersom vir 'n down tendens toon. A waaksaam handelaar sal nie net aandag te gee aan die rigting van die EMO lyn, maar ook die verhouding van die tempo van verandering van die een bar na die volgende. Byvoorbeeld, as die prys aksie van 'n sterk uptrend begin plat en reverse, van die EMAS tempo van verandering van die een bar na die volgende sal begin om te verminder tot tyd en wyl die aanwyser lyn plat en die tempo van verandering is nul. As gevolg van die sloerende uitwerking, deur hierdie punt, of selfs 'n paar bars voor, die prys aksie moet reeds omgekeer. Dit volg dus dat die waarneming van 'n konsekwente verminderde in die tempo van verandering van die EMO kon self gebruik word as 'n aanduiding dat die dilemma wat veroorsaak word deur die sloerende uitwerking van bewegende gemiddeldes verder kon teen te werk. Algemene gebruike van die EMO EMA word algemeen gebruik word in samewerking met ander aanwysers aan beduidende mark beweeg bevestig en om hul geldigheid te meet. Vir handelaars wat intraday en vinnig bewegende markte handel te dryf, die EMO is meer van toepassing. Dikwels handelaars gebruik EMA om 'n handels vooroordeel bepaal. Byvoorbeeld, as 'n EMO op 'n daaglikse grafiek toon 'n sterk opwaartse neiging, kan 'n intraday handelaars strategie wees om net handel van die lang kant op 'n intraday chart. Exponential verval modelle Alle modelle is verkeerd, 'n paar modelle is meer verkeerd as ander. Die straatlig model Eksponensiële verval modelle is redelik algemeen. Maar hoekom Een rede 'n model kan gewild wees, is dat dit 'n redelike benadering tot die meganisme wat die data genereer bevat. Dit is ernstig onwaarskynlik in hierdie geval. Wanneer dit donker en you8217ve verloor jou sleutels, waar jy kyk onder die straatlig. Jy kyk daar nie, want jy dink that8217s die mees waarskynlike plek vir die sleutels te wees wat jy daar sien, want dit is die enigste plek you8217ll hulle te vind as hulle daar. Lank gelede en nie so ver weg, ek nodig het om die afwyking matriks van die opbrengs van 'n paar duisend aandele te bereken. Die masjien wat ek moes kon drie afskrifte van die matriks maar nie veel meer te hou. 'N eksponensiële verval model gewerk wonderlik in hierdie situasie. Die data wat ek nodig het is: die vorige day8217s variansie matriks Die vektor van yesterday8217s terug die bedrywighede was: doen 'n buitenste produk met die vektor van opgawes doen 'n geweegde gemiddelde van daardie buitenste produk en die vorige variansie matriks Compact en maklik. Daar is beter maniere, it8217s net dat die tyd was verkeerd. Die 8220right8221 manier sou wees om 'n lang geskiedenis van die opbrengs van die aandele gebruik en pas 'n realistiese model. Selfs al daardie rekenaar die geskiedenis van opbrengste (waarskynlik nie) kon gehou, is dit onwaarskynlik dat dit ruimte om te werk met dit om vorendag te kom met die antwoord gehad het. Plus daar is baie van die data komplikasies sou hê om deur te werk met 'n meer komplekse model. 8220The skadu en lig van models8221 gebruik 'n ander metafoor van die lig met betrekking tot modelle. As ons net 'n eksponensiële verval model kan gebruik, is die meting van onkunde gaan 'n bietjie dodgy wees. Ons won8217t weet hoeveel van die onkunde is te danke aan die model en hoeveel is inherent. Eksponensiële gladstryking Ons kan eksponensiële gladstryking van die daaglikse opbrengs van die SampP 500 as 'n voorbeeld te doen. Figuur 1 toon die onbestreken opbrengste. Figuur 2 toon die eksponensiële glad met lambda gelyk aan 0,97 8212 wat 97 gewig op die vorige glad en 3 gewig op die huidige punt. Figuur 3 toon die eksponensiële glad met lambda gelyk aan 1. Nota. Dikwels wat genoem lambda hier is een minus lambda elders. Let daarop dat die begin van die gladde in figure 2 en 3 is 'n bietjie vreemd. Die eerste punt van die gladde is die werklike eerste datapoint, wat gebeur met 'n bietjie meer as 1. Dat probleem opgelos kan word deur die verlening van 'n brand-in periode 8212 weglating van die eerste 20, 50, 100 punte in die gladde. Kettings van gewigte Die eenvoudige proses van altyd besig met 'n geweegde som van die vorige glad en die nuwe data beteken dat die gladde is eintlik 'n geweegde som van al die vorige data met gewigte wat eksponensieel afneem. Figuur 4 toon die gewig wat die gevolg is van twee keuses van lambda. Figuur 4: Gewigte van uitgesak waarnemings vir lambda gelyk aan 0.97 (blou) en 0.99 (goud). Die gewigte drop redelik vinnig af. As die proses stabiel was, sou ons wil die waarnemings ewe word geweeg. Dit is maklik om dit te doen kompak sowel let op die som van die statistiek wat jy wil let op die aantal waarnemings die nuwe statistiek toe te voeg tot die som en deel dit deur die aantal waarnemings Wat ons is geneig om te wil regtig is 'n paar kompromie tussen hierdie uiterstes . Halfleeftyd Die halfleeftyd van 'n eksponensiële verval word dikwels gegee. Dit is die aantal lags waarteen die gewig val tot die helfte van die gewig vir die huidige waarneming. Figuur 5 toon die half-lewe vir ons twee voorbeeld lambdas. Oor die algemeen die halfleeftyd word asof dit 'n intuïtiewe waarde. Wel, klink koel 8212 I8217m nie seker of dit vertel my veel van enigiets. Opsomming Wanneer 'n eksponensiële verval model gebruik word, moet jy vra: Is daar 'n goeie rede om eksponensiële verval gebruik, of is dit net gebruik omdat dit nog altyd gedoen soos wat Vooruitgang in hardeware beteken dat sommige van wat kan slegs geskoei met eksponensiële verval in die verlede kan nou beter wees geskoei. Dit beteken ook dat dit wat nie gedoen kan word op alle voor kan nou gedoen word met eksponensiële verval. Epiloog Hy vind 'n gerieflike straat lig, stappe uit die skaduwee Sê iets soos, 8220You en my baba, hoe oor it8221 van 8220Romeo en Juliet8221 deur Mark Knopfler Bylae R R is, natuurlik, 'n wonderlike plek om modellering 8212 doen eksponensiële en ander. naïef eksponensiële gladstryking 'n naïewe implementering van eksponensiële gladstryking is: Dit is naïef in ten minste twee sinne. Dit maak die herhaling uitdruklik. Vir hierdie eenvoudige geval, daar is 'n alternatief. Maar in meer komplekse situasies dit nodig mag wees om 'n lus te gebruik. Die funksie is ook naïef in die veronderstelling dat die vektor te stryk het ten minste twee elemente. Hierdie soort van probleem is 'n familielid van Circle 8.1.60 in die R Inferno. beter eksponensiële gladstryking Eksponensiële smoothing kan meer doeltreffend deur die druk van die herhaling af in 'n saamgestel taal gedoen word: Dit is nog steeds 'n paar naïwiteit deurdat dit doesn8217t seker te maak dat lambda is van lengte een. Sien ook die funksie HoltWinters in die statistieke pakket, en Ets in die vooruitsig pakket. gewig plotte 'n vereenvoudigde weergawe van 'n gedeelte van figuur 5 is: tyd plot Die erwe met verloop van tyd is vervaardig met pp. timeplot. Moving gemiddelde en eksponensiële gladstryking modelle As 'n eerste stap in die beweging van buite gemiddelde modelle, ewekansige loop modelle, en lineêre tendens modelle, nonseasonal patrone en tendense kan geëkstrapoleer deur 'n bewegende-gemiddelde of glad model. Die basiese aanname agter gemiddelde en glad modelle is dat die tyd reeks is plaaslik stilstaande met 'n stadig wisselende gemiddelde. Vandaar, neem ons 'n bewegende (plaaslike) gemiddelde om die huidige waarde van die gemiddelde skat en dan gebruik dit as die voorspelling vir die nabye toekoms. Dit kan beskou word as 'n kompromie tussen die gemiddelde model en die ewekansige-stap-sonder-drif-model. Dieselfde strategie gebruik kan word om te skat en ekstrapoleer 'n plaaslike tendens. 'N bewegende gemiddelde is dikwels 'n quotsmoothedquot weergawe van die oorspronklike reeks, want kort termyn gemiddelde het die effek van gladstryking uit die knoppe in die oorspronklike reeks. Deur die aanpassing van die mate van gladstryking (die breedte van die bewegende gemiddelde), kan ons hoop om 'n soort van 'n optimale balans tussen die prestasie van die gemiddelde en die stogastiese wandeling modelle slaan. Die eenvoudigste soort gemiddelde model is die. Eenvoudige (ewe-geweeg) Moving Average: Die voorspelling vir die waarde van Y op tyd T1 wat gemaak word op tydstip t is gelyk aan die eenvoudige gemiddelde van die mees onlangse m waarnemings: (hier en elders sal ek die simbool 8220Y-hat8221 gebruik om op te staan vir 'n voorspelling van die tyd reeks Y gemaak op die vroegste moontlike voor datum deur 'n gegewe model.) Hierdie gemiddelde is gesentreer op tydperk t (M1) / 2, wat impliseer dat die skatting van die plaaslike gemiddelde sal neig om agter die werklike waarde van die plaaslike gemiddelde met sowat (M1) / 2 periodes. So, sê ons die gemiddelde ouderdom van die data in die eenvoudige bewegende gemiddelde is (M1) / 2 met betrekking tot die tydperk waarvoor die voorspelling is bereken: dit is die hoeveelheid tyd waarop voorspellings sal neig om agter draaipunte in die data. Byvoorbeeld, as jy gemiddeld die afgelope 5 waardes, sal die voorspellings wees oor 3 periodes laat in reaksie op draaipunte. Let daarop dat indien M1, die eenvoudige bewegende gemiddelde (SMA) model is soortgelyk aan die ewekansige loop model (sonder groei). As m is baie groot (vergelykbaar met die lengte van die skatting tydperk), die SMA model is gelykstaande aan die gemiddelde model. Soos met enige parameter van 'n voorspelling model, is dit gebruiklik om die waarde van k te pas ten einde die beste quotfitquot om die data, dit wil sê die kleinste voorspelling foute gemiddeld behaal. Hier is 'n voorbeeld van 'n reeks wat blykbaar ewekansige skommelinge toon om 'n stadig-wisselende gemiddelde. In die eerste plek kan probeer om dit aan te pas met 'n ewekansige loop model, wat gelykstaande is aan 'n eenvoudige bewegende gemiddelde van 1 kwartaal: Die ewekansige loop model reageer baie vinnig om veranderinge in die reeks, maar sodoende dit tel baie van die quotnoisequot in die data (die ewekansige skommelinge) asook die quotsignalquot (die plaaslike gemiddelde). As ons eerder probeer 'n eenvoudige bewegende gemiddelde van 5 terme, kry ons 'n gladder lyk stel voorspellings: Die 5 termyn eenvoudige bewegende gemiddelde opbrengste aansienlik kleiner foute as die ewekansige loop model in hierdie geval. Die gemiddelde ouderdom van die data in hierdie voorspelling is 3 ((51) / 2), sodat dit is geneig om agter draaipunte met sowat drie periodes. (Byvoorbeeld, blyk 'n afswaai het plaasgevind by tydperk 21, maar die voorspellings nie omdraai tot verskeie tydperke later.) Let daarop dat die langtermyn-voorspellings van die SMA model is 'n horisontale reguit lyn, net soos in die ewekansige loop model. So, die SMA model veronderstel dat daar geen neiging in die data. Maar, terwyl die voorspellings van die ewekansige loop model is eenvoudig gelyk aan die laaste waargenome waarde, die voorspellings van die SMA model is gelykstaande aan 'n geweegde gemiddelde van die afgelope waardes. Die vertroue perke bereken deur Stat Graphics vir die langtermyn-voorspellings van die eenvoudige bewegende gemiddelde nie groter as die vooruitskatting horison styg kry. Dit is natuurlik nie korrek Ongelukkig is daar geen onderliggende statistiese teorie wat ons vertel hoe die vertrouensintervalle behoort te brei vir hierdie model. Dit is egter nie te moeilik om empiriese ramings van die vertroue perke vir die langer-horison voorspellings te bereken. Byvoorbeeld, kan jy die opstel van 'n sigblad waarop die SMA model sal gebruik word om 2 stappe vooruit, 3 stappe vooruit, ens binne die historiese data monster voorspel. Jy kan dan bereken die monster standaardafwykings van die foute op elke voorspelling horison, en dan bou vertrouensintervalle vir langer termyn voorspellings deur optelling en aftrekking veelvoude van die toepaslike standaard afwyking. As ons probeer om 'n 9-termyn eenvoudige bewegende gemiddelde, kry ons selfs gladder voorspellings en meer van 'n sloerende uitwerking: Die gemiddelde ouderdom is nou 5 periodes ((91) / 2). As ons 'n 19-termyn bewegende gemiddelde te neem, die gemiddelde ouderdom toeneem tot 10: Let daarop dat, inderdaad, is die voorspellings nou agter draaipunte met sowat 10 periodes. Watter bedrag van smoothing is die beste vir hierdie reeks Hier is 'n tabel wat hulle dwaling statistieke vergelyk, ook met 'n 3-gemiddelde: Model C, die 5-termyn bewegende gemiddelde, lewer die laagste waarde van RMSE deur 'n klein marge oor die 3 - term en 9 termyn gemiddeldes, en hul ander statistieke is byna identies. So, onder modelle met 'n baie soortgelyke fout statistieke, kan ons kies of ons 'n bietjie meer responsiewe ingesteldheid of 'n bietjie meer gladheid in die voorspellings sou verkies. (Terug na bo.) Browns Eenvoudige Eksponensiële Smoothing (eksponensieel geweeg bewegende gemiddelde) Die eenvoudige bewegende gemiddelde model hierbo beskryf het die ongewenste eienskap dat dit behandel die laaste k Waarnemings ewe en heeltemal ignoreer al voorafgaande waarnemings. Intuïtief, moet afgelope data verdiskonteer in 'n meer geleidelike mode - byvoorbeeld, die mees onlangse waarneming moet 'n bietjie meer gewig kry as 2 mees onlangse, en die 2de mees onlangse moet 'n bietjie meer gewig as die 3 mees onlangse kry, en so aan. Die eenvoudige eksponensiële gladstryking (SES) model accomplishes hierdie. Laat 945 dui n quotsmoothing constantquot ( 'n getal tussen 0 en 1). Een manier om die model te skryf is om 'n reeks L dat die huidige vlak (dit wil sê die plaaslike gemiddelde waarde) van die reeks verteenwoordig as geraamde van data tot op hede te definieer. Die waarde van L op tydstip t is rekursief bereken uit sy eie vorige waarde soos volg: Dus, die huidige stryk waarde is 'n interpolasie tussen die vorige stryk waarde en die huidige waarneming, waar 945 kontroles die nabyheid van die geïnterpoleerde waarde tot die mees onlangse waarneming. Die voorspelling vir die volgende tydperk is eenvoudig die huidige stryk waarde: anders gestel ons kan die volgende voorspelling direk in terme van vorige voorspellings en vorige waarnemings uit te druk, in enige van die volgende ekwivalent weergawes. In die eerste weergawe, die voorspelling is 'n interpolasie tussen vorige skatting en vorige waarneming: In die tweede weergawe, is die volgende voorspelling verkry deur die aanpassing van die vorige skatting in die rigting van die vorige fout deur 'n breukdeel bedrag 945. is die fout gemaak by tyd t. In die derde weergawe, die voorspelling is 'n eksponensieel geweeg (dit wil sê afslag) bewegende gemiddelde met afslag faktor 1- 945: Die interpolasie weergawe van die voorspelling formule is die eenvoudigste om te gebruik as jy die uitvoering van die model op 'n spreadsheet: dit pas in 'n enkele sel en bevat selverwysings verwys na die vorige skatting, die vorige waarneming, en die sel waar die waarde van 945 gestoor. Let daarop dat indien 945 1, die SES model is gelykstaande aan 'n ewekansige loop model (sonder groei). As 945 0, die SES model is gelykstaande aan die gemiddelde model, met die veronderstelling dat die eerste stryk waarde gelyk aan die gemiddelde is ingestel. (Terug na bo.) Die gemiddelde ouderdom van die data in die eenvoudige eksponensiële-glad voorspelling is 1/945 relatief tot die tydperk waarvoor die voorspelling is bereken. (Dit is nie veronderstel duidelik te wees, maar dit kan maklik aangetoon deur die evaluering van 'n oneindige reeks.) Dus, die eenvoudige bewegende gemiddelde voorspelling is geneig om agter draaipunte met sowat 1/945 periodes. Byvoorbeeld, wanneer 945 0.5 die lag is 2 periodes wanneer 945 0.2 die lag is 5 periodes wanneer 945 0.1 die lag is 10 periodes, en so aan. Vir 'n gegewe gemiddelde ouderdom (bv bedrag van lag), die eenvoudige eksponensiële gladstryking (SES) voorspelling is 'n bietjie beter as die eenvoudige bewegende gemiddelde (SMA) voorspel, want dit plaas relatief meer gewig op die mees onlangse waarneming --i. e. dit is 'n bietjie meer quotresponsivequot om veranderinge voorkom in die onlangse verlede. Byvoorbeeld, 'n SMA model met 9 terme en 'n SES model met 945 0.2 beide het 'n gemiddelde ouderdom van 5 vir die data in hul voorspellings, maar die SES model plaas meer gewig op die laaste 3 waardes as wel die SMA model en by die Terselfdertyd is dit doesn8217t heeltemal 8220forget8221 oor waardes meer as 9 tydperke oud was, soos getoon in hierdie grafiek: nog 'n belangrike voordeel van die SES model die SMA model is dat die SES model maak gebruik van 'smoothing parameter wat voortdurend veranderlike, so dit kan maklik new deur die gebruik van 'n quotsolverquot algoritme om die gemiddelde minimum te beperk kwadraat fout. Die optimale waarde van 945 in die SES model vir hierdie reeks blyk te wees 0,2961, soos hier gewys word: die gemiddelde ouderdom van die data in hierdie voorspelling is 1 / 0,2961 3.4 tydperke, wat soortgelyk is aan dié van 'n 6-termyn eenvoudige bewegende gemiddelde. Die langtermyn-voorspellings van die SES model is 'n horisontale reguit lyn. soos in die SMA model en die ewekansige loop model sonder groei. Let egter daarop dat die vertrouensintervalle bereken deur Stat Graphics nou divergeer in 'n redelike aantreklike mode, en dat hulle aansienlik nouer as die vertrouensintervalle vir die ewekansige loop model. Die SES model veronderstel dat die reeks is 'n bietjie quotmore predictablequot as wel die ewekansige loop model. 'N SES model is eintlik 'n spesiale geval van 'n ARIMA model. sodat die statistiese teorie van ARIMA modelle bied 'n goeie basis vir die berekening van vertrouensintervalle vir die SES model. In die besonder, 'n SES model is 'n ARIMA model met een nonseasonal verskil, 'n MA (1) termyn, en geen konstante term. andersins bekend as 'n quotARIMA (0,1,1) model sonder constantquot. Die MA (1) koëffisiënt in die ARIMA model stem ooreen met die hoeveelheid 1- 945 in die SES model. Byvoorbeeld, as jy 'n ARIMA (0,1,1) model inpas sonder konstante om die reeks te ontleed hier, die beraamde MA (1) koëffisiënt blyk te wees 0,7029, wat byna presies 'n minus 0,2961. Dit is moontlik om die aanname van 'n nie-nul konstante lineêre tendens voeg by 'n SES model. Om dit te doen, net 'n ARIMA model met een nonseasonal verskil en 'n MA (1) termyn met 'n konstante, dit wil sê 'n ARIMA (0,1,1) model met 'n konstante spesifiseer. Die langtermyn-voorspellings sal dan 'n tendens wat gelyk is aan die gemiddelde tendens waargeneem oor die hele skatting tydperk is. Jy kan dit nie doen in samewerking met seisoenale aanpassing, omdat die aanpassing opsies seisoenale is afgeskakel wanneer die model tipe is ingestel op ARIMA. Jy kan egter 'n konstante langtermyn eksponensiële tendens om 'n eenvoudige eksponensiële gladstryking model voeg (met of sonder seisoenale aanpassing) deur gebruik te maak van die opsie inflasie-aanpassing in die vooruitskatting prosedure. Die toepaslike quotinflationquot (persentasie groei) koers per periode kan geskat word as die helling koëffisiënt in 'n lineêre tendens model toegerus om die data in samewerking met 'n natuurlike logaritme transformasie, of dit kan op grond van ander, onafhanklike inligting oor die langtermyn groeivooruitsigte . (Terug na bo.) Browns Lineêre (dws dubbel) Eksponensiële glad die SMA modelle en SES modelle aanvaar dat daar geen tendens van enige aard in die data (wat gewoonlik OK of ten minste nie-te-sleg vir 1- stap-ahead voorspellings wanneer die data is relatief raserig), en hulle kan verander word om 'n konstante lineêre tendens inkorporeer soos hierbo getoon. Wat van kort termyn tendense As 'n reeks vertoon 'n wisselende koers van groei of 'n sikliese patroon wat uitstaan ​​duidelik teen die geraas, en as daar 'n behoefte aan meer as 1 tydperk wat voorlê voorspel, dan skatting van 'n plaaslike tendens kan ook wees n probleem. Die eenvoudige eksponensiële gladstryking model veralgemeen kan word na 'n lineêre eksponensiële gladstryking (LES) model wat plaaslike begrotings van beide vlak en tendens bere te kry. Die eenvoudigste-time wisselende tendens model is Browns lineêr eksponensiële gladstryking model, wat twee verskillende reëlmatige reeks wat op verskillende punte gesentreer in die tyd gebruik. Die vooruitskatting formule is gebaseer op 'n ekstrapolasie van 'n streep deur die twee sentrums. ( 'N meer gesofistikeerde weergawe van hierdie model, Holt8217s, word hieronder bespreek.) Die algebraïese vorm van Brown8217s lineêr eksponensiële gladstryking model, soos dié van die eenvoudige eksponensiële gladstryking model, uitgedruk kan word in 'n aantal verskillende maar ekwivalente vorms. Die quotstandardquot vorm van hierdie model word gewoonlik uitgedruk as volg: Laat S dui die enkel-stryk reeks verkry deur die toepassing van eenvoudige eksponensiële gladstryking om reeks Y. Dit is, is die waarde van S op tydperk t gegee word deur: (Onthou dat, onder eenvoudige eksponensiële gladstryking, dit sou die voorspelling vir Y by tydperk T1 wees) Dan Squot dui die dubbel-stryk reeks verkry deur die toepassing van eenvoudige eksponensiële gladstryking (met behulp van dieselfde 945) tot reeks S:. ten slotte, die voorspelling vir Y tk. vir enige kgt1, word gegee deur: Dit lewer e 1 0 (dit wil sê kul n bietjie, en laat die eerste skatting gelyk wees aan die werklike eerste waarneming), en e 2 Y 2 8211 Y 1. waarna voorspellings gegenereer met behulp van die vergelyking hierbo. Dit gee dieselfde toegerus waardes as die formule gebaseer op S en S indien laasgenoemde is begin met behulp van S 1 S 1 Y 1. Hierdie weergawe van die model gebruik word op die volgende bladsy wat 'n kombinasie van eksponensiële gladstryking met seisoenale aanpassing illustreer. Holt8217s Lineêre Eksponensiële Smoothing Brown8217s LES model bere plaaslike begrotings van vlak en tendens deur glad die onlangse data, maar die feit dat dit nie so met 'n enkele glad parameter plaas 'n beperking op die data patrone wat dit in staat is om aan te pas: die vlak en tendens word nie toegelaat om wissel op onafhanklike tariewe. Holt8217s LES model spreek hierdie kwessie deur die insluiting van twee glad konstantes, een vir die vlak en een vir die tendens. Te eniger tyd t, soos in Brown8217s model, die daar is 'n skatting L t van die plaaslike vlak en 'n skatting T t van die plaaslike tendens. Hier is hulle rekursief bereken vanaf die waarde van Y op tydstip t en die vorige raming van die vlak en tendens waargeneem deur twee vergelykings wat eksponensiële gladstryking afsonderlik van toepassing op hulle. As die geskatte vlak en tendens op tydstip t-1 is L t82091 en T t-1. onderskeidelik, dan is die voorspelling vir Y tshy wat op tydstip t-1 sal gemaak is gelyk aan L t-1 T T-1. Wanneer die werklike waarde is waargeneem, is die opgedateer skatting van die vlak rekursief bereken deur interpol tussen Y tshy en sy voorspelling, L t-1 T T-1, die gebruik van gewigte van 945 en 1- 945. Die verandering in die geskatte vlak, naamlik L t 8209 L t82091. geïnterpreteer kan word as 'n lawaaierige meting van die tendens op tydstip t. Die opgedateer skatting van die tendens is dan rekursief bereken deur interpol tussen L t 8209 L t82091 en die vorige skatting van die tendens, T t-1. die gebruik van gewigte van 946 en 1-946: Die interpretasie van die tendens-glad konstante 946 is soortgelyk aan dié van die vlak glad konstante 945. Models met klein waardes van 946 aanvaar dat die tendens verander net baie stadig met verloop van tyd, terwyl modelle met groter 946 aanvaar dat dit vinniger is om te verander. 'N Model met 'n groot 946 is van mening dat die verre toekoms is baie onseker, omdat foute in die tendens-skatting word baie belangrik wanneer voorspel meer as een tydperk wat voorlê. (Terug na bo.) Die smoothing konstantes 945 en 946 kan in die gewone manier word beraam deur die vermindering van die gemiddelde kwadraat fout van die 1-stap-ahead voorspellings. Wanneer dit in Stat Graphics gedoen, die skattings uitdraai om te wees 945 0.3048 en 946 0,008. Die baie klein waarde van 946 beteken dat die model veronderstel baie min verandering in die tendens van een tydperk na die volgende, so basies hierdie model is besig om 'n langtermyn-tendens skat. Volgens analogie met die idee van die gemiddelde ouderdom van die data wat gebruik word in die skatte van die plaaslike vlak van die reeks, die gemiddelde ouderdom van die data wat gebruik word in die skatte van die plaaslike tendens is eweredig aan 1/946, hoewel nie presies gelyk aan Dit. In hierdie geval is dit blyk 1 / 0,006 125. Dit isn8217t n baie presiese aantal sover die akkuraatheid van die skatting van 946 isn8217t regtig 3 desimale plekke te wees, maar dit is van dieselfde algemene orde van grootte as die steekproefgrootte van 100 , so hierdie model is gemiddeld oor 'n hele klomp van die geskiedenis in die skatte van die tendens. Die voorspelling plot hieronder toon dat die LES model skat 'n effens groter plaaslike tendens aan die einde van die reeks as die konstante tendens geskat in die SEStrend model. Ook waarvan die beraamde waarde van 945 is byna identies aan die een wat deur die pas van die SES model met of sonder tendens, so dit is amper dieselfde model. Nou, doen hierdie lyk redelike voorspellings vir 'n model wat veronderstel is om te beraming 'n plaaslike tendens As jy hierdie plot 8220eyeball8221, dit lyk asof die plaaslike tendens afwaarts gedraai aan die einde van die reeks: Wat het die parameters van hierdie model gebeur is beraam deur die vermindering van die kwadraat fout van 1-stap-ahead voorspellings, nie langer termyn voorspellings, in welke geval die tendens 'n groot verskil doesn8217t maak. As alles wat jy is op soek na is 1-stap-ahead foute, is jy nie sien die groter prentjie van tendense oor (sê) 10 of 20 periodes. Ten einde hierdie model meer in harmonie te kry met ons oogbal ekstrapolasie van die data, kan ons met die hand die tendens-glad konstante pas sodat dit 'n korter basislyn vir tendens skatting. Byvoorbeeld, as ons kies om te stel 946 0.1, dan is die gemiddelde ouderdom van die gebruik in die skatte van die plaaslike tendens data is 10 periodes, wat beteken dat ons die gemiddeld van die tendens oor daardie laaste 20 periodes of so. Here8217s wat die voorspelling plot lyk asof ons '946 0.1 terwyl 945 0.3. Dit lyk intuïtief redelike vir hierdie reeks, maar dit is waarskynlik gevaarlik om hierdie tendens te ekstrapoleer nie meer as 10 periodes in die toekoms. Wat van die fout statistieke Hier is 'n model vergelyking vir die twee modelle hierbo asook drie SES modelle getoon. Die optimale waarde van 945.Vir die SES model is ongeveer 0,3, maar soortgelyke resultate (met 'n bietjie meer of minder 'n responsiewe ingesteldheid, onderskeidelik) verkry met 0,5 en 0,2. (A) Holts lineêre exp. glad met alfa 0,3048 en beta 0,008 (B) Holts lineêre exp. glad met alfa 0,3 en beta 0,1 (C) Eenvoudige eksponensiële gladstryking met alfa 0,5 (D) Eenvoudige eksponensiële gladstryking met alfa 0,3 (E) Eenvoudige eksponensiële gladstryking met alfa 0,2 hul statistieke is byna identies, so ons can8217t regtig die keuse te maak op die basis van 1-stap-ahead voorspelling foute binne die data monster. Ons het om terug te val op ander oorwegings. As ons glo dat dit sinvol om die huidige tendens skatting van wat die afgelope 20 periodes of so gebeur baseer, kan ons 'n saak vir die LES model met 945 0.3 en 946 0.1 maak. As ons wil hê agnostikus te wees oor die vraag of daar 'n plaaslike tendens, dan een van die SES modelle makliker om te verduidelik kan wees en sou ook vir meer middel-of-the-road voorspellings vir die volgende 5 of 10 periodes. (Terug na bo.) Watter tipe tendens-ekstrapolasie die beste: horisontale of lineêre empiriese bewyse dui daarop dat, indien die data is reeds aangepas (indien nodig) vir inflasie, dan is dit dalk onverstandig om kort termyn lineêre ekstrapoleer wees tendense baie ver in die toekoms. Tendense duidelik vandag mag verslap in die toekoms as gevolg van uiteenlopende oorsake soos produk veroudering, toenemende mededinging en sikliese afswaai of opwaartse fases in 'n bedryf. Om hierdie rede, eenvoudige eksponensiële gladstryking voer dikwels beter out-of-monster as wat dit andersins word verwag, ten spyte van sy quotnaivequot horisontale tendens ekstrapolasie. Gedempte tendens veranderinge van die lineêre eksponensiële gladstryking model word ook dikwels gebruik in die praktyk om 'n aantekening van konserwatisme in te voer in die tendens projeksies. Die gedempte-tendens LES model geïmplementeer kan word as 'n spesiale geval van 'n ARIMA model, in die besonder, 'n ARIMA (1,1,2) model. Dit is moontlik om vertrouensintervalle rondom langtermyn voorspellings wat deur eksponensiële gladstryking modelle bereken deur die oorweging van hulle as spesiale gevalle van ARIMA modelle. (Pasop: nie alle sagteware bereken vertrouensintervalle vir hierdie modelle korrek.) Die breedte van die vertrouensintervalle hang af van (i) die RMS fout van die model, (ii) die tipe glad (eenvoudige of lineêr) (iii) die waarde (s) van die smoothing konstante (s) en (iv) die aantal periodes voor jy voorspel. In die algemeen, die tussenposes versprei vinniger as 945 kry groter in die SES model en hulle uitgebrei, sodat baie vinniger as lineêre, eerder as eenvoudige smoothing gebruik. Hierdie onderwerp word verder in die ARIMA modelle deel van die notas bespreek. (Terug na bo.)


No comments:

Post a Comment