Fråga:
Varför ökar variansen av Random walk?
Isbister
2015-07-02 20:07:32 UTC
view on stackexchange narkive permalink

slumpmässig gång som definieras som $ Y_ {t} = Y_ {t-1} + e_t $ , där $ e_t $ är vitt brus. Betecknar att den aktuella positionen är summan av den tidigare positionen + en oförutsedd term.

Du kan bevisa att medelfunktionen $ \ mu_t = 0 $ span > eftersom $ E (Y_ {t}) = E (e_1 + e_2 + ... + e_t) = E (e_1) + E (e_2) + ... + E (e_t ) = 0 + 0 + ... + 0 $

Men varför är det så att avvikelsen ökar linjärt med tiden?

Har detta något att göra med att det inte är "rent" slumpmässigt, eftersom den nya positionen är mycket korrelerad med den tidigare?

EDIT:

Nu har jag en mycket bättre förståelse genom att visualisera ett stort urval av slumpmässiga promenader, och här kan vi enkelt observera att den totala variansen ökar över tiden,

100 000 Random walks

och medelvärdet är som förväntat runt noll.

Kanske var det trots allt trivialt, eftersom i de tidiga stadierna av tidsserien (jämför tid = 10, med 100) har de slumpmässiga vandrarna inte haft tid ännu att utforska så mycket.

Det är svårt att se hur "medelvärdet" för någon simulerad slumpmässig promenad skulle vara samma sak som * förväntan * på en viss $ Y_t $.Den förväntningen beräknas per definition över hela "ensemblen" av möjliga slumpmässiga promenader, varav din simulerade promenad bara är en instans.När du simulerar * många * promenader - kanske genom att lägga deras grafer på ett diagram - ser du att de är spridda runt den horisontella axeln.Hur varierar spridningen med $ t $?
@whuber som är vettigare!Naturligtvis borde jag betrakta det som en instans av alla möjliga promenader.Och då ja, du kan se genom att titta på diagrammet att den totala variansen för _all_ promenaderna ökar över tiden.Det stämmer?
Ja det stämmer.Det är ett bra sätt att uppskatta vad @Glen_b skrev i sitt svar med matematik.Jag har funnit att det hjälper att vara bekant med många applikationer av slumpmässiga promenader: förutom den klassiska Brownian-applikationen beskriver de diffusion, prissättning av alternativ, ackumulering av mätfel och mycket mer.Ta en av dessa, till exempel diffusion.Föreställ dig att en droppe bläck faller i en pool med stillastående vatten.Även om dess position är fast sprider den sig med tiden: så här kan vi * se * ett konstant nollmedelvärde tillsammans med en ökande varians.
@whuber Tack så mycket, jag förstår det helt nu!
Fem svar:
Glen_b
2015-07-02 20:16:07 UTC
view on stackexchange narkive permalink

Kort sagt eftersom det fortsätter att lägga till variansen för nästa steg till den variabilitet vi har för att komma dit vi är nu.

$ \ text {Var} (Y_ {t}) = \ text {Var} (e_1 + e_2 + ... + e_t) $ $ \ qquad \ quad \; \; = \ text {Var} (e_1) + \ text {Var} (e_2) + ... + \ text {Var} ( e_t) $ (självständighet)
$ \ qquad \ quad \; \; = \ sigma ^ 2 + \ sigma ^ 2 + ... + \ sigma ^ 2 = t \ sigma ^ 2 \ ,, $

och vi kan se att $ t \ sigma ^ 2 $ ökar linjärt med $ t $ .


Medlet är noll vid varje tidpunkt; om du simulerade serien många gånger och genomsnittade över serier under en viss tid, skulle det i genomsnitt vara något nära 0

500 simulated random walks with sample mean and +/- standard deviation

$ \ quad ^ {\ text {Figur: 500 simulerade slumpmässiga promenader med exempelvärde i vitt och}} $
$ \ quad ^ {\ pm \ text { en standardavvikelse i rött. Standardavvikelsen ökar med} \ sqrt {t} \ ,.} $

Ja, varje felterm är oberoende ja.Och säker på att detta är vettigt på papperet.Men jag får fortfarande inte en bra tarmkänsla för "Hur kan variansen öka linjärt" men medelvärdet förblir noll?Det låter så konstigt, nästan som en motsägelse.Vad sägs om en mindre matematisk förklaring som svarar på mina frågor?
timpal0l - Vid varje tidpunkt lägger du till en annan term som inte förskjuter medelvärdet utan lägger till "bruset" (variansen om medelvärdet).Så medelvärdet förblir detsamma men variansen ökar (fördelningen "sprids ut" mer vid senare tider).Det är både den intuitiva idén och också i allmänhet vad matematiken visar.
Tack för diagrammet, [A.Webb] (http://stats.stackexchange.com/users/56912/a-webb).Mycket trevligt.
Matthew Drury
2015-07-02 22:49:05 UTC
view on stackexchange narkive permalink

Här är ett sätt att föreställa sig det. För att förenkla saker, låt oss byta ut ditt vita brus $ e_i $ med ett myntflip $ e_i $

$$ e_i = \ left \ {\ begin {array} {c} 1 \ \ text {med} \ Pr = .5 \\ -1 \ \ text {med} \ Pr = .5 \ slut {array} \ höger. $$

detta förenklar bara visualiseringen, det finns inget riktigt grundläggande med omkopplaren förutom att lätta på vår fantasi.

Antag nu att du har samlat en armé med myntflipper. Deras instruktioner är att på ditt kommando vända deras mynt och hålla reda på vad deras resultat var tillsammans med en summering av alla deras tidigare resultat. Varje enskild flipper är en förekomst av slumpmässig promenad

$$ W = e_1 + e_2 + \ cdots $$

och aggregering över hela din armé borde ge dig ett tag på förväntat beteende.

vänd 1 : Ungefär hälften av din armé vänder på huvudet och hälften vänder på svansen. Förväntningen på summan, tagen över hela din armé, är noll. Det maximala värdet på $ W $ för hela din armé är $ 1 $ och lägsta är $ -1 $, så det totala intervallet är $ 2 $.

flip 2 : Ungefär hälften vändhuvuden och halva vänder svansar. Förväntningen på denna vändning är återigen noll, så förväntningen på $ W $ över alla vändningar förändras inte. En del av din armé har vänt $ HH $, och andra har vänt $ TT $, så högst $ W $ är $ 2 $ och lägsta är $ -2 $; det totala intervallet är $ 4 $.

...

vänd n : Ungefär hälften vänder och hälften vänder svansar. Förväntningen på denna vändning är återigen noll, så förväntningen på $ W $ över alla vändningar ändras inte, den är fortfarande noll. Om din armé är väldigt stor, väntade några mycket lyckliga soldater $ HH \ cdots H $ och andra $ TT \ cdots T $. Det vill säga, det finns några med $ n $ huvuden och några med $ n $ svansar (även om detta blir sällsynta och sällsynta med tiden). Så, åtminstone enligt vår fantasi, är det totala intervallet $ 2n $.

Så här är vad du kan se från detta tankeexperiment:

  • Förväntningen på promenaden är noll, eftersom varje steg i promenaden är balanserad.
  • Det totala intervallet för promenaden växer linjärt med längden på promenaden.

För att återhämta intuitionen var vi tvungna att kassera standardavvikelsen och använda den i intuitivt mått, intervallet.

Standardavvikelsen växer inte linjärt, så den slutliga anmärkningen är tveksam.
Ja, jag försöker tänka igenom något för att säga för att lösa det, några förslag?Allt jag kan tänka mig är överklaganden till den centrala gränssatsen som inte är särskilt intuitiva.
@JuhoKokkala Jag håller med din kritik, så jag tog bort den sista anmärkningen.
Aksakal
2015-07-02 23:33:10 UTC
view on stackexchange narkive permalink

Har detta något att göra med att det inte är "rent" slumpmässigt, eftersom den nya positionen är mycket korrelerad med den tidigare?

Det verkar som om "ren" du menar oberoende . I slumpmässig promenad är bara stegen slumpmässiga och oberoende av varandra. Som du noterade är "positionerna" slumpmässiga men korrelerade , dvs. inte oberoende .

Förväntningen på positionen är fortfarande noll som du skrev $ E [Y_t] = 0 $. Anledningen till att du observerar positioner som inte är noll är att positionerna fortfarande är slumpmässiga, dvs $ Y_t $ är alla icke-noll slumpmässiga nummer. Faktum är att medan du ökar provet kommer större $ Y_t $ att observeras då och då, just för att, som du noterade, variansen ökar med provstorleken.

Variansen ökar eftersom om du packar upp positionen enligt följande: $ Y_t = Y_0 + \ sum_ {i = 0} ^ t \ varepsilon_t $, kan du tydligt se att positionen är en summa av steg. Avvikelserna ökar med att provstorleken ökar.

Förresten, felmedlen läggs också till, men i en slumpmässig promenad antar vi vanligtvis att medelvärdet är noll, så att lägga till alla nollor kommer fortfarande att resultera i noll. Det finns slumpmässig gång med en drift: $ Y_t-Y_ {t-1} = \ mu + \ varepsilon_t $, där $ Y_t $ kommer att glida bort från noll i takt $ \ mu t $ med provtid.

Sanchises
2015-07-02 21:16:03 UTC
view on stackexchange narkive permalink

Låt oss ta ett annat exempel för en intuitiv förklaring: att kasta dart mot en darttavla. Vi har en spelare som försöker sikta mot bullseye, som vi tar för att vara en koordinat som heter 0. Spelaren kastar några gånger, och faktiskt är medelvärdet av hans kast 0, men han är inte riktigt bra, så variansen är 20 cm.

Vi ber spelaren att kasta en enda ny pil. Förväntar du dig att det slår bullseye?

Nej. Även om medelvärdet är exakt bullseye, är det troligt att det inte blir bullseye när vi provar ett kast.

På samma sätt, med slumpmässig promenad, förväntar vi oss inte ett enda prov vid tiden $ t $ att vara någonstans nära 0. Det är faktiskt vad variansen indikerar: hur långt borta förväntar vi oss att ett prov ska vara?

Men om vi tar många prover ser vi att det centrerar runt 0. Precis som vår dartspelare kommer nästan aldrig att slå bullseye (stor varians), men om han kastar en hel del dart kommer han att ha dem centrerade runt bullseye (medel).

Om vi ​​förlänger detta exempel på slumpmässig gång, kan vi se att variansen ökar med tiden, även om medelvärdet stannar vid 0. I slumpmässigt gångfall verkar det konstigt att medelvärdet stannar vid 0, även om du intuitivt vet att det nästan aldrig hamnar precis vid ursprunget. Detsamma gäller dock vår darter: vi kan se att varje enskild dart nästan aldrig kommer att träffa bullseye med en ökande varians, och ändå kommer pilarna att bilda ett fint moln runt bullseye - medelvärdet förblir detsamma: 0.

Detta beskriver inte fenomenet i frågan, som rör den tidsmässiga * ökningen * i spridningen.Den ökningen är inte en funktion av antalet prover.Det är inneboende.
@whuber Jag vet att detta svar inte tar itu med det, och jag hade ingen avsikt att göra det.OP verkade kämpa med det faktum att medelvärdet var helt oberoende av variansen, även om vi intuitivt kan se att en slumpmässig promenad nästan aldrig kommer att hamna vid ursprunget, så jag försökte klargöra det med ett exempel utan det svåra beroendetpå $ t $.Det var dock för långt för en kommentar, men verkligen inte tänkt som ett fullständigt svar.Jag utvidgade svaret för att förhoppningsvis ta itu med din oro.
plalud
2019-01-24 07:00:58 UTC
view on stackexchange narkive permalink

Här är ett annat sätt att få intuition att variansen ökar linjärt med tiden.

Returer ökar linjärt med tiden. $. 1 \% $ avkastning per månad översätt till $ 1,2 \% $ avkastning per år - $ X $ avkastning per dag genererar $ 365X $ avkastning per år (förutsatt oberoende).

Det är vettigt att avkastningsområdet också ökar linjärt.Om månadsavkastningen är $. 1 \% $ i genomsnitt $ \ pm .05 \% $ , dådet är intuitivt förnuftigt att det per år är $ 1,2 \% $ $ \ pm .6 \% $ span>.

Tja, om vi intuitivt tänker på varians som intervall, så är det intuitivt förnuftigt att varians ökar på samma sätt som avkastning genom tiden, det är linjärt.



Denna fråga och svar översattes automatiskt från det engelska språket.Det ursprungliga innehållet finns tillgängligt på stackexchange, vilket vi tackar för cc by-sa 3.0-licensen som det distribueras under.
Loading...