Fråga:
Hur läses notationen $ X \ sim N (\ mu, \ sigma ^ 2) $?
not
2015-07-16 21:46:15 UTC
view on stackexchange narkive permalink

Hur läses notationen $ X \ sim N (\ mu, \ sigma ^ 2) $? Är det $ X $ följer en normalfördelning? Eller är $ X $ en normal distribution? Eller kanske $ X $ är ungefär normal ..

Vad händer om det finns flera variabler som följer (eller vad orden är) samma fördelning? Hur är det skrivet?

$ X \ sim N (\ mu, \ sigma) $ ska vara $ X \ sim N (\ mu, \ sigma ^ 2) $
@mandata som (tyvärr) beror på vem du frågar.Många författare använder $ \ sigma $ i både definition och notation.
Jag föredrar $ \ sigma $ själv, men det går emot spannmålen.
Vanlig notation är att "$ \ sim $" betyder distribuerat som, "$ \ dot \ sim $" (notera punkten) betyder ungefär fördelat som.
Är $ (X, Y) \ sim N (\ mu, \ sigma ^ 2) $ den korrekta beteckningen för den andra punkten?
Så, $ X $ _ distribueras som en normal distribution _?
Det är trevligare att skriva $ \ mathcal N (\ mu, \ sigma ^ 2) $ och inte $ N (\ mu, \ sigma ^ 2) $.Det är '\ mathcal N'.
@amoeba varför så?
@Student001, eftersom det är vackrare och för att det är standard (https://en.wikipedia.org/wiki/Normal_distribution#Notation).$ N $ ser ut som alla andra bokstäver.$ \ mathcal N $ erkänns omedelbart som en normalfördelning.
@amoeba ja, min poäng är att den första delen bara är din personliga preferens, och delen om att det är standard är inte sant.Huvudstaden N är en vanlig notation.
Sex svar:
Alecos Papadopoulos
2015-07-16 23:09:55 UTC
view on stackexchange narkive permalink

När det gäller användningen av symbolerna $ \ sim $ ("följer", "fördelas enligt") och $ \ approx $ ("motsvarar ungefär"), se detta svar. Så här används symbolerna åtminstone i statistik / ekonometri.

När det gäller notationskonventionerna för en distribution är det normala ett gränsfall : vi skriver vanligtvis definiera parametrar för en distribution bredvid dess symbol, parametrarna som gör det möjligt för en att skriva korrekt dess kumulativa fördelningsfunktion och dess sannolikhetsdensitet / massfunktion. Vi noterar inte de ögonblick som vanligtvis är en funktion av men inte lika med dessa parametrar.

Så för en uniform som varierar i $ [a, b] $ skriver vi $ U (a, b) $. Medelvärdet för fördelningen är $ (a + b) / 2 $ medan variansen är $ (b-a) ^ 2/12 $. För en Gamma (parametrisering i formskala) skriver vi $ G (k, \ theta) $. Medelvärdet är $ k \ theta $ och variansen $ k \ theta ^ 2 $. Etc.

I fallet med normalfördelningen råkar också parametern $ \ mu $ vara medelvärdet för fördelningen, medan parametern $ \ sigma $ råkar vara kvadratroten av variansen. Det är mitt (möjligen felaktiga) intryck att man i ingenjörscirklar oftare ser $ N (\ mu, \ sigma) $ (som överensstämmer med den allmänna notationsregeln), medan man i Econometrics-cirklar nästan alltid ser $ N (\ mu, \ sigma ^ 2) $ (som faller i frestelsen att tillhandahålla ögonblicken genom att behandla $ \ sigma ^ 2 $ som basparameter och inte som kvadraten på den).

Vladislavs Dovgalecs
2015-07-16 21:53:05 UTC
view on stackexchange narkive permalink

Jag antar att variabeln X fördelas enligt normalfördelningen med medelvektorn $ \ mu $ och standardavvikelsen $ \ sigma $.

Varför _vector_ $ \ mu $?
Eftersom normalfördelningen kan vara flervariat.Det kan vara ett enda värde, det kan också generaliseras till $ n $ dimensioner.
Varför är $ \ sigma $ bara en skalär?
Du har rätt, $ \ sigma $ är inte skalärt i allmänhet för multivariata fall.Du talar då om kovariansmatrisen $ \ Sigma $
standardavvikelse*.
ekvall
2015-07-16 22:13:32 UTC
view on stackexchange narkive permalink

REDIGERA: Mitt tidigare svar kunde inte svara på själva frågan. Vad som följer är mitt försök till ett mer till punkt-svar.


Hur är notationen $ X \ sim N (\ mu, \ sigma ^ 2) $ läs?

Andra svar säger redan vad notationen betyder, nämligen att $ X $ span> är en normalt distribuerad slumpmässig variabel med något medelvärde $ \ mu $ och varians $ \ sigma ^ 2 $ span >. Dilips svar ger också en bra redogörelse för vilka andra möjliga tolkningar det finns när notationen är mindre tydlig än $ \ sigma ^ 2 $ , t.ex. för allmänna parametrar $ \ {a, b \} $ , dvs. $ X \ sim N (a, b) $ .

När jag ser den här notationen i text brukar jag läsa den så att den är vettig grammatiskt. Jag skulle hävda att detta är det förnuftiga sättet att behandla notationen. Således är svaret på din fråga att du vet vad beteckningen betyder matematiskt, att du helt enkelt läser den på något sätt som passar texten. Här är två exempel:

(1) Låt $ X \ sim N (a, b) $ ...

(2) Tänk på tre oberoende slumpmässiga variabler, $ X \ sim N (0,1), Y \ sim N (1,2), Z \ sim Exp ( \ lambda). $

I (1) läste jag det som (t.ex.) "Låt $ X $ distribueras normalt med medelvärde a och varians b ... ", och i (2) läser jag det som" ... $ X $ är standard normalt ... ".

Följer det X en normalfördelning?

Ja, det fungerar också. Många säger det på detta sätt, även om du kanske vill inkludera medelvärdet och variansen som kännetecknar fördelningen.

Eller är X en normalfördelning?

Nej, det är felaktigt. Se det här gamla svaret för en redogörelse för vad en distribution är.

Eller kanske är X ungefär normal ..

Nej, det är också felaktigt. Det finns andra sätt att beteckna detta. Som påpekas i kommentarerna är $ \ overset {\ cdot} {\ sim} $ en av dem.

Vad händer om det finns flera variabler som följer (eller vad orden är) samma fördelning? Hur skrivs det?

Om de alla är oberoende är ett enkelt sätt att skriva detta $ X_i \ overset {iid} {\ sim} N (\ mu, \ sigma ^ 2), i = 1,2, \ dots n $ , med tanke på att du har $ n $ variabler (iid står för oberoende och identiskt fördelade). Om de inte är oberoende kan du säga att $ X_i, i = 1,2, \ dots, n $ är möjligen beroende, men (marginellt) identiskt fördelade som $ N (\ mu, \ sigma ^ 2) $ . Eller så kan du istället behöva deklarera deras gemensamma fördelning - det beror på vilket syfte du har för att överväga de slumpmässiga variablerna.

Om de är gemensamt normala är det lätt att skriva att $ \ mathbf X: = (X_1, \ dots, X_n) '\ sim N (\ mu, \ Sigma) $ för att fullt ut karakterisera deras gemensamma fördelning med hjälp av någon medelvektor $ \ mu $ och kovariansmatris $ \ Sigma $ .

I allmänhet kan du definiera vilken multivariat distributionsfunktion som helst $ F $ och skriv sedan $ \ mathbf X \ sim F $ .

Är det inte trevligt att $ \ mathcal N (0,1) $ oavsett vilken konvention som används alltid är den normala normala slumpmässiga variabeln?
@DilipSarwate, verkligen!Gör namnet "standard" också mycket lämpligt.
Dilip Sarwate
2015-07-17 23:36:59 UTC
view on stackexchange narkive permalink

Svårigheten är inte att veta vad $ \ mathcal N (\ mu, \ sigma ^ 2) $ betyder. Till och med $ \ mathcal N (3,5 ^ 2) $ är rimligt entydigt de flesta människor som betyder en normal slumpmässig variabel med medelvärdet $ 3 $ och varians $ 5 ^ 2 $ eller varians $ 25 $ (purister borde tro att standardavvikelsen är en mer grundläggande parameter än variansen skulle kunna säga "standardavvikelse $ 5 $" istället). Vad menas dock med $ \ mathcal N (a, b) $, t.ex. $ \ mathcal N (3,25) $ är föremål för åtminstone tre olika konventioner med avseende på avvikelse eller standardavvikelse. Alla tre konventionerna är överens om att $ \ mathbf 3 $ är medel $ \ mu_X $ på $ X $ men $ \ mathbf 25 $ har olika betydelser för olika människor.

  • $ X \ sim \ mathcal N (\ star, 25) $ betyder att standardavvikelsen på $ X $ är $ 25 $.

  • $ X \ sim \ mathcal N (\ star, 25) $ betyder att variansen av $ X $ är $ 25 $.

  • $ X \ sim \ mathcal N (\ star, 25) $ betyder att variansen för $ X $ är $ \ dfrac {1} {25} $.

Se den här frågan och kommentarerna som följer för mer information.

vem förutom dig, någonsin haft tolkningen att den 2: a parametern för en Normal är det omvända av variansen?Det här är första gången jag minns att jag såg något sådant.
@MarkL.Stone Vänligen kasta inte hänsyn till min sanning.Om du hade brytt dig om att följa länken som jag har tagit med i mitt svar och läsa kommentarerna, skulle du ha sett att Moderator whuber sa "Andra, särskilt i Bayesian-sammanhang, parametrar till och med normalerna efter deras precision, som i $ N (\mu, 1 / \ sigma ^ 2) $. "och Moderator kardinal sa "det finns också _naturliga parametrar för det normala_, som förmodligen ser ganska onaturligt ut för de flesta."Dessa "naturliga parametrar" uppstår när normalfördelningen definieras som en medlem av den _ekonomiska familjen_ av distributioner.
Jag försökte inte kasta tankar på din sanning.Jag tittade på tråden och såg ditt svar, men missade Whubers kommentar.Jag antar att jag inte är Bayesian.
StatsStudent
2015-07-18 23:40:02 UTC
view on stackexchange narkive permalink

$ X $ är en slumpmässig variabel "$ X $";

$ \ sim $ läses "fördelas som";

$ N $ läses "Normal" ;

$ \ mu $ läses "med medelvärdet $ \ mu $" (konventionen är att den första posten efter den öppna parentesen är medelvärdet, och den andra är variansen eller standardavvikelsen, beroende på notation - se nedan); och

$ \ sigma ^ 2 $ läsas "med varians $ \ sigma ^ 2 $ (eller standardavvikelse $ \ sigma ^ 2 $, beroende på författarens / användarens användning. I detta fall, Jag antar att det är med varians $ \ sigma ^ 2 $.

Om du sätter ihop allt har du en slumpmässig variabel $ X $ som fördelas som Normal med ett genomsnitt "mu" ($ \ mu $ ) och varians "sigma kvadrat" ($ \ sigma ^ 2 $).

Du kan också säga $ X $ följer en normal..

Om flera variabler följer samma fördelning kan du representera detta på flera sätt, men du kanske vill indexera variablerna från $ i = 1 $ till $ n $. Då kan du skriva, $ X_i \ sim N (\ mu, \ sigma ^ 2) $, för $ i = 1 $ till $ n $.

mandata
2015-07-16 21:55:18 UTC
view on stackexchange narkive permalink

$ X $ distribueras normalt med medelvärde $ \ mu $ och standardavvikelse $ \ sigma $. Tilden betyder inte approximation, eftersom den inte är relaterad till ett likhetstecken, men antyder det på ett sätt eftersom X aldrig är definitivt känd.

Varför inte?Det finns befolkningar som är helt kända.
$ X $ representerar en variabel, inte en uppsättning värden.
X är verkligen en slumpmässig variabel och x kan vara ett av dess värden.Men det betyder att det inte finns någon approximation: allt som finns att (definitivt) veta om X anges i uttrycket vi diskuterar.
För ordens skull är $ \ sim $ en tilde.Tilda är ett varumärke av basmatiris :-)


Denna fråga och svar översattes automatiskt från det engelska språket.Det ursprungliga innehållet finns tillgängligt på stackexchange, vilket vi tackar för cc by-sa 3.0-licensen som det distribueras under.
Loading...