Är "felmarginal" samma som "standardfel"?
Ett (enkelt) exempel för att illustrera skillnaden skulle vara stor!
Är "felmarginal" samma som "standardfel"?
Ett (enkelt) exempel för att illustrera skillnaden skulle vara stor!
Kort svar : de skiljer sig åt genom en kvantil av referensfördelningen (vanligtvis standardnormalen).
Långt svar : du uppskattar en viss befolkningsparameter (säg andelen personer med rött hår; det kan vara något mycket mer komplicerat, från att säga en logistisk regressionsparameter till den 75: e percentilen av vinsten i prestationspoäng till vad som helst). Du samlar in dina data, du kör din uppskattningsprocedur, och det allra första du tittar på är poänguppskattningen, den mängd som ungefär motsvarar vad du vill lära dig om din befolkning (stickprovets andel rödhåriga är 7%). Eftersom detta är ett exempel på statistik är det en slumpmässig variabel. Som en slumpmässig variabel har den en (samplings-) fördelning som kan karaktäriseras av medelvärde, varians, fördelningsfunktion etc. Medan poänguppskattningen är din bästa gissning angående populationsparametern är standardfelet din bästa gissning om standardavvikelsen för din estimator (eller i vissa fall kvadratroten av det genomsnittliga kvadratfelet, MSE = bias $ ^ 2 $ + varians).
För ett urval av storlek $ n = 1000 $, standardfelet för din proportion uppskattning är $ \ sqrt {0,07 \ cdot0.93 / 1000} $ $ = 0,0081 $. felmarginalen är halvbredden för tillhörande konfidensintervall, så för 95% konfidensnivå skulle du ha $ z_ {0,975} = 1,96 $ vilket resulterar i en felmarginal $ 0,0081 \ cdot1.96 = 0,0158 $.
Detta är ett utökat (eller exegetisk utvidgning av @StasK-svaret) försök på frågan med fokus på proportioner
Standardfel:
standardfelet ( SE ) i samplingsfördelningen en andel $ p $ definieras som:
$ \ text {SE} _p = \ sqrt {\ frac {p \, (1-p)} {n}} $. Detta kan kontrasteras mot standardavvikelsen ( SD ) för samplingsfördelningen för en andel $ \ pi $: $ \ sigma_p = \ sqrt {\ frac {\ pi \, (1- \ pi)} {n}} $.
Konfidensintervall:
förtroendet intervall uppskattar populationsparametern $ \ pi $ baserat på samplingsfördelningen och den centrala gränssatsen (CLT) som tillåter en normal approximation. Följaktligen, med tanke på en SE och en andel, $ 95 \% $ beräknas konfidensintervallet som:
$$ p \, \ pm \, Z _ {\ alpha / 2} \, \ text { SE} $$
Med tanke på att $ Z _ {\ alpha / 2} = Z_ {0.975} = 1.959964 \ sim1.96 $, blir CI:
$$ p \ , \ pm \, 1.96 \, \ sqrt {\ frac {p \, (1-p)} {n}} $$.
Detta väcker en fråga angående användningen av normalfördelningen även om vi känner verkligen inte till befolkningens SD - när man uppskattar konfidensintervall för medel, om SE används i stället för SD, upplevs $ t $ -fördelningen vanligtvis vara ett bättre val på grund av dess fetare svansar. I fallet med en proportion finns det dock bara en parameter, $ p $, som uppskattas, eftersom formeln för Bernouilli-avvikelsen är helt beroende av $ p $ som $ p \, (1 -p) $. Detta förklaras mycket snyggt här.
Felmarginal:
Felmarginalen är helt enkelt "radien" (eller halva bredden) av ett konfidensintervall för en viss statistik, i det här fallet är exemplets andel:
$ \ text {ME} _ {\ text {@ 95% CI }} = 1,96 \, \ sqrt {\ frac {p \, (1-p)} {n}} $.
Grafiskt,
samplingsfel mäter i vilken utsträckning ett provstatistik skiljer sig från parametern som uppskattas, å andra sidan, försök att kvantifiera variationen mellan provstatistik från samma population
Med @Antoni Parelladas exempel på samplingsandel, $ \ hat {p} $ ,
Standardfelet i provet definieras som:
$$ \ hat {SE} = \ sqrt {\ frac {\ hat {p} (1- \ hat {p})} {n}} $$
Felmarginalen använder z-poängen vid en viss konfidensnivå $ \ alpha $ (t.ex. $\ alpha = $ 0,05 motsvarar en 95% CI):
$$ M = z _ {\ alpha / 2} \ cdot \ hat {SE} $$
Felmarginalen är halvbredden av konfidensintervallet [för samplingsandelen i detta fall]:
$$ \ hatt {p} \ pm M $$
Felmarginalen är mängden som läggs till och subtraheras i ett konfidensintervall. Standardfelet är standardavvikelsen för provstatistiken om vi kunde ta många prover av samma storlek.