Den ena är en förutsägelse av en framtida observation, och den andra är ett förutsagt medelrespons. Jag kommer att ge ett mer detaljerat svar för att förhoppningsvis förklara skillnaden och varifrån den kommer, liksom hur denna skillnad manifesterar sig i bredare intervall för förutsägelse än för förtroende.
Det här exemplet kan illustrera skillnaden mellan förtroende och förutsägelseintervall: antag att vi har en regressionsmodell som förutsäger huspriset baserat på antal sovrum, storlek osv. Det finns två typer av förutsägelser vi kan göra för en given $ x_0 $:
-
Vi kan förutsäga priset för ett specifikt nytt hus som kommer på marknaden med egenskaper $ x_0 $ ( "vad är det förutspådda priset för detta hus $ x_0 $?" ). Dess sanna pris är $$ y = x_0 ^ T \ beta + \ epsilon $$. Eftersom $ E (\ epsilon) = 0 $ kommer det förutspådda priset att vara $$ \ hat {y} = x_0 ^ T \ hat {\ beta} $$ Vid bedömningen av variansen av denna förutsägelse måste vi inkludera vår osäkerhet om $ \ hat {\ beta} $, liksom vår osäkerhet om vår förutsägelse (felet i vår förutsägelse) och så måste inkludera variansen av $ \ epsilon $ (felet i vår förutsägelse). Detta kallas vanligtvis prediction of a future value.
-
Vi kan också förutsäga genomsnittspriset för ett hus med egenskaper $ x_0 $ ( "vad skulle vara genomsnittspriset för ett hus med egenskaper $ x_0 $?" ). Poänguppskattningen är fortfarande $$ \ hat {y} = x_0 ^ T \ hat {\ beta} $$, men nu behöver endast variansen i $ \ hat {\ beta} $ redovisas. Detta kallas vanligtvis prediction of the mean response.
De flesta gånger är vad vi verkligen vill ha det första fallet. Vi vet att $$ var (x_0 ^ T \ hat {\ beta}) = x_0 ^ T (X ^ TX) ^ {- 1} x_0 \ sigma ^ 2 $$
Detta är variansen för vårt medelsvar (fall 2).Men för en förutsägelse av en framtida observation (fall 1), kom ihåg att vi behöver variansen av $ x_0 ^ T \ hat {\ beta} + \ epsilon $;$ \ epsilon $ har varians $ \ sigma ^ 2 $ och antas vara oberoende av $ \ hat {\ beta} $.Med en enkel algebra resulterar detta i följande konfidensintervall:
-
CI för ett framtida svar för $ x_0 $: $$ \ hat {y} _0 \ pm t_ {np} ^ {(\ alpha / 2)} \ hat {\ sigma} \ sqrt {x_0^ T (X ^ TX) ^ {- 1} x_0 + 1} $$
-
CI för det medelsvar som ges $ x_0 $: $$ \ hat {y} _0 \ pm t_ {np} ^ {(\ alpha / 2)} \ hat {\ sigma} \ sqrt {x_0 ^T (X ^ TX) ^ {- 1} x_0} $$
Där $ t_ {n-p} ^ {\ alpha / 2} $ är en t-statistik med $ n-p $ frihetsgrader vid kvantiteten $ \ alpha / 2 $.
Detta förhoppningsvis gör det lite tydligare varför förutsägelsesintervallet alltid är bredare och vad den underliggande skillnaden mellan de två intervallen är.Detta exempel anpassades från Faraway, Linear Models with R, Sec.4.1.