Låt oss först se till att vi är överens om definitioner. Tänk på en binär slumpmässig variabel $ Y \ sim \ text {Ber} (p) $ och överväg en förlustfunktion $ L (y_i | s) $ , där $ s $ är en uppskattning av $ p $ med uppgifterna. I dina exempel är $ s $ en funktion av observerade data $ y_1, \ dots, y_n $ med $ s = \ hat {p} $ . Brier-poängförlustfunktionen är $ L_b (y_i, s) = | y_i - s | ^ 2 $ , och den absoluta förlustfunktionen är $ L_a (y_i | s) = | y_i - s | $ . En förlustfunktion har en förväntad förlust $ E_Y (L (Y | s)): = R (p | s) $ . En förlustfunktion är en perper poängregel om den förväntade förlusten $ R (p | s) $ minimeras med avseende på $ s $ genom att ställa in $ s = p $ för alla $ p \ in (0,1) $ .
Ett praktiskt knep för att verifiera detta är att använda den binära karaktären av $ Y $ , som för alla förväntade förluster har vi
$$ R (p | s) = pL (1 | s) + (1-p) L (0 | s) $$
Låt oss börja med att verifiera att Bier-förlustfunktionen är en korrekt poängregel. Observera att $ L_b (1 | s) = | 1-s | ^ 2 = (1-s) ^ 2 $ och $ L_b (0 | s) = s ^ 2 $ , så med hjälp av ovanstående har vi
$$ R_b (p | s) = p (1-s) ^ 2 + (1-p) s ^ 2 $$
och tar derivat av den funktionen wrt till $ s $ och inställningen till $ 0 $ ger dig att valet av $ s = p $ minimerar den förväntade risken. Så Brier-poängen är verkligen en riktig poängregel.
Däremot, när vi påminner om den binära karaktären av $ Y $ , kan vi skriva den absoluta förlusten $ L_a $ span> som
$$ L_a (y | s) = y (1-s) + (1-y) s $$
som $ y \ i \ {0,1 \} $ . Som sådan har vi det
$$ R_a (p | s) = p (1-s) + (1-p) s = p + s - 2ps $$
Tyvärr minimeras $ R_a (p | s) $ inte av $ s = p $ , och genom att överväga kantfall kan du visa att $ R_a (p | s) $ minimeras med $ s = 1 $ när $ p>.5 $ , och av $ s = 0 $ när $ p<.5 $ och håller för val av $ s $ när $ p = .5 $ .
Så för att svara på dina frågor är absolut förlust inte en ordentlig poängregel, och det behöver inte med antalet utmatningskategorier. När det gäller huruvida det kan brottas kan jag verkligen inte tänka på ett sätt ... Jag tror att sådana försök att tänka på liknande tillvägagångssätt förmodligen leder dig till Brier-poängen :).
Edit:
Som svar på OP: s kommentar, notera att den absoluta förlustmetoden i grunden uppskattar medianen för $ Y $ , som i binär fallet förväntas antingen $ 0 $ eller $ 1 $ beroende på $ p $ . Den absoluta förlusten straffar bara inte det alternativa valet tillräckligt för att du vill välja något annat än det värde som dyker upp mest. Däremot straffar det kvadrerade felet alternativet tillräckligt för att hitta en mellanliggande väg som sammanfaller med medelvärdet $ p $ . Detta bör också markera att det inte är något fel med att använda absolut förlust som klassificerare, och du kan tänka på det relaterat till att bestämma, för ett givet problem, om du bryr dig mer om medelvärdet eller medianen. För binär data skulle jag personligen säga att medelvärdet är mer intressant (att veta medianen säger om p > .5, men att veta medelvärdet säger ett mer exakt uttalande om $ p $ ), men det beror på det. Som det andra inlägget också betonar är det inget fel med absolut förlust, det är bara inte en ordentlig poängregel.