"Standard", den mest använda och beskrivna, fördelningen av val för räkningsdata är Poisson-distributionen. Oftast illustreras det med exempel på dess första praktiska användning:
En praktisk tillämpning av denna distribution gjordes av Ladislaus Bortkiewicz 1898 när han fick i uppdrag att undersöka antalet soldater i Preussisk armé dödades av misstag av hästsparkar; detta experiment introducerade Poisson-fördelningen till området tillförlitlighetsteknik.
Poisson-fördelningen parametriseras av hastigheten $ \ lambda $ per fast tidsintervall ($ \ lambda $ är också dess medelvärde och varians) . Vid regression kan vi använda Poisson-distribution i generaliserad linjär modell med log-linjär länkfunktion
$$ E (Y | X, \ beta) = \ lambda = \ exp \ left (\ beta_0 + \ beta_1 X_1 + \ dots + \ beta_k X_k \ right) $$
som kallas Poisson-regression, eftersom vi kan anta att $ \ lambda $ är en Poisson-fördelning. Observera dock att för log-linjär regression behöver du inte göra ett sådant antagande och helt enkelt använda GLM med logglänk med icke-räknedata. När du tolkar parametrarna måste du komma ihåg att förändringar i oberoende variabler på grund av användning av loggtransform resulterar i multiplikativa förändringar i de förutspådda räkningarna.
Problemet med att använda Poisson-distribution för verkliga data är det antar att medelvärdet är lika med variansen. Brott mot detta antagande kallas överdispersion . I sådana fall kan du alltid använda kvasi-Poisson -modell, icke-Poisson log-linjär modell (för stora räkningar kan Poisson approximeras med normalfördelning), negativ binomiell regression (nära relaterad till Poisson; se Berk och MacDonald, 2008), eller andra modeller, som beskrivs av Stephan Kolassa .
För lite vänlig introduktion till Poisson-regression kan du också kolla in papper av Lavery (2010) eller Coxe , West och Aiken (2009).
Lavery, R. (2010). En animerad guide: En introduktion till Poisson-regression. NESUG-papper, sa04.
Coxe, S., West, S.G., & Aiken, L.S. (2009). Analysen av räkningsdata: En mild introduktion till Poisson-regression och dess alternativ. Tidsskrift för personlighetsbedömning, 91 (2), 121-136.
Berk, R., & MacDonald, J. M. (2008). Overdispersion and Poisson regression. Journal of Quantitative Criminology, 24 (3), 269-284.