user28

2010-07-20 00:42:28 UTC

view on stackexchange narkive permalink

Så här förklarar jag den grundläggande skillnaden för min mormor:

Jag har placerat min telefon någonstans i hemmet. Jag kan använda telefonsökaren på instrumentets bas för att lokalisera telefonen och när jag trycker på telefonsökaren börjar telefonen pipa.

Problem: Vilket område i mitt hem ska jag söka?

Resonemang frekventist

Jag hör att telefonen piper. Jag har också en mental modell som hjälper mig att identifiera det område från vilket ljudet kommer. Därför, när jag hör pipet, drar jag slut på det område i mitt hem som jag måste söka för att hitta telefonen.

Bayesian resonemang

Jag kan höra telefonen pipa. Nu, förutom en mental modell som hjälper mig att identifiera det område ljudet kommer ifrån, känner jag också till de platser där jag tidigare har placerat telefonen fel. Så jag kombinerar mina slutsatser med pip och min tidigare information om de platser jag tidigare har placerat telefonen för att identifiera ett område jag måste söka för att hitta telefonen.

Jag gillar analogin. Jag skulle tycka att det var mycket användbart om det fanns en definierad fråga (baserad på en dataset) där ett svar härleddes med frekvent resonemang och ett svar härleddes med Bayesian - helst med R-skript för att hantera båda resonemanget. Frågar jag för mycket?

Det enklaste jag kan tänka mig att kasta ett mynt n gånger och uppskatta sannolikheten för ett huvuden (betecknas med p). Antag att vi observerar k-huvuden. Då är sannolikheten för att få k-huvuden: P (k-huvuden i n-försök) = (n, k) p ^ k (1-p) ^ (nk) Frekvensistanslutning skulle maximera ovanstående för att nå en uppskattning av p = k / n.Bayesian skulle säga: Hej, jag vet att p ~ Beta (1,1) (vilket motsvarar antagandet att p är enhetligt på [0,1]). Så den uppdaterade slutsatsen skulle vara: p ~ Beta (1 + k, 1 + n-k) och därmed den bayesiska uppskattningen av p skulle vara p = 1 + k / (2 + n) Jag känner inte R, förlåt.

Det bör påpekas att det från frekventistsynpunkt inte finns någon anledning att du inte kan införliva förkunskaperna * i * modellen. I den meningen är frekvensistens syn enklare, du har bara en modell och lite data. Det finns inget behov av att separera den tidigare informationen från modellen.

@user28 Som en kommentar till din kommentar, om $ n = 3 $, skulle frekvensen uppskatta $ p = 0 $ (respektive $ p = 1 $) efter att ha sett ett resultat av $ k = 0 $ huvuden (respektive $ k = 3 $ huvuden), det vill säga myntet är tvåhuvigt eller tvåstjärtat. Bayesian uppskattar $ 1/5 $ respektive $ 4/5 $ möjliggör möjligheten att det är ett något mindre partiskt mynt.

@Farrel - den senaste frågan på http://stats.stackexchange.com/questions/21439/estimating-probability-of-success-given-a-reference-population/21466#21466 och mitt svar i två delar (oavsiktligt) är ett trevligt enkelt exempel på detta. Det skulle vara ganska enkelt att slå ihop ett exempel på dataset och R-skript som visar de två tillvägagångssätten.

@user28 - när du säger "Jag vet inte R", vad hänvisar du till med bokstaven "R"?

@BYS2 Programmeringsspråket som heter R.

Jag lade nyligen upp en fråga om ett Bayesian-exempel som liknar det här men lite annorlunda på ett intressant sätt.En fiskare är förlorad till sjöss och kustbevakningen söker efter honom med en modell och uppdaterar sedan modellen när de gör sökningar ... så att de kombinerar vad deras modell förutsäger baserat på havsströmmar / vind med "tidigare information" om varde sökte redan.http://stats.stackexchange.com/q/119952/25734

Exemplet är trevligt men bör verkligen börja i början;Antag att du inte har några data ("inga pip"), kan du göra en sannolik slutsats?Ja, det kan du, säger Bayesian, för du har förkunskaper om var du brukar lämna din telefon (mycket troligt) - men nej, det kan du inte om du är en frekvent, eftersom bara data är slumpmässiga.- Det är här (jag finner) att man ser "skönheten" och konsistensen av Bayesian resonemang, eftersom probabilistisk slutsats utan nya data är naturlig och Bayesian integrerar snyggt hur nya data (pip) ska påverka slutningen.

Som kommenterades redan 2010, ur frekvensistsynpunkt finns det ingen anledning att du inte kan införliva förkunskaperna i modellen.Här ett exempel på att uttryckligen använda informativa priors i ferquentistiska resonemang: Använda förkunskaper i frekventistiska tester.figshare. https://doi.org/10.6084/m9.figshare.4819597.v3 Se även alternativa definitioner i andra svar nedan.

Det bör nämnas att vilken modell som väljs beror på applikationen.Om en strikt noggrannhet önskas, utan att bry sig om biverkningar, bör Bayesian-modellen användas.Om du vill behålla en "rättvis" distribution när du vidtar åtgärder baserade på slutsatser kan frekventmodellen vara nödvändig.Det kan till exempel vara sant att om man tar hänsyn till ras för att bestämma någons skuld på ett brott kan det öka noggrannheten i en sannolik gissning, det skapar också större falska negativ och falska positiva för olika raser.Effekter av vidtagna åtgärder kommer att påverka distributionen.

Dikran Marsupial

2010-08-12 19:53:36 UTC

view on stackexchange narkive permalink

Tunga fast i kinden:

En Bayesian definierar en "sannolikhet" på exakt samma sätt som de flesta icke-statistiker gör - nämligen en indikation på sannolikheten för en proposition eller en situation. Om du ställer honom en fråga kommer han att ge dig ett direkt svar med tilldelning av sannolikheter som beskriver sannolikheten för de möjliga resultaten för den specifika situationen (och ange sina tidigare antaganden).

En frekventist är någon som tror att sannolikheter representerar långsiktiga frekvenser med vilka händelser inträffar; om det behövs kommer han att uppfinna en fiktiv befolkning från vilken din specifika situation kan betraktas som ett slumpmässigt urval så att han meningsfullt kan prata om långsiktiga frekvenser. Om du ställer honom en fråga om en viss situation, kommer han inte att ge ett direkt svar, utan i stället göra ett uttalande om denna (möjligen imaginära) befolkning. Många icke-frekventistiska statistiker kommer lätt att förväxlas av svaret och tolkar det som Bayesians sannolikhet om den speciella situationen. ge i princip samma resultat, skillnaden är till stor del en fråga om filosofi, och i praktiken handlar det om "hästar för kurser".

Som ni kanske har gissat är jag en Bayesian och ingenjör. ; o)

Som icke-expert tror jag att nyckeln till hela debatten är att människor faktiskt resonerar som Bayesians. Du måste utbildas för att tänka som en frekventist, och även då är det lätt att glida upp och antingen resonera eller presentera ditt resonemang som om det var Bayesian. "Det finns en 95% chans att värdet ligger inom detta konfidensintervall." Nog sagt.

Nyckeln är också att tänka på vilken typ av lobbying som statistiken från 1900-talet kallas "klassisk" medan statistiken som Laplace och Gauss har börjat använda på 1800-talet inte är ...

Kanske har jag jobbat frekvent för länge, men jag är inte så säker på att Bayesians synvinkel alltid är intuitiv.Antag till exempel att jag är intresserad av en intressant parameter av verklig värld, som en befolknings genomsnittlig höjd.Om jag säger dig "det finns 95% chans att parametern är intresserad av mitt trovärdiga intervall" och följer sedan upp med en fråga om "Om vi skapade 100 sådana intervall för olika parametrar, hur stor andel av dem skulle vi förvänta oss att innehållade verkliga värdena för parametern? ", det faktum att svaret är ** inte ** 95 måste vara förvirrande för vissa människor.

@CliffAB men varför skulle du ställa den andra frågan?Poängen är att de är olika frågor, så det är inte förvånande att de har olika svar.Baysian kan svara på båda frågorna, men svaret kan vara annorlunda (vilket verkar rimligt för mig).Frekvensen kan bara svara på en av frågorna (på grund av den begränsande definitionen av sannolikhet) och använder därför (implicit) samma svar för båda frågorna, vilket är orsaken till problemen.Ett trovärdigt intervall är inte ett konfidensintervall, men en Bayesian kan konstruera * både * ett trovärdigt intervall och ett konfidensintervall.

Min kommentar var som svar på Waynes;tanken att människor "naturligt" tänker i Bayes-sammanhang, eftersom det är lättare att tolka ett trovärdigt intervall.Min poäng är att även om det är enklare att konstruera rätt tolkning av ett trovärdigt intervall (dvs. mindre ordsoppa), tror jag att icke-statistikern är lika sannolikt förvirrad över vad det * egentligen * betyder.

@CliffAB, ah, jag ser dock, men om du tänker så för att du har gjort frekvent arbete för länge, tyder det snarare på att ditt sätt att tänka på sannolikhet inte är ditt naturliga, utan ett som du har lärt dig och vant dig.Jag tror inte att jag håller med om slutsatsen, det vanliga missförståndet av ett konfidensintervall är just det att tolka det som ett trovärdigt intervall, dvs ett intervall som sannolikt innehåller det verkliga värdet med ett givet förtroende.På samma sätt uppstår felaktigheten p-värde genom att tolka ett frekventisttest på ett Bayesiskt sätt.

Min poäng är mer att jag tror att bara en statistiker (Frequentist eller Bayesian) skulle tro att uttalandena "om X händer 1 av 100 gånger, är sannolikheten X händer 1/100" och "sannolikhet är ett mått på osäkerhet" är inte kompatiblauttalanden.Så det blir väldigt svårt att säga att den ena tolkningen är mer "naturlig" än den andra.Jag tror att de flesta inte naturligtvis tycker att det finns en åtskillnad.

I själva verket behöver du inte leta långt för att hitta en hardcore (den svåraste kärnan?) Bayesian [av misstag säger en frekventistisk uppfattning gör det lättare att förstå vad "slumpmässig" betyder.] (Http: //www.bayesianphilosophy.com / trick-for-making-sense-of-statistics /)

@CliffAB de två påståendena är inte oförenliga inom en Bayesiansk definition (längs körfrekvens är ett rimligt sätt att representera en osäker grad av tro där en långsiktig frekvens finns), men de är under en frekvent, vilket snarare gör min poäng att Bayesianramen är mer naturlig.Observera att jag är en "häst för kurs" -man, så det finns vissa saker som lättare kan förklaras i frekventa termer än Bayesian.

Graham Cookson

2010-07-21 20:50:43 UTC

view on stackexchange narkive permalink

Mycket grovt skulle jag säga att:

Frequentist: Provtagningen är oändlig och beslutsreglerna kan vara skarpa. Data är ett repeterbart slumpmässigt urval - det finns en frekvens. Underliggande parametrar är fasta, dvs de förblir konstanta under denna repeterbara provtagningsprocess.

Bayesian: Okända mängder behandlas probabilistiskt och världens tillstånd kan alltid uppdateras. Data observeras från det realiserade provet. Parametrar är okända och beskrivs probabilistiskt. Det är uppgifterna som fixas.

Det finns ett lysande blogginlägg som ger ett djupgående exempel på hur en Bayesian och Frequentist skulle ta itu med samma problem. Varför inte svara på problemet själv och sedan kolla?

Problemet (hämtat från Panos Ipeirotis blogg):

Du har ett mynt som när det vänds hamnar huvudet med sannolikhet $ p $ och slutar svansen med sannolikhet $ 1-p $ . (Värdet av $ p $ är okänt.)

Försöker uppskatta $ p $ span> vänder du myntet 100 gånger. Det hamnar huvudet 71 gånger.

Då måste du bestämma dig för följande händelse: "I de kommande två kasten får vi två huvuden i rad."

Skulle du satsa på att händelsen kommer att inträffa eller att den inte kommer att hända?

Eftersom $ 0,71 ^ 2 = 0,5041 $, skulle jag betrakta detta som tillräckligt nära en jämn satsning för att vara beredd att gå blygsamt åt båda hållen bara för skojs skull (och att ignorera alla problem i form av föregående). Jag köper ibland försäkringar och lotter med mycket sämre odds.

I slutet av det blogginlägget står det "istället för att använda den enhetliga fördelningen som tidigare kan vi vara ännu mer agnostiska. I det här fallet kan vi använda Beta (0,0) -distributionen som tidigare. En sådan fördelning motsvarar till det fall där något medelvärde för fördelningen är lika troligt. I detta fall ger de två tillvägagångssätten, Bayesian och frekventist samma resultat. " vilken typ av summerar det verkligen!

Det * stora * problemet med det blogginlägget är att det inte adekvat karaktäriserar vad en icke-Bayesisk (men rationell) beslutsfattare skulle göra. Det är lite mer än en halmman.

@tdc: Bayesian (Jeffreys) prior är Beta (0,5, 0,5) och vissa skulle säga att det är den enda berättigade prior.

Vad betyder "skarp"?

@mcb - exakt.

[Beta (.5, .5)] (https://en.wikipedia.org/wiki/Beta_distribution) ser inte alls ut som en lämplig prior för _p_ av ett mynt.(Jag antar att det är tänkt att vara en ["uninformativ" föregående] (https://en.wikipedia.org/wiki/Prior_probability#Uninformative_priors) men det är inte uninformativ i vardaglig mening, det är snarare "opinionated" att p är nära 0eller 1, en åsikt som verkar fel.)

Tony Breyal

2010-07-20 04:40:01 UTC

view on stackexchange narkive permalink

Låt oss säga att en man rullar en sexsidig matris och den har resultatet 1, 2, 3, 4, 5 eller 6. Dessutom säger han att om den landar på en 3, ger han dig en fritext bok.

Då informellt:

Frequentist skulle säga att varje utfall har lika 1 till 6 chans att inträffa. Hon ser sannolikheten som härledd från långsiktiga frekvensfördelningar.

Bayesian men skulle säga hänga på en sekund, jag vet att mannen, han är David Blaine, en berömd trickster! Jag känner att han gör något. Jag ska säga att det bara är 1% chans att det landar på en 3 MEN Jag ska omvärdera denna tro och ändra den ju fler gånger han rullar formen. Om jag ser att de andra siffrorna kommer upp lika ofta, ökar jag chansen iterativt från 1% till något högre, annars minskar jag det ytterligare. Hon ser sannolikheten som grader av tro på en proposition.

Jag tror att frekventisten (ordligt) skulle påpeka sina antaganden och skulle undvika att göra någon användbar förutsägelse. Kanske skulle han säga, "förutsatt att matrisen är rättvis, har varje utfall lika 1 till 6 chans att inträffa. Dessutom, om matrullarna är rättvisa och David Blaine rullar matrisen 17 gånger, finns det bara 5% chans att det kommer aldrig att landa på 3, så ett sådant resultat skulle få mig att tvivla på att matrisen är rättvis. "

Så skulle "sannolikhet" (som i MLE) vara frekvensistens "sannolikhet"?

Kunde inte frekvensen använda en hypotetisk David Blaine tärningsmodell och inte nödvändigtvis en enhetlig tärningsmodell?

Brett

2010-12-04 09:06:01 UTC

view on stackexchange narkive permalink

Bara lite kul ...

En Bayesian är en som vagt förväntar sig en häst och få en glimt av en åsna, tror starkt att han har sett en mula.

Från denna webbplats:

http://www2.isye.gatech.edu/~brani/isyebayes/jokes.html

och från samma webbplats, en trevlig uppsats ...

"En intuitiv förklaring av Bayes teorem"

http://yudkowsky.net/rational/bayes

I vilket fall skulle inte frekvensen vara en som känner till förhållandet mellan åsna-, mul- och hästpopulationer, och efter att ha observerat en förpackning med mulor börjar beräkna p-värdet för att veta om det har skett en statistiskt signifikant ökning i populationsförhållandet mellan mulor.

Detta svarar inte alls på frågan.

mcdowella

2010-12-04 12:54:30 UTC

view on stackexchange narkive permalink

Bayesianen ombeds att satsa, som kan innehålla allt från vilket flugan kommer att krypa upp en vägg snabbare till vilken medicin kommer att rädda de flesta liv, eller vilka fångar som ska gå i fängelse. Han har en stor låda med handtag. Han vet att om han lägger absolut allt han vet i lådan, inklusive hans personliga åsikt, och vrider handtaget, kommer det att göra det bästa möjliga beslutet för honom.

Frekvensen ombeds att skriva rapporter. Han har en stor svart bok med regler. Om situationen han blir ombedd att göra en rapport om omfattas av hans regelbok kan han följa reglerna och skriva en rapport så noggrant formulerad att den är i värsta fall fel en gång i 100 (eller en gång i 20, eller en tid oavsett specifikationen för hans rapport säger. kunde bli dåligt. Frekvensen vet också (av samma anledning) att om han satsar mot Bayesian varje gång han skiljer sig från honom, så kommer han på lång sikt att förlora.

"på lång sikt kommer han att förlora" är tvetydigt.Jag antar att "han" är bayesian här?Skulle de inte utjämna på lång sikt - bayesianen kunde lära sig och ändra sin personliga upptagning tills den matchar de faktiska (men okända) fakta.

Vad är den grundläggande skillnaden mellan en stor låda och en stor regelbok?Jag kan inte förstå analogin.

probabilityislogic

2011-08-28 20:51:24 UTC

view on stackexchange narkive permalink

På vanlig engelska skulle jag säga att Bayesian och Frequentist resonemang utmärks av två olika sätt att besvara frågan:

Vad är sannolikhet?

De flesta skillnader kommer i huvudsak att gå ner på hur var och en svarar på den här frågan, för den definierar i princip domänen för giltiga tillämpningar av teorin. Nu kan du inte riktigt ge något av svaren i termer av "vanlig engelska" utan att ytterligare generera fler frågor. För mig är svaret (som du förmodligen kan gissa)

sannolikhet är logik

min "icke-klara engelska" anledning till detta är att beräkningen av propositioner är ett speciellt fall av sannolikhetsberäkningen, om vi representerar sanningen med $ 1 $ och falskheten med $ 0 $. Dessutom kan beräkningen av sannolikheter härledas från beräkningen av propositioner. Detta överensstämmer med det "bayesiska" resonemanget närmast - även om det också utvidgar det bayesiska resonemanget i applikationer genom att tillhandahålla principer för att tilldela sannolikheter, utöver principer för att manipulera dem. Naturligtvis leder detta till uppföljningsfrågan "vad är logik?" för mig är det närmaste jag kan ge som svar på denna fråga "logik är sunt förnuft bedömningar av en rationell person, med en viss uppsättning antaganden" (vad är en rationell person? etc. etc.). Logik har alla samma funktioner som Bayesian resonemang har. Logiken säger till exempel inte vad du ska anta eller vad som är "helt sant". Den berättar bara hur sanningen i en proposition är relaterad till sanningen i en annan. Du måste alltid tillhandahålla ett logiskt system med "axiomer" för att det ska komma igång med slutsatserna. De har också samma begränsningar genom att du kan få godtyckliga resultat från motsägelsefulla axiom. Men "axiomer" är inget annat än tidigare sannolikheter som har ställts till $ 1 $. Att avvisa Bayesiansk resonemang är för mig att avvisa logik. För om du accepterar logik måste du också acceptera Bayesianskt resonemang "logiskt från logik" (hur är det för vanlig engelska: P).

För frekvent resonemang har vi svaret:

sannolikhet är frekvens

även om jag inte är säker på att "frekvens" är en vanlig engelsk term på det sätt som den används här - kanske "proportion" är ett bättre ord. Jag ville lägga till i det frekventistiska svaret att sannolikheten för en händelse anses vara en verklig, mätbar (observerbar?) Kvantitet, som existerar oberoende av personen / objektet som beräknar den. Men jag kunde inte göra detta på ett "vanligt engelska" sätt.

Så kanske en "vanlig engelsk" version av en kan skillnaden vara att frekvent resonemang är ett försök att resonera från "absoluta" sannolikheter, medan bayesian resonemang är ett försök att resonera från "relativa" sannolikheter.

En annan skillnad är att frekventistiska grunder är mer vaga i hur du översätter det verkliga världsproblemet till teorins abstrakta matematik. Ett bra exempel är användningen av "slumpmässiga variabler" i teorin - de har en exakt definition i den abstrakta världen av matematik, men det finns inget entydigt förfarande man kan använda för att avgöra om någon observerad kvantitet är eller inte är en "slumpmässig variabel ".

Det bayesiska resonemanget, begreppet" slumpmässig variabel "är inte nödvändigt. En sannolikhetsfördelning tilldelas en kvantitet eftersom den är okänd - vilket innebär att den inte kan härledas logiskt från den information vi har. Detta ger på en gång en enkel koppling mellan den observerbara kvantiteten och teorin - eftersom "att vara okänd" är entydig.

Du kan också se i ovanstående exempel en ytterligare skillnad i dessa två sätt att tänka - "slumpmässigt" mot "okänt". "slumpmässighet" formuleras på ett sådant sätt att "slumpmässigheten" verkar som om den är en egenskap för den faktiska kvantiteten. Omvänt beror "att vara okänd" på vilken person du frågar om den kvantiteten - därför är det statistikens egenskap som gör analysen. Detta ger upphov till de "objektiva" kontra "subjektiva" adjektiv som ofta fästs vid varje teori. Det är lätt att visa att "slumpmässighet" inte kan vara en egenskap hos vissa standardexempel, genom att helt enkelt be två frekventister som får olika information om samma kvantitet att avgöra om det är "slumpmässigt". En är den vanliga Bernoulli Urn: frekventist 1 har ögonbindel medan man ritar, medan frekvent 2 står över urnen och ser frekventist 1 dra bollarna från urnen. Om deklarationen om "slumpmässighet" är en egenskap hos bollarna i urnen, kan det inte bero på den olika kunskapen hos frekventist 1 och 2 - och därför bör de två frekventisterna ge samma deklaration av "slumpmässig" eller "inte slumpmässig" .

Jag skulle vara intresserad om du skulle kunna skriva om detta utan hänvisning till sunt förnuft.

@PeterEllis - Vad är fel med sunt förnuft? Vi har alla det, och det är vanligtvis dumt att inte använda det ...

Det är för omtvistat vad det egentligen är, och för kulturellt specifikt. "Sunt förnuft" är en kort hand för vad som helst som uppfattas som förnuftigt sätt att göra saker i just den här kulturen (som alltför ofta ser långt ifrån förnuftig ut för en annan kultur i tid och rum), så att hänvisa till det i en definition ankar nyckelfrågorna . Det är särskilt ohjälpsamt som en del av en definition av logik (och så skulle jag påstå att begreppet "rationell person" i det specifika sammanhanget - speciellt eftersom jag antar att din definition av "rationell person" skulle vara en logisk person vem har sunt förnuft!)

Jag förstår inte varför det är dåligt att använda sunt förnuft. med hjälp av din definition av det, varför skulle vi inte vilja göra det som är förnuftigt just då? Och vad är "nyckelfrågorna" som undviks? du säger att sunt förnuft inte har någon väldefinierad mening, och gå sedan och ge en!

Han kan inte tillhandahålla en, hans argument är att _Det finns ingen universell definition_, bara kulturspecifika. Två personer med olika kulturell bakgrund (och det inkluderar olika stilar av statistisk utbildning) kommer troligen att ha två olika förståelser för vad som är förnuftigt att göra i en given situation.

Detta svar har nuggets av godhet (hur är det för vanlig engelska?), Men jag tror inte (hur är det för att vara Bayesian!) Att följande uttalande är sant: "För om du accepterar logik ... måste du också accepteraBayesian resonemang ".Till exempel, om du tänker istället för att översätta den abstrakta teorin om matematiken till den verkliga världen, kommer du att upptäcka att det axiomatiska tillvägagångssättet kan överensstämma med både Frequentist och Bayesian resonemang!Förmodligen Kolmogorov i det första fallet, och säg Jeffreys i det andra fallet.I grund och botten är det sannolikhetsteorin som är logik;inte dess tolkning.

Jag gillar det sista 3 stycket, särskilt det sista stycket.Detta är också hur jag så småningom övertygar mig själv om att sannolikheten är en subjektiv tro, dvs olika människor har olika informationsuppsättningar om en händelse och därför kan de ha olika tro på sannolikheten för att händelsen inträffar.Jag använde samma exempel, bolldragningen från urnan med två personer

Detta svar antyder att Kolmogorovs sannolikhet är nödvändigtvis Bayesian men det är inte nödvändigtvis.

Aaron McDaid

2012-06-26 23:36:44 UTC

view on stackexchange narkive permalink

I själva verket tror jag att mycket av filosofin kring frågan bara är enastående. Det är inte för att avfärda debatten, men det är ett ord av försiktighet. Ibland prioriterar praktiska frågor - jag ska ge ett exempel nedan.

Du kan också lika gärna argumentera för att det finns mer än två tillvägagångssätt:

Neyman- Pearson ("frekventist")
Sannolikhetsbaserade tillvägagångssätt
Helt Bayesian

En seniorkollega påminde mig nyligen om att "många människor på vanligt språk prata om frekventist och Bayesian. Jag tror att en mer giltig åtskillnad är sannolikhetsbaserad och frekventist. Både maximal sannolikhet och Bayesiska metoder följer sannolikhetsprincipen medan frekventistiska metoder inte gör det. p> Jag börjar med ett mycket enkelt praktiskt exempel:

Vi har en patient. Patienten är antingen frisk (H) eller sjuk (S). Vi kommer att utföra ett test på patienten och resultatet blir antingen positivt (+) eller negativt (-). Om patienten är sjuk får de alltid ett positivt resultat. Vi kallar detta rätt (C) resultat och säger att $$ P (+ | S) = 1 $$ eller $$ P (Rätt | S) = 1 $$ Om patienten är frisk, kommer testet att vara negativt 95% av tiden, men det kommer att finnas några falska positiva effekter. $$ P (- | H) = 0,95 $$$$ P (+ | H) = 0,05 $$ I andra verk är sannolikheten för att testet är korrekt, för friska människor, är 95%.

Så testet är antingen 100% korrekt eller 95% korrekt, beroende på om patienten är frisk eller sjuk. Sammantaget betyder det att testet är minst 95% korrekt.

Hittills så bra. Det är de uttalanden som en frekventist skulle göra. Dessa uttalanden är ganska enkla att förstå och är sanna. Det finns inget behov av att våffla om en "frekvent tolkning".

Men saker blir intressanta när du försöker vända på saker. Med tanke på testresultatet, vad kan du lära dig om patientens hälsa? Med tanke på ett negativt testresultat är patienten uppenbarligen frisk, eftersom det inte finns några falska negativ.

Men vi måste också överväga fallet där testet är positivt. Var testet positivt eftersom patienten faktiskt var sjuk, eller var det falskt positivt? Det är här frekventisten och Bayesianen skiljer sig åt. Alla är överens om att detta inte kan besvaras just nu. Frekvensen kommer att vägra att svara. Bayesianen kommer att vara beredd att ge dig ett svar, men du måste ge Bayesianen en förhandsgranskning först - dvs berätta vilken andel av patienterna som är sjuka.

För att sammanfatta är följande uttalanden sanna :

För friska patienter är testet mycket exakt.
För sjuka patienter är testet mycket exakt.

Om du är nöjd med uttalanden som det, då använder du frekventistiska tolkningar. Detta kan ändras från projekt till projekt, beroende på vilken typ av problem du tittar på.

Men du kanske vill göra olika uttalanden och svara på följande fråga:

För de patienter som fick ett positivt testresultat, hur exakt är testet?

Detta kräver en tidigare och en Bayesisk strategi. Observera också att detta är den enda frågan av intresse för läkaren. Läkaren kommer att säga "Jag vet att patienterna antingen kommer att få ett positivt resultat eller ett negativt resultat. Jag också nu när det negativa resultatet innebär att patienten är frisk och kan skickas hem. De enda patienterna som intresserar mig nu är de som fick ett positivt resultat - är de sjuka? ".

Sammanfattningsvis: I exempel som detta kommer Bayesianerna att hålla med om allt som frekvensen säger. Men Bayesian kommer att hävda att frekvensistens uttalanden, även om de är sanna, inte är särskilt användbara. och kommer att argumentera för att de användbara frågorna bara kan besvaras med en föregående.

En frekvent kommer att överväga varje möjligt värde för parametern (H eller S) i tur och ordning och fråga "om parametern är lika med detta värde , vad är sannolikheten för att mitt test är korrekt? "

En Bayesian kommer istället att överväga varje möjligt observerat värde (+ eller -) i tur och ordning och fråga "Om jag föreställer mig att jag just har observerat det värdet, vad säger det mig om den villkorliga sannolikheten för H-kontra-S?" / p>

Menar du "För sjuka patienter är testet INTE särskilt exakt." Glömmer du INTE?

Det är väldigt korrekt i båda fallen, så nej jag glömde inte ett ord. För friska människor kommer resultatet att vara korrekt (dvs. "negativt") 95% av tiden. Och för sjuka människor blir resultatet 95% av tiden korrekt (dvs. 'positivt').

Jag tror att "svagheten" i maximal sannolikhet är att den antar en enhetlig prioritet på data medan "full Bayesian" är mer flexibel i vilken prioritet du kan välja.

För att slutföra exemplet, anta att 0,1% av befolkningen är sjuk med D-sjukdom som vi testar för: detta är inte vår tidigare.Mer troligt att ungefär 30% av patienterna som kommer till läkaren och har symtom som matchar D faktiskt har D (detta kan vara mer eller mindre beroende på detaljer som hur ofta en annan sjukdom presenterar samma symtom).Så 70% av dem som tar testet är friska, 66,5% får ett negativt resultat och 30% / 33,5% är sjuka.Så med tanke på ett positivt resultat är vår bakre sannolikhet att en patient är sjuk 89,6%.Nästa pussel: hur visste vi att 70% av testtagarna har D?

user36160

2013-12-14 00:37:46 UTC

view on stackexchange narkive permalink

Bayesiansk och frekventistisk statistik är kompatibel genom att den kan förstås som två begränsande fall för att bedöma sannolikheten för framtida händelser baserat på tidigare händelser och en antagen modell, om man medger att det i gränsen för ett mycket stort antal observationer, ingen osäkerhet om systemet kvarstår, och att i det avseendet är ett mycket stort antal observationer lika med att känna till parametrarna för modellen.

Antag att vi har gjort några observationer, t.ex. resultat av 10 myntvändningar. I Bayesiansk statistik börjar du från vad du har observerat och sedan bedömer du sannolikheten för framtida observationer eller modellparametrar. I frekventistisk statistik utgår du från en idé (hypotes) om vad som är sant genom att anta scenarier för ett stort antal observationer som har gjorts, t.ex. mynt är opartiskt och ger 50% upp, om du kastar det många gånger. Baserat på dessa scenarier för ett stort antal observationer (= hypotes), bedömer du frekvensen för att göra observationer som den du gjorde, dvs. frekvensen för olika utfall på 10 mynt. Det är först då du tar ditt faktiska resultat, jämför det med frekvensen av möjliga resultat och bestämmer om resultatet ska tillhöra de som förväntas inträffa med hög frekvens. Om så är fallet drar du slutsatsen att observationen som görs inte strider mot dina scenarier (= hypotes). Annars drar du slutsatsen att observationen som gjorts är oförenlig med dina scenarier, och du förkastar hypotesen.

Således börjar Bayesiansk statistik från det som har observerats och bedömer möjliga framtida resultat. Frekventiststatistik börjar med ett abstrakt experiment av vad som skulle observeras om man antar något och först då jämför resultaten av det abstrakta experimentet med det som faktiskt observerades. Annars är de två metoderna kompatibla. De bedömer båda sannolikheten för framtida observationer baserat på vissa observationer som gjorts eller antagits.

Jag började skriva upp detta på ett mer formellt sätt:

Positionering av Bayesians inferens som en speciell tillämpning av frekvent inferens och vice versa. figshare.

http://dx.doi.org/10.6084/m9.figshare.867707

Manuskriptet är nytt. Om du råkar läsa den och har kommentarer, vänligen meddela mig.

Michael R. Chernick

2012-05-05 03:03:19 UTC

view on stackexchange narkive permalink

Jag skulle säga att de ser på sannolikheten på olika sätt. Bayesian är subjektiv och använder a priori-övertygelser för att definiera en tidigare sannolikhetsfördelning på möjliga värden för okända parametrar. Så han litar på en teori om sannolikhet som deFinettis. Frekvensen ser sannolikheten som något som har att göra med en begränsande frekvens baserat på en observerad andel. Detta är i linje med sannolikhetsteorin som utvecklats av Kolmogorov och von Mises.
En frekventist gör parametrisk inferens med bara sannolikhetsfunktionen. En Bayesian tar det och multiplicerar med en prior och normaliserar det för att få den bakre fördelningen som han använder för slutsats.

+1 Bra svar, men det bör betonas att Bayesian-metoden och Frekvensmetoden skiljer sig åt med avseende på deras _tolkning_ av sannolikhet.Kolmogorov å andra sidan ger ett _axiomatiskt fundament_ för sannolikhetsteorin, som inte kräver en tolkning_ (!) Som de som används av Bayesian eller Frequentist.På ett sätt har det axiomatiska systemet ett eget liv!Från Kolmogorovs sex axiomer ensam tror jag inte att det är möjligt att säga att hans axiomatiska system varken är Bayesian eller Frequentist, och faktiskt kan vara förenligt med båda.

Demetrios Papakostas

2018-04-07 19:03:53 UTC

view on stackexchange narkive permalink

Hur jag svarar på denna fråga är att frequentists jämför de data de ser med vad de förväntade sig.Det vill säga, de har en mental modell för hur frekvent något ska hända och ser sedan data och hur ofta det hände.dvs hur sannolikt är de data de har sett med tanke på den modell de valde.

Bayesian-folk, å andra sidan, kombinerar sina mentala modeller.Det vill säga, de har en modell baserad på sina tidigare erfarenheter som berättar för dem hur de tycker att data ska se ut, och sedan kombinerar de detta med de data de observerar för att slå sig ner på någon `` bakre '' tro.dvs. de finner sannolikheten att modellen de försöker välja är giltig med tanke på de data de har observerat.

Så med andra ord tittar en frekventist på $ P (data | modell) $ medan en Bayesian tittar på $ P (modell | data) $ ...?

sorta.Bayesians gör i huvudsak en P (modell | data) $ \ prop $ P (data | modell) P (modell), där P (modell) är tidigare.Ju mer jag lär mig om detta, desto mer känns mitt svar otillräckligt.Exempelvis är ett kännetecken för frekventiststatistik maximal sannolikhetsuppskattning, vilket i huvudsak ges den data jag ser, vilka modellparametrar som gör det jag såg mest troligt.Bayesians vill också detta, men de beräknar modellen genom att integrera över alla värden i parametern baserat på någon tidigare distribution av den.Frequentists väljer en modellparameter så att det de såg var mest troligt.

Emil M Friedman

2017-01-25 02:51:47 UTC

view on stackexchange narkive permalink

Frekventist: Naturens verkliga tillstånd är.Om jag vanligtvis gör sådana analyser kommer 95% av mina svar att vara korrekta.

Bayesian: Det finns en 95% chans att det sanna svaret är ... Jag baserar det på en kombination av de data dugav mig och våra tidigare gissningar om vad sanningen är.

ccrider

2015-09-20 17:28:46 UTC

view on stackexchange narkive permalink

Frequentist: satsa på tärningar. Endast tärningens värde avgör resultatet: du vinner din insats eller inte. Beroende på chansen ensam.

Bayesian: spela Texas Hold'em poker. Du är den enda som ser dina två kort. Du har viss kunskap om de andra spelarna på bordet. Du måste justera din sannolikhet för att vinna på floppen, turn och river och eventuellt enligt vilka spelare som är kvar. Bluffar de ofta? Är de aggressiva eller passiva spelare? Allt detta kommer att avgöra vad du gör. Det är inte bara sannolikheten för de två första handkort som du har, som kommer att avgöra om du vinner eller inte.

Att spela frekvent poker skulle innebära att varje spelare skulle visa sina händer i början och sedan satsa eller vika innan floppen, vänd och flodkort visas. Nu beror det bara på chansen igen om du vinner eller inte.

Yang Fu

2016-03-13 16:04:32 UTC

view on stackexchange narkive permalink

Säg, om du fick huvudvärk och gå till en läkare. Antag att det i beslutsuppsättningen av läkare finns två orsaker till huvudvärk, nr 1 för hjärntumör (en grundorsak som skapar huvudvärk 99% av tiden) och # 2 kall (en orsak som kan skapa huvudvärk hos väldigt få patienter) .

Då skulle läkarnas beslut baserade på frekventistiska tillvägagångssätt vara, du har hjärntumör.

Läkarens beslut baserat på Bayesiansk metod skulle säga att du har fått en förkylning (även om endast 1% av förkylningen orsakar huvudvärk)

(-1) Det är oklart vad som är skillnaden mellan "Frequentist doc" och "Bayesian doc".Jag ser ingen anledning till att Frequentist-doktor * ignorerar * informationen om förkylning som orsakar huvudvärk.Bayesian doc verkar inte använda Bayes sats eller prior på något sätt, så jag förstår inte hur är han Bayesian?

För otroligt att vara en användbar eller till och med underhållande analogi.

A Lion

2010-07-21 00:54:13 UTC

view on stackexchange narkive permalink

En hankatt och en honkatt är nedskrivna i en stålkammare, tillsammans med tillräckligt med mat och vatten i 70 dagar.

En frekventist skulle säga att den genomsnittliga dräktighetsperioden för kattdjur är 66 dagar, honan var i värme när katterna var nedskrivna, och en gång i värme parar hon sig upprepade gånger i 4 till 7 dagar. Eftersom det sannolikt fanns många formeringsformer och tillräckligt med efterföljande tid för dräktighet är oddsen, när lådan öppnas på dag 70 finns det en kull med nyfödda kattungar.

En Bayesian skulle säga, jag hörde några Allvarlig Marvin Gaye kommer från lådan dag 1 och sedan i morse hörde jag många kattunge-liknande ljud som kom från lådan. Så utan att veta mycket om kattreproduktion är oddsen, när lådan öppnas på dag 70 finns det en kull med nyfödda kattungar.

Så som jag skrev upp det, särskilt med den bayesian som inte visste mycket om kattreproduktion, i början skulle bara frekventisten satsa på att det skulle finnas kattungar. De relevanta punkterna i mitt * mycket grova exempel * var mest att frekvensen gjorde sin förutsägelse baserat på data i början, sedan lutade sig tillbaka utan att inkorporera nya kompletterande data, medan bayesian inte hade mycket data till att börja med, men fortsatte att införliva relevanta uppgifter när de blir tillgängliga.

... och varför skulle inte en icke-Bayesian använda sig av ytterligare data också?