Matematiker vill ha motsvarande kunskap till en kvalitetsstatistik

Fråga:

Matematiker vill ha motsvarande kunskap till en kvalitetsstatistik

John Robertson

2011-01-26 01:03:49 UTC

view on stackexchange narkive permalink

Jag vet att människor älskar att stänga dubbletter så jag inte ber om en hänvisning till start inlärningsstatistik (som här).

Jag har en doktorsexamen i matematik men lärde mig aldrig statistik. Vad är den kortaste vägen till motsvarande kunskap till en förstklassig BS-statistikgrad och hur mäter jag när jag har uppnått det.

Om en lista med böcker skulle räcka (förutsatt att jag gör övningarna kan vi säga), det är fantastiskt. Ja, jag förväntar mig att träna problem är en implicit del av att lära mig det, men jag vill snabbt spåra så mycket som möjligt. Jag letar inte efter en vansinnigt rigorös behandling om det inte är en del av vad statistiska huvudämnen i allmänhet lär sig.

vilket matematikområde har du fått din doktorsexamen? Detta kan vara relevant.

Kan du dela med oss * varför * du vill lära dig statistik? Nyfikenhet? Behövs för ett projekt eller forskning? Vill du byta jobb? Behöver du undervisa några kurser? Vill du samarbeta med statistiker som teoretisk person?

Det skulle vara användbart i mitt arbete som involverar en stor mängd maskininlärning. Det skulle också vara användbart ibland eftersom mitt (mycket lilla) företag ibland kunde använda en äkta statistiker.

Jag tycker att det nästan alltid är viktigt att också utveckla domänspecifik expertis. Mycket statistik lär sig modellerna som är relevanta för specifika områden.

Försök att vända "statistikern vill ha motsvarande kunskap till en matematisk kvalitetsgrad" - det är inte troligt att det finns några snabba rutter.

"Jag vet att folk älskar att stänga dubbletter" fick mig att skratta.

Kasta en tärning 100 gånger så är du klar.;)

Nio svar:

cardinal

2011-02-22 08:08:30 UTC

view on stackexchange narkive permalink

(Mycket) novell

Lång historia kort, i någon mening är statistik som alla andra tekniska områden: Det finns ingen snabbspårning▶ att det är ganska svårt att packa allt som behövs för att lära sig statistik väl in i en läroplan. Detta gäller särskilt vid universitet som har betydande allmänna utbildningskrav.

Att utveckla nödvändiga färdigheter (matematiska, beräknings- och intuitiva) tar mycket ansträngning och tid. Statistik kan börja förstås på en ganska anständig "operativ" nivå när eleven har behärskat kalkyl och en anständig mängd linjär och matrisalgebra. Men någon tillämpad statistiker vet att det är ganska lätt att hitta sig i territorium som inte överensstämmer med en cookie-cutter eller receptbaserad strategi för statistik. För att verkligen förstå vad som händer under ytan krävs som en förutsättning matematisk och i dagens värld beräkningsmognad som bara verkligen kan uppnås under de senare åren av grundutbildningen. Detta är en anledning till att riktig statistisk utbildning mestadels börjar vid M.S. nivå i USA (Indien med deras dedikerade ISI är lite annorlunda. Ett liknande argument kan göras för en del kanadensisk utbildning. Jag känner inte tillräckligt till europeisk eller ryskbaserad grundutbildning för statistik för att ha en informerat yttrande.)

Nästan alla (intressanta) jobb skulle kräva en MS nivåutbildning och de riktigt intressanta (enligt min mening) jobben kräver i princip en doktorandutbildning.

Eftersom du har en doktorsexamen i matematik, även om vi inte vet inom vilket område, här är mina förslag på något närmare en utbildning på MS-nivå. Jag tar med några parentesanmärkningar för att förklara valen.

D. Huff, Hur man ligger med statistik . (Mycket snabb, lättläst. Visar många av de konceptuella idéerna och fallgroparna, särskilt när de presenterar statistik för lekmannen.)
Mood, Graybill och Boes, Introduktion till teorin om statistik , 3: e upplagan, 1974. (MS-nivå introduktion till teoretisk statistik. Du lär dig om samplingsfördelningar, poänguppskattning och hypotesprovning i ett klassiskt, frekventistiskt ramverk. Min åsikt är att detta i allmänhet är bättre, och lite mer avancerad än moderna motsvarigheter som Casella & Berger eller Rice.)
Seber & Lee, Linjär regressionsanalys , 2: a upplagan. (Lägger teorin bakom poängskattning och hypotesprovning för linjära modeller, vilket förmodligen är det viktigaste ämnet att förstå i tillämpad statistik. Eftersom du förmodligen har en bra linjär algebrabakgrund bör du omedelbart kunna förstå vad som händer geometriskt , som ger mycket intuition. Har också bra information relaterad till bedömningsfrågor i modellval, avvikelser från antaganden, förutsägelse och robusta versioner av linjära modeller.)
Hastie, Tibshirani och Friedman, Elements of Statistical Learning , 2: a upplagan, 2009. (Denna bok har en mycket mer tillämpad känsla än den förra och omfattar i stort sett många moderna maskininlärningsämnen. Det största bidraget här är att tillhandahålla statistiska tolkningar av många maskininlärningsidéer, som lönar sig särskilt när det gäller att kvantifiera osäkerhet i sådana modeller. Det här är något som tenderar att tas upp i typiska maskininlärningsböcker. Lagligt tillgänglig gratis rong> här .)
A. Agresti, Kategorisk dataanalys , 2: a upplagan (Bra presentation av hur man hanterar diskreta data i en statistisk ram. Bra teori och bra praktiska exempel. Kanske på den traditionella sidan i vissa avseenden.)
Boyd & Vandenberghe, Konvex optimering . (Många av de mest populära moderna statistiska uppskattnings- och hypotesprovningsproblemen kan formuleras som konvexa optimeringsproblem. Detta gäller också många maskininlärningstekniker, t.ex. SVM. Att ha en bredare förståelse och förmågan att känna igen sådana problem som konvexa program tycker jag är ganska värdefullt. Lagligt tillgängligt gratis här . )
Efron & Tibshirani, En introduktion till Bootstrap . (Du borde åtminstone känna till bootstrap och relaterade tekniker. För en lärobok är det en snabb och enkel läsning.)
J. Liu, Monte Carlo Strategies in Scientific Computing eller P. Glasserman, Monte Carlo Methods in Financial Engineering . (Det senare låter väldigt riktat till ett visst applikationsområde, men jag tror att det kommer att ge en bra översikt och praktiska exempel på alla de viktigaste teknikerna. Finansiella tekniska applikationer har drivit en hel del Monte Carlo-forskning under det senaste decenniet eller så .)
E. Tufte, Visuell visning av kvantitativ information . (Bra visualisering och presentation av data är [mycket] underskattad, även av statistiker.)
J. Tukey, Exploratory Data Analysis . (Standard. Oldie, men godis. Vissa kan säga föråldrade, men ändå värda att titta på det.)

Komplement

Här är några andra böcker, mestadels av lite mer avancerade, teoretiska och / eller hjälpande karaktärer, som är användbara.

F. A. Graybill, Theory and Application of the Linear Model . (Gammaldags, fruktansvärd satsning, men täcker hela samma mark som Seber & Lee och mer. Jag säger gammaldags för att modernare behandlingar antagligen skulle använda SVD för att förena och förenkla många tekniker och bevis.)
F. A. Graybill, Matriser med tillämpningar i statistik . (Ledsagande text till ovanstående. En mängd bra matrisalgebra resultat som är användbara för statistik här. Stor skrivbordsreferens.)
Devroye, Gyorfi och Lugosi, En probabilistisk teori om mönsterigenkänning . (Strikt och teoretisk text om kvantifiering av prestanda i klassificeringsproblem.)
Brockwell & Davis, Time Series: Theory and Methods . (Klassisk tidsserieanalys. Teoretisk behandling. För mer tillämpade är Box, Jenkins & Reinsel eller Ruey Tsays texter anständiga.)
Motwani och Raghavan, Slumpmässiga algoritmer . (Probabilistiska metoder och analys för beräkningsalgoritmer.)
D. Williams, Sannolikhet och Martingales och / eller R. Durrett, Sannolikhet: Teori och exempel . (Om du har sett måttteori, säg, på nivån för DL Cohn, men kanske inte sannolikhetsteori. Båda är bra för att snabbt komma i fart om du redan känner till måttteori.)
F . Harrell, Regression Modeling Strategies . (Inte lika bra som Elements of Statistical Learning [ESL], men har en annan och intressant uppfattning. Täcker mer "traditionella" tillämpade statistikämnen än ESL och så värt att veta om säkert.)

Mer avancerade texter (doktorsexamen)

Lehmann och Casella , Theory of Point Estimation . (Behandling på doktorsexamen av poänguppskattning. En del av utmaningen med den här boken är att läsa den och ta reda på vad som är ett skrivfel och vad som inte är. När du ser dig själv känna igen dem snabbt vet du att du förstår. Det finns gott om övning av denna typ där inne, speciellt om du dyker in i problemen.)
Lehmann och Romano, Testa statistiska hypoteser . (Behandling av doktornivå av hypotesprov. Inte så många stavfel som TPE ovan.)
A. van der Vaart, Asymptotisk statistik . (En vacker bok om den asymptotiska teorin om statistik med goda tips om tillämpningsområden. Inte en tillämpad bok men. Mitt enda gräl är att någon ganska bisarr notation används och detaljer ibland borstas under mattan.)

@cardinal, ex-sovjetiska universitet har separata statistikstudier på grundnivå. I Vilnius universitet kan du till exempel få en kandidatexamen i statistik. Enligt vad jag ser med studenterna håller jag helhjärtat med om att det krävs master- eller till och med doktorandutbildning för intressanta jobb.

@cardinal, @mpiktas 4 år i BS + 2 år i MS + 4 år i doktorsexamen gör tio år att lära sig något intressant :) Jag skulle ge $ + \ infty $ till detta fantastiska svar om möjligt. De flesta böcker är nya för mig.

Jag tittade på Boyd & Vandenberghe, Convex Optimization eftersom det verkar vara tillgängligt online gratis, och jag tyckte att det var lite oroande. Den nämnde inte någon av följande fraser: "konjugatgradient" "BFGS" "Broyden" (av BFGS). Det här är vanliga moderna metoder, så jag är förvirrad varför de inte skulle nämnas åtminstone.

@John Salvatier, du har rätt att dessa metoder inte omfattas av denna text. Återigen slår detta mig mer som en smakfråga, särskilt eftersom textens huvudfokus inte är på algoritmer. Till att börja med behandlas dina bekymmer direkt av författarna i inledningen (s. 13).

@John, Min personliga tolkning av avsikten med denna text är att tillhandahålla de maskiner som är nödvändiga för att * känna igen * ett problem som faller inom klassen av konvexa optimeringsproblem snarare än att utveckla de algoritmiska verktyg som är nödvändiga för att lösa dem (även om en del av detta * presenteras * ) säkert. Kanske kan en lämplig analogi hittas i standardbehandlingarna för linjär regression.

Jag skulle också rekommendera Boyd och Vandenberghe, särskilt om de är tillgängliga gratis.

@cardinal: Skandinaviska universitet erbjuder vanligtvis också kandidatexamen. Med detta sagt tror jag statistiker tar sig själva lite för seriöst. Jag håller inte med om att du behöver doktorsexamen för att få ett "intressant" jobb. Jag tror att när vetenskap och forskning blir mer och mer tvärvetenskaplig statistik har införts på studier från många olika områden. Hälften av artiklarna om tidskrifter med hög effekt har viss tvivelaktig statistisk analys, bara för att möta kraven, även om det kanske inte är vettigt, givet i originalets sammanhang / domän av problemet.

[fortsättning från tidigare kommentar] ... Jag vet inte om detta är fallet med OP, men jag kan definitivt relatera till dilemmaet att försöka spola framåt, särskilt om du är klar med din utbildning. Det är helt enkelt orealistiskt att gå igenom en lång lista med böcker, övningar och spendera månader och år för att kunna göra ditt jobb, vilket kanske inte har något att göra med teoretisk statistik ... (jag är ledsen om jag låter för frustrerad)

@posdef, Jag har verkligen empati med dina känslor av frustration. Jag tar lite problem med några kommentarer som du har gjort som jag misstänker mest är en produkt av denna frustration. För att svara på dina kommentarer helt krävs en uppsats. Modern tillämpad statistik är ett matematiskt och beräkningsmässigt sofistikerat område som kräver en ganska hög grad av specialkunskap. Det tycker mig är lite förmodigt att vilja bli bra / kompetent på fältet utan att göra en ansträngning. Klicka på länken jag tillhandahöll för en mer vältalig version av detta.

Som någon som ursprungligen kom från en annan disciplin förstår jag önskan att lära mig tillräckligt snabbt för att vara produktiv. Tyvärr är min erfarenhet att det är svårt och potentiellt farligt. Vad är din bakgrund? Om någon med en B.S. I statistik kom till dig och sa "Jag måste känna ditt område. Gör mig till en expert så snabbt som möjligt", vad skulle du realistiskt föreslå för dem? När skulle du * känna dig säker att kalla dem en expert och lämna dem ett eget projekt som * ditt * företag eller din försörjning var beroende av?

Som jag sa tror jag att en väl genomtänkt uppsats behövs och det är tyvärr knappast ett bra format för det. De punkter du tar upp beträffande dålig statistisk analys i litteraturen är giltiga. Mitt argument skulle vara att detta ofta beror på just det problem vi försöker ta itu med i den här tråden. Det finns många, * många * människor som gör statistik utan att helt förstå vad de gör. Det finns också för få statistiker som har tillräcklig domenexpertis inom det applikationsområde de arbetar med.

@cardinal: Även om jag mest håller med dig är det som jag tycker är mycket oroande antagandet om "intresse för att bemästra" statistikområdet. När jag ställer eller svarar på en fråga om StackOverflow gör jag inte antaganden om avsikter att behärska någonting, jag tänker bara lära mig att lösa mina problem. På samma sätt antar jag inte att folk vill behärska programmeringsområdet när de frågar något där. Behärskning, som du nämnde, kommer naturligtvis över tid och ansträngning. Min erfarenhet SO vs CV och statistik vs programmering har varit bittert annorlunda när det gäller hjälp / verktyg :(

@posdef, tack för dina kommentarer. Mitt svar var skräddarsydd för frågan om OP som "ville ha motsvarande kunskap om en kvalitetsstatistik." Jag läste det som en önskan om en viss grad av behärskning. Även om programmering kräver en mycket betydande grad av både logik och kreativitet, skulle jag spekulera i att de flesta frågorna om SO handlar om mer direkta implementeringsfrågor. CV är mer inriktat på att hjälpa andra att förstå och tillämpa statistik, vilket i allmänhet kräver en djupare dialog med OP för att göra det bra (korrekt) och handlar om att ta itu med mer finesser. Min $ 0,02.

@cardinal: ah, jag antar att du har rätt ... Jag är ledsen för att jag har skapat en diskussion som inte är ämnet så här och för att jag är väldigt bitter i ämnet. Jag måste jobba med det på något sätt.

@posdef, inga bekymmer. Diskussionen är ändå intressant (för mig). Det bästa sättet att bekämpa frustrationens känslor är att fortsätta lära sig när möjligheten uppstår. För det första är jag glad att jag deltar här. Tillämpad statistik som fält fortsätter bara att växa genom positiva interaktioner med dem som är intresserade av dess applikationer. Jag skulle hävda att det omvända i många fall också är sant.

@cardinal: tack! Jag försöker bli av med fördomarna och frustrationen genom att försöka ignorera de negativa sidorna och försöka lista ut rätt "tänkesätt". Jag tror att vetenskapen är ungefär som språk, du kommer aldrig att vara flytande om du inte lär dig att tänka på det språket istället för att tänka på något annat språk och översätta i ditt huvud. Vi får se hur bra det fungerar för mig ... :)

@cardinal: ignorerar eventuella gräl över en text mot en annan, det enda jag ser i din lista som är en allvarlig utelämning är bristen på en referens på robust statistik. Maronna, Martin och Yohai är ett anständigt val, eller så kan du gå "klassiskt" och sätta Huber eller Hampel där.

@Wesley: Tack för kommentaren. Ja, uttryckligt omnämnande av robust statistik saknas. Men jag har inte försummat det helt. Avsnitt 3.13 i Seber & Lee ger en trevlig 15-sidig introduktion och flera kapitel i van der Vaart behandlar också robust statistik. Så det är där inne, om i något förklädd form. Huber (1981) är en härlig liten bok, men jag tror att den antagligen måste gå under kategorin "avancerad" i min lista ovan.

@cardinal: Du gör många bra poäng. Två upplevelser kan jag lägga till, en gång hade jag en sommarstudent som precis hade avslutat en doktorsexamen i matte och ville byta till statistik - de hade mycket svårt att få den statistiken att bara inte identifiera funktioner och sedan göra beräkningar. En annan gång hade jag klienter som hade doktorsexamen i biofysik med mycket matte. De påverkades minst av råd jag gav ...

Agresti kategoribok är nu i sin tredje upplagan.

@cardinal Mood book var ett bra förslag eftersom det idag är svårt att hitta en inledande bok om statistik som är tillräckligt formell för någon med matematisk bakgrund.Har någon läst denna bok ny bok? Panateros, "Statistik för matematiker" https://www.springer.com/us/book/9783319283395

@cardinal Jag har en doktorsexamen i funktionsanalys, särskilt med Banach rymdteori.Jag vill lära mig mer om tidsserieprognosmodeller som ARIMA, GARCH, etc. Jag gillar särskilt Brockwell och Davis's Theory and Methods-bok eftersom de verkligen ger rigor.Känner du råkar några andra böcker som liknar Borckwell och Davis?

Christopher Aden

2011-01-26 01:48:44 UTC

view on stackexchange narkive permalink

Jag kan inte tala för de mer rigorösa skolorna, men jag gör en B.S. i allmän statistik (den mest rigorösa på min skola) vid University of California, Davis, och det är ganska stort beroende av rigor och härledning. En doktorsexamen i matte kommer att vara till hjälp, eftersom du kommer att ha en mycket stark bakgrund inom verklig analys och linjär algebra - användbara statistiska färdigheter. Mitt statistikprogram har cirka 50% av kurserna som kommer att stödja de grundläggande (linjär algebra, verklig analys, kalkyl, sannolikhet, uppskattning), och de andra 50% går till specialiserade ämnen som är beroende av de grundläggande (icke-parametrar, beräkning, ANOVA / Regression, tidsserier, Bayesian-analys).
När du väl har fått det grundläggande är det vanligtvis inte så svårt att hoppa till detaljerna. De flesta individer i mina klasser kämpar med bevisen och den verkliga analysen och förstår lätt de statistiska begreppen, så det kommer definitivt att hjälpa från en matematisk bakgrund. Med detta sagt har följande två texter ganska bra täckning av många ämnen som omfattas av statistik. Båda rekommenderades förresten i länken du angav, så jag skulle inte säga att din fråga och den du länkade är nödvändigtvis okorrelerade.

Mathematical Methods of Statistics, av Harald Cramer

All Statistics: A Concise Course in Statistical Inference, av Larry Wasserman

+1 All statistik: det skulle vara ett bra ställe att börja.

UC-Davis-programmet ser bra ut och jag tror att du får en bra utbildning där. Jag skulle inte betrakta det som "mindre rigoröst" än andra platser. Jag tyckte att kommentaren till deras "integrerade BS / MS-examen" ** [sida] (http://anson.ucdavis.edu/undergrad/bs-ms) ** var intressant och relevant för tråden: "Det finns en hög efterfrågan på statistiker, men den kunskap och skicklighet som uppnås av dem med en BS-examen i statistik är ofta inte tillräckliga för behoven på [regeringen eller den industriella] arbetsplatsen. "

Scortchi - Reinstate Monica

2013-08-27 14:21:36 UTC

view on stackexchange narkive permalink

Royal Statistical Society i Storbritannien erbjuder forskarutbildningen i statistik, som ligger på en bra kandidatexamen. En kursplan, läslista, tidigare &-artiklar finns på deras webbplats. Jag har känt att matematiker använder den för att få fart på statistiken. Att ta tentorna (officiellt eller bekvämt för din egen studie) kan vara ett användbart sätt att mäta när du är där.

Examensexamen för examensbevis är faktiskt sista års grundexamen; för "iscensättning" finns det lägre nivåcertifikat som kan tas först. RSS-tentorna är tillgängliga, om jag minns rätt, över hela världen med undantag av Hong Kong (som har sitt eget statistikförening och tentor). Ett alternativ är examensbeviset i statistik som erbjuds av distansutbildning av Open University i Storbritannien, men återigen tillgängligt över hela världen. Detta är på något lägre nivå än RSS Grad Dip så det kan ses som en förberedelse för det. Som undervisad kurs är det betydligt dyrare.

Neil McGuigan

2011-02-22 01:51:04 UTC

view on stackexchange narkive permalink

Jag skulle gå till läroplanerna för toppskolorna, skriva ner böckerna som de använder i sina grundkurser, se vilka som får högst betyg på Amazon och beställa dem på ditt offentliga / universitetsbibliotek.

Några skolor att tänka på:

MIT - tekniskt sett korsundervisat med Harvard.
Caltech
Carnegie Mellon
Stanford

Komplettera texterna med de olika föreläsningsvideosidorna som MIT OCW och videolectures.net.

Caltech har ingen grundexamen i statistik, men du går inte fel genom att följa läroplanen för deras kurser för grundläggande statistik.

det här verkar som en konstig lista. Såvitt jag vet är Carnegie Mellon den * enda * skolan på den listan som (formellt) erbjuder en grundexamen i statistik. Varken Caltech eller MIT har ens examen i statistik.

@cardinal. varför måste du tvivla på mig? :) Jag satte in länkar till kurser på grundnivåstatistik vid de fina institutionerna. Blandning och matchning av kurser från de bästa skolorna kommer också att slå ut efter en examensväg från en sämre skola.

OCW är verkligen en mycket bra resurs och ett bra initiativ. Det är ingen tvekan om det. När det gäller ditt påstående att blandning och matchning från de "bästa skolorna" är en överlägsen lösning, tycker jag att det är mycket misstänkt, särskilt för grundutbildning. Medan en högt motiverad student kommer att få en mycket bra grundutbildning vid någon av dessa skolor, kan en grundutbildning som är bra eller bättre hittas i många, många "värre" skolor. Skolor som de som du listar brukar "vinna ut" för forskarutbildning, skulle jag säga.

Egentligen var detta det första jag försökte. Jag försökte detta innan jag skickade frågan. Att hitta en lista med kurser var inte svårt, men det var mycket svårare att hitta information om vilka böcker som faktiskt användes för dessa kurser och vilka delar av dessa böcker som täcktes.

kgarten

2011-01-26 01:38:58 UTC

view on stackexchange narkive permalink

Jag kommer från en datavetenskaplig bakgrund med fokus på maskininlärning. Men jag började verkligen förstå (och viktigare att tillämpa) statistik efter att ha gått en mönsterigenkänningskurs med Bishop's Book https://www.microsoft.com/en-us/research/people/cmbishop/#!prml -bok

här är några kursbilder från MIT:
http://www.ai.mit.edu/courses/6.867-f03/lectures.html

Detta ger dig bara bakgrunden (+ lite matlab-kod) för att använda statistik för verkliga arbetsproblem och är definitivt mer på den tillämpade sidan.

Ändå beror det mycket på vad du vill göra med din kunskap. För att få ett mått på hur bra du är kanske du vill bläddra i det öppna kurstillbehöret på något universitet för avancerade statistikkurser, för att kontrollera om du känner till ämnena som täcks. Bara mina fem cent.

Dikran Marsupial

2011-01-26 01:44:39 UTC

view on stackexchange narkive permalink

E.T. Jaynes "Probability Theory: The Logic of Science: Principles and Elementary Applications Vol 1", Cambridge University Press, 2003 är ganska mycket ett måste för den Bayesianska sidan av statistiken, på ungefär rätt nivå. Jag ser fram emot rekommendationer för den frekventa sidan av saker (jag har massor av monografier, men väldigt få bra allmänna texter).

Jag föreslår att det är en måste läsas för * någon * som vill vara en bra statistiker, frekventist, Bayesian eller något annat.

Jag håller inte med, Jaynes bok är en fruktansvärd rekommendation under denna omständighet: 1) notationen är slarvig och icke-standard, vilket gör det svårt att korsreferera med andra källor, 2) han är långvarig och hamnar i dumma och irrelevanta argument. (OP frågade efter den "kortaste vägen") 3) det finns också felen (som marginaliseringsparadox)

@Dikran Marsupial, äger du Schervish-texten om statistisk slutsats? Jag har varit på staketet om jag ska köpa det eller inte, så var nyfiken, eftersom du verkar anpassa dig ganska starkt till den Bayesiska metoden.

Jag skulle inte säga att jag var starkt anpassad till Bayesian. Det är det tillvägagångssätt som jag förstår bäst, vilket inte är samma sak. I grund och botten är jag ingenjör och jag vill ha båda verktygen i min verktygslåda, underhållna i god ordning! En korrekt förståelse för fördelarna och nackdelarna med varje tillvägagångssätt är vad vi bör sträva efter. Jag har ingen bok från Shervishes, men jag läste en uppsats om honom om Bayes-faktorer som verkade ganska bristfälliga för mig (jag får se om jag kan hitta den och lägga upp en fråga för någon att förklara för mig!).

@Dikran, Din (potentiella) fråga låter intressant. Jag ser fram emot ett inlägg om det.

Jag förväntar mig att jag bara saknar något, men det är tidningen av Lavine och Schervish "Bayes-faktorer: vad de är och vad de inte är". Exempel 2 verkar lite konstigt eftersom de använder en Bayes-faktor i en situation där de har en väl specificerad (och mycket informativ) före hypoteserna. Som ett resultat verkar det inte förvånande att det beter sig lite konstigt med tanke på att informationen (mu) används för att beräkna Bayes-faktorn, men sedan behandlas som okänd i själva hypotesprovet. Jag gillar att läsa artiklar om vad saker egentligen betyder men att vara fel är ett bra sätt att lära sig!

Sent på dagen, men jag lade till ett plus i kommentaren mot Jaynes.Det är en bok av stort intresse för dem som redan har en egen inriktning på statistik.Som en introduktion kunde det bara vara enstaka bisarrt, även för de matematiskt välutbildade.Cambridge U.P.hade helt rätt att publicera det, brister och allt, men bristerna minskar dess pedagogiska värde avsevärt.

mcdowella

2011-02-27 01:58:58 UTC

view on stackexchange narkive permalink

Jag har sett Statistical Inference, av Silvey, som används av matematiker som behövde en viss förståelse för statistik. Det är en liten bok och bör enligt rättigheterna vara billig. Titta på http://www.amazon.com/Statistical-Inference-Monographs-Statistics-Probability/dp/0412138204/ref=sr_1_1?ie=UTF8&s=books&qid=1298750064&sr=1-1, det verkar vara billig begagnad.

Den är gammal och koncentrerar sig på klassisk statistik. Även om det inte är mycket abstrakt, är det avsett för en rimligt matematisk publik - många av övningarna kommer från Cambridge (UK) Diploma in Mathematical Statistics, som i grunden är en MSc.

Karsten W.

2011-06-05 19:57:28 UTC

view on stackexchange narkive permalink

När det gäller mätningen av din kunskap: Du kan delta i vissa datautvinning / dataanalys tävlingar, till exempel 1, 2, 3, 4 och se hur du gör poäng jämfört med andra.

Det finns många tips till läroböcker om matematisk statistik i svaren. Jag vill lägga till som relevanta ämnen:

den empiriska sociala forskningskomponenten, som omfattar urvalsteori, sociodemografiska och regionala standarder
datahantering, som inkluderar kunskap om databaser (skriva SQL-frågor, vanliga databasscheman)
kommunikation, hur man presenterar resultat på ett sätt som publiken håller sig vaken (visualiseringsmetoder)

Ansvarsfriskrivning: Jag är inte en statistiker, det här är bara mina två cent

Shiv_90

2017-11-22 15:52:39 UTC

view on stackexchange narkive permalink

Jag tror att Stanford ger de bästa resurserna när det gäller flexibilitet. De har till och med en maskininlärningskurs online som ger dig en respektabel kunskapsbas när det gäller att designa algoritmer i R. Sök upp på Google och det kommer att omdirigera dig till deras Lagunita-sida där de har några intressanta kurser, de flesta av att de är fria. Jag har Tibshiranis böcker, Introduction to Statistical Learning 'och' Elements of Statistical Learning 'i PDF-format och båda är extremt bra resurser.

Eftersom du är matematiker, skulle jag ändå rekommendera dig att inte spåra eftersom det inte skulle ge dig en gedigen bas som du kanske kommer att vara till stor hjälp i framtiden om du alls gör något seriöst maskininlärning. Behandla statistik som en gren av matematiken för att få insikter från data, och det kräver lite arbete. Förutom det finns det massor av online-resurser, Johns Hopkins tillhandahåller liknande saker som Stanford. Även om erfarenhet alltid betalar, kommer en respektabel referens alltid att förstärka basen. Du kan också tänka på de specifika fälten som du vill skriva in; med det menar jag om du vill gå in i textanalys eller tillämpa dina matematiska och statistiska färdigheter inom ekonomi. Jag kommer i den senare kategorin så jag har en examen i ekonometri där vi studerade finans + statistik. En kombination kan alltid vara väldigt bra.

ⓘ

Denna fråga och svar översattes automatiskt från det engelska språket.Det ursprungliga innehållet finns tillgängligt på stackexchange, vilket vi tackar för cc by-sa 2.0-licensen som det distribueras under.

about - legalese

Loading...