Fråga:
Viktiga papper om matrisnedbrytning
gappy
2010-11-06 08:32:18 UTC
view on stackexchange narkive permalink

Jag läste nyligen Skillicorns bok om matrisnedbrytning och blev lite besviken, eftersom den riktades till en grundutbildningspublik. Jag skulle vilja sammanställa (för mig själv och andra) en kort bibliografi över viktiga artiklar (undersökningar, men också genombrott) om matrisnedbrytning. Vad jag först och främst tänker på är något om SVD / PCA (och robusta / glesa varianter) och NNMF, eftersom de är överlägset mest använda. Har ni alla några rekommendationer / förslag? Jag håller av mina för att inte förutse svaren. Jag ber att begränsa varje svar till 2-3 artiklar.

P.S .: Jag hänvisar till dessa två nedbrytningar som den mest använda i dataanalysen . Naturligtvis är QR, Cholesky, LU och polar mycket viktiga i numerisk analys. Det är dock inte fokus för min fråga.

Fem svar:
onestop
2010-11-06 12:17:03 UTC
view on stackexchange narkive permalink

Hur vet du att SVD och NMF är överlägset de mest använda matrisnedbrytningarna snarare än LU, Cholesky och QR? Min personliga favorit "genombrott" måste vara den garanterade rank-avslöjande QR-algoritmen,

  • Chan, Tony F. "Rank avslöjande QR-faktoriseringar". Linjär algebra och dess tillämpningar Volymer 88-89, april 1987, sidorna 67-82. DOI: 10.1016 / 0024-3795 (87) 90103-0

... en utveckling av den tidigare idén om QR med kolumnvridning:

  • Businger, Peter; Golub, Gene H. (1965). Linjära lösningar med minsta kvadrat genom hushållsförändringar. Numerische Mathematik Volym 7, nummer 3, 269-276, DOI: 10.1007 / BF01436084

A ( the ?) klassisk lärobok är:

  • Golub, Gene H .; Van Loan, Charles F. (1996). Matrix Computations (3: e upplagan), Johns Hopkins, ISBN 978-0-8018-5414-9.

(jag vet du bad inte om läroböcker men jag kan inte motstå)

Redigera: Lite mer googling hittar ett papper vars abstrakt antyder att vi kan vara något vid tumlare. Min ovanstående text kom från ett "numeriskt linjärt algebra" -perspektiv; kanske du är mer bekymrad över ett '' tillämpad statistik / psykometri '' (AS / P) perspektiv? Kan du kanske förtydliga?

Jag skulle själv säga "läroboken" med Stewarts * Matrix Algorithms * ([båda] (http://books.google.com/books?id=XHOQ_HU-85IC) [delar] (http://books.google. com / books? id = FtC9rHW7ORMC)) en nära sekund. Jag skulle själv ge en lista över banbrytande tidningar, men OP borde verkligen förklara om han vill ha numerisk synvinkel eller statistikvinkel (jag kan hjälpa till med den förra, men inte så mycket den senare).
+1 för Golub och Van Loan. Och ja, den slutgiltiga artikeln är lämplig.
Jag redigerade min fråga för att klargöra att jag fokuserar på statistikdelen. Jag håller med alla om att Golub och Van Loan är standardreferensen för matrisnedbrytning. Men det utelämnar ämnet mycket storskalig sönderdelning genom slumpmässiga prognoser. Ett undersökningsdokument som jag skulle lägga in i min lista är "Hitta struktur med slumpmässighet: Stokastiska algoritmer för att konstruera ungefärliga matrisnedbrytningar" av Halko et al.
shabbychef
2010-11-07 00:47:39 UTC
view on stackexchange narkive permalink

För NNMF beskriver Lee och Seung en iterativ algoritm som är mycket enkel att implementera. Egentligen ger de två liknande algoritmer, en för att minimera Frobenius norm för rest, den andra för att minimera Kullback-Leibler Divergens av approximationen och originalmatrisen.

bijey
2010-11-22 01:28:41 UTC
view on stackexchange narkive permalink

Kanske kan du hitta intressanta

  1. [Learning with Matrix Factorizations] Doktorsavhandling av Nathan Srebro,
  2. [Undersökning av olika matrisfaktoriseringsmetoder för stora rekommenderingssystem], Gábor Takács et.al. och nästan samma teknik som beskrivs här

De två sista länkarna visar hur glesa matrisfaktoriseringar används i Collaborative Filtering. Jag tror dock att SGD-liknande faktoriseringsalgoritmer kan vara användbara någon annanstans (åtminstone är de extremt enkla att koda)

pslice
2010-11-21 15:44:04 UTC
view on stackexchange narkive permalink

Witten, Tibshirani - Penaliserad matrisnedbrytning

http://www.biostat.washington.edu/~dwitten/Papers/pmd.pdf

http://cran.r-project.org/web/packages/PMA/index.html

Martinsson, Rokhlin, Szlam, Tygert - Randomized SVD

http://cims.nyu.edu/~tygert/software.html

http://cims.nyu.edu/~tygert/blanczos.pdf

Tack. Jag känner till båda tidningarna. Jag är inte ett stort fan av Witten [inte Whitten] et al., Eftersom jag tror att det finns viktigare artiklar om glesa nedbrytningar. På randomiserad SVD gillar jag särskilt granskningsdokumentet "Hitta struktur med slumpmässighet: Stokastiska algoritmer för att konstruera ungefärliga matrisnedbrytningar" (http://arxiv.org/abs/0909.4061) också medförfattare av Martinsson.
jag håller med. Jag lade bara ut två papper som ingen hade nämnt.
pisk
2010-12-16 14:03:13 UTC
view on stackexchange narkive permalink

Vid årets NIPS fanns ett kort papper om distribuerad, mycket storskalig SVD som fungerar i ett enda pass över en strömmande ingångsmatris.

Papperet är mer implementeringsorienterat men sätter saker i perspektiv med riktiga väggurstider och allt. Tabellen nära början är också en bra undersökning.

Vad står NIPS för?
@onestop-länk har lagts till. NIPS = Neural Information Processing Systems. Det är en gemenskap (inte ett system :)). Men pisk talar om konferensen NIPS 2010.


Denna fråga och svar översattes automatiskt från det engelska språket.Det ursprungliga innehållet finns tillgängligt på stackexchange, vilket vi tackar för cc by-sa 2.0-licensen som det distribueras under.
Loading...