Hva er den objektive funksjonen til PCA?

Neil McGuigan

2011-05-03 04:10:17 UTC

view on stackexchange narkive permalink

Hovedkomponentanalyse kan bruke matrisedekomponering, men det er bare et verktøy for å komme dit.

Hvordan vil du finne hovedkomponentene uten bruk av matrisealgebra?

Hva er den objektive funksjonen (mål), og hva er begrensningene?

Kanskje jeg mangler noe, så vær så snill å korrigere meg hvis jeg tar feil, men det burde være mulig (i det minste i prinsippet) å konstruere det som gjøres i PCA ved å bruke matriser som et (komplisert) lineært programmeringsproblem, men det gjør jeg ikke vet hvordan du vil angi alle nødvendige begrensninger. Jeg er heller ikke sikker på at det ville være veldig enkelt å gjøre i forhold til bare å bruke PCA. Hvorfor prøver du å unngå matriser?

@Chris Jeg ser ikke hvordan man kan komme til et lineært programmeringsproblem. Det var heller ikke min forståelse at matriser skulle unngås i * beregningen *. Spørsmålet var hva slags problem som løses av PCA, og ikke hvordan det gjøres (ved å beregne SVD for eksempel). Løsningen fra kardinal sier at du finner suksessive ortogonale retninger av * maksimal varians *. Løsningen jeg presenterte sier at du finner hyperplaner med minimal rekonstruksjonsfeil.

@chris Jeg håper å finne en annen måte å se PCA på, uten matrisealgebra, for å øke forståelsen av den.

@Chris, Du har en kvadratisk objektivfunksjon og en $ \ ell_2 $ normbegrensning. Alternativt, under formuleringen i @NRH's-svaret, har du en begrensning for matriseplassering. Det kommer ikke til å slå seg ned til et lineært programmeringsproblem. @NRH gir god intuisjon, og det er faktisk en veldig nær sammenheng mellom de to perspektivene på PCA som er gitt. Kanskje i samarbeid med @NRH, kan vi legge til det i hans / hennes innlegg for å gjøre hele settet med svar mer komplett.

@cardinal Ja, uansett fører det til det samme selvfølgelig. Jeg synes dette er veldig godt forklart i The Elements, og siden boken er gratis tilgjengelig online for nedlasting, er det mulig å studere detaljene der. Jeg kan bare legge til at datavektorene i @cardinal's-løsningen antas sentrert.

@NRH, Egentlig liker jeg * ESL * mye, men jeg synes behandlingen der av dette emnet er ganske overfladisk, slik det er for mange av emnene i boka. Spesielt beviser de ikke (eller tildeler til og med som en øvelse) den viktige delen av løsningen for optimaliseringsproblemet du gir.

@NRH, Også om du velger å sentrere funksjonene eller ikke er en beslutning utenfor rammen av PCA. Det er statistiske situasjoner der det er mest fornuftig å gjøre det ene eller det andre. Skjønt, vil jeg si at sentrering vanligvis vinner ut.

@cardinal,-poeng tatt med muligheten for å velge ikke å sentrere, men uten sentrering vil jeg ikke kalle $ \ mathbf {S} $ prøvekovariansen.

@NRH: Ja, jeg er enig.

@NRH og @Cardinal Jeg synes begge innleggene og kommentarene dine her er veldig innsiktsfulle, men basert på OP og kommentaren @Neil kom med i disse innleggene virker det som om han leter etter noe mer i retning av en måte å se på dette som et system av ligninger enn når det gjelder lineær algebra for dette problemet. Det er tydeligvis ikke et lineært program, men jeg hadde tilsynelatende en hjernesvikt og kunne ikke tenke på ligningssystemer i går. Jeg tror det er grunnen til at han ikke har godtatt noen av de gode svarene dine ennå.

+1.Jeg tok meg fri til å endre tittelen på spørsmålet ditt.Det handlet om å finne PC-er "uten matrise-algebra", men det aksepterte svaret handler om matrise-algebra!Så jeg syntes tittelen var veldig misvisende.Jeg endret den for å fokusere på den objektive funksjonen, som er hva begge (utmerkede) svarene spesifikt handler om.Jeg håper du ikke har noe imot det, @Neil.Gi meg beskjed hvis du synes det var en upassende redigering.