Jeg er nysgjerrig på arten av $ \ Sigma ^ {- 1} $. Kan noen fortelle noe intuitivt om "Hva sier $ \ Sigma ^ {- 1} $ om data?"
Rediger:
Takk for svarene
Etter tar noen flotte kurs, vil jeg legge til noen poeng:
- Det er mål på informasjon, dvs. $ x ^ T \ Sigma ^ {- 1} x $ er mengden informasjon langs retningen $ x $.
- Dualitet: Siden $ \ Sigma $ er positiv, er det også $ \ Sigma ^ {- 1} $, så de er prikkproduktnormer , mer presist er de to normer for hverandre, så vi kan utlede Fenchel dual for det regulariserte minste kvadratproblemet, og gjøre maksimering av dobbelt problem. Vi kan velge en av dem, avhengig av betingelsen.
- Hilbert-mellomrom: Kolonner (og rader) på $ \ Sigma ^ {- 1} $ og $ \ Sigma $ span det samme rommet. Så det er ikke noen fordel (annen at når en av disse matrisene er dårlig betinget) mellom representasjon med $ \ Sigma ^ {- 1} $ eller $ \ Sigma $
- Bayesian Statistics: norm for $ \ Sigma ^ {- 1} $ spiller en viktig rolle i den bayesiske statistikken. Dvs. den bestemte hvor mye informasjon vi har tidligere, for eksempel når kovarians av tidligere tetthet er som $ \ | \ Sigma ^ {- 1} \ | \ rightarrow 0 $ har vi ikke-informativ (eller sannsynligvis Jeffreys tidligere)
- Frequentist Statistics: Det er nært knyttet til Fisher-informasjon ved bruk av Cramér – Rao-bundet. Faktisk er fiskerinformasjonsmatrise (ytre produkt av gradient av log-sannsynlighet med seg selv) Cramér – Rao bundet den, dvs. $ \ Sigma ^ {- 1} \ preceq \ mathcal {F} $ (wrt positiv halvdefinert kjegle, iewrt konsentrasjon ellipsoider). Så når $ \ Sigma ^ {- 1} = \ mathcal {F} $ er maksimal sannsynlighetsestimator effektiv, dvs. maksimal informasjon finnes i dataene, så hyppig regime er optimalt. I enklere ord, for noen sannsynlighetsfunksjoner (merk at funksjonell form for sannsynligheten rent avhenger av den sannsynlighetsmodellen som angivelig genererte data, også kalt generativ modell), er maksimal sannsynlighet effektiv og konsekvent estimator, regler som en sjef. (beklager at du har overdrevet det)