Spørsmål:
Abonnementnotasjon i forventning
Emile
2013-10-12 16:04:39 UTC
view on stackexchange narkive permalink

Hva er den eksakte betydningen av abonnementsnotasjonen $ \ mathbb {E} _X [f (X)] $ i betingede forventninger innenfor rammen av måle teori? Disse abonnementene vises ikke i definisjonen av betinget forventning, men vi kan for eksempel se i denne siden på wikipedia. (Merk at det ikke alltid var tilfellet, den samme siden for noen måneder siden).

Hva skal for eksempel være betydningen av $ \ mathbb {E} _X [X + Y] $ med $ X \ sim \ mathcal {N} (0,1) $ og $ Y = X + 1 $?

Ingen tvil om at noen vil ringe inn med formelle definisjoner, uformelt, alle forventninger er forventninger over fordelingen av (/ forventning med hensyn til) noen (muligens multivariate) tilfeldige variabler, enten den er eksplisitt spesifisert eller venstre underforstått. I mange tilfeller er det åpenbart ($ \ text {E} (X) $ innebærer $ \ text {E} _X (X) $ i stedet for $ \ text {E} _W (X) $). Andre ganger er det nødvendig å skille; vurder loven om total varians for eksempel: $ \ text {Var} [Y] = \ text {E} _X \ left [\ text {Var} [Y \ mid X] \ right] + \ text {Var} _X \ venstre [\ text {E} [Y \ mid X] \ høyre] $.
@Glen_b Er det virkelig nødvendig å spesifisere i loven om total varians?Som $ E [Y | X] = f (X) $, for noen $ f $, er det ikke klart at $ \ text {Var} [E [Y | X]] $ er over $ X $?
@ThomasAhle Du har ganske rett - "nødvendig" var et for sterkt ord for det eksempelet.Mens det strengt tatt burde være klart, er det ofte et forvirringspunkt for lesere som er uvanlige til å jobbe med det, så det er vanlig, snarere enn nødvendig, å være eksplisitt om det.Det er noen uttrykk som involverer forventninger der du ikke kan være sikker uten å spesifisere, men det er egentlig ikke et av dem
To svar:
Alecos Papadopoulos
2013-10-12 16:56:27 UTC
view on stackexchange narkive permalink

I et uttrykk der mer enn én tilfeldige variabler er involvert, symbolet $ E $ alene, avklarer ikke med hensyn til hvilken tilfeldig variabel er den forventede verdien "tatt". For eksempel

$$ E [h (X, Y)] = \ text {?} \ Int _ {- \ infty} ^ {\ infty} h ( x, y) f_X (x) \, dx $$ eller $$ E [h (X, Y)] = \ text {?} \ int _ {- \ infty} ^ \ infty h (x, y) f_Y (y) \, dy $$

Ingen av dem . Når mange tilfeldige variabler er involvert, og det ikke er noe abonnement i $ E $ -symbolet, blir den forventede verdien tatt med hensyn til deres felles fordeling:

$$ E [h (X, Y)] = \ int _ {- \ infty} ^ \ infty \ int _ {- \ infty} ^ \ infty h (x, y) f_ {XY} (x, y) \, dx \, dy $$

Når et abonnement er tilstede ... i noen tilfeller forteller det oss på hvilken variabel vi skal tilstand . Så

$$ E_X [h (X, Y)] = E [h (X, Y) \ mid X] = \ int _ {- \ infty} ^ \ infty h (x, y) f_ {h (X, Y) \ mid X} (h (x, y) \ mid x) \, dy $$

Her, vi "integrerer" variabelen $ Y $ , og vi har igjen funksjonen $ X $ .

... Men i andre tilfeller forteller den oss hvilken marginal tetthet vi skal bruke for "gjennomsnitt"

$$ E_X [h (X, Y)] = \ int _ {- \ infty} ^ \ infty h (x, y) f_ {X} (x) \, dx $$

Her "gjennomsnittlig over" variabelen $ X $ , og vi har igjen funksjonen $ Y $ .

Ganske forvirrende vil jeg si, men hvem sa at vitenskapelig notasjon er helt fri for tvetydighet eller flerbruk? Du bør se hvordan hver forfatter definerer bruken av slike symboler.

Jeg har to spørsmål. 1) Ikke sikker på om jeg forstår dette ordentlig, kan jeg tolke forventningen som en av de to første ligningene, hvis enten X eller Y er løst? 2) Kan du gi et eksempel på EQ 4 og EQ 5? Jeg har vanskelig for å tolke dem, og jeg tror konkrete eksempler vil hjelpe. Takk!
@ceiling cat 1) $ E [h (X, \ bar y)] = \ int _ {- \ infty} ^ {\ infty} h (x, \ bar y) f_X (x) dx $ er riktig fordi du egentlig gjør det _not_ har _ to_ tilfeldige variabler lenger. Likeledes for å fikse $ X $ til $ \ bar x $.
@ceiling kat 2) -EQ5: Vurder $ Z = X ^ 2 (Y- (Y + 2) ^ 3) = h (X, Y) $. $ Z $ er en tilfeldig variabel alright (for en passende støtte). Bruk deretter den spesifikke betydningen for korthåndsnotasjonen, $ E_X (Z) = E_X [(h (X, Y)] = \ int _ {- \ infty} ^ {\ infty} x ^ 2 (y- (y + 2 ) ^ 2) f_ {X} (x) dx $ hvor $ f_ {X} (x) $ er tettheten på $ X $ (hva det enn er). Åpenbart er $ Y $ ikke integrert, og den vil forbli intakt. Men resultatet du vil oppnå vil ikke være et tall (som i min forrige kommentar), men en tilfeldig variabel (en funksjon på $ Y $), siden $ Y $ her er _ ikke_ fast, bare ikke integrert ut.
@ceiling katt I begge tilfeller i mine to tidligere kommentarer vil "mekanikken" til matematiske beregninger være den samme. Sluttresultatene har imidlertid forskjellige tolkninger.
@ceiling cat 2) -EQ4: Vurder den samme tilfeldige variabelen $ Z $. Dens forventede verdi betinget av $ X $ er (ved å bruke den andre betydningen for forkortelsen) $ E_X [Z] = E (Z \ mid X) = \ int _ {- \ infty} ^ {\ infty} z f_ {Z | X} (z \ mid x) dz $. Vær oppmerksom på at her vises $ x $ og $ y $ ikke direkte i integranden - de blir "kondensert" i $ z $ symbolet.
@Alecos $ E_X (Z) = E (Z | X) $ virker inkonsekvent.LHS integrerer $ X $ ut mens RHS er en funksjon på $ X $.
@A.S.Jeg understreket spesielt i svaret mitt at (dårlig uansett) notasjonen $ E_X (Z) $ kan ha forskjellige betydninger i hendene på forskjellige forfattere., Og jeg ga to av dem som jeg vet om.Kommentaren din står bare hvis $ E_X (Z) $ har en enkelt, universell betydning og bruk - og det har den ikke.Unngå det uansett, hvis du spør meg.
I lys av all denne diskusjonen http://www.stat.cmu.edu/~ryantibs/statml/review/modelbasics.pdf, side 2, den andre ligningen (den etter y = f (x) + e), hvordankommer det fremdeles en forventning på høyre side av ligningen?Det er ikke tilfeldige variabler igjen.Bør det ikke bare være s ^ 2 + (f (x) - fhat (x)) ^ 2
@CagdasOzgenc Ja, siden jeg forstår at små bokstaver $ x $ er en spesifikk realisering og $ X $ er en tilfeldig variabel.Men dette notasjonelle skillet blir ikke alltid observert, og jeg tror forfatteren har i tankene den tilfeldige variabelen $ X $, eller $ X = x $ men $ \ for alle x $.
@AlecosPapadopoulos Jeg sjekket noen andre avledninger av det samme.Det ser ut til at de også er gjennomsnittlige over treningsdataene som påvirker f_hat.Men hvordan i helvete noen antar å vite det.Jeg synes abonnementet skal håndheves i full grad i alle forventninger.
@AlecosPapadopoulos er den siste integralen den betingede forventningen på $ h (X, Y) $ med hensyn til $ Y $
@ColinHicks nr. Som du kan se under integralen, vises ingen betinget tetthet.Integralet før det siste, er et eksempel på en betinget forventning.
@AlecosPapadopoulos Dette emnet forvirret meg og jeg stilte et [lignende spørsmål] (https://math.stackexchange.com/questions/3688785/law-of-unconscious-statistician-for-conditional-expectation) hvor jeg ble fortalt (bytte hvilken variabeler betinget) $ E (h (X, Y) | X) = \ int _ {- \ infty} ^ {\ infty} h (x, y) f_ {Y | X} (y | x) dy $ Jeg skjønner degbruker ikke standard notasjon med $ dh $, men er dette en motsetning med det jeg ble fortalt, eller er integralene på en eller annen måte "ekvivalente"?
@ColinHicks Selvfølgelig er de ikke det.Dette er hele poenget med innlegget, for å varsle at "kompakte" notasjoner kan referere til forskjellige ting, avhengig av hvordan hver forfatter definerer den kompakte notasjonen.
@ColinHicks ... og $ dh $ var en skrivefeil, ubemerket i så mange år ... korrigert.Pluss litt mer diskusjon.
@AlecosPapadopoulos ah så $ f_ {h (X, Y) | X} (h (x, y) | x) $ er det samme som $ f_ {Y | X} (y | x) $ eller er dette bare et tilfelle avde to integralene er like?Jeg antar det sistnevnte, men jeg føler også at det kan være en enkel endring av variabler som vil avklare hvorfor begge integralene gir samme utgang.Jeg har innsett at jeg trenger å lære mer grunnleggende før jeg kommer hit, da jeg ikke har en grundig forståelse av disse konstruksjonene som forener forvirringen notasjonelt.Jeg setter stor pris på din hjelp btw etter alle disse årene haha
@ColinHicks Det kan ikke være det samme.$ h (x, y) $ er en bivariat funksjon som kan ha hvilken som helst form.For eksempel kan vi ha $ h (x, y) = 2 + x ^ 2 + xy ^ 3 $.Selv om vi betinger $ X $, og så behandler $ x $ i $ h (x, y) $ som faste tall, kan distribusjonen av $ h (x, y) $ betinget av $ X $ tydeligvis ikke væredet samme som fordelingen av $ Y $ betinget av $ X $.
@AlecosPapadopoulos for en felles fordeling av to variabler $ f_ {X, Y} (x, y) $ har vi at en betinget fordeling og en marginal fordeling er forskjellige ting.Men er det det samme for forventningsverdier?Jeg har vanskeligheter med å tolke $$ E_X [h (X, Y)] = \ int _ {- \ infty} ^ \ infty h (x, y) f_ {X} (x) \, dx = E_1 (y) $$for X, Y avhengig er dette forskjellig fra $$ E_X [h (X, Y)] = \ int _ {- \ infty} ^ \ infty h (x, y) f_ {X | Y} (x | y) \,dx = E_2 (y) $$ $ E_2 (y) $ I kan tolke som gjennomsnittet / gjennomsnittet av $ h (x, y) $ betinget av $ y $.Men jeg kan ikke se hva slags forventning / gjennomsnitt $ E_1 (y) $ er.
Eller bør denne $ E_1 (y) $ -formuleringen tolkes i den forstand at X og Y enten ikke er felles distribuerte variabler (f.eks. Y er en parameter) eller i den forstand at X og Y er uavhengige variabler, i hvilket tilfelle $ f_X =f_ {X | Y} $, dvs.marginale og betingede fordelinger er like.
Skulle dette $ E [h (X, Y) \ mid X] $ $$ \ int _ {- \ infty} ^ \ infty h (x, y) f_ {h (X, Y) \ mid X} (h (x, y) \ mid x) \, dy $$ i stedet ikke være $$ \ int _ {- \ infty} ^ \ infty h (x, y) f_ {h (X, Y) \ mid X} (h (x, y) \ mid x) \, dh (x, y) $$ eller $$ \ int _ {- \ infty} ^ \ infty h (x, y) f_ {Y \ mid X} (y \ mid x) \, dy $$
@SextusEmpiricus $ E_1 (y) $ behandler i hovedsak å behandle $ h $ som $ h (x; y) $, det vil si som en funksjon på bare $ x $ med $ y $ som en gratis parameter som er forskjellig fra betinget forventning.som for de to andre integralene i den siste kommentaren din, se [lov om ubevisst statistiker] (https://en.wikipedia.org/wiki/Law_of_the_unconscious_statistician) og [dette spørsmålet] (https://stats.stackexchange.com/questions/475418 / lov-av-ubevisst-statistiker-for-betinget-forventning)
@ColinHicks mitt problem med uttrykket for $ E_1 (y) $ er at det multipliserer $ h (x; y) $ (et uttrykk hvis verdi avhenger av $ y $) med marginalen $ f (x) $ i stedet for med den betingede$ f (x; y) $.Jeg forstår ikke betydningen av $ E_1 (y) $.Hva mener du at det skiller seg fra betinget forventning?Er $ y $ i $ h (x; y) $ forskjellig fra $ y $ i tetthetsfunksjonen $ f (x; y) $?
@ColinHicks så for distribusjoner kan vi ha marginale og betingede distribusjoner.Jeg kan intuitivt forstå disse tingene.For forventningene ser jeg imidlertid ikke hvordan du kan gjøre den forskjellen.Vel, du kan utgjøre en forskjell og uttrykke en marginal forventning som $ E_1 (y) $, men hva betyr den forventningen?
information_interchange
2019-12-28 07:15:39 UTC
view on stackexchange narkive permalink

Jeg vil bare legge til en oppfølging av Alecos 'flotte svar.Noen ganger spiller det ingen rolle nøyaktig R.V.(eller sett med bobil) forventningen er over.For eksempel

$$ E_ {X \ sim P (X)} [X] = E_ {X \ sim P (X, Y)} [X] $$

I ditt spesielle spørsmål mistenker jeg at fordi du får $ h (X, Y) $ er lineær i X og Y, så vil du bryte den oppinn i de "marginale" forventningene $ E_X [X] $ og $ E_X [Y] $ (og deretterbytt i $ Y = X + 1 $ )



Denne spørsmålet ble automatisk oversatt fra engelsk.Det opprinnelige innholdet er tilgjengelig på stackexchange, som vi takker for cc by-sa 3.0-lisensen den distribueres under.
Loading...