Utledning av lukket form lasso løsning

Gary

2011-11-01 05:03:49 UTC

view on stackexchange narkive permalink

For lassoproblemet $ \ min_ \ beta (Y-X \ beta) ^ T (Y-X \ beta) $ slik at $ \ | \ beta \ | _1 \ leq t $. Jeg ser ofte det myke terskelresultatet $$ \ beta_j ^ {\ text {lasso}} = \ mathrm {sgn} (\ beta ^ {\ text {LS}} _ j) (| \ beta_j ^ {\ text {LS} } | - \ gamma) ^ + $$ for det ortonormale $ X $ tilfellet. Det hevdes at løsningen kan "lett vises" for å være slik, men jeg har aldri sett en bearbeidet løsning. Har noen sett en eller kanskje har gjort avledningen?

Dette virker litt forvirret. I begynnelsen antar du en begrensning $ t $, og i løsningen introduserer du en parameter $ \ gamma $. Jeg antar at du har tenkt at disse to skal være relatert via det dobbelte problemet, men kanskje du kan gjøre klart hva du leter etter.

Delvis å svare på at @cardinal, finner $ \ beta $ som minimerer $ (YX \ beta) '(YX \ beta) $ underlagt $ \ | \ beta \ | _1 \ leq t $ tilsvarer å finne $ \ beta $ som minimerer $ (YX \ beta) '(YX \ beta) + \ gamma \ sum_j | \ beta_j | $. Det er et 1-1 forhold mellom $ t $ og $ \ gamma $. For å 'enkelt' se hvorfor det myke terskelresultatet er slik, vil jeg anbefale å løse det andre uttrykket (i min kommentar).

En annen merknad, når du finner $ \ beta $ som minimerer $ (YX \ beta) '(YX \ beta) + \ gamma \ sum_j | \ beta_j | $, deler du problemet opp i sakene $ \ beta_j> 0 $, $ \ beta_j <0 $, og $ \ beta = 0 $.

@Mike: Angående din første kommentar: Det var poenget mitt. Jeg håpet å få OP til å avklare dette for seg selv (og andre).

@Mike: Dessuten er forholdet ikke helt en-til-en, for for store nok $ t $ vil løsningen alltid være den minste kvadratiske løsningen, dvs. den som tilsvarer $ \ gamma = 0 $. :)

@cardinal Din metode for å egg OP for å videreutdype problemet er god :) Jeg prøvde å bruke spørsmålet ditt som en innledning til mitt hint. Jeg antok at OP var ukjent med resultatet - hvis jeg er feil, beklager Gary!

@cardinal Ah ja, 1-1 er feil. Korrigering: for hver $ t \ geq0 $ kan du finne $ \ gamma \ geq 0 $.

@Mike: Jeg liker å gjøre det. Noen ganger "degenererer" den til lange kommentarstrømmer; men det er alltid hyggelig å se når det klikker i hodet på noen fordi han / hun tenkte på det i stedet for å bli vist. Når det er sagt, har jeg gått frem og motstått den fristelsen litt i dette tilfellet. Jubel. :)

-1

@MikeWierzbicki faktisk. Det ser ut til at dette forholdet mellom $ t $ og $ \ gamma $ er $ \ sum_ {i} ^ p (| \ hat {\ beta} _i ^ {\ text {LS}} | - \ gamma) _ + = t $

Takk for en flott diskusjon! Jeg kom over denne videoen på coursera - [Deriving the lasso coordinate descent update] (https://www.coursera.org/learn/ml-regression/lecture/6OLyn/deriving-the-lasso-coordinate-descent-update),som er veldig relevant for denne diskusjonen, og går veldig elegant gjennom løsningen.Kan være nyttig for fremtidige besøkende :-)

Se [her] (https://stats.stackexchange.com/questions/123672/coordinate-descent-soft-thresholding-update-operator-for-lasso/351134#351134) for en fullstendig avledning av koordinatnedstigningssaken