Spørsmål:
Må vi rapportere medianen eller gjennomsnittet når vi bruker en Kruskal-Wallis-test?
jorrebor
2012-08-06 17:41:06 UTC
view on stackexchange narkive permalink

Jeg har to grupper. Det er en betydelig forskjell i henhold til KW-testen. Men trenger jeg å rapportere gjennomsnittet eller medianen til gruppene?

@MånsT ja dette forstår jeg, men jeg er forvirret om hvilken av de to jeg trenger å rapportere.
Testen avgjør om det er et stedskifte i distribusjonen eller ikke. Som Frank Harrell nevnte, er dette ikke akkurat testing for en forskjell i medianen eller gjennomsnittet. Faktiske verdier for medianer og midler er alltid verdt å rapportere, så vel som sammenlignende boksplott. Testen trenger ikke å diktere hvilke andre sammendrag som skal rapporteres når man sammenligner de to distribusjonene.
To svar:
Frank Harrell
2012-08-06 18:07:19 UTC
view on stackexchange narkive permalink

Wilcoxon / Kruskal-Wallis-testen er verken for gjennomsnittet eller medianen, selv om medianen kan være nærmere det testen tester. Estimatoren som er i samsvar med testen er Hodges-Lehmann-estimatoren. Se http://en.wikipedia.org/wiki/Mann-whitney og http://en.wikipedia.org/wiki/Hodges%E2%80%93Lehmann_estimate. I R kan du enkelt gjøre beregningene - se for eksempel http://biostat.mc.vanderbilt.edu/WilcoxonSoftware.

(+1). @jorrebor, kan du også være interessert i å lese _kommentarer_ til dette [svaret] (http://stats.stackexchange.com/questions/16219/testing-the-difference-of-some-quantile-q-between-groups).
gui11aume
2012-08-06 18:03:41 UTC
view on stackexchange narkive permalink

Kruskal-Wallis-testen sies å teste om medianen er den samme i hver gruppe. I henhold til den enkle regelen, bør du rapportere medianen, som er svaret på spørsmålet ditt.

Dette gir meg imidlertid anledningen til å vise at KW egentlig ikke er en test av medianen. Den alternative hypotesen for testen er ikke at en av distribusjonene har en annen median. Det er den ene distribusjonene har nøyaktig samme form som de andre, men forskyves opp eller ned.

Her er et lite R-snutt som demonstrerer dette. Jeg lager to prøver med samme median (nemlig 0), og jeg bruker Kruskal-Wallis-testen.

  set.seed (123) x <- exp (rnorm (100)) y <- exp (rnorm (100)) x <- x - median (x) y <- median (y) - y # Både x og y har median 0. kruskal.test (liste (x, y))  

Det viser seg at p-verdien er 0,005676, noe som virker veldig lavt for to prøver med nøyaktig samme median. Dette er fordi prøvene er hentet fra distribusjoner som er veldig skjev i motsatt retning (prøven x har en tung hale på høyre side og y på venstre side).

Er KW-testen feil? Nei. Det er riktig å avvise nullhypotesen om at prøver er tatt fra samme fordeling.

Så konklusjonen er at du kan ikke konkludere med at det er forskjell i medianen bare fordi du avviser null hypotese . Du kan også avvise nullhypotesen på grunn av manglende uavhengighet, eller som vist i forrige eksempel fordi distribusjoner ikke har de samme formene.

Jeg tror det ikke er nødvendig å nevne alt dette mens du rapporterer medianen. , men dette er elementer du bør ha i bakhodet hver gang du gjør testen.

+1, det er en veldig fin demonstrasjon; klar og grundig


Denne spørsmålet ble automatisk oversatt fra engelsk.Det opprinnelige innholdet er tilgjengelig på stackexchange, som vi takker for cc by-sa 3.0-lisensen den distribueres under.
Loading...