Hvorfor gir lme og aov forskjellige resultater for gjentatte tiltak ANOVA i R?

Henrik

2011-08-10 20:16:04 UTC

view on stackexchange narkive permalink

Jeg prøver å gå fra å bruke ez -pakken til lme for gjentatte tiltak ANOVA (som jeg håper jeg vil kunne bruke egendefinerte kontraster på med lme ).

Etter råd fra dette blogginnlegget klarte jeg å sette opp den samme modellen ved å bruke begge aov (som gjør ez , når det blir bedt om det) og lme . Imidlertid er F -verdiene i eksemplet gitt i det innlegget helt enige mellom aov og lme ( Jeg sjekket det, og de gjør det), dette er ikke tilfelle for dataene mine. Selv om F -verdiene er like, er de ikke de samme.

aov returnerer en f-verdi på 1.3399, lme returnerer 1.36264. Jeg er villig til å godta resultatet aov som det "riktige", ettersom dette også er det SPSS returnerer (og dette er det som teller for mitt felt / veileder).

Spørsmål:

Det ville være flott om noen kunne forklare hvorfor denne forskjellen eksisterer, og hvordan jeg kan bruke lme for å gi troverdige resultater. (Jeg vil også være villig til å bruke lmer i stedet for lme for denne typen ting, hvis det gir "riktig" resultat. Imidlertid har jeg ikke brukt det så langt.)
Etter å ha løst dette problemet vil jeg kjøre en kontrastanalyse. Spesielt ville jeg være interessert i kontrasten med å slå sammen de to første faktornivåene (dvs. c ("MP", "MT") ) og sammenligne dette med det tredje faktornivået (dvs. "AC" ). Videre testing av det tredje versus det fjerde faktornivået (dvs. "AC" versus "DA").

Data:

  tau.base <- struktur (liste (id = struktur (c (1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 10L, 11L , 12L, 13L, 14L, 15L, 16L, 17L, 18L, 19L, 20L, 21L, 22L, 1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 10L, 11L, 12L, 13L, 14L , 15L, 16L, 17L, 18L, 19L, 20L, 21L, 22L, 1L, 2L, 3L, 4L,
5L, 6L, 7L, 8L, 9L, 10L, 11L, 12L, 13L, 14L, 15L, 16L, 17L, 18L, 19L, 20L, 21L, 22L, 1L, 2L, 3L, 4L, 5L, 6L, 7L, 8L, 9L, 10L, 11L, 12L, 13L, 14L, 15L, 16L, 17L, 18L, 19L, 20L, 21L, 22L), .Label = c ("A18K", "D21C", "F25E", "G25D "," H05M "," H07A "," H08H "," H25C "," H28E "," H30D "," J10G "," J22J "," K20U "," M09M "," P20E "," P26G ", "P28G", "R03C", "U21S", "W08A", "W15V", "W18R"), klasse = "faktor"), faktor = struktur (c (1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 1L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 2L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 3L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L, 4L), .Label = c ("MP", "MT", "AC", "DA"), klasse = "faktor"), verdi = c (0,9648092876, 0,2128662077, 1, 0,0607615485, 0,9912814024, 3,22e-08, 0,8073856412, 0,1465590332, 0,9981672618, 1, 1, 1, 0,9794401938, 0,6102546108, 0,428651501, 1, 0,1 710644881, 1, 0.7639763913, 1, 0.5298989196, 1, 1, 0.7162733447, 0.7871177434, 1, 1, 1, 0.8560509327, 0.3096989662, 1, 8.51e-08, 0.3278862311, 0.0953598576, 1, 1.38e-08, , 0.545290432, 0.1305621416, 2.61e-08, 1, 0.9834051136, 0.8044114935, 0.7938839461, 0.9910112678, 2.58e-08, 0.5762677121, 0.4750002288, 1e-08, 0.8584252623, 1, 1, 0.6020383727.5 0.263377904, 1, 1.07e-08, 0.3160751898, 5.8e-08, 0.3460325565, 0.6842217296, 1.01e-08, 0.9438301877, 0.5578367224, 2.18e-08, 1, 0.9161424562, 0.2924856039, 1e-08, 0.8642664992 0.9988463913, 0.2960361777, 0.0285680426, 0.0969063841, 0.6947998266, 0.0138254805, 1, 0.3494775301, 1, 2.61e-08, 1.52e-08, 0.5393467752, 1, 0.9069223275)), .Names = "factor" verdi "), klasse =" data.frame ", rad.names = c (1L, 6L, 10L, 13L, 16L, 17L, 18L, 22L, 23L, 24L, 27L, 29L, 31L, 33L, 42L, 43L, 44L, 45L, 54L, 56L, 58L, 61L, 64L, 69L, 73L, 76L, 79L,
80L, 81L, 85L, 86L, 87L, 90L, 92L, 94L, 96L, 105L, 106L, 107L, 108L, 117L, 119L, 121L, 124L, 127L, 132L, 136L, 139L, 142L, 143L, 144L, 148L, 149L, 150L, 153L, 155L, 157L, 159L, 168L, 169L, 170L, 171L, 180L, 182L, 184L, 187L, 190L, 195L, 199L, 202L, 205L, 206L, 207L, 211L, 212L, 213L, 216L, 218L, 220L, 222L, 231L, 232L, 233L, 234L, 243L, 245L, 247L, 250L))

Og koden:

  krever ( nlme) sammendrag (aov (verdi ~ faktor + feil (id / faktor), data = tau.base)) anova (lme (verdi ~ faktor, data = tau.base, tilfeldig = ~ 1 | id))

Det ser ut til at du nettopp har svart på delen om kontrastene selv i svaret ditt [her] (http://stats.stackexchange.com/questions/14078/post-hoc-test-after-anova-with-repeated-measures-using -r / 14142 # 14142); Hvis ikke, kan du redigere dette spørsmålet slik at vi vet hvilken vanskelighet som gjenstår.

@Aaron, så lenge det er forskjeller i `lme`-resultatene fra standard lærebok ANOVA (gitt av` aov`, og det er det jeg trenger), er dette ikke et alternativ for meg. I papiret mitt vil jeg rapportere en ANOVA, ikke noe som en ANOVA. Interessant viser Venables & Ripley (2002, s. 285) at begge tilnærmingene fører til identiske estimater. Men forskjellene i * F * -verdier gir meg en dårlig følelse. Videre returnerer `Anova ()` (fra `bil`) bare Chi²-verdier for` lme`-objekter. Derfor blir ikke mitt første spørsmål besvart ennå.

Jeg forstår (men ikke del) din varighet med `lme '; men for kontraster, fungerer 'glht' på 'lm' passer også, ikke bare 'lme' passer. (Også, `lme`-resultatene er også standard lærebokresultater.)

Dessverre kan du ikke spesifisere 'lm' for en gjentatt måleanalyse. Bare "aov" kan håndtere gjentatte tiltak, men vil returnere et objekt av klasse "aovlist" som dessverre ikke håndteres av "glht".

Er dette bare et mindre eksempel da? Fordi du ikke trenger aov her, da det bare er innen emneeffekter.

@Aaron kan du utdype mer om dette. Hvorfor ingen `aov`? Generelt er jeg interessert i en generell løsning med både mellom og innen faktorer. Men hvis det er en annen fin måte for deler av dette problemet, vil jeg også være interessert.

`lm` bruker restfeilen som feiluttrykk for alle effekter; når det er effekter som skal bruke et annet feiluttrykk, er 'aov' nødvendig (eller i stedet for å bruke resultatene fra 'lm' for å beregne F-statistikken manuelt). I ditt eksempel er feiluttrykket for "faktor" interaksjonen "id: faktor", som er restfeiluttrykket i en additivmodell. Sammenlign resultatene dine med `anova (lm (verdi ~ faktor + id))`.

Jeg har svart på det første spørsmålet ditt nedenfor. Siden svaret er ganske langt, vil jeg foreslå at du starter et nytt spørsmål for det andre spørsmålet ditt.

Hvorfor skriver du "tilfeldig = ~ 1 | id" og ikke "tilfeldig = ~ 1 | (id / faktor)"?

> anova (lm1 <- lm (verdi ~ faktor + id, data = tau.base)) Df Sum Sq Gjennomsnitt Sq F verdi Pr (>F) faktor 3 0.6484 0.21614 1.3399 0.2694id 21 3.1609 0.15052 0.9331 0.5526 Rester 63 10.1628 0.16131