Tema 30: Ampliación de ANOVA: ANOVA de medidas repetidas, ANCOVA, MANOVA y MANCOVA

1. En el Tema dedicado a la introducción al ANOVA (el Tema 15) vimos que hay una serie de conceptos que caracterizan el lenguaje de esta técnica de técnicas que es el ANOVA. Es tan técnica de técnicas el mundo ANOVA que las que vamos a presentar aquí (ANOVA de medidas repetidas, ANCOVA, MANOVA y MANCOVA) se pueden considerar, perfectamente, de hecho, parte de ese complejo y amplísimo mundo que es el ANOVA. Por eso, uso en este Tema la noción de ampliación de ANOVA, porque son variantes de esa técnica madre, porque podríamos decir que son técnicas derivadas del ANOVA.

2. Al hablar de conceptos que caracterizan el lenguaje ANOVA me estoy refiriendo a los conceptos de factor, nivel, factor fijo/factor aleatorio, factor cruzado/factor anidado, interacción o comparaciones múltiples. Estos conceptos también forman parte del ANOVA de medidas repetidas, del ANCOVA, del MANOVA o del MANCOVA, lo que sucede es que estas técnicas precisan de unas variantes conceptuales que vamos a ver a continuación y que no vimos en el tema introductoria del ANOVA.

3. Una ampliación de este lenguaje nos lleva a tener que introducir los siguientes conceptos siguientes conceptos no vistos en la introducción al mundo ANOVA:

a. Medidas repetidas.

b. Covariables.

c. Vector de variables respuesta.

4. Cada uno de estas tres conceptos nos llevan a una técnica distinta y que supone un paso hacia una mayor complejidad. Pero complejidad en muchas ocasiones necesaria porque la realidad estudiada no obliga a ello.

5. Las medidas repetidas nos llevan al ANOVA de medidas repetidas.

6. Las covariables nos llevan al ANCOVA (donde se añade la C de covariable).

7. El vector de variables respuesta nos lleva al MANOVA (de ANOVA multivariante, por eso la M).

8. Además, si a esta última técnica le añadimos la noción de covariable, llegamos entonces al MANCOVA (añadiendo la C de covariable).

9. Importante tener en cuenta (lo repito) que en estas variantes de ANOVA o técnicas derivadas del ANOVA, se usa todo lo que hemos visto en la introducción: factor, nivel, factor fijo/factor aleatorio, factor cruzado/factor anidado, interacción, comparaciones múltiples.

10. Veamos una a una las peculiaridades de esas técnicas que en realidad son derivadas del ANOVA porque, de hecho, amplian lo realizado allí a situaciones progresivamente más complejas.

11. En primer lugar veamos el ANOVA de medidas repetidas. En el punto 63 del Tema 15 introducía unos datos que podían analizarse con un modelo denominado de Bloques aleatorizados. En realidad, en ese ejemplo está el germen de lo que es el ANOVA de medidas repetidas. Recordémoslo.

12. El aquel punto del tema 15 hablaba de unos pacientes que son sometidos a cuatro condiciones que se quieren comparar. Todos los pacientes pasan por todas las condiciones. Lo que se quiere es estudiar si hay diferencias entre esas cuatro condiciones. No entre los pacientes. Los datos son los siguientes:

IMG_4866

13. El factor condición, con cuatro niveles, en realidad, son medidas repetidas realizadas a cinco pacientes. Cada paciente es sometido a las cuatro condiciones a comparar. Si este estudio se hubiera hecho con 20 personas distintas, y a 5 de ellas se los sometiera a la primera condición, a otros 5 a la segunda condición, etc., estaríamos hablando de un ANOVA de un factor a efectos fijos, pero como no es así lo debemos enfocar de otra forma.

14. En el Tema 15 vimos que esta situación planteada puede analizarse como Bloques aleatorizados pero esta opción queda limitada. No da más de sí. No se puede ampliar introduciendo más factores. Sin embargo, enfocarlo desde el mundo ANOVA de medidas repetidas nos abre un mundo de muchas posibilidades porque nos permite introducir mucha más complejidad, como veremos a continuación.

15. Supongamos que queramos no sólo comparar un grupo de pacientes, como es lo que hemos vistos antes, sino diferentes grupos de pacientes tratados de forma distinta, o recogidos en condiciones distintas.

16. Veamos los siguientes datos:

IMG_0748

17. Si se observa bien los grupos del nivel 1 del Factor añadido en la primera columna son los datos del ejemplo anterior. Sin embargo, ahora se ha añadido un segundo nivel que quiere también compararse con el primero. O sea, no sólo queremos ver si hay diferencias entre las distintas condiciones (que son medidas repetidas, medidas hechas a los mismos pacientes) sino también entre los distintos tratamientos (1 y 2, del Factor) o distintos tipos de pacientes que queremos también comparar para detectar diferencias entre ellos.

18. En estas situtaciones suele distinguirse entre INTERSUJETOS e INTRASUJETOS. Observemos que cuando comparamos las cuatro condiciones estamos analizando un factor INTRASUJETOS, estamos analizando cambios que ocurren dentro de un sujeto, estudiamos el perfil de los valores que tiene cada sujeto. Sin embargo, cuando analizamos los dos niveles del Factor de la primera columna estamos analizando un factor INTERSUJETOS, estamos comparando si hay diferencias entre los pacientes del grupo 1 y 2 en cuanto al conjunto de perfiles que tienen de las diferentes condiciones repetidas analizadas.

19. Si hacemos una mirada intrasujetos podemos ver que hay valores grandes, medianos y pequeños en cada sujeto pero hay una regularidad muy clara: En la Condición 3 (C3) cada individuo obtiene los valores más altos y la Condición 4 (C4) tenemos los valores más bajos. Hay una regularidad clara a ese nivel. Esto la técnica estadística lo captará como algo significativo porque es muy regular.

20. Esto que acabo de decir se ve tanto en los datos del punto 12 anterior donde sólo había un grupo de sujetos, como en los dos casos del punto 16 donde ahora hay dos grupos de sujetos a comparar. El intrasujetos es, por lo tanto, significativo en los tres casos. Si no se viera esa regulariadad la estadística nos diría que no hay diferencias significativas en el factor intrasujetos. Es lo que sucedería en los datos que se muestran a continuación:

IMG_0750

21. Observemos que son los mismos números de la tabla del punto 12 pero con otra disposición. Ahora no hay la regularidad que se veía allí. No hay significación en el factor intrasujetos. No hay diferencias entre las cuatro condiciones.

22. En los datos del punto 12 ó en estos últimos vistos, no hay nada más que hacer. Únicamente es posible analizar la influencia de ese factor intrasujetos. Pero en los datos del punto 16 sí es posible hacer más, puesto que tenemos, además, un factor intersujetos.

23. Si se observan los datos del punto 16 en los primeros parece que hay un ligero aumento del nivel 2 del factor columna, del factor intersujetos, pero que dada la enorme variación que tenemos la estadística no lo captará como significativo. Sin embargo, en los segundos datos el nivel 2 presenta valores mucho más elevados. Esa diferencias sí las captará, la técnica estadística, como significativa.

24. Este es, pues, el nivel introducido en el ANOVA de medidas repetidas: la posibilidad de hacer un ANOVA con uno o más factores, cruzados, anidados, fijos o aleatorios, pero con un factor cuyos niveles se evalúan a todos los individuos del estudio: es la variable que introduce las medidas repetidas y es la que tiene la particularidad de ser intrasujetos, porque se mide a todos sujetos. En el ANOVA no existía este tipo de situación, todo era, digamos, intersujetos. Cada sujeto se media la variable una única vez.

25. Los diferentes softwares estadísticos que tienen incorporada la técnica ANOVA de medidas repetidas pide cuál es el factor intrasujetos y cuál o cuáles los factores intersujetos. Si sólo hay factor intrasujetos (el caso del punto 12) no se introducen factores intersujetos y, por lo tanto, únicamente nos aportará la significación o no de ese factor intrasujetos. Si hay uno o más factores intersujetos se deberán especificar y tendremos también significación de esos factores.

26. Veamos ahora el ANCOVA. Ahora tenemos un ANOVA con uno, dos, etc, factores. Como siempre tenemos una variable respuesta a estudiar pero, la peculiaridad es que, ahora, además, tenemos medida otra variable cuantitativa a cada sujeto del estudio que puede ser responsable de la variación vista en la variable respuesta. O sea, además de la influencia de los factores estudiados tenemos una variable cuantitativa que puede estar explicando también las variaciones que vemos. A esta variable la denominamos Covariable.

27. Veamos un ejemplo: Supongamos los siguientes datos:

IMG_0751

28. Tenemos un caso de ANOVA de un factor con tres niveles y una variable respuesta. El ANOVA nos va a permitir detectar si hay diferencias entre esos tres niveles. Si hacemos un ANOVA tenemos los siguientes resultados:

IMG_0752

29. Como puede verse el p-valor es superior a 0.05. Es verdad que la media muestral del grupo 3 es superior a la del grupo 2 y ésta superior a la del grupo 1. Pero, hay mucha dispersión. Además, el tamaño muestral es pequeño, claro. Pero la dispersión es enorme.

30. Supongamos que tenemos una variable que medida individuo a individuo, al mismo tiempo que medimos la variable respuesta del estudio, vemos que presenta correlación con la variable respuesta que es la variable que queremos realmente analizar. Esa variable puede ser que explique la dispersión de resultados. Entonces, si la introducimos como covariable, esta variable va a explicar dispersión y va a poder comparar las diferencias entre los tres grupos descontando el efecto que cada individuo sufre como consecuencia de la acción de esa variable.

31. Veamos los resultados que obtenemos si introducimos esta covariable:

IMG_0753

32. Ahora sí que es un factor significativo. Observemos que el p-valor es 0.0069. Y eso es gracias a que la dispersión que antes nos impedía ver diferencias entre los grupos ahora la vemos explicada por esa covariable y, por lo tanto, la comparación entre los tres niveles se hace mirando de descontar el efecto perturbador y confusor que introduce esa covariable.

33. Detectar covariables, como detectar otros factores que influyan introduciendo variación es fundamental a la hora de diseñar un ANOVA más eficaz, un ANOVA que acabe comparando de la forma lo más pura posible los tratamientos o las condiciones que realmente queremos comparar.

34. Veamos ahora el MANOVA. Se trata de un ANOVA pero con la peculiaridad de que en lugar de una variable respuesta tenemos un vector respuesta. O sea, dos o más variables respuesta, al mismo tiempo. Y queremos ver el efecto, o los efectos, del factor, o de los factores, que estamos estudiando no para una variable sino para un grupo de variables al unísono, al mismo tiempo. Queremos detectar igualdad o diferencia no de valores de una variable sino de valores de punto definidos por muchas variables.

35. Hay algo que puede ayudar a ver cómo actúa el MANOVA y por qué es necesario muchas veces. Veamos el siguiente dibujo:

IMG_0754

36. Tenemos aquí dos muestras de dos grupos que han podido ser tratados de forma diferente y que queremos comparar. Tenemos medidas de dos variables respuesta: la variable x y la variable y. Si hacemos un ANOVA con esos dos grupos para la variable x y otro ANOVA para la variable y, veremos que los dos grupos se ven desde esas variables muy solapados, lo que nos llevará a no ver diferencias significativas en ninguna de las dos variables:

IMG_0755

37. Observemos que en los ejes están dibujadas las proyecciones, que es lo que en realidad veríamos si analizáramos x e y por separado. Puede verse perfectamente que ambos grupos se ven muy solapados. Sin embargo, los dos grupos, vistos conjuntamente mediante las dos variables x e y, al mismo tiempo, se ve claro que están separados, que ocupan posiciones significativamente distintas en el plano.

38. Si se entiende esto se ve perfectamente que no es lo mismo hacer tantos análisis ANOVA como variables respuesta tengamos que hacer un MANOVA de todas las variables respuesta al unísono, viéndolas conjuntamente.

39. Todo lo demás, es igual, factores, niveles, etc. Lo importante es ver que el MANOVA trabaja con dos o más variables respuesta al mismo tiempo, pero todo lo demás es exactamente igual.

40. Y evidentemente el MANOVA puede incorporar también una o más covariables, siendo entonces un MANCOVA lo que estamos aplicando.

41. En el fichero Un estudio para aplicar ANOVA, ANCOVA, ANOVA de medidas repetidas, Regresión simple y Regresión múltiple, puede verse un ejemplo de aplicación de estas técnicas.

Deja un comentario

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s