Archivos Mensuales: octubre 2013

Algoritmo de Bennet-Franklin

En los diferentes modelos de Análisis de la varianza (ANOVA), uno de los principales niveles de complejidad, cuando trabajamos con más de un factor, es saber cuáles son las F-ratio; o sea, los cocientes entre cuadrados medios que hay que hacer para realizar los contrastes de hipótesis necesarios para resolver del modelo. Elegir los cocientes adecuados es clave para que la decisión esté bien fundamentada.

El Algoritmo de Bennet-Franklin es un clásico mecanismo para encontrar las esperanzas de los cuadrados medios y así diseñar los cocientes necesarios para la realización de esos contrastes de hipótesis.

Evidentemente es muy recomendable leer el tema Tema 15: ANOVA para situar las nociones de factor, de nivel de un factor, de factor fijo o aleatorio, de factores cruzados o anidados, que irán apareciendo a continuación. También es importante ver los distintos modelos ANOVA que están descritos en el apartado HERBARIO DE TÉCNICAS de este Blog.

El objetivo de este Algoritmo de Bennet-Franklin es, como digo, la obtención de las esperanzas de los cuadrados medios calculados en cualquier tabla ANOVA y, por lo tanto, localizar los cocientes oportunos. Muchos software hacen cocientes incorrectos o bien dejan abierta la opcionalidad de los cocientes. El cálculo analítico de estas esperanzas es matemáticamente complejo. Por esto este sencillo algoritmo tuvo mucho éxito en su momento y continúa aplicándose hoy en día.

Veamos cómo es este Algoritmo.

Cuando se tiene localizado el modelo se trata de crear, en primer lugar, una matriz con tantas filas como efectos (parámetros o combinaciones de los parámetros con subíndices) tenga el modelo y tantas columnas como subíndices utilizados en el modelo.

A continuación se siguen los siguientes pasos:

1. Se escribe 1 en toda la fila correspondiente al residuo.

2. En todo cruce de fila con columna donde coincida un subíndice se escribe un 0 si el subíndice corresponde a un factor fijo que no corresponda a un subíndice que jerarquice a algún factor anidado en él. Se escribe, por el contrario, un 1 si el subíndice corresponde a un factor aleatorio o si forma parte de un subíndice que jerarquiza a algún factor anidado en él.

3. Los espacios vacíos se rellenan con el número de valores de cada uno de los subíndices de las diferentes filas de la matriz creada.

Veamos un ejemplo en un caso de dos factores cruzados y con un factor fijo y el otro aleatorio. Se trata del ANOVA de dos factores a efectos mixtos:

Primero se construye la siguiente matriz:

IMG_7020

Una fila por efecto y una columna por cada índice implicado. A continuación se ponen siempre, como he dicho en el apartado primero 1 en la última fila, la del residuo:

IMG_7021

A continuación se mira cada fila por fila y cuando coincida un subíndice del efecto considerado en la fila con el subíndice de la columna se pone un 0 ó un 1 según el criterio especificado en el anterior punto 2. Lo repito: Se escribe un 0 si el subíndice corresponde a un factor fijo que no corresponda a un subíndice que jerarquice a algún factor anidado en él. Se escribe, por el contrario, un 1 si el subíndice corresponde a un factor aleatorio o si corresponde a un subíndice que jerarquiza a algún factor anidado en él.

Veámoslo en nuestro ejemplo:

IMG_7022

Ahora, siguiente el punto 3 anterior rellenamos las casillas vacías con los valores máximos de cada unos de los subíndices de las columnas:

IMG_7023

Una vez llegados aquí debemos proceder de la siguiente forma. Fila por fila (efecto por efecto) iremos calculando la esperanza de los cuadrados medios tachando siempre las columnas donde aparezcan individualmente cada uno de los subíndices implicados en el efecto y las filas que no contengan a todos los subíndices implicados en el efecto considerado en aquel momento. Veámoslo paso a paso en nuestro ejemplo inicial:

IMG_7025

Observemos que para evaluar la esperanza del primer efecto he tachado lo especificado: la primera columna, porque tiene la i y la segunda fila porque no contiene a la i. Al mismo tiempo he añadido los efectos en una columna a la derecha. Los efectos de un factor fijo pongo simplemente Efecto A o Efecto B o lo que sea (también pongo Ef.A como abreviación).

La esperanza del cuadrado medio consiste en ir multiplicando por filas lo que hay. Primera fila: bnEf.A, etc. Luego se suman estos productos por fila y acabas obteniendo la esperanza de aquel cuadrado medio.

Veamos la segunda esperanza:

IMG_7026

Observemos que ahora nos queda más simplificado porque en una de las filas hay un 0 y esto transforma el producto de toda la fila en 0.

Siguiente esperanza de cuadrado medio:

IMG_7028

Y, finalmente, la esperanza del cuadrado medio residual: este siempre lo podemos poner directamente como la sigma al cuadrado del modelo: la varianza residual, la varianza de las condiciones experimentales que siempre suponemos que es igual en todas las condiciones, por eso no tiene subíndice.

Pues ya lo tenemos. Podemos ver que coincide con las esperanzas de los cuadrados medios expuestos en el modelo ANOVA de dos factores a efectos mixtos.

Pues vamos ahora a practicar. Vamos a calcular mediante este Algoritmo las esperanzas de los cuadrados medios del modelo ANOVA de dos factores a efectos fijos:

La matriz sería:

IMG_7029

Y el cálculo de las esperanzas medias es:

IMG_7030

Vayamos ahora con otro caso, el modelo ANOVA de dos factores a efectos aleatorios:

La matriz:

IMG_7031

Las esperanzas:

IMG_7032

Otro ejemplo, ahora con factores anidados. El modelo ANOVA de dos factores anidados a efectos fijos:

La matriz es:

IMG_7039

Y las esperanzas son:

IMG_7040

Otro modelo, el ANOVA de dos factores anidados a efectos aleatorios:

La matriz es:

IMG_7041

Y las esperanzas de los cuadrado medios es:

IMG_7042

Y ahora casos un poco más complejos. Primero el modelo ANOVA con dos factores fijos cruzados y un tercer factor fijo anidado en ellos:

IMG_7048

Los cuadrados medios se calculan así:

IMG_7043

Otro modelo: ANOVA con dos factores fijos cruzados y un tercer factor aleatorio anidado en ellos:

IMG_7048

Las esperanzas son:

IMG_7044

Otro modelo: ANOVA de tres factores fijos anidados sucesivamente:

IMG_7050

Esperanzas:

IMG_7045

Veamos un modelo que es una variante del anterior. Tres factores anidados sucesivamente pero donde el primero es fijo y los otros dos son aleatorios. El modelo sería el siguiente:

captura-de-pantalla-2016-12-16-a-las-10-14-12

Y las esperanzas:

captura-de-pantalla-2016-12-16-a-las-10-14-24

Otro modelo: ANOVA de dos factores fijos cruzados y un tercer factor aleatorio anidado en uno de esos dos factores fijos:

IMG_7050

Esperanzas:

IMG_7046

Con todo lo visto podemos apreciar que mediante este Algoritmo de Bennet-Franklin tenemos un poderoso instrumento para poder encontrar las esperanzas de los cuadrados medios. Esto es clave para saber cuáles son los concientes que hay que hacer para contrastar los diferentes contrastes de hipótesis en cada modelo.

Estos cocientes son claves porque de lo que se trata con ellos es que en el numerador y en el denominador del cociente se estime lo mismo en el caso de ser cierta la Hipótesis nula. Que en el numerados el único elemento diferencial con el denominador sea el efecto focalizado en el contraste implicado. De esta forma si la F-ratio calculada es un valor pequeño deberemos mantener la Hipótesis nula y si ese F-ratio es grande la rechazaremos. Y lo haremos con razón porque el único elemento diferencial, como digo, será el elemento del contraste en cuestión.

Solución Situación 38

Se trata de un análisis con dos factores. Uno fijo (la forma de medida) y otro aleatorio (el factor medidor). Es por lo tanto un caso de ANOVA de dos factores a efectos mixtos. Un factor fijo cruzado con un factor aleatorio.

Debemos comprobar la normalidad de los residuos (con el test de Shapiro-Wilk). Debemos comprobar la igualdad de varianzas (con el test de Bartlett). Supongamos que ha sido comprobado y estamos bajo estas condiciones. De hecho, si miramos los datos, podemos comprobar que con muchas posibilidades se cumplirán esas condiciones. No hay ni aspecto de no normalidad, ni de heterogeneidad de varianzas, en cada uno de las ocho condiciones experimentales. Otra cosa sería que en algún grupo se vieran valores mucho más dispersos que en los otros, o una asimetría clara que hiciera pensar en un alejamiento de la distribución normal.

Si miramos los datos con atención podemos comprobar que hay una variabilidad residual, la que hay en cada una de las ocho condiciones experimentales. Una variabilidad residual que no es muy grande respecto a la que se aprecia en el conjunto de los datos.

Si miramos los datos veremos que los dos niveles del factor fijo (tipo de medida: fotoeléctrica o con cinta métrica) no presentan diferencias que parezcan muy relevantes.

Si miramos con atención los datos también podemos ver que los medidores sí que aportan una variabilidad considerable.

Y, finalmente, podemos apreciar, también, a simple vista, que no hay interacción: no parece que los resultados de un medidor cambien mucho si la medición la hace mediante un método u otro. El medidor que tiene tendencia a dar valores bajos los da bajos con ambos métodos. Y el medidor que tiende a dar valores altos los da altos con ambos métodos.

Veamos que todo esto está en consonancia con el análisis:

La tabla ANOVA es la siguiente:

IMG_6990

Comprobar que aquí los cocientes de cuadrados medios se han hecho tal como dispone el ANOVA de dos factores a efectos aleatorios. El factor fijo va dividido por la interacción y el factor aleatorio por el residuo.

El factor fijo, tipo de medida, no presenta diferencias significativas (p-valor=0.2582), como puede apreciarse también en los intervalos de confianza del 95%:

IMG_6992

El factor medidor, que es aleatorio, porque hemos elegido una muestra de alumnos para ver si, en general, el medidor introduce variabilidad, sí que es un factor significativo. No hace falta representar sus intervalos de confianza porque, al tratarse de una muestra de niveles, lo que nos interesa de esos alumnos es estimar la componente de la varianza que introduce el medidor en general.

Tampoco hay interacción. El gráfico de interacción también lo muestra:

IMG_6994

Aunque hay un ligero cruce de líneas entre el alumno 3 y 4 no se trata de una interacción significativa, como muestra el p-valor de 0.2021.

Los parámetros del modelo son la constante, el efecto del factor fijo, que no es significativo, y las tres componentes de la varianza: la de medidor, la de la interacción, que tampoco es significativa, y la residual.

Los valores de estos parámetros son:

IMG_6995

Este 1662.71 es el valor de la constante, la mu del modelo. La alfa1 sería -0.875 y la alfa2 sería 0.875. Pero esto es una estimación. Hemos de tener en cuenta que el contraste de hipótesis nos muestra que este efecto no es significativo.

Finalmente las componentes de la varianza. La estimación es la siguiente:

IMG_6997

La componente de la varianza residual es el valor del cuadrado medio residual de la tabla ANOVA; o sea, 5.5. Las demás se calculan, como puede verse, a partir de la esperanza de los cuadrados medios del factor Alumno y de la esperanza de los cuadrados medios de la interacción. Ver de nuevo el fichero ANOVA de dos factores a efectos mixtos.

Se trata de estimaciones. El de la interacción, como hemos visto antes, no es una componente significativa.

Todo ello confirma que, realmente, a partir de estos datos del experimento, la variabilidad de la medición de la altura, es fundamentalmente una variabilidad introducida por el medidor. Que los dos sistemas de medida evaluados presentan diferentes importantes, ni las propias repeticiones del medidor. La variabilidad es entre medidores. Se maneja de forma muy distinta al paciente, por parte del medidor, a la hora de poner en posición al paciente para medirlo.

Solución Situación 39

1d: El primer cuartil es 4 y el tercer cuartil es 8.5. Por lo tanto, el rango intercuartílico es 4.5. La mediana no es 9. Es 6.5.

2d: Siempre que tenemos un p-valor es que hemos realizado un Contraste de hipótesis. En este apartado se muestra un p-valor menor que 0.05, por lo que rechazaremos la Hipótesis nula. En un contraste de hipótesis el mecanismo siempre es el mismo: Hipótesis nula versus Hipótesis alternativa. Si el p-valor es superior o igual a 0.05 mantenemos la Hipótesis nula. Si el p-valor es menor que 0.05 entonces rechazamos la Hipótesis nula y aceptamos la Hipótesis alternativa.

El p-valor muchas veces se da simplemente como mayor o menor que 0.05. En el fondo es lo que básicamente nos interesa: Saber si debemos mantener la Hipótesis nula, previamente tomada como cierta, o si, por el contrario, debemos pasarnos a la Hipótesis alternativa. Por eso, en absoluto es cierto el apartado a.

El apartado b tampoco es cierto. Cuando una correlación es significativa sabemos inmediatamente si es positiva o negativa.

El apartado c también es incorrecto. El criterio de decisión es justo el contrario del que se especifica ahí.

3b: Para que el índice de Gini sea 0 todos los valores de la muestra deben ser iguales. En este caso la curva de Lorenz coincide con la diagonal y, por eso, el índice de Gini es 0. Y esto representa que la desviación estándar es también 0.

El valor máximo del coeficiente de Gini es 1, no 0.5.

El apartado c es incorrecto. Esa muestra nos daría un índice de Gini próximo a 1, no a 0.

Ni en el índice de Gini ni en la desviación estándar pueden tener valores negativos.

4c: En este apartado c, la correlación 0.3 es mayor que la correlación 0.5, sencillamente porque esta última no es significativa y, por lo tanto, debemos pensar que no tenemos argumentos para descartar que poblacionalmente la correlación no sea 0.

El apartado a es incorrecto porque una r=0.9 es una correlación con más magnitud que una r=0.5 pero para decir que sea más significativa deberíamos tener los p-valores, cosa que no tenemos.

La cantidad de correlación lo marca la magnitud. Por lo tanto, 0.5 no es mayor que -0.6.

El apartado d es incorrecto, también. Como ninguna de esas dos correlaciones es significativa, ambas correlaciones son 0 y, por lo tanto, ninguna es mayor que la otra. No tenemos información muestral suficiente, de momento, para decir cuál es mayor.

5d: Al tratarse de un intervalo de confianza de la media debemos calcular el Error estándar, que es 10/raíz(100); o sea, 1. Por lo tanto, un intervalo de confianza del 99.5 sería la media más menos 3 errores estándar; o sea, (47, 53).

Situación 39: Examen (Temas 1-5)

1. En la muestra (8, 9, 5, 3), ¿qué afirmación es cierta?

a) El primer cuartil es 8.5.

b) El tercer cuartil es 4.5.

c) La mediana es 9.

d) El rango intercuartílico es 4.5.

2. Si la correlación entre dos variables es r=0.56 (p<0.05), ¿qué afirmación es cierta?

a) No sabemos si la correlación es significativa porque no tenemos el valor exacto del p-valor.

b) La correlación es significa pero no sabemos si es positiva o negativa.

c) La correlación no es significativa porque el p-valor es menor que 0.05.

d) En este contraste de hipótesis hemos rechazado la Hipótesis nula y hemos aceptado la Hipótesis alternativa, por ser el p-valor inferior a 0.05.

3. ¿Qué afirmación entre las siguientes es cierta?

a) El índice de Gini es máximo cuando es 0.5.

b) Un índice de Gini de 0 equivale a una Desviación estándar también de 0.

c) La curva de Lorenz de la muestra (1, 1, 1, 1000) nos daría un índice de Gini muy próximo a 0.

d) En el índice de Gini, contrariamente a lo que sucede con la desviación estándar, podemos tener valores negativos.

4. ¿Qué afirmación es cierta?

a) r=0.9 es una correlación más significativa que una correlación r=0.5.

b) r=0.5 es una correlación mayor que r= – 0.6.

c) r=0.3 (p=0.003) es una correlación mayor que una r=0.5 (p=0.56).

d) r=0.6 (p=0.48) es una correlación menor que una r=0.7 (p=0.45)

5. Tenemos una muestra de tamaño 100 de una variable que se ajusta bien a una distribución normal. La media muestral es 50 y la desviación estándar es 10. ¿Qué afirmación es cierta?

a) Un Intervalo de confianza del 95% de la media sería: (49, 51).

b) Un intervalo de confianza del 95% de valores individuales de la variable sería: (40, 60).

c) Un intervalo de confianza del 95% de la media sería: (30, 70).

d) Un intervalo de confianza del 99.5% de la media sería: (47, 53).

Solución

Situación 38: Un problema de ANOVA

Estamos estudiando qué elementos introducen más variación a la hora de medir la altura de pacientes ancianos con problemas de osteoporosis. Para ello cogemos una anciana voluntaria predispuesta a ser medida en muchas ocasiones. Usamos dos sistemas de medida: un sistema fotoeléctrico y el de la típica cinta métrica. También escogemos al azar a cuatro alumnos de la asignatura de Reumatología en la facultad de Medicina para que hagan las medidas. Con ello queremos valorar la contribución a la variabilidad de la medida que aporta la persona que la haga. Estos alumnos no saben que forman parte de este experimento. En tres semanas sucesivas se les pide, durante las prácticas, que midan a muchos y muchas ancianas en las consultas externas. Lo que no saben es que han medido de las dos formas distintas a la misma anciana tres veces. Esto se hace para que no puedan recordar la medida dada en una semana anterior. La medida se pedía que se diera en milímetros. Los resultados obtenidos fueron los siguientes:

IMG_6967

Hacer un ANOVA. Primero un ANOVA intuitivo, pensándolo, intentando ver en los datos qué nos podría dar un ANOVA calculado con un software estadística. Luego, hacer un ANOVA mediante un software y mediante el modelo adecuado.

 

El Box-Plot en Medicina

Hemos visto en el Tema 2: Estadística descriptiva, un excelente gráfico que resume en poco espacio una información muy valiosa. Pongo a continuación unos ejemplos de aplicación de este tipo de gráfico, en Medicina. Es muy importante familiarizarse con él porque proporciona una información descriptiva muy valiosa.

Veamos el gráfico siguiente donde se muestran cuatro Box-Plot, uno por cada tipo funcional de insuficiencia cardíaca, usando como variable analizada la concentración del Péptido natriurético tipo B, el conocido por las siglas BNP:

IMG_6929

El siguiente es un análisis de la misma variable (BNP) pero ahora comparando una diferente agrupación de pacientes, según tengan una insuficiencia cardíaca no congestiva, una dísnea no cardiogénica pero con disfunción ventricular izquierda y, finalmente, un grupo con dísnea originada por una insuficiencia cardíaca congestiva:

IMG_6926

El objetivo de esta última tabla es mostrar que cuando se combina afectación pulmonar y cardíaca el nivel de BNP aumenta.

Pero lo que quiero destacar aquí es el uso de estos interesantes gráficos (los Box-Plot) que de una tacada permiten visualizar el mínimo, el máximo, el primer cuartil, la mediana, el tercer cuartil, el rango, el rango intercuartílico de una muestra, y, habitualmente, la media muestral, aunque en este caso no aparece.

Un ejemplo de determinación del tamaño de muestra en Medicina

A continuación voy a comentar el proceso de elección del tamaño de muestra en el estudio del artículo siguiente:

IMG_6860

En este artículo se evalúa el efecto de una determinada acción rehabilitadora sobre enfermos que han padecido un ictus. Se comparan dos grupos: el control y el tratado. Para la elección del tamaño de muestra se escribe lo siguiente en el artículo (incluyo toda la parte del análisis de datos, aunque lo que nos interesa ahora es únicamente el primer párrafo):

IMG_6857

Observemos que en la descripción de la elección del tamaño de muestra elegido incluye todos los elementos que hay que tener en cuenta y que hemos visto en el Tema 16: DETERMINACIÓN DEL TAMAÑO DE MUESTRA: el error de tipo I (0.05), el error de tipo II (0.20 ó 20%) y su equivalente: la potencia (80%). Que el test sea bilateral; o sea, que interesa ver tanto si va bien como si va mal, el tratamiento. La Desviación estándar supuesta que se tendrá (10), que puede haberse conseguido o por estudios previos o por una premuestra, y, finalmente, qué diferencia mínima interesa detectar (una diferencia de 5 puntos en el índice SF-36). Una diferencia por debajo de la cual se consideraría que médicamente no tendría relevancia.

Es muy importante entender bien todos estos elementos. Porque siempre están presentes en la elección. A continuación, usando el GRANMO ( Ver, de nuevo, el Tema 16), se trata de buscar la opción de comparación de dos variables independientes y hemos de especificar los siguientes

parámetros (Uso ahora la opción del GRANMO como aplicación, pero es lo mismo que se puede conseguir en la página web):

IMG_6859

El programa nos devuelve la siguiente especificación:

IMG_6858

Nos dice que hemos de usar 63 pacientes por grupo que es lo que han hecho los que han planteado el estudio comentado. Esto significa que si la diferencia es mayor de 5 unidades del índice SF-36 lo detectaremos como estadísticamente significativo.