Archivos Mensuales: noviembre 2015

Solución Situación 89

1.Se trata de un modelo de dos factores fijos y cruzados. Ver ANOVA de dos factores fijos. Son, ambos, factores fijos porque se han elegido dos materiales concretos y tres tipos concretos de longitud de nanofibras. Se trata claramente de dos factores cruzados porque cada material se combinada con cada una de las tres longitudes de las nanofibras.

La tabla ANOVA es la siguiente:

Captura de pantalla 2015-11-26 a las 16.26.09

Para evaluar cuáles son los cocientes a hacer para obtener las respectivas F-ratio (Razón-F) debe verse el Algoritmo de Bennet-Franklin.

Esta tabla ANOVA nos muestra que hay diferencias entre los niveles del factor Fórmula, entre los niveles del factor Longitud y que hay interacción significativa, también. La estimación de los parámetros del modelo son los siguientes:

Captura de pantalla 2015-11-26 a las 16.39.52

Una estimación de los dos parámetros del factor Fórmula es: 2.78 y -2.78.

Y una estimación de los tres parámetros del factor Longitud es: 6.435, -9.31 y 2.875 (este tercero no lo da el software pero sabemos que es él porque los tres parámetros deben sumar 0.

Finalmente, los 6 parámetros de la interacción son:

-1.68  1.68

-2.53  2.53

4.21  -4.21

Las comparaciones múltiples nos dan las siguientes diferencias dos a dos:

Captura de pantalla 2015-11-26 a las 16.27.28

Los gráficos de medias de los diferentes niveles de los dos factores, con sus respectivos intervalos de confianza, muestran, gráficamente, de forma clara, cuáles son esos perfiles:

Captura de pantalla 2015-11-26 a las 16.27.00

Captura de pantalla 2015-11-26 a las 16.27.10

Y, finalmente, si se quisiera comprobar el cumplimiento de las suposiciones: la igualdad de varianzas y la normalidad, haríamos los dos siguientes contrastes que muestran que se cumplen las condiciones del modelo ANOVA usado: igualdad de varianzas y normalidad:

Captura de pantalla 2015-11-26 a las 16.27.39

 

2. Se trata de un modelo de dos factores anidados mixtos. El factor Desinfectante es fijo y el factor Zona es aleatorio y anidado en el factor Desinfectante. Ver ANOVA de dos factores anidados mixtos. Se han tomado dos desinfectates concretos por lo que se trata de un factor fijo, pero las zonas se han elegido al azar en cada una de las dos salas por lo que se trata de un factor aleatorio. Además, se trata, la zona, de un factor anidado puesto que se toman zonas que están sólo en una sala.

La tabla ANOVA es la siguiente:

Captura de pantalla 2015-11-26 a las 23.06.29

Para ver cuáles son los cocientes a hacer y para estimar las componentes de la varianza es necesario aplicar el Algoritmo de Bennet-Franklin.

La estimación de los parámetros del modelo son los siguientes:

Captura de pantalla 2015-11-26 a las 23.03.57

Una estimación de los dos parámetros del factor Desinfectante es: 4.47 y -4.47.

Si hacemos las comparaciones múltiples:

Captura de pantalla 2015-11-26 a las 23.04.09

Captura de pantalla 2015-11-26 a las 23.04.21

Si analizamos las condiciones del modelo:

Captura de pantalla 2015-11-26 a las 23.04.33

Captura de pantalla 2015-11-26 a las 23.09.49

El Desinfectante 1 se ajusta a una distribución normal N(26.3+4.47, Raíz(12.97+4.22))=N(30.77, 4.146). Esto es cierto precisamente por lo que acabamos de demostrar.

Observemos que hemos tomado para el cálculo de la varianza las dos componentes de la varianza. La de zona no es estadísticamente significativa pero a la hora de estimar la contribución a la variabilidad la tomamos. Es discutible, evidentemente, si debe o no debe hacerse. En todo caso resolver el problema tomando sólo como componente de la varianza la del residuo sería también coherente porque sería hacer prevalecer el contraste de hipótesis a la estimación. Pero como tenemos muestras pequeñas la potencia del contraste será baja y, por lo tanto, parece más coherente usar la estimación.

Si nos preguntaran cuál es la probabilidad de que con este desinfectante tengamos valores por encima de 30 deberíamos calcular la probabilidad de que en esta normal tengamos valores por encima de 30. Esta probabilidad es:

Captura de pantalla 2015-11-26 a las 23.14.41

O sea, un 57,36%.

3. Se trata de un modelo de dos factores aleatorios cruzados. Ver ANOVA de dos factores a efectos aleatorios. Son dos factores aleatorios claramente: se toman dos de las muchísimas muestras que podrían tomarse de líquido cefalorraquídeo de un paciente. Además, se eligen cuatro operarios al azar. El objetivo es ver cómo se reparte la variabilidad de los resultados entre las diferentes fuentes posibles de variación: la muestra, el operario y la interacción entre muestra y operario.

La tabla ANOVA es la siguiente:

Captura de pantalla 2015-11-26 a las 23.18.52

Para ver cuáles son los cocientes a hacer y para estimar las componentes de la varianza es necesario ver el Algoritmo de Bennet-Franklin.

La estimación de los parámetros del modelo son los siguientes:

Captura de pantalla 2015-11-26 a las 23.19.00

Las suposiciones del modelo se cumplen porque:

Captura de pantalla 2015-11-26 a las 23.19.08

Finalmente la variación total es:

Varianza total=3.57+1.55+0.538+0.05=5.7

Aquí podría ser controvertido si tomar el valor de 1.55 ó no tomarlo, puesto que el contraste de hipótesis nos ha salido no significativo. Lo he tomado porque, aunque no significativo, algún efecto estimamos que está aportando el operario.

Desviación estándar=2.38

Por lo tanto, si establecemos un límite de ±3,5 en un intervalo del 95% éste lo sobrepasa porque 2 veces ese valor de desviación estándar es 4.76 (más preciso sería calcular 1.96 veces el valor de desviación estándar pero seguiría siendo un valor muy similar: sería 4.66). Por lo tanto, hay que intentar disminuir la variación introducida por la toma de muestra que es lo que introduce más fuente de variación (3.57) de ese total de 5.7.

Anuncios

Situación 89: Tres problemas de ANOVA

1. Se pretende evaluar la absorción acústica de dos materiales (M1 y M2) y de tres longitudes diferentes de unas noanofibras (C=Cortas, M=Medias y L=Largas) incorporadas a cada uno de esos materiales. El objetivo es usar la mejor combinación, si la hay, para aislar edificios cercanos a carreteras. Para ello se realiza un experimento combinando cada material con cada longitud de nanofibras. Los porcentajes de disminución del sonidos son los siguientes:

Captura de pantalla 2015-11-26 a las 7.18.40

Proponer el modelo y resolverlo.

2. Se quiere evaluar la reducción de la contaminación ambiental por hongos en salas hospitalarias mediante dos mecanismos de desinfección diferentes. Para ellos se toman dos salas diferentes, en un mismo hospital, pero dos salas de un nivel de contaminación similar. Se elige, al azar, en cada una de esas dos salas, tres zonas donde realizar la desinfección y la posterior toma de muestra. En cada zona se evalúan cuatro recuentos de hongos para evaluar la reducción de la concentración inicial. Los datos de reducción obtenidos son los siguientes:

Captura de pantalla 2015-11-26 a las 7.19.02

Proponer el modelo y resolverlo. Evaluar cuál es la probabilidad de que el Desinfectante 1 dé un valor por encima de 30.

3. Se quiere saber la contribución a la variabilidad que introducen tanto la toma de la muestra ante el paciente como la intervención de los operarios en el laboratorio en el análisis de un determinado parámetro del líquido cefalorraquídeo. Para ello se hace a un mismo paciente dos tomas de muestra y cada una de ellas se divide en 8 submuestras. Se eligen al azar 4 de los operarios que trabajan habitualmente en ese laboratorio. Cada operario realiza el análisis a dos  submuestras de cada una de esas dos muestras. Los resultados obtenidos son los siguientes:

Captura de pantalla 2015-11-26 a las 7.19.17

Estimar cuál es la variabilidad total. ¿Es razonable si sólo estamos dispuestos a admitir un error de ±3.5?

 

Solución Situación 88

Se trata claramente de un ANOVA de dos factores cruzados, uno fijo (la técnica) y el otro aleatorio ( el operario). La comprobación de la normalidad y de la igualdad de varianzas no permite estar bajo las condiciones del modelo:

Captura de pantalla 2015-11-24 a las 17.02.32

La tabla ANOVA es la siguiente:

Captura de pantalla 2015-11-24 a las 17.02.41

Observemos que al ser un ANOVA de factores mixtos (uno fijo y uno aleatorio) los cociente de cuadrados medios son los que aparecen en la tabla.

Hay significación tanto en los métodos como en el operario. No así en la interacción.

Los parámetros del modelo son:

Captura de pantalla 2015-11-24 a las 17.02.53

El cálculo de las componentes de la varianza se realizan así:

IMG_2536

Si ahora quisiéramos calcular la probabilidad de que la T1 ó la T2 dé valores por encima, por ejemplo, de 22, deberíamos ver con qué distribución normal debemos trabajar. La media la tomaríamos estimando la media de cada una de las dos técnicas y respecto a la varianza total hay dos opciones, como se puede ver: Considerar la de la interacción como 0 ó como el valor negativo que surge de la estimación. Me he inclinado por la primera opción, como puede verse a continuación:

Captura de pantalla 2015-11-24 a las 17.03.16

En la técnica 1 un 8,3% de valores serán mayores de 22 y en la técnica 2 un 67,7%.

 

Situación 88: Problema de ANOVA

Supongamos que queremos ensayar dos técnicas concretas diferentes (T1 y T2) para evaluar un determinado parámetro sanguíneo y queremos, además, ver cómo influye, en la variación del resultado, el operario. Para ello se toman tres operarios al azar entre  los muchos del laboratorio. Se toma una misma muestra y cada operario hace la medición con las dos técnicas haciendo dos réplicas. Los resultados son los siguientes:

IMG_2535

Estudiar si hay diferencias significativas entre ambas técnicas y si hay variabilidad significativa entre operadores.

Ver a qué modelo de ANOVA se ajusta la situación.

Estimar los parámetros del modelo.

Calcular la probabilidad de que la técnica 1 y la técnica 2, por separado, dé un valor por encima de 22 en una muestra con las características de la tomada.

 

 

Solución Situación 87

En una revista científica he detectado este error curioso. Calculan tres correlaciones con sus correspondientes p-valores. Pero se equivocan en el sentido del símbolo de mayor. Obviamente  debía constar el símbolo de menor.

Escribir esto es decir que no sabemos si esas tres correlaciones son o no significativas. Sería como decirle a un alumno, como información de la nota de un examen, que ha sacado más de un 1. Se quedaría, igualmente, con la duda de si ha aprobado o ha suspendido. De poco le serviría esa información.