Archivos Mensuales: mayo 2016

Solución Situación 99

1d: Variable continua, muestras relacionadas. La resta se ajusta a la distribución normal (Test de Shapiro-Wilk con p>0.05), por lo que debemos aplicar un test de la t de Student de datos apareados.

2a: Si disminuimos el tamaño de muestra nos fiaremos menos aún de las diferencias de medias que tengamos, por lo que el p-valor subirá. En este caso es más incoherente, aún, rechazar la hipótesis nula de igualdad de medias.

3b: Variable dicotómica, muestras independientes, tamaño de muestra superior a 30 pero valor esperado por grupo inferior a 5 porque en una muestra tenemos 6 (el 12% de 50) y en la otra 2 (el 4% de 50). Esto no proporciona un valor esperado por grupo, bajo la hipótesis nula, de 4, que es inferior a 5. Debemos aplicar, pues, un test exacto de Fisher.

4d: Si en ambas muestras tenemos los mismos individuos las muestras son relacionadas y, por lo tanto, nunca aplicaríamos un test exacto de Fisher.

5b: En un test de ajuste a la normal la hipótesis nula es que hay normalidad por lo que si el p-valor es inferior a 0.05 debemos rechazarla y admitir que no hay ajuste a la normal.

6d: Si un factor no es significativa en un ANOVA evidentemente las comparaciones múltiples nos mostrarían un único grupo homogéneo.

7b: Claramente el ANOVA nos dará un p-valor inferior a 0.05. Y claramente también se observan tres grupos homogéneos: El 1 y 2, por un lado, el 3, por otro, y el 4 y 5 por otro.

8c: Basta aplicar la fórmula n=(4*100*100)/(10*10)=400

9c: Mirando la tabla para determinar el tamaño de muestra en poblaciones finitas se observa claramente que para ese nivel de error y para ese tamaño poblacional el tamaño de muestra es 385.

10a: Los dos factores no son significativos. No hay diferencias en las medias de las dos columnas o entre las dos filas. Sin embargo, hay claramente interacción: dependiendo de la combinación de niveles de un factor con otro los resultados son muy diferentes.

 

Situación 99: Examen (Temas 13-16)

1.En un estudio donde se quiere comparar dos productos distintos tenemos 100 voluntarios. A cada voluntario le hacemos probar los dos productos. La variable respuesta analizada es una escala del 0 al 100. El test de Shapiro-Wilk de la variable resta nos da un p-valor mayor que 0.05. El test de Fisher-Snedecor nos proporciona una p=0.001. Es cierto lo siguiente:

a)Debemos aplicar el test de la t de Student para varianzas desiguales y si tenemos un p-valor inferior a 0.05 debemos concluir que las medias son diferentes.

b)Debemos aplicar el test de la t de Student para varianzas desiguales y si tenemos un p-valor inferior a 0.05 debemos concluir que las medias no son diferentes.

c)Debemos aplicar el Test de Wilcoxon.

d)Debemos aplicar el Test de la t de Student de datos apareados.

2.Si en una comparación de dos poblaciones al aplicar el test adecuado al caso el p-valor final es 0.3 es cierto lo siguiente:

a)Si disminuimos el tamaño de muestra el p-valor subirá.

b)Si aumentamos la desviación estándar de ambas muestras el p-valor bajará.

c)Si disminuimos la diferencias de medias entre ambas muestras el p-valor bajará.

d)Ninguna de las respuestas anteriores es cierta.

3.Se comparan dos zonas distintas para ver el nivel de consumo de un producto. Tomamos 50 personas en cada zona. La variable estudiada es si se consume el producto o no. En una zona el consumo es del 12% y en la otra es del 4%. Para ver si esa diferencia es estadísticamente significativa debemos aplicar:

a)El Test de proporciones.

b)El Test exacto de Fisher.

c)El Test de Mann-Whitney.

d)El Test de McNemar.

4.Si se ha aplicado en Test exacto de Fisher no puede ser cierto:

a) El tamaño de muestra es de 100 por muestra.

b)Las muestras son independientes.

c)La variable respuesta es una variable cuantitativa dicotomizada.

d) Los individuos que tenemos son los mismos en ambas muestras.

5.¿Cuál de las siguientes afirmaciones es cierta?

a)Si en una comparación de dos poblaciones aplicamos un Test de McNemar es que la variable estudiada no se ajusta bien a una distribución normal.

b)En un contraste de hipótesis para evaluar el ajuste a la distribución normal un p-valor inferior a 0.05 indica que no hay suficiente ajuste de los datos a la distribución normal.

c)Con una potencia inferior al 80% nos podemos fiar del p-valor que tengamos.

d)En un ANOVA de dos factores con interacción sólo miraremos el p-valor de la interacción si el p-valor de alguno de los dos factores es significativo.

6.¿Cuál de las siguientes afirmaciones es cierta?

a)Una potencia superior al 50% indica que tenemos buena capacidad predictiva.

b)Si se aplica un Test de McNemar es que las muestras no son apareadas.

c)En un ANOVA de un factor si el p-valor es menor que 0.05 ya hemos acabado el análisis.

d)Si realizamos en un ANOVA unas comparaciones múltiples en un factor no significativo encontraremos una única población homogénea.

7.En una ANOVA de un factor como el siguiente:

img_3461

a)El p-valor será menor que 0.05 y tenemos dos grupos homogéneos.

b)El p-valor será menor que 0.05 y tenemos tres grupos homogéneos.

c)El p-valor será mayor que 0.05 y tenemos dos grupos homogéneos.

d)El p-valor será menor que 0.05 y tenemos cuatro grupos homogéneos.

8.Se quiere hacer un pronóstico de la media poblacional de la concentración de un determinado neurotransmisor. ¿Qué tamaño de muestra necesitamos tomar para tener un intervalo del 95% de radio 10 si la Desviación estándar que tenemos en una muestra piloto es de 100?:

a)250.

b)1000.

c)400.

d)25.

9.Queremos saber cuánto tamaño de muestra necesitamos para estimar el porcentaje de consumo que hay en una población de 10000 habitantes sin poder realizar una muestra piloto. Y queremos hacerlo con un radio del intervalo del 5%. El tamaño será:

a)222

b)1000

c)385

d)400

10.Tenemos los siguientes datos en un estudio donde vamos a aplicar un ANOVA de dos factores:

img_3460

¿Cuál es la afirmación más razonable?:

a)Factor A: p>0.05. Factor B: p>0.05. Interacción: p<0.05.

b)Factor A: p<0.05. Factor B: p<0.05. Interacción: p<0.05.

c)Factor A: p<0.05. Factor B: p<0.05. Interacción: p>0.05.

d)Factor A: p<0.05. Factor B: p>0.05. Interacción: p>0.05.

Solución Situación 98

1d: Los tres p-valores de un ANOVA de dos factores son independientes. Puede darse cualquiera de las posibles combinaciones en ellos. Ninguno depende de ningún otro.

2a: Variables continuas, muestras independientes, normalidad porque ambas muestras nos dan un p-valor en el Shapiro-Wilk superior a 0.05. El test de Fisher-Snedecor nos da un p-valor inferior a 0.05 por lo que son diferentes las varianzas. Habrá que aplicar un test de la t de Student de varianzas desiguales. El p-valor de este último test es inferior a 0.05 por lo tanto debemos concluir que las medias son diferentes.

3d: Ninguna de las tres primeras opciones es cierta. Por lo tanto, la cierta es la cuarta.

4a: Variable dicotómica, muestras independientes. Tamaño de muestras mayor que 30 y el valor esperado por grupo es superior a 5, por lo tanto debemos aplicar el test de proporciones.

5a: Ni el factor A ni el B son significativas. Pero, claramente hay interacción.

6c: Con unos datos como los que se dan claramente la distribución no es normal. Por lo tanto, debe aplicarse el test de Mann-Whitney.

7d: Hagamos los cálculos de la primera componente para cada individuo:

x y z w
3 4 4 -2,22
1 2 5 -2,8
4 5 1 -0,73
5 1 1 1,57

El valor superior es el del tercer individuo, el d. Es el que estará más a la derecha.

8b: El test de McNemar es claramente un test para datos apareados que es sinónimo de muestras relacionadas.

9c: Podemos aplicar un ANOVA de un factor con estos datos. Más en concreto: un factor con cinco niveles.

10c: Basta aplicar la fórmula n=(4*20*20)/(4*4)=100

 

Situación 98: Examen (Temas 13-17 y 19)

1.¿Cuál de las siguientes afirmaciones es cierta?

a)Si en una comparación de dos poblaciones aplicamos un Test de McNemar es que las muestras son independientes.

b)En un contraste de hipótesis para evaluar el ajuste a la distribución normal un p-valor inferior a 0.05 indica que hay suficiente ajuste de los datos a la distribución normal.

c)Con una potencia superior al 50% nos podemos fiar del p-valor que tengamos.

d)En un ANOVA de dos factores con interacción el p-valor de la interacción no depende de cuál sea el p-valor de los dos factores.

2.En un estudio donde se quiere comparar dos psicoterapias distintas tenemos 100 pacientes que repartimos en dos grupos de igual tamaño. A cada grupo le aplicamos uno de los dos tratamientos a comparar. La variable respuesta analizada es una escala del 0 al 100. El test de Shapiro-Wilk de ambas muestras nos proporciona un p-valor mayor que 0.05. El test de Fisher-Snedecor nos proporciona una p=0.001. Es cierto lo siguiente:

a)Debemos aplicar el test de la t de Student para varianzas desiguales y si tenemos un p-valor inferior a 0.05 debemos concluir que las medias son diferentes.

b)Debemos aplicar el test de la t de Student para varianzas desiguales y si tenemos un p-valor inferior a 0.05 debemos concluir que las medias no son diferentes.

c)Debemos aplicar el Test de Mann-Whitney.

d)Debemos aplicar el Test de la t de Student de datos apareados.

3.Si en una comparación de dos poblaciones al aplicar el test adecuado al caso el p-valor final es 0.8 es cierto lo siguiente:

a)Si aumentamos el tamaño de muestra el p-valor subirá.

b)Si aumentamos la desviación estándar de ambas muestras el p-valor bajará.

c)Si disminuimos la diferencias de medias entre ambas muestras el p-valor bajará.

d)Ninguna de las respuestas anteriores es cierta.

4.Se comparan dos tratamientos distintos para pacientes con demencia. Tomamos 200 pacientes y los repartimos al azar en dos grupos de 100 cada uno. A cada grupo le aplicamos únicamente un tratamiento. La variable elegida para evaluar ambos tratamientos es si el Mini-Mental ha bajado después de un año más de dos puntos o no, respecto al valor basal. En un grupo baja más de dos puntos el valor del Mini-Mental en un 10% de pacientes y en el otro en un 6% de pacientes. Para ver si esa diferencia es estadísticamente significativa debemos aplicar:

a)El Test de proporciones.

b)El Test exacto de Fisher.

c)El Test de Wilcoxon.

d)El Test de McNemar.

5.Tenemos los siguientes datos en un estudio clínico donde se va a aplicar un ANOVA de dos factores:

img_3460

¿Cuál es la afirmación más razonable?:

a)Factor A: p>0.05. Factor B: p>0.05. Interacción: p<0.05.

b)Factor A: p<0.05. Factor B: p<0.05. Interacción: p<0.05.

c)Factor A: p<0.05. Factor B: p<0.05. Interacción: p>0.05.

d)Factor A: p<0.05. Factor B: p>0.05. Interacción: p>0.05.

6.Hemos comparado dos tratamientos antidepresivos. La variable analizada es, después de un año, el número de los 14 efectos secundarios que pueden generar ese tipo de tratamiento. Se ha trabajado con 400 pacientes. 200 en cada grupo. Cada paciente recibe un único tratamiento. La primera muestra tiene una media muestral de 1 y una desviación estándar de 5. La segunda muestra tiene una media de 2 y una desviación estándar de 6. En base a estos datos, ¿cuál es la técnica más adecuada al caso para realizar la comparación estadística?:

a)El Test de la t de Student de varianzas iguales.

b)El Test de la t de Student de varianzas diferentes.

c)El Test de Mann-Whitney.

d)El Test de la t de Student de datos apareados.

7.En un Análisis de componentes principales la primera componente principal es W=0.5X-0.45Y-0.48Z. ¿Cuál de los siguientes puntos es el que está en la posición del 4?:

img_3462

a)(3, 4, 4)

b)(1, 2, 5)

c)(4, 5, 1)

d)(5, 1, 1)

8.¿Cuál de las siguientes afirmaciones es cierta?

a)Una potencia del 85% se corresponden con un error de tipo II del 0.25.

b)En un Test de McNemar es un test para datos apareados.

c)En un ANOVA la variable respuesta estudiada debe ser dicotómica.

d)Después de un Test de la t de Student de varianzas distintas significativo debemos aplicar unas Comparaciones múltiples para ver cuántos grupos homogéneos tenemos.

9.En unos datos como los siguientes:

img_3461

a)Podemos aplicar un ANOVA con cinco factores.

b)Podemos aplicar un test de la t de Student.

c)Podemos aplicar un ANOVA de un factor.

d)Podemos aplicar un test de la t de Student de datos apareados.

10.Se quiere hacer un pronóstico de la media poblacional de la concentración de un determinado neurotransmisor. ¿Qué tamaño de muestra necesitamos tomar para tener un intervalo del 95% de radio 4 si la Desviación estándar que tenemos en una muestra piloto es de 20?:

a)20.

b)50.

c)100.

d)200.

Solución Situación 97

1c: Si el test de Shapiro-Wilk nos da un p-valor inferior a 0.05 es que no hay normalidad. Hay que hacer, entonces, un test de Mann-Whitney. El test de Fisher-Snedecor no es necesario.

2b: Si aumentamos la desviación estándar las muestras estarán más solapadas aún y, por lo tanto, el p-valor subirá. Será más incoherente rechazar la hipótesis nula.

3b: Variable dicotómica. Muestras independientes. Tamaño de muestra superior a 30 pero valor esperado por grupo menor que 5 porque en una muestra tenemos 5 casos (un 10% de 50) y en la otra 3 casos (un 6% de 50). El valor esperado por grupo, bajo la hipótesis nula, es 4. Por lo tanto, hemos de aplicar un test exacto de Fisher.

4b: Variable dicotómica. Muestras independientes. Tamaño de muestra superior a 30 y el valor esperado por grupo mayor que 5 porque en una muestra tenemos 4 casos (un 2% de 200) y en la otra 10 casos (un 5% de 200). El valor esperado por grupo, bajo la hipótesis nula, es 7. Por lo tanto, hemos de aplicar un test de proporciones.

5b: En un test de ajuste a la normal la hipótesis nula es que hay normalidad. Por lo que si el p-valor es menor que 0.05 debemos rechazarla.

6c: Un ANOVA se aplica únicamente a variables cuantitativas y, más en concreto, que se ajusten a la distribución normal.

7b: Claramente hay diferencias significativas entre los cinco niveles. Por lo tanto, el p-valor del ANOVA será menor que 0.05. Y se ve claramente que hay tres grupos homogéneos: El formado por los niveles 1 y 2, el formado por el nivel 3 y el formado por los niveles 4 y 5.

8d: Si aplicamos la fórmula nos da n=(4*100*100)/(40*40)=25.

9c: Hagamos los cálculos de la primera componente W para cada uno de los valores:

x y z w
3 4 4 1,38
1 2 5 -1
4 5 1 3,77
1 5 4 0,83

Por lo tanto, el que está más a la derecha es el tercer valor, el c, porque tiene el valor mayor de la primera componente.

10a: Los dos factores no son significativos. No hay diferencias en las medias de las dos columnas o entre las dos filas. Sin embargo, hay claramente interacción: dependiendo de la combinación de niveles de un factor con otro los resultados son muy diferentes.

 

Situación 97: Examen (Temas 13-17 y 19)

1.En un estudio donde se quiere comparar dos psicoterapias distintas tenemos 100 pacientes que repartimos en dos grupos de igual tamaño. A cada grupo le aplicamos uno de los dos tratamientos a comparar. La variable respuesta analizada es una escala del 0 al 100. El test de Shapiro-Wilk de ambas muestras nos proporciona un p-valor menor que 0.05. El test de Fisher-Snedecor nos proporciona una p=0.001. Es cierto lo siguiente:

a)Debemos aplicar el test de la t de Student para varianzas desiguales y si tenemos un p-valor inferior a 0.05 debemos concluir que las medias son diferentes.

b)Debemos aplicar el test de la t de Student para varianzas desiguales y si tenemos un p-valor inferior a 0.05 debemos concluir que las medias no son diferentes.

c)Debemos aplicar el Test de Mann-Whitney.

d)Debemos aplicar el Test de la t de Student de datos apareados.

2.Si en una comparación de dos poblaciones al aplicar el test adecuado al caso el p-valor final es 0.8 es cierto lo siguiente:

a)Si aumentamos el tamaño de muestra el p-valor subirá.

b)Si aumentamos la desviación estándar de ambas muestras el p-valor subirá.

c)Si disminuimos la diferencias de medias entre ambas muestras el p-valor bajará.

d)Ninguna de las respuestas anteriores es cierta.

3.Se comparan dos tratamientos distintos para pacientes con demencia. Tomamos 100 pacientes y los repartimos al azar en dos grupos de 50 cada uno. A cada grupo le aplicamos únicamente un tratamiento. La variable elegida para evaluar ambos tratamientos es si el Mini-Mental ha bajado después de un año más de dos puntos o no, respecto al valor basal. En un grupo baja más de dos puntos el valor del Mini-Mental en un 10% de pacientes y en el otro en un 6% de pacientes. Para ver si esa diferencia es estadísticamente significativa debemos aplicar:

a)El Test de proporciones.

b)El Test exacto de Fisher.

c)El Test de Wilcoxon.

d)El Test de McNemar.

4.Hemos comparado dos tratamientos antidepresivos. La variable analizada es si después de un año el paciente tiene uno de los efectos secundarios que pueden generar ese tipo de tratamiento. Se ha trabajado con 400 pacientes. 200 en cada grupo. Cada paciente recibe un único tratamiento. Después del año en un grupo un 2% tienen ese efecto secundario. En el otro grupo lo tiene un 5%. Debemos aplicar:

a)El Test de Mann-Whitney.

b)El Test de proporciones.

c)El Test exacto de Fisher.

d)El Test de McNemar.

5.¿Cuál de las siguientes afirmaciones es cierta?

a)Si en una comparación de dos poblaciones aplicamos un Test de McNemar es que la variable estudiada se ajusta bien a una distribución normal.

b)En un contraste de hipótesis para evaluar el ajuste a la distribución normal un p-valor inferior a 0.05 indica que no hay suficiente ajuste de los datos a la distribución normal.

c)Con una potencia inferior al 80% nos podemos fiar del p-valor que tengamos.

d)En un ANOVA de dos factores con interacción sólo miraremos el p-valor de la interacción si el p-valor de alguno de los dos factores es significativo.

6.¿Cuál de las siguientes afirmaciones es cierta?

a)Una potencia del 85% se corresponden con un error de tipo I del 0.15.

b)En un Test de McNemar se proporcionan dos p-valores.

c)En un ANOVA la variable respuesta estudiada debe ser cuantitativa.

d)Después de un Test de la t de Student de varianzas distintas significativo debemos aplicar unas Comparaciones múltiples para ver cuántos grupos homogéneos tenemos.

7.En una ANOVA de un factor como el siguiente:

img_3461

a)El p-valor será menor que 0.05 y tenemos dos grupos homogéneos.

b)El p-valor será menor que 0.05 y tenemos tres grupos homogéneos.

c)El p-valor será mayor que 0.05 y tenemos dos grupos homogéneos.

d)El p-valor será menor que 0.05 y tenemos cuatro grupos homogéneos.

8.Se quiere hacer un pronóstico de la media poblacional de la concentración de un determinado neurotransmisor. ¿Qué tamaño de muestra necesitamos tomar para tener un intervalo del 95% de radio 40 si la Desviación estándar que tenemos en una muestra piloto es de 100?:

a)250.

b)50.

c)400.

d)25.

9.En un Análisis de componentes principales la primera componente principal es W=0.5X+0.45Y-0.48Z. ¿Cuál de los siguientes puntos es el que está en la posición del 4?:

img_3462

a)(3, 4, 4)

b)(1, 2, 5)

c)(4, 5, 1)

d)(1, 5, 4)

10.Tenemos los siguientes datos en un estudio clínico:

img_3460

¿Cuál es la afirmación más razonable?:

a)Factor A: p>0.05. Factor B: p>0.05. Interacción: p<0.05.

b)Factor A: p<0.05. Factor B: p<0.05. Interacción: p<0.05.

c)Factor A: p<0.05. Factor B: p<0.05. Interacción: p>0.05.

d)Factor A: p<0.05. Factor B: p>0.05. Interacción: p>0.05.

Un esquema de las principales técnicas estadística que suelen usarse en Medicina es el siguiente:

Captura de pantalla 2016-05-05 a las 14.43.17

Como puede verse hay tres tipos de técnicas estadística: las descriptivas, las de relación y las de comparación. Cada familia de estas técnicas hace justo lo que dice su nombre: describir, relacionar y comparar. En los temas del curso pueden encontrarse los detalles de cada una de estas técnicas.

La determinación del tamaño de muestra es algo común a todo estudio. Siempre debemos determinar el tamaño de muestra. Ni poca muestra ni demasiado muestra. El tamaño justo. También el tema 16 y otros artículos del apartado de complementos y del apartado de Estadística y Medicina explican la complejidad de esta determinación.