Archivo de la categoría: PROBLEMAS

Solución Situación 110

1c: Es una variable continua, las muestras son independientes y hay normalidad. Por lo tanto, hay que aplicar el test de la t de Student de varianzas iguales. Si el p-valor es 0.34 debemos mantener la hipótesis nula de igualdad de medias.

2c: En los tres pasos se producen los siguientes tránsitos: Al disminuir el tamaño de muestra el p-valor subirá. Al disminuir la desviación estándar el p-valor bajará. Al aumentar la diferencia de medias el p-valor bajará. La respuesta c es la única que produce estos cambios desde el primer p-valor que tenemos.

3c: Estamos ante una variable continua y tenemos muestras independientes. Como no hay normalidad debemos aplicar el test de Mann-Whitney.

4c: Variables dicotómicas. Muestras independientes. Tamaño muestral superior a 30. Valor esperado por grupo igual a 3, que es menor que 5. El 3 sale de que el 8% de 50 es 4 y el 4% de 50 es 2. El promedio de 4 y 2 es 3. Por lo tanto, hay que aplicar el test exacto de Fisher.

5c: Desviaciones estándar pequeñas hacen más fácil encontrar diferencias significativas entre los grupos comparados. La d no es correcta porque dice que “hay diferencias entre las cinco poblaciones” y esto, en general, no es cierto. De hecho, afirma que habrá cinco grupos homogéneos y esto es, obviamente, incorrecto.

6d: Para estar a la derecha debemos tener valores grandes de las cinco variables porque los cinco coeficientes son grandes y positivos. Para estar abajo hay que tener relativamente un valor mayor de la variables 4 que de la 1 que son las que pesan en la segunda componente.

7d: Si el ANOVA tiene un p-valor menor que 0.05 es que hay diferencias y, por lo tanto, como mínimo tendremos dos grupos homogéneos.

8a: Si se aplica la fórmula n=(4*20*20)/(4*4)=100.

9a: Como el coeficiente de X es positivo y los coeficientes de Y y de Z son negativos para estar más a la derecha en la primera componente debemos tener valores grandes de la primera variable y pequeños de las otras dos variables.

10c: Viendo los datos se observa que no hay diferencias entre tratamientos, sí entre sexos y no hay interacción.

 

Situación 110: Examen (Temas 13-17 y 19)

1.En un estudio donde se quiere comparar dos psicoterapias tenemos 100 pacientes que repartimos en dos grupos de igual tamaño. A cada grupo le aplicamos sólo uno de los dos tratamientos a comparar. El test de Shapiro-Wilk de ambas muestras nos proporciona un p-valor mayor que 0.05. El test de Fisher-Snedecor nos proporciona una p=0.34. Es cierto lo siguiente:

a.Si el test de la t de Student para varianzas desiguales da un p-valor inferior a 0.05 debemos concluir que las medias son diferentes.

b.Si el test de la t de Student para varianzas desiguales da un p-valor superior a 0.05 debemos concluir que las medias son diferentes.

c.Si el test de la t de Student para varianzas iguales da un p-valor inferior a 0.05 debemos concluir que las medias son diferentes.

d.Si el test de la t de Student para varianzas iguales da un p-valor inferior a 0.05 debemos concluir que no podemos decir que las medias son diferentes.

2.En un estudio de comparación de dos poblaciones partimos de unos datos iniciales concretos y calculamos el p-valor con la técnica adecuada. Seguidamente eliminamos valores de ambas muestras que eran incorrectos disminuyendo, pues, el tamaño de ambas muestras y obteniendo la misma media y la misma desviación estándar en ambas muestras y volvemos a calcular el p-valor. Después detectamos que la desviación estándar era más baja de la que habíamos calculado y volvemos a calcular el p-valor. Finalmente, detectamos que la diferencia de medias es más grande de la que habíamos calculado previamente y volvemos a calcular el p-valor. ¿Cuál de las siguientes es la secuencia de p-valores que podríamos tener?

a.0.81/0.97/0.25/0.31.

b.0.56/0.74/0.81/0.12.

c.0.2/0.37/0.12/0.005.

d.0.02/0.001/0.09/0.0001.

3.Hemos de comparar dos procedimientos distintos de tratamiento para pacientes con demencia. Tomamos 80 pacientes y los repartimos al azar en dos grupos de 40 cada uno. La variable elegida para evaluar ambos tratamientos es el Mini-Mental. El Test de Shapiro-Wilk nos da, en ambas muestras, un p-valor de 0.005. Debemos:

a.Aplicar el Test de Fisher- Snedecor y si tenemos un p-valor inferior a 0.05 aplicar el test de la t de Student de varianzas iguales.

b.Aplicar el Test de Fisher- Snedecor y si tenemos un p-valor inferior a 0.05 aplicar el test de la t de Student de varianzas iguales.

c.Aplicar el Test de Mann-Whitney.

d Aplicar el Test de la t de Student de datos apareados.

4.Hemos de comparar dos formas de rehabilitación psicológica a pacientes que han sufrido un infarto cerebral. La variable analizada es si después de un año el paciente consigue superar un umbral previamente establecido en un test psicotécnico. Se ha trabajado con 100 pacientes. 50 en cada grupo. Cada paciente recibe un único tratamiento. Después del año en un grupo un 8% consigue la rehabilitación psicológica. En el otro grupo un 4% lo consigue. Para ver si esas diferencias son estadísticamente significativas debemos:

a.Aplicar un Test de Mann-Whitney.

b.Aplicar un Test de proporciones.

c.Aplicar un Test exacto de Fisher.

d.Aplicar un Test de McNemar.

5.¿Cuál de las siguientes afirmaciones es cierta?

a. Si en una comparación de dos poblaciones aplicamos un Test de Mann-Whitney es que la variable no se ajusta a la distribución normal en ninguna de las dos muestras.

b. En un contraste de hipótesis para evaluar el ajuste a la distribución normal un p-valor inferior a 0.05 indica que hay suficiente ajuste de los datos a la distribución normal.

c. Cuanto menor desviación estándar tengamos en dos muestras de dos poblaciones a comparar más posible será rechazar la hipótesis nula de igualdad de medias.

d. En un ANOVA de un factor fijo con cinco niveles un p-valor menor de 0.05 indica que hay diferencias significativas entre las cinco poblaciones que estamos comparando.

6.Hemos realizado un Análisis de componentes principales a una base de datos con cinco variables obteniendo dos componentes que explican un 85% de la información. La primera componente es Y1=0.5X1+0.5X2+0.5X3+0.5X4+0.5X5 y la segunda componente es Y2=0.5X1-0.01X2-0.01X3-0.5X4+0.01X5. En el siguiente gráfico de las dos primeras componentes principales, ¿cuál es el individuo 5?

a.(3, 4, 2, 3, 2)

b.(1, 1, 2, 0, 1)

c.(7, 7, 6, 5, 7)

d.(5, 8, 5, 7, 7)

7.¿Cuál de las siguientes afirmaciones es cierta?

a.En un ANOVA de dos factores si ninguno de los dos factores es significativo la interacción tampoco puede ser significativa.

b.Si en las comparaciones múltiples de un ANOVA de un factor tenemos dos o más grupos homogéneos el p-valor del ANOVA será mayor de 0.05.

c.Las comparaciones múltiples en un factor únicamente tiene sentido realizarlas si el p-valor del ANOVA previo, para ese factor, es superior a 0.05.

d. Si en un ANOVA de un factor con cinco niveles el p-valor es menor que 0.05 tendremos como mínimo dos grupos homogéneos.

8.Se quiere hacer un pronóstico de la media poblacional de la concentración de un determinado neurotransmisor. ¿Qué tamaño de muestra necesitamos tomar para tener un intervalo del 95% de radio 4 si la Desviación estándar que tenemos en una muestra piloto es de 20?:

a. 100.

b. 1000.

c. 400.

d. 25.

9.En un Análisis de componentes principales la primera componente principal es 0.5X-0.45Y-0.48Z. Es cierto lo siguiente:

a. En la representación de la primera componente los individuos más a la derecha del eje tendrán valores grandes de X, valores pequeños de Y y valores pequeños de Z.

b. En la representación de la primera componente los individuos más a la derecha del eje tendrán valores grandes de X, de Y y de Z.

c. En la representación de la primera componente los individuos más a la derecha del eje tendrán valores grandes de X e Y y valores pequeños de Z.

d. En la representación de la primera componente los individuos más a la derecha del eje tendrán valores pequeños de X e Y y valores grandes de Z.

10.Tenemos los siguientes datos en un ensayo clínico donde se aplican tres tratamientos a personas de dos sexos. ¿Cuál es la afirmación más razonable respecto a los resultados que podríamos obtener en el ANOVA?:

a.Factor Tratamiento: p>0.05. Factor Sexo: p>0.05. Interacción: p<0.05.

b.Factor Tratamiento: p>0.05. Factor Sexo: p<0.05. Interacción: p<0.05.

c.Factor Tratamiento: p>0.05. Factor Sexo: p<0.05. Interacción: p>0.05.

d.Factor Tratamiento: p<0.05. Factor Sexo: p<0.05. Interacción: p>0.05.

Situación 109: Examen (Temas 1-9)

1. ¿Qué valor refleja un mayor nivel de relación entre dos variables?

a. r= 0.6 (p<0.05)

b. OR=2 (IC 95%: (0.87, 13.32))

c. V=0.85 (p>0.05)

d. Kappa= -1

2. ¿Qué Odds ratio indica mayor relación entre dos variables dicotómicas?

a. 0.1 (p<0.05)

b. 7 (p<0.05)

c. 10 (p>0.05)

d. 0.05 (p>0.05)

3. Tenemos un individuo con un valor de IMC de 27 y nos dicen que, respecto a una muestra, este valor representa un percentil 70. ¿Cuál de las siguientes es la muestra referente?:

a. (19, 21, 21, 22, 23, 24, 24, 24, 27, 31, 33)

b. (19, 21, 21, 22, 24, 24, 25, 27, 28, 31, 31)

c. (20, 21, 21, 22, 24, 24, 24, 25, 26, 27, 30)

d. (18, 21, 21, 22, 24, 24, 27, 29, 31, 38, 38)

4. ¿Qué afirmación entre las siguientes es cierta?

a. Una Odds ratio mayor que 1 siempre es significativa.

b. Una Odds ratio de 4, significativa, es una medida que indica menor asociación que una Odds ratio de 0.5 que también sea significativa.

c. La V de Crámer toma el valor de 1 si el observado y el esperado son diferentes.

d. El p-valor de la ji-cuadrado es el que marca la significación de la V de Crámer.

5. En una muestra como la siguiente: (4, 5, 5, 6, 6, 15, 16, 16, 17, 17, 800), la asimetría estandarizada y la curtosis estandarizada:

a. Deben de ser valores que caen fuera del intervalo (-2, 2) porque sí parece haber ajuste a la distribución normal.

b. Deben de ser valores que caen fuera del intervalo (-2, 2) porque no parece haber ajuste a la distribución normal.

c. Deben de ser valores que caen dentro del intervalo (-2, 2) porque sí parece haber ajuste a la distribución normal.

d. Deben de ser valores que caen dentro del intervalo (-2, 2) porque no parece haber ajuste a la distribución normal.

6. ¿Cuál de las siguientes afirmaciones no es cierta?

a. Un intervalo de confianza del 95% de una pendiente en una Regresión lineal simple que sea (0.75, 1.34) nos indica una pendiente no significativa porque el intervalo incluye al 1.

b. Una Odds ratio con un intervalo de confianza del 95% que sea (3.23, 7.67) indica una asociación significativa.

c. Una correlación r=0.23 (p=0.001) indica que estamos ante una correlación significativa.

d. Un índice kappa de -0.9 indica una muy débil concordancia entre dos observadores.

7. Sea la muestra (1, 2, 5, 7, 9). Podemos afirmar:

a. El rango es 9.

b. El primer cuartil es 1.5.

c. No tiene tercer cuartil.

d. El rango intercuartílico es 5.

8. ¿Cuál de las siguientes afirmaciones  es cierta?

a. En una Regresión lineal simple la variable dependiente es cualitativa.

b. En un Test de la ji-cuadrado si el p-valor es mayor que 0.05 indica que la tabla de contingencias observada y la esperada son iguales.

c. Un intervalo de confianza de la media del 95% que sea (8, 12) indica que el Error estándar es igual a 1.

d. Una correlación de Pearson de -0.6 entre dos variables nos indica que si hacemos una Regresión lineal simple entre ambas variables tendremos un coeficiente de determinación del 60%.

9. ¿Cuál de las siguientes afirmaciones es cierta?

a. Un modelo de Regresión lineal simple que sea y=3x+4 tiene una pendiente positiva y significativa.

b. Una V de Crámer de -1 indica que la relación entre las variables cualitativas es de tipo inverso.

c. La ji-cuadrado es una técnica que cuantifica el grado de relación que hay entre dos variables cualitativas.

d. Una Odds ratio de 0.1, significativa, nos indica que la exposición estudiada es un factor que nos protege 10 veces más que la no exposición.

10. Estamos relacionando los cuatro grupos sanguíneos entre los que tienen o no tienen una determinada enfermedad. Hemos aplicado una ji-cuadrado y el valor es 5.28. Entonces:

a. Podemos decir que hay relación significativa porque 5.28 es mayor que 3.84.

b. No podemos decir que hay relación significativa porque 5.28 es menor que el valor de referencia.

c. Podemos decir que hay relación significativa porque 5.28 es menor que 15.50.

d. No podemos decir que hay relación significativa porque 5.28 es menor que 15.50.

Solución Situación 108

1a: Hay nueve valores. El primer cuartil es 3, la mediana es 5 y el tercer cuartil es, también, 5.

2a: Es la única correlación no significativa y, por lo tanto, poblacionalmente es cero. Y es la correlación menor, evidentemente.

3c: Si se hace el cálculo en base a la fórmula del intervalo de confianza de una proporción visto al final del tema 3 veremos que éste es el intervalo que obtenemos.

4c: Pendiente significativa y correlación significativa. En la opción a no sucede esto. En la b sí pero el signo es distinto. Y en la opción d habla de que pendiente y correlación son el mismo valor y esto no es cierto, en general.

5c: Si una variable cuantitativa se resume así no cabe otra posibilidad, a no ser que se diga lo contrario, que nos están dando la mediana, el primer cuartil y el tercer cuartil. Por lo tanto, no nos están dando ni la media, ni la desviación estándar ni el rango. Viendo, además, los datos podemos apreciar la clara asimetría de la muestra, lo que nos lleva a poder afirmar que no habrá suficiente ajuste a la distribución normal.

6c: 4.33 está por debajo del umbral de una tabla de contingencias 4×2, que es 7.81. Por lo tanto, no hay relación estadísticamente significativa entre esas variables cualitativas y, por lo tanto, la V de Crámer que calculemos tampoco será significativa.

7c: La OR de 0.25 tiene un equivalente en el lado del riesgo de 4, porque 1/0.25 es igual a 4. Como se trata de una OR significativa porque su intervalo de confianza no incluye al 1, podemos decir que se trata de la mayor relación entre esas variables cualitativas dicotómicas.

8b: Como cualquier tabla de contingencias tiene un umbral o igual o superior a 3.84, una ji-cuadrado de 2.45 siempre estará a la izquierda del umbral y, por lo tanto, indicará una relación no significativa.

9c: Porque el umbral en una tabla 4×3 es 12.59 y como 25.75 es mayor que ese valor de referencia estamos ante una relación significativa.

10c: El error estándar es 0.5 porque 10/raíz(400) nos da este valor. Por lo tanto, como estamos construyendo un intervalo de la media del 95% debemos coger dos errores estándar para construir el intervalo.

Situación 108: Examen (Temas 1-9)

1.En la muestra (1, 2, 3, 5, 5, 5, 5, 6, 8), ¿cuál es su Box-Plot?

2.¿Cuál de las siguientes correlaciones es menor?

a.r=0.57 IC 95%: (-0.15, 0.99)

b.r=-0.60 IC 95%: (-0.95, -0.15)

c.r=0.25 IC 95%: (0.15, 0.41)

d.r=0.15 IC 95%: (0.11, 0.24)

3.Estamos interesados en predecir cuántas personas tienen obesidad en un país. Para ello se toman al azar una muestra de tamaño 1000. Entre ellas 40 tienen criterios de obesidad. Un intervalo de confianza del 95% del porcentaje de obesos que hay es ese país es el siguiente:

a.(3.24, 4.76).

b.(1.95, 6.05).

c.(2.76, 5.24).

d.(2.32, 5.68).

4.¿Cuál de las siguientes afirmaciones es cierta en una regresión?

a.Una pendiente con un IC 95%: (1, 5) es compatible con una correlación con p-valor 0.25

b.Una pendiente con un IC 95%: (-1, -0.55) es compatible con una correlación con IC 95%: (0.4, 0.6)

c.Una pendiente con un IC 95%: (0.5, 8) es compatible con una correlación con p-valor igual a 0.008

d.Una pendiente con un valor de 0.5 es implica una correlación con valor 0.5

5.Si tengo una variable descrita de la siguiente forma: 7.14 (4.25, 28.12), podemos afirmar:

a.La media muestral es 7.14.

b.La desviación estándar es 23.87.

c.No hay suficiente ajuste a la normalidad.

d.El rango es 23.87.

6. Tenemos una Ji-cuadrado en una tabla de contigencias 4×2, con un valor de Ji-cuadrado de 4.33, podemos decir entonces que:

a.La V de Crámer nos dará el nivel de relación.

b.La Odds ratio nos dará el nivel de relación.

c.La V de Crámer que tengamos no será estadísticamente significativa.

d.No podemos decir nada porque necesitamos saber el tamaño de muestra del estudio.

7.¿Cuál de las siguientes Odds ratio indica una relación mayor entre las variables estudiadas?

a.OR=2; IC 95%: (1.12, 2.78)

b.OR=3; IC 95%: (0.82, 7.78)

c.OR=0.25; IC 95%: (0.12, 0.45)

d.OR=0.68; IC 95%: (0.54, 0.88)

8.¿Cuál de las siguientes afirmaciones es cierta?:

a.En una regresión lineal simple una R2 superior al 50% indica que tenemos una relación estadísticamente significativa entre las variables.

b.Con una ji-cuadrado de 2.45 ya podemos decir que no será estadísticamente significativa la relación independientemente del número de filas y de columnas que tenga la tabla de contingencias.

c.Una V de Crámer superior a 0.5 es estadísticamente significativa.

d.Una Odds ratio de 0.5 es equivalente a una Odds ratio de 5.

9.Estamos relacionando los cuatro grupos sanguíneos con tres zonas de Europa. Hemos aplicado una ji-cuadrado y el valor es 25.78. Entonces:

a.Podemos decir que hay relación significativa porque 25.75 es mayor que 21.02.

b.No podemos decir que hay relación significativa porque 25.75 es menor que 31.41.

c.Podemos decir que hay relación significativa porque 25.75 es mayor que 12.59.

d.Podemos decir que hay relación significativa porque 25.75 es mayor que 3.84.

10.Un intervalo de confianza del 95% de la media en una muestra con media muestral 20, desviación estándar 10 y tamaño muestral de 400 es:

a.(0, 40).

b.(19.5, 20.5).

c.(19, 21).

d.(18, 22).

Solución Situación 107

1b: Porque los intervalos de confianza de la media dependen del tamaño de muestra y en las dos muestras ese tamaño es distinto.

2c: En el primer caso, al tener un p-valor tan bajo con una correlación tan débil el tamaño de muestra debe ser muy grande. En el segundo caso, al tener una correlación relativamente grande y significativa pero con un p-valor poco inferior a 0.05 indica que el tamaño de muestra no es muy grande.

3a: Aplicando la fórmula:

captura-de-pantalla-2017-01-16-a-las-10-56-44

obtenemos ese resultado.

4c: Si la V de Crámer es 0 el p-valor será 1.

5a: Aunque las dos primeras correlaciones son significativas, la primera tiene un intervalo de confianza que da valores un poco superiores.

6c: La significación de esta V de Crámer nos vendrá de si la ji-cuadrado es significativa.

7c: La correlación y la pendiente siempre van de la mano en una regresión lineal simple.

8d: El efecto de la introducción de variables innecesarias amplía la R2 pero incrementa el error estándar de las predicciones y esto es muy malo.

9b: El umbral en una tabla 5×6 es 31.4. Como 23.33 es menor que ese umbral se trata de una relación no estadísticamente significativa.

10d: El error estándar es 1=10/Raíz(100). Por lo tanto, el intervalo es (18, 22).

11b: Variables dicotómica con muestras relacionadas la técnica de comparación es el test de McNemar.

12c: Variables dicotómicas. Independientes. Valor esperado por grupo menor que 5. Test exacto de Fisher.

13a: Es la única opción donde el p-valor siempre va bajando, que es lo que sucede si aumentamos el tamaño de muestra, después disminuimos la desviación estándar y finalmente si aumentamos la diferencia de medias.

14b: Muestras independientes y variable dicotómica. Porque en realidad estamos analizando en antes menos el después, el cambio que ha habido. Como el tamaño de muestra es menor de 20 debemos aplicar el test exacto de Fisher.

15c: Los tres factores son significativos.

16a: Subzona no parece significativo. Los otros dos factores sí.

17b: Como habremos rechazado Ho por ser el p-valor menor que 0.05 sólo podremos estar cometiendo el error de tipo I.

18b: Si hay normalidad podremos aplicar un test de la t de Student por lo que no deberemos aplicar un test de Mann-Whitney.

19c: Si la correlación es negativa al aumentar una variable disminuirá la otra.

20b: Si aplicamos la fórmula:

img_3388

con una p de 0.5 porque al no conocerla esta es la mejor opción, llegamos a la conclusión que el tamaño muestral debe ser 400.

 

Situación 107: Examen (Temas 1-16)

1.En la muestra (1, 3, 5, 7) y la muestra (1, 1, 3, 3, 5, 5, 7, 7) no es cierto:

a.Las medias muestrales son iguales.

b.Los intervalos de confianza de la media son iguales.

c.Los rangos intercuartílicos son iguales.

d.Las medianas son iguales.

2.En dos estudios distintos tenemos las siguientes correlaciones r=0.2 (p=0.0001) y r=0.5 (p=0.03) podemos decir:

a.La correlación r=0.5 no es fiable porque tiene un p-valor superior al de la otra correlación.

b.Al tratarse de dos correlaciones estadísticamente significativas tienen, ambas, suficiente capacidad predictiva.

c.El tamaño de muestra usado en el estudio de la correlación r=0.2 es muy superior al usado en la correlación r=0.5.

d.La correlación r=0.2 tiene mayor capacidad predictiva por tener un p-valor muy inferior al de la correlación r=0.5.

3.Estamos interesados en saber en cuántos lugares a lo largo de un río se supera un cierto nivel de un contaminante. Para ello se toman al azar 400 muestras a lo largo del río. En 20 de ellas se supera ese nivel. Un intervalo de confianza del 95% del porcentaje de puntos del río donde se supera dicho nivel es:

a.(2.82, 7.18).

b.(1.73, 8.27).

c.(3.91, 6.09).

d.(0.64, 9.36).

4.¿Cuál de las siguientes afirmaciones no es cierta?

a.La ji-cuadrado evalúa si hay relación entre dos variables cualitativas.

b.El coeficiente de determinación evalúa capacidad predictiva por lo que una correlación significativa puede tener baja capacidad predictiva.

c.Si la V de Crámer es cero el p-valor también será cero.

d.Si la tabla de contingencias observada y la tabla de contingencias esperada son distintas el p-valor de la ji-cuadrado será distinto de cero.

5.En cuál de las siguientes regresiones lineales simples podremos hacer mejores predicciones:

a)y=0.002x+220; IC del 95% de la correlación (0.3, 0.5).

b)y=4x+5; IC del 95% de la correlación (0.1, 0.4)

c)y=-10x-13; IC del 95% de la correlación (-0.8, 0.2)

d)y=15x+25; IC del 95% de la correlación (-0.3, 0.9).

6.Estamos tratando de asociar la presencia o la ausencia de una especie fitoplanctónica con la presencia o ausencia de una especie zooplanctónica en muestras marinas de distintas zonas del mediterráneo. Hemos codificado la ausencia con un 0 y la presencia con un 1. Hemos calculado la V de Crámer y resulta ser 0.65, podemos decir:

a.Que hay una relación significativa entre esas dos variables.

b.Que relación no es suficiente porque no tiene una R2 superior al 50%.

c.Que necesitamos aplicar previamente el test de la ji-cuadrado y ver si el p-valor inferior a 0.05 para valorar este 0.65.

d.Que necesitamos saber el tamaño de muestra para saber si esta relación es estadísticamente significativa.

7.¿Cuál de las siguientes afirmaciones es cierta?:

a.En un test kappa lo que se está evaluando es si un observador da valores siempre superiores a los del otro observador.

b.Si el p-valor es menor que 0.05 el valor del cálculo de la ji-cuadrado es siempre menor que 3.84.

c.El p-valor de la correlación de Pearson es el mismo que el de la pendiente en una regresión lineal simple entre esas dos mismas variables.

d.La V de Crámer es una cuantificación de la relación entre dos variables cuantitativas.

8.En una Regresión lineal múltiple es cierto:

a.Si la R2 es superior al 50% tenemos una relación estadísticamente significativa entre las variables de la regresión.

b. La R2 no tiene ningún valor porque sólo tiene aplicación en la Regresión lineal simple.

c.El Stepwise es un mecanismo que permite encontrar el modelo con mayor error estándar entre los posibles.

d.El introducir variables innecesarias incrementa el error estándar de las estimaciones.

9.Estamos relacionando en cinco zonas distintas la presencia de seis especies distintas del zooplancton. Hemos aplicado una ji-cuadrado y el valor es 23.33. Entonces:

a.No podemos decir que hay relación porque 23.33 es mayor que 21.02.

b.No podemos decir que hay relación porque 23.33 es menor que 31.41.

c.Si el nivel de significación fuese 0.05 diríamos que hay relación pero si fuese 0.01 diríamos que no hay relación.

d.Podemos decir que hay relación estadísticamente significativa porque 23.33 es mayor que 3.84.

10.Un intervalo de confianza del 95% de la media en una muestra con media muestral 20, desviación estándar 10 y tamaño muestral de 100 es:

a.(-20, 60).

b.(19.5, 20.5).

c.(19, 21).

d.(18, 22).

11.¿Cuál de las siguientes afirmaciones es cierta?

a.Si en una comparación el tamaño muestral es superior a 30 por grupo tendremos una potencia estadística superior al 80%.

b.En una comparación de dos muestras relacionadas con variables dicotómicas la técnica adecuada al caso es el test de McNemar.

c.En una técnica de comparación de muestras independientes el tamaño muestral de ambas poblaciones debe ser el mismo.

d.Si en un ANOVA de dos factores uno de los dos factores es significativa (p-valor<0.05) la interacción es significativa (p-valor<0.05).

12.En un estudio donde se quiere comparar la cantidad de un contaminante en las playas de dos poblaciones distintas tenemos 50 observaciones en cada una de las dos playas. El test de Shapiro-Wilk de ambas muestras nos proporciona un p-valor mayor que 0.05. El test de Fisher-Snedecor nos proporciona una p=0.001. Hemos trabajado, no obstante, finalmente, con la variable que indica si el valor de contaminación es superior o no a un determinado valor de referencia. En una playa en 5 casos había un valor por encima de este valor y en la otra en 1 caso, únicamente. Es cierto lo siguiente:

a.Debemos aplicar el test de la t de Student para varianzas desiguales.

b.Debemos aplicar el test de la t de Student para varianzas iguales.

c.Debemos aplicar el test exacto de Fisher.

d.Debemos aplicar el test de Mann-Whitney.

13.En un estudio de comparación de dos poblaciones partimos de unos datos iniciales concretos y calculamos el p-valor con la técnica adecuada. Seguidamente aumentamos el tamaño de muestra de ambas poblaciones obteniendo la misma media y desviación estándar en ambas muestras y volvemos a calcular el p-valor. Después detectamos que la desviación estándar era más baja de la que habíamos calculado y volvemos a calcular el p-valor. Finalmente, detectamos que la diferencia de medias es más grande de la que habíamos calculado previamente y volvemos a calcular el p-valor. ¿Cuál de las siguientes es la secuencia de p-valores que podríamos tener?

a.0.81/0.37/0.25/0.01.

b.0.56/0.74/0.51/0.12.

c.0.02/0.07/0.001/0.15.

d.0.02/0.001/0.09/0.0001.

14.Se analiza el porcentaje de una especie en el fitoplancton en 20 puntos del océano pacífico y 20 puntos del océano atlántico. Después de un año se hace lo mismo en los mismos puntos y se vuelve a calcular el porcentaje de esa misma especie. En el pacífico en el 50% de puntos ha disminuido el porcentaje de esta especie y en el atlántico en el 40%. Queremos comparar si esa diferencia es estadísticamente significativa. Debemos aplicar:

a.El Test de proporciones.

b.El Test exacto de Fisher.

c.El Test de Wilcoxon.

d.El Test de McNemar.

15.Hemos analizado la cantidad de biomasa en dos Zonas (Z1 y Z2) de las que hemos elegido en cada una de ellas tres Subzonas al azar (SZ1, SZ2 y SZ3). Hemos evaluado la cantidad de Biomasa con dos técnicas distintas. Los resultados son los siguientes:

captura-de-pantalla-2016-12-23-a-las-12-04-10

¿Cuál es la afirmación más razonable?:

a.Factor Z: p>0.05. Factor SZ: p>0.05. Factor T: p>0.05.

b.Factor Z: p<0.05. Factor SZ: p<0.05. Factor T: p>0.05.

c.Factor Z: p<0.05. Factor SZ: p<0.05. Factor T: p<0.05.

d.Factor Z: p>0.05. Factor SZ: p<0.05. Factor T: p>0.05.

16. En un estudio oceanográfico se han comparado tres zonas marítimas (Z1, Z2 y Z3) de las que se han tomado dos subzonas en cada una de ellas (SZ1 y SZ2). En cada subzona se ha tomado una muestra y se ha repartido en ocho recipientes. A doce estudiantes de oceanografía se les ha pedido que analizaran en cuatro de ellas, mediante una determinada técnica, la cantidad de una determina sustancia. Los datos obtenidos son los siguientes datos:

captura-de-pantalla-2016-12-16-a-las-10-33-25

a.Factor Z: p<0.05. Factor SZ: p>0.05. Factor O: p<0.05.

b.Factor Z: p<0.05. Factor SZ: p>0.05. Factor O: p>0.05.

c.Factor Z: p>0.05. Factor SZ: p>0.05. Factor O: p>0.05.

d.Factor Z: p<0.05. Factor SZ: p<0.05. Factor O: p<0.05.

17.¿Qué error podríamos estar cometiendo si al comparar dos tratamientos tenemos una potencia del 95% y el p-valor que obtenemos es de 0.01?

a.No podemos cometer error porque la potencia estadística es superior al 80%.

b.El error de tipo I.

c.El error de tipo II.

d.Ambos errores: El error de tipo I y el error de tipo II.¡p

18.¿Cuál de las siguientes afirmaciones no es cierta?

a.Una potencia del 80% se corresponde con un error de tipo II de 0.20.

b.Si en dos muestras independientes que se ajustan a la normalidad no hay igualdad de varianzas se aplica el Test de Mann-Whitney.

c.En un ANOVA de dos factores anidados no puede evaluarse la interacción entre factores.

d.Las comparaciones múltiples sólo se aplican en los factores fijos significativos de un ANOVA.

19.¿Cuál de las siguientes afirmaciones no es cierta viendo los datos aportados en la siguiente tabla?:

captura-de-pantalla-2016-10-07-a-las-11-32-10

a. Al aumentar SRP hay una tendencia a aumentar los niveles de Keratella.

b. Al disminuir los niveles de Daphnia hay una tendencia a disminuir los niveles de Keratella.

c. Al aumentar los niveles de “edible algas (bio)” hay una tendencia a aumentar los niveles de Keratella.

d. Al aumentar la temperatura no podemos decir, significativamente, que aumenten los niveles de Keratella.

20.Se quiere hacer un pronóstico del porcentaje de peces de una especie que en el mediterráneo tienen un nivel de un contaminante por encima de un cierto umbral. ¿Qué tamaño muestral de peces necesitamos tomar para tener un intervalo del 95% con un radio de 5%?:

a.200.

b.400.

c.100.

d.500.