Archivos Mensuales: enero 2017

Solución Situación 107

1b: Porque los intervalos de confianza de la media dependen del tamaño de muestra y en las dos muestras ese tamaño es distinto.

2c: En el primer caso, al tener un p-valor tan bajo con una correlación tan débil el tamaño de muestra debe ser muy grande. En el segundo caso, al tener una correlación relativamente grande y significativa pero con un p-valor poco inferior a 0.05 indica que el tamaño de muestra no es muy grande.

3a: Aplicando la fórmula:

captura-de-pantalla-2017-01-16-a-las-10-56-44

obtenemos ese resultado.

4c: Si la V de Crámer es 0 el p-valor será 1.

5a: Aunque las dos primeras correlaciones son significativas, la primera tiene un intervalo de confianza que da valores un poco superiores.

6c: La significación de esta V de Crámer nos vendrá de si la ji-cuadrado es significativa.

7c: La correlación y la pendiente siempre van de la mano en una regresión lineal simple.

8d: El efecto de la introducción de variables innecesarias amplía la R2 pero incrementa el error estándar de las predicciones y esto es muy malo.

9b: El umbral en una tabla 5×6 es 31.4. Como 23.33 es menor que ese umbral se trata de una relación no estadísticamente significativa.

10d: El error estándar es 1=10/Raíz(100). Por lo tanto, el intervalo es (18, 22).

11b: Variables dicotómica con muestras relacionadas la técnica de comparación es el test de McNemar.

12c: Variables dicotómicas. Independientes. Valor esperado por grupo menor que 5. Test exacto de Fisher.

13a: Es la única opción donde el p-valor siempre va bajando, que es lo que sucede si aumentamos el tamaño de muestra, después disminuimos la desviación estándar y finalmente si aumentamos la diferencia de medias.

14b: Muestras independientes y variable dicotómica. Porque en realidad estamos analizando en antes menos el después, el cambio que ha habido. Como el tamaño de muestra es menor de 20 debemos aplicar el test exacto de Fisher.

15c: Los tres factores son significativos.

16a: Subzona no parece significativo. Los otros dos factores sí.

17b: Como habremos rechazado Ho por ser el p-valor menor que 0.05 sólo podremos estar cometiendo el error de tipo I.

18b: Si hay normalidad podremos aplicar un test de la t de Student por lo que no deberemos aplicar un test de Mann-Whitney.

19c: Si la correlación es negativa al aumentar una variable disminuirá la otra.

20b: Si aplicamos la fórmula:

img_3388

con una p de 0.5 porque al no conocerla esta es la mejor opción, llegamos a la conclusión que el tamaño muestral debe ser 400.

 

Anuncios

Situación 107: Examen (Temas 1-16)

1.En la muestra (1, 3, 5, 7) y la muestra (1, 1, 3, 3, 5, 5, 7, 7) no es cierto:

a.Las medias muestrales son iguales.

b.Los intervalos de confianza de la media son iguales.

c.Los rangos intercuartílicos son iguales.

d.Las medianas son iguales.

2.En dos estudios distintos tenemos las siguientes correlaciones r=0.2 (p=0.0001) y r=0.5 (p=0.03) podemos decir:

a.La correlación r=0.5 no es fiable porque tiene un p-valor superior al de la otra correlación.

b.Al tratarse de dos correlaciones estadísticamente significativas tienen, ambas, suficiente capacidad predictiva.

c.El tamaño de muestra usado en el estudio de la correlación r=0.2 es muy superior al usado en la correlación r=0.5.

d.La correlación r=0.2 tiene mayor capacidad predictiva por tener un p-valor muy inferior al de la correlación r=0.5.

3.Estamos interesados en saber en cuántos lugares a lo largo de un río se supera un cierto nivel de un contaminante. Para ello se toman al azar 400 muestras a lo largo del río. En 20 de ellas se supera ese nivel. Un intervalo de confianza del 95% del porcentaje de puntos del río donde se supera dicho nivel es:

a.(2.82, 7.18).

b.(1.73, 8.27).

c.(3.91, 6.09).

d.(0.64, 9.36).

4.¿Cuál de las siguientes afirmaciones no es cierta?

a.La ji-cuadrado evalúa si hay relación entre dos variables cualitativas.

b.El coeficiente de determinación evalúa capacidad predictiva por lo que una correlación significativa puede tener baja capacidad predictiva.

c.Si la V de Crámer es cero el p-valor también será cero.

d.Si la tabla de contingencias observada y la tabla de contingencias esperada son distintas el p-valor de la ji-cuadrado será distinto de cero.

5.En cuál de las siguientes regresiones lineales simples podremos hacer mejores predicciones:

a)y=0.002x+220; IC del 95% de la correlación (0.3, 0.5).

b)y=4x+5; IC del 95% de la correlación (0.1, 0.4)

c)y=-10x-13; IC del 95% de la correlación (-0.8, 0.2)

d)y=15x+25; IC del 95% de la correlación (-0.3, 0.9).

6.Estamos tratando de asociar la presencia o la ausencia de una especie fitoplanctónica con la presencia o ausencia de una especie zooplanctónica en muestras marinas de distintas zonas del mediterráneo. Hemos codificado la ausencia con un 0 y la presencia con un 1. Hemos calculado la V de Crámer y resulta ser 0.65, podemos decir:

a.Que hay una relación significativa entre esas dos variables.

b.Que relación no es suficiente porque no tiene una R2 superior al 50%.

c.Que necesitamos aplicar previamente el test de la ji-cuadrado y ver si el p-valor inferior a 0.05 para valorar este 0.65.

d.Que necesitamos saber el tamaño de muestra para saber si esta relación es estadísticamente significativa.

7.¿Cuál de las siguientes afirmaciones es cierta?:

a.En un test kappa lo que se está evaluando es si un observador da valores siempre superiores a los del otro observador.

b.Si el p-valor es menor que 0.05 el valor del cálculo de la ji-cuadrado es siempre menor que 3.84.

c.El p-valor de la correlación de Pearson es el mismo que el de la pendiente en una regresión lineal simple entre esas dos mismas variables.

d.La V de Crámer es una cuantificación de la relación entre dos variables cuantitativas.

8.En una Regresión lineal múltiple es cierto:

a.Si la R2 es superior al 50% tenemos una relación estadísticamente significativa entre las variables de la regresión.

b. La R2 no tiene ningún valor porque sólo tiene aplicación en la Regresión lineal simple.

c.El Stepwise es un mecanismo que permite encontrar el modelo con mayor error estándar entre los posibles.

d.El introducir variables innecesarias incrementa el error estándar de las estimaciones.

9.Estamos relacionando en cinco zonas distintas la presencia de seis especies distintas del zooplancton. Hemos aplicado una ji-cuadrado y el valor es 23.33. Entonces:

a.No podemos decir que hay relación porque 23.33 es mayor que 21.02.

b.No podemos decir que hay relación porque 23.33 es menor que 31.41.

c.Si el nivel de significación fuese 0.05 diríamos que hay relación pero si fuese 0.01 diríamos que no hay relación.

d.Podemos decir que hay relación estadísticamente significativa porque 23.33 es mayor que 3.84.

10.Un intervalo de confianza del 95% de la media en una muestra con media muestral 20, desviación estándar 10 y tamaño muestral de 100 es:

a.(-20, 60).

b.(19.5, 20.5).

c.(19, 21).

d.(18, 22).

11.¿Cuál de las siguientes afirmaciones es cierta?

a.Si en una comparación el tamaño muestral es superior a 30 por grupo tendremos una potencia estadística superior al 80%.

b.En una comparación de dos muestras relacionadas con variables dicotómicas la técnica adecuada al caso es el test de McNemar.

c.En una técnica de comparación de muestras independientes el tamaño muestral de ambas poblaciones debe ser el mismo.

d.Si en un ANOVA de dos factores uno de los dos factores es significativa (p-valor<0.05) la interacción es significativa (p-valor<0.05).

12.En un estudio donde se quiere comparar la cantidad de un contaminante en las playas de dos poblaciones distintas tenemos 50 observaciones en cada una de las dos playas. El test de Shapiro-Wilk de ambas muestras nos proporciona un p-valor mayor que 0.05. El test de Fisher-Snedecor nos proporciona una p=0.001. Hemos trabajado, no obstante, finalmente, con la variable que indica si el valor de contaminación es superior o no a un determinado valor de referencia. En una playa en 5 casos había un valor por encima de este valor y en la otra en 1 caso, únicamente. Es cierto lo siguiente:

a.Debemos aplicar el test de la t de Student para varianzas desiguales.

b.Debemos aplicar el test de la t de Student para varianzas iguales.

c.Debemos aplicar el test exacto de Fisher.

d.Debemos aplicar el test de Mann-Whitney.

13.En un estudio de comparación de dos poblaciones partimos de unos datos iniciales concretos y calculamos el p-valor con la técnica adecuada. Seguidamente aumentamos el tamaño de muestra de ambas poblaciones obteniendo la misma media y desviación estándar en ambas muestras y volvemos a calcular el p-valor. Después detectamos que la desviación estándar era más baja de la que habíamos calculado y volvemos a calcular el p-valor. Finalmente, detectamos que la diferencia de medias es más grande de la que habíamos calculado previamente y volvemos a calcular el p-valor. ¿Cuál de las siguientes es la secuencia de p-valores que podríamos tener?

a.0.81/0.37/0.25/0.01.

b.0.56/0.74/0.51/0.12.

c.0.02/0.07/0.001/0.15.

d.0.02/0.001/0.09/0.0001.

14.Se analiza el porcentaje de una especie en el fitoplancton en 20 puntos del océano pacífico y 20 puntos del océano atlántico. Después de un año se hace lo mismo en los mismos puntos y se vuelve a calcular el porcentaje de esa misma especie. En el pacífico en el 50% de puntos ha disminuido el porcentaje de esta especie y en el atlántico en el 40%. Queremos comparar si esa diferencia es estadísticamente significativa. Debemos aplicar:

a.El Test de proporciones.

b.El Test exacto de Fisher.

c.El Test de Wilcoxon.

d.El Test de McNemar.

15.Hemos analizado la cantidad de biomasa en dos Zonas (Z1 y Z2) de las que hemos elegido en cada una de ellas tres Subzonas al azar (SZ1, SZ2 y SZ3). Hemos evaluado la cantidad de Biomasa con dos técnicas distintas. Los resultados son los siguientes:

captura-de-pantalla-2016-12-23-a-las-12-04-10

¿Cuál es la afirmación más razonable?:

a.Factor Z: p>0.05. Factor SZ: p>0.05. Factor T: p>0.05.

b.Factor Z: p<0.05. Factor SZ: p<0.05. Factor T: p>0.05.

c.Factor Z: p<0.05. Factor SZ: p<0.05. Factor T: p<0.05.

d.Factor Z: p>0.05. Factor SZ: p<0.05. Factor T: p>0.05.

16. En un estudio oceanográfico se han comparado tres zonas marítimas (Z1, Z2 y Z3) de las que se han tomado dos subzonas en cada una de ellas (SZ1 y SZ2). En cada subzona se ha tomado una muestra y se ha repartido en ocho recipientes. A doce estudiantes de oceanografía se les ha pedido que analizaran en cuatro de ellas, mediante una determinada técnica, la cantidad de una determina sustancia. Los datos obtenidos son los siguientes datos:

captura-de-pantalla-2016-12-16-a-las-10-33-25

a.Factor Z: p<0.05. Factor SZ: p>0.05. Factor O: p<0.05.

b.Factor Z: p<0.05. Factor SZ: p>0.05. Factor O: p>0.05.

c.Factor Z: p>0.05. Factor SZ: p>0.05. Factor O: p>0.05.

d.Factor Z: p<0.05. Factor SZ: p<0.05. Factor O: p<0.05.

17.¿Qué error podríamos estar cometiendo si al comparar dos tratamientos tenemos una potencia del 95% y el p-valor que obtenemos es de 0.01?

a.No podemos cometer error porque la potencia estadística es superior al 80%.

b.El error de tipo I.

c.El error de tipo II.

d.Ambos errores: El error de tipo I y el error de tipo II.¡p

18.¿Cuál de las siguientes afirmaciones no es cierta?

a.Una potencia del 80% se corresponde con un error de tipo II de 0.20.

b.Si en dos muestras independientes que se ajustan a la normalidad no hay igualdad de varianzas se aplica el Test de Mann-Whitney.

c.En un ANOVA de dos factores anidados no puede evaluarse la interacción entre factores.

d.Las comparaciones múltiples sólo se aplican en los factores fijos significativos de un ANOVA.

19.¿Cuál de las siguientes afirmaciones no es cierta viendo los datos aportados en la siguiente tabla?:

captura-de-pantalla-2016-10-07-a-las-11-32-10

a. Al aumentar SRP hay una tendencia a aumentar los niveles de Keratella.

b. Al disminuir los niveles de Daphnia hay una tendencia a disminuir los niveles de Keratella.

c. Al aumentar los niveles de “edible algas (bio)” hay una tendencia a aumentar los niveles de Keratella.

d. Al aumentar la temperatura no podemos decir, significativamente, que aumenten los niveles de Keratella.

20.Se quiere hacer un pronóstico del porcentaje de peces de una especie que en el mediterráneo tienen un nivel de un contaminante por encima de un cierto umbral. ¿Qué tamaño muestral de peces necesitamos tomar para tener un intervalo del 95% con un radio de 5%?:

a.200.

b.400.

c.100.

d.500.