Archivo de la categoría: PROBLEMAS

Situación 109: Examen (Temas 1-9)

1. ¿Qué valor refleja un mayor nivel de relación entre dos variables?

a. r= 0.6 (p<0.05)

b. OR=2 (IC 95%: (0.87, 13.32))

c. V=0.85 (p>0.05)

d. Kappa= -1

2. ¿Qué Odds ratio indica mayor relación entre dos variables dicotómicas?

a. 0.1 (p<0.05)

b. 7 (p<0.05)

c. 10 (p>0.05)

d. 0.05 (p>0.05)

3. Tenemos un individuo con un valor de IMC de 27 y nos dicen que, respecto a una muestra, este valor representa un percentil 70. ¿Cuál de las siguientes es la muestra referente?:

a. (19, 21, 21, 22, 23, 24, 24, 24, 27, 31, 33)

b. (19, 21, 21, 22, 24, 24, 25, 27, 28, 31, 31)

c. (20, 21, 21, 22, 24, 24, 24, 25, 26, 27, 30)

d. (18, 21, 21, 22, 24, 24, 27, 29, 31, 38, 38)

4. ¿Qué afirmación entre las siguientes es cierta?

a. Una Odds ratio mayor que 1 siempre es significativa.

b. Una Odds ratio de 4, significativa, es una medida que indica menor asociación que una Odds ratio de 0.5 que también sea significativa.

c. La V de Crámer toma el valor de 1 si el observado y el esperado son diferentes.

d. El p-valor de la ji-cuadrado es el que marca la significación de la V de Crámer.

5. En una muestra como la siguiente: (4, 5, 5, 6, 6, 15, 16, 16, 17, 17, 800), la asimetría estandarizada y la curtosis estandarizada:

a. Deben de ser valores que caen fuera del intervalo (-2, 2) porque sí parece haber ajuste a la distribución normal.

b. Deben de ser valores que caen fuera del intervalo (-2, 2) porque no parece haber ajuste a la distribución normal.

c. Deben de ser valores que caen dentro del intervalo (-2, 2) porque sí parece haber ajuste a la distribución normal.

d. Deben de ser valores que caen dentro del intervalo (-2, 2) porque no parece haber ajuste a la distribución normal.

6. ¿Cuál de las siguientes afirmaciones no es cierta?

a. Un intervalo de confianza del 95% de una pendiente en una Regresión lineal simple que sea (0.75, 1.34) nos indica una pendiente no significativa porque el intervalo incluye al 1.

b. Una Odds ratio con un intervalo de confianza del 95% que sea (3.23, 7.67) indica una asociación significativa.

c. Una correlación r=0.23 (p=0.001) indica que estamos ante una correlación significativa.

d. Un índice kappa de -0.9 indica una muy débil concordancia entre dos observadores.

7. Sea la muestra (1, 2, 5, 7, 9). Podemos afirmar:

a. El rango es 9.

b. El primer cuartil es 1.5.

c. No tiene tercer cuartil.

d. El rango intercuartílico es 5.

8. ¿Cuál de las siguientes afirmaciones  es cierta?

a. En una Regresión lineal simple la variable dependiente es cualitativa.

b. En un Test de la ji-cuadrado si el p-valor es mayor que 0.05 indica que la tabla de contingencias observada y la esperada son iguales.

c. Un intervalo de confianza de la media del 95% que sea (8, 12) indica que el Error estándar es igual a 1.

d. Una correlación de Pearson de -0.6 entre dos variables nos indica que si hacemos una Regresión lineal simple entre ambas variables tendremos un coeficiente de determinación del 60%.

9. ¿Cuál de las siguientes afirmaciones es cierta?

a. Un modelo de Regresión lineal simple que sea y=3x+4 tiene una pendiente positiva y significativa.

b. Una V de Crámer de -1 indica que la relación entre las variables cualitativas es de tipo inverso.

c. La ji-cuadrado es una técnica que cuantifica el grado de relación que hay entre dos variables cualitativas.

d. Una Odds ratio de 0.1, significativa, nos indica que la exposición estudiada es un factor que nos protege 10 veces más que la no exposición.

10. Estamos relacionando los cuatro grupos sanguíneos entre los que tienen o no tienen una determinada enfermedad. Hemos aplicado una ji-cuadrado y el valor es 5.28. Entonces:

a. Podemos decir que hay relación significativa porque 5.28 es mayor que 3.84.

b. No podemos decir que hay relación significativa porque 5.28 es menor que el valor de referencia.

c. Podemos decir que hay relación significativa porque 5.28 es menor que 15.50.

d. No podemos decir que hay relación significativa porque 5.28 es menor que 15.50.

Solución Situación 108

1a: Hay nueve valores. El primer cuartil es 3, la mediana es 5 y el tercer cuartil es, también, 5.

2a: Es la única correlación no significativa y, por lo tanto, poblacionalmente es cero. Y es la correlación menor, evidentemente.

3c: Si se hace el cálculo en base a la fórmula del intervalo de confianza de una proporción visto al final del tema 3 veremos que éste es el intervalo que obtenemos.

4c: Pendiente significativa y correlación significativa. En la opción a no sucede esto. En la b sí pero el signo es distinto. Y en la opción d habla de que pendiente y correlación son el mismo valor y esto no es cierto, en general.

5c: Si una variable cuantitativa se resume así no cabe otra posibilidad, a no ser que se diga lo contrario, que nos están dando la mediana, el primer cuartil y el tercer cuartil. Por lo tanto, no nos están dando ni la media, ni la desviación estándar ni el rango. Viendo, además, los datos podemos apreciar la clara asimetría de la muestra, lo que nos lleva a poder afirmar que no habrá suficiente ajuste a la distribución normal.

6c: 4.33 está por debajo del umbral de una tabla de contingencias 4×2, que es 7.81. Por lo tanto, no hay relación estadísticamente significativa entre esas variables cualitativas y, por lo tanto, la V de Crámer que calculemos tampoco será significativa.

7c: La OR de 0.25 tiene un equivalente en el lado del riesgo de 4, porque 1/0.25 es igual a 4. Como se trata de una OR significativa porque su intervalo de confianza no incluye al 1, podemos decir que se trata de la mayor relación entre esas variables cualitativas dicotómicas.

8b: Como cualquier tabla de contingencias tiene un umbral o igual o superior a 3.84, una ji-cuadrado de 2.45 siempre estará a la izquierda del umbral y, por lo tanto, indicará una relación no significativa.

9c: Porque el umbral en una tabla 4×3 es 12.59 y como 25.75 es mayor que ese valor de referencia estamos ante una relación significativa.

10c: El error estándar es 0.5 porque 10/raíz(400) nos da este valor. Por lo tanto, como estamos construyendo un intervalo de la media del 95% debemos coger dos errores estándar para construir el intervalo.

Situación 108: Examen (Temas 1-9)

1.En la muestra (1, 2, 3, 5, 5, 5, 5, 6, 8), ¿cuál es su Box-Plot?

2.¿Cuál de las siguientes correlaciones es menor?

a.r=0.57 IC 95%: (-0.15, 0.99)

b.r=-0.60 IC 95%: (-0.95, -0.15)

c.r=0.25 IC 95%: (0.15, 0.41)

d.r=0.15 IC 95%: (0.11, 0.24)

3.Estamos interesados en predecir cuántas personas tienen obesidad en un país. Para ello se toman al azar una muestra de tamaño 1000. Entre ellas 40 tienen criterios de obesidad. Un intervalo de confianza del 95% del porcentaje de obesos que hay es ese país es el siguiente:

a.(3.24, 4.76).

b.(1.95, 6.05).

c.(2.76, 5.24).

d.(2.32, 5.68).

4.¿Cuál de las siguientes afirmaciones es cierta en una regresión?

a.Una pendiente con un IC 95%: (1, 5) es compatible con una correlación con p-valor 0.25

b.Una pendiente con un IC 95%: (-1, -0.55) es compatible con una correlación con IC 95%: (0.4, 0.6)

c.Una pendiente con un IC 95%: (0.5, 8) es compatible con una correlación con p-valor igual a 0.008

d.Una pendiente con un valor de 0.5 es implica una correlación con valor 0.5

5.Si tengo una variable descrita de la siguiente forma: 7.14 (4.25, 28.12), podemos afirmar:

a.La media muestral es 7.14.

b.La desviación estándar es 23.87.

c.No hay suficiente ajuste a la normalidad.

d.El rango es 23.87.

6. Tenemos una Ji-cuadrado en una tabla de contigencias 4×2, con un valor de Ji-cuadrado de 4.33, podemos decir entonces que:

a.La V de Crámer nos dará el nivel de relación.

b.La Odds ratio nos dará el nivel de relación.

c.La V de Crámer que tengamos no será estadísticamente significativa.

d.No podemos decir nada porque necesitamos saber el tamaño de muestra del estudio.

7.¿Cuál de las siguientes Odds ratio indica una relación mayor entre las variables estudiadas?

a.OR=2; IC 95%: (1.12, 2.78)

b.OR=3; IC 95%: (0.82, 7.78)

c.OR=0.25; IC 95%: (0.12, 0.45)

d.OR=0.68; IC 95%: (0.54, 0.88)

8.¿Cuál de las siguientes afirmaciones es cierta?:

a.En una regresión lineal simple una R2 superior al 50% indica que tenemos una relación estadísticamente significativa entre las variables.

b.Con una ji-cuadrado de 2.45 ya podemos decir que no será estadísticamente significativa la relación independientemente del número de filas y de columnas que tenga la tabla de contingencias.

c.Una V de Crámer superior a 0.5 es estadísticamente significativa.

d.Una Odds ratio de 0.5 es equivalente a una Odds ratio de 5.

9.Estamos relacionando los cuatro grupos sanguíneos con tres zonas de Europa. Hemos aplicado una ji-cuadrado y el valor es 25.78. Entonces:

a.Podemos decir que hay relación significativa porque 25.75 es mayor que 21.02.

b.No podemos decir que hay relación significativa porque 25.75 es menor que 31.41.

c.Podemos decir que hay relación significativa porque 25.75 es mayor que 12.59.

d.Podemos decir que hay relación significativa porque 25.75 es mayor que 3.84.

10.Un intervalo de confianza del 95% de la media en una muestra con media muestral 20, desviación estándar 10 y tamaño muestral de 400 es:

a.(0, 40).

b.(19.5, 20.5).

c.(19, 21).

d.(18, 22).

Solución Situación 107

1b: Porque los intervalos de confianza de la media dependen del tamaño de muestra y en las dos muestras ese tamaño es distinto.

2c: En el primer caso, al tener un p-valor tan bajo con una correlación tan débil el tamaño de muestra debe ser muy grande. En el segundo caso, al tener una correlación relativamente grande y significativa pero con un p-valor poco inferior a 0.05 indica que el tamaño de muestra no es muy grande.

3a: Aplicando la fórmula:

captura-de-pantalla-2017-01-16-a-las-10-56-44

obtenemos ese resultado.

4c: Si la V de Crámer es 0 el p-valor será 1.

5a: Aunque las dos primeras correlaciones son significativas, la primera tiene un intervalo de confianza que da valores un poco superiores.

6c: La significación de esta V de Crámer nos vendrá de si la ji-cuadrado es significativa.

7c: La correlación y la pendiente siempre van de la mano en una regresión lineal simple.

8d: El efecto de la introducción de variables innecesarias amplía la R2 pero incrementa el error estándar de las predicciones y esto es muy malo.

9b: El umbral en una tabla 5×6 es 31.4. Como 23.33 es menor que ese umbral se trata de una relación no estadísticamente significativa.

10d: El error estándar es 1=10/Raíz(100). Por lo tanto, el intervalo es (18, 22).

11b: Variables dicotómica con muestras relacionadas la técnica de comparación es el test de McNemar.

12c: Variables dicotómicas. Independientes. Valor esperado por grupo menor que 5. Test exacto de Fisher.

13a: Es la única opción donde el p-valor siempre va bajando, que es lo que sucede si aumentamos el tamaño de muestra, después disminuimos la desviación estándar y finalmente si aumentamos la diferencia de medias.

14b: Muestras independientes y variable dicotómica. Porque en realidad estamos analizando en antes menos el después, el cambio que ha habido. Como el tamaño de muestra es menor de 20 debemos aplicar el test exacto de Fisher.

15c: Los tres factores son significativos.

16a: Subzona no parece significativo. Los otros dos factores sí.

17b: Como habremos rechazado Ho por ser el p-valor menor que 0.05 sólo podremos estar cometiendo el error de tipo I.

18b: Si hay normalidad podremos aplicar un test de la t de Student por lo que no deberemos aplicar un test de Mann-Whitney.

19c: Si la correlación es negativa al aumentar una variable disminuirá la otra.

20b: Si aplicamos la fórmula:

img_3388

con una p de 0.5 porque al no conocerla esta es la mejor opción, llegamos a la conclusión que el tamaño muestral debe ser 400.

 

Situación 107: Examen (Temas 1-16)

1.En la muestra (1, 3, 5, 7) y la muestra (1, 1, 3, 3, 5, 5, 7, 7) no es cierto:

a.Las medias muestrales son iguales.

b.Los intervalos de confianza de la media son iguales.

c.Los rangos intercuartílicos son iguales.

d.Las medianas son iguales.

2.En dos estudios distintos tenemos las siguientes correlaciones r=0.2 (p=0.0001) y r=0.5 (p=0.03) podemos decir:

a.La correlación r=0.5 no es fiable porque tiene un p-valor superior al de la otra correlación.

b.Al tratarse de dos correlaciones estadísticamente significativas tienen, ambas, suficiente capacidad predictiva.

c.El tamaño de muestra usado en el estudio de la correlación r=0.2 es muy superior al usado en la correlación r=0.5.

d.La correlación r=0.2 tiene mayor capacidad predictiva por tener un p-valor muy inferior al de la correlación r=0.5.

3.Estamos interesados en saber en cuántos lugares a lo largo de un río se supera un cierto nivel de un contaminante. Para ello se toman al azar 400 muestras a lo largo del río. En 20 de ellas se supera ese nivel. Un intervalo de confianza del 95% del porcentaje de puntos del río donde se supera dicho nivel es:

a.(2.82, 7.18).

b.(1.73, 8.27).

c.(3.91, 6.09).

d.(0.64, 9.36).

4.¿Cuál de las siguientes afirmaciones no es cierta?

a.La ji-cuadrado evalúa si hay relación entre dos variables cualitativas.

b.El coeficiente de determinación evalúa capacidad predictiva por lo que una correlación significativa puede tener baja capacidad predictiva.

c.Si la V de Crámer es cero el p-valor también será cero.

d.Si la tabla de contingencias observada y la tabla de contingencias esperada son distintas el p-valor de la ji-cuadrado será distinto de cero.

5.En cuál de las siguientes regresiones lineales simples podremos hacer mejores predicciones:

a)y=0.002x+220; IC del 95% de la correlación (0.3, 0.5).

b)y=4x+5; IC del 95% de la correlación (0.1, 0.4)

c)y=-10x-13; IC del 95% de la correlación (-0.8, 0.2)

d)y=15x+25; IC del 95% de la correlación (-0.3, 0.9).

6.Estamos tratando de asociar la presencia o la ausencia de una especie fitoplanctónica con la presencia o ausencia de una especie zooplanctónica en muestras marinas de distintas zonas del mediterráneo. Hemos codificado la ausencia con un 0 y la presencia con un 1. Hemos calculado la V de Crámer y resulta ser 0.65, podemos decir:

a.Que hay una relación significativa entre esas dos variables.

b.Que relación no es suficiente porque no tiene una R2 superior al 50%.

c.Que necesitamos aplicar previamente el test de la ji-cuadrado y ver si el p-valor inferior a 0.05 para valorar este 0.65.

d.Que necesitamos saber el tamaño de muestra para saber si esta relación es estadísticamente significativa.

7.¿Cuál de las siguientes afirmaciones es cierta?:

a.En un test kappa lo que se está evaluando es si un observador da valores siempre superiores a los del otro observador.

b.Si el p-valor es menor que 0.05 el valor del cálculo de la ji-cuadrado es siempre menor que 3.84.

c.El p-valor de la correlación de Pearson es el mismo que el de la pendiente en una regresión lineal simple entre esas dos mismas variables.

d.La V de Crámer es una cuantificación de la relación entre dos variables cuantitativas.

8.En una Regresión lineal múltiple es cierto:

a.Si la R2 es superior al 50% tenemos una relación estadísticamente significativa entre las variables de la regresión.

b. La R2 no tiene ningún valor porque sólo tiene aplicación en la Regresión lineal simple.

c.El Stepwise es un mecanismo que permite encontrar el modelo con mayor error estándar entre los posibles.

d.El introducir variables innecesarias incrementa el error estándar de las estimaciones.

9.Estamos relacionando en cinco zonas distintas la presencia de seis especies distintas del zooplancton. Hemos aplicado una ji-cuadrado y el valor es 23.33. Entonces:

a.No podemos decir que hay relación porque 23.33 es mayor que 21.02.

b.No podemos decir que hay relación porque 23.33 es menor que 31.41.

c.Si el nivel de significación fuese 0.05 diríamos que hay relación pero si fuese 0.01 diríamos que no hay relación.

d.Podemos decir que hay relación estadísticamente significativa porque 23.33 es mayor que 3.84.

10.Un intervalo de confianza del 95% de la media en una muestra con media muestral 20, desviación estándar 10 y tamaño muestral de 100 es:

a.(-20, 60).

b.(19.5, 20.5).

c.(19, 21).

d.(18, 22).

11.¿Cuál de las siguientes afirmaciones es cierta?

a.Si en una comparación el tamaño muestral es superior a 30 por grupo tendremos una potencia estadística superior al 80%.

b.En una comparación de dos muestras relacionadas con variables dicotómicas la técnica adecuada al caso es el test de McNemar.

c.En una técnica de comparación de muestras independientes el tamaño muestral de ambas poblaciones debe ser el mismo.

d.Si en un ANOVA de dos factores uno de los dos factores es significativa (p-valor<0.05) la interacción es significativa (p-valor<0.05).

12.En un estudio donde se quiere comparar la cantidad de un contaminante en las playas de dos poblaciones distintas tenemos 50 observaciones en cada una de las dos playas. El test de Shapiro-Wilk de ambas muestras nos proporciona un p-valor mayor que 0.05. El test de Fisher-Snedecor nos proporciona una p=0.001. Hemos trabajado, no obstante, finalmente, con la variable que indica si el valor de contaminación es superior o no a un determinado valor de referencia. En una playa en 5 casos había un valor por encima de este valor y en la otra en 1 caso, únicamente. Es cierto lo siguiente:

a.Debemos aplicar el test de la t de Student para varianzas desiguales.

b.Debemos aplicar el test de la t de Student para varianzas iguales.

c.Debemos aplicar el test exacto de Fisher.

d.Debemos aplicar el test de Mann-Whitney.

13.En un estudio de comparación de dos poblaciones partimos de unos datos iniciales concretos y calculamos el p-valor con la técnica adecuada. Seguidamente aumentamos el tamaño de muestra de ambas poblaciones obteniendo la misma media y desviación estándar en ambas muestras y volvemos a calcular el p-valor. Después detectamos que la desviación estándar era más baja de la que habíamos calculado y volvemos a calcular el p-valor. Finalmente, detectamos que la diferencia de medias es más grande de la que habíamos calculado previamente y volvemos a calcular el p-valor. ¿Cuál de las siguientes es la secuencia de p-valores que podríamos tener?

a.0.81/0.37/0.25/0.01.

b.0.56/0.74/0.51/0.12.

c.0.02/0.07/0.001/0.15.

d.0.02/0.001/0.09/0.0001.

14.Se analiza el porcentaje de una especie en el fitoplancton en 20 puntos del océano pacífico y 20 puntos del océano atlántico. Después de un año se hace lo mismo en los mismos puntos y se vuelve a calcular el porcentaje de esa misma especie. En el pacífico en el 50% de puntos ha disminuido el porcentaje de esta especie y en el atlántico en el 40%. Queremos comparar si esa diferencia es estadísticamente significativa. Debemos aplicar:

a.El Test de proporciones.

b.El Test exacto de Fisher.

c.El Test de Wilcoxon.

d.El Test de McNemar.

15.Hemos analizado la cantidad de biomasa en dos Zonas (Z1 y Z2) de las que hemos elegido en cada una de ellas tres Subzonas al azar (SZ1, SZ2 y SZ3). Hemos evaluado la cantidad de Biomasa con dos técnicas distintas. Los resultados son los siguientes:

captura-de-pantalla-2016-12-23-a-las-12-04-10

¿Cuál es la afirmación más razonable?:

a.Factor Z: p>0.05. Factor SZ: p>0.05. Factor T: p>0.05.

b.Factor Z: p<0.05. Factor SZ: p<0.05. Factor T: p>0.05.

c.Factor Z: p<0.05. Factor SZ: p<0.05. Factor T: p<0.05.

d.Factor Z: p>0.05. Factor SZ: p<0.05. Factor T: p>0.05.

16. En un estudio oceanográfico se han comparado tres zonas marítimas (Z1, Z2 y Z3) de las que se han tomado dos subzonas en cada una de ellas (SZ1 y SZ2). En cada subzona se ha tomado una muestra y se ha repartido en ocho recipientes. A doce estudiantes de oceanografía se les ha pedido que analizaran en cuatro de ellas, mediante una determinada técnica, la cantidad de una determina sustancia. Los datos obtenidos son los siguientes datos:

captura-de-pantalla-2016-12-16-a-las-10-33-25

a.Factor Z: p<0.05. Factor SZ: p>0.05. Factor O: p<0.05.

b.Factor Z: p<0.05. Factor SZ: p>0.05. Factor O: p>0.05.

c.Factor Z: p>0.05. Factor SZ: p>0.05. Factor O: p>0.05.

d.Factor Z: p<0.05. Factor SZ: p<0.05. Factor O: p<0.05.

17.¿Qué error podríamos estar cometiendo si al comparar dos tratamientos tenemos una potencia del 95% y el p-valor que obtenemos es de 0.01?

a.No podemos cometer error porque la potencia estadística es superior al 80%.

b.El error de tipo I.

c.El error de tipo II.

d.Ambos errores: El error de tipo I y el error de tipo II.¡p

18.¿Cuál de las siguientes afirmaciones no es cierta?

a.Una potencia del 80% se corresponde con un error de tipo II de 0.20.

b.Si en dos muestras independientes que se ajustan a la normalidad no hay igualdad de varianzas se aplica el Test de Mann-Whitney.

c.En un ANOVA de dos factores anidados no puede evaluarse la interacción entre factores.

d.Las comparaciones múltiples sólo se aplican en los factores fijos significativos de un ANOVA.

19.¿Cuál de las siguientes afirmaciones no es cierta viendo los datos aportados en la siguiente tabla?:

captura-de-pantalla-2016-10-07-a-las-11-32-10

a. Al aumentar SRP hay una tendencia a aumentar los niveles de Keratella.

b. Al disminuir los niveles de Daphnia hay una tendencia a disminuir los niveles de Keratella.

c. Al aumentar los niveles de “edible algas (bio)” hay una tendencia a aumentar los niveles de Keratella.

d. Al aumentar la temperatura no podemos decir, significativamente, que aumenten los niveles de Keratella.

20.Se quiere hacer un pronóstico del porcentaje de peces de una especie que en el mediterráneo tienen un nivel de un contaminante por encima de un cierto umbral. ¿Qué tamaño muestral de peces necesitamos tomar para tener un intervalo del 95% con un radio de 5%?:

a.200.

b.400.

c.100.

d.500.

Solución Situación 106

Tenemos tres factores: Zona, Subzona y Técnica. Zona es fijo, Subzona es aleatorio y anidado dentro de zona, Técnica es fijo y está cruzado tanto con como con Subzona.

El modelo es exactamente el mismo que el de la Situación 41.

Para ve el modelo, el algoritmo de Bennet-Franklin y los cocientes a realizar para evaluar la significación de cada efecto ver la Solución Situación 41.

Aplicando este modelo a los datos de nuestro problema los resultados son los siguientes. La tabla ANOVA es la siguiente:

captura-de-pantalla-2016-12-23-a-las-11-45-00

Hay diferencias entre las tres zonas, entre subzonas dentro de las zonas, entre técnicas y también hay interacción entre técnicas y subzonas.

Los parámetros fijos significativos son:

captura-de-pantalla-2016-12-23-a-las-11-46-11

Las componentes de la varianza son las siguientes:

captura-de-pantalla-2016-12-23-a-las-11-45-16

La componente de la varianza residual la obtenemos del cuadrado medio residual y las otras dos de resolver las ecuaciones que tenemos de las esperanzas de los cuadrados medios:

captura-de-pantalla-2016-12-23-a-las-11-52-03

Si sumamos las componentes de la varianza obtenemos una varianza total de 31,94. Su raíz cuadrada (5,65) nos proporciona la desviación estándar total.

Esto nos permite encontrar distribiciones de grupos concretos. Por ejemplo:

La distribución de la Zona 2 y Técnica 1 será una N(31,51; 5,65).

La distribución de la Zona 2 y Técnica 2 será una N(44,21; 5,65).

A estas distribuciones llegamos por la suposición de normalidad de los datos y de igualdad de varianzas que, evidentemente, debemos comprobar. Al 31,51 llegamos sumando a la media global (la constante) el valor de los parámetros de los dos factores fijos de Zona 2 y Técnica 1 (9,51 y -6,35, respectivamente). Al 44,21 llegamos sumando a la misma media global el valor de los parámetro de los dos factores fijos de Zona 2 y Técnica 2 (9,51 y 6,35, respectivamente). La desviación estándar es la del total.

La distribución de la resta de la Z2, T2 menos la zona Z2, T1 sería: N(12,7; 8). Para llegar a ello aprovechamos un resultado típico de la distribución normal. Al restar dos normales tenemos una variable con distribución normal  con una media que es la resta de las medias y una varianza que es la suma de las varianzas.

Para saber, entonces, por ejemplo, la probabilidad que la resta de estos dos grupos, a nivel poblacional, sea superior a 9 bastará calcular el área que hay por encima de 9 en esa distribución.

 

Situación 106: Un problema de ANOVA

Supongamos que hemos seleccionado en dos zonas concretas que queremos comparar y de esas dos zonas hemos elegido al azar tres subzonas para ver el grado de homogeneidad que hay entre ellas. Queremos evaluar la concentración de un contaminante. Hemos tomado una muestra en cada una de esas seis subzonas. Hemos dividido cada muestra en diez submuestras. A cinco les aplicamos una técnica y las otras cinco otra técnica. Queremos, pues, también, comparar esas técnicas. Los resultados obtenidos son los siguientes:

captura-de-pantalla-2016-12-23-a-las-12-04-10

Analizar estos datos con el modelo ANOVA apropiado.