Archivos Mensuales: junio 2015

Solución Situación 83

1c: El p-valor de los dos factores es superior a 0.05 y el de la interacción es inferior a 0.05. Por lo tanto, los dos factores no son significativos y la interacción sí.
2c: Es evidente que no hay igualdad entre los cuatro niveles. Y si se observa con detenimiento los tres primeros niveles son muy similares y el cuarto es el que se aparta de los demás. Por lo tanto, el ANOVA tendrá un p-valor inferior a 0.05 y que en las comparaciones múltiples tendremos dos grupos homogéneos en este estudio: el formado por los niveles 1, 2 y 3 y el formado por el nivel 4.

3a: Las Odds ratio significativas son la a, c y d. La duda está entre la a y la c, entre 0.3 y 3. Es mayor 0.3 porque si dividimos 1/0.3 obtenemos 3.333333 que es mayor que 3. Si hacemos lo contrario, 1/3 es 0.33333. Y 0.3 está más alejado del 1 que 0.3333333.

4b: La variable es dicotómica porque se mira si la diferencia es positiva o no. Las muestras son relacionadas porque los dos tratamientos se ensayan con cada paciente. Por lo tanto, se debe aplicar el test de McNemar.

5c: Es la única muestra que cumple todas las propiedades exigidas.

6c: Se trata de un coeficiente de determinación muy grande, pero con la información que tenemos no sabemos si se trata de una relación significativa. Ese coeficiente no marca significación sino magnitud de relación.

7c: Un individuo con los cinco valores de 1 tendría un valor de 1.5 no de 2.5 de la primera componente.

8d: El error estándar es 0.5 por lo que un intervalo de confianza del 99.5% de la media será el resultado de restar y sumar tres veces ese error estándar a la media. Por lo tanto, ese intervalo es correcto.

9b: Si se aplica la fórmula del Tema 16 para obtener el tamaño se obtiene de forma directa, pero hay otra forma de razonarlo. El error estándar que se pretende tener es de 0.05 porque se pretende un radio de intervalo de 0.1 en un intervalo de confianza del 95%. Si la DE es 2 para obtener un error estándar de 0.05 debemos dividir 2 por 40 (2/40=0.05). Por lo tanto, 40 es igual a la raíz cuadrada del tamaño de muestra que necesitamos; o sea, 1600.

10c: Variable continua, muestras relacionadas, ajuste a la normal. Por lo tanto, el test adecuado es el de Student de datos apareados.

11b: Son muestras independientes de una variable continua. Una se ajusta a la distribución normal (p>0.05) y la otra no (p<0.05) por lo que debemos aplicar un test de Mann-Whitney. Para aplicar algunos de los dos test de la t de Student hace falta que las dos distribuciones sean normales.

12b: El p-valor es un criterio que debe ir acompañada de otro mecanismo de control, de la potencia. Si en una comparación tenemos un p-valor de 0.55 si no hay suficiente potencia, que lo marcará un determinado tamaño de muestra, no podremos decir que no haya diferencia entre los dos grupos comparados. Se precisa una potencia al menos del 80%.

13d: Se trata de una correlación significativa, como es positiva la pendiente de la recta de regresión también será positiva. Y como es una correlación significativa también lo será la pendiente. Siempre lo que le sucede a la correlación, en materia de significación, y en materia de signo, es lo mismo que le sucede a la pendiente.

14c: Observemos que a y b están a la misma distancia que d y e. Por eso empiezan igual en el dendrograma. Pero, al mismo tiempo el grupo de a y b está muy alejado del grupo formado por d y e. A continuación, el siguiente en unirse es c al grupo formado por a y b, porque está muy próximo a ellos. Entre el grupo formado, ahora, por a, b y c y el grupo formado por d y e sí que hay mucha distancia.

15a: Como es un intervalo de la media debemos fijarnos en el error estándar, que es 1.5 (15/raiz(100)). Por lo tanto, si el intervalo es del 95% debemos sumar y restar dos veces ese error estándar. El intervalo es, pues, (97, 103).

16a: Sabemos que en toda tabla 2×2 el valor de referencia para la significación es 3.84. Como 4.6 es mayor que ese valor sabemos que se trata de una relación significativa. Siempre, una tabla de contingencias, con un número de filas y columnas determinado, tiene un valor de referencia a partir del cual el valor de la ji-cuadrado que obtengamos marcará que no podemos mantener la hipótesis nula de no relación entre las variables cualitativas estudiadas. En general,  no sabemos cuál es ese valor, pero en el tema 8 donde todos los ejemplos se ponen en tablas 2×2, se puede observar que el 3.84 es el valor de referencia para todas las tablas que tengan 2 filas y 2 columnas. Revisar la importante tabla del final del tema 8.

17d: La V de Crámer tiene la enorme ventaja que es calculable para cualquier tabla de contingencias, tenga el número de filas que tenga y el número de columnas que tenga.

18d: Si r=0.9 es evidente que el coeficiente de determinación será del 81%, y ese coeficiente marca la cantidad que una variable determina a la otra. Las otras respuestas no son correctas. Las otras tres respuestas serían únicamente correctas si la correlación fuera r=1, que no es el caso. Hay, por lo tanto, un error, lo que no garantiza que ni en la muestra ni en futuras observaciones cuando tengamos un valor de x=5 tendremos un valor de y=15.

19d: Toda variable tiene desviación estándar, aunque sea dicotómica. En concreto, en una dicotómica DE=raiz(p(1-p)), siendo p la proporción de unos que tengamos.

20d: La significación de cualquier tabla de contingencias depende de un valor de referencia. Valor de referencia que, como hemos visto en el tema 8, depende del número de filas y de columnas, pero no del tamaño de muestra. Observad, de nuevo, el gráfico final del tema 8. Podéis ver que el valor de 3.84 es el mismo para un caso de tabla con mucho tamaño de muestra y para otro con menor tamaño de muestra. Sólo depende de que sea una tabla con dos filas y dos columnas. Otra tabla, por ejemplo, una tabla 4×3 tiene otro valor de referencia que depende, de nuevo, de las filas y columnas que tengamos, no de la cantidad de muestra que tengamos.

 

Anuncios

Solución Situación 82

1c: El rango es 100-2=98.

2a: El percentiel 60 en esta muestra es el promedio de 5 y 15 que es 10. En las otras muestras el percentil 60 no es 10.

3b: En la segunda muestra el valor de 2000 hace que casi todo esté en manos de una persona. Esto es lo que genera un índice muy grande, próximo a 1.

4a: El error estándar es 2 porque 10 dividido por la raíz cuadrada de 25 es 2. Como el intervalo de la media es del 95% debemos coger dos errores estándar, por lo tanto, el intervalo será (96, 104).

5a: Como la variable es continua, las muestras son independientes y no hay normalidad debemos aplicar el Test de Mann-Whitney directamente sin comprobar igualdad de desviaciones estándar.

6d: Porque si el tamaño de muestra es grande y la diferencia de medias también lo es, esto va a favor de tener muchas posibilidades de rechazar la hipótesis nula de igualdad de medias, no menos posibilidades como dice la afirmación “d”.

7a: Si en lugar de 43 es 73 el índice de Gini será mayor porque introducimos más diferencias entre las personas de la muestra.

8c: Rango y rango intercuartílico pueden ser iguales. Por ejemplo, la siguiente muestra: (0, 0, 10, 10) tienen el mismo rango y rango intercuartílico: 10. La “d” no es correcta, no siempre la mediana es menor que el tercer cuartil. Por ejemplo, en la muestra (0,5, 5, 5) la mediana y el tercer cuartil son iguales. Valen 5 ambos estadísticos.

9d: Falta la información acerca de si la variable resta se ajusta o no a la distribución normal. En función de eso sabremos si hace falta aplicar el test de la t de Student de datos apareados o el de los signos o Wilcoxon.

10c: Si es un intervalo de confianza de la media ese intervalo se construye con el error estándar y, como es un intervalo del 95%, se construye con dos errores estándares. Como el intervalo tiene un radio de 1 y ese radio es dos veces el error estándar, el error estándar debe ser 0.5.

Situación 82: Examen (Temas 1-4 y 13-14)

1. Si tenemos la muestra siguiente: (8, 8, 4, 4, 2, 2, 10, 100) no es cierto lo siguiente:

a. La mediana es 6.

b. El rango intercuartílico es 6.

c. El rango es 102.

d. El tercer cuartil es 9.

2. ¿Cuál de las siguientes muestras tiene un percentil 60 igual a 10?

a. (2, 3, 3, 4, 5, 5, 15, 15, 20, 20).

b. (2, 3, 3, 4, 5, 10, 15, 15, 20, 20).

c. (2, 3, 3, 4, 5, 10, 12, 15, 20, 20).

d. (2, 3, 3, 4, 5, 8, 10, 15, 20, 20).

3. ¿Cuál de las siguientes muestras tiene un índice de Gini mayor?

a. (0, 0, 1, 1, 5, 15, 15, 20, 20, 20).

b. (0, 0, 1, 1, 5, 15, 15, 20, 20, 2000).

c. (0, 0, 1, 1, 5, 15, 15, 20, 20, 200).

d. (10, 10, 10, 10, 15, 15, 15, 20, 20, 20).

4. Si la valoración media de un activo financiero a lo largo del tiempo tiene media 100 y desviación estándar 10 y la muestra con la que hemos trabajado es de tamaño 25, ¿cuál es un intervalo de confianza del 95% de la media?

a. (96, 104).

b. (90, 110).

c. (80, 120).

d. (98, 102).

5. Queremos comparar el nivel de conocimientos de estudiantes de Economía de dos universidades distintas justo al final de sus estudios. Para ello realizamos un test a 30 alumnos de cada una de esas dos universidades. Las medias muestrales son 5 y 6.5, respectivamente. Las desviaciones estándar son 1.5 y 1.65, respectivamente. Aplicamos un test de Shapiro-Wilk a cada una de las dos muestras y tenemos los siguientes p-valores: 0.001 y 0.01, respectivamente. La técnica adecuada al caso será:

a. El test de Mann-Whitney.

b. El test de la t de Student de varianzas iguales.

c. El test de la t de Student de vaianzas desiguales.

d. Hace falta hacer el test de Fisher-Snedecor para comprobar la igualdad de varianzas y saber, así, si debemos aplicar el test de la t de Student de varianzas iguales o el test de la t de Student de varianzas distintas.

6. ¿Cuál de las siguientes afirmaciones no es cierta en la comparación de la media de dos poblaciones?

a. Cuanto mayor tamaño de muestra y menor desviación estándar más posibilidades de rechazar la Hipótesis nula.

b. Cuanta mayor desviación estándar y menor diferencia de medias menos posibilidades de rechazar la Hipótesis nula.

c. Cuanta mayor diferencia de medias y mayor tamaño de muestra más posibilidades de rechazar la Hipótesis nula.

d. Cuanto mayor tamaño de muestra y mayor diferencia de medias menos posibilidades de rechazar la Hipótesis nula.

7. Si tenemos la siguiente muestra de rentas (1, 3, 5, 34, 43) y hemos calculado el índice de Gini, si, de repente, nos damos cuenta que el valor 43 era erróneo, que debía ser 73, ¿qué sucederá al recalcular el índice de Gini con el valor correcto?:

a. Será mayor.

b. Será menor.

c. No cambiará.

d. Falta información para poder responder a esa pregunta.

8. ¿Cuál de las siguientes afirmaciones es cierta?

a. La media y la mediana son iguales si el rango es igual al rango intercuartílico.

b. La desviación estándar y el rango intercuartílico son sinónimos.

c. En una muestra el rango intercuartílico puede ser igual al rango.

d. La mediana siempre es un valor menor que el tercer cuartil.

9. Se están comparando dos fórmulas distintas de un producto entre consumidores habituales. La variable analizada es la valoración entre el 0 y el 10. El tamaño de muestra es de 50 personas. Cada persona prueba y puntúa cada una de las dos fórmulas. La técnica adecuada al caso es:

a. Un test de los signos.

b. El test de Mann-Withney.

c. Un test de la t de Student de datos apareados.

d. Falta información para precisar qué técnica es la adecuada al caso.

10. Tenemos un IC del 95% de la media que es (200, 202), ¿qué afirmación es cierta?

a. El tamaño de muestra es 100.

b. La desviación estándar es 1.

c. El error estándar es 0.5

d. Ninguna de las tres anteriores respuestas es cierta.

 

 

 

Una introducción a la Estadística inferencial para estudiantes de ESO

La Estadística que se estudia en la enseñanza secundaria es la Estadística descriptiva, la Estadística que se limita a describir lo que se tiene: una muestra. De ella se hacen gráficos que la resumen (histogramas, diagramas de frecuencias, diagramas de cajas (Box-Plot), etc), se calculan valores que detectan ciertas características (la media, la mediana, la desviación estándar, el rango, etc).

Esta introducción a la Estadística inferencial es un primer paso desde esa Estadística, la Estadística descriptiva, a la Estadística inferencial, que es la que con mayor frecuencia se van a encontrar esos alumnos cuando lleguen a la universidad o la acaben aplicando, en la vida real, como profesionales de la Economía, de la Medicina, de la Psicología, etc.

La Estadística inferencial es la que va más allá de la muestra, la que intenta decir cosas no de la muestra, sino de toda la población de donde se ha tomado la muestra. Es la Estadística que, apoyándose en la información muestral, pretende decir cosas de la población global. Por eso es inferencial, porque inferir significa ir más allá de lo que vemos, usar lo que tenemos para hablar de lo que no tenemos.

Supongamos la siguiente situación: dos grupos de investigación estudian cada uno de ellos una determinada enfermedad. Quieren saber si es una enfermedad asociada al sexo; o sea, más frecuente en un sexo que en otro.

El grupo que estudia la enfermedad A ha tomado una muestra de pacientes de esa enfermedad y 2 son hombres y 8 son mujeres.

El grupo que estudia la enfermedad B ha tomado una muestra de pacientes de esa enfermedad y 450 son hombres y 550 son mujeres.

Tenemos, por lo tanto, la siguiente situación:

IMG_1470

La Estadística descriptiva de estas dos muestras es muy sencilla de hacer. De la enfermedad A en la muestra el 20% son hombres y el 80% son mujeres. De la enfermedad B en la muestra el 45% son hombres y el 55% son mujeres.

La Estadística descriptiva aquí acaba su recorrido, no pretende más que eso: describir lo que tenemos, la muestra.

La Estadística inferencial, de hecho, empieza donde ha acabado la Estadística descriptiva. A partir de esos porcentajes muestrales incuestionables se plantea: Esa diferencia, ¿es SIGNIFICATIVA? Y aquí aparece la gran palabra de la Estadística: la palabra SIGNIFICATIVO.

Si ahora aplicáramos técnica estadísticas inferenciales acabaríamos viendo que la información que tenemos de la enfermedad A no es significativa y, sin embargo, la que tenemos de la enfermedad B sí lo es. Lo que implica que podemos decir que es mayor la diferencia que hay entre el 45% y el 55% de la enfermedad B que entre el 20% y el 80% de la enfermedad A.

Quien quiera profundizar más en las razones puede consultar el artículo titulado Introducción al contraste de hipótesis. Allí podrá ver la razón fundamental de por qué la diferencia entre 2 y 8 no es significativa y sí lo es la diferencia entre 450 y 550. Evidentemente, como puede suponerse, aquí la clave es el tamaño de muestra. Si en Estadística inferencial queremos decir cosas de todos a partir de una parte (de una muestra) el tamaño de esa muestra para hacer este salto va a ser, evidentemente, fundamental.

Una metáfora puede ayudar a entender todo esto, una metáfora tomada del mundo del baloncesto:

Si un equipo de baloncesto está ganando de 10 puntos en la media parte del partido, ningún aficionado al baloncesto diría que este partido ya está ganado. Si miráramos en una base de datos cientos de miles de partidos de baloncesto y buscáramos todos los partidos en los que un equipo ganaba de 10 faltando todavía 20 minutos de partido por jugar seguro que veríamos que más del 5% de veces ese equipo ha acabado perdiendo. En términos estadísticos diríamos que se trata de un resultado estadísticamente NO SIGNIFICATIVO.

Este número, el 5%, es muy importante en Estadística. Es un valor frontera muy importante. Es el error máximo que se ha establecido para poder afirmar algo en ciencias.

Por el contrario, si faltando un minuto un equipo está ganando de 10 puntos. Ahora  si buscásemos en esa misma base de datos partidos que un equipo, faltando un minuto para acabar el partido, iba ganando de 10 puntos, seguramente veríamos que menos del 5% de veces ese equipo ha acabado perdiendo. Si fuera así, diríamos, en términos estadísticos, que este resultado es estadísticamente SIGNIFICATIVO.

Observemos, ahora, los siguientes datos tomados de un importante y reciente estudio publicado en la revista médica más importante, el New England Journal of Medicine:

 

Se trata de un estudio donde se ensaya la implantación de un páncreas artificial. Para ello se toman 54 niños en un campamento para diabéticos y en dos noches se les trata de dos formas distintas. Una noche mediante el tratamiento habitual mediante insulina y otra noche mediante el páncreas artificial. Se analiza si durante la noche han tenido o no una hipoglucemia, que es la situación más grave que puede padecer un diabético. Como puede verse, con el páncreas artificial 7 de los 54 han padecido una hipoglucemia. Sin embargo, cuando estaban siendo tratados con la insulina, el tratamiento control, se produjeron 22 hipoglucemias. Es evidente que es distinto 7 de 22. Matemáticamente distinto. Pero lo que hace falta es ver si es una diferencia significativa, si es una diferencia estadísticamente significativa.

El valor p=0.02 es el que nos dice si se trata de un resultado significativo. Ser un resultado significativo implica decir que es extrapolable a la población. Que esta diferencia se mantendría si en lugar de tener sólo 54 pacientes tuviéramos millones y millones de pacientes.

Pues esto, esta operación de detectar la significación es la finalidad más importante de la Estadística. Se podría decir perfectamente que la Estadística inferencial es la técnica científica que permite afirmar si un resultado es o no SIGNIFICATIVO. Poca cosa, tal vez, pero de una trascendencia extraordinaria. Fijaos en otro paralelismo: Un juez es una persona encargada de decir, en un juicio, si un acusado es o no inocente. Básicamente es esa su labor. Poca cosa si se quiere, pero se trata de una labor muy trascendental en la sociedad. Pues un estadístico es en la ciencia como un juez en la sociedad. Dicta la sentencia de si un resultado es o no significativo.