Archivos Mensuales: abril 2014

Test de una proporción

 

En ocasiones se requiere contrastar la hipótesis de que la proporción en una población, de una variable dicotómica, es un cierto valor concreto.

El Test de una proporción es el clásico test para esta situación. Es un test que se basa en la aproximación de una distribución binomial a una distribución normal.

El Test es el siguiente:

20140418-185639.jpg

 Veamos el siguiente ejemplo: Supongamos que queremos comprobar si una moneda tiene un desequilibrio. Aplicaríamos este contraste con po =0.5. Por lo tanto, la Hipótesis nula afirma que p=0.5. Supongamos que en un muestreo de 100 lanzamientos de esa moneda han salido 65 caras y 35 cruces. Si calculamos el valor del estadístico T es 3 ó -3 según miremos las caras o las cruces del muestreo. Como en una normal N(0, 1) la zona de rechazo de la hipótesis nula está a la derecha de 1.96 y a la izquierda de -1.96, para un nivel de significación del 0.05, podemos rechazar tal hipótesis. El p-valor es menor que 0.05. Debemos rechazar la hipótesis de equilibrio.

Si, por el contrario, en el muestreo salen 55 caras y 45 cruces el valor del estadístico T es 1 ó -1, lo que nos llevaría a no poder rechazar la hipótesis nula.

 

Situación 62: Práctica (Tema14)

Se ha realizado un estudio clínico con pacientes diagnosticados de Alzheimer. Se ha ensayado un tratamiento que intenta frenar el proceso de la demencia progresiva. Para ello se han seleccionado un grupo de 60 pacientes con esta enfermedad. De forma aleatoria se reparten estos pacientes en dos grupos de 30 pacientes cada uno. Durante 2 años a uno de los grupos se les da un tratamiento experimental y al otro grupo se les da un placebo. El estudio es a doble ciego. La variable estudiada para evaluar el nivel cognitivo del paciente era el Mini-Mental.

El Mini-Mental es una evaluación numérica del nivel cognitivo obtenido mediante una encuesta validada que es la siguiente:

20140410-233409.jpg

20140410-233419.jpg

A continuación se aporta la base de datos con los valores basales (0 años) y los valores a los 2 años de tratamiento:

GPlacebo0a=Grupo Placebo a nivel basal (a los 0 años).

GPlacebo2a=Grupo Placebo a los 2 años.

RestaP=Resta GPlacebo0a-GPlacebo2a.

GTratamiento0a=Grupo Tratamiento a nivel basal (a los 0 años).

GTratamiento2a=Grupo Tratamiento a los 2 años.

RestaT=Resta GTratamiento0a-GTratamiento2a.

GPlacebo0a GPlacebo2a RestaP GTratamiento0a GTratamiento2a RestaT
18 14 4 17 15 2
21 16 5 20 18 2
17 13 4 21 19 2
15 12 3 23 19 4
18 13 5 22 20 2
15 12 3 19 18 1
16 14 2 19 17 2
18 14 4 18 17 1
21 16 5 20 16 4
23 17 6 15 12 3
22 21 1 16 14 2
21 18 3 18 16 2
19 13 6 21 20 1
18 14 4 20 18 2
18 13 5 16 15 1
16 13 3 16 13 3
18 13 5 23 21 2
18 11 7 24 22 2
16 13 3 22 18 4
19 18 1 19 13 6
20 15 5 18 17 1
15 13 2 17 15 2
16 12 4 17 13 4
18 15 3 19 16 3
21 16 5 17 14 3
23 19 4 16 14 2
15 14 1 19 14 5
16 12 4 20 19 1
18 13 5 15 14 1
19 14 5 19 18 1

Se pide:

1. ¿Hay diferencia, estadísticamente significativa, a nivel basal (a los 0 años), en cuanto al nivel de enfermedad entre los dos grupos (el grupo Placebo y el grupo Tratamiento)?

2. ¿Hay una pérdida, estadísticamente significativa, en el grupo Tratamiento, en los dos años?

3. ¿Hay una pérdida, estadísticamente significativa, en el grupo Control, en los dos años?

4. ¿Hay diferencia, estadísticamente significativa, entre los dos grupos (Placebo y Tratamiento) en cuanto a la variable Resta; o sea, la variable Mini-Mental a 0 años-Mini-Mental a 2 años?

5. ¿Hay diferencia, estadísticamente significativa, entre ambos grupos, en cuanto al porcentaje de los pacientes que en los dos años el descenso del valor individual es superior o igual a 6?

Aplicación del Test de Hosmer-Lemeshow en Medicina

La Regresión logística es uno de los modelos matemáticos más usuales en Medicina. Un modelo no puede aplicarse así, sin más, porque se suela hacer. Un modelo puede usarse siempre y cuando haya un buen ajuste. Usar un modelo sin ajustarlo previamente es actuar a ciegas y esto es grave en ciencia.

El Test de Hosmer y Lemeshow es un test de bondad de ajuste de unos datos a un modelo de Regresión logística. Y como la Regresión logística es muy usual en Medicina este Test es un muy importante Test en Medicina.

Un Test de bondad de ajuste, en general, lo que hace es comprobar si el modelo propuesto puede explicar lo que se observa. Es un Test donde se evalúa la distancia entre lo observado en los datos que tenemos de la realidad y lo esperado bajo el modelo. Para introducirse en la visión general de los tests estadísticos donde se evalúa la distancia entre observado y esperado ver el artículo Tema 8: Relación entre variables cualitativas: Test de la ji-cuadrado.

El Test básicamente consiste en dividir el recorrido de valores de la variable dependiente (0,1) en una serie de intervalos. Intervalos que contengan un número de observaciones suficientemente grande (5 ó más). Se trata, entonces, de contar intervalo por intervalo el esperado y el observado para cada uno de los dos resultados posibles de la variable dependiente dicotómica (tiene la enfermedad o no la tiene, es hombre o mujer, etc). El observado es lo que se tiene y el esperado es el valor esperado teórico calculado mediante el modelo construido. El estadístico es un estadístico de la ji-cuadrado, como el visto en el tema dedicado a la relación entre variables cualitativas.

Veamos un par de ejemplos donde podemos comprobar la aplicación del Test a un caso donde hay ajuste y a otro donde no lo hay. El ejemplo es con pocos datos, para que se entienda mejor, lo que fuerza a que el número de observaciones por intervalo sea muy bajo (menos de 5), lo que hace menos fiable el test. Los datos son los siguientes:

IMG_8389

Vemos la variable “y” que es la variable dependiente. Una variable codificada con 1 ó 0. Es la variable dicotómica estudiada: Enfermo-No enfermo, Muere-No muere, Metástasis-No metástasis, etc.

Las otras dos variables son las variables independientes. Haremos una Regresión logística con cada una de las dos variables independientes.

Empezemos con la primera, la variable x1. El dibujo de la Regesión logística es el siguiente:

IMG_8390

Como puede verse los valores aparecen bien segregados, los valores con variable dependiente 1 ó 0. La aplicación del Test de Hosmer-Lemeshow es la siguiente:

IMG_8392

Observemos que el p-valor es superior a 0.05. Aquí la Hipótesis nula es que el modelo se ajusta a la realidad. En un Test de bondad de ajuste siempre en la Hipótesis nula se afirma que el modelo propuesto se ajusta a lo observado. Por lo tanto, un p-valor superior a 0.05 implica que lo que observamos se ajusta suficientemente a lo que esperado bajo el modelo.

Observemos también que en la tabla de aplicación del Test, en la que se van calculando, en una serie de intervalos, los valores observados y esperados, hay mucha proximidad entre estos valores reales y teóricos. Esto es lo que permite pensar que usar este modelo y calcular predicciones con él es suficientemente correcto. Esto suele considerarse como una Calibración.

Veamos ahora lo mismo pero con la variable x2:

IMG_8391

Viendo estos datos vemos que los valores con 1 ó 0 ya no tienen una disposición que haga pensar en un buen ajuste. Veamos la aplicación del Test:

IMG_8393

Ahora el p-valor del Test es menor que 0.05, lo que implica que la Hipótesis nula no parece lógico mantenerla a la luz de lo que vemos en nuestros datos. Si observamos, también, la tabla de los valores observados y esperados, tanto entre los valores con 1 y con 0, vemos que hay mucha distancia entre los valores observados y los valores esperados.

En una situación como esta no sería recomendable el uso del modelo de Regresión logística.

Solución Situación 61

1d: No existen métodos de comparación entre estas tres medidas del grado de relación entre variables. Entre dos medidas significativas del mismo tipo sí que la hay, pero no entre estos distintos tipos de medidas. Cada una tiene un rango de valores posibles distinto y no hay unas pautas de comparación entre los diferentes tipos de medidas del grado de relación que aparecen en esta pregunta; o sea, entre la correlación de Pearson, la Odds ratio y la V de Crámer.

2a: Las únicas OR significativas son 0.1 y 7. Y 0.1 implica un grado de relación de 10 niveles de protección. Y 10 es mayor que 7.

3c: En esta muestra el 26 tiene 8 valores inferiores y 2 superiores. Por eso, sólo en esta muestra ocupa el percentil 80.

4b: Una OR=4 es equivalente a una OR=0.25 porque ambas suponen 4 veces riesgo ó 4 veces protección. Y 0.5 supone únicamente 2 veces protección. Por lo tanto, una OR=4 implica mayor asociación que una OR=0.5.

Una OR mayor que 1 puede ser perfectamente no significativa.

No siempre que el observado y el esperado de una tabla de contingencia no coincidan la V de Crámer valdrá 1. Valdrá 1 sólo si existe el grado máximo posible de diferencia, dado el tipo de tabla que tengamos y el tamaño de muestra que tengamos.

El índice kappa puede tener valores negativos sólo si la discordancia es muy grande.

5b: No parece haber ajuste a una distribución normal, claramente. Luego, los valores de asimetría estandarizada y curtosis estandarizada caerán fuera del intervalo (-2, 2).

6a: Si el intervalo de confianza del 95% de la pendiente no incluye al 0 se trata de una pendiente significativa. No es cierto que no lo sea, de significativa, por incluir al 1.

Las otras afirmaciones son claramente ciertas. El intervalo de confianza de la OR no incluye al 1, por lo tanto: es significativo. La correlación también lo es por tener un p-valor inferior a 0.05. Y el índice kappa indica fuerte asociación porque es casi 1.

7d: El rango es 8. La moda 3. La mediana es 3. Y el rango intercuartílico es, claramente 6 puesto que el primer cuartil es 2 y el tercero es 8.

8d: Una r=-0.6 al hacer su cuadrado tenemos que es 0.36 y al pasarlo a porcentaje se transforma en un 36%.

En una Regresión lineal simple la variable dependiente es cuantitativa, no cualitativa.

El que el p-valor sea mayor que 0.05 no es indicativo de que observado y esperado coinciden. Evidentemente, si estos coinciden el p-valor será mayor que 0.05 (de hecho, será 1), pero el que el p-valor sea mayor que 0.05 no implica que necesariamente observado y esperado coincidan.

Si un intervalo de confianza del 95% de la media es (8, 12) el Error estándar será 1, no 2, puesto que la media muestral será 10 y dos veces el Error estándar nos debe dar 2. Luego el Error estándar debe ser 1.

9d: Una OR=0.2 indica un grado de protección de 5 porque 1/0.2 es igual a 5.

La Regresión lineal simple y=3x+4 tiene pendiente claramente positiva.

La V de Crámer sólo puede tener valores entre 0 y 1.

Una ji-cuadrado no cuantifica el grado de relación que hay entre dos variables cualitativas. Valora si hay o no relación.

10c: Como ni la asimetría estandarizada ni la curtosis estandarizada caen dentro del intervalo (-2, 2) nuestra variable, en este caso, no se ajusta a la distribución normal, por lo tanto a la hora de resumirla brevemente es preferible y recomendable hacerlo mediante la mediana y el rango intercuartílico.

La afirmación “a” seguro que tiene demasiado error por el no ajuste a la distribución normal.

No tienen por qué ser iguales la mediana y la media.

Toda muestra de una variable cuantitativa tiene desviación estándar, se ajuste o no a una distribución normal. Otra cosa es cómo se interprete en función del ajuste a la distribución normal de la variable estudiada.

Situación 61: Examen (Temas 1-9)

1. ¿Qué valor refleja un mayor nivel de relación entre dos variables?

a. r= 0.6 (p<0.05)

b. OR=10 (IC 95%: (4.37, 23.32))

c. V=0.85 (p<0.05)

d. No pueden compararse estos tres tipos de medición del grado de relación entre dos variables.

2. ¿Qué Odds ratio indica mayor relación entre dos variables dicotómicas?

a. 0.1 (p<0.05)

b. 7 (p<0.05)

c. 15 (p>0.05)

d. 0.05 (p>0.05)

3. Tenemos un individuo con un valor de IMC de 26 y nos dicen que, respecto a una muestra, este valor representa un percentil 80. ¿Cuál de las siguientes es la muestra referente?:

a. (19, 21, 21, 22, 23, 24, 24, 24, 25, 31)

b. (19, 21, 21, 22, 24, 24, 25, 27, 28, 31)

c. (20, 21, 21, 22, 24, 24, 24, 25, 27, 29)

d. (18, 21, 21, 22, 24, 24, 27, 29, 31, 38)

4. ¿Qué afirmación entre las siguientes es cierta?

a. Una Odds ratio mayor que 1 siempre es significativa.

b. Una Odds ratio de 4, significativa, es una medida que indica mayor asociación que una Odds ratio de 0.5 que también sea significativa.

c. La V de Crámer toma el valor de 1 si el observado y el esperado son diferentes.

d. El índice kappa puede tener valores negativos si la concordancia entre dos observadores es muy alta.

5. En una muestra como la siguiente: (4, 5, 5, 6, 6, 15, 16, 16, 17, 17, 80), la asimetría estandarizada y la curtosis estandarizada:

a. Deben de ser valores que caen fuera del intervalo (-2, 2) porque sí parece haber ajuste a la distribución normal.

b. Deben de ser valores que caen fuera del intervalo (-2, 2) porque no parece haber ajuste a la distribución normal.

c. Deben de ser valores que caen dentro del intervalo (-2, 2) porque sí parece haber ajuste a la distribución normal.

d. Deben de ser valores que caen dentro del intervalo (-2, 2) porque no parece haber ajuste a la distribución normal.

6. ¿Cuál de las siguientes afirmaciones no es cierta?

a. Un intervalo de confianza del 95% de una pendiente en una Regresión lineal simple que sea (0.75, 1.34) nos indica una pendiente no significativa porque el intervalo incluye al 1.

b. Una Odds ratio con un intervalo de confianza del 95% que sea (3.23, 7.67) indica una asociación significativa.

c. Una correlación r=0.23 (p=0.001) indica que estamos ante una correlación positiva significativa.

d. Un índice kappa de 0.98 indica una fuerte concordancia entre dos observadores.

7. Sea la muestra (9, 9, 1, 1, 3, 3, 3, 7). Podemos afirmar:

a. El rango es 9.

b. La moda es 9.

c. La mediana es 5.

d. El rango intercuartílico es 6.

8. ¿Cuál de las siguientes afirmaciones  es cierta?

a. En una Regresión lineal simple la variable dependiente es cualitativa.

b. En un Test de la ji-cuadrado si el p-valor es mayor que 0.05 indica que la tabla de contingencias observada y la esperada son iguales.

c. Un intervalo de confianza de la media del 95% que sea (8, 12) indica que el Error estándar es igual a 2.

d. Una correlación de Pearson de -0.6 entre dos variables nos indica que si hacemos una Regresión lineal simple entre ambas variables tendremos una Rdel 36%.

9. ¿Cuál de las siguientes afirmaciones es cierta?

a. Un modelo de Regresión lineal simple que sea y=3x+4 tiene una pendiente negativa.

b. Una V de Crámer de -1 indica que la relación entre las variables cualitativas es de tipo inverso.

c. La ji-cuadrado es una técnica que cuantifica el grado de relación que hay entre dos variables cualitativas.

d. Una Odds ratio de 0.2, significativa, nos indica que la exposición estudiada es un factor que nos protege 5 veces más que la no exposición.

10. En una muestra con curtosis estandarizada de 3.45 y asimetría estandarizada de -5.18:

a. Si la media muestral es 5 y la desviación estándar es 3 podremos decir que entre 2 y 8 tenemos el 68.5% de los valores.

b. La media muestral y la mediana serán iguales.

c. Si la queremos resumir brevemente mejor hacerlo mediante la mediana y el rango intercuartílico expresado mediante el primer y tercer cuartil.

d. Esta muestra no tienen desviación estándar porque no se ajusta a una distribución normal.