Archivos Mensuales: agosto 2013

Solución Situación 36

Se trata de una pregunta que creo debería estar mejor planteada, porque tal como está formulada puede llevar a dudar incluso a los propios profesionales de la Estadística. Voy a continuación a explicar el porqué. Creo, además, que seguir esta argumentación puede ayudar a solidificar conceptos esenciales en Estadística.

La respuesta correcta, a mi modo de ver, es la 2 (ANOVA). De hecho, si se entiende que se quiere comparar los cuatro grupos de pacientes que se han establecido es, de las cinco respuestas posibles, la única opción realmente factible porque las otras cuatro técnicas son técnicas de comparación de dos poblaciones y nosotros tenemos aquí cuatro poblaciones, cuatro grupos. La pO2 de los dos momentos temporales puede hacer pensar que estamos ante datos apareados pero si los valores de antes y después se restan estamos, entonces, ante una única variable: la variable resta, la variable cambio de pO2 entre antes y después del tratamiento con NO. Por lo tanto, visto así, tenemos cuatro grupos a comparar con muestras independientes. Si es que lo que se pretende en este estudio es comparar los cuatro tipos de pacientes para ver si el cambio de pO2 es el mismo o no entre ellos.

A veces, puede llevar a engaño, en estos tests, el problema del tamaño de muestra. Es éste un tema que suele llevar a muchas confusiones. Es verdad que se acostumbra a simplificar estableciendo una frontera habitualmente en un tamaño de muestra de 30, pero esto no es correcto.

Hay tests estadísticos que no dependen del tamaño de muestra porque si la muestra sigue una distribución normal ya podemos aplicar el test: es el caso de la t de Student o del ANOVA. Si no sigue la normalidad sí que aplicaremos tests no paramétricos: el test de Mann-Whitney o el test Kruskal-Wallis, pero no si el tamaño de muestra es menor de 30. Esto del tamaño de muestra es aplicable a tests donde la distribución del estadístico en el caso de ser cierta la Hipótesis nula es asintóticamente conocida y este asintóticamente quiere decir para tamaños de muestra grandes. Es el caso, por ejemplo, del test de la ji-cuadrado, por ejemplo, o del propio test Kruskal-Wallis. Cada test tiene, además, un tamaño de muestra a partir del cual se considera suficientemente grande como para considerar que ya se cumple la distribución teórica supuesta. El 30 es un número que funciona bastantes veces i por eso se toma muchas veces como frontera, pero no siempre es así.

Por lo tanto, en el caso que se plantea la única opción factible es el ANOVA y para aplicarse debería comprobarse la normalidad de la variable resta de la pO2 de cada una de las cuatro poblaciones y la homogeneidad (la igualdad) de varianzas de las cuatro poblaciones. Si se cumplen ambas condiciones se puede aplicar con tranquilidad el ANOVA, sino debería aplicarse el test de Kruskal-Wallis. Como no se da esta última opción la técnica a aplicar es el ANOVA.

Todo esto que digo es lo que a mí me parece más lógico a argumentar ante esta pregunta. Sin embargo, me cabe una duda. En ningún momento se está diciendo que se quiere comparar estos cuatro grupos. Se dice que se quiere comparar si ante el tratamiento con NO hay diferencias, no si esas diferencias son distintas según el grupo de pacientes considerados. Esto me hace pensar que tal vez quien ha puesto esta pregunta lo que pretende es decir que se han tomado cuatro grupos de pacientes con HTP de UCI tratados con NO porque esa es la realidad hospitalaria con la que se han encontrado, y que se quiere mirar el efecto de ese tratamiento a esos pacientes, pero en ningún caso se pretende evaluar la diferencia que pueda darse entre esos cuatro grupos. De hecho, puede ayudar a llevar a esta conclusión el que en ningún momento se diga que se quiere comparar esos cuatro grupos. Y, por el contrario, se dice que lo que se quiere ver es si hay diferencia en la pO2 entre antes y después del tratamiento.

Si esto fuera lo que pretendía el que ha puesto esta pregunta estamos ante datos apareados pero tenemos un problema: entonces hay dos respuestas posibles. El Test de Wilcoxon y el test de la t de Student de datos apareados son posibles. Deberíamos saber si la variable resta de pO2 en los 24 pacientes sigue o no la distribución normal. En absoluto debe pensarse que el ser la muestra de tamaño 24 (que es menor que 30) impide la aplicación de la técnica paramétrica (la t de Student de datos apareados), como he comentado antes. El test de la t de Student es un test exacto, no asintótico. Es exacto si se sigue la distribución normal. Por lo tanto, si el que ha puesto la pregunta está pensando en esto falta información para elegir entre estas dos opciones posibles.

Por lo tanto, para mí la pregunta necesitaría formularse mejor mediante dos opciones: 1) Dejar claro que se quiere ver si hay diferencias significativas entre la respuesta al NO según se pertenezca a un grupo u otro de esos cuatro pacientes. 2) Si lo que se quiere es ver únicamente si hay un cambio significativo en el pO2 después del tratamiento con NO en los pacientes con HTP en UCI, especificándose los cuatro tipos de pacientes únicamente a nivel informativo, debería concretarse si la variable resta se ajusta o no a la distribución normal porque si no se especifica tal cosa hay dos respuestas posibles.

Para leer cosas que complementen a lo visto aquí ver el Tema 14: Comparación de dos poblaciones.

Para ver otro ámbito en el que suele llevar a confusiones el tener un determinado tamaño de muestra en Estadística ver el artículo: La Estadística descriptiva en Medicina.

Situación 36: Una pregunta del MIR

En un ensayo clínico se pretende evaluar la respuesta al Óxido nítrico (NO) en niños con Hipertensión pulmonar (HTP). Se incluyeron 24 pacientes de la UCI, entre 1996 y 1997, que recibieron NO inhalado. Las indicaciones se categorizaron en 4 grupos: 1) Tratamiento con monitorización directa de la Presión arterial pulmonar (PAP). 2) Tratamiento sin monitorización directa. 3)  Con un nivel de presión mayor de 15 mmHg. 4) En uso preventivo. Se controlaron TA, PAP, gases en sangre antes y después, meta Hb, control ambiental NO cada 4h y ecocardio pre y post NO. En el análisis estadístico se compararon pO2 antes y después del NO. ¿Qué test se utilizó?

1. t de Student de muestras independientes

2. ANOVA

3. Wilcoxon

4. t de Student apareados

5. Mann Whitney

Solución