Una introducción a la Estadística inferencial para estudiantes de ESO

La Estadística que se estudia en la enseñanza secundaria es la Estadística descriptiva, la Estadística que se limita a describir lo que se tiene: una muestra. De ella se hacen gráficos que la resumen (histogramas, diagramas de frecuencias, diagramas de cajas (Box-Plot), etc), se calculan valores que detectan ciertas características (la media, la mediana, la desviación estándar, el rango, etc).

Esta introducción a la Estadística inferencial es un primer paso desde esa Estadística, la Estadística descriptiva, a la Estadística inferencial, que es la que con mayor frecuencia se van a encontrar esos alumnos cuando lleguen a la universidad o la acaben aplicando, en la vida real, como profesionales de la Economía, de la Medicina, de la Psicología, etc.

La Estadística inferencial es la que va más allá de la muestra, la que intenta decir cosas no de la muestra, sino de toda la población de donde se ha tomado la muestra. Es la Estadística que, apoyándose en la información muestral, pretende decir cosas de la población global. Por eso es inferencial, porque inferir significa ir más allá de lo que vemos, usar lo que tenemos para hablar de lo que no tenemos.

Supongamos la siguiente situación: dos grupos de investigación estudian cada uno de ellos una determinada enfermedad. Quieren saber si es una enfermedad asociada al sexo; o sea, más frecuente en un sexo que en otro.

El grupo que estudia la enfermedad A ha tomado una muestra de pacientes de esa enfermedad y 2 son hombres y 8 son mujeres.

El grupo que estudia la enfermedad B ha tomado una muestra de pacientes de esa enfermedad y 450 son hombres y 550 son mujeres.

Tenemos, por lo tanto, la siguiente situación:

IMG_1470

La Estadística descriptiva de estas dos muestras es muy sencilla de hacer. De la enfermedad A en la muestra el 20% son hombres y el 80% son mujeres. De la enfermedad B en la muestra el 45% son hombres y el 55% son mujeres.

La Estadística descriptiva aquí acaba su recorrido, no pretende más que eso: describir lo que tenemos, la muestra.

La Estadística inferencial, de hecho, empieza donde ha acabado la Estadística descriptiva. A partir de esos porcentajes muestrales incuestionables se plantea: Esa diferencia, ¿es SIGNIFICATIVA? Y aquí aparece la gran palabra de la Estadística: la palabra SIGNIFICATIVO.

Si ahora aplicáramos técnica estadísticas inferenciales acabaríamos viendo que la información que tenemos de la enfermedad A no es significativa y, sin embargo, la que tenemos de la enfermedad B sí lo es. Lo que implica que podemos decir que es mayor la diferencia que hay entre el 45% y el 55% de la enfermedad B que entre el 20% y el 80% de la enfermedad A.

Quien quiera profundizar más en las razones puede consultar el artículo titulado Introducción al contraste de hipótesis. Allí podrá ver la razón fundamental de por qué la diferencia entre 2 y 8 no es significativa y sí lo es la diferencia entre 450 y 550. Evidentemente, como puede suponerse, aquí la clave es el tamaño de muestra. Si en Estadística inferencial queremos decir cosas de todos a partir de una parte (de una muestra) el tamaño de esa muestra para hacer este salto va a ser, evidentemente, fundamental.

Una metáfora puede ayudar a entender todo esto, una metáfora tomada del mundo del baloncesto:

Si un equipo de baloncesto está ganando de 10 puntos en la media parte del partido, ningún aficionado al baloncesto diría que este partido ya está ganado. Si miráramos en una base de datos cientos de miles de partidos de baloncesto y buscáramos todos los partidos en los que un equipo ganaba de 10 faltando todavía 20 minutos de partido por jugar seguro que veríamos que más del 5% de veces ese equipo ha acabado perdiendo. En términos estadísticos diríamos que se trata de un resultado estadísticamente NO SIGNIFICATIVO.

Este número, el 5%, es muy importante en Estadística. Es un valor frontera muy importante. Es el error máximo que se ha establecido para poder afirmar algo en ciencias.

Por el contrario, si faltando un minuto un equipo está ganando de 10 puntos. Ahora  si buscásemos en esa misma base de datos partidos que un equipo, faltando un minuto para acabar el partido, iba ganando de 10 puntos, seguramente veríamos que menos del 5% de veces ese equipo ha acabado perdiendo. Si fuera así, diríamos, en términos estadísticos, que este resultado es estadísticamente SIGNIFICATIVO.

Observemos, ahora, los siguientes datos tomados de un importante y reciente estudio publicado en la revista médica más importante, el New England Journal of Medicine:

 

Se trata de un estudio donde se ensaya la implantación de un páncreas artificial. Para ello se toman 54 niños en un campamento para diabéticos y en dos noches se les trata de dos formas distintas. Una noche mediante el tratamiento habitual mediante insulina y otra noche mediante el páncreas artificial. Se analiza si durante la noche han tenido o no una hipoglucemia, que es la situación más grave que puede padecer un diabético. Como puede verse, con el páncreas artificial 7 de los 54 han padecido una hipoglucemia. Sin embargo, cuando estaban siendo tratados con la insulina, el tratamiento control, se produjeron 22 hipoglucemias. Es evidente que es distinto 7 de 22. Matemáticamente distinto. Pero lo que hace falta es ver si es una diferencia significativa, si es una diferencia estadísticamente significativa.

El valor p=0.02 es el que nos dice si se trata de un resultado significativo. Ser un resultado significativo implica decir que es extrapolable a la población. Que esta diferencia se mantendría si en lugar de tener sólo 54 pacientes tuviéramos millones y millones de pacientes.

Pues esto, esta operación de detectar la significación es la finalidad más importante de la Estadística. Se podría decir perfectamente que la Estadística inferencial es la técnica científica que permite afirmar si un resultado es o no SIGNIFICATIVO. Poca cosa, tal vez, pero de una trascendencia extraordinaria. Fijaos en otro paralelismo: Un juez es una persona encargada de decir, en un juicio, si un acusado es o no inocente. Básicamente es esa su labor. Poca cosa si se quiere, pero se trata de una labor muy trascendental en la sociedad. Pues un estadístico es en la ciencia como un juez en la sociedad. Dicta la sentencia de si un resultado es o no significativo.

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s