La distribución normal

Gauss, que era un matemático genial, tuvo una extraordinaria intuición: en la naturaleza muchas cosas se distribuyen de forma simétrica respecto a un valor central y cuanto más se alejan de ese centro menos densidad de valores hay. Y creó una función de las más importantes de la historia de las matemáticas: la Distribución normal, o también conocida como campana de Gauss. (Si se quiere ver la situación de la Distribución normal dentro del contexto de otras funciones de distribución consultar el artículo Funciones de distribución).

La Distribución normal tiene una propiedad muy importante: Si a una variable con una Distribución normal cualquiera se le resta su media y se la divide por su desviación estándar se transforma en una Distribución normal con media 0 y con Desviación estándar igual a 1. Es la llamada Distribución normal estándar. Y a este procedimiento, a esta transformación de una normal cualquiera en una única y común distribución, la N(0, 1), se le denomina “estandarización” o “tipificación”.

IMG_4314

Al restar por su media la normal se desplaza, rígidamente, sin cambiar su forma, sin cambiar su dispersión, hasta situarse sobre el cero. Al dividir por la Desviación estándar (DE) lo que hacemos es comprimirla (si la DE de partida es mayor que 1) o expandirla (si la DE de partida es menor que 1). En el gráfico adjunto se pueden ver estos dos actos: el de desplazamiento y el de compresión.

IMG_4260

Esta propiedad de la Distribución normal nos permite calcular el área de cualquier de una de ellas mediante una única tabla, la de la Normal N(0, 1).

¿Y cómo funciona la tabla de N(0, 1)?

Hay de muchos tipos de estas tablas. Todas deben usarse sabiendo dos cosas básicas: Que el área que hay debajo de la campana es 1 y que la distribución de áreas es simétrica respecto al valor donde está el punto medio.

Voy a explicar cómo se utiliza una de estas tablas. La tabla adjunta tiene unos valores referencia en la primera columna y en la primera fila. En la primera columna los valores son 0.0, 0.1, 0.2, y así sucesivamente. En la primera fila son 0.00, 0.01, 0.02, y así sucesivamente. Las áreas en esta tabla se dan siempre hacia la izquierda del número de referencia elegido. Cuando en una N(0, 1) se quiere buscar un número para encontrar el área debe elegirse la combinación de un número de la primera columna con un número de la primera fila, sumándolos.

Practiquemos: Si quiero calcular el área que hay, bajo la campana, a la izquierda de 1.43, debo buscar en la primera columna el 1.4 y en la primera fila el 0.03. De esta forma sumo estos dos valores tengo 1.43. En la celdilla intersección de tal columna con tal fila encontramos el valor de tal área: 0.9236. Esta es el área a la izquierda de 1.43, el área desde menos infinito hasta 1.43 bajo la distribución N(0, 1).

Si quiero calcular, ahora, el área a la izquierda de 0.82 debo buscar en la primera columna el 0.8 y en la primera fila el 0.02, así al sumar tengo 0.82. En la celdilla intersección de tal columna con tal fila encontramos el valor de tal área: 0.7939.

Observemos que los valores empiezan en el punto 0.0. Esto es con finalidad de ahorrar espacio. Porque al ser el área bajo la campana de 1 y a partir de la propiedad de simetría podemos calcular cualquier área. Veámoslo: Supongamos que queremos calcular el área a la izquierda del valor -1.13, debemos buscar el área a la derecha de 1.13 porque es la misma. Y para encontrarla hay que buscar el área a la izquierda de 1.13 y calcular 1 menos esa área. Jugando con esta idea se puede calcular cualquier área.

Si se quiere encontrar el área dentro de un intervalo, por ejemplo entre 0.23 y 1.12, buscamos el área a la izquierda de 1.12, el área a la izquierda de 0.23 y las restamos. Las restamos porque al área a la izquierda de 1.12 hay que restarle el área a la izquierda de 0.23, de esta forma estaremos calculando el área que hay desde 0.23 a 1.12.

Y, así, sabiendo utilizar las propiedades de la Distribución normal comentadas: área 1 y simetría, puede calcularse cualquier área.

Hay un detalle que es importante destacar. Ahora que ya sabemos manejar la tabla de la Normal hemos de decir que cuando decimos aquello de media más menos una Desviación estándar (DE), más menos dos DE o más menos tres DE, cubren el 68.5, 95 y 99.5% podemos comprobar que estos valores son aproximados, no son exactos. Se fijan estos tres números porque son muy próximos y son más fáciles de retener en la memoria. En realidad, si lo calculamos exacto desde -1 hasta +1 en la N(0, 1) sería exactamente: 0.8413-0.1587=0.6826; por lo tanto media más menos una DE es exactamente un 68.26%. Si miramos la tabla podremos comprobar que desde -2 hasta 2 hay un área un poco superior al 95%, y que si queremos crear un intervalo exactamente del 95% deberíamos crearlo mediante la media más menos 1.96 Desviaciones estándar porque desde -1.96 hasta 1.96 se da exactamente un área de 0.95. Respecto al intervalo formado por la media más menos tres DE el área es: 0.99865-0.00135=0.99730; o sea, del 99.7%.

IMG_4261

Para ver problemas de aplicación de la distribución normal y ver su relación con otras distribuciones puede consultarse el artículo Funciones de distribución. Allí se verá, entre otras cosas, cómo la distribución normal se puede usar para aproximar a distribuciones como la Binomial o la Poisson.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s