Estimación no paramétrica de funciones de densidad (Método Kernel)

La estimación no paramétrica de funciones de densidad, mediante el método Kernel, es una ingeniosa forma de estimar una función de densidad que no siga un modelo conocido (Normal, Binomial, Exponencial, etc). Tiene una enorme flexibilidad y lo que hace es construir una función de densidad girando en torno a los valores muestrales.

IMG_4416

El valor h, denominado normalmente la ventana, es un valor que representa el área de influencia que se le pretende dar a cada valor muestral. Su elección se le suele hacer depender de la dispersión de los valores. Posiblemente, para entender mejor la operatividad del estimador, es mejor pensar que h es igual a 1 y así ya aparecen en la expresión elementos más fáciles de controlar y asimilar.

Veamos cómo sería la construcción de este estimador en un ejemplo concreto, paso a paso:

IMG_4692

Arriba vemos los cinco puntos muestrales. En la imagen del medio vemos que hemos construido una Normal sobre cada valor muestral, una Normal con media cada uno de esos valores. Y con densidad, cada una de esas normales 1/n, en nuestro caso: 1/5, para darle el mismo peso a cada valor muestral y que, al final, la suma de las áreas sea 1.

En la imagen final integramos esas cinco funciones en una sola. Y nos queda una imagen como ésta. Esto es una estimación coherente de cómo debe de ser la distribución poblacional.

Este procedimiento tiene muchas aplicaciones. Una de ellas es en Análisis discriminante. Si tenemos varias muestras, una por cada población distinta, y no siguen la normalidad, podemos construir para cada muestra una función de densidad según este criterio y clasificar al nuevo individuo simplemente asignándolo a la población donde haya más valor de densidad, que querrá decir que por allí hay más influencia de esa población.

2 comentarios en “Estimación no paramétrica de funciones de densidad (Método Kernel)

Deja un comentario