Artículo 4: Principal component analysis of socioeconomic factors and their association with malaria in children from the Ashanti Region, Ghana

Este interesante artículo fue publicado en la revista Malaria Journal en el 2010.

El Abstract es el siguiente:

IMG_0247

La región donde se realiza el estudio es la siguiente:

IMG_0248

He elegido el artículo para comentar por el uso que hace de un análisis estadístico muy interesante: el Análisis de componentes principales. Es una técnica multivariante que combina las variables originales creando unas macrovariables (Componentes) que son diferentes combinaciones, con distintos pesos, de esas variables originales, y que explican (las primeras de esas componentes: por eso se llaman principales) la mayor parte de la variabilidad que hay entre los datos que tenemos.

Observemos, a través de la redacción de los métodos, cuáles han sido las variables utilizadas en el análisis, en este estudio. Como podemos ver variables socioeconómicas, como nos indica el título del artículo:

IMG_0249

El Análisis de componentes principales que realizan a una muestra de tamaño 1496, da los siguientes resultados básicos:

IMG_0250

La primera componente no explica mucho. Pero es la que explica más varianza. Explica el 20% de la variabilidad. Observemos que se ha trabajado con 11 variables originales y se obtiene 11 componentes. Lo que sucede es que son 11 componentes (11 combinaciones distintas de las variables originales) con una capacidad muy desigual de explicar la variabilidad intrínseca en los datos, como puede verse en la columna donde está la proporción de la varianza explicada por cada componente (las denomina “factores”).

Ellos han trabajado con esta primera componente, que es la que explica más varianza y que, además, tiene gran interés para lo que persigue el estudio. Suma todas las variables originales. Con pesos un poco diferentes, es cierto, pero siempre con el coeficiente positivo. Lo que nos separa las personas con buen o con mas nivel socioeconómico evaluado por esas 11 variables originales. Quien tiene más comunidades de las enunciadas en las diferentes variables es el que puntúa más en la componente. Por lo tanto, esta componente evalúa el nivel socioeconómico pesando mediante esos coeficientes las 11 variables originales.

La utilización de las componentes a partir de un estudio así puede tener muchas direcciones. Ellos exponen el uso que le han dado a la principal de esas componentes, a la primera:

IMG_0251

Es interesante ver ese uso. Están haciendo una Regresión logística relacionando esa primera componente principal con el tener o no malaria y obtienen esas Odds ratio.

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s