Archivos Mensuales: febrero 2014

Análisis de componentes principales aplicado a datos de jugadores de baloncesto

He recogido estadísticas de los jugadores de baloncesto del F.C.Barcelona y del R.Madrid publicadas en la página web de la ACB. La base de datos es la siguiente:

PUN=Puntos medios por partido.

T2, T3 y T1=Porcentaje de acierto en tiros de 2, de 3 y de 1, respectivamente.

RTO=Rebotes totales.

ASI=Asistencias.

BRE=Balones recuperados.

BPE=Balones perdidos.

TFA=Tapones a favor.

TCO=Tapones en contra.

FFA=Faltas a favor.

FCO=Faltas en contra.

Nombre PUN T2 T3 T1 RTO ASI BRE BPE TFA TCO FFA FCO
Tomic, Ante 11.20 64.38 0.00 69.23 7.05 1.55 0.65 1.45 0.60 0.20 2.50 3.35
Navarro, Juan Carlos 10.83 48.57 34.83 80.95 2.39 2.44 0.78 1.22 0.00 0.17 1.33 3.33
Huertas, Marcelinho 7.53 54.22 27.66 100.00 1.79 4.79 0.63 1.79 0.05 0.16 0.84 1.53
Lorbek, Erazem 9.18 56.00 45.83 80.00 2.82 1.09 0.55 0.55 0.09 0.18 1.82 1.82
Dorsey, Joey 4.95 74.58 0.00 29.73 5.45 0.50 1.10 1.20 1.30 0.15 2.75 2.00
Abrines, Alex 7.94 52.50 46.30 86.66 1.61 0.83 0.72 0.56 0.39 0.11 1.83 1.67
Papanikolau, Kostas 6.94 50.00 38.30 89.99 3.83 1.33 0.72 1.44 0.22 0.39 2.06 1.33
Lampe, Maciej 6.33 47.76 31.58 65.00 2.93 1.07 0.00 0.80 0.60 0.07 1.27 1.73
Oleson, Brad 6.73 55.55 39.47 90.00 1.09 1.45 0.55 0.73 0.09 0.00 1.00 1.09
Nachbar, Bostjan 7.74 53.62 27.78 80.00 2.47 0.63 0.63 1.16 0.05 0.21 3.11 1.58
Sada, Víctor 1.74 37.93 0.00 84.61 2.05 1.95 0.47 1.00 0.00 0.05 0.63 1.16
Todorovic, Marko 2.73 60.00 0.00 64.70 2.53 0.53 0.40 0.67 0.47 0.00 1.40 0.93
Hezonja, Mario 3.50 47.83 33.33 80.01 1.83 0.75 0.50 0.75 0.25 0.00 0.92 0.75
Pullen, Jacob 5.60 57.14 35.56 69.57 0.50 1.05 0.50 1.00 0.05 0.20 1.05 1.25
Mirotic, Nikola 13.68 61.60 33.33 77.11 6.32 1.32 1.05 1.16 0.37 0.21 1.63 3.42
Fernández, Rudy 12.94 60.00 35.23 84.75 3.17 2.61 2.11 1.06 0.28 0.11 1.61 3.78
Rodríguez, Sergio 12.35 57.80 40.79 84.85 1.85 5.70 1.60 2.30 0.10 0.15 1.60 2.20
Llull, Sergio 13.30 51.72 49.48 88.89 2.00 3.25 1.20 1.30 0.10 0.05 1.05 2.20
Reyes, Felipe 8.16 52.13 38.47 77.78 4.53 0.79 1.05 1.47 0.26 0.16 1.74 3.32
Bourousis, Ioannis 6.61 57.97 29.17 81.82 4.11 0.56 0.44 0.78 0.39 0.17 2.22 1.89
Carroll, Jaycee 10.07 53.57 40.98 80.00 2.27 0.40 0.47 0.87 0.00 0.20 1.47 1.33
Mejri, Salah 4.89 56.52 24.99 60.00 4.00 0.42 0.47 0.63 0.79 0.26 1.84 1.11
Darden, Tremmell 5.05 51.16 42.42 93.75 2.25 0.90 0.30 0.35 0.60 0.00 1.20 0.75
Slaughter, Marcus 2.70 56.10 0.00 42.11 3.15 0.75 0.75 0.60 0.45 0.05 2.00 1.25
Díez, Daniel 3.92 52.38 27.59 83.34 1.23 0.54 0.46 0.15 0.08 0.15 0.46 0.62
Draper, Dontaye 1.79 50.00 27.78 71.44 0.89 1.68 0.79 0.74 0.05 0.05 2.05 0.74

Si se hace un Análisis de componentes principales con estas variables obtenemos el siguiente cuadro del peso de cada una de las componentes:

IMG_8096

Las tres primeras componentes explican el 73,1% de la variabilidad. Con las dos primeras un 62,4%.

Los coeficientes de las tres primeras componentes son las siguientes:

IMG_8097

El gráfico de las dos primeras componentes principales es el siguiente:

IMG_8098

Anuncios

Situación 56: Aplicación de técnicas de relación y de comparación

Supongamos que tenemos una base de datos como la siguiente:

Tenemos registradas las siguientes variables: Sexo, Edad, Fumador, Haber fumado, Paquetes-año y Bronquitis crónica.

En la variable fumador se distinguen tres situaciones: fumador activo (sí), ex-fumador (ex) y que nunca ha fumado (no).

La variable Haber fumado es una transformación de esta anterior que puede ser útil en algún momento. Agrupa en un valor de “sí” a los fumadores activos y a los ex-fumadores y en un valor de “no” a los que nunca han fumado.

En la variable Paquetes-año se calcula mediante la fórmula de años fumados multiplicado por  el número de paquetes al día fumados. Por ejemplo, una persona que ha fumado durante 15 años a razón de 1 paquete diario son 15 paquetes-año. Una persona que ha fumado durante 30 años medio paquete diario también son 15 paquetes-año.

(Esta matriz se puede copiar y pegar en un software estadístico)

(La variable Bronquitis crónica está codificada de la siguiente forma: 1=sí, 0=no)

Sexo Edad Fumador Haber fumado Paquetes-año Bronquitis crónica
h 56 20 1
h 64 45 1
h 40 15 1
h 35 5 0
h 45 20 1
h 55 35 1
h 45 0 0
h 35 no no 0 0
h 38 no no 0 0
h 67 no no 0 0
h 45 no no 0 0
h 48 no no 0 0
h 56 no no 0 1
h 45 no no 0 0
h 47 ex 25 1
h 55 ex 10 0
h 45 ex 30 1
h 49 ex 20 1
h 64 28 1
h 40 15 1
h 35 5 0
h 45 20 1
h 55 35 1
h 45 no no 0 0
h 35 no no 0 0
h 38 no no 0 0
h 67 no no 0 0
h 47 ex 25 1
h 55 ex 10 0
h 45 ex 25 1
h 49 ex 20 1
h 64 40 1
h 40 15 1
h 35 5 0
h 45 20 1
h 47 ex 25 1
h 55 ex 10 0
h 47 ex 30 1
h 51 ex 20 1
h 64 45 1
h 40 15 1
h 35 5 0
h 44 20 0
h 47 no no 0 0
h 48 no no 0 0
h 56 no no 0 1
h 46 no no 0 0
h 56 no no 0 0
h 56 no no 0 1
h 35 7 0
m 45 10 0
m 47 ex 12 0
m 55 ex 10 0
m 45 ex 15 1
m 28 5 0
m 45 20 1
m 55 12 1
m 45 no no 0 0
m 35 no no 0 0
m 27 no no 0 0
m 67 no no 0 0
m 45 no no 0 0
m 35 5 0
m 56 8 0
m 55 12 1
m 55 no no 0 0
m 41 no no 0 0
m 48 no no 0 0
m 77 no no 0 0
m 54 no no 0 0
m 40 6 0
m 50 10 0
m 66 14 1
m 69 no no 0 0
m 44 no no 0 0
m 44 no no 0 0
m 73 no no 0 0
m 54 no no 0 0
m 54 no no 0 0
m 41 5 0
m 51 13 0
m 61 12 1
m 51 no no 0 0
m 41 no no 0 0
m 44 no no 0 0
m 73 no no 0 0
m 41 5 0
m 51 20 1
m 61 10 1
m 51 no no 0 0
m 41 no no 0 0
m 44 no no 0 0
m 73 no no 0 0
m 51 no no 0 0
m 54 no no 0 0
m 62 no no 0 1
m 51 no no 0 0
m 53 ex 15 1
m 61 ex 10 0
m 62 no no 0 1

Preguntas:

1. ¿Existe asociación estadísticamente significativa entre la variable Sexo y la variable Fumador?

2. ¿Existe asociación estadísticamente significativa entre la variable Haber fumado y la variable Bronquitis crónica? Si existe asociación significativa, calcular la Odds ratio.

3. ¿Existe asociación estadísticamente significativa entre la cantidad de tabaco fumado acumulado en los fumadores y en los ex-fumadores y tener o no el diagnóstico de Bronquitis crónica? Calcular la Odds ratio.

4. ¿Existen diferencias estadísticamente significativas entre los niveles de tabaco fumado acumulado y el ser fumadores activos o ex-fumadores?

5. ¿Existen diferencias significativas entre los niveles de tabaco fumado acumulado en los dos sexos?

6. ¿Existe una correlación significativa entre la variable Edad y la variable Tabaco acumulado?