Solución Situación 50

1. Las correlaciones entre las tres variables cuantitativas que tenemos son las siguientes:

IMG_7580

Como puede observarse se trata de tres correlaciones significativas. El p-valor, en los tres casos, es menor que 0.05. Hay una correlación positiva (entre el Tiempo de visualización y el Número de paradas) y hay dos correlaciones negativas (entre Tiempo de visualización y Velocidad y entre Velocidad y Número de paradas). Correlaciones que, si las pensamos un poco, son lógicas.

2. La regresión lineal simple entre la variable Número de paradas y la variable Tiempo de visualización nos proporciona un gráfico como el siguiente:

IMG_7581

La estimación de los parámetros del modelo (La pendiente y la ordenada en el origen) son los siguientes:

IMG_7582

Con este modelo podemos predecir el número de paradas en función del tiempo de visualización. Con una R cuadrado del 71.44%, que es bastante buena.

3. Al relacionar las variables cualitativas Sexo y Relacionado con el mundo del Arte obtenemos la siguiente tabla de contingencias:

IMG_7584

La ji-cuadrado aplicada a esta tabla de contingencias es la siguiente:

IMG_7583

Por lo tanto, como el p-valor es superior a 0.05 no podemos decir que haya relación entre ambas variables.

4. Para resolver este problema debemos hacer una Regresión logística simple de la variable dicotómica “Relacionado con el mundo del Arte” con cada una de las variables cuantitativas que tenemos. Evidentemente se podría hacer también una Regresión logística múltiple y ver con un Stepwise cuál es el modelo final elegido. Pero vamos a hacer aquí, porque nos irá bien a efectos didácticos, tres regresiones logísticas simples y seleccionaremos la que nos ajuste un modelo más predictivo.

Veamos primero la relación con la variable Tiempo de visualización:

IMG_7585

Y hecho con otro software que nos dibuja la Regresión logística obtenemos esta salida de ordenador:

IMG_7589

Es interesante comprobar que, aunque los resultados fundamentales son paralelos, son los mismos, la salida de ordenador que nos proporciona cada software tiene su singularidad. Por ejemplo, la del primer software (El G-Stat 2.0) nos da una algo peculiar: una prueba de clasificación. Aplica el criterio creado con esta muestra para establecer una clasificación entre los dos tipos de variable dependiente dicotómica a la muestra que, en realidad, ya sabe qué valor tiene cada individuo de esa variable respuesta. De esta forma puede comparar lo que haría con lo verdadero y, así, establecer una calidad de clasificación. En este caso nos da una buena clasificación del 85%.

El segundo software (El Statgrafics) nos ofrece algo muy visual: el gráfico. El gráfico donde se ven donde quedan los valores muestrales y cuál sería la curva construida como probabilidad de predicción de cada uno de los dos estados posibles de la variable dependiente dicotómica.

Es bueno combinar diferentes softwares, si es posible, porque cada uno tiene sus elementos de interés que nos ayuda a perfilar las conclusiones finales.

Veamos ahora la relación con la variable Velocidad media del ojo:

IMG_7586

Y con el otro software:

IMG_7590

Y, finalmente, veamos la relación con la variable Número de paradas:

IMG_7588

Y con el otro software:

IMG_7591

Es interesante comprobar que se trata de una elección no clara. Las tres variables pueden ser usadas como predictoras. Las tres tienen una relación significativa con la variable dicotómica “Relacionado con el Arte”.

Si elegimos por la calidad de la clasificación debemos elegir la variable independiente “Velocidad media del ojo”. Si elegimos por la prueba de la verosimilitud debemos elegir, en este caso, la variable “Tiempo de visualización”.

En todo caso estamos en una situación difícil donde ambas variables podrían ser elegidas. Están en una posición muy paralela. De hecho, es lógico que sea así, el que la correlación entre ellas sea tan grande lo que indica es que en gran parte son variables intercambiables.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s