Archivos Mensuales: junio 2014

Soluciones Situación 67

1c: La correlación de la respuesta “a” no es significativa, porque en su intervalo de confianza está incluido el 0. Las otras tres, sí son correlaciones signficativas. De esas tres la corrrelación con mayor magnitud, con valor absoluto mayor es -0.7.

2a: Las cuatro Odds ratio son significativas pero la que indica mayor relación es la OR=0.1. Ésta OR es equivalente a 10, que es mayor que 8, que 5 y que 4, que es la equivalente de 0.25.

3c: El Error estándar es 10/raiz(400); o sea, 0.5. Dos veces 0.5 es 1. Por lo tanto, 40 más menos 1 dan lugar al intervalo (39,41).

4c: La variable es continuda, las muestras son relacionadas. La variable diferencia se ajusta a la distribución normal porque el p-valor del test de Shapiro-Wilk es superior a 0.05. Por lo tanto, el test a aplicar es el test de la t de Student de datos apareados.

5d: De la asimetría y curtosis estandarizadas deducimos que la muestra no se ajusta a la distribución normal, luego ni la mediana muestral no tiene por qué ser igual a la media, ni podremos construir los intervalos tal como lo solemos hacer con la distribución normal ni tampoco podremos de forma pautada establecer los percentiles si previamente no los hemos calculado a la muestra. Por lo tanto, ni la respuesta “a”, ni la “b”, ni la “c” son correctas.

6d: La correlación que nos dan aunque grande no es significativa. Debemos tener un tamaño de muestra pequeño. Para saber si es éste el signo de la correlación y la magnitud no nos queda otro remedio que aumentar el tamaño de muestra.

7d: Si en una técnica de comparación el p-vaor es menor que 0.05 las medias poblacionales sí son distintas significativamente.

8a: En el intervalo de confianza del 95% (1.9, 3.1) no tenemos incluido al 1, por lo tanto se trata de una relación significativa.

9d: Un intervalo de confianza del 99% será mayor, de más amplitud, que uno del 95%. Recordemos lo que sucede al contruir intervalos de confianza de una variable con distribución normal: Más menos una DE crea un intervalo del 68.5%, más menos dos DE lo crea del 95%, más menos 3 DE crea uno del 99.5%. Cada vez más amplio y con más valores en su interior.

10d: El primer cuartil es el promedio entre -7 y 1, que es -3.

 

Situación 67: Examen (Temas 1-5, 8, 9, 13 y 14)

1. ¿Qué correlación es mayor?

a. r= 0.75 (IC 95%: (-0.1, 0.99)

b. r= 0.5 (p<0.05)

c. r= -0.7 IC 95%: (-0.99, -0.2)

d. r= 0.3 (p<0.05)

2. ¿Qué Odds ratio es mayor; o sea, cuál indica más relación entre dos variables dicotómicas?

a. 0.1 ( IC 95%: (0.001, 0.2)

b. 8 (p<0.05)

c. 0.25 (p<0.05)

d. 5 ( IC 95%: (2, 15.5)

3. Si una muestra de tamaño 400, que se ajusta bien a una distribución normal, tiene una media muestral de 40 y una desviación estándar de 10, un intervalo de confianza del 95% de la media poblacional sería:

a. (38, 42)

b. (0, 80)

c. (39, 41)

d. (39.5, 40.5)

4. Estamos estudiando dos posibles nuevos productos alimentarios. Para hacer un estudio de mercados se toma una muestra de 50 personas y se divide en dos grupos de 25 cada uno. Cada persona de los dos grupos prueba los dos productos. La diferencia entre ambos grupos es únicamente en el orden de degustación. Los degustadores puntúan el producto entre el 0 y el 10. Con los valores obtenidos de esa variable resta de ambas puntuaciones encuestado a encuestado se aplica el Test de Shapiro-Wilk resultando un p-valor superior a 0.05. El Test a aplicar para comparar ambos productos será:

a. El Test de la t de Student de varianzas desiguales si el Test de Fisher-Snedecor nos da un p-valor inferior a 0.05..

b. El Test de la t de Student de varianzas iguales si el Test de Fisher-Snedecor nos da un p-valor inferior a 0.05.

c. El Test de la t de Student de datos apareados.

d El Test de McNemar.

5. En una muestra con una variable cuantitativa con Asimetría estandarizada igual a 7.23 y Curtosis estandarizada de -12.98, con media igual a 120 y desviación estándar igual a  10, podemos afirmar:

a. La mediana muestral es 120.

b. Que el 95% de la población, aproximadamente, tiene valores entre 100 y 140.

c. Que el percentil 95 es 140.

d. Ninguna de las tres afirmaciones anteriores es cierta.

6. Si entre dos variables tenemos una correlación de Pearson: r=-0.76 (p>0.05), podemos afirmar lo siguiente:

a. Existe correlación significativa porque el p-valor es superior a 0.05.

b. No es significativa porque las correlaciones negativas nunca pueden ser significativas.

c. El tamaño muestral debe ser muy grande para tener ese p-valor asociado con esa correlación.

d. Si queremos comprobar si hay relación entre esas variables, de qué signo es y de qué magnitud es, necesitamos aumentar el tamaño de muestra.

7. ¿Qué afirmación, entre las siguientes, no es cierta?:

a. Cuanta menos dispersión tenemos en dos grupos a comparar menos tamaño de muestra necesitaremos para encontrar diferencias significativas.

b. Cuanta más diferencia haya entre las medias muestrales de dos grupos a comparar menos tamaño de muestra necesitaremos para detectar significación estadística.

c. En una técnica estadística de comparación de dos poblaciones aplicada a dos muestras con medias muestrales iguales, el p-valor será mayor que 0.05.

d. Si el p-valor en una comparación de dos poblaciones es menor de 0.05 entonces las dos medias poblacionales no son distintas significativamente.

8. ¿Qué afirmación, entre las siguientes, es cierta?:

a. Si la Odds ratio entre dos variables dicotómicas nos da un intervalo de confianza del 95% (1.9, 3.1) se trata de una relación significativa porque el intervalo no contiene al 1.

b. Si el valor del estadístico de la ji-cuadrado es menor que 0 rechazamos la Hipótesis nula de independencia de las variables cualitativas.

c. Una correlación de Pearson entre dos variables cuantitativas con intervalo de confianza del 95% (0.05, 0.85) no es una correlación significativa porque no contiene al 0.

d. Una correlación de Pearson es significativa si el tamaño de muestra es superior a 30.

9. ¿Cuál de las siguientes afirmaciones es cierta?

a. Un intervalo de confianza del 95% de una Odds ratio que incluye al 0 es significativa.

b. Una correlación de Pearson mayor que 0.5 es significativa.

c. Cuanto mayor es el tamaño de muestra de dos poblaciones a comparar más difícil es ver diferencias significativas entres sus medias poblacionales.

d. Un intervalo de confianza del 99% tendrá una longitud de intervalo mayor que uno del 95% de confianza.

10. Sea la muestra (-7, -7, 1, 1, 3, 3, 3, 7). Podemos afirmar:

a. El rango es 7.

b. La mediana es 1.

c. El rango intercuartílico es 14.

d. El primer cuartil es -3.

 

Situación 66: Trabajo para ciencias sociales y humanas

Estos son los datos de las distribuciones porcentuales de licenciados, en el año 2010, distribuidos según ámbito de estudio, en los siguientes estados:

Estado    Educación Humanidades    Ciencias sociales    Ciencias puras    Ingeniería    Agricultura    Ciencias salud    Servicios
Bélgica 12,7 11,5 31,7 5,3 11,3 2,4 23 2
Bulgaria 5,5 6,8 51,6 4,7 15,2 1,9 6,7 7,6
República Checa 15,6 7,7 35,1 9,5 14,6 3,6 9,2 4,7
Dinamarca 7,6 13,2 32,7 8,3 11,1 1,6 22,6 2,9
Alemania 9,3 16,5 22,4 12,7 13 1,5 21,6 3
Estonia 7,7 12,8 37,6 9,8 10,7 1,9 11 8,5
Irlanda 8,8 12,4 31,9 11,6 12,5 1,4 16,2 5,3
Grecia 8,8 13,2 30,3 12,1 15,4 4,6 12,6 3,1
España 14,5 8,7 26,8 8,7 16,2 1,7 15,4 8
Italia 6 17,1 33,5 7,4 15,3 1,5 16 3,2
Chipre 10,7 10,1 49 6,9 6,4 0,1 7,6 9,2
Letonia 8,3 7,2 54,4 5 9,3 0,9 9,3 5,7
Lituania 11,5 7,2 45,8 5 16,2 1,9 9,6 2,9
Hungría 11,5 12,5 39,9 6,8 8,8 2,4 8,9 9,2
Malta 10,5 18,9 38,3 9,4 6,9 0,5 12,6 2,9
Países Bajos 13,5 9 37,8 6,2 7,9 1,5 18,8 5,3
Austria 12,1 8,6 34 9,8 19,3 1,8 10,9 3,5
Polonia 16,4 8,1 42,8 6,9 9 1,7 8,9 6,2
Portugal 8,7 8,2 29,3 6,5 18,3 1,6 20,8 6,5
Rumanía 1,5 8,3 60 4,8 12,3 1,6 8,8 2,7
Eslovenia 7,5 6,2 44,3 5,5 15,6 2,8 8,7 9,4
Eslovaquia 13,7 6,6 31,9 7,9 12,9 1,9 19,2 5,9
Finlandia 6,1 13,4 23 7,8 24 2,2 18,4 5,1
Suecia 14,8 6,3 24,1 7,4 18,4 1,1 24,9 3,1
Reino Unido 11,1 15,9 31,2 12,9 9,7 0,9 16,9 1,5
Islandia 20,4 10,3 36,9 6,6 9,1 0,5 15,1 1,2
Noruega 17,7 8,6 29,4 7,1 8,9 0,8 22,6 4,9
Suiza 9,9 8,2 37,4 7,5 12,3 1,9 15,6 7,2
Croacia 4,8 11,9 44,2 7,8 12,3 3,5 6,9 8,7
Macedonia 10,2 13,5 37,7 11,6 7,7 2,3 10,6 6,3
Turquía 11,8 8,2 44,8 7 13,3 4,5 5,9 4,6

Plantea posibles estudios donde aplicar diferentes técnicas estadísticas vistas durante el curso para tratar de organizar y sacarle el máximo provecho posible a estos datos.

Solución Situación 66

Una Estadística descriptiva de estas variables cuantitativas es la siguiente:

20140615-103231.jpg

Si hacemos una Análisis de componentes principales vemos que con las dos primeras componentes explicamos el 52,9% de la información y con tres el 71,45%:

20140615-103244.jpg

Los coeficientes de las tres primeras componentes son los siguientes:

20140615-103252.jpg

Como puede verse en la primera componente diferenciamos estados con con peso alto en Ciencias sociales y Servicios y peso bajo en Ciencias puras, Ciencias de la Salud y Humanidades de estados con lo contrario: peso bajo en Ciencias sociales y Servicios y peso alto en Ciencias puras, Ciencias de la Salud y Humanidades. En la segunda componente contrastamos estados con peso alto en Educación y bajo en Ciencias puras, Ingeniería y Agricultura con estados con lo contrario: peso bajo en Educación y alto en Ciencias puras, Ingeniería y Agricultura.

Observemos la posición de los Estados en un gráfico de las dos primeras componentes principales:

20140615-103259.jpg

Finalmente, un cuadro con todas las correlaciones entre estas variables cuantitativas:

20140615-103306.jpg

Solución Situación 65

1b: Las dos Odds ratio son significativas. Una mayor que 1 (factor de riesgo) y otra menor que 1 (factor de protección.

2c: El primer cuartil es 5 (promedio de 3 y 7) y el tercer cuartil es 22. Entonces 22-5=17.

3b: El Error estándar es 5/raíz(100)=0.5. La media más menos dos EE es (19, 21).

4b: El radio del intervalo es 5. Como es un intervalo del 95% el EE=2.5, porque el radio del intervalo es dos veces el EE. Tenemos, pues, la siguiente igualdad: 2.5=10/raíz(n). Luego, para que se cumpla la igualdad n debe ser 16.

5c: Un coeficiente de determinación menor del 50% implica una precisión en los pronósticos muy mala y, por lo tanto, inaceptable.

6a: Sólo las dos primeras Odds ratio son significativas. Una OR de 10 es mayor que 0.2 porque 10 es equivalente a 0.1 y 0.2 es equivalente a 5.

7c: La V de Crámer en ningún caso puede tener valores inferiores a 0. El valor más bajo posible es 0.

8c: El valor de la ji-cuadrado en ningún caso puede ser negativa. El mínimo posible es 0. Valor que se daría si la tabla de contingencia observada y esperada fueran iguales.

9d: Dispersión y tamaño de muestra tienen una relación directa. Si tenemos más dispersión, hay más incertidumbre y necesitaremos más tamaño de muestra para ver diferencias significativas.

10c: Estamos hablando de una variable cuantitativa, de muestras independientes y ninguna de las dos se ajusta a la distribución normal (el p-valor del Test de Shapiro-Wilk es menor que 0.05 y hay que recordar a que en un test de ajuste a la normal la hipótesis nula es que existe ajuste a la distribución normal). Por lo tanto, el Test adecuado al caso es el Test de Mann-Whitney.

11b: Estamos hablando de una variable dicotómica (superar o no dicho umbral), de dos muestras independientes. Por tamaño de muestra y por valor esperado por grupo estamos bajo las condiciones de aplicación del Test de proporciones.

12d: Una correlación de Pearson puede darse acompañada de un intervalo de confianza del 95%, como sucede en cualquier pronóstico. Este intervalo de confianza lleva implícito un mecanismo que proporciona la significación estadística de esa correlación. El criterio es el siguiente: si el intervalo contiene al 0 la correlación no es significativa. Si el intervalo no contiene al 0 la correlación es estadísticamente significativa.

13a: Por supuesto que puede suceder que en un ANOVA de dos factores cruzados ninguno de los dos factores sea significativo y la interacción sí lo sea.

14c: Las comparaciones múltiples se aplican cuando se ha rechazado la hipótesis nula de igualdad de niveles de un factor en un ANOVA. Sólo en este caso tiene sentido aplicarlas esas comparaciones. Con ellas sabremos el motivo del rechazo de la hipótesis de igualdad.

15bc: (Disculpad, revisando el examen he comprobado que en esta pregunta hay dos correctas, por lo tanto, cualquiera que haya contestado a cualquiera de las dos la tiene bien, evidentemente) Si un consumo de droga tiene una Odds ratio de 5, el no consumirla tiene una Odds ratio de 0.2. El valor de 5 y de 0.2 son equivalentes. Uno al lado del riesgo y el otro al lado de la protección. Bastaría cambiar los datos de la tabla de contingencias colocando como exposición el no consumo de esa droga para obtener esa Odds ratio de 0.2.

Como la Odds ratio es 5 y es significativa un intervalo de confianza del 95% sólo tendrá valores superiores a 1, porque para ser significativa una Odds ratio dicho intervalo de confianza no debe contener al 1.

16a: Tenemos que aplicar esta ecuación, pero como el intervalo de confianza es del 68.5% la k en este caso valdrá 1. Vale 2 si el intervalo de confianza es del 95% y 3 si el intervalo de confianza es del 99.5. Luego, si la K=1 y la r=1 al despejar la n nos quedará que n es igual al cuadrado de la DE y como DE=10, entonces n=100:

IMG_4906

17d: Por definición por encima del tercer cuartil de una muestra tenemos en la población aproximadamente el 25% de personas. Como no hay ajuste a la distribución normal la expresión de la afirmación a es incorrecta.

18d: Si una correlación es significativa también lo es la pendiente de la recta de regresión que construyamos con esa variable. Lo mismo: si una correlación no es significativa tampoco lo será esa pendiente. Son equivalentes ambos contrastes de hipótesis.

19b: Estamos construyendo un intervalo de confianza del 99.5%, lo que se consigue sumando y restando a la media 3 errores estándar. Por lo tanto, el error estándar es 1/3. Y como sabemos que EE=DE/raíz(n), tenemos la ecuación 1/3=DE/raíz(900). DE es igual a 10.

20d: El número de componentes generadas es el mismo que el número de variables originales. No tienen por qué ser positivos siempre los coeficientes de la primera componente. Si las variables son independientes el Análisis de componentes principales no nos aporta prácticamente nada. Y es cierto que si dos variables tienen fuerte correlación negativa en la primera componente saldrán con coeficientes grandes y de signo contrario. Ver, por ejemplo, en el Tema 17 el ejemplo de los datos meteorológicos: Temperatura y altitud de las comarcas tienen, lógicamente, una fuerte correlación negativa. Observad que en la primera componente sucede lo apuntado anteriormente: Coeficientes grandes y con signo distinto.

Situación 65: Examen (Temas 1-17)

1. Sabemos que los homocigotos e4 para el gen APOE que codifica la Apoproteína E tienen una asociación con la enfermedad de Alzhéimer cuantificada mediante una Odds ratio de 5.5 (IC 95%: (4.23, 7.18)) y que los homocigotos e2 tienen una Odds ratio de 0.32 (IC 95%: (0.18, 0.45)). Es cierto lo siguiente:

a. Que para saber si la asociación es significativa nos faltaría hacer un contraste de hipótesis y tener un p-valor.

b. Que ser homocigoto e4 para ese gen es un factor de riesgo y ser homocigoto e2 es un factor de protección, respecto a la enfermedad de Alzhéimer.

c. Que no existe asociación porque los intervalos de confianza no incluyen al 1.

d. Que necesitamos saber el tamaño de muestra para saber si esta asociación es o no significativa.

2. En la muestra (-8, 3, 7, 11, 15, 22, 22, 22):

a. La mediana es 15.

b. El rango es 22.

c. El rango intercuartílico es 17.

d. El primer cuartil es 3.

3. Un intervalo de confianza del 95% de la media en una muestra con media muestral 20, desviación estándar 5 y tamaño muestral de 100 es:

a. (10, 30).

b. (19, 21).

c. (19.5, 20.5).

d. (18.5, 21.5).

4. Un intervalo de confianza del 95% de la media que sea (95, 105) que proceda de una muestra con media muestral 100 y desviación estándar 10, tiene un tamaño muestral de:

a. 4.

b. 16.

c. 25.

d. 100.

5. De una correlación r=0.45 (p=0.002), podemos decir:

a. El tamaño muestral es muy pequeño porque la correlación es pequeña.

b. No podemos decir que haya relación significativa entre las variables comparadas porque el coeficiente de determinación R2 es menor del 50%.

c. No podremos predecir con una precisión aceptable el valor de una variable a partir de la otra, mediante una Regresión, porque el coeficiente de determinación R2 es menor del 50%.

d. No existe correlación entre estas variables porque el p-valor es menor que 0.05.

6. ¿Cuál de las siguientes relaciones indica una relación más fuerte entre las dos variables cualitativas?

a. OR=10 (IC 95%: (8, 25)).

b. OR=0.2 (IC 95%: (0.04, 0.35)).

c. OR=25 (IC 95%: (0.8, 145)).

d. OR=0.9 (IC 95%: (0.85, 0.92)).

7. ¿Cuál de las siguientes afirmaciones no es cierta?

a. El Kappa puede ser usado como una medida del grado de concordancia entre dos observadores.

b. El Kappa tiene como valor máximo el 1.

c. La V de Crámer puede tener valores incluso negativos en casos de poca relación entre las variables.

d. Si la tabla de contingencias observada y la tabla de contingencias esperada son iguales entonces la V de Crámer valdrá 0.

8. ¿Cuál de las siguientes afirmaciones no es cierta?

a. Si una ji-cuadrado nos proporciona un p-valor menor que 0.05 indica que hay una relación significativa entre las dos variables cualitativas.

b. Si la tabla de contingencias observada y la esperada son idénticas el p-valor es 1.

c. Entre dos variables cuantitativas una ji-cuadrado negativa indica una relación inversa entre las variables.

d. Una correlación negativa y significativa entre dos variables cuantitativas va seguida de una regresión lineal simple con pendiente negativa y significativa.

9. Respecto a la comparación de poblaciones es cierto:

a. Cuanto menor tamaño de muestra tenemos más dispersión necesitamos para poder encontrar una diferencia de medias significativa.

b. Cuanta menor dispersión tenemos en las muestras más diferencia de medias necesitamos para poder encontrar una diferencia de medias significativa.

c. Cuanto más tamaño de muestra tenemos más diferencia de medias necesitamos para poder encontrar una diferencia de medias significativa.

d. Cuanto mayor dispersión tenemos mayor tamaño de muestra necesitamos para encontrar una diferencia de medias significativa.

10. Hemos de comparar dos procedimientos distintos de tratamiento para pacientes con demencia. Tomamos 100 pacientes y los repartimos al azar en dos grupos de 50 cada uno. La variable elegida para evaluar ambos tratamientos es el Mini-Mental. El Test de Shapiro-Wilk nos da, en ambas muestras, un p-valor inferior a 0.05. Debemos:

a. Aplicar el Test de Fisher-Snedecor de comparación de varianzas para saber si hemos de aplicar el Test de la t de Student de varianzas iguales o el Test de la t de Student de varianzas diferentes.

b. Aplicar directamente el Test de la t de Student de varianzas iguales sin hacer previamente el Test de Fisher-Snedecor.

c. Aplicar el Test de Mann-Whitney.

d. Aplicar el Test de la t de Student de datos apareados.

11. Hemos de comparar dos formas de rehabilitación psicológica a pacientes que han sufrido un infarto cerebral. La variable analizada es si después de un año el paciente consigue superar un umbral previamente establecido en un test psicotécnico. Se ha trabajado con 200 pacientes. 100 en cada grupo. Cada paciente recibe un único tratamiento. Después del año en un grupo un 40% consigue la rehabilitación psicológica. En el otro grupo un 50% lo consigue. Debemos:

a. Aplicar un Test de Mann-Whitney.

b. Aplicar un Test de proporciones.

c. Aplicar un Test exacto de Fisher.

d. Como entre un 50% y un 40% hay una diferencia superior al 5%, que en tanto por 1 es igual a 0.05, se trata de una diferencia estadísticamente significativa.

12. ¿Cuál de las siguientes afirmaciones es cierta?

a. Como el Test de Mann-Whitney no necesita del ajuste a la normal el criterio de decisión en él no es mediante un contraste de hipótesis.

b. En un contraste de hipótesis para evaluar el ajuste a la distribución normal la hipótesis alternativa parte como cierta inicialmente.

c. El contraste de hipótesis al trabajar y evaluar una Odds ratio tiene como hipótesis nula: OR=0.

d. La significación en una correlación de Pearson puede darse mediante un intervalo de confianza.

13. En un ANOVA es cierto:

a. Si hay dos factores cruzados podemos tener interacción significativa y que ninguno de los dos factores, individualmente, sea significativo.

b. El número de factores es el mismo al número de niveles de cada factor.

c. Si hay un único factor la interacción se interpreta entonces como relación entre niveles.

d. Si hay dos factores cruzados y los dos factores son significativos la interacción también será significativa.

  1. ¿Cuál de las siguientes afirmaciones es cierta?

a. En un ANOVA de dos factores cruzados con cuatro y tres niveles, respectivamente, el número de condiciones experimentales diferentes del estudio es de (4-1)x(3-1)=6.

b. La interacción entre dos factores indica que los niveles de cada uno de los factores son distintos significativamente en las comparaciones múltiples.

c. Las comparaciones múltiples en un factor únicamente tiene sentido realizarlas si el p-valor del ANOVA previo, para ese factor, es inferior a 0.05.

d. En un ANOVA de dos factores cruzados no es posible tener un p-valor para la interacción de factores.

15. Estamos tratando de asociar el consumo de una determinada droga con un determinado trastorno psiquiátrico. Nos dicen que la Odds ratio entre los consumidores de esa droga es de 5, y que es significativa. Podemos afirmar:

a. Que un intervalo de confianza del 95% de la Odds ratio contiene al 1.

b. Que la Odds ratio asociada al no consumo de esa droga es de 0.2.

c. Que un intervalo de confianza del 95% de la Odds ratio sólo tiene valores superiores a 1.

d. Que la ji-cuadrado previa ha dado un p-valor superior a 0.05.

16. Se quiere hacer un pronóstico de la media poblacional de la concentración de un determinado neurotransmisor. ¿Qué tamaño de muestra necesitamos tomar para tener un intervalo del 68.5% de radio 1 si la Desviación estándar que tenemos en una muestra piloto es de 10?:

a. 100.

b. 1000.

c. 400.

d. 250.

17. Nos dicen que la concentración de dopamina en pacientes con Parkinson de menos de 3 años de evolución tiene una media de 20, una mediana de 15, una desviación estándar de 20, un primer cuartil de 5 y un tercer cuartil de 22, una curtosis estandarizada de 13.45 y una asimetría estandarizada de -52.24. ¿Cuál de las siguientes afirmaciones es correcta:

a. Una representación adecuada de esta muestra es 20±20.

b. Una representación breve adecuada de esta muestra es 15±20.

c. Por encima de 5 tenemos aproximadamente el 50% de la población de los pacientes de Parkinson de menos de 3 años de evolución.

d. Por encima de 22 tenemos aproximadamente el 25% de la población de los pacientes de Parkinson de menos de 3 años de evolución.

18. En una Regresión lineal simple es cierto:

a. Si la R2 es superior a 50% tenemos una relación estadísticamente significativa entre las variables de la regresión.

b. Si la pendiente de la recta presenta un intervalo de confianza del 95% como el siguiente: (-3.35, -0.18), la R2 será mayor que el 50%.

c. Si un intervalo de confianza del 95% de la pendiente de la recta incluye al 1 no es una pendiente significativa.

d. Si un intervalo de confianza del 95% de la pendiente de la recta no incluye al 0 entonces un intervalo de confianza del 95% de la correlación de Pearson de esas variables tampoco incluirá al 0.

19. Se quiere hacer un pronóstico de la media poblacional de la concentración de un determinado neurotransmisor. Se determina, finalmente, que para el nivel de precisión requerido y para la Desviación estándar que se ha previsto, necesitamos una n=900. El intervalo del 99.5% obtenido es (8, 10). La Desviación estándar era:

a. 15.

b. 10.

c. 20.

d. 25.

20. En un Análisis de componentes principales es cierto:

a. El número de componentes generadas en el análisis es menor que el número de variables originales.

b. Los coeficientes de la primera componente son siempre positivos.

c. Si las variables son independientes entre ellas, el Análisis de componentes principales nos aporta una muy buena reducción de dimensiones.

d. Dos variables que tienen una muy fuerte correlación negativa entre sí tendrán coeficientes grandes y con signo distinto en la primera componente principal.