Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1.1. El proceso por el cual se asignan números a objetos o características según determinadas
reglas se denomina: A) muestreo; B) estadística; C) medición.
1.2. Mediante la Estadística Descriptiva se organizan y resumen conjuntos de observaciones
procedentes de: A) muestras exclusivamente; B) muestras aleatorias exclusivamente;
C) muestras o poblaciones totales
1.3. La estadística inferencial: A) permite analizar descriptivamente la muestra bajo estudio; B) no
tiene en cuenta las leyes de probabilidad; C) permite realizar generalizaciones a la población
con una muestra
1.4. Un estadístico: A) se puede utilizar para estimar algún parámetro de la población; B) adopta
el mismo valor en cada muestra; C) coincide con el parámetro cuando el muestreo es
probabilístico
1.5. La variable Género, con las categorías Hombre y Mujer, está medida en una escala: A) de
razón ; B) ordinal ; C) nominal
1.8. La variable tipo de trastorno psicológico puede adoptar los valores depresión y trastorno de
personalidad. ¿Qué nivel de medida presenta? A) Nominal; B) Ordinal; C) De razón
1
INTRODUCCIÓN AL ANÁLISIS DE DATOS
1.11. Para que tenga sentido calcular las frecuencias acumuladas de una variable, ésta debe ser,
como mínimo: A) nominal; B) ordinal; C) de intervalo.
1.12. En la Tabla 2, la variable “grupo” es: A) de intervalo; B) nominal; C) politómica
1.13. En la Tabla 2, la frecuencia absoluta del intervalo 4-8 del grupo clínico es: A) 33; B) 17;
C) 11
Tabla 2: Distribución de frecuencias relativas en un cuestionario de depresión aplicado a 300 personas del
grupo “clínico” (enfermos) y a 200 del grupo “no clínico” (sanos).
pi
X
Grupo clínico Grupo no clínico
24-28 0,32 0,08
19-23 0,24 0,25
14-18 0,19 0,34
9 -13 0,14 0,23
4-8 0,11 0,10
1.14. El número de sujetos de una muestra que realizaron correctamente una tarea de discriminación
en un experimento psicofísico es 80, lo que representa el 40% de la muestra. ¿Cuál el número
de sujetos de la muestra? A) 200; B) 320 ; C) 500
1.15. En la Situación 1, el número de sujetos con edades comprendidas entre 20,5 y 23,5 es A) 22;
B) 50; C) 100
Situación 1. La gráfica muestra la distribución de la edad (X) de los 250 sujetos de una investigación. En el
eje horizontal, se recogen los límites exactos de los intervalos de X y en el eje vertical la frecuencia
absoluta acumulada (na)
2
INTRODUCCIÓN AL ANÁLISIS DE DATOS
Figura 2: Número de conductas obsesivas observadas durante un día, en una muestra de n enfermos
1.20. En una escala de intervalo se han asignado a tres sujetos los valores X=0, X=3, y X=6. Con
esta escala es correcto afirmar que: A) el tercer sujeto con X=6 tiene el doble de la variable
medida que el segundo sujeto con X=3; B) el primer sujeto presenta carencia absoluta de
variable medida; C) la diferencia entre X=0 y X=3 es la misma que entre X=3 y X=6 en la
variable medida.
1.21. La amplitud del intervalo en la distribución de frecuencias de la Tabla 3 es: A) 5; B) 4; C) 6.
3
INTRODUCCIÓN AL ANÁLISIS DE DATOS
1.22. La variable número de asignaturas matriculadas en la UNED según los datos proporcionados
en la Situación 2 es: A) de intervalo; B) de razón; C) continua
1.23. ¿Qué distribución de frecuencias de la Situación 2 está agrupada en intervalos de amplitud 2?
A) La distribución 1; B) La distribución 2; C) La distribución 3.
1.24. ¿Cuáles son los límites exactos del intervalo aparente 32,74 - 32,75? A) 32,73 - 32,76;
B) 32,735 - 32,755; C) 32,745 - 32,755.
4
INTRODUCCIÓN AL ANÁLISIS DE DATOS
SOLUCIONES
1.1. C
1.2. C
1.3. C
1.4. A
1.5. C
1.6. C
1.7. A
1.8. A
1.9. B
1.10. A
Dado que se trata de un diagrama de barras acumulativo, el nº de familias con un nivel alto
de poder adquisitivo será 45-40=5
1.11. B
1.12. B
1.13. A
ni npi 300 0,11 33
1.14. A
ni = 80 pi = 0,40
pi = ni / n n = ni / pi
n = 80 / 0,40 = 200
1.15. B
Dado que se trata de un histograma acumulativo, el nº de sujetos con edades comprendidas
entre 20,5 y 23,5 es 100-50 =50
Límites exactos ni na
29,5 – 32,5 50 250
26,5 – 29,5 50 200
23,5 – 26,5 50 150
20,5 – 23,5 50 100
17,5 – 20,5 50 50
1.16. B
La diferencia entre cada dos puntos medios consecutivos es 3 por lo que la amplitud de los
intervalos es 3.
1.17. C
n = 10 + 20 + 70 + 60 + 30 + 10 = 200
1.18. C
5
INTRODUCCIÓN AL ANÁLISIS DE DATOS
1.19. B
1.20. C
1.21. C
1.22. B
1.23. A
1.24. B
0,01:2=0,005
Li = 32,74 – 0,005 =32,735
Ls = 32,75 + 0,005 =32,755
1.25. A
6
INTRODUCCIÓN AL ANÁLISIS DE DATOS
2.4. La media ponderada para el total de la muestra de personas (hombres y mujeres) que han
realizado la prueba de fluidez verbal de la Tabla 1 es: A) 5,29; B) 6,52; C) 5,7.
2.5. Según los datos obtenidos en las Figuras 1 y 2, las niñas obtuvieron en media: A) más puntos
que los niños; B) los mismos puntos que los niños; C) menos puntos que los niños.
En las abscisas se muestran los intervalos aparentes del número de puntos obtenidos por cada niña o niño,
en un juego de ordenador en una hora. La Figura 1 corresponde a 15 niñas de nueve años y la Figura 2 a
10 niños de nueve años. En las ordenadas están las frecuencias de cada intervalo.
2.6. La mediana de las puntuaciones obtenidas con los datos de la Figura 1 es: A) 26,5; B) 27,0; C)
28,6.
2.7. La puntuación media total de los 25 niños (incluyendo a niños y niñas) en el juego de
ordenador es: A) 27,25; B) 27,60; C) 27,90.
1
INTRODUCCIÓN AL ANÁLISIS DE DATOS
2.8. Con los datos de la Tabla 2, ¿qué percentil Tabla 2. Distribución de frecuencias de las
le corresponde a un alumno con una puntuaciones obtenidas por 80 sujetos en un test
puntuación de 47?: A) 62; B) 75; C) 78. de inteligencia emocional. Sabemos que la
2.9. Con los datos de la Tabla 2, el valor de la desviación típica es igual a 5,86.
mediana es: A) 42; B) 44; C) 50
X ni
30-34 10
35-39 15
40-44 30
45-49 15
50-54 10
2.10. ¿Qué porcentaje de niños de 12 meses de Tabla 3. Estatura en centímetros de 100 niños de
la Tabla 3 tienen menor estatura que un 12 meses de edad.
niño de esa edad que mide 80 Estatura Frecuencia
centímetros? A) 50; B) 90; C) 95. 79-81 10
2.11. Con los datos de la Tabla 3, ¿cuál es la 76-78 25
moda de la distribución? A) 45; B) 74; C) 73-75 45
80 70-72 20
2.12. Con los datos de la Tabla 4, el tercer cuartil de los niños de la ciudad A es igual a: A) 16; B)
14,5; C) 13,5
X Ciudad A Ciudad B
17-20 10 17
13-16 20 27
9-12 25 15
5-8 15 12
1-4 10 9
80 80
Tabla 4: Puntuaciones obtenidas en un test de aptitud numérica por dos grupos de niños de dos
ciudades distintas. Los de la ciudad A, presentan una media de 10,75, mientras que en los de la ciudad
B la desviación típica es de 5,12.
2
INTRODUCCIÓN AL ANÁLISIS DE DATOS
2.13. En la Situación 1, la
distribución de la edad de los Situación 1. La gráfica muestra la distribución de la edad (X) de
sujetos: A) no tiene moda; B) los 250 sujetos de una investigación. En el eje horizontal, se
tiene una moda; C) tiene dos recogen los límites exactos de los intervalos de X y en el eje
vertical la frecuencia absoluta acumulada (na).
modas
2.14. En la Situación 1, el 80% de
los sujetos tiene una edad
menor que: A) 26,5; B) 28;
C) 29,5
2.15. En la Situación 1, la edad
media de los sujetos es: A) 25;
B) 50; C) 150
2.18. En un test los seis primeros alumnos han obtenido las puntuaciones: 5, 10, 15, 16, 9, 10. La
mediana de estas puntuaciones es : A) 15,5; B) 10; C)15.
2.19. Con los datos de la tabla 6, la media en el Tabla 6. Distribución de frecuencias relativas en un
grupo “no-clínico” es igual a: A) 14,5; B) cuestionario de depresión aplicado a 300 personas
15,9; C) 18,3. del grupo “clínico” (enfermos) y a 200 del grupo
2.20. Con los datos de la tabla 6, una persona “no clínico” (sanos).
que ha obtenido una puntuación de 17 en
el grupo “clínico”, ¿qué porcentaje de pi
X
personas dejaría por debajo de sí?: A) G. clínico G. no clínico
38,3%; B) 44,0%; C) 25,5% . 24-28 0,32 0,08
19-23 0,24 0,25
14-18 0,19 0,34
9 -13 0,14 0,23
4-8 0,11 0,10
3
INTRODUCCIÓN AL ANÁLISIS DE DATOS
2.21. Con los datos de la tabla 7, ¿cuál de las siguientes medidas de tendencia central tendrá el
valor más alto? A) la media; B) la mediana; C) la moda.
Tabla 7. Resultados en un test de agudeza visual (X) de siete personas en una investigación sobre
la miopía.
Persona Xi
1 20
2 6
3 9
4 6
5 12
6 8
7 16
X ni
64-69 4
58-63 16
52-57 14
46-51 22
40-45 32
34-39 44
28-33 42
22-27 18
16-21 8
4
INTRODUCCIÓN AL ANÁLISIS DE DATOS
2.24. Atendiendo a los datos de la Situación 2, el tercer cuartil de la distribución 1 es: A) 5,96; B)
8,75; C) 75.
2.25. Con los datos de la Figura 3, ¿cuál es la moda de la variable trastorno psicológico?: A) 45;
B) Es amodal; C) Trastorno por estrés postraumático.
Figura 3. Trastornos psicológicos que presentan las víctimas del 11M según los resultados del
proyecto de Apoyo Psicológico a Afectados de Terrorismo.
5
INTRODUCCIÓN AL ANÁLISIS DE DATOS
SOLUCIONES
2.1. A
La moda es el punto medio del intervalo con mayor frecuencia:
4 5
Mo 4,5
2
2.2. B
2.3. B
X nM na
8-9 20 60
6-7 16 40
4-5 10 24 60·30
14
2-3 8 14 P30 3,5 100 ·2 3,5 4 ·2 3,5 0,8 4,3
0-1 6 6 10 10
60
2.4. A
Grupo ni XJ
Mujeres 60 5,7
Varones 60 4,87
120
La media total, de las 120 personas, se obtiene aplicando la fórmula de la media ponderada:
6
INTRODUCCIÓN AL ANÁLISIS DE DATOS
2.5. A
Xniñas ni Xi Xini
36-40 3 38 114
31-35
26-30
3
4
33
28
99
112 X niñas
n X i i
435
29
21-25 4 23 92 n 15
16-20 1 18 18
15 435
Xniños ni Xi Xini
36-40 1 38 38
31-35
26-30
1
2
33
28
33
56 X niños
n X
i i
255
25,5
21-25 4 23 92 n 10
16-20 2 18 36
10 255
2.6. C
X ni na
36-40 3 15
15
31-35 3 12 5
26-30 4 9 Md 25,5 2 ·5 25,5 3,125 28,625 28,6
4
21-25 4 5
16-20 1 1
15
2.7. B
Grupo ni XJ
niñas 15 29
niños 10 25,5
25
n1 X1 n2 X 2 nJ X J 15 29 10 25,5 690
Xp 27,6
n1 n2 nJ 15 10 25
7
INTRODUCCIÓN AL ANÁLISIS DE DATOS
2.8. C
Xi ni na
50-54 10 80
45-49 15 70
40-44 30 55
35-39 15 25
30-34 10 10
80
2.9. A
n 80
40 , por lo que el intervalo crítico es [40-44]
2 2
Xi ni na
50-54 10 80 n 80
45-49 15 70 nd 25
40-44 30 55 Md Li 2 ·I 39,5 2 ·5 42
nc 30
35-39 15 25
30-34 10 10
80
2.10. C
Estatura Frecuencia na
79-81 10 100
76-78 25 90
73-75 45 65
70-72 20 20
8
INTRODUCCIÓN AL ANÁLISIS DE DATOS
X ni na
17-20 10 80
13-16 20 70
9-12 25 50
5-8 15 25
1-4 10 10
80
n·k 80 75
nd 50
P75 Li 100 I 12,5 100 4 14,5
nc 20
2.13. A
Pasamos de frecuencias acumuladas a absolutas para el cálculo de la moda:
Límites exactos na ni
29,5 – 32,5 250 50
26,5 – 29,5 200 50
23,5 – 26,5 150 50
20,5 – 23,5 100 50
17,5 – 20,5 50 50
La distribución no tiene moda (es amodal) dado que todos los intervalos tienen la misma
frecuencia absoluta de ni=50.
9
INTRODUCCIÓN AL ANÁLISIS DE DATOS
2.14. C
En la gráfica de la situación 1 se observa que el 80% (n=200) de los sujetos tiene una edad
menor que X=29,5.
Límites exactos ni na
29,5 – 32,5 50 250
26,5 – 29,5 50 200
23,5 – 26,5 50 150
20,5 – 23,5 50 100
17,5 – 20,5 50 50
n·k 250 80
nd 150
P80 Li 100 I 26,5 100 3 29,5
nc 50
2.15. A
X ni Xi ni Xi
29,5 – 32,5 50 31 1550
26,5 – 29,5 50 28 1400
X
n X i i
6250
25
23,5 – 26,5 50 25 1250 n 250
20,5 – 23,5 50 22 1100
17,5 – 20,5 50 19 950
250 6250
2.16. B
Tiempo
ni na
reacción
100
381-400 10 100 40
361-380 20 90 Md 340,5 2 ·20 340,5 1 ·20 347,2
30 3
341-360 30 70
321-340 25 40
301-320 15 15
100
2.17. C.
341 360
Mo 350,5
2
10
INTRODUCCIÓN AL ANÁLISIS DE DATOS
2.18. B
Se ordenan las puntuaciones: 5, 9, 10, 10, 15, 16
Dado que n=6 es par, la mediana es el valor medio de los dos valores centrales
10 10
Md 10
2
2.19. B
X Xi pi pi X i
24-28 26 0,08 2,08
19-23 21 0,25 5,25
14-18 16 0,34 5,44 X pi X i 15,9
9-13 11 0,23 2,53
4-8 6 0,10 0,60
15,9
2.20. A
X Xi pi ni na
24-28 26 0,32 96 300
19-23 21 0,24 72 204
14-18 16 0,19 57 132
9-13 11 0,14 42 75
4-8 6 0,11 33 33
(17 13,5) 57
75
k 5
100 38,3
300
2.21. A
Las puntuaciones son: 20, 6, 9, 6, 12, 8 y 16
La media es:
X X i
77
11
n 7
Para calcular la mediana, ordenamos primero los datos de menor a mayor:
6, 6, 8, 9, 12, 16, 20
Dado que n=7 es impar, la mediana es el valor central, Md=9
La Mo=6
Por tanto, el valor más alto es el de la media.
11
INTRODUCCIÓN AL ANÁLISIS DE DATOS
2.22. C
X ni Xi na
64-69 4 66,5 200
58-63 16 60,5 196
52-57 14 54,5 180
46-51 22 48,5 166
40-45 32 42,5 144
34-39 44 36,5 112
28-33 42 30,5 68
22-27 18 24,5 26
16-21 8 18,5 8
200
n k 200 20
40 , es decir, el 20% de n =200 es 40. Por lo tanto, el intervalo crítico es el primer
100 100
intervalo cuya frecuencia acumulada sea igual o mayor a 40. En este caso, se corresponde con el
intervalo [28-33] cuya na = 68.
n·k 200 20
nd 26
P20 Li 100 I 27,5 100 6 29,5
nc 42
2.23. C
No es posible su cálculo porque el intervalo máximo no tiene límite superior y no
conocemos su punto medio.
2.24. A
Distribución 1
X ni na
9-10 2 40
7-8 5 38
5-6 11 33
3-4 15 22
1-2 7 7
40
n k 40 75
30 , es decir, el 75% de n =40 es 30. Por lo tanto, el intervalo crítico es el
100 100
12
INTRODUCCIÓN AL ANÁLISIS DE DATOS
primer intervalo cuya frecuencia acumulada sea igual o mayor a 30. En este caso, se
corresponde con el intervalo [5-6] cuya na = 33.
nk 40 75
nd 22
Q3 P75 Li 100 I 4,5 100 2 5,96
nc 11
2.25. C
Se trata de una variable con nivel de medida nominal en la que la categoría más frecuente
(Pi = 45) es “trastorno por estrés postraumático”. Por lo tanto, la moda es esa categoría.
13
INTRODUCCIÓN AL ANÁLISIS DE DATOS
3.1. La amplitud total de la distribución de frecuencias de la Tabla 1 es: A) 11; B) 12; C) 100.
Tabla 1. Estatura en centímetros de 100 niños de 12 meses de edad.
Estatura Frecuencia
79-81 10
76-78 25
73-75 45
70-72 20
3.2. Con los datos de la Tabla 2 el rango o amplitud total de la variable Cociente Intelectual es: A) 13;
135; C) 128,5.
Tabla 2. Resultados de medir el Cociente Intelectual (CI), variable X, y la nota media al terminar el
curso, variable Y, de 5 alumnos de 15 años de edad.
Alumno X Y
Roberto 122 5,7
Ana 130 8,4
María 124 6,0
Jesús 123 6,1
Inés 135 8,6
3.3. Según los datos de la Tabla 2, la desviación media de la variable Cociente Intelectual es: A) 2,4;
B) 3,78; C) 4,56.
3.4. Con los datos de la Tabla 2, la varianza de la nota media al terminar el curso es: A) 1,6; B) 1,7; C)
1,8.
3.5. La cuasivarianza de las puntuaciones en X, en la Tabla 3, para el grupo de varones es
aproximadamente: A) 3,54 ; B) 6,70; C) 6,85
X Mujeres Varones
8-9 20 12
6-7 16 13
4-5 10 17
2-3 8 10
0-1 6 8
∑ 60 60
Tabla 3. Resultados obtenidos por un grupo de 60 mujeres y 60 hombres en una prueba de fluidez
verbal (X)
1
INTRODUCCIÓN AL ANÁLISIS DE DATOS
Estatura Frecuencia
79-81 10
76-78 25
73-75 45
70-72 20
3.7. En la situación 1, la varianza de las edades de los sujetos es: A) 18; B) 22; C) 24
Situación 1. La gráfica muestra la distribución de la edad (X) de los 250 sujetos de una
investigación. En el eje horizontal, se recogen los límites exactos de los intervalos de X y en el eje
vertical la frecuencia absoluta acumulada (na).
3.8. Sabiendo que el tiempo de reacción medio de los 100 estudiantes de la Tabla 5 es 347,5. ¿Cuál es
su desviación típica? A) 23,9; B) 571; C) 1518,5.
Tabla 5. Tiempo de reacción de 100 estudiantes en una tarea de atención visual focalizada. Se sabe
que ni X i2 12132725
Tiempo de
Frecuencia
reacción
381-400 10
361-380 20
341-360 30
321-340 25
301-320 15
100
2
INTRODUCCIÓN AL ANÁLISIS DE DATOS
Tabla 6. Puntuaciones de 100 niños en un test de inteligencia emocional (X) agrupadas en intervalos
junto con sus frecuencias absolutas (ni) y sus frecuencias absolutas acumuladas (na).
X ni na
17-20 10 100
13-16 20 90
9-12 42 70
5-8 21 28
1-4 7 7
3.11. Con los datos de la Tabla 8, ¿qué variable presenta un mayor grado de dispersión?: A) las
puntuaciones en el test de analogías verbales; B) las puntuaciones en lengua; C) las dos variables
presentan el mismo grado de dispersión
Tabla 8. Un psicólogo utilizó un test de Analogías Verbales (X) para predecir el rendimiento en
Lengua de 4º de la ESO (Y). Obtuvo las puntuaciones de las dos variables en una muestra
aleatoria de 1000 estudiantes. En la tabla se muestran las medias, las varianza y la correlación
entre ambas variables.
X Y
Media 30 15
Varianza 64 36
Correlación rXY 0,70
3
INTRODUCCIÓN AL ANÁLISIS DE DATOS
3.15. Respecto a la distribución de la Tabla 10, ¿puede calcularse el índice de asimetría de Pearson?:
A) no, porque es bimodal; B) no, porque no tiene moda; C) sí, porque es unimodal
Tabla 10. Distribución de las puntuaciones obtenidas en una muestra de 1000 alumnos
del primer curso de la Educación Segundaria Obligatoria, en un test de razonamiento
abstracto (X). X pi pa
43 - 48 0,10 1
37 - 42 0,15 0,90
31 - 36 0,25 0,75
25 - 30 0,25 0,50
19 - 24 0,16 0,25
13 -18 0,06 0,09
7 - 12 0,02 0,03
1-6 0,01 0,01
3.16. Teniendo en cuenta el valor del índice de asimetría de Fisher, la distribución presentada en la
tabla 11: A) asimétrica positiva; B) asimétrica negativa; C) simétrica.
X ni
9-11 2
6-8 9
3-5 22
0-2 7
4
INTRODUCCIÓN AL ANÁLISIS DE DATOS
3.17. Con los datos de la Tabla 12, si la moda de las puntuaciones en inteligencia es igual a 105,
¿cuál es el valor del índice de asimetría?: A) 0; B) -0,30; C) 0,50
Desv.
Media Covarianza
típica
X 108 6
SXY=27,2
Y 41 5
3.18. Con los datos de la Tabla 12, el coeficiente de variación es mayor en: A) matemáticas, B)
inteligencia; C) en la unión de las dos variables.
3.19. La puntuación típica en Fluidez Verbal del vendedor 5 de la Tabla 13 necesariamente será: A)
negativa; B) igual a cero; C) positiva.
Fluidez Ventas
Vendedor
verbal (X) diarias (Y)
1 10 2
2 50 4
3 50 5
4 60 3
5 20 1
3.20. Con los datos de la tabla 14, ¿cuál es la puntuación típica correspondiente a la segunda
persona? A) -1,01; B) -5; C) -0,41.
Tabla 14. Resultados en un test de agudeza visual (X) de siete personas en una
investigación sobre la miopía. Persona Xi
1ª 20
2ª 6
3ª 9
4ª 6
5ª 12
6ª 8
7ª 16
5
INTRODUCCIÓN AL ANÁLISIS DE DATOS
3.21. Un test de adaptación social tiene una media de 120 y una desviación típica de 10 en una
población de adolescentes. Un adolescente de esta población ha obtenido en el test una
puntuación X = 100, lo que indica que ese adolescente está a: A) una desviación típica por encima
de la media; B) dos desviaciones típicas por encima de la media; C) dos desviaciones típicas por
debajo de la media
3.22. Con los datos de la Tabla 15, la puntuación típica del alumno D en el cuestionario de hábitos de
estudio (X) está entre: A) -0,70 y -0,40; B) -0,10 y 0,20; C) 0,40 y 0,70
Hábitos de Calificación
Alumno
estudio (X) Global (Y)
A 2 6
B 8 5
C 12 10
D 3 7
E 1 3
3.23. La puntuación típica de un sujeto en un test de razonamiento abstracto ha sido de 2. ¿Cuál fue
su puntuación diferencial en el test si la media fue de 10 y la varianza de 9?: A) 0; B) 16; C) 6.
3.24. Se quiere dibujar el diagrama de caja de la variable flexibilidad psicológica. Se sabe que las
puntuaciones 4 y 7 se corresponden con los percentiles 25 y 75, respectivamente. ¿Cuál sería el
límite superior del diagrama de caja? A)7; B) 11,5; C) 13,6.
3.25. Atendiendo a los datos del ejercicio anterior, el límite inferior del diagrama de caja sería:
A) -0,5; B) 3; C) 4.
6
INTRODUCCIÓN AL ANÁLISIS DE DATOS
SOLUCIONES
3.1. B
AT X máx X mín 81,5 69,5 12
3.2. A
AT X máx X mín 135 122 13
3.3. C
X
X i
122 130 124 123 135 634
126,8
n 5 5
DM
X i X
122 126,8 130 126,8 124 126,8 123 126,8 135 126,8
n 5
4,8 3,2 2,8 3,8 8,2 22,8
4,56
5 5
3.4. A
Alumno Yi Yi2
Roberto 5,7 32,49
Ana 8,4 70,56
María 6,0 36
Jesús 6,1 37,21
Inés 8,6 73,96
34,8 250,22
Cálculo de la media:
X
Y i
34,8
6,96
n 5
Cálculo de la varianza
5
Y i
2
250,22
S X2 i 1
6,96 2 48,442 50,044 48,442 1,6
5 5
7
INTRODUCCIÓN AL ANÁLISIS DE DATOS
3.5. C
X n V X i n V X i (X i X ) nv ( X i X ) 2
8-9 12 8,5 102 3,63 158,1228
6-7 13 6,5 84,5 1,63 34,5397
4-5 17 4,5 76,5 -0,37 2,3273
2-3 10 2,5 25 -2,37 56,169
0-1 8 0,5 4 -4,37 152,7752
60 292 403,934
292
X 4,87
60
n X X
2
403,934
6,85
2 i i
S n 1
n 1 59
3.6. A
Estatura Xi Frecuencia niXi Xi2 niXi2
79-81 80 10 800 6400 64000
76-78 77 25 1925 5929 148225
73-75 74 45 3330 5476 246420
70-72 71 20 1420 5041 100820
100 7475 559465
X
n X i i
7475
74,75
n 100
S x2
n X i i
2
X2
559465
74,75 2 7,09
n 100
S x S x2 7,09 2,66
3.7. A
X ni Xi ni Xi 2
29,5 – 32,5 50 31 48050
26,5 – 29,5 50 28 39200
23,5 – 26,5 50 25 31250
20,5 – 23,5 50 22 24200
17,5 – 20,5 50 19 18050
160750
X 25 (ver ejercicio resuelto 2.13 del Tema 2)
S X2
n X i i
2
X2
160750
25 2 18
n 250
8
INTRODUCCIÓN AL ANÁLISIS DE DATOS
3.8. A
S 2
n X
i
2
i
X2
12132725
347,5 2 571
x
n 100
S x 571 23,9
3.9. B
X ni na
17-20 10 100
13-16 20 90
9-12 42 70
5-8 21 28
1-4 7 7
n·k 100 25
nd 7
P25 Li 100 I 4,5 100 4 7,93
nc 21
n·k 100 75
nd 70
P75 L i 100 I 12,5 100 4 13,5
nc 20
AIQ P75 P25 13,5 7,93 5,57
3.10. B
9
INTRODUCCIÓN AL ANÁLISIS DE DATOS
X pi pa
43 - 48 0,10 1
37 - 42 0,15 0,90
31 - 36 0,25 0,75
25 - 30 0,25 0,50
19 - 24 0,16 0,25
13 -18 0,06 0,09
7 - 12 0,02 0,03
1-6 0,01 0,01
Para una mayor claridad pasamos las frecuencias relativas a frecuencias absolutas:
X pi pa ni na
43 - 48 0,10 1 100 1000
37 - 42 0,15 0,90 150 900
31 - 36 0,25 0,75 250 750
25 - 30 0,25 0,50 250 500
19 - 24 0,16 0,25 160 250
13 -18 0,06 0,09 60 90
7 - 12 0,02 0,03 20 30
1-6 0,01 0,01 10 10
n·k 1000 25
nd 90
P25 L i 100 I 18,5 100 6 24,5
nc 160
n·k 1000 75
nd 500
P75 L i 100 I 30,5 100 6 36,5
nc 250
AIQ 36,5 24,5 12
10
INTRODUCCIÓN AL ANÁLISIS DE DATOS
3.11. B
X Y
Media 30 15
Varianza 64 36
SX 8
CVX ·100 ·100 26,67
X 30
CVY CVX
SY 6
CVY ·100 ·100 40
Y 15
3.12. C
X Xi ni Xi ni
30-34 32 10 320
35-39 37 15 555
40-44 42 30 1260
45-49 47 15 705
50-54 52 10 520
80 3360
X
n X
i 3360
i
42
n 80
X Mo 42 42
AP 0
SX 5,86
3.13. A
X Xi ni ( X i X ) ( X i X ) 3 ni ( X i X ) 3
30-34 32 10 -10 -1000 -10000
35-39 37 15 -5 -125 -1875
40-44 42 30 0 0 0
45-49 47 15 5 125 1875
50-54 52 10 10 1000 10000
0
∑ 80
X 42
S X 5,86 S X3 5,863 201,23
11
INTRODUCCIÓN AL ANÁLISIS DE DATOS
Sustituyendo:
AF
n (X
i i X ) 3
0
0
0
nS 3
X 80 201,23 16098,4
3.14. C
X Xi ni ( X i X ) ( X i X )4 ni ( X i X ) 4
30-34 32 10 -10 10000 100000
35-39 37 15 -5 625 9375
40-44 42 30 0 0 0
45-49 47 15 5 625 9375
50-54 52 10 10 10000 100000
∑ 80 218750
X 42
S X 5,86 S X4 5,86 4 1179,21
Cr
n (X
i i X ) 4
3
218750
3
218750
3 2,3188 3 0,68
nS 4
X 80 1179,21 94336,8
3.15. A
La distribución presenta dos modas: X=27,5 y X=33,5, por lo que no puede aplicarse el índice
de asimetría de Pearson.
3.16. A
Primero se calcula la media y la desviación típica de la distribución:
X ni Xi Xi ni X i2 ni
9-11 2 10 20 200
6-8 9 7 63 441
3-5 22 4 88 352
0-2 7 1 7 7
40 178 1000
178
X 4,45
40
S X2
n X i i
2
X2
1000
4,45 2 5,2
n 40
S X 5,2 2,28
12
INTRODUCCIÓN AL ANÁLISIS DE DATOS
X Xi ni ( X i X ) ( X i X ) 3 ni ( X i X ) 3
9-11 10 2 5,55 170,9539 341,9078
6-8 7 9 2,55 16,5814 149,2326
3-5 4 22 -0,45 -0,0911 -2,0042
0-2 1 7 -3,45 -41,0636 -287,4452
201,69
∑ 40
Sustituyendo:
AF
n (X
i i X ) 3
201,69
201,69
0,43
nS 3
X 40 11,85 474
3.17. C
Desv.
Media Covarianza
típica
X 108 6
SXY=27,2
Y 41 5
Mo=105.
X Mo 108 105
AP 0,50
SX 6
3.18. A
Desv.
Media Covarianza
típica
X 108 6
SXY=27,2
Y 41 5
SX 6
CVX 100 100 5,56
X 108
13
INTRODUCCIÓN AL ANÁLISIS DE DATOS
SY 5
CVY 100 100 12,20
Y 41
CVX CVY
Hay mayor dispersión en matemáticas (Y).
3.19. A
Fluidez Ventas
Vendedor
verbal (X) diarias (Y)
1 10 2
2 50 4
3 50 5
4 60 3
5 20 1
El vendedor 5 tiene una puntuación en fluidez verbal de 20, que es menor que la media
X i
X 190 X X 20 38
38 . Por tanto, al pasar su puntuación a típica, Z el
n 5 Sx Sx
resultado será un valor negativo, ya que la desviación típica es siempre positiva.
3.20. A
Persona Xi Xi X (X i X )2
1 20 9 81
2 6 -5 25
3 9 -2 4
4 6 -5 25
5 12 1 1
6 8 -3 9
7 16 5 25
170
170 5
S X2 24,29 S X 4,93 X 11 z 1,01
7 4,93
3.21. C
100 120
z 2
10
14
INTRODUCCIÓN AL ANÁLISIS DE DATOS
3.22. A
Persona Xi Xi2
A 2 4
B 8 64
C 12 144
D 3 9
E 1 1
26 222
X
X i
26
5,2 S2
X 2
i
Xi2
222
5,22 17,36
SX S2X 17,36 4,17
X
n 5 n 5
3 5,2
z 0,53
4,17
3.23. C
S X S X2 9 3
x XX
x x
z 2 x 23 6
SX 3
3.24. B
P25 Q1 4
P75 Q3 7
Por lo tanto:
AIQ Q3 Q1 7 4 3
y
LS Q3 AIQ 1,5 7 3 1,5 11,5
3.25. A
LI Q1 AIQ 1,5 4 3 1,5 0,5
15
INTRODUCCIÓN AL ANÁLISIS DE DATOS
4.1. En una tabla de contingencia con los valores de X en las filas y los valores de Y en las columnas,
¿cómo se denomina al número de casos de cada celdilla dividido por el total de casos de Y y
multiplicado por 100? A) Porcentaje condicionado a filas; B) Porcentaje condicionado a columnas; C)
Porcentaje condicionado a X.
4.6. Si queremos estudiar la relación entre dos variables dicotómicas, X e Y, el valor del Coeficiente
de Contingencia máximo que podemos obtener es: A) 0,20 ; B) 0,71 ; C) 0,9.
4.11. El coeficiente de Contingencia puede tomar valores: A) mayores o iguales a 0 y menores que 1;
B) entre -1 y 1; C) entre 0 y 100.
1
INTRODUCCIÓN AL ANÁLISIS DE DATOS
4.12. Es apropiado analizar la relación entre dos variables utilizando el coeficiente C de contingencia en
el caso de: A) la Figura 1; B) la Figura 2; C) la Tabla 3.
10
9
Número de errores (Y)
8
7
6
5
4
3
2
1
0
0 10 20 30 40 50 60 70 80 90
Concentración (X)
Tabla 3. Resultados obtenidos en un estudio sobre la discriminación laboral percibida de tres grupos
distintos de inmigrantes.
Discriminación laboral
percibida
Baja Moderada Alta
Rumanos 30 35 15 80
Inmigrantes
Marroquíes 10 20 20 50
Subsaharianos 10 30 30 70
50 85 65 200
2
INTRODUCCIÓN AL ANÁLISIS DE DATOS
3
INTRODUCCIÓN AL ANÁLISIS DE DATOS
SOLUCIONES
4.1. B
El porcentaje condicionado a columnas es el número de casos de cada celdilla dividido por el total
de casos por columna y multiplicado por 100. En el enunciado se informa de que los valores de X
están situados en las filas y los valores de Y en las columnas de la tabla de contingencia.
4.2. B
En una relación asimétrica los porcentajes se calculan en el sentido de la variable explicativa, en
este caso, la variable altruismo.
4.3. C
Cálculo de las frecuencias teóricas (entre paréntesis en la tabla)
( 400 x 800) ( 400 x 200) (600 x 800) (600 x 200)
320 80 480 120
1000 1000 1000 1000
Voluntariado
A B
Sí 250 (320) 150 (80) 400
Altruismo
No 550 (480) 50 (120) 600
800 200 1000
4.4. B
Voluntariado
A B
Sí 250 150 400
Altruismo
No 550 50 600
800 200 1000
n11 n22 n12 n21 250 50 550 150 12500 82500 70000
0,357
n1 n2 n1 n 2 400 600 800 200 38400000000 195959,18
4.5. C
El valor de phi es distinto de cero, por lo que hay asociación entre ambas variables.
4.6. B
k 1 2 1
C max 0,5 0,71
k 2
4
INTRODUCCIÓN AL ANÁLISIS DE DATOS
4.7. B
Tarea realizada
Total
Sí No
68 92
Baja 160
(84,8) (75,2)
Ansiedad
144 96
Alta 240
(127,2) (112,8)
4.8. A
2 11,80
C 0,029 0,17
n
2
11,80 400
4.9. B
2 11,80
V 0,03 0,173
n(k 1) 4002 1
4.10. C
4.11. A
4.12. C
4.13. A
Se trata de una distribución de Y condicionada a uno de los valores de X (ser mujer), por lo que se
considera únicamente la fila en la que aparecen las frecuencias de las mujeres. Por tanto, para
calcular estos porcentajes, cada frecuencia de la fila de las mujeres se divide entre el total de
mujeres (45) y se multiplica por 100. Los porcentajes condicionados a ser mujer son 55,6%, 33,3%
y 16,7%.
4.14. C
Con los datos de la tabla se calculan las frecuencias teóricas multiplicando los marginales
correspondientes a cada celdilla y dividiendo por el total (en la tabla entre paréntesis).
5
INTRODUCCIÓN AL ANÁLISIS DE DATOS
Itinerario
Clínica Educación Trabajo
Hombre 5 (15) 15 (15) 25 (15) 45
Sexo
Mujer 25 (15) 15(15) 5 (15) 45
30 30 30 90
(5 15) 2 15 15 25 15 25 15 15 15 5 15
2 2 2 2 2
2
15 15 15 15 15 15
6,667 0 6,667 6,667 0 6,667 26,7
4.15. B
26,7
C 0,48
26,7 90
4.16. B
2 26,7
V 0,297 0,54
n(k 1) 902 1
4.17. B
Con los datos de la tabla se calculan las frecuencias teóricas multiplicando los marginales
correspondientes a cada celdilla y dividiendo por el total (en la tabla entre paréntesis).
Trastorno Psicológico
Depresión Personalidad
Acepta Sí 36 (32) 44 (48) 80
Tratam. No 4 (8) 16 (12) 20
40 60 100
4.18. A
Trastorno Psicológico
Depresión Personalidad
Acepta Sí 36 44 80
Tratam. No 4 16 20
40 60 100
6
INTRODUCCIÓN AL ANÁLISIS DE DATOS
4.19. C
En primer lugar hay que calcular los rangos de las variables. Para hacerlo, hay que ordenar los
valores de menor a mayor. En la primera tabla aparece el número de estudiante y la nota
otorgada por el profesor 1. En la segunda tabla se han ordenado los datos de la calificación
otorgada por el profesor 1 de menor a mayor, por lo que ahora el nº del estudiante no está
ordenado. En la última tabla se han asignado los rangos correspondientes.
1 7 3 5,5 3 1
2 10 1 7 1 2
3 5,5 4 7,5 4 3
4 7,5 5 9 5 4
5 9 2 10 2 5
1 6 3 5 3 1
2 9 1 6 1 2
3 5 4 8,5 4 3
4 8,5 2 9 2 4
5 9,5 5 9,5 5 5
Ahora, se sitúan los rangos correspondientes en la misma tabla ordenada por el número de
estudiante y se calcula la diferencie entre los rangos de ambas variables.
Y sustituyendo en la fórmula:
6 d i2 6 2 12
rs 1 1 1 1 0,1 0,9
n(n 1)
2
5(5 1)
2
120
4.20. B.
7
INTRODUCCIÓN AL ANÁLISIS DE DATOS
5.1. Entre las variables Fluidez Verbal y número de ventas diarias que presentan un grupo de
vendedores (ver Tabla 1) existe una relación lineal: A) directa; B) inversa; C) nula.
Tabla 1. Resultados en un test de fluidez verbal de un grupo de vendedores de enciclopedias y
número de ventas diarias realizadas.
5.2. Según los datos de la Tabla 2, la covarianza entre el CI y la nota media a final de curso es: A)
6; B) 7; C) 8
Tabla 2. Resultados de medir el Cociente Intelectual (CI), variable X, y la nota media al terminar
el curso, variable Y, de 5 alumnos de 15 años de edad.
Alumno X Y
Roberto 122 5,7
Ana 130 8,4
María 124 6,0
Jesús 123 6,1
Inés 135 8,6
5.3. Con los datos de la Tabla 3, la covarianza entre ambas variables es igual a: A) 83,6; B) 25,3;
C) 33,6
Tabla 3. Un psicólogo utilizó un test de Analogías Verbales (X) para predecir el rendimiento
en Lengua de 4º de la ESO (Y). Obtuvo las puntuaciones de las dos variables en una muestra
aleatoria de 1000 estudiantes. En la tabla se muestran las medias, las varianza y la correlación
entre ambas variables.
X Y
Media 30 15
Varianza 64 36
Correlación rXY 0,70
1
INTRODUCCIÓN AL ANÁLISIS DE DATOS
5.4. Con los datos de la Tabla 4, la covarianza entre la variable X e Y es: A) 0,49; B) 13,38; C)
11,21
Tabla 4. Datos de 50 personas en un estudio para predecir la nota en dibujo artístico (Y) a partir
de su nivel de creatividad (X)
Media Desv. típica Correlación
X 8 2,83
rXY 0,7
Y 14 5,66
5.5. Con los datos de la Tabla 5, la covarianza entre ambas variables es igual a: A) 4,6; B) 7,9;
C) 3,2
Tabla 5. Con el fin de estudiar la relación entre las puntuaciones en un test de
inteligencia (X) y la obtenida en un examen de matemáticas (Y), se utilizan las
puntuaciones de 50 sujetos obteniéndose los siguientes resultados:
X Y XY
X 30 Y 7
X 2 45200 Y 2 2650 XY 10660
5.6. Teniendo en cuenta los datos de la Tabla 6, el coeficiente de correlación de Pearson entre X e
Y vale: A) 0,7 ; B) 0,8 ; C) 0,9
Tabla 6. Para pronosticar las puntuaciones en una asignatura (Y) a partir de las
puntuaciones en un test de razonamiento (X) disponemos de los siguientes datos obtenidos
en un grupo de 500 niños:
Desviación
Media Recta de regresión
típica
X 100 10
Y´= - 8 + 0,16 X
Y 8 2
2
INTRODUCCIÓN AL ANÁLISIS DE DATOS
5.10. La recta de regresión, calculada con los datos de la Tabla 8, para pronosticar la nota media al
terminar el curso, en función del CI, es: A) -24,1+0,245Xi ; B) -2,41Xi+0,245; C)
24,1 0,245 X i
Tabla 8. Resultados de medir el Cociente Intelectual (CI), variable X, y la nota media al
terminar el curso, variable Y, de 5 alumnos de 15 años de edad.
Alumno X Y
Roberto 122 5,7
Ana 130 8,4
María 124 6,0
Jesús 123 6,1
Inés 135 8,6
3
INTRODUCCIÓN AL ANÁLISIS DE DATOS
5.13. Con los datos de la Tabla 10, la pendiente de la recta de regresión que permite pronosticar el
número de ventas diarias (Y) a partir de la fluidez verbal de los vendedores (X) es: A) -0,053;
B) 0; C) 0,053.
Tabla 11: Datos de 50 personas en un estudio para predecir la nota en dibujo artístico (Y) a
partir de su nivel de creatividad (X)
4
INTRODUCCIÓN AL ANÁLISIS DE DATOS
5.17. Atendiendo a los datos de la Tabla 12, la recta de regresión de las calificaciones en
matemáticas sobre las puntuaciones en el test de inteligencia es: A) Y’ = -0,24X - 0,20;
C) Y’ = 0,50X + 10,20; C) Y’ = 0,80X - 17
Tabla 12. Con el fin de estudiar la relación entre las puntuaciones en un test de inteligencia
(X) y la obtenida en un examen de matemáticas (Y), se utilizan las puntuaciones de 50
sujetos obteniéndose los siguientes resultados:
X Y XY
X 30 Y 7
X 2 45200 Y 2 2650 XY 10660
5
INTRODUCCIÓN AL ANÁLISIS DE DATOS
Tabla 13. Para pronosticar las puntuaciones en una asignatura (Y) a partir de las
puntuaciones en un test de razonamiento (X) disponemos de los siguientes datos
obtenidos en un grupo de 500 niños:
Desviación
Media Recta de regresión
típica
X 100 10
Y´= - 8 + 0,16 X
Y 8 2
5.19. Con los datos de la Tabla 14 ¿qué nota media a final de curso pronosticaremos a un alumno
que tiene un CI de 127? A) 6; B) 7; C) 8
Tabla 14. Resultados de medir el Cociente Intelectual (CI), variable X, y la nota media al
terminar el curso, variable Y, de 5 alumnos de 15 años de edad.
Alumno X Y
Roberto 122 5,7
Ana 130 8,4
María 124 6,0
Jesús 123 6,1
Inés 135 8,6
5.20. Con los datos de la Tabla 15. ¿cuántas ventas diarias se pronosticará a un nuevo aspirante al
puesto de vendedor de enciclopedias que ha obtenido en el test de fluidez verbal una puntuación
de 40? A) Entre 0 y 1; B) Entre 2 y 3; C) Entre 3 y 4.
Tabla 15. Resultados en un test de fluidez verbal de un grupo de vendedores de
enciclopedias y número de ventas diarias realizadas.
5.21. Considerando los datos de la Tabla 16, ¿qué puntuación en Y pronosticaremos a un alumno
que tiene una puntuación en X de 10?: A) 112,35; B) 19,6; C) 16,8
6
INTRODUCCIÓN AL ANÁLISIS DE DATOS
Tabla 16: Datos de 50 personas en un estudio para predecir la nota en dibujo artístico (Y)
a partir de su nivel de creatividad (X)
5.22. La recta de regresión que permite pronosticar el riesgo de padecer una enfermedad coronaria
(Y) en función de la hostilidad (X) es Y’ = 1,1 + 0,9X, ¿cuál es el riesgo de padecer una
enfermedad coronaria de una persona que ha obtenido una puntuación X = 8 en hostilidad?: A)
0,9; B) 1,1; C) 8,3
5.23. En una muestra de víctimas de violencia doméstica, hemos obtenido la recta de regresión
siguiente Y’ = 0,08 + 1,24X. En esta investigación, X es el grado de violencia doméstica
sufrida e Y el grado de daño físico y psicológico manifestado. Una puntuación pronosticada Y’
= 10 indica que X es igual a: A) 0,08; B) 1,24; C) 8
5.24. Hemos medido el grado de miopía (Y) de las siete personas de la Tabla 17 y, a
continuación, hemos calculado la recta de regresión de Y sobre X. Sabiendo que la correlación
de Pearson entre el test de agudeza visual y el grado de miopía es de 0,68 y que la varianza de
las puntuaciones pronosticadas, Y’, es igual a 4, ¿cuál es el valor de la varianza de los errores?:
A) 4,65; B) 1,88; C) 1.
Tabla 17: Resultados en un test de agudeza visual (X) de siete personas en una
investigación sobre la miopía.
SY2' 4 Persona Xi
1 20
rXY 0,68 2 6
3 9
4 6
5 12
6 8
7 16
7
INTRODUCCIÓN AL ANÁLISIS DE DATOS
SOLUCIONES
5.1. A
Para responder a este ejercicio no es necesario hacer ningún cálculo, basta con observar los valores
de la tabla o su representación gráfica. No necesariamente tiene que ser una relación lineal directa
"perfecta". Si aún así no se ve claro, debemos utilizar el coeficiente de correlación de Pearson, que
en este caso es de 0,73, lo que confirma la relación lineal directa.
5.2. A
Alumno X Y XY
Roberto 122 5,7 695,4
Ana 130 8,4 1092
María 124 6 744
Jesús 123 6,1 750,3
Inés 135 8,6 1161
634 34,8 4442,7
S XY
XY XY 4442,7 126,8·6,96 6,012 6
n 5
5.3. C
X Y
Media 30 15
Varianza 64 36
8
INTRODUCCIÓN AL ANÁLISIS DE DATOS
5.4. C
S XY S X SY rXY 2,83 5,66 0,70 11,21
5.5. C
10660
cov( X , Y ) 30 7 3,2
50
5.6. B
Sabemos que:
b 0,16 , S X 10 , SY 2
Por lo tanto:
SY S 10
b rxy rxy b X 0,16 0,8
SX SY 2
5.7. B
5.8. A
S XY
Si rxy = -1, el valor de SXY es negativo puesto que rXY y las desviaciones típicas no
S X SY
pueden tener signo negativo.
5.9. B
5.10. A
5.11. A
5.12. A
SY 6
b rXY 0,70 0,525
SX 8
5.13. C
Vendedor X Y XY X2
1 10 2 20 100
2 50 4 200 2500
3 50 5 250 2500
4 60 3 180 3600
5 20 1 20 400
190 15 670 9100
9
INTRODUCCIÓN AL ANÁLISIS DE DATOS
5.14. A
SY 5,66
b rXY 0,70 1,4
SX 2,83
a Y bX 14 1,4 8 2,8
5.15. B
Y’ = 2X – 3 a = -3
5.16. A
Concentración Nº errores XY X2
(X) (Y)
10 10 100 100
50 4 200 2500
80 2 160 6400
70 6 420 4900
20 8 160 400
230 30 1040 14300
5.17. C
50 10660 1500 350 8000
b 0,8
50 45200 (1500) 2 10000
a 7 (0,8 30) 17
Por lo tanto, Y’=0,8X-17
5.18. C
Y 8 0,16X 8 0,16·100 8 16 8
10
INTRODUCCIÓN AL ANÁLISIS DE DATOS
5.19. B
Alumno X Y X2 XY
Roberto 122 5,7 14884 695,4
Ana 130 8,4 16900 1092
María 124 6 15376 744
Jesús 123 6,1 15129 750,3
Inés 135 8,6 18225 1161
634 34,8 80514 4442,7
5.20. C
b = 0,053
X i Y i
X 190 Y 15
38 3
n 5 n 5
a Y bX 3-0,053 38 0,986
5.21. C
Y ' 2,8 1,4 X 2,8 1,4 10 16,8
5.22. C
Y’ = 1,1 + 0,9(8) = 8,3
5.23. C
Y’ = 0,08 + 1,24X
Y’ = 10
10 = 0,08 + 1,24X
10 – 0,08 = 1,24X
9,92 = 1,24X
11
INTRODUCCIÓN AL ANÁLISIS DE DATOS
9,92
X 8
1,24
5.24. A
SY2' 4 rXY 0,68
S Y2' 4
S Y2 8,65
rXY 0,68 2
2
5.25. A
S E2 0,6272
1 rXY
2
SY2 2,24 SY 2,24 1,5
SY2
1 0,84852
12
INTRODUCCIÓN AL ANÁLISIS DE DATOS
6.2. El espacio muestral E = {cara cara; cara cruz; cruz cara; cruz cruz} corresponde al
experimento de lanzar al aire una moneda: A) dos veces; B) cuatro veces; C) ocho
veces.
6.3. Respecto al espacio muestral del ejercicio 6.2, el número de casos posibles es: A) 2; B) 4;
C) 8.
6.4. En un espacio muestral hay dos sucesos A y B. Sabemos que P( A ) 0,4 , P( B ) 0,75 y
que P( A B) 0,55 . ¿Cuál es la probabilidad de la intersección de los sucesos A y B?: A)
0,10; B) 0,60; C) 0,15.
A) E=
, , , , ,
;
B) E=
, , ,
;
C) E=
, ,
6.7. Con los datos de la situación 1 se define un
nuevo suceso C = “obtener un número
par”. ¿Cuál es P(A C) ? : A) 1/6; B) 3/6;
C) 4/6.
6.8. Al jugar una partida de parchís, ¿qué probabilidad hay de irse a “casa” por sacar tres
veces seguidas un seis al lanzar el dado tres veces? A) 0,0046; B) 0,0501; C) 0,1667.
6.9. Hay una bola verde (V) y una bola azul (A) en una bolsa. Si extraemos dos bolas una a
una y con reposición, los pares posibles son: A) VA, AV; B) VV, AA; C) VV, VA, AV, AA
1
INTRODUCCIÓN AL ANÁLISIS DE DATOS
6.12. Se realiza un estudio sobre el hábito de fumar en adultos de mediana edad con 200
hombres y 300 mujeres. Un 30% de los hombres reconocen que sí fuman habitualmente,
mientras que 225 mujeres se declaran no fumadoras. Si seleccionamos una persona al
azar, ¿cuál es la probabilidad de que sea hombre y no fume? A) 0,70; B) 0,28; C) 0,73.
6.13. Con los datos del ejercicio anterior, si elegimos una persona al azar, ¿cuál es la
probabilidad de que fume? A) 0,32; B) 0,73; C) 0,27.
2
INTRODUCCIÓN AL ANÁLISIS DE DATOS
6.22. Con los datos del ejercicio anterior, ¿Cuál es la probabilidad de que una persona sea
culpable, dado que el jurado ha determinado que es culpable? A) 0,05; B) 0,95; C) 0,99.
6.23. De los siguientes diagramas de árbol, ¿cuál representa los datos del enunciado del
Ejercicio 6.21? A) Diagrama 1; B) Diagrama 2; C) Diagrama 3.
3
INTRODUCCIÓN AL ANÁLISIS DE DATOS
SOLUCIONES
6.1. C
6.2. A
6.3. B
6.4. A
P( B) 1 P( B ) 1 0,75 0,25
P( A B) P( A) P( B) P( A B) 0,40 0,25 0,55 0,10
6.5. A
6.6. A
6.7. C
2 3 1 4
P(A C) P(A) P(C) - P(A C)
6 6 6 6
6.8. A
1
P(6)
6
1 1 1 1
P(6 6 6) P(6) P(6) P(6) 0,0046
6 6 6 216
6.9. C
Dado que la selección es con reposición, el espacio muestral es: VV, VA, AV, AA
Hay dos bolas en una bolsa, una verde (V) y una azul (A), y extraemos dos bolas una a
una y con reposición. Es decir, se saca una bola, se vuelve a meter en la bolsa y se saca
una segunda bola.
Como en el momento de cada extracción están la bola verde y la bola azul en la bolsa,
los pares posibles son: bola verde en ambas extracciones (VV), bola verde en la primera
extracción y bola azul en la segunda (VA), bola azul en la primera extracción y bola verde
en la segunda (AV) y bola azul en ambas extracciones (AA).
6.10. A
Itinerario
Clínica Educación Trabajo
Hombre 5 15 25 45
Sexo
Mujer 25 15 5 45
30 30 30 90
15
P(hombre educación) 0,1667
90
6.11. B
25
P(mujer clínica )
P(mujer clínica ) 90 0,83
P(clínica ) 30
90
4
INTRODUCCIÓN AL ANÁLISIS DE DATOS
6.12. B
Fumador
Sí No
Hombre 60 140 200
Sexo
Mujer 75 225 300
135 365 500
140
P( H No) 0,28
500
6.13. C
135
P( Sí ) 0,27
500
6.14. C
6.15. B
PAA ·
11 1 11 1 11 1 11 1
P(BB) · P(CC) · P(DD) ·
4 4 16 4 4 16 4 4 16 4 4 16
1 4
4· 0,25
16 16
6.16. B
5
P( A) 0,5 P(atasco A) 0,4
10
3
P( B) 0,3 P(atasco B) 0,5
10
2
P(C ) 0,2 P(atasco C ) 0,65
10
P(atasco ) P( A atasco ) P( B atasco ) P(C atasco )
P( A)·P(atasco A) P( B)·P(atasco B) P(C )·P(atasco C )
0,5 0,4 0,3 0,5 0,2 0,65 0,48
6.17. B
5
INTRODUCCIÓN AL ANÁLISIS DE DATOS
6.18. A
PEC
Sí No
A 60 40 100
Asignatura
B 60 140 200
120 180 300
PSi
120
0,4
300
6.19. B
P A Si
60
0,2
300
6.20. C
60
PB Si 300 60
PB Si 0,5
PSi 120 120
300
6.21. B
C= Culpable VC=Veredicto de culpable
C no culpable
PC 1 0,99 0,01
P(VC ) P(C )·P(VC C ) P(C )·P(VC C ) = 0,99 0,95 0,01 0,05 0,94
6.22. C
6
INTRODUCCIÓN AL ANÁLISIS DE DATOS
6.24. A
Resultado Prueba
+ -
Trastorno Sí 36 16 52
Depresivo No 4 44 48
40 60 100
Sensibilidad = P( T )
nT 36
P( T ) 0,69
nT 52
6.25. B
n NT 44
P( NT ) 0,73
n 60
7
INTRODUCCIÓN AL ANÁLISIS DE DATOS
7.1. Se llama función de probabilidad de una variable aleatoria discreta a aquella función que
asocia, a cada valor de la variable, la probabilidad de que ésta adopte: A) ese valor; B) ese valor
o cualquier otro inferior; C) ese valor o cualquier otro superior.
7.2. Los valores posibles de una variable aleatoria X son: 0, 1, 2, 3 y 4. Si todos los valores tienen la
misma probabilidad, la probabilidad de que X sea menor o igual que 3 es: A) 0,20; B) 0,60; C)
0,80
7.3. Una variable aleatoria discreta X toma los valores 0, 1, 2 y 3. Si sabemos que P(X > 2) = 0,125
¿cuál es la probabilidad de que X sea igual a 3?: A) 0,125; B) 0,25; C) 0,875
7.4. Una variable aleatoria discreta X puede adoptar, con la misma probabilidad, los valores 1, 2, 3
y 4. ¿Cuál es su esperanza matemática? A) 0,25; B) 1; C) 2,5.
7.5. La función de probabilidad de una variable X es: f(1)=0,25; f(2)=0,50 y f(3)=0,25. Su varianza
vale: A) 0,5; B) 2,5; C) 2,3
7.10. ¿Cuál es la media de una variable aleatoria X que toma los valores 0, 1 y 2, con una
probabilidad de 0,6, 0,2 y 0,2 respectivamente? A) 0,2; B) 0,6; C) 1.
7.11. Sea X una variable aleatoria discreta que toma los valores 0,1, 2 y 3. Si los valores son
equiprobables, la desviación típica es igual a: A) 0,69; B) 0,25; C) 1,12
1
INTRODUCCIÓN AL ANÁLISIS DE DATOS
0.1
7.14 ¿Cuál es la varianza de la variable aleatoria
X presentada en la Figura 1?: A) 1,45; 0
B) 2,20; C) 3,70.
0 1 2 3 X
7.15. Lanzamos al aire 10 veces una moneda (no trucada), ¿cuál es la probabilidad de que salgan 4
caras? : A) 0,2051; B) 0,3770; C) 0,5000
7.16. Si lanzamos al aire 10 veces una moneda (no trucada), la varianza de la variable aleatoria
“número de caras” es: A) 2,5; B) 4; C) 10
7.17. Un antidepresivo causa efectos secundarios en el 25% de los pacientes que lo toman. Si
elegimos al azar 8 pacientes entre los que toman el antidepresivo, la probabilidad de que
ninguno de estos 8 pacientes tenga efectos secundarios es: A) 0; B) 0,1001; C) 0,25
7.18. Con los datos del ejercicio anterior, el número medio de pacientes que se espera tengan
efectos secundarios es: A) 0; B) 2; C) 4
7.19. En un estudio sobre fobias concluyen que el 40% de la población adolescente con este
problema presentan fobia social. Si elegimos al azar una muestra de 15 adolescentes, ¿cuál es la
probabilidad de que cinco de ellos padezcan este trastorno? A) 0,1859; B) 0,4032; C) 0,8290.
7.20. Se sabe que un 30% de las personas que acuden a una primera consulta en un centro de
psicología clínica presentan un trastorno depresivo. Si elegimos al azar una muestra de 10
personas que acuden al centro, la probabilidad de que dos o más no tengan depresión es: A)
0,1493; B) 0,0282; C) 0,3002
7.21. En una consulta de un psicólogo especialista en depresión, el 80% de los pacientes depresivos
son varones y el resto mujeres. Si seleccionamos al azar de esa consulta 10 pacientes
depresivos, ¿cuál es la probabilidad de que 4 pacientes de estos 10 pacientes sean mujeres?: A)
0,0881; B) 0,20; C) 0,9672
2
INTRODUCCIÓN AL ANÁLISIS DE DATOS
7.25. ¿Cuál es la probabilidad de que un estudiante que responde al azar las 20 preguntas de un
examen de verdadero o falso acierte más de 15? A) 0,0059; B) 0,5900; C) 0,9941.
3
INTRODUCCIÓN AL ANÁLISIS DE DATOS
SOLUCIONES
7.1. A
7.2. C
x 0 1 2 3 4
f(x) 0,2 0,2 0,2 0,2 0,2
P(X ≤ 3) = f(0) + f(1) + f(2) + f(3) = 0,20 + 0,20 + 0,20 + 0,20 = 0,80
7.3. A
7.4. C
X f(x) Xf(x)
1 0,25 0,25
2 0,25 0,50
3 0,25 0,75
4 0,25 1
2,5
x· f x 2,5
7.5. A
7.6. B
x F(x)
1 0,15
2 0,50
3 0,80
4 1
7.7. B
4
INTRODUCCIÓN AL ANÁLISIS DE DATOS
7.8. C
F(1)=f(-1)+f(0)+f(1)=0,2+0,1+0,2=0,5
7.9. B
x f(x) x·f(x)
-1 0,2 -0,2
0 0,1 0
1 0,2 0,2
2 0,3 0,6
3 0,2 0,6
1 1,2
7.10. B
x f(x) x·f(x)
0 0,6 0
1 0,2 0,2 x· f x 0,6
2 0,2 0,4
0,6
7.11. C
x f(x) x·f(x) ( x μ) ( x μ) 2 ( x μ) 2 f ( x )
0 0,25 0 -1,5 2,25 0,5625
1 0,25 0,25 -0,5 0,25 0,0625
2 0,25 0,50 0,5 0,25 0,0625
3 0,25 0,75 1,5 2,25 0,5625
1,5 1,25
1,5
2 1,25 1,12
7.12. C
P( X 1) f (1) f (2) f (3) 0,2 0,2 0,3 0,7
7.13. B
x f(x) x·f(x)
0 0,3 0
1 0,2 0,2
x· f x 1,5
2 0,2 0,4
3 0,3 0,9
1,5
5
INTRODUCCIÓN AL ANÁLISIS DE DATOS
7.14. A
x f(x) x·f(x) x2 x2·f(x)
0 0,3 0 0 0
1
2
0,2
0,2
0,2
0,4
1
4
0,2
0,8
2 E X 2 E X 2 3,7 (1,5) 2 3,7 2,25 1,45
3 0,3 0,9 9 2,7
1,5 3,7
7.15. A
(Se busca directamente en la tabla I, con n = 10, p = 0,50 y x = 4).
7.16. A
Binomial con n = 10 y p = 0,5 varianza = npq = 10 0,5 0,5 2,5
7.17. B
Distribución Binomial con n = 8, p = 0,25 y x = 0 (Tabla I)
7.18. B
La media de la distribución binomial es igual a np.
Como n = 8 y p = 0,25, la media es: np = 8(0,25) = 2
7.19. A
(Se busca directamente en la tabla I, con n = 15, p = 0,40 y x = 5).
7.20. A
La probabilidad de que 2 o más no tengan depresión es equivalente a que ninguno o uno
tengan depresión. Por lo tanto, debemos calcular P ( X 1) con n=10 y p=0,30.
Este valor se localiza en la Tabla II con n=10, x=1 y p=0,30
7.21. A
Tabla I con n = 10, p = 0,2 y x = 4
7.22. A
x f(x) x·f(x)
1
X x·f ( x )
0 3/4 0
0,25
1 1/4 1/4 4
1 1/4
7.23. B
Utilizando las tablas de la binomial (Tabla I) con n=20, p=0,25 y x=5, obtenemos 0,2023
7.24. C
Función de distribución binomial (Tabla II)
7.25. A
P( X 15) 1 P( X 15)
Utilizando la Tabla II comprobamos (para n=20, x=15 y p=0,5) que P( X 15) 0,9941.
Por tanto, P( X 15) 1 0,9941 0,0059
6
INTRODUCCIÓN AL ANÁLISIS DE DATOS
8.2.. En una distribución normal tipificada, el percentil 67 vale: A) 0,44; B) 0,67; C) 0,7486
8.3. Se sabe que el absentismo laboral de la empresa se distribuye como una normal de media 2,2 y de
varianza 1,44. El percentil 25 es un valor comprendido entre: A) 0 y 1; B) 1 y 2; C) 2 y 3
8.4. En una población, las puntuaciones en un test de memoria se distribuyen normalmente con media
100 y varianza 36. La proporción de sujetos con puntuaciones en el test entre 90 y 110 está entre:
A) 0,10 y 0,15; B) 0,50 y 0,55; C) 0,90 y 0,95
8.5. En una distribución normal con media 100 y desviación típica 15, la proporción de sujetos con
puntuaciones entre 115 y 85 es igual a: A) 0,8413; B) 0,1587; C) 0,6826
8.6. Las puntuaciones en una prueba de comprensión verbal siguen la distribución normal con media
50 y desviación típica 10. ¿Qué proporción de sujetos obtienen una puntuación superior a 60?:
A) 0,1587; B) 0,5398; C) 0,8413
Tabla 1: Un psicólogo utilizó un test de analogías verbales (X) para predecir el rendimiento en
lengua de 4º de la ESO (Y). Obtuvo las puntuaciones en las dos variables en una muestra aleatoria
de 1000 estudiantes. En la tabla se muestran las medias, las varianzas y la correlación entre ambas
variables.
X Y
Media 30 15
Varianza 64 36
Correlación rXY 0,70
8.7. Sabiendo que las puntuaciones en el test de analogías verbales de la Tabla 1 se distribuyen
normalmente, ¿cuál es la proporción de sujetos con puntuaciones entre 22 y 38?: A) 0,84;
B) 0,50; C) 0,68
8.8. En una población de 2500 personas, las puntuaciones en un test de inteligencia siguen una
distribución normal con media 100 y desviación típica 15. ¿Cuántas personas tienen en el test una
puntuación superior a 130?: A) 15; B) 25; C) 57
8.9. Suponiendo que las calificaciones de los 4000 alumnos que se presentaron en la Convocatoria de
Febrero al examen de una asignatura se distribuyen normalmente con media igual a 4,7 y
1
INTRODUCCIÓN AL ANÁLISIS DE DATOS
desviación típica igual a 3. ¿Cuántos alumnos obtuvieron una calificación igual o menor a 5?
A) 1841; B) 2159; C) 2560
8.10. Las puntuaciones en un test de inteligencia siguen una distribución normal de media 100 y
desviación típica 15. Si queremos clasificar la población en cuatro grupos de igual tamaño, ¿qué
puntuaciones delimitarán estos grupos? A) 80, 100 y 120; B) 85, 100 y 115; C) 90, 100 y 110
8.11. Las puntuaciones en una prueba de psicomotricidad siguen una distribución normal con varianza
9. Si el primer cuartil vale 4, ¿cuál es la media de las puntuaciones en psicomotricidad? A) 0;
B) 1,99; C) 6,01
8.14. En una distribución Chi-cuadrado con 7 grados de libertad, el valor 1,239 corresponde al
percentil: A) 1; B) 10; C) 99
8.15. Una distribución Chi-cuadrado tiene varianza igual a 32, su media es: A) 4; B) 16; C) 32
78.16. Una variable aleatoria sigue una distribución Chi-cuadrado con varianza igual a 4. Los grados
de libertad de esta variable son: A) 8; B) 2; C) 4
8.17. En una distribución Chi-cuadrado con 60 grados de libertad, la P(X > 79,0819) es: A) 0,05;
B) 0,95; C) 0,975
2
INTRODUCCIÓN AL ANÁLISIS DE DATOS
8.18. En una variable aleatoria X que sigue la distribución Chi-cuadrado con varianza igual a 40, la
probabilidad de que (10,8508 X 28,4120) es: A) 0,95; B) 0,85; C) 0,90
8.19. Una variable se distribuye según una t de Student con 20 grados de libertad, ¿cuál es la media de
dicha variable?: A) 20; B) 0; C) hacen falta más datos para calcularla
Gráfica 2
8.22. Respecto a la Gráfica 2, ¿cuánto vale la probabilidad de un valor igual o inferior a la media de
la distribución?: A) 0; B) 0,05; C) las opciones A y B son incorrectas
8.23. La probabilidad de que una variable X que sigue una distribución t de Student con 10 grados de
libertad tome el valor -0,7 o uno menor es: A) 0,25; B) 0,50; C) 0,75
8,24. En las tablas de la t de Student con 16 grados de libertad, el percentil 90 es: A) 1,337; B) 1,537;
C) 1,737
8.25. Las puntuaciones en un test psicomotor se distribuyen según una t de Student con 40 grados de
libertad. La probabilidad de obtener puntuaciones mayores que 2,423 es: A) 0,010; B) 0,005;
C) 0,990
8.26. Una variable aleatoria se distribuye según la t de Student con varianza igual a 1,20. ¿Cuál es el
valor de la distribución que deja por encima al 20% de las observaciones? A) 0,873; B) 0,849;
C) 0,259
3
INTRODUCCIÓN AL ANÁLISIS DE DATOS
8.28. Una variable X se distribuye según la F de Snedecor con 7 grados de libertad en el numerador y
20 en el denominador. ¿Cuál es el percentil 10 de esa distribución? A) 2,595; B) 0,385; C) 2,040
8.29. La distribución F: A) es simétrica; B) puede adoptar cualquier valor entre -∞ y +∞; C) posee la
propiedad recíproca
8.30. ¿Cuál de las siguientes distribuciones se emplea habitualmente en pruebas de bondad de ajuste?:
A) Chi-cuadrado; B) t de Student; C) F de Snedecor
SOLUCIONES
8.1. A
La media y la varianza de las puntuaciones típicas son siempre 0 y 1, respectivamente. Es una
propiedad de las puntuaciones típicas.
8.2. A
P67 = 0,44 (Tabla IV)
8.3. B
Tabla III
8.4. C
Tablas III y IV
X 90 100 110 100
Z 1,67 y 1,67
6 6
P(Z ≤ 1,67) - P(Z ≤ -1,67) = 0,9525 – 0,0475 = 0,905
8.5. C
Tablas III y IV
85 100 115 100
z 1 z 1
15 15
La proporción de sujetos entre z = -1 y z = 1 es:
4
INTRODUCCIÓN AL ANÁLISIS DE DATOS
8.6. A
Tabla IV
X 60 50
z 1
10
P(Z > 1) = 1 - P(Z ≤ 1) = 1 - 0,8413 = 0,1587
8.7. C
Se pide: P(22 X 38) P( X 38) P( X 22)
Para calcular estas proporciones, transformamos las puntuaciones directas a puntuaciones típicas y
buscamos en las tablas de la distribución normal.
22 X 22 30
z 1 ; P(Z 1) 0,1587
Sx 8
38 30
z 1 ; P(Z 1) 0,8413
8
8.8. C
Tabla IV
(130 100)
z 2
15
P(Z 2) 1 P(Z 2) 1 0,9772 0,0228
8.9. B
5 4,7
z 0,1
3
5
INTRODUCCIÓN AL ANÁLISIS DE DATOS
8.10. C
Se piden los cuartiles. Buscamos en el interior de la Tablas III y IV las probabilidades 0,25, 0,50
y 0,75 y vemos que corresponden a las puntuaciones típicas -0,67, 0 y 0,67.
P25 100
0,67 P25 90
15
P50 100
0 P50 100
15
P75 100
0,67 P75 110
15
8.11. C
P25=4 y la puntuación típica que deja por debajo al 25% de los sujetos es z=-0,67 (Tabla III)
4
0,67 6,01
3
8.12. B
A la proporción 1 - 0,242 = 0,758 le corresponde una z = 0,70 P(Z ≤ 0,70) = 0,758 (Tabla
IV)
X 87 80 87 80
Z z 0,70 10
0,70
8.13. B
A = 80 en la distribución de X le corresponde una z = 0 en la distribución normal tipificada.
P(X < 80) = P(Z < 0) = 0,5 (Tabla IV)
6
INTRODUCCIÓN AL ANÁLISIS DE DATOS
8.14. A
Tabla V con 7 g.l.
8.15. B
La media y la varianza de una distribución Chi cuadrado son n y 2n, respectivamente.
32
Varianza = 2n = 32 n 16 Media = n = 16
2
8.16. B
8.1. A
P(X ≤ 79,0818) = 0,95 Tabla V para 60 g.l.
8.18. B
Buscamos en la Tabla V para 40 g.l. las probabilidades, por lo que:
8.20. C
8.21. A
P(X ≤ 4, 8652) = 0,10 (Tabla V para 10 g.l.)
8.22. C
= n = 10
Como se ve en la Tabla V para 10 g.l., la P(X ≤ 10) es un valor entre 0,10 y 0,90
7
INTRODUCCIÓN AL ANÁLISIS DE DATOS
8.23. A
P(X ≤ -0,7) = 1- P(X ≤ 0,7) = 1 - 0,75 = 0,25 (Tabla VI para 10 g.l)
8.24. A
Tabla VI para 16 g.l.
8.25. A
En la tabla VI para 40 g.l, la P(T 2,423) 0,990 . Dado que se pide la probabilidad de obtener
puntuaciones mayores o iguales que 2,423, la probabilidad es igual a 1 - 0,990 = 0,010
8.26. A
n
2 1,20 n 12 grados de libertad.
n2
P(T t12 ) 0,20 P(T t12 ) 0,80
En la tabla VI este valor es: t 12 0,873
8.27. A
Tabla VII para p = 0,95, n1=30 y n2 =7
1 1
0, 05 F7,30 0,296
0, 95 F30, 7 3,376
8.28. B
Tabla VII para p = 0,90, n1=20 y n2 =7
1 1
0,10 F7, 20 0,385
0, 90 F20, 7 2,595
8
INTRODUCCIÓN AL ANÁLISIS DE DATOS
8.29. C
8.30. A
9
INTRODUCCIÓN AL ANÁLISIS DE DATOS
9.1. El muestreo aleatorio simple: A) es el más adecuado en cualquier tipo de situación; B) Se utiliza
en otros tipos de muestreo; C) es totalmente equivalente al muestreo casual.
9.2. En el muestreo aleatorio simple, la probabilidad de que cada individuo sea elegido de la población
es: A) la misma para todos los individuos; B) distinta para cada individuo; C) la misma para
algunos individuos.
𝑖𝑖=𝑁𝑁 𝑋𝑋𝑖𝑖
9.3. La media de la distribución muestral de la media se corresponde con: A) 𝜇𝜇𝑋𝑋� ; B) ∑𝑖𝑖=1 , siendo
𝑁𝑁
N el número de sujetos en la población; C) ambas respuestas son correctas.
9.4. Para seleccionar una muestra de profesores universitarios para una encuesta, se seleccionaron al
azar algunas universidades, dentro de cada una de ellas algunas facultades y, finalmente algunas
asignaturas dentro de cada facultad. Sabiendo que la muestra está formada por todos los
profesores de las asignaturas seleccionadas, el muestreo utilizado es: A) el muestreo sistemático;
B) el muestreo por conglomerados; C) el muestreo estratificado.
9.5. En el muestreo estratificado se eligen los elementos en: A) un estrato de la población; B) algunos
estratos de la población; C) cada estrato de la población.
9.6. El muestreo estratificado es recomendable cuando en la población: A) los individuos son muy
similares entre sí; B) existen grupos de individuos claramente diferenciados; C) la proporción de
individuos es idéntica en cada uno de los estratos.
9.7. Se desea realizar una encuesta sobre los Tabla 1. Población del pueblo donde se va a
hábitos de lectura en un pueblo, cuyos realizar la encuesta, agrupada por edades.
datos de población aparecen en la Tabla 1.
La muestra necesaria para la encuesta es
de n = 500 individuos. ¿Qué tipo de
muestreo es el más aconsejable?: A)
Aleatorio simple; B) Estratificado con
afijación proporcional; C) Conglomerados.
9.8. Con los datos del ejercicio anterior
determinar cuál es la composición de la
muestra seleccionada en función de cada
estrato? A) 125, 125, 125, 125; B) 87, 189,
145, 79; C) 79, 223, 152, 46.
9.9. En un centro escolar hay 500 alumnos matriculados en la asignatura A y 500 en la asignatura B.
En cada asignatura hay 400 mujeres. Si queremos una muestra de 100 alumnos para realizar una
encuesta con una proporción de mujeres y hombres en ambas asignaturas idéntica a la del centro
escolar, ¿cuántos alumnos varones de cada asignatura deberá tener la muestra?: A) 5; B) 10; C)
40.
9.10. En el estudio de una variable X se sabe que la desviación típica poblacional es 3. Se selecciona
una muestra de tamaño 100, ¿cuál es el valor del error típico de estimación de la media : A) 0.03;
B) 0.6; C) 0.3).
1
INTRODUCCIÓN AL ANÁLISIS DE DATOS
9.21. Con los datos del ejercicio anterior, ¿cuál es la probabilidad de que la media de muestras de
tamaño 12 se encuentren entre los valores de 48 y 52 puntos? A) 0,15; B) 0,850; C) 0,70.
9.22. Sea X una variable con distribución normal en la población con 𝑁𝑁(𝜇𝜇; 6). Se extraen muestras de
tamaño 25, ¿entre que valores se encuentra el 90% central de las varianzas muestrales? A) (3,91
y 10,74); B) (19,94 y 52,44); C) (2,47 y 11,39).
9.23. Un grupo de investigación de la Universidad de Granada ha desarrollado un test que evalúa el
síndrome de Burnout. La variable se distribuye en la población normal con parámetros 𝜇𝜇 = 120
y varianza 25. Tras diversas aplicaciones para determinar si hay Burnout en los trabajadores de
enfermería de los hospitales, se llega a la conclusión de que el test es poco discriminativo, por lo
que se modifican 8 ítems. Se aplica el nuevo test a una muestra aleatoria de 40 enfermeros y se
obtienen los estadísticos correspondientes cuyos valores son: 𝑋𝑋� = 108 y 𝑆𝑆𝑋𝑋2 = 36. ¿Qué
probabilidad hay de que la nueva versión del test no haya mejorado la capacidad discriminativa?
A) 0,025; B) 0,005; C) 0,010.
2
INTRODUCCIÓN AL ANÁLISIS DE DATOS
9.24. En una encuesta sobre el acoso escolar realizada a 10.000 estudiantes de bachillerato, 6500
respondieron que no eran conscientes de que en su centro existiese este problema. Si tomamos
muestras de tamaño 25, ¿cuál es la media y la varianza de la distribución muestral del número de
estudiantes que mantienen esta opinión? A) (0,85; 0.095); B) (16,25; 21,25); C) (16,25; 5,69).
SOLUCIONES
9.1. B
9.2. A
9.3. C
9.4. B
9.5. C
9.6. B
9.7. B
9.8. C
9.9. B
Centro escolar:
Total alumnos matriculados 1000
Total mujeres matriculadas 800 (400 por asignatura)
Total hombres matriculados 200 (100 por asignatura)
Proporción de varones del centro: 200/1000 = 0,20
3
INTRODUCCIÓN AL ANÁLISIS DE DATOS
9.11. C
9.12. B
Teniendo en cuenta la definición de error típico de la media 𝜎𝜎𝑋𝑋� = √𝜎𝜎𝑛𝑛 , se observa que es
inversamente proporcional a n, en consecuencia, cuanto mayor es n menor es el error típico.
9.13. A
9.14. B
σ X = 1,5 n = 100
σ
σX = → σ = n ⋅σ X
n
9.16. C
9.17. B
Supuestos:
Variable X es una variable Bernoulli (lee periódico o no lo lee)
Se conoce el valor π en la población
Las n observaciones son independientes
La muestra es grande n>30
Por tanto se resuelve por aproximación a la normal (pág. 410; formula9.4)
𝜎𝜎 0,50
𝜎𝜎𝑝𝑝 = = = 0,071
√𝑛𝑛 √49
9.18. A
𝜎𝜎 3,5
𝜇𝜇 = 23 𝑦𝑦 = = 0,7
√𝑛𝑛 √25
4
INTRODUCCIÓN AL ANÁLISIS DE DATOS
Dado que X es de distribución desconocida y n es 25 (25 < 30), solo se puede afirmar que la
media de la distribución muestral de las medias es 23 y su error típico 0,7, pero no podemos decir cuál
es su distribución.
9.19. C
σ 2 = Varianza poblacional 272 = 729
9.20. A
Dado que desconocemos la varianza poblacional y que la variable X se distribuye normal, la
� → 𝑡𝑡 �50; 6,36�
distribución de la media muestral sigue una t (pág. 406) cuyos parámetros son: ) X
√9
� → 𝑡𝑡(50; 2,12) con 8 g.l.
X
𝑛𝑛 𝑆𝑆𝑥𝑥2
𝜇𝜇 = 50; 𝑆𝑆𝑛𝑛−1 = = 6,36
𝑛𝑛−1
9.21. C
2 𝑛𝑛 𝑆𝑆𝑥𝑥2 12 × 36
Dado que ahora n = 12; 𝑆𝑆𝑛𝑛−1 = = = 39,27; de donde: 𝑆𝑆𝑛𝑛−1 = √39,27 = 6,27
𝑛𝑛−1 11
𝑋𝑋�−𝜇𝜇 48−50 −2 𝑋𝑋�−𝜇𝜇 50−50 2
𝑇𝑇 = 𝑆𝑆𝑛𝑛−1 = 6,27 = 6 ,27� = − 1,16 y 𝑇𝑇 = 𝑆𝑆𝑛𝑛−1 = 6,27 = 6 ,27� = 1,16 (aunque
� � 3,46 � � 3,46
√𝑛𝑛 √12 √𝑛𝑛 √12
este cálculo es incensario en este caso dada la simetría).
Acudiendo a la Tabla VI podemos calcular las probabilidades correspondientes (recordar que t es
simétrica)
P(T≤ 𝑡𝑡11 ) = P(T≤ 1,16) = 0,850
𝑃𝑃(𝑋𝑋� ≤ 48) = 1 − 0,850 = 0,15 y 𝑃𝑃(𝑋𝑋� ≥ 50) = 0,850
Por tanto P (48 ≤ 52) = 0,850 - 0,15 = 0,7
9.22. B
2
Se trata de la distribución muestral de la varianza. Sabemos que dicha distribución es χ𝑛𝑛−1
2
(Pág. 415). Hay que recordar también que el estimador de 𝜎𝜎 2 es 𝑆𝑆𝑛𝑛−1 .
2
𝑃𝑃�𝜒𝜒2 ≤ χ𝑛𝑛−1 � = 0,05
Acudiendo a la Tabla V con 24 grados de libertad, los valores de 𝜒𝜒 2 correspondientes son:
2
χ24;0,05 = 13,8484
Χ 224;0,95 = 36,4150
Los valores buscados son los límites del intervalo de probabilidad anterior que son:
2
𝑛𝑛 𝑆𝑆𝑥𝑥2 2
χ224;0,05 × 𝜎𝜎 2 13,8484 × 36
χ24;0,05 = → lim inf 𝑆𝑆𝑥𝑥 = = = 19,94
𝜎𝜎 2 𝑛𝑛 25
2
2
2
𝑛𝑛 𝑆𝑆𝑥𝑥 2
χ24;0,95 × 𝜎𝜎 2 36,4150 × 36
χ24;0,95 = → lim sup 𝑆𝑆𝑥𝑥 = = = 52,44
𝜎𝜎 2 𝑛𝑛 25
5
INTRODUCCIÓN AL ANÁLISIS DE DATOS
9.23. A
Se entiende que un test no mejora su capacidad de discriminación cuando la varianza
2
poblacional se mantiene. Sabemos que la distribución muestral de la varianza es χ𝑛𝑛−1 . Por tanto para
nuestros datos:
𝑛𝑛𝑆𝑆 2 40 × 36
χ2𝑛𝑛−1 = = = 57,6
𝜎𝜎 2 25
2 2
𝑃𝑃(𝜒𝜒39 ≥ 57,6) = 1 − 𝑃𝑃(𝜒𝜒39 ≤ 57,6) = (1 − 0,975) = 0,025
Es decir, que hay una probabilidad muy pequeña 0.025 (2,5%) de obtener varianzas iguales o
mayores de 36 bajo el supuesto de que no mejora la capacidad discriminativa del test. Por tanto,
parece que las modificaciones introducidas incrementan la discriminación.
9.24. C
Aplicación directa de la distribución binomial:
La pregunta se refiere al nº de éxitos (en este caso, al número de alumnos) que se corresponde con la variable
X, según lo dicho en el apartado 9.5.1 pág. 409: “Para muestras pequeñas l distribución muestral del
estadístico X (número de éxitos en n ensayos) es:
La intención de este ejercicio es que se den cuenta de que no es lo mismo la distribución muestral del
número de éxitos que la distribución muestral de la proporción (que por otra parte no es más que una
transformación lineal de la variable número de éxitos definida como P=X/n)
6500
Por tanto: 𝐸𝐸(𝑋𝑋) = 𝑛𝑛𝑛𝑛 = 25 × = 16,25
10000
Y 𝜎𝜎𝑋𝑋2 = 5,69
6
INTRODUCCIÓN AL ANÁLISIS DE DATOS
10.1. Para estimar la media poblacional de una variable X (cuya distribución es normal)
y cuya desviación típica poblacional es 4, hemos seleccionado mediante m. a. s.
una muestra de 100 personas, obteniendo un valor para la media en la muestra de
10. Trabajando con un nivel de confianza del 95%. ¿Cuáles son los límites del
intervalo confidencial? A) (8,968 y 11,032); B) (9,216 y 10,784); C) (8 y12).
10.2. En un estudio sobre el optimismo de los adolescentes andaluces, la amplitud del
intervalo de confianza es de 2,8 puntos para un nivel de confianza de 0,95. En una
muestra de adolescentes de la Comunidad Andaluza, extraída aleatoriamente de la
población, se ha obtenido un valor para la media de la variable optimismo de 16.
¿Cuáles son los límites entre los cuáles se estima está el optimismo medio de la
población de adolescentes? A) (10,4 y 21,6); B) (13,2 y 18,8); C) (14,6 y 17,4).
10.3. Se aplicó un test de fluidez verbal (cuya distribución en la población es normal) a
una muestra de 121 abogados. La muestra se obtuvo mediante m. a. s. de la
población de abogados de la Comunidad de Madrid. Se sabe que en la población
el test tiene una varianza de 100, habiéndose obtenido en la muestra de estudio un
valor para la media de 105. Con un nivel de riesgo de 0,05, ¿entre qué valores
estará comprendida la media poblacional en fluidez verbal de abogados de la
Comunidad de Madrid? A) (87,19 y 122,81); B) (100,95 y 109,05); C) (103,22 y
106,78).
10.4. Los límites del intervalo de confianza para la autoestima media de adolescentes
con anorexia es 3,02 y 4,98 en una muestra de tamaño n = 36, siendo el nivel de
confianza igual a 0,95 y igual a 3. ¿Calcular el valor de la media de la muestra
de trabajo?: A) 4; B) 6; C) 8.
10.5. Se extrae, mediante m.a.s., una muestra de tamaño 100 de la población de
estudiantes de medicina de la UCM, a los que y se les administra un test que
valora la autoestima. Se calcula el intervalo de confianza con un nivel de
significación 0,05 para la autoestima media, siendo el valor de los límites:
8,50 y 11,50. ¿Se puede afirmar que la autoestima media de los estudiantes de
medicina de la UCM está entre 8,50 y 11,50? A) Con total seguridad; B) Con
ninguna seguridad; C) Con un nivel de riesgo de 0,05.
10.6. Para los datos del ejercicio anterior y sabiendo que la media de la muestra es 9,35
y la cuasidesviación típica 4,35, ¿cuál es el intervalo de confianza para la media
con un nivel de confianza de 99%?: A) (9,40 y 12,34); B) (7,45 y 10,99); C) (8,23
y 10,47).
10.7. Se sabe que la inteligencia espacial presenta una distribución normal en la
población de estudiantes universitarios. Mediante m.a.s. se extrae una muestra
aleatoria de 100 estudiantes de Bellas Artes de la UCM y se les mide (mediante el
test correspondiente) la inteligencia espacial, obteniendo un valor para la media
de 135 y una desviación típica de 16. ¿Cuál de los siguientes es el intervalo de
confianza de la media poblacional siendo el nivel de riesgo 0,01? A) (99,23 y
150,45); B) (130,78 y 139,22); C) (100,34 y 128,93).
INTRODUCCIÓN AL ANÁLISIS DE DATOS
10.8. Con los datos del ejercicio anterior, ¿cuál de los siguientes intervalos corresponde
estima la varianza manteniendo el nivel de riesgo en 0,01? A) (182,63 y 380,23);
B) (132,89 y 163,58); C) (197,76 y 245,89).
10.9. La proporción de alumnos del grado que aprueban la materia de memoria es
560/800. ¿Cuál de los siguientes intervalos se corresponde con el intervalo de
confianza para la proporción de aprobados en memoria en muestras de tamaño 30,
siendo A) (0,53 y 0,86); B) (0,48 y 0,86); C) (0,48; y 0,92).
10.10. El 70% de los estudiantes de un Centro Asociado utilizan para estudiar la
biblioteca. ¿Cuál de los siguientes intervalos se corresponde con el intervalo de
confianza en el que se encuentra el 95% de la proporción de estudiantes que
utilizan la biblioteca en muestras de tamaño 40? A) (0,51 y 0,89; B) (0,56 y 0,84);
C) (0,51 y 0,84).
10.11. Si incrementamos el tamaño de las muestras, ¿se verá afectado el intervalo de
confianza calculado? A) No, el tamaño muestral no afecta al intervalo: B) Sí,
aumentaría su precisión ya que disminuye su amplitud; C) No se puede responder
sin calcularlo ya que la distribución muestral de la proporción ya no se ajustaría a
la normal.
10.12. Se realiza una encuesta a 150 jóvenes de una determinada población y se
encuentra que 25 de ellos fuman sustancias tóxicas. ¿Cuál de los siguientes
intervalos de confianza corresponde a la proporción real de jóvenes que fuman
este tipo de sustancias aceptando un riesgo de 0,01? A) (0,0876 y 0,225); (B)
(0,106 y 0,225); C) (0,0876 y 0,244).
10.13. La media de una muestra compuesta por 80 sujetos en la variable neuroticismo es
98 y la cuasidesviación típica 25. ¿Cuál de los siguientes intervalos de confianza
para la media se corresponde con un nivel de confianza de 99%? A) (90,79 y
105,21); B) (92,52 y 103,48); C) (93,42 y 102,58).
10.14. Con los datos del ejercicio anterior, suponiendo que el intervalo de confianza
calculado fuese (93,42; 102,58), ¿se podría conocer a qué nivel de confianza se ha
trabajado? A) No, porque lo fija el investigador de forma arbitraria; B) Sí, pero
los datos son insuficientes; C) 0,90.
10.15. La distribución de la variable autoritarismo, medida mediante el test de RWA, se
distribuye en la población según la normal. Una muestra de 30 personas
responden al test y se obtiene una media de 45 puntos y un cuasivarianza de 100.
¿Cuál de los siguientes intervalos corresponde al de la varianza poblacional
siendo el nivel de confianza del 0,90? A) (68,14 y 163,71); B) (49,40 y 150,61);
C) (93,43 y 180,72).
10.16. El nivel de competencia lectora se distribuye normalmente en la población de
estudiantes de la ESO, con una desviación típica igual a 6. Si el error máximo de
estimación que estamos dispuestos a admitir no puede ser superior a 2, y siendo el
nivel de confianza de 0,95. ¿Qué tamaño debe tener la muestra para estimar la
media asumiendo población infinita? A) 35; B) 58; C) 69.
10.17. La amplitud deseada de un intervalo de confianza para la media asumiendo
población infinita es 4. Para un nivel de confianza igual a 0,95, ¿cuál debe ser el
INTRODUCCIÓN AL ANÁLISIS DE DATOS
SOLUCIONES
10.1. B
Variable con distribución normal y varianza poblacional conocida, por tanto, la
distribución muestral de la media es: ( ⁄ )
√
El intervalo confidencial viene definido por:
(̅ | ⁄ | ⁄ ̅ | ⁄ | ⁄ )
√ √
Sustituyendo:
10.2. C
Recuérdese que el IC se define de forma general:
IC = [ ] (pág. 458 libro)
Siendo los límites:
; )
Por tanto, la amplitud del intervalo de confianza es:
( ) ( )
En el problema que hemos planteado
Sustituyendo:
̅
̅
Por tanto, el intervalo correspondiente es: (14,6; 17,4)
10.3. C
Variable con distribución normal y varianza poblacional conocida. Por tanto, la
distribución muestral de la media es: ( ⁄ )
√
(̅ | ⁄ | ⁄ ̅ | ⁄ | ⁄ )
√ √
Siendo los límites:
̅ | | ⁄ ̅ | | ⁄
√ √
Aplicado a nuestros datos:
0,05 | ⁄ | | | (Tabla III y IV);
10.4. A
Variable con distribución normal y varianza poblacional conocida. Por tanto, la
distribución muestral de la media es: ( ⁄ )
√
(̅ | ⁄ | ⁄ ̅ | ⁄ | ⁄ )
√ √
siendo los límites del intervalo de confianza:
̅ | | ⁄ ̅ | | ⁄
√ √
INTRODUCCIÓN AL ANÁLISIS DE DATOS
| ⁄ | ̅
√
De donde:
⁄ ̅
√
Caben tres soluciones:
̅ ̅
̅ ̅
10.5. C
10.6 C
Desconocemos la distribución de la variable autoestima en la población y,
tampoco conocemos la varianza poblacional. Dado que el tamaño muestral es grande
(n=100), podemos aplicar el Teorema del Límite Central y resolver mediante la
aproximación de la t de Student a la normal.
Por tanto:
(̅ | ⁄ | ̅ | ⁄ | )
√ √
̅ | ⁄ | ̅ | ⁄ |
√ √
10.7. B
Dado que desconocemos la varianza poblacional pero sabemos que la variable
inteligencia espacial se distribuye en la población según la normal, la distribución
muestral de la ̅ bajo estas condiciones sigue la t de Student, ̅ ( )
√
Por tanto el intervalo de confianza queda definido como:
(̅ | ⁄
| ̅ | ⁄ )
| )
√ √
̅ | | ̅ | |
⁄ ⁄
√ √
Luego: √ √
Linf = 135 – 2,626 x = 130,78
√
( ) ( )
( )
( ⁄ )
( ) ( )
⁄
⁄ y ⁄ (Tabla V)
( ) ( )
⁄
( ) ( )
⁄
10.9. C
Dado que las muestras son de tamaño 30, podemos considerar la aproximación a la
normal, es decir la proporción de aprobados en memoria en muestras de tamaño 30 se
distribuye:
( )
( √ )
( ) ( )
( | ⁄ |√ | ⁄ |√ )
Y los límites:
( ) ( )
| ⁄ |√ | ⁄ |√
; 1 - p = 1 - 0,7 = 0,3; √
( )
| ⁄ |√
( )
| ⁄ |√
10.10. B
INTRODUCCIÓN AL ANÁLISIS DE DATOS
Dado que las muestras son de tamaño 40, podemos considerar la aproximación a la
normal. Es decir, la proporción de estudiantes que utilizan la biblioteca se distribuye
( )
N( √ )
donde:
( ) ( )
( | ⁄ |√ | ⁄ |√ )
( ) ( )
| ⁄ |√ | ⁄ |√
; 1 - p = 1 - 0,7 = 0,3
( )
√ √
( )
| ⁄ |√ ( )
( )
| ⁄ |√
10.12 C
| ⁄ | | ⁄ | | | (Tabla III y IV)
Dado que la muestra es de tamaño 150, podemos considerar la aproximación a la
normal. Es decir, la proporción de estudiantes que fuman sustancias se distribuye
( )
( √ )
donde:
INTRODUCCIÓN AL ANÁLISIS DE DATOS
( ) ( )
( | ⁄ |√ | ⁄ |√ )
( ) ( )
| ⁄ |√ | ⁄ |√
( )
√ √
Por tanto:
( )
| ⁄ |√ ( )
( )
| ⁄ |√ ( ) 0,244
10.13. A
Desconocemos la distribución de la variable autoestima en la población y la varianza
poblacional. Dado que el tamaño muestral es grande (n = 80), podemos aplicar el
Teorema del Límite Central y resolver mediante la aproximación de t de Student a la
normal.
Por tanto:
(̅ | ⁄ | ̅ | ⁄ | )
√ √
̅ | ⁄ | ̅ | ⁄ |
√ √
̅ | ⁄ |
√ √
̅ | ⁄ |
√ √
El intervalo es: (90,79; 105,21)
10.14. C
̅ | ⁄ | | ⁄ |
√ √
de donde:
| ⁄ |
| ⁄ |
(n.c.) = 0,90
10.15. A
( ) ( )
( )
( ⁄ )
( ) ( )
⁄
INTRODUCCIÓN AL ANÁLISIS DE DATOS
⁄ (Tabla V)
Por tanto:
( ) ( )
⁄
( ) ( )
⁄
El intervalo es: (68,14; 163,71)
10.16. A
n.c. = 0,95 → ⁄ (Tabla III y IV)
⁄ 1,962 62
34,57 35
22
10.17. C
n.c. = 0,95 → ⁄ (Tabla III y IV)
= 4/2 = 2
⁄ 1,96 2 x10 2
96,04 96
22
10.18. A
=2
12,24
2 z / 2 z / 2 1,96
144
z / 2 1,96 1 / 2 0,975 (Tabla III y IV)
/ 2 1 0,975 0,025
0,025 2 0,05
0,05
1 1 0,05 0,95 n.c. 0,95
INTRODUCCIÓN AL ANÁLISIS DE DATOS
10.19. B
n.c. = 0,95 → ⁄ (Tabla III y IV)
4
E máx z / 2 1,96 0,784
n 100
LSup X Emax X LSup Emax 3,784 0,784 3
10.20. A
n.c. = 0,95 → ⁄ (Tabla III y IV)
σ
5,588 5 1,96
100
1,96 0,588
10
10 0,588 5,88
σ 3
1,96 1,96
10.21. A
Linf X Emax
4,412 5 Emax
10.22. C
Sería menor porque el error de estimación máximo es inversamente proporcional
al tamaño muestral (página 458)
10.23. B
Ya que se desconoce la proporción deberemos tomar el caso más desfavorable.
Es decir: P = 0,5 (página 465), y el muestreo es con reposición. Por tanto:
⁄
( )
10.24. A
Sabemos, por el estudio anterior que p = 0,4, por lo que: (1- p) = 0,6.
INTRODUCCIÓN AL ANÁLISIS DE DATOS
⁄
( )
10.25. C
Si n > 100 (en nuestro caso n = 400) podemos aplicar la aproximación a la normal,
siendo en este caso (pág. 455)
| ⁄ | √ √ 11,23
presente que el error típico de estimación es √ y, por tanto, según la definición del