Está en la página 1de 95

INTRODUCCIÓN AL ANÁLISIS DE DATOS

EJERCICIOS RESUELTOS TEMA 1.

1.1. El proceso por el cual se asignan números a objetos o características según determinadas
reglas se denomina: A) muestreo; B) estadística; C) medición.
1.2. Mediante la Estadística Descriptiva se organizan y resumen conjuntos de observaciones
procedentes de: A) muestras exclusivamente; B) muestras aleatorias exclusivamente;
C) muestras o poblaciones totales
1.3. La estadística inferencial: A) permite analizar descriptivamente la muestra bajo estudio; B) no
tiene en cuenta las leyes de probabilidad; C) permite realizar generalizaciones a la población
con una muestra
1.4. Un estadístico: A) se puede utilizar para estimar algún parámetro de la población; B) adopta
el mismo valor en cada muestra; C) coincide con el parámetro cuando el muestreo es
probabilístico
1.5. La variable Género, con las categorías Hombre y Mujer, está medida en una escala: A) de
razón ; B) ordinal ; C) nominal

1.6. La variable X, puntuaciones en una prueba X Mujeres Varones


de fluidez verbal, recogida en la Tabla 1, 8-9 20 12
es: A) dicotómica; B) cualitativa; C) 6-7 16 13
cuantitativa 4-5 10 17
2-3 8 10
1.7. Los datos recogidos en la Tabla 1, en 0-1 6 8
fluidez verbal (X), para el grupo de ∑ 60 60
mujeres pueden representarse mediante un:
A) histograma; B) diagrama de sectores; Tabla 1: Resultados obtenidos por un grupo de 60
C) diagrama de dispersión mujeres y 60 hombres en una prueba de fluidez
verbal (X)

1.8. La variable tipo de trastorno psicológico puede adoptar los valores depresión y trastorno de
personalidad. ¿Qué nivel de medida presenta? A) Nominal; B) Ordinal; C) De razón

1.9. La variable Poder adquisitivo de la Figura 1,


está medida en una escala: A) de razón; B)
ordinal; C) nominal

1.10. Con los datos de la Figura 1, el número de


familias con un nivel alto en la variable Poder
adquisitivo es de: A) 5; B) 45; C) 95

Figura 1. Poder adquisitivo de las familias


que participan en una investigación.

1
INTRODUCCIÓN AL ANÁLISIS DE DATOS

1.11. Para que tenga sentido calcular las frecuencias acumuladas de una variable, ésta debe ser,
como mínimo: A) nominal; B) ordinal; C) de intervalo.
1.12. En la Tabla 2, la variable “grupo” es: A) de intervalo; B) nominal; C) politómica
1.13. En la Tabla 2, la frecuencia absoluta del intervalo 4-8 del grupo clínico es: A) 33; B) 17;
C) 11

Tabla 2: Distribución de frecuencias relativas en un cuestionario de depresión aplicado a 300 personas del
grupo “clínico” (enfermos) y a 200 del grupo “no clínico” (sanos).

pi
X
Grupo clínico Grupo no clínico
24-28 0,32 0,08
19-23 0,24 0,25
14-18 0,19 0,34
9 -13 0,14 0,23
4-8 0,11 0,10

1.14. El número de sujetos de una muestra que realizaron correctamente una tarea de discriminación
en un experimento psicofísico es 80, lo que representa el 40% de la muestra. ¿Cuál el número
de sujetos de la muestra? A) 200; B) 320 ; C) 500
1.15. En la Situación 1, el número de sujetos con edades comprendidas entre 20,5 y 23,5 es A) 22;
B) 50; C) 100

Situación 1. La gráfica muestra la distribución de la edad (X) de los 250 sujetos de una investigación. En el
eje horizontal, se recogen los límites exactos de los intervalos de X y en el eje vertical la frecuencia
absoluta acumulada (na)

1.16. Las puntuaciones de una distribución de frecuencias están agrupadas en 4 intervalos


ordenados de menor a mayor, siendo los puntos medios de estos intervalos: 2, 5, 8 y 11. La
amplitud de los intervalos: A) es 2; B) es 3; C) no se puede calcular
1.17. El número de enfermos de la muestra de la Figura 2 es: A) 70; B) 80; C) 200
1.18. La Figura 2 es: A) un histograma; B) un diagrama de dispersión; C) un polígono de frecuencia

2
INTRODUCCIÓN AL ANÁLISIS DE DATOS

Figura 2: Número de conductas obsesivas observadas durante un día, en una muestra de n enfermos

1.19. Según la Figura 3, la distribución de frecuencias de los alumnos de bachillerato es: A)


asimétrica positiva; B) asimétrica negativa; C) simétrica.

Figura 3. Distribuciones de frecuencias obtenidas al aplicar una misma prueba de competencia


lectora a alumnos de: (a) Primaria, (b) Secundaria y (c) Bachillerato.

1.20. En una escala de intervalo se han asignado a tres sujetos los valores X=0, X=3, y X=6. Con
esta escala es correcto afirmar que: A) el tercer sujeto con X=6 tiene el doble de la variable
medida que el segundo sujeto con X=3; B) el primer sujeto presenta carencia absoluta de
variable medida; C) la diferencia entre X=0 y X=3 es la misma que entre X=3 y X=6 en la
variable medida.
1.21. La amplitud del intervalo en la distribución de frecuencias de la Tabla 3 es: A) 5; B) 4; C) 6.

Tabla 3: Puntuaciones de 200 universitarios en una X ni


escala de actitudes agrupadas en intervalos y las 64-69 4
frecuencias absolutas (ni) de cada intervalo 58-63 16
52-57 14
46-51 22
40-45 32
34-39 44
28-33 42
22-27 18
16-21 8

3
INTRODUCCIÓN AL ANÁLISIS DE DATOS

1.22. La variable número de asignaturas matriculadas en la UNED según los datos proporcionados
en la Situación 2 es: A) de intervalo; B) de razón; C) continua
1.23. ¿Qué distribución de frecuencias de la Situación 2 está agrupada en intervalos de amplitud 2?
A) La distribución 1; B) La distribución 2; C) La distribución 3.

Situación 2. El número de asignaturas matriculadas en la UNED por un grupo de 40 estudiantes es:


X: 2, 6, 3, 4, 4, 6, 5, 2, 3, 3, 5, 10, 8, 5, 4, 7, 3, 2, 1, 4, 5, 4, 6, 8, 7, 4, 3, 2, 7, 9, 4, 1, 6, 3, 5, 4, 3, 5, 5, 2.
Con estos datos pueden realizarse distintas distribuciones de frecuencias, como las tres siguientes:

Distribución 1 Distribución 2 Distribución 3


X ni X ni X ni
9-10 2 9-11 2 7 o más 7
7-8 5 6-8 9 6 4
5-6 11 3-5 22 5 7
3-4 15 0-2 7 4 8
1-2 7 3 7
2 5
1 2

1.24. ¿Cuáles son los límites exactos del intervalo aparente 32,74 - 32,75? A) 32,73 - 32,76;
B) 32,735 - 32,755; C) 32,745 - 32,755.

1.25. Según los resultados de la Figura 4, si


fueran 60 las víctimas que
participaron en el proyecto, ¿cuántos
presentarían un trastorno por estrés
postraumático? A) 27; B) 45; C) 75.

Figura 4. Trastornos psicológicos que presentan las


víctimas del 11M según los resultados del proyecto
de Apoyo Psicológico a Afectados de Terrorismo.

4
INTRODUCCIÓN AL ANÁLISIS DE DATOS

SOLUCIONES
1.1. C
1.2. C
1.3. C
1.4. A
1.5. C
1.6. C
1.7. A
1.8. A
1.9. B
1.10. A
Dado que se trata de un diagrama de barras acumulativo, el nº de familias con un nivel alto
de poder adquisitivo será 45-40=5
1.11. B
1.12. B
1.13. A
ni  npi  300  0,11  33
1.14. A
ni = 80 pi = 0,40
pi = ni / n  n = ni / pi
n = 80 / 0,40 = 200
1.15. B
Dado que se trata de un histograma acumulativo, el nº de sujetos con edades comprendidas
entre 20,5 y 23,5 es 100-50 =50
Límites exactos ni na
29,5 – 32,5 50 250
26,5 – 29,5 50 200
23,5 – 26,5 50 150
20,5 – 23,5 50 100
17,5 – 20,5 50 50

1.16. B
La diferencia entre cada dos puntos medios consecutivos es 3 por lo que la amplitud de los
intervalos es 3.
1.17. C
n = 10 + 20 + 70 + 60 + 30 + 10 = 200
1.18. C
5
INTRODUCCIÓN AL ANÁLISIS DE DATOS

1.19. B
1.20. C
1.21. C
1.22. B
1.23. A
1.24. B
0,01:2=0,005
Li = 32,74 – 0,005 =32,735
Ls = 32,75 + 0,005 =32,755
1.25. A

6
INTRODUCCIÓN AL ANÁLISIS DE DATOS

EJERCICIOS RESUELTOS TEMA 2

2.1. La Moda para el grupo de Varones de la


Tabla 1 es: A) 4,5; B) 17; C) 60. X Mujeres Varones
8-9 20 12
2.2. Con los datos de la Tabla 1, la media en X 6-7 16 13
para las Mujeres es: A) igual a la media 4-5 10 17
para los Varones; B) mayor que la media 2-3 8 10
para los Varones; C) menor que la media 0-1 6 8
para los Varones ∑ 60 60
2.3. El Percentil 30, para el grupo de Mujeres en
la Tabla 1, es: A) 3; B) 4,3; C) 7,5. Tabla 1. Resultados obtenidos por un grupo de
60 mujeres y 60 hombres en una prueba de
fluidez verbal (X)

2.4. La media ponderada para el total de la muestra de personas (hombres y mujeres) que han
realizado la prueba de fluidez verbal de la Tabla 1 es: A) 5,29; B) 6,52; C) 5,7.
2.5. Según los datos obtenidos en las Figuras 1 y 2, las niñas obtuvieron en media: A) más puntos
que los niños; B) los mismos puntos que los niños; C) menos puntos que los niños.

Figura 1. Nº niñas de 9 años Figura 2. Nº niños de 9 años

En las abscisas se muestran los intervalos aparentes del número de puntos obtenidos por cada niña o niño,
en un juego de ordenador en una hora. La Figura 1 corresponde a 15 niñas de nueve años y la Figura 2 a
10 niños de nueve años. En las ordenadas están las frecuencias de cada intervalo.

2.6. La mediana de las puntuaciones obtenidas con los datos de la Figura 1 es: A) 26,5; B) 27,0; C)
28,6.
2.7. La puntuación media total de los 25 niños (incluyendo a niños y niñas) en el juego de
ordenador es: A) 27,25; B) 27,60; C) 27,90.

1
INTRODUCCIÓN AL ANÁLISIS DE DATOS

2.8. Con los datos de la Tabla 2, ¿qué percentil Tabla 2. Distribución de frecuencias de las
le corresponde a un alumno con una puntuaciones obtenidas por 80 sujetos en un test
puntuación de 47?: A) 62; B) 75; C) 78. de inteligencia emocional. Sabemos que la
2.9. Con los datos de la Tabla 2, el valor de la desviación típica es igual a 5,86.
mediana es: A) 42; B) 44; C) 50
X ni
30-34 10
35-39 15
40-44 30
45-49 15
50-54 10

2.10. ¿Qué porcentaje de niños de 12 meses de Tabla 3. Estatura en centímetros de 100 niños de
la Tabla 3 tienen menor estatura que un 12 meses de edad.
niño de esa edad que mide 80 Estatura Frecuencia
centímetros? A) 50; B) 90; C) 95. 79-81 10
2.11. Con los datos de la Tabla 3, ¿cuál es la 76-78 25
moda de la distribución? A) 45; B) 74; C) 73-75 45
80 70-72 20

2.12. Con los datos de la Tabla 4, el tercer cuartil de los niños de la ciudad A es igual a: A) 16; B)
14,5; C) 13,5

X Ciudad A Ciudad B
17-20 10 17
13-16 20 27
9-12 25 15
5-8 15 12
1-4 10 9
80 80
Tabla 4: Puntuaciones obtenidas en un test de aptitud numérica por dos grupos de niños de dos
ciudades distintas. Los de la ciudad A, presentan una media de 10,75, mientras que en los de la ciudad
B la desviación típica es de 5,12.

2
INTRODUCCIÓN AL ANÁLISIS DE DATOS

2.13. En la Situación 1, la
distribución de la edad de los Situación 1. La gráfica muestra la distribución de la edad (X) de
sujetos: A) no tiene moda; B) los 250 sujetos de una investigación. En el eje horizontal, se
tiene una moda; C) tiene dos recogen los límites exactos de los intervalos de X y en el eje
vertical la frecuencia absoluta acumulada (na).
modas
2.14. En la Situación 1, el 80% de
los sujetos tiene una edad
menor que: A) 26,5; B) 28;
C) 29,5
2.15. En la Situación 1, la edad
media de los sujetos es: A) 25;
B) 50; C) 150

Tabla 5. Tiempo de reacción de 100 estudiantes en una


2.16. Atendiendo a los datos de la Tabla tarea de atención visual focalizada.
5, la mediana del tiempo de reacción
es: A) 30; B) 347,2; C) 360,5. Tiempo de
Frecuencia
reacción
2.17. ¿Cuál es la moda de la variable 381-400 10
tiempo de reacción según los datos de 361-380 20
la Tabla 5? A) 30; B) 340,5; C) 350,5. 341-360 30
321-340 25
301-320 15
100

2.18. En un test los seis primeros alumnos han obtenido las puntuaciones: 5, 10, 15, 16, 9, 10. La
mediana de estas puntuaciones es : A) 15,5; B) 10; C)15.

2.19. Con los datos de la tabla 6, la media en el Tabla 6. Distribución de frecuencias relativas en un
grupo “no-clínico” es igual a: A) 14,5; B) cuestionario de depresión aplicado a 300 personas
15,9; C) 18,3. del grupo “clínico” (enfermos) y a 200 del grupo
2.20. Con los datos de la tabla 6, una persona “no clínico” (sanos).
que ha obtenido una puntuación de 17 en
el grupo “clínico”, ¿qué porcentaje de pi
X
personas dejaría por debajo de sí?: A) G. clínico G. no clínico
38,3%; B) 44,0%; C) 25,5% . 24-28 0,32 0,08
19-23 0,24 0,25
14-18 0,19 0,34
9 -13 0,14 0,23
4-8 0,11 0,10

3
INTRODUCCIÓN AL ANÁLISIS DE DATOS

2.21. Con los datos de la tabla 7, ¿cuál de las siguientes medidas de tendencia central tendrá el
valor más alto? A) la media; B) la mediana; C) la moda.

Tabla 7. Resultados en un test de agudeza visual (X) de siete personas en una investigación sobre
la miopía.
Persona Xi
1 20
2 6
3 9
4 6
5 12
6 8
7 16

2.22. Atendiendo a la tabla 8, el decil 2 es: A) 28,5; B) 30,5; C) 29,5.

Tabla 8. Puntuaciones de 200 universitarios en una escala de actitudes agrupadas en


intervalos y las frecuencias absolutas (ni) de cada intervalo. La varianza de esta distribución
es igual a 132,84.

X ni
64-69 4
58-63 16
52-57 14
46-51 22
40-45 32
34-39 44
28-33 42
22-27 18
16-21 8

2.23. Teniendo en cuenta únicamente los datos de la distribución 3 presentada en la Situación 2, la


media: A) es igual a 4,3; B) es igual a 5; C) no se puede calcular.

4
INTRODUCCIÓN AL ANÁLISIS DE DATOS

Situación 2. El número de asignaturas matriculadas en la UNED por un grupo de 40


estudiantes es:
X: 2, 6, 3, 4, 4, 6, 5, 2, 3, 3, 5, 10, 8, 5, 4, 7, 3, 2, 1, 4, 5, 4, 6, 8, 7, 4, 3, 2, 7, 9, 4, 1, 6, 3, 5, 4, 3,
5, 5, 2.
Con estos datos pueden realizarse distintas distribuciones de frecuencias, como las tres siguientes:

Distribución 1 Distribución 2 Distribución 3


X ni X ni X ni
9-10 2 9-11 2 7 o más 7
7-8 5 6-8 9 6 4
5-6 11 3-5 22 5 7
3-4 15 0-2 7 4 8
1-2 7 3 7
2 5
1 2

2.24. Atendiendo a los datos de la Situación 2, el tercer cuartil de la distribución 1 es: A) 5,96; B)
8,75; C) 75.
2.25. Con los datos de la Figura 3, ¿cuál es la moda de la variable trastorno psicológico?: A) 45;
B) Es amodal; C) Trastorno por estrés postraumático.

Figura 3. Trastornos psicológicos que presentan las víctimas del 11M según los resultados del
proyecto de Apoyo Psicológico a Afectados de Terrorismo.

5
INTRODUCCIÓN AL ANÁLISIS DE DATOS

SOLUCIONES

2.1. A
La moda es el punto medio del intervalo con mayor frecuencia:
 4  5
Mo    4,5
 2 

2.2. B

Mujeres Varones 342


XM   5,7
X nM nV Xi Xi nM Xi nV 60
8-9 20 12 8,5 170 102
6-7 16 13 6,5 104 84,5 292
XV   4,87
4-5 10 17 4,5 45 76,5 60
2-3 8 10 2,5 20 25
0-1 6 8 0,5 3 4
60 60 342 292

2.3. B
X nM na
8-9 20 60
6-7 16 40
4-5 10 24  60·30 
  14 
2-3 8 14 P30  3,5   100 ·2  3,5   4 ·2  3,5  0,8  4,3
0-1 6 6  10   10 
 
60  

2.4. A

Grupo ni XJ
Mujeres 60 5,7
Varones 60 4,87
120

La media total, de las 120 personas, se obtiene aplicando la fórmula de la media ponderada:

n1  X1  n2  X 2    nJ  X J 60  5,7  60  4,87 634,2


Xp     5,285  5,29
n1  n2    nJ 60  60 120

6
INTRODUCCIÓN AL ANÁLISIS DE DATOS

2.5. A
Xniñas ni Xi Xini
36-40 3 38 114
31-35
26-30
3
4
33
28
99
112 X niñas 
n X i i

435
 29
21-25 4 23 92 n 15
16-20 1 18 18
15 435

Xniños ni Xi Xini
36-40 1 38 38
31-35
26-30
1
2
33
28
33
56 X niños 
n X
i i

255
 25,5
21-25 4 23 92 n 10
16-20 2 18 36
10 255

2.6. C

X ni na
36-40 3 15
 15 
31-35 3 12  5
26-30 4 9 Md  25,5   2 ·5  25,5  3,125  28,625  28,6
 4 
21-25 4 5  
16-20 1 1  
15

2.7. B

Grupo ni XJ
niñas 15 29
niños 10 25,5
25

La media total, de los 25 niños se obtiene aplicando la fórmula de la media ponderada:

n1  X1  n2  X 2    nJ  X J 15  29  10  25,5 690
Xp     27,6
n1  n2    nJ 15  10 25

7
INTRODUCCIÓN AL ANÁLISIS DE DATOS

2.8. C

Xi ni na
50-54 10 80
45-49 15 70
40-44 30 55
35-39 15 25
30-34 10 10
80

La puntuación X=47 está en el intervalo [45-49].

 (Pk  L i )  n c   (47  44,5)  15 


  nd    55 
k I 5
  100     100  78,125  78
 n   80 
   

Por lo tanto, a la puntuación X=47, le corresponde el percentil 78.

2.9. A
n 80
  40 , por lo que el intervalo crítico es [40-44]
2 2

Xi ni na
50-54 10 80 n   80 
45-49 15 70   nd    25 
40-44 30 55 Md  Li   2 ·I  39,5   2 ·5  42
 nc   30 
35-39 15 25    
   
30-34 10 10
80

2.10. C

Estatura Frecuencia na
79-81 10 100
76-78 25 90
73-75 45 65
70-72 20 20

La puntuación 80 se encuentra en el intervalo 79-81.

8
INTRODUCCIÓN AL ANÁLISIS DE DATOS

 Pk  Li   nc   80  78,510 


  nd    90 
k I 3
  100     100  95
 n   100 
   
2.11. B
La moda es el punto medio del intervalo con mayor frecuencia:
 73  75 
Mo    74
 2 
2.12. B

X ni na
17-20 10 80
13-16 20 70
9-12 25 50
5-8 15 25
1-4 10 10
80

 n·k   80  75 
  nd    50 
P75  Li   100   I  12,5   100   4  14,5
 nc   20 
   
   
2.13. A
Pasamos de frecuencias acumuladas a absolutas para el cálculo de la moda:
Límites exactos na ni
29,5 – 32,5 250 50
26,5 – 29,5 200 50
23,5 – 26,5 150 50
20,5 – 23,5 100 50
17,5 – 20,5 50 50

La distribución no tiene moda (es amodal) dado que todos los intervalos tienen la misma
frecuencia absoluta de ni=50.

9
INTRODUCCIÓN AL ANÁLISIS DE DATOS

2.14. C
En la gráfica de la situación 1 se observa que el 80% (n=200) de los sujetos tiene una edad
menor que X=29,5.
Límites exactos ni na
29,5 – 32,5 50 250
26,5 – 29,5 50 200
23,5 – 26,5 50 150
20,5 – 23,5 50 100
17,5 – 20,5 50 50

Obtendríamos el mismo resultado aplicando la fórmula de los percentiles:

 n·k   250  80 
  nd    150 
P80  Li   100   I  26,5   100   3  29,5
 nc   50 
   
   
2.15. A

X ni Xi ni Xi
29,5 – 32,5 50 31 1550
26,5 – 29,5 50 28 1400
X
n X i i

6250
 25
23,5 – 26,5 50 25 1250 n 250
20,5 – 23,5 50 22 1100
17,5 – 20,5 50 19 950
250 6250

2.16. B

Tiempo
ni na
reacción
 100 
381-400 10 100   40 
361-380 20 90 Md  340,5   2  ·20  340,5   1  ·20  347,2
 30   3
341-360 30 70  
321-340 25 40  
301-320 15 15
100

2.17. C.
341  360
Mo   350,5
2

10
INTRODUCCIÓN AL ANÁLISIS DE DATOS

2.18. B
Se ordenan las puntuaciones: 5, 9, 10, 10, 15, 16
Dado que n=6 es par, la mediana es el valor medio de los dos valores centrales
10  10
Md   10
2
2.19. B

X Xi pi pi X i
24-28 26 0,08 2,08
19-23 21 0,25 5,25
14-18 16 0,34 5,44 X   pi X i  15,9
9-13 11 0,23 2,53
4-8 6 0,10 0,60
15,9

2.20. A

X Xi pi ni na
24-28 26 0,32 96 300
19-23 21 0,24 72 204
14-18 16 0,19 57 132
9-13 11 0,14 42 75
4-8 6 0,11 33 33

 (17  13,5)  57 
  75 
k 5
  100  38,3
 300 
 
2.21. A
Las puntuaciones son: 20, 6, 9, 6, 12, 8 y 16
La media es:

X X i

77
 11
n 7
Para calcular la mediana, ordenamos primero los datos de menor a mayor:
6, 6, 8, 9, 12, 16, 20
Dado que n=7 es impar, la mediana es el valor central, Md=9
La Mo=6
Por tanto, el valor más alto es el de la media.

11
INTRODUCCIÓN AL ANÁLISIS DE DATOS

2.22. C

X ni Xi na
64-69 4 66,5 200
58-63 16 60,5 196
52-57 14 54,5 180
46-51 22 48,5 166
40-45 32 42,5 144
34-39 44 36,5 112
28-33 42 30,5 68
22-27 18 24,5 26
16-21 8 18,5 8
 200

Dado que el decil 2 es el percentil 20, calculamos directamente el percentil 20 de la distribución.

n  k 200  20
  40 , es decir, el 20% de n =200 es 40. Por lo tanto, el intervalo crítico es el primer
100 100
intervalo cuya frecuencia acumulada sea igual o mayor a 40. En este caso, se corresponde con el
intervalo [28-33] cuya na = 68.

 n·k   200  20 
  nd    26 
P20  Li   100   I  27,5   100   6  29,5
 nc   42 
   
   

2.23. C
No es posible su cálculo porque el intervalo máximo no tiene límite superior y no
conocemos su punto medio.
2.24. A
Distribución 1
X ni na
9-10 2 40
7-8 5 38
5-6 11 33
3-4 15 22
1-2 7 7
 40

Dado que el percentil 75 equivale al tercer cuartil, calculamos directamente el percentil 75 de la


distribución.

n  k 40  75
  30 , es decir, el 75% de n =40 es 30. Por lo tanto, el intervalo crítico es el
100 100

12
INTRODUCCIÓN AL ANÁLISIS DE DATOS

primer intervalo cuya frecuencia acumulada sea igual o mayor a 30. En este caso, se
corresponde con el intervalo [5-6] cuya na = 33.
 nk   40  75 
  nd    22 
Q3  P75  Li   100   I  4,5   100   2  5,96
 nc   11 
   
   

2.25. C
Se trata de una variable con nivel de medida nominal en la que la categoría más frecuente
(Pi = 45) es “trastorno por estrés postraumático”. Por lo tanto, la moda es esa categoría.

13
INTRODUCCIÓN AL ANÁLISIS DE DATOS

EJERCICIOS RESUELTOS TEMA 3.

3.1. La amplitud total de la distribución de frecuencias de la Tabla 1 es: A) 11; B) 12; C) 100.
Tabla 1. Estatura en centímetros de 100 niños de 12 meses de edad.

Estatura Frecuencia
79-81 10
76-78 25
73-75 45
70-72 20

3.2. Con los datos de la Tabla 2 el rango o amplitud total de la variable Cociente Intelectual es: A) 13;
135; C) 128,5.

Tabla 2. Resultados de medir el Cociente Intelectual (CI), variable X, y la nota media al terminar el
curso, variable Y, de 5 alumnos de 15 años de edad.

Alumno X Y
Roberto 122 5,7
Ana 130 8,4
María 124 6,0
Jesús 123 6,1
Inés 135 8,6

3.3. Según los datos de la Tabla 2, la desviación media de la variable Cociente Intelectual es: A) 2,4;
B) 3,78; C) 4,56.
3.4. Con los datos de la Tabla 2, la varianza de la nota media al terminar el curso es: A) 1,6; B) 1,7; C)
1,8.
3.5. La cuasivarianza de las puntuaciones en X, en la Tabla 3, para el grupo de varones es
aproximadamente: A) 3,54 ; B) 6,70; C) 6,85

X Mujeres Varones
8-9 20 12
6-7 16 13
4-5 10 17
2-3 8 10
0-1 6 8
∑ 60 60

Tabla 3. Resultados obtenidos por un grupo de 60 mujeres y 60 hombres en una prueba de fluidez
verbal (X)

1
INTRODUCCIÓN AL ANÁLISIS DE DATOS

3.6. La desviación típica de la variable estatura de la Tabla 4 es un valor entre: A) 2 y 3; B) 4 y 5; C)


7 y 8.
Tabla 4. Estatura en centímetros de 100 niños de 12 meses de edad.

Estatura Frecuencia
79-81 10
76-78 25
73-75 45
70-72 20

3.7. En la situación 1, la varianza de las edades de los sujetos es: A) 18; B) 22; C) 24

Situación 1. La gráfica muestra la distribución de la edad (X) de los 250 sujetos de una
investigación. En el eje horizontal, se recogen los límites exactos de los intervalos de X y en el eje
vertical la frecuencia absoluta acumulada (na).

3.8. Sabiendo que el tiempo de reacción medio de los 100 estudiantes de la Tabla 5 es 347,5. ¿Cuál es
su desviación típica? A) 23,9; B) 571; C) 1518,5.

Tabla 5. Tiempo de reacción de 100 estudiantes en una tarea de atención visual focalizada. Se sabe
que  ni X i2  12132725

Tiempo de
Frecuencia
reacción
381-400 10
361-380 20
341-360 30
321-340 25
301-320 15
100

2
INTRODUCCIÓN AL ANÁLISIS DE DATOS

3.9. La amplitud intercuartil de los datos de la Tabla 6 es un valor entre: A) 2 y 4; B) 5 y 7; C) 8 y 10

Tabla 6. Puntuaciones de 100 niños en un test de inteligencia emocional (X) agrupadas en intervalos
junto con sus frecuencias absolutas (ni) y sus frecuencias absolutas acumuladas (na).
X ni na
17-20 10 100
13-16 20 90
9-12 42 70
5-8 21 28
1-4 7 7

3.10. Respecto a la Tabla 7, la amplitud intercuartil de la distribución vale: A) 8; B) 12; C) 16

Tabla 7. Distribución de las puntuaciones obtenidas en una muestra de 1000 alumnos


del primer curso de la Educación Segundaria Obligatoria, en un test de razonamiento
abstracto (X).
X pi pa
43 - 48 0,10 1
37 - 42 0,15 0,90
31 - 36 0,25 0,75
25 - 30 0,25 0,50
19 - 24 0,16 0,25
13 -18 0,06 0,09
7 - 12 0,02 0,03
1-6 0,01 0,01

3.11. Con los datos de la Tabla 8, ¿qué variable presenta un mayor grado de dispersión?: A) las
puntuaciones en el test de analogías verbales; B) las puntuaciones en lengua; C) las dos variables
presentan el mismo grado de dispersión

Tabla 8. Un psicólogo utilizó un test de Analogías Verbales (X) para predecir el rendimiento en
Lengua de 4º de la ESO (Y). Obtuvo las puntuaciones de las dos variables en una muestra
aleatoria de 1000 estudiantes. En la tabla se muestran las medias, las varianza y la correlación
entre ambas variables.

X Y
Media 30 15
Varianza 64 36
Correlación rXY  0,70

3
INTRODUCCIÓN AL ANÁLISIS DE DATOS

3.12. Con los datos de la Tabla 9, el índice de asimetría de


Pearson es: A) 1; B) -1; C) 0. Tabla 9. Distribución de frecuencias
de las puntuaciones obtenidas por 80
3.13. Según los datos de la Tabla 9, el índice de asimetría de sujetos en un test de inteligencia
Fisher es: A) 0; B) -1; C) 1. emocional. Sabemos que la desviación
3.14. Atendiendo a los datos de la Tabla 9, el índice de típica es igual a 5,86.
curtosis es:A) 2,32; B)1,54; C) -0,68.
X ni
30-34 10
35-39 15
40-44 30
45-49 15
50-54 10

3.15. Respecto a la distribución de la Tabla 10, ¿puede calcularse el índice de asimetría de Pearson?:
A) no, porque es bimodal; B) no, porque no tiene moda; C) sí, porque es unimodal
Tabla 10. Distribución de las puntuaciones obtenidas en una muestra de 1000 alumnos
del primer curso de la Educación Segundaria Obligatoria, en un test de razonamiento
abstracto (X). X pi pa
43 - 48 0,10 1
37 - 42 0,15 0,90
31 - 36 0,25 0,75
25 - 30 0,25 0,50
19 - 24 0,16 0,25
13 -18 0,06 0,09
7 - 12 0,02 0,03
1-6 0,01 0,01

3.16. Teniendo en cuenta el valor del índice de asimetría de Fisher, la distribución presentada en la
tabla 11: A) asimétrica positiva; B) asimétrica negativa; C) simétrica.

Tabla 11. Número de asignaturas matriculadas en la UNED por un grupo de 40 estudiantes.

X ni
9-11 2
6-8 9
3-5 22
0-2 7

4
INTRODUCCIÓN AL ANÁLISIS DE DATOS

3.17. Con los datos de la Tabla 12, si la moda de las puntuaciones en inteligencia es igual a 105,
¿cuál es el valor del índice de asimetría?: A) 0; B) -0,30; C) 0,50

Tabla 12. Datos de 12 alumnos en un estudio para predecir la puntuación en


matemáticas (Y) a partir de su nivel de inteligencia (X). La ordenada en el origen de
la recta de regresión de Y sobre X es a  40,61

Desv.
Media Covarianza
típica
X 108 6
SXY=27,2
Y 41 5

3.18. Con los datos de la Tabla 12, el coeficiente de variación es mayor en: A) matemáticas, B)
inteligencia; C) en la unión de las dos variables.
3.19. La puntuación típica en Fluidez Verbal del vendedor 5 de la Tabla 13 necesariamente será: A)
negativa; B) igual a cero; C) positiva.

Tabla 13. Resultados en un test de fluidez verbal de un grupo de vendedores de enciclopedias


y número de ventas diarias realizadas.

Fluidez Ventas
Vendedor
verbal (X) diarias (Y)
1 10 2
2 50 4
3 50 5
4 60 3
5 20 1

3.20. Con los datos de la tabla 14, ¿cuál es la puntuación típica correspondiente a la segunda
persona? A) -1,01; B) -5; C) -0,41.
Tabla 14. Resultados en un test de agudeza visual (X) de siete personas en una
investigación sobre la miopía. Persona Xi
1ª 20
2ª 6
3ª 9
4ª 6
5ª 12
6ª 8
7ª 16

5
INTRODUCCIÓN AL ANÁLISIS DE DATOS

3.21. Un test de adaptación social tiene una media de 120 y una desviación típica de 10 en una
población de adolescentes. Un adolescente de esta población ha obtenido en el test una
puntuación X = 100, lo que indica que ese adolescente está a: A) una desviación típica por encima
de la media; B) dos desviaciones típicas por encima de la media; C) dos desviaciones típicas por
debajo de la media

3.22. Con los datos de la Tabla 15, la puntuación típica del alumno D en el cuestionario de hábitos de
estudio (X) está entre: A) -0,70 y -0,40; B) -0,10 y 0,20; C) 0,40 y 0,70

Tabla 15. Resultados en un cuestionario de hábitos de estudio (X) y la calificación


global en 4º de Secundaria (Y) de cinco alumnos de un centro educativo.

Hábitos de Calificación
Alumno
estudio (X) Global (Y)
A 2 6
B 8 5
C 12 10
D 3 7
E 1 3

3.23. La puntuación típica de un sujeto en un test de razonamiento abstracto ha sido de 2. ¿Cuál fue
su puntuación diferencial en el test si la media fue de 10 y la varianza de 9?: A) 0; B) 16; C) 6.

3.24. Se quiere dibujar el diagrama de caja de la variable flexibilidad psicológica. Se sabe que las
puntuaciones 4 y 7 se corresponden con los percentiles 25 y 75, respectivamente. ¿Cuál sería el
límite superior del diagrama de caja? A)7; B) 11,5; C) 13,6.

3.25. Atendiendo a los datos del ejercicio anterior, el límite inferior del diagrama de caja sería:
A) -0,5; B) 3; C) 4.

6
INTRODUCCIÓN AL ANÁLISIS DE DATOS

SOLUCIONES

3.1. B
AT  X máx  X mín  81,5  69,5  12

3.2. A
AT  X máx  X mín  135  122  13
3.3. C

X
X i

122  130  124  123  135 634
  126,8
n 5 5

DM 
X i X

122  126,8  130  126,8  124  126,8  123  126,8  135  126,8

n 5
4,8  3,2  2,8  3,8  8,2 22,8
   4,56
5 5
3.4. A

Alumno Yi Yi2
Roberto 5,7 32,49
Ana 8,4 70,56
María 6,0 36
Jesús 6,1 37,21
Inés 8,6 73,96
34,8 250,22

Cálculo de la media:

X
Y i

34,8
 6,96
n 5

Cálculo de la varianza
5

Y i
2

250,22
S X2  i 1
 6,96 2   48,442  50,044  48,442  1,6
5 5

7
INTRODUCCIÓN AL ANÁLISIS DE DATOS

3.5. C
X n V X i n V X i (X i  X ) nv ( X i  X ) 2
8-9 12 8,5 102 3,63 158,1228
6-7 13 6,5 84,5 1,63 34,5397
4-5 17 4,5 76,5 -0,37 2,3273
2-3 10 2,5 25 -2,37 56,169
0-1 8 0,5 4 -4,37 152,7752
60 292 403,934

292
X  4,87
60

 n X X
2
403,934
   6,85
2 i i
S n 1
n 1 59
3.6. A
Estatura Xi Frecuencia niXi Xi2 niXi2
79-81 80 10 800 6400 64000
76-78 77 25 1925 5929 148225
73-75 74 45 3330 5476 246420
70-72 71 20 1420 5041 100820
100 7475 559465

X 
n X i i

7475
 74,75
n 100

S x2 
n X i i
2

X2 
559465
 74,75 2  7,09
n 100
S x  S x2  7,09  2,66

3.7. A
X ni Xi ni Xi 2
29,5 – 32,5 50 31 48050
26,5 – 29,5 50 28 39200
23,5 – 26,5 50 25 31250
20,5 – 23,5 50 22 24200
17,5 – 20,5 50 19 18050
160750
X  25 (ver ejercicio resuelto 2.13 del Tema 2)

S X2 
n X i i
2

X2 
160750
 25 2  18
n 250

8
INTRODUCCIÓN AL ANÁLISIS DE DATOS

3.8. A

S 2

n X
i
2
i
 X2 
12132725
 347,5 2  571
x
n 100

S x  571  23,9
3.9. B

X ni na
17-20 10 100
13-16 20 90
9-12 42 70
5-8 21 28
1-4 7 7

 n·k   100  25 
  nd   7
P25  Li   100   I  4,5   100   4  7,93
 nc   21 
   
   

 n·k   100  75 
  nd    70 
P75  L i   100   I  12,5   100   4  13,5
 nc   20 
   
   
AIQ  P75  P25  13,5  7,93  5,57

3.10. B

9
INTRODUCCIÓN AL ANÁLISIS DE DATOS

X pi pa
43 - 48 0,10 1
37 - 42 0,15 0,90
31 - 36 0,25 0,75
25 - 30 0,25 0,50
19 - 24 0,16 0,25
13 -18 0,06 0,09
7 - 12 0,02 0,03
1-6 0,01 0,01
Para una mayor claridad pasamos las frecuencias relativas a frecuencias absolutas:

X pi pa ni na
43 - 48 0,10 1 100 1000
37 - 42 0,15 0,90 150 900
31 - 36 0,25 0,75 250 750
25 - 30 0,25 0,50 250 500
19 - 24 0,16 0,25 160 250
13 -18 0,06 0,09 60 90
7 - 12 0,02 0,03 20 30
1-6 0,01 0,01 10 10

 n·k   1000  25 
  nd    90 
P25  L i   100   I  18,5   100   6  24,5
 nc   160 
   
   

 n·k   1000  75 
  nd    500 
P75  L i   100   I  30,5   100   6  36,5
 nc   250 
   
   
AIQ  36,5  24,5  12

10
INTRODUCCIÓN AL ANÁLISIS DE DATOS

3.11. B

X Y
Media 30 15
Varianza 64 36
SX 8
CVX  ·100  ·100  26,67
X 30
CVY  CVX
SY 6
CVY  ·100  ·100  40
Y 15

3.12. C

X Xi ni Xi ni
30-34 32 10 320
35-39 37 15 555
40-44 42 30 1260
45-49 47 15 705
50-54 52 10 520
80 3360

En el enunciado se dice que S X=5,86. Mo=42.

X 
n X
i 3360
i
  42
n 80
X  Mo 42  42
AP   0
SX 5,86

3.13. A

X Xi ni ( X i  X ) ( X i  X ) 3 ni ( X i  X ) 3
30-34 32 10 -10 -1000 -10000
35-39 37 15 -5 -125 -1875
40-44 42 30 0 0 0
45-49 47 15 5 125 1875
50-54 52 10 10 1000 10000
0
∑ 80

X  42
S X  5,86  S X3  5,863  201,23

11
INTRODUCCIÓN AL ANÁLISIS DE DATOS

Sustituyendo:

AF 
n (X
i i X ) 3

0

0
0
nS 3
X 80  201,23 16098,4

3.14. C

X Xi ni ( X i  X ) ( X i  X )4 ni ( X i  X ) 4
30-34 32 10 -10 10000 100000
35-39 37 15 -5 625 9375
40-44 42 30 0 0 0
45-49 47 15 5 625 9375
50-54 52 10 10 10000 100000
∑ 80 218750

X  42
S X  5,86  S X4  5,86 4  1179,21

Cr 
n (X
i i X ) 4
3 
218750
3
218750
 3  2,3188  3  0,68
nS 4
X 80 1179,21 94336,8

3.15. A
La distribución presenta dos modas: X=27,5 y X=33,5, por lo que no puede aplicarse el índice
de asimetría de Pearson.
3.16. A
Primero se calcula la media y la desviación típica de la distribución:

X ni Xi Xi ni X i2 ni
9-11 2 10 20 200
6-8 9 7 63 441
3-5 22 4 88 352
0-2 7 1 7 7
40 178 1000

178
X   4,45
40

S X2 
n X i i
2

 X2 
1000
 4,45 2  5,2
n 40
S X  5,2  2,28

12
INTRODUCCIÓN AL ANÁLISIS DE DATOS

A continuación el índice de Fisher:

X Xi ni ( X i  X ) ( X i  X ) 3 ni ( X i  X ) 3
9-11 10 2 5,55 170,9539 341,9078
6-8 7 9 2,55 16,5814 149,2326
3-5 4 22 -0,45 -0,0911 -2,0042
0-2 1 7 -3,45 -41,0636 -287,4452
201,69
∑ 40

S X  2,28  S X3  2,283  11,85

Sustituyendo:

AF 
n (X
i i X ) 3

201,69

201,69
 0,43
nS 3
X 40 11,85 474

AF  0,43  AF  0 por lo que la asimetría es positiva.

3.17. C
Desv.
Media Covarianza
típica
X 108 6
SXY=27,2
Y 41 5

Mo=105.

X  Mo 108  105
AP    0,50
SX 6
3.18. A

Desv.
Media Covarianza
típica
X 108 6
SXY=27,2
Y 41 5

SX 6
CVX  100  100  5,56
X 108

13
INTRODUCCIÓN AL ANÁLISIS DE DATOS

SY 5
CVY   100   100  12,20
Y 41
CVX  CVY
Hay mayor dispersión en matemáticas (Y).

3.19. A
Fluidez Ventas
Vendedor
verbal (X) diarias (Y)
1 10 2
2 50 4
3 50 5
4 60 3
5 20 1

El vendedor 5 tiene una puntuación en fluidez verbal de 20, que es menor que la media

X i 
X 190 X  X 20  38
 38 . Por tanto, al pasar su puntuación a típica, Z   el
n 5 Sx Sx
resultado será un valor negativo, ya que la desviación típica es siempre positiva.

3.20. A

Persona Xi Xi  X (X i  X )2
1 20 9 81
2 6 -5 25
3 9 -2 4
4 6 -5 25
5 12 1 1
6 8 -3 9
7 16 5 25
170

170 5
S X2   24,29 S X  4,93 X  11 z  1,01
7 4,93

3.21. C
100  120
z  2
10

14
INTRODUCCIÓN AL ANÁLISIS DE DATOS

3.22. A

Persona Xi Xi2
A 2 4
B 8 64
C 12 144
D 3 9
E 1 1
26 222

X
X i

26
 5,2 S2

X 2
i
 Xi2 
222
 5,22  17,36
SX  S2X  17,36  4,17
X
n 5 n 5
3  5,2
z  0,53
4,17

3.23. C

S X  S X2  9  3

x  XX
x x
z  2   x  23  6
SX 3

3.24. B
P25  Q1  4
P75  Q3  7
Por lo tanto:
AIQ  Q3  Q1  7  4  3

y
LS  Q3  AIQ 1,5  7  3 1,5  11,5

3.25. A
LI  Q1  AIQ 1,5  4  3 1,5  0,5

15
INTRODUCCIÓN AL ANÁLISIS DE DATOS

EJERCICIOS RESUELTOS TEMA 4.

4.1. En una tabla de contingencia con los valores de X en las filas y los valores de Y en las columnas,
¿cómo se denomina al número de casos de cada celdilla dividido por el total de casos de Y y
multiplicado por 100? A) Porcentaje condicionado a filas; B) Porcentaje condicionado a columnas; C)
Porcentaje condicionado a X.

4.2. Teniendo en cuenta que el altruismo puede influir en el


Tabla 1. Los 1000 estudiantes de un
voluntariado, sería de utilidad conocer los porcentajes: A)
centro educativo clasificados según su
del total; B) condicionados a la variable altruismo; C)
puntuación (sean o no voluntarios y
condicionados a la variable voluntariado. según puntúen alto o bajo en altruismo.
4.3. El estadístico X2 para cuantificar el grado de asociación
entre las variables voluntariado y altruismo de la Tabla 1
está entre: A) 105 y 110; B) 115 y 120; C) 125 y 130. Voluntariado
Sí No
4.4. Con los datos de la Tabla 1, ¿cuál es el valor del
Sí 250 150
coeficiente φ? A) -0,680; B) -0,357; C) 0,289. Altruismo
No 550 50
4.5. Según el valor obtenido de φ en el ejercicio anterior,
¿existe asociación entre altruismo y voluntariado? A) No,
porque el valor de phi es negativo; B) No, porque el valor
de phi es cero; C) Sí, porque el valor de phi es distinto de
cero.

4.6. Si queremos estudiar la relación entre dos variables dicotómicas, X e Y, el valor del Coeficiente
de Contingencia máximo que podemos obtener es: A) 0,20 ; B) 0,71 ; C) 0,9.

4.7. Con los datos de la Tabla 2, el valor de χ2 es


igual a: A) 7,17; B) 11,80; C) 16,8. Tarea realizada
Total
4.8. El coeficiente de contingencia, C, está Sí No
comprendido entre: A) 0 y 0,3; B) 0,4 y 0,7; 68 ---
C) 0,8 y 1. Baja 160
(84,8) (---)
4.9. ¿Cuál es el valor del coeficiente V? A) 0,029; Ansiedad
--- 96
B) 0,173; C) 0,689. Alta ---
(---) (112,8)
4.10. Atendiendo a los resultados obtenidos en los
Ejercicios 4.7, 4.8 y 4.9, podemos concluir que: Total 212 --- 400
A) según χ2, la relación entre la ansiedad de
ejecución y realización correcta es alta, Tabla 2. En un estudio se investigó la relación
mientras que los coeficientes C y V apuntan a entre la ansiedad de ejecución (Baja ó Alta) y la
que no hay relación entre ambas variables; B) realización correcta de una tarea (Sí, No) en
no hay ningún tipo de relación entre las 400 personas. En la tabla se muestran algunas
variables de la Tabla 2; C) la relación entre las frecuencias observadas y, debajo y entre
variables estudiadas es de baja intensidad. paréntesis, algunas frecuencias teóricas.

4.11. El coeficiente de Contingencia puede tomar valores: A) mayores o iguales a 0 y menores que 1;
B) entre -1 y 1; C) entre 0 y 100.

1
INTRODUCCIÓN AL ANÁLISIS DE DATOS

4.12. Es apropiado analizar la relación entre dos variables utilizando el coeficiente C de contingencia en
el caso de: A) la Figura 1; B) la Figura 2; C) la Tabla 3.

Figura 1. Distribuciones de frecuencias obtenidas al aplicar una misma prueba de competencia


lectora a alumnos de: (a) Primaria, (b) Secundaria y (c) Bachillerato.

Figura 2. Diagrama de dispersión y recta de regresión de Y sobre X. La variable X representa la


puntuación obtenida en un test de concentración, y la variable Y el número de errores cometidos al
realizar una tarea monótona de atención.

10
9
Número de errores (Y)

8
7
6
5
4
3
2
1
0
0 10 20 30 40 50 60 70 80 90
Concentración (X)

Tabla 3. Resultados obtenidos en un estudio sobre la discriminación laboral percibida de tres grupos
distintos de inmigrantes.
Discriminación laboral
percibida
Baja Moderada Alta

Rumanos 30 35 15 80
Inmigrantes

Marroquíes 10 20 20 50

Subsaharianos 10 30 30 70

50 85 65 200

2
INTRODUCCIÓN AL ANÁLISIS DE DATOS

4.13. Según los datos de la Tabla 4, la


distribución condicionada a ser mujer es:
Itinerario
A) 55,6%, 33,3% y 11,1%; B) 83,3%,
50% y 16,7%; C) 83,3% y 16,7%. Clínica Educación Trabajo
Hombre 5 15 25
4.14. El valor de 2 es: A) 1,1; B) 11,1; Sexo
Mujer 25 15 5
C) 26,7.
Tabla 4. Elección del itinerario en el grado de
4.15. ¿Cuál es el valor del coeficiente de
Psicología en función del sexo de los
Contingencia? A) 0,27; B) 0,48; C) 1,11.
estudiantes de segundo de grado que asisten
4.16. El coeficiente V de Cramer está a un centro asociado de la UNED.
comprendido entre: A) 0 y 0,3; B) 0,4 y
0,7; C) 0,8 y 1.

4.17. Con los datos de la Tabla 5,


si analizamos la independencia Trastorno Psicológico
entre ambas variables, se Depresión Personalidad
obtiene un valor del índice 2 Aceptación Sí 36 44
igual a: A) 0; B) 4,17; C) 7,25. Tratamiento No 4 16
4.18. Teniendo en cuenta los
datos de la Tabla 5, el Tabla 5. Resultados de una investigación en la que se
coeficiente  es un valor estudió la aceptación o no del tratamiento psicológico
comprendido entre: A) 0,1 y por parte de pacientes que presentaban dos tipos de
0,3; B) 0,4 y 0,6; C) 0,7 y 0,9. trastornos psicológicos (depresión y trastorno de
personalidad).

4.19. Con los datos de la Tabla 6, el


coeficiente de correlación lineal de Estudiante Prof. 1 Prof. 2
Spearman es igual a: A) 0,26; B) 065; 1 7 6
C) 0,90. 2 10 9
3 5,5 5
4.20. Con los resultados del ejercicio 4 7,5 8,5
anterior, podemos considerar que: 5 9 9,5
A) no hay relación entre las calificaciones
otorgadas por ambos profesores; B) hay
Tabla 6. Calificaciones otorgadas por dos
una relación directa entre las notas de
profesores del tribunal de defensa de un Trabajo
ambos profesores; C) hay una relación
Fin de Máster a los 5 alumnos presentados en
inversa entre las notas de ambos
determinada convocatoria.
profesores.

3
INTRODUCCIÓN AL ANÁLISIS DE DATOS

SOLUCIONES

4.1. B
El porcentaje condicionado a columnas es el número de casos de cada celdilla dividido por el total
de casos por columna y multiplicado por 100. En el enunciado se informa de que los valores de X
están situados en las filas y los valores de Y en las columnas de la tabla de contingencia.

4.2. B
En una relación asimétrica los porcentajes se calculan en el sentido de la variable explicativa, en
este caso, la variable altruismo.

4.3. C
Cálculo de las frecuencias teóricas (entre paréntesis en la tabla)
( 400 x 800) ( 400 x 200) (600 x 800) (600 x 200)
 320  80  480  120
1000 1000 1000 1000

Voluntariado
A B
Sí 250 (320) 150 (80) 400
Altruismo
No 550 (480) 50 (120) 600
800 200 1000

(250  320) 2 (150  80) 2 (550  480) 2 (50 120) 2



2
     127,60
320 80 480 120

4.4. B
Voluntariado
A B
Sí 250 150 400
Altruismo
No 550 50 600
800 200 1000

n11  n22  n12  n21 250  50  550  150 12500  82500  70000
     0,357
n1  n2  n1  n 2 400  600  800  200 38400000000 195959,18

4.5. C
El valor de phi es distinto de cero, por lo que hay asociación entre ambas variables.

4.6. B
k 1 2 1
C max    0,5  0,71
k 2

4
INTRODUCCIÓN AL ANÁLISIS DE DATOS

4.7. B

Tarea realizada
Total
Sí No

68 92
Baja 160
(84,8) (75,2)
Ansiedad
144 96
Alta 240
(127,2) (112,8)

Total 212 188 400

(68  84,8) 2 (92  75,2) 2 (144  127,2) 2 (96 112,8) 2


2      11,80
84,8 75,2 127,2 112,8

4.8. A

2 11,80
C   0,029  0,17
 n
2
11,80  400

4.9. B

2 11,80
V   0,03  0,173
n(k  1) 4002  1

4.10. C

4.11. A

4.12. C

4.13. A
Se trata de una distribución de Y condicionada a uno de los valores de X (ser mujer), por lo que se
considera únicamente la fila en la que aparecen las frecuencias de las mujeres. Por tanto, para
calcular estos porcentajes, cada frecuencia de la fila de las mujeres se divide entre el total de
mujeres (45) y se multiplica por 100. Los porcentajes condicionados a ser mujer son 55,6%, 33,3%
y 16,7%.

4.14. C
Con los datos de la tabla se calculan las frecuencias teóricas multiplicando los marginales
correspondientes a cada celdilla y dividiendo por el total (en la tabla entre paréntesis).

5
INTRODUCCIÓN AL ANÁLISIS DE DATOS

Itinerario
Clínica Educación Trabajo
Hombre 5 (15) 15 (15) 25 (15) 45
Sexo
Mujer 25 (15) 15(15) 5 (15) 45
30 30 30 90

(5  15) 2 15  15 25  15  25  15  15  15  5  15 
2 2 2 2 2
2   
15 15 15 15 15 15
 6,667  0  6,667  6,667  0  6,667  26,7

4.15. B

26,7
C  0,48
26,7  90

4.16. B

2 26,7
V   0,297  0,54
n(k  1) 902  1

4.17. B
Con los datos de la tabla se calculan las frecuencias teóricas multiplicando los marginales
correspondientes a cada celdilla y dividiendo por el total (en la tabla entre paréntesis).

Trastorno Psicológico
Depresión Personalidad
Acepta Sí 36 (32) 44 (48) 80
Tratam. No 4 (8) 16 (12) 20
40 60 100

(36  32) 2 44  48 2 4  8 16  12  4,17


2 2
2    
32 48 8 12

4.18. A
Trastorno Psicológico
Depresión Personalidad
Acepta Sí 36 44 80
Tratam. No 4 16 20
40 60 100

n11  n22  n12  n21 36  16  4  44 576  176 400


     0,2
n1  n2  n1  n 2 80  20  40  60 3840000 1959,59

6
INTRODUCCIÓN AL ANÁLISIS DE DATOS

4.19. C
En primer lugar hay que calcular los rangos de las variables. Para hacerlo, hay que ordenar los
valores de menor a mayor. En la primera tabla aparece el número de estudiante y la nota
otorgada por el profesor 1. En la segunda tabla se han ordenado los datos de la calificación
otorgada por el profesor 1 de menor a mayor, por lo que ahora el nº del estudiante no está
ordenado. En la última tabla se han asignado los rangos correspondientes.

Estudiante Prof. 1 Estudiante Prof. 1 Estudiante Prof. 1

1 7 3 5,5 3 1
2 10 1 7 1 2
3 5,5 4 7,5 4 3
4 7,5 5 9 5 4
5 9 2 10 2 5

Siguiendo el mismo procedimiento se asignan los rangos correspondientes a la variable calificación


otorgada por el profesor 2. Primero se ordenan los valores de la variable de menor a mayor
(segunda tabla) y después se asignan los rangos correspondientes (tercera tabla).

Estudiante Prof. 2 Estudiante Prof. 2 Estudiante Prof. 2

1 6 3 5 3 1
2 9 1 6 1 2
3 5 4 8,5 4 3
4 8,5 2 9 2 4
5 9,5 5 9,5 5 5

Ahora, se sitúan los rangos correspondientes en la misma tabla ordenada por el número de
estudiante y se calcula la diferencie entre los rangos de ambas variables.

Estudiante Profesor 1 Profesor 2 Rangos Rangos


di di2
Profesor 1 Profesor 2
1 7 6 2 2 0 0
2 10 9 5 4 1 1
3 5,5 5 1 1 0 0
4 7,5 8,5 3 3 0 0
5 9 9,5 4 5 -1 1
2

Y sustituyendo en la fórmula:

6 d i2 6 2 12
rs  1   1  1  1  0,1  0,9
n(n  1)
2
5(5  1)
2
120

4.20. B.

7
INTRODUCCIÓN AL ANÁLISIS DE DATOS

EJERCICIOS RESUELTOS TEMA 5.

5.1. Entre las variables Fluidez Verbal y número de ventas diarias que presentan un grupo de
vendedores (ver Tabla 1) existe una relación lineal: A) directa; B) inversa; C) nula.
Tabla 1. Resultados en un test de fluidez verbal de un grupo de vendedores de enciclopedias y
número de ventas diarias realizadas.

Vendedor Fluidez Ventas


verbal (X) diarias (Y)
1 10 2
2 50 4
3 50 5
4 60 3
5 20 1

5.2. Según los datos de la Tabla 2, la covarianza entre el CI y la nota media a final de curso es: A)
6; B) 7; C) 8
Tabla 2. Resultados de medir el Cociente Intelectual (CI), variable X, y la nota media al terminar
el curso, variable Y, de 5 alumnos de 15 años de edad.

Alumno X Y
Roberto 122 5,7
Ana 130 8,4
María 124 6,0
Jesús 123 6,1
Inés 135 8,6

5.3. Con los datos de la Tabla 3, la covarianza entre ambas variables es igual a: A) 83,6; B) 25,3;
C) 33,6
Tabla 3. Un psicólogo utilizó un test de Analogías Verbales (X) para predecir el rendimiento
en Lengua de 4º de la ESO (Y). Obtuvo las puntuaciones de las dos variables en una muestra
aleatoria de 1000 estudiantes. En la tabla se muestran las medias, las varianza y la correlación
entre ambas variables.

X Y
Media 30 15
Varianza 64 36
Correlación rXY  0,70

1
INTRODUCCIÓN AL ANÁLISIS DE DATOS

5.4. Con los datos de la Tabla 4, la covarianza entre la variable X e Y es: A) 0,49; B) 13,38; C)
11,21
Tabla 4. Datos de 50 personas en un estudio para predecir la nota en dibujo artístico (Y) a partir
de su nivel de creatividad (X)
Media Desv. típica Correlación
X 8 2,83
rXY  0,7
Y 14 5,66

5.5. Con los datos de la Tabla 5, la covarianza entre ambas variables es igual a: A) 4,6; B) 7,9;
C) 3,2
Tabla 5. Con el fin de estudiar la relación entre las puntuaciones en un test de
inteligencia (X) y la obtenida en un examen de matemáticas (Y), se utilizan las
puntuaciones de 50 sujetos obteniéndose los siguientes resultados:

X Y XY
X  30 Y 7
 X 2  45200 Y 2  2650  XY  10660

5.6. Teniendo en cuenta los datos de la Tabla 6, el coeficiente de correlación de Pearson entre X e
Y vale: A) 0,7 ; B) 0,8 ; C) 0,9
Tabla 6. Para pronosticar las puntuaciones en una asignatura (Y) a partir de las
puntuaciones en un test de razonamiento (X) disponemos de los siguientes datos obtenidos
en un grupo de 500 niños:
Desviación
Media Recta de regresión
típica
X 100 10
Y´= - 8 + 0,16 X
Y 8 2

5.7. ¿Qué diagrama de dispersión corresponde a los datos presentados en la Tabla 7? A) El 1; B)


El 2; C) El 3.
Diagrama 1 Diagrama 2 Diagrama 3

2
INTRODUCCIÓN AL ANÁLISIS DE DATOS

Tabla 7. Resultados en un test de Fluidez Verbal de un grupo de vendedores de enciclopedias


y número de ventas diarias realizadas
Vendedor Fluidez Ventas
verbal (X) diarias (Y)
1 10 2
2 50 4
3 50 5
4 60 3
5 20 1

5.8. Si el coeficiente de correlación de Pearson entre X e Y es igual a -1, el valor de la covarianza


entre X e Y es: A) negativo; B) positivo; C) cero
5.9. Según la Figura 1, la relación entre el nivel de concentración y el número de errores cometido
es: A) lineal directa; B) lineal inversa; C) nula.

Figura 1. Diagrama de dispersión y recta de regresión de Y sobre X. La variable X


representa la puntuación obtenida en un test de concentración, y la variable Y el número
de errores cometidos al realizar una tarea monótona de atención.

5.10. La recta de regresión, calculada con los datos de la Tabla 8, para pronosticar la nota media al
terminar el curso, en función del CI, es: A) -24,1+0,245Xi ; B) -2,41Xi+0,245; C)
24,1  0,245 X i
Tabla 8. Resultados de medir el Cociente Intelectual (CI), variable X, y la nota media al
terminar el curso, variable Y, de 5 alumnos de 15 años de edad.
Alumno X Y
Roberto 122 5,7
Ana 130 8,4
María 124 6,0
Jesús 123 6,1
Inés 135 8,6

3
INTRODUCCIÓN AL ANÁLISIS DE DATOS

5.11. La recta de regresión de Y sobre X siempre pasa por el punto: A) ( X, Y) ; B) (0, Y) ; C)


( X,0)
5.12. Con los datos de la Tabla 9, la pendiente de la recta de regresión de Y sobre X en
puntuaciones directas es: A) 0,525; B) 0,385; C) 0,495

Tabla 9. Un psicólogo utilizó un test de Analogías Verbales (X) para predecir el


rendimiento en Lengua de 4º de la ESO (Y). Obtuvo las puntuaciones de las dos variables
en una muestra aleatoria de 1000 estudiantes. En la tabla se muestran las medias, las
varianza y la correlación entre X Y ambas variables.
Media 30 15
Varianza 64 36
Correlación rXY  0,70

5.13. Con los datos de la Tabla 10, la pendiente de la recta de regresión que permite pronosticar el
número de ventas diarias (Y) a partir de la fluidez verbal de los vendedores (X) es: A) -0,053;
B) 0; C) 0,053.

Tabla 10. Resultados en un test de Fluidez Verbal de un grupo de vendedores de


enciclopedias y número de ventas diarias realizadas.

Vendedor Fluidez Ventas


verbal (X) diarias (Y)
1 10 2
2 50 4
3 50 5
4 60 3
5 20 1

5.14. Respecto a la Tabla 11, la ordenada en el origen y la pendiente de la ecuación de la recta de


regresión para pronosticar la variable Y a partir de la variable X son, respectivamente: A) 2,8 y
1,4; B) -8,4 y 2,8; C) 0,35 y 11,2

Tabla 11: Datos de 50 personas en un estudio para predecir la nota en dibujo artístico (Y) a
partir de su nivel de creatividad (X)

Media Desv. típica Correlación


X 8 2,83
rXY  0,7
Y 14 5,66

4
INTRODUCCIÓN AL ANÁLISIS DE DATOS

5.15. Y’ = 2X – 3 indica que la ordenada en el origen de la recta de regresión es: A) 2; B) -3; C) 3

5.16. La recta de regresión representada en la Figura 2 es: A) Y’ = 10,14 - 0,09X; B) Y’ = 10,14


+ 0,09X; C) Y’ = 10,14X - 0,09.

Figura 2. Diagrama de dispersión y recta de regresión de Y sobre X. La variable X representa la


puntuación obtenida en un test de concentración, y la variable Y el número de errores cometidos
al realizar una tarea monótona de atención.

5.17. Atendiendo a los datos de la Tabla 12, la recta de regresión de las calificaciones en
matemáticas sobre las puntuaciones en el test de inteligencia es: A) Y’ = -0,24X - 0,20;
C) Y’ = 0,50X + 10,20; C) Y’ = 0,80X - 17

Tabla 12. Con el fin de estudiar la relación entre las puntuaciones en un test de inteligencia
(X) y la obtenida en un examen de matemáticas (Y), se utilizan las puntuaciones de 50
sujetos obteniéndose los siguientes resultados:

X Y XY
X  30 Y 7
 X 2  45200 Y 2  2650  XY  10660

5.18. Utilizando la recta de regresión, recogida en la Tabla 13, ¿qué puntuación en Y


pronosticaremos a un alumno que ha obtenido una puntuación de 100 en X?: A) 4 ; B) 6; C) 8

5
INTRODUCCIÓN AL ANÁLISIS DE DATOS

Tabla 13. Para pronosticar las puntuaciones en una asignatura (Y) a partir de las
puntuaciones en un test de razonamiento (X) disponemos de los siguientes datos
obtenidos en un grupo de 500 niños:

Desviación
Media Recta de regresión
típica
X 100 10
Y´= - 8 + 0,16 X
Y 8 2

5.19. Con los datos de la Tabla 14 ¿qué nota media a final de curso pronosticaremos a un alumno
que tiene un CI de 127? A) 6; B) 7; C) 8
Tabla 14. Resultados de medir el Cociente Intelectual (CI), variable X, y la nota media al
terminar el curso, variable Y, de 5 alumnos de 15 años de edad.

Alumno X Y
Roberto 122 5,7
Ana 130 8,4
María 124 6,0
Jesús 123 6,1
Inés 135 8,6

5.20. Con los datos de la Tabla 15. ¿cuántas ventas diarias se pronosticará a un nuevo aspirante al
puesto de vendedor de enciclopedias que ha obtenido en el test de fluidez verbal una puntuación
de 40? A) Entre 0 y 1; B) Entre 2 y 3; C) Entre 3 y 4.
Tabla 15. Resultados en un test de fluidez verbal de un grupo de vendedores de
enciclopedias y número de ventas diarias realizadas.

Vendedor Fluidez Ventas


verbal (X) diarias (Y)
1 10 2
2 50 4
3 50 5
4 60 3
5 20 1

5.21. Considerando los datos de la Tabla 16, ¿qué puntuación en Y pronosticaremos a un alumno
que tiene una puntuación en X de 10?: A) 112,35; B) 19,6; C) 16,8

6
INTRODUCCIÓN AL ANÁLISIS DE DATOS

Tabla 16: Datos de 50 personas en un estudio para predecir la nota en dibujo artístico (Y)
a partir de su nivel de creatividad (X)

Media Desv. típica Correlación


X 8 2,83
rXY  0,7
Y 14 5,66

5.22. La recta de regresión que permite pronosticar el riesgo de padecer una enfermedad coronaria
(Y) en función de la hostilidad (X) es Y’ = 1,1 + 0,9X, ¿cuál es el riesgo de padecer una
enfermedad coronaria de una persona que ha obtenido una puntuación X = 8 en hostilidad?: A)
0,9; B) 1,1; C) 8,3

5.23. En una muestra de víctimas de violencia doméstica, hemos obtenido la recta de regresión
siguiente Y’ = 0,08 + 1,24X. En esta investigación, X es el grado de violencia doméstica
sufrida e Y el grado de daño físico y psicológico manifestado. Una puntuación pronosticada Y’
= 10 indica que X es igual a: A) 0,08; B) 1,24; C) 8

5.24. Hemos medido el grado de miopía (Y) de las siete personas de la Tabla 17 y, a
continuación, hemos calculado la recta de regresión de Y sobre X. Sabiendo que la correlación
de Pearson entre el test de agudeza visual y el grado de miopía es de 0,68 y que la varianza de
las puntuaciones pronosticadas, Y’, es igual a 4, ¿cuál es el valor de la varianza de los errores?:
A) 4,65; B) 1,88; C) 1.

Tabla 17: Resultados en un test de agudeza visual (X) de siete personas en una
investigación sobre la miopía.
SY2'  4 Persona Xi
1 20
rXY  0,68 2 6
3 9
4 6
5 12
6 8
7 16

5.25. Respecto a la Tabla 18, SY vale: A) 1,5; B) 2,03; C) 4,13

7
INTRODUCCIÓN AL ANÁLISIS DE DATOS

Tabla 18. Resultados obtenidos en una muestra de adolescentes en las variables


estrés del entorno familiar (X) y agresividad de los adolescentes (Y).

X7 Media de la variable X

Y'  7,4 Media de los pronósticos Y’


Pendiente de la recta de Y
b = 0,9 sobre X
Correlación de Pearson entre
r  0,8485 XeY
varianza de los errores de
SE2  0,6272 pronóstico

SOLUCIONES

5.1. A
Para responder a este ejercicio no es necesario hacer ningún cálculo, basta con observar los valores
de la tabla o su representación gráfica. No necesariamente tiene que ser una relación lineal directa
"perfecta". Si aún así no se ve claro, debemos utilizar el coeficiente de correlación de Pearson, que
en este caso es de 0,73, lo que confirma la relación lineal directa.

5.2. A

Alumno X Y XY
Roberto 122 5,7 695,4
Ana 130 8,4 1092
María 124 6 744
Jesús 123 6,1 750,3
Inés 135 8,6 1161
634 34,8 4442,7

S XY 
 XY  XY  4442,7  126,8·6,96  6,012  6
n 5
5.3. C
X Y
Media 30 15
Varianza 64 36

rxy2  0,49  rxy  0,70


S XY  rXY S X SY  33,6

8
INTRODUCCIÓN AL ANÁLISIS DE DATOS

5.4. C
S XY  S X SY rXY  2,83  5,66  0,70  11,21

5.5. C
10660
cov( X , Y )   30  7  3,2
50
5.6. B
Sabemos que:
b  0,16 , S X  10 , SY  2
Por lo tanto:

SY S 10
b  rxy  rxy  b X  0,16  0,8
SX SY 2

5.7. B

5.8. A
S XY
Si rxy = -1, el valor de SXY es negativo puesto que rXY  y las desviaciones típicas no
S X SY
pueden tener signo negativo.
5.9. B

5.10. A

5.11. A

5.12. A
SY 6
b  rXY  0,70  0,525
SX 8
5.13. C

Vendedor X Y XY X2
1 10 2 20 100
2 50 4 200 2500
3 50 5 250 2500
4 60 3 180 3600
5 20 1 20 400
190 15 670 9100

9
INTRODUCCIÓN AL ANÁLISIS DE DATOS

n  XY   X Y 5  670  190  15 500


b    0,053
n  X 2  (  X) 2 5  9100  1902 9400

5.14. A
SY 5,66
b  rXY  0,70   1,4
SX 2,83

a  Y  bX  14  1,4  8  2,8

5.15. B
Y’ = 2X – 3  a = -3
5.16. A

Concentración Nº errores XY X2
(X) (Y)
10 10 100 100
50 4 200 2500
80 2 160 6400
70 6 420 4900
20 8 160 400
230 30 1040 14300

n  XY   X Y 5  1040  230  30  1700


b    0,09
n  X 2  (  X) 2 5  14300  2302 18600
230 30
X   46 Y  6
5 5
a  Y  bX  6  0,09  46  10,14
Yi'  a  bX  10,14  0,09 X

5.17. C
50  10660  1500  350 8000
b   0,8
50  45200  (1500) 2 10000
a  7  (0,8  30)  17
Por lo tanto, Y’=0,8X-17

5.18. C
Y  8  0,16X  8  0,16·100  8  16  8

10
INTRODUCCIÓN AL ANÁLISIS DE DATOS

5.19. B
Alumno X Y X2 XY
Roberto 122 5,7 14884 695,4
Ana 130 8,4 16900 1092
María 124 6 15376 744
Jesús 123 6,1 15129 750,3
Inés 135 8,6 18225 1161
634 34,8 80514 4442,7

n XY   X  Y 5·4442,7  634·34,8 22213,5  22063,2 150,3


b     0,245
n X 2  ( X ) 5·80514  6342 402570  401956
2
614

a  Y  bX  6,96  0,245·126,8  24,106

Y'  a  bX  24,106  0,245X  24,106  0,245  127  7


i

5.20. C
b = 0,053

X i  Y  i 
X 190 Y 15
 38 3
n 5 n 5
a  Y  bX  3-0,053  38  0,986

Y '  a  bX  0,986  0,053X  0,986  0,053  40  3,106


i

5.21. C
Y '  2,8  1,4 X  2,8  1,4 10  16,8

5.22. C
Y’ = 1,1 + 0,9(8) = 8,3

5.23. C
Y’ = 0,08 + 1,24X
Y’ = 10
10 = 0,08 + 1,24X
10 – 0,08 = 1,24X
9,92 = 1,24X

11
INTRODUCCIÓN AL ANÁLISIS DE DATOS

9,92
X  8
1,24

5.24. A
SY2'  4 rXY  0,68
S Y2' 4
S Y2    8,65
rXY 0,68 2
2

S E2  SY2  SY2'  8,65  4  4,65

5.25. A
S E2 0,6272
1  rXY
2
  SY2   2,24  SY  2,24  1,5
SY2
1  0,84852

12
INTRODUCCIÓN AL ANÁLISIS DE DATOS

EJERCICIOS RESUELTOS TEMA 6.

6.1. Sean A={1,2,3,4}, B={2,4,6,8} y C={3,4,5,6}. La operación (AB)C es: A){4};


B){3,4,6}; C){2,3,4,5,6}

6.2. El espacio muestral E = {cara cara; cara cruz; cruz cara; cruz cruz} corresponde al
experimento de lanzar al aire una moneda: A) dos veces; B) cuatro veces; C) ocho
veces.

6.3. Respecto al espacio muestral del ejercicio 6.2, el número de casos posibles es: A) 2; B) 4;
C) 8.

6.4. En un espacio muestral hay dos sucesos A y B. Sabemos que P( A )  0,4 , P( B )  0,75 y
que P( A  B)  0,55 . ¿Cuál es la probabilidad de la intersección de los sucesos A y B?: A)
0,10; B) 0,60; C) 0,15.

6.5. La zona sombreada del diagrama de Venn


Situación 1. Lanzamos al aire una vez un
de la Situación 1 representa: A) A  B ;
dado, definiendo dos sucesos: A = “obtener
B) A∩B; C) A  B . un nº menor que tres” y B = “obtener un
nº impar”. En el diagrama se representa
6.6. El espacio muestral descrito en la situación
una operación entre ambos sucesos.
1 está formado por:

A) E=
 , , , , ,
;

B) E=
 , , ,
;

C) E=
 , ,

6.7. Con los datos de la situación 1 se define un
nuevo suceso C = “obtener un número
par”. ¿Cuál es P(A  C) ? : A) 1/6; B) 3/6;
C) 4/6.

6.8. Al jugar una partida de parchís, ¿qué probabilidad hay de irse a “casa” por sacar tres
veces seguidas un seis al lanzar el dado tres veces? A) 0,0046; B) 0,0501; C) 0,1667.

6.9. Hay una bola verde (V) y una bola azul (A) en una bolsa. Si extraemos dos bolas una a
una y con reposición, los pares posibles son: A) VA, AV; B) VV, AA; C) VV, VA, AV, AA

6.10. Con los datos de la tabla 2, si elegimos Itinerario


al azar a un estudiante, la probabilidad
de que sea hombre y quiera realizar el Clínica Educación Trabajo
itinerario de educación está
comprendida entre: A) 0,15 y 0,20; B) Hombre 5 15 25
0,05 y 0,10; C) 0,25 y 0,30 Sexo
Mujer 25 15 5
6.11. Atendiendo a los datos de la Tabla 2 ,
hemos seleccionado un estudiante y
resulta que desea realizar el itinerario de Tabla 2. Elección del itinerario en el grado de
clínica. ¿Cuál es la probabilidad de que Psicología en función del sexo de los
sea mujer? A) 0,28; B) 0,83; C) 0,33 estudiantes de segundo de grado que asisten
a un centro asociado de la UNED.

1
INTRODUCCIÓN AL ANÁLISIS DE DATOS

6.12. Se realiza un estudio sobre el hábito de fumar en adultos de mediana edad con 200
hombres y 300 mujeres. Un 30% de los hombres reconocen que sí fuman habitualmente,
mientras que 225 mujeres se declaran no fumadoras. Si seleccionamos una persona al
azar, ¿cuál es la probabilidad de que sea hombre y no fume? A) 0,70; B) 0,28; C) 0,73.

6.13. Con los datos del ejercicio anterior, si elegimos una persona al azar, ¿cuál es la
probabilidad de que fume? A) 0,32; B) 0,73; C) 0,27.

6.14. Si colocamos una rata en un laberinto, como el


recogido en la Figura 1, ¿cuál es la probabilidad de
que escoja la salida C?: A) 0,10; B) 0,20; C) 0,25

6.15. Si colocamos una rata en dos ocasiones en un


laberinto, como el recogido en la Figura 1, y
suponemos que no hay aprendizaje (los ensayos son
independientes) ¿cuál es la probabilidad de que Figura 1. Rata situada en un
escoja la misma salida en las dos ocasiones?: A) laberinto con cuatro salidas (A, B,
0,06; B) 0,25; C) 0,50 C y D) equiprobables

6.16. Teniendo en cuenta los datos de la


Situación 1, ¿cuál es la probabilidad Situación 1. En un barrio de las afueras de
de sufrir un atasco? A) 0,25; B) Madrid viven 10 trabajadores de una gran
0,48; C) 0,63. empresa cuya sede está en la otra punta de la
ciudad. Hay tres posibles recorridos para realizar
6.17. Con los datos de la Situación 1, se
su trayecto y 5 de ellos escogen la ruta A, 3 de
ha elegido un trabajador al azar
ellos la ruta B y 2 de ellos la ruta C. Se sabe
constatando que ha sufrido un
además, que la probabilidad de encontrar atasco
atasco, ¿cuál es la probabilidad de
siguiendo la ruta A es 0,4, siguiendo la ruta B es
que haya escogido la ruta B? A)
0,5 y siguiendo la ruta C es 0,65
0,15; B) 0,31; C) 0,53.

6.18. Teniendo en cuenta los datos


representados en la Gráfica 2, si 100
elegimos un alumno al azar ¿cuál es
la probabilidad de que haya 80 40
realizado la PEC?: A) 0,4; B) 0,3; C) 70
60
0,6
No
6.19. Si elegimos un alumno al azar, 40
Si
teniendo en cuenta los datos 60
20
representados en la Gráfica 2, ¿cuál 30
es la probabilidad de que esté 0
matriculado en la asignatura A y
Asignatura A Asignatura B
haya entregado la PEC?: A) 0,1; B)
0,2; C) 0,5
Gráfica 2: Representación gráfica del porcentaje
6.20. Elegido un alumno al azar, teniendo de alumnos en dos asignaturas (A y B) según
en cuenta los datos presentados en hayan realizado o no una PEC (Prueba de
la Gráfica 2, ha resultado que ha evaluación continua). En la asignatura A hay
entregado la PEC ¿cuál es la matriculados 100 alumnos y, en la asignatura B,
probabilidad de que esté 200 alumnos.
matriculado en la asignatura B?: A)
0,2; B) 0,4; C) 0,5

2
INTRODUCCIÓN AL ANÁLISIS DE DATOS

6.21. La probabilidad de que un jurado llegue al veredicto de culpable suponiendo que la


persona es culpable es del 95% y del 5% si no lo es. Se estima que el 99% de las
personas que llegan a juicio son culpables. ¿Cuál es la probabilidad de que el jurado
dictamine un veredicto de culpable? A) 0,05; B) 0,94; C) 0,99.

6.22. Con los datos del ejercicio anterior, ¿Cuál es la probabilidad de que una persona sea
culpable, dado que el jurado ha determinado que es culpable? A) 0,05; B) 0,95; C) 0,99.

6.23. De los siguientes diagramas de árbol, ¿cuál representa los datos del enunciado del
Ejercicio 6.21? A) Diagrama 1; B) Diagrama 2; C) Diagrama 3.

Diagrama 1 Diagrama 2 Diagrama 3

6.24. Atendiendo a los datos de la Tabla 1,


¿cuál es la sensibilidad de la prueba para Resultado Prueba
evaluar la depresión en adolescentes?
A) 0,69; B) 0,79; C) 0,90. + -
Trastorno Sí 36 16
6.25. Atendiendo a los datos sobre calidad Depresivo No 4 44
de la prueba diagnóstica presentada en
la Tabla 1, ¿cuál es su valor predictivo Tabla 1. Resultados de un estudio sobre la
negativo? A) 0,27; B) 0,73; C) 0,92. calidad de una prueba diagnóstica, para
evaluar la depresión en adolescentes.

3
INTRODUCCIÓN AL ANÁLISIS DE DATOS

SOLUCIONES

6.1. C
6.2. A
6.3. B
6.4. A

P( B)  1  P( B )  1  0,75  0,25
P( A  B)  P( A)  P( B)  P( A  B)  0,40  0,25  0,55  0,10
6.5. A
6.6. A
6.7. C
2 3 1 4
P(A  C)  P(A)  P(C) - P(A  C)    
6 6 6 6
6.8. A
1
P(6) 
6
1 1 1 1
P(6  6  6)  P(6)  P(6)  P(6)      0,0046
6 6 6 216
6.9. C
Dado que la selección es con reposición, el espacio muestral es: VV, VA, AV, AA
Hay dos bolas en una bolsa, una verde (V) y una azul (A), y extraemos dos bolas una a
una y con reposición. Es decir, se saca una bola, se vuelve a meter en la bolsa y se saca
una segunda bola.
Como en el momento de cada extracción están la bola verde y la bola azul en la bolsa,
los pares posibles son: bola verde en ambas extracciones (VV), bola verde en la primera
extracción y bola azul en la segunda (VA), bola azul en la primera extracción y bola verde
en la segunda (AV) y bola azul en ambas extracciones (AA).
6.10. A

Itinerario
Clínica Educación Trabajo
Hombre 5 15 25 45
Sexo
Mujer 25 15 5 45
30 30 30 90

15
P(hombre  educación)   0,1667
90
6.11. B
25
P(mujer  clínica )
P(mujer clínica )   90  0,83
P(clínica ) 30
90

4
INTRODUCCIÓN AL ANÁLISIS DE DATOS

6.12. B

Fumador
Sí No
Hombre 60 140 200
Sexo
Mujer 75 225 300
135 365 500

140
P( H  No)   0,28
500

6.13. C
135
P( Sí )   0,27
500
6.14. C

6.15. B

PAA  · 
11 1 11 1 11 1 11 1
P(BB)  ·  P(CC)  ·  P(DD)  · 
4 4 16 4 4 16 4 4 16 4 4 16
1 4
4·   0,25
16 16

6.16. B

5
P( A)   0,5 P(atasco A)  0,4
10
3
P( B)   0,3 P(atasco B)  0,5
10
2
P(C )   0,2 P(atasco C )  0,65
10
P(atasco )  P( A  atasco )  P( B  atasco )  P(C  atasco ) 
 P( A)·P(atasco A)  P( B)·P(atasco B)  P(C )·P(atasco C ) 
 0,5  0,4  0,3  0,5  0,2  0,65  0,48

6.17. B

P( B)·P(atasco B) 0,3  0,5


P( B atasco)    0,31
P(atasco) 0,48

5
INTRODUCCIÓN AL ANÁLISIS DE DATOS

6.18. A

PEC
Sí No
A 60 40 100
Asignatura
B 60 140 200
120 180 300

PSi  
120
 0,4
300

6.19. B

P A  Si  
60
 0,2
300
6.20. C

 60 
 
PB  Si   300  60
PB Si      0,5
PSi   120  120
 
 300 
6.21. B
C= Culpable VC=Veredicto de culpable

C  no culpable
PC   1  0,99  0,01

PVC C   0,95 PVC C   0,05

P(VC )  P(C )·P(VC C )  P(C )·P(VC C ) = 0,99  0,95  0,01  0,05  0,94
6.22. C

PC ·PVC / C  0,99  0,95


PC / VC    
PC ·PVC / C   PC ·PVC / C  0,99  0,95  0,01  0,05
0,9405 0,9405
   0,99
0,9405  0,0005 0,941
6.23. A

6
INTRODUCCIÓN AL ANÁLISIS DE DATOS

6.24. A

Resultado Prueba
+ -
Trastorno Sí 36 16 52
Depresivo No 4 44 48
40 60 100

Sensibilidad = P( T )

nT 36
P( T )   0,69
nT 52

6.25. B

Valor predictivo negativo = P( NT )

n NT  44
P( NT )    0,73
n 60

7
INTRODUCCIÓN AL ANÁLISIS DE DATOS

EJERCICIOS RESUELTOS TEMA 7.

7.1. Se llama función de probabilidad de una variable aleatoria discreta a aquella función que
asocia, a cada valor de la variable, la probabilidad de que ésta adopte: A) ese valor; B) ese valor
o cualquier otro inferior; C) ese valor o cualquier otro superior.

7.2. Los valores posibles de una variable aleatoria X son: 0, 1, 2, 3 y 4. Si todos los valores tienen la
misma probabilidad, la probabilidad de que X sea menor o igual que 3 es: A) 0,20; B) 0,60; C)
0,80

7.3. Una variable aleatoria discreta X toma los valores 0, 1, 2 y 3. Si sabemos que P(X > 2) = 0,125
¿cuál es la probabilidad de que X sea igual a 3?: A) 0,125; B) 0,25; C) 0,875

7.4. Una variable aleatoria discreta X puede adoptar, con la misma probabilidad, los valores 1, 2, 3
y 4. ¿Cuál es su esperanza matemática? A) 0,25; B) 1; C) 2,5.

7.5. La función de probabilidad de una variable X es: f(1)=0,25; f(2)=0,50 y f(3)=0,25. Su varianza
vale: A) 0,5; B) 2,5; C) 2,3

7.6. Según la tabla 1, la probabilidad de


obtener un valor menor o igual a 2 es: x 1 2 3 4
A) 0,35; B) 0,50 C) 0,15 F(x) 0,15 0,50 0,80 1

7.7. Con los datos de la tabla 1, la Tabla 1: Función de distribución de la variable


esperanza matemática de la variable X aleatoria X
es: A) 7,55; B) 2,55; C) 3

7.8. Considerando los datos de la Tabla 2, la Tabla 2. Función de probabilidad de una


función de distribución, F(x), para x = 1 es: A) variable X.
0,3; B) 0,4; C) 0,5
x f(x)
-1 0,2
7.9. Considerando la Tabla 2, la esperanza
0 0,1
matemática de la variable aleatoria X es: A)
1 0,2
1,1; B) 1,2; C) 1,3 2 0,3
3 0,2

7.10. ¿Cuál es la media de una variable aleatoria X que toma los valores 0, 1 y 2, con una
probabilidad de 0,6, 0,2 y 0,2 respectivamente? A) 0,2; B) 0,6; C) 1.

7.11. Sea X una variable aleatoria discreta que toma los valores 0,1, 2 y 3. Si los valores son
equiprobables, la desviación típica es igual a: A) 0,69; B) 0,25; C) 1,12

1
INTRODUCCIÓN AL ANÁLISIS DE DATOS

7.12. Con los datos de la Figura 1, la


probabilidad de que la variable aleatoria X Figura 1. Representación gráfica de una
adopte valores mayores o iguales a 1 es: A) variable aleatoria
0,2; B) 0,5; C) 0,7.
0.4

7.13 ¿Cuál es la media de la variable aleatoria X 0.3


presentada en la Figura 1?: A) 0,25; B) 1,5;
C) 2,5. f(x) 0.2

0.1
7.14 ¿Cuál es la varianza de la variable aleatoria
X presentada en la Figura 1?: A) 1,45; 0
B) 2,20; C) 3,70.
0 1 2 3 X

7.15. Lanzamos al aire 10 veces una moneda (no trucada), ¿cuál es la probabilidad de que salgan 4
caras? : A) 0,2051; B) 0,3770; C) 0,5000

7.16. Si lanzamos al aire 10 veces una moneda (no trucada), la varianza de la variable aleatoria
“número de caras” es: A) 2,5; B) 4; C) 10

7.17. Un antidepresivo causa efectos secundarios en el 25% de los pacientes que lo toman. Si
elegimos al azar 8 pacientes entre los que toman el antidepresivo, la probabilidad de que
ninguno de estos 8 pacientes tenga efectos secundarios es: A) 0; B) 0,1001; C) 0,25

7.18. Con los datos del ejercicio anterior, el número medio de pacientes que se espera tengan
efectos secundarios es: A) 0; B) 2; C) 4

7.19. En un estudio sobre fobias concluyen que el 40% de la población adolescente con este
problema presentan fobia social. Si elegimos al azar una muestra de 15 adolescentes, ¿cuál es la
probabilidad de que cinco de ellos padezcan este trastorno? A) 0,1859; B) 0,4032; C) 0,8290.

7.20. Se sabe que un 30% de las personas que acuden a una primera consulta en un centro de
psicología clínica presentan un trastorno depresivo. Si elegimos al azar una muestra de 10
personas que acuden al centro, la probabilidad de que dos o más no tengan depresión es: A)
0,1493; B) 0,0282; C) 0,3002

7.21. En una consulta de un psicólogo especialista en depresión, el 80% de los pacientes depresivos
son varones y el resto mujeres. Si seleccionamos al azar de esa consulta 10 pacientes
depresivos, ¿cuál es la probabilidad de que 4 pacientes de estos 10 pacientes sean mujeres?: A)
0,0881; B) 0,20; C) 0,9672

2
INTRODUCCIÓN AL ANÁLISIS DE DATOS

7.22. Si colocamos una rata en un laberinto, como el


recogido en la Figura 2, y la variable aleatoria X toma el
valor 1 cuando la rata escoge la salida A y 0 en otro
caso. ¿cuánto vale la media de X?: A) 0,25; B) 0,50;
C) 2,50

7.23. Si en un laberinto como el de la Figura 2 colocamos


sucesivamente 20 ratas diferentes, ¿Cuál es la
probabilidad de que 5 de ellas escojan la salida A?:
A) 0,1686; B) 0,2023 ; C) 0,6172
Figura 2. Rata situada en un
7.24. Si en un laberinto como el de la Figura 2 colocamos laberinto con cuatro salidas (A,
sucesivamente 20 ratas diferentes, ¿Cuál es la B, C y D) equiprobables
probabilidad de que 5 ó menos escojan la salida A?:
A) 0,2023 ; B) 0,3456; C) 0,6172

7.25. ¿Cuál es la probabilidad de que un estudiante que responde al azar las 20 preguntas de un
examen de verdadero o falso acierte más de 15? A) 0,0059; B) 0,5900; C) 0,9941.

3
INTRODUCCIÓN AL ANÁLISIS DE DATOS

SOLUCIONES

7.1. A

7.2. C
x 0 1 2 3 4
f(x) 0,2 0,2 0,2 0,2 0,2

P(X ≤ 3) = f(0) + f(1) + f(2) + f(3) = 0,20 + 0,20 + 0,20 + 0,20 = 0,80

7.3. A

7.4. C
X f(x) Xf(x)
1 0,25 0,25
2 0,25 0,50
3 0,25 0,75
4 0,25 1
2,5
   x· f x   2,5
7.5. A

x f(x) x  μ  x  μ2 x  μ2 · f x


1 0,25 -1 1 0,25
σ 2   x  μ  · f x   0,50
2
2 0,50 0 0 0
3 0,25 1 1 0,25
0,50

7.6. B

x F(x)
1 0,15
2 0,50
3 0,80
4 1

7.7. B

x F(x) f(x) x·f(x)


1 0,15 0,15 0,15
2 0,50 0,35 0,70
3 0,80 0,30 0,9
4 1 0,20 0,8
2,55

4
INTRODUCCIÓN AL ANÁLISIS DE DATOS

7.8. C
F(1)=f(-1)+f(0)+f(1)=0,2+0,1+0,2=0,5

7.9. B
x f(x) x·f(x)
-1 0,2 -0,2
0 0,1 0
1 0,2 0,2
2 0,3 0,6
3 0,2 0,6
1 1,2

7.10. B
x f(x) x·f(x)
0 0,6 0
1 0,2 0,2    x· f x   0,6
2 0,2 0,4
0,6

7.11. C
x f(x) x·f(x) ( x  μ) ( x  μ) 2 ( x  μ) 2 f ( x )
0 0,25 0 -1,5 2,25 0,5625
1 0,25 0,25 -0,5 0,25 0,0625
2 0,25 0,50 0,5 0,25 0,0625
3 0,25 0,75 1,5 2,25 0,5625
1,5 1,25

  1,5
 2  1,25    1,12
7.12. C
P( X  1)  f (1)  f (2)  f (3)  0,2  0,2  0,3  0,7
7.13. B

x f(x) x·f(x)
0 0,3 0
1 0,2 0,2
   x· f x   1,5
2 0,2 0,4
3 0,3 0,9
1,5

5
INTRODUCCIÓN AL ANÁLISIS DE DATOS

7.14. A
x f(x) x·f(x) x2 x2·f(x)
0 0,3 0 0 0
1
2
0,2
0,2
0,2
0,4
1
4
0,2
0,8
 
 2  E X 2  E X 2  3,7  (1,5) 2  3,7  2,25  1,45
3 0,3 0,9 9 2,7
1,5 3,7

7.15. A
(Se busca directamente en la tabla I, con n = 10, p = 0,50 y x = 4).
7.16. A
Binomial con n = 10 y p = 0,5  varianza = npq = 10  0,5  0,5  2,5
7.17. B
Distribución Binomial con n = 8, p = 0,25 y x = 0 (Tabla I)
7.18. B
La media de la distribución binomial es igual a np.
Como n = 8 y p = 0,25, la media es: np = 8(0,25) = 2
7.19. A
(Se busca directamente en la tabla I, con n = 15, p = 0,40 y x = 5).
7.20. A
La probabilidad de que 2 o más no tengan depresión es equivalente a que ninguno o uno
tengan depresión. Por lo tanto, debemos calcular P ( X  1) con n=10 y p=0,30.
Este valor se localiza en la Tabla II con n=10, x=1 y p=0,30
7.21. A
Tabla I con n = 10, p = 0,2 y x = 4
7.22. A

x f(x) x·f(x)
1
X   x·f ( x ) 
0 3/4 0
 0,25
1 1/4 1/4 4
1 1/4

7.23. B
Utilizando las tablas de la binomial (Tabla I) con n=20, p=0,25 y x=5, obtenemos 0,2023
7.24. C
Función de distribución binomial (Tabla II)

7.25. A
P( X  15)  1  P( X  15)
Utilizando la Tabla II comprobamos (para n=20, x=15 y p=0,5) que P( X  15)  0,9941.
Por tanto, P( X  15)  1  0,9941 0,0059

6
INTRODUCCIÓN AL ANÁLISIS DE DATOS

EJERCICIOS RESUELTOS TEMA 8.

8.1. La media y la varianza de las puntuaciones típicas valen, respectivamente, 0 y 1: A) siempre;


B) nunca; C) sólo si la distribución es normal

8.2.. En una distribución normal tipificada, el percentil 67 vale: A) 0,44; B) 0,67; C) 0,7486

8.3. Se sabe que el absentismo laboral de la empresa se distribuye como una normal de media 2,2 y de
varianza 1,44. El percentil 25 es un valor comprendido entre: A) 0 y 1; B) 1 y 2; C) 2 y 3

8.4. En una población, las puntuaciones en un test de memoria se distribuyen normalmente con media
100 y varianza 36. La proporción de sujetos con puntuaciones en el test entre 90 y 110 está entre:
A) 0,10 y 0,15; B) 0,50 y 0,55; C) 0,90 y 0,95

8.5. En una distribución normal con media 100 y desviación típica 15, la proporción de sujetos con
puntuaciones entre 115 y 85 es igual a: A) 0,8413; B) 0,1587; C) 0,6826

8.6. Las puntuaciones en una prueba de comprensión verbal siguen la distribución normal con media
50 y desviación típica 10. ¿Qué proporción de sujetos obtienen una puntuación superior a 60?:
A) 0,1587; B) 0,5398; C) 0,8413

Tabla 1: Un psicólogo utilizó un test de analogías verbales (X) para predecir el rendimiento en
lengua de 4º de la ESO (Y). Obtuvo las puntuaciones en las dos variables en una muestra aleatoria
de 1000 estudiantes. En la tabla se muestran las medias, las varianzas y la correlación entre ambas
variables.
X Y
Media 30 15
Varianza 64 36
Correlación rXY  0,70

8.7. Sabiendo que las puntuaciones en el test de analogías verbales de la Tabla 1 se distribuyen
normalmente, ¿cuál es la proporción de sujetos con puntuaciones entre 22 y 38?: A) 0,84;
B) 0,50; C) 0,68

8.8. En una población de 2500 personas, las puntuaciones en un test de inteligencia siguen una
distribución normal con media 100 y desviación típica 15. ¿Cuántas personas tienen en el test una
puntuación superior a 130?: A) 15; B) 25; C) 57

8.9. Suponiendo que las calificaciones de los 4000 alumnos que se presentaron en la Convocatoria de
Febrero al examen de una asignatura se distribuyen normalmente con media igual a 4,7 y

1
INTRODUCCIÓN AL ANÁLISIS DE DATOS

desviación típica igual a 3. ¿Cuántos alumnos obtuvieron una calificación igual o menor a 5?
A) 1841; B) 2159; C) 2560

8.10. Las puntuaciones en un test de inteligencia siguen una distribución normal de media 100 y
desviación típica 15. Si queremos clasificar la población en cuatro grupos de igual tamaño, ¿qué
puntuaciones delimitarán estos grupos? A) 80, 100 y 120; B) 85, 100 y 115; C) 90, 100 y 110

8.11. Las puntuaciones en una prueba de psicomotricidad siguen una distribución normal con varianza
9. Si el primer cuartil vale 4, ¿cuál es la media de las puntuaciones en psicomotricidad? A) 0;
B) 1,99; C) 6,01

Gráfica 1. El área de color blanco bajo la curva normal vale 0,242

8.12. Respecto a la Gráfica 1, la desviación típica de la distribución de la variable X: A) vale 1;


B) vale 10; C) no se puede calcular

8.13. Respecto a la Gráfica 1, la probabilidad de obtener un valor inferior a µ = 80: A) vale 0;


B) vale 0,5; C) no se puede calcular

8.14. En una distribución Chi-cuadrado con 7 grados de libertad, el valor 1,239 corresponde al
percentil: A) 1; B) 10; C) 99

8.15. Una distribución Chi-cuadrado tiene varianza igual a 32, su media es: A) 4; B) 16; C) 32

78.16. Una variable aleatoria sigue una distribución Chi-cuadrado con varianza igual a 4. Los grados
de libertad de esta variable son: A) 8; B) 2; C) 4

8.17. En una distribución Chi-cuadrado con 60 grados de libertad, la P(X > 79,0819) es: A) 0,05;
B) 0,95; C) 0,975

2
INTRODUCCIÓN AL ANÁLISIS DE DATOS

8.18. En una variable aleatoria X que sigue la distribución Chi-cuadrado con varianza igual a 40, la
probabilidad de que (10,8508  X  28,4120) es: A) 0,95; B) 0,85; C) 0,90

8.19. Una variable se distribuye según una t de Student con 20 grados de libertad, ¿cuál es la media de
dicha variable?: A) 20; B) 0; C) hacen falta más datos para calcularla

8.20. Respecto a la media de la distribución t de Student: A) cuanto mayor es el número de grados de


libertad mayor es la media; B) cuanto mayor es el número de grados de libertad menor es la
media; C) no se modifica la media al aumentar los grados de libertad

Gráfica 2

8.21. En la Gráfica 2, el área de color gris vale: A) 0,10; B) 0,50; C) 4,8652

8.22. Respecto a la Gráfica 2, ¿cuánto vale la probabilidad de un valor igual o inferior a la media de
la distribución?: A) 0; B) 0,05; C) las opciones A y B son incorrectas

8.23. La probabilidad de que una variable X que sigue una distribución t de Student con 10 grados de
libertad tome el valor -0,7 o uno menor es: A) 0,25; B) 0,50; C) 0,75

8,24. En las tablas de la t de Student con 16 grados de libertad, el percentil 90 es: A) 1,337; B) 1,537;
C) 1,737

8.25. Las puntuaciones en un test psicomotor se distribuyen según una t de Student con 40 grados de
libertad. La probabilidad de obtener puntuaciones mayores que 2,423 es: A) 0,010; B) 0,005;
C) 0,990

8.26. Una variable aleatoria se distribuye según la t de Student con varianza igual a 1,20. ¿Cuál es el
valor de la distribución que deja por encima al 20% de las observaciones? A) 0,873; B) 0,849;
C) 0,259

3
INTRODUCCIÓN AL ANÁLISIS DE DATOS

8.27. En una distribución F de Snedecor con 7 grados de libertad en el numerador y 30 en el


denominador, el percentil 5 es: A) 0,296; B) 2,334; C) 3,376

8.28. Una variable X se distribuye según la F de Snedecor con 7 grados de libertad en el numerador y
20 en el denominador. ¿Cuál es el percentil 10 de esa distribución? A) 2,595; B) 0,385; C) 2,040

8.29. La distribución F: A) es simétrica; B) puede adoptar cualquier valor entre -∞ y +∞; C) posee la
propiedad recíproca

8.30. ¿Cuál de las siguientes distribuciones se emplea habitualmente en pruebas de bondad de ajuste?:
A) Chi-cuadrado; B) t de Student; C) F de Snedecor

SOLUCIONES

8.1. A
La media y la varianza de las puntuaciones típicas son siempre 0 y 1, respectivamente. Es una
propiedad de las puntuaciones típicas.
8.2. A
P67 = 0,44 (Tabla IV)

8.3. B
Tabla III

8.4. C
Tablas III y IV
X 90  100 110  100
Z   1,67 y  1,67
 6 6
P(Z ≤ 1,67) - P(Z ≤ -1,67) = 0,9525 – 0,0475 = 0,905

8.5. C
Tablas III y IV
85  100 115  100
z  1 z 1
15 15
La proporción de sujetos entre z = -1 y z = 1 es:

P(1  Z  1)  P( Z  1)  P( Z  1)  0,8413  0,1587  0,6826

4
INTRODUCCIÓN AL ANÁLISIS DE DATOS

8.6. A
Tabla IV
X   60  50
z  1
 10
P(Z > 1) = 1 - P(Z ≤ 1) = 1 - 0,8413 = 0,1587

8.7. C
Se pide: P(22  X  38)  P( X  38)  P( X  22)
Para calcular estas proporciones, transformamos las puntuaciones directas a puntuaciones típicas y
buscamos en las tablas de la distribución normal.
22  X 22  30
z   1 ; P(Z  1)  0,1587
Sx 8
38  30
z  1 ; P(Z  1)  0,8413
8

8.8. C
Tabla IV
(130  100)
z 2
15
P(Z  2)  1  P(Z  2)  1  0,9772  0,0228

Nº de personas con inteligencia mayor que 130  2500  0,0228  57

8.9. B
5  4,7
z  0,1
3

5
INTRODUCCIÓN AL ANÁLISIS DE DATOS

P(Z < 0,1) = 0,5398 (Tabla IV)

(0,5398) (4000) =2159,2 ≈ 2159

8.10. C
Se piden los cuartiles. Buscamos en el interior de la Tablas III y IV las probabilidades 0,25, 0,50
y 0,75 y vemos que corresponden a las puntuaciones típicas -0,67, 0 y 0,67.

P25  100
 0,67   P25  90
15
P50  100
0  P50  100
15
P75  100
0,67   P75  110
15

8.11. C
P25=4 y la puntuación típica que deja por debajo al 25% de los sujetos es z=-0,67 (Tabla III)

4
 0,67    6,01
3

8.12. B
A la proporción 1 - 0,242 = 0,758 le corresponde una z = 0,70  P(Z ≤ 0,70) = 0,758 (Tabla
IV)
X 87  80 87  80
Z z  0,70     10
  0,70

8.13. B
A  = 80 en la distribución de X le corresponde una z = 0 en la distribución normal tipificada.
P(X < 80) = P(Z < 0) = 0,5 (Tabla IV)

6
INTRODUCCIÓN AL ANÁLISIS DE DATOS

8.14. A
Tabla V con 7 g.l.

8.15. B
La media y la varianza de una distribución Chi cuadrado son n y 2n, respectivamente.
32
Varianza = 2n = 32  n  16  Media = n = 16
2
8.16. B

8.1. A
P(X ≤ 79,0818) = 0,95 Tabla V para 60 g.l.

P(X > 79,0818) = 1 - 0,95 = 0,05

8.18. B
Buscamos en la Tabla V para 40 g.l. las probabilidades, por lo que:

P(10,8508  X  28,4120)  P( X  28,4120)  P( X  10,8508)  0,90  0,05  0,85


8.19. B

8.20. C

8.21. A
P(X ≤ 4, 8652) = 0,10 (Tabla V para 10 g.l.)

8.22. C
 = n = 10
Como se ve en la Tabla V para 10 g.l., la P(X ≤ 10) es un valor entre 0,10 y 0,90

7
INTRODUCCIÓN AL ANÁLISIS DE DATOS

8.23. A
P(X ≤ -0,7) = 1- P(X ≤ 0,7) = 1 - 0,75 = 0,25 (Tabla VI para 10 g.l)

8.24. A
Tabla VI para 16 g.l.

8.25. A
En la tabla VI para 40 g.l, la P(T  2,423)  0,990 . Dado que se pide la probabilidad de obtener
puntuaciones mayores o iguales que 2,423, la probabilidad es igual a 1 - 0,990 = 0,010
8.26. A
n
2   1,20  n  12 grados de libertad.
n2
P(T  t12 )  0,20  P(T  t12 )  0,80
En la tabla VI este valor es: t 12  0,873
8.27. A
Tabla VII para p = 0,95, n1=30 y n2 =7
1 1
0, 05 F7,30    0,296
0, 95 F30, 7 3,376

8.28. B
Tabla VII para p = 0,90, n1=20 y n2 =7
1 1
0,10 F7, 20    0,385
0, 90 F20, 7 2,595

8
INTRODUCCIÓN AL ANÁLISIS DE DATOS

8.29. C
8.30. A

9
INTRODUCCIÓN AL ANÁLISIS DE DATOS

EJERCICIOS RESUELTOS TEMA 9

9.1. El muestreo aleatorio simple: A) es el más adecuado en cualquier tipo de situación; B) Se utiliza
en otros tipos de muestreo; C) es totalmente equivalente al muestreo casual.
9.2. En el muestreo aleatorio simple, la probabilidad de que cada individuo sea elegido de la población
es: A) la misma para todos los individuos; B) distinta para cada individuo; C) la misma para
algunos individuos.
𝑖𝑖=𝑁𝑁 𝑋𝑋𝑖𝑖
9.3. La media de la distribución muestral de la media se corresponde con: A) 𝜇𝜇𝑋𝑋� ; B) ∑𝑖𝑖=1 , siendo
𝑁𝑁
N el número de sujetos en la población; C) ambas respuestas son correctas.
9.4. Para seleccionar una muestra de profesores universitarios para una encuesta, se seleccionaron al
azar algunas universidades, dentro de cada una de ellas algunas facultades y, finalmente algunas
asignaturas dentro de cada facultad. Sabiendo que la muestra está formada por todos los
profesores de las asignaturas seleccionadas, el muestreo utilizado es: A) el muestreo sistemático;
B) el muestreo por conglomerados; C) el muestreo estratificado.
9.5. En el muestreo estratificado se eligen los elementos en: A) un estrato de la población; B) algunos
estratos de la población; C) cada estrato de la población.
9.6. El muestreo estratificado es recomendable cuando en la población: A) los individuos son muy
similares entre sí; B) existen grupos de individuos claramente diferenciados; C) la proporción de
individuos es idéntica en cada uno de los estratos.
9.7. Se desea realizar una encuesta sobre los Tabla 1. Población del pueblo donde se va a
hábitos de lectura en un pueblo, cuyos realizar la encuesta, agrupada por edades.
datos de población aparecen en la Tabla 1.
La muestra necesaria para la encuesta es
de n = 500 individuos. ¿Qué tipo de
muestreo es el más aconsejable?: A)
Aleatorio simple; B) Estratificado con
afijación proporcional; C) Conglomerados.
9.8. Con los datos del ejercicio anterior
determinar cuál es la composición de la
muestra seleccionada en función de cada
estrato? A) 125, 125, 125, 125; B) 87, 189,
145, 79; C) 79, 223, 152, 46.

9.9. En un centro escolar hay 500 alumnos matriculados en la asignatura A y 500 en la asignatura B.
En cada asignatura hay 400 mujeres. Si queremos una muestra de 100 alumnos para realizar una
encuesta con una proporción de mujeres y hombres en ambas asignaturas idéntica a la del centro
escolar, ¿cuántos alumnos varones de cada asignatura deberá tener la muestra?: A) 5; B) 10; C)
40.
9.10. En el estudio de una variable X se sabe que la desviación típica poblacional es 3. Se selecciona
una muestra de tamaño 100, ¿cuál es el valor del error típico de estimación de la media : A) 0.03;
B) 0.6; C) 0.3).

1
INTRODUCCIÓN AL ANÁLISIS DE DATOS

9.11. La desviación típica de la distribución muestral de la media se denomina: A) desviación típica


poblacional; B) desviación típica muestral; C) error típico de la media.
9.12. Respecto al error típico de la media, ¿cuál de las siguientes afirmaciones es correcta?: A) cuanto
menor es el tamaño de la muestra menor es el error típico; B) cuanto mayor es el tamaño de la
muestra menor es el error típico; C) cuanto mayor es σ menor es el error típico.
9.13. Si una variable X se distribuye normal en la población, la distribución muestral de la media de
esa variable sigue una distribución: A) normal; B) 𝐹𝐹 de Snedecor; C) χ2.
9.14. Sabemos que el error típico de la media vale 1,5 y el tamaño de la muestra es 100, ¿cuál es la
desviación típica de la población?: A) 1,5; B) 15; C) 150.
9.15. Si extraemos una muestra aleatoria de 25 elementos de una población en la que la varianza es 9,
¿cuál es el error típico de la media? A) 0,6; B) 0,7; C) 0,8.
9.16. El error típico de la proporción es la desviación típica de: A) la muestra; B) la población; C) la
distribución muestral de la proporción.
9.17. En una población grande, el porcentaje de personas que leen el periódico 5 días a la semana es
del 45%. Si extraemos muestras de 49 personas, el error típico de la proporción es: A) 0,036; B)
0,071; C) 0,50.
9.18. Los parámetros de una variable aleatoria X, de distribución desconocida en la población, son 𝜇𝜇 =
23 y 𝜎𝜎 = 3,5. Se extraen 25 muestras de tamaño n. ¿Cuál de las siguientes expresiones se
corresponde a la definición de la distribución muestral de la media de dichas muestras? A) 𝑋𝑋� →
𝑋𝑋�𝑋𝑋� = 23 y σX� = 0,7 ; B) X
� → N(23; 3,5); C) X
� → N(23; 0,7).
9.19. Se sabe que la variable optimismo de los alumnos de la UNED se distribuye N(100; 27). ¿Cuál
de los siguientes valores corresponde la varianza de la población? A) 27; B) No se puede
determinar pues no conocemos el tamaño muestral; C) 729
9.20. Las puntuaciones en un test de rendimiento de los estudiantes del primero de Historia del Arte de
la UNED sigue la distribución normal con μ = 50 y varianza desconocida. Se selecciona (por m.
a. s) una muestra formada por 9 estudiantes en la que la media en rendimiento es 52 y la varianza
36. En las circunstancias anunciadas, ¿cuál de las siguientes expresiones corresponde a la
distribución muestral de la media? A) X� → t(50; 2,12) con 8 g.l. ; B) X� → N(50; 36); C) X �→
5
N �50, �.
√9

9.21. Con los datos del ejercicio anterior, ¿cuál es la probabilidad de que la media de muestras de
tamaño 12 se encuentren entre los valores de 48 y 52 puntos? A) 0,15; B) 0,850; C) 0,70.
9.22. Sea X una variable con distribución normal en la población con 𝑁𝑁(𝜇𝜇; 6). Se extraen muestras de
tamaño 25, ¿entre que valores se encuentra el 90% central de las varianzas muestrales? A) (3,91
y 10,74); B) (19,94 y 52,44); C) (2,47 y 11,39).
9.23. Un grupo de investigación de la Universidad de Granada ha desarrollado un test que evalúa el
síndrome de Burnout. La variable se distribuye en la población normal con parámetros 𝜇𝜇 = 120
y varianza 25. Tras diversas aplicaciones para determinar si hay Burnout en los trabajadores de
enfermería de los hospitales, se llega a la conclusión de que el test es poco discriminativo, por lo
que se modifican 8 ítems. Se aplica el nuevo test a una muestra aleatoria de 40 enfermeros y se
obtienen los estadísticos correspondientes cuyos valores son: 𝑋𝑋� = 108 y 𝑆𝑆𝑋𝑋2 = 36. ¿Qué
probabilidad hay de que la nueva versión del test no haya mejorado la capacidad discriminativa?
A) 0,025; B) 0,005; C) 0,010.

2
INTRODUCCIÓN AL ANÁLISIS DE DATOS

9.24. En una encuesta sobre el acoso escolar realizada a 10.000 estudiantes de bachillerato, 6500
respondieron que no eran conscientes de que en su centro existiese este problema. Si tomamos
muestras de tamaño 25, ¿cuál es la media y la varianza de la distribución muestral del número de
estudiantes que mantienen esta opinión? A) (0,85; 0.095); B) (16,25; 21,25); C) (16,25; 5,69).

SOLUCIONES
9.1. B

9.2. A

9.3. C

9.4. B

9.5. C

9.6. B

9.7. B

9.8. C

Tamaño de la población: 14783


El número de personas por intervalo de edad es:

14783 2342 2342 × 500


6 – 16 ∶ = → 𝑥𝑥 = = 79
500 𝑥𝑥 14783

14783 6578 6578 × 500


17 – 40: = → 𝑥𝑥 = = 223
500 𝑥𝑥 14783

14783 4498 4498 × 500


41 − 65: = → 𝑥𝑥 = = 152
500 𝑥𝑥 14783

14783 1365 1365 × 500


Mayores de 66: = → 𝑥𝑥 = = 46
500 𝑥𝑥 14783

9.9. B
Centro escolar:
Total alumnos matriculados 1000
Total mujeres matriculadas 800 (400 por asignatura)
Total hombres matriculados 200 (100 por asignatura)
Proporción de varones del centro: 200/1000 = 0,20
3
INTRODUCCIÓN AL ANÁLISIS DE DATOS

Muestra: 100 alumnos


Número total de varones: 100 x 0,20 = 20
10 varones en cada asignatura
9.10. C
𝜎𝜎 3
𝜎𝜎𝑋𝑋� = = = 0,3
√𝑛𝑛 √100

9.11. C
9.12. B
Teniendo en cuenta la definición de error típico de la media 𝜎𝜎𝑋𝑋� = √𝜎𝜎𝑛𝑛 , se observa que es
inversamente proporcional a n, en consecuencia, cuanto mayor es n menor es el error típico.

9.13. A
9.14. B
σ X = 1,5 n = 100
σ
σX = → σ = n ⋅σ X
n

σ = 100 ×1,5 = 10 ×1,5 = 15


9.15. A
σ 3
σX = = = 0,6
n 25

9.16. C
9.17. B
Supuestos:
Variable X es una variable Bernoulli (lee periódico o no lo lee)
Se conoce el valor π en la población
Las n observaciones son independientes
La muestra es grande n>30
Por tanto se resuelve por aproximación a la normal (pág. 410; formula9.4)

𝜎𝜎 0,50
𝜎𝜎𝑝𝑝 = = = 0,071
√𝑛𝑛 √49
9.18. A
𝜎𝜎 3,5
𝜇𝜇 = 23 𝑦𝑦 = = 0,7
√𝑛𝑛 √25

4
INTRODUCCIÓN AL ANÁLISIS DE DATOS

Dado que X es de distribución desconocida y n es 25 (25 < 30), solo se puede afirmar que la
media de la distribución muestral de las medias es 23 y su error típico 0,7, pero no podemos decir cuál
es su distribución.
9.19. C
σ 2 = Varianza poblacional  272 = 729

9.20. A
Dado que desconocemos la varianza poblacional y que la variable X se distribuye normal, la
� → 𝑡𝑡 �50; 6,36�
distribución de la media muestral sigue una t (pág. 406) cuyos parámetros son: ) X
√9
� → 𝑡𝑡(50; 2,12) con 8 g.l.
X
𝑛𝑛 𝑆𝑆𝑥𝑥2
𝜇𝜇 = 50; 𝑆𝑆𝑛𝑛−1 = = 6,36
𝑛𝑛−1

9.21. C
2 𝑛𝑛 𝑆𝑆𝑥𝑥2 12 × 36
Dado que ahora n = 12; 𝑆𝑆𝑛𝑛−1 = = = 39,27; de donde: 𝑆𝑆𝑛𝑛−1 = √39,27 = 6,27
𝑛𝑛−1 11
𝑋𝑋�−𝜇𝜇 48−50 −2 𝑋𝑋�−𝜇𝜇 50−50 2
𝑇𝑇 = 𝑆𝑆𝑛𝑛−1 = 6,27 = 6 ,27� = − 1,16 y 𝑇𝑇 = 𝑆𝑆𝑛𝑛−1 = 6,27 = 6 ,27� = 1,16 (aunque
� � 3,46 � � 3,46
√𝑛𝑛 √12 √𝑛𝑛 √12
este cálculo es incensario en este caso dada la simetría).
Acudiendo a la Tabla VI podemos calcular las probabilidades correspondientes (recordar que t es
simétrica)
P(T≤ 𝑡𝑡11 ) = P(T≤ 1,16) = 0,850
𝑃𝑃(𝑋𝑋� ≤ 48) = 1 − 0,850 = 0,15 y 𝑃𝑃(𝑋𝑋� ≥ 50) = 0,850
Por tanto P (48 ≤ 52) = 0,850 - 0,15 = 0,7

9.22. B
2
Se trata de la distribución muestral de la varianza. Sabemos que dicha distribución es χ𝑛𝑛−1
2
(Pág. 415). Hay que recordar también que el estimador de 𝜎𝜎 2 es 𝑆𝑆𝑛𝑛−1 .
2
𝑃𝑃�𝜒𝜒2 ≤ χ𝑛𝑛−1 � = 0,05
Acudiendo a la Tabla V con 24 grados de libertad, los valores de 𝜒𝜒 2 correspondientes son:
2
χ24;0,05 = 13,8484
Χ 224;0,95 = 36,4150
Los valores buscados son los límites del intervalo de probabilidad anterior que son:

2
𝑛𝑛 𝑆𝑆𝑥𝑥2 2
χ224;0,05 × 𝜎𝜎 2 13,8484 × 36
χ24;0,05 = → lim inf 𝑆𝑆𝑥𝑥 = = = 19,94
𝜎𝜎 2 𝑛𝑛 25
2
2
2
𝑛𝑛 𝑆𝑆𝑥𝑥 2
χ24;0,95 × 𝜎𝜎 2 36,4150 × 36
χ24;0,95 = → lim sup 𝑆𝑆𝑥𝑥 = = = 52,44
𝜎𝜎 2 𝑛𝑛 25

5
INTRODUCCIÓN AL ANÁLISIS DE DATOS

9.23. A
Se entiende que un test no mejora su capacidad de discriminación cuando la varianza
2
poblacional se mantiene. Sabemos que la distribución muestral de la varianza es χ𝑛𝑛−1 . Por tanto para
nuestros datos:
𝑛𝑛𝑆𝑆 2 40 × 36
χ2𝑛𝑛−1 = = = 57,6
𝜎𝜎 2 25
2 2
𝑃𝑃(𝜒𝜒39 ≥ 57,6) = 1 − 𝑃𝑃(𝜒𝜒39 ≤ 57,6) = (1 − 0,975) = 0,025
Es decir, que hay una probabilidad muy pequeña 0.025 (2,5%) de obtener varianzas iguales o
mayores de 36 bajo el supuesto de que no mejora la capacidad discriminativa del test. Por tanto,
parece que las modificaciones introducidas incrementan la discriminación.

9.24. C
Aplicación directa de la distribución binomial:
La pregunta se refiere al nº de éxitos (en este caso, al número de alumnos) que se corresponde con la variable
X, según lo dicho en el apartado 9.5.1 pág. 409: “Para muestras pequeñas l distribución muestral del
estadístico X (número de éxitos en n ensayos) es:

𝑋𝑋 → 𝐵𝐵 �𝑛𝑛 × 𝜋𝜋, �𝑛𝑛 × 𝜋𝜋 × (1 − 𝜋𝜋)�

La intención de este ejercicio es que se den cuenta de que no es lo mismo la distribución muestral del
número de éxitos que la distribución muestral de la proporción (que por otra parte no es más que una
transformación lineal de la variable número de éxitos definida como P=X/n)
6500
Por tanto: 𝐸𝐸(𝑋𝑋) = 𝑛𝑛𝑛𝑛 = 25 × = 16,25
10000

𝜎𝜎𝑋𝑋 = �𝑛𝑛𝑛𝑛(1 − 𝜋𝜋) = �25 × 0,65 × 0,35 = �5,69

Y 𝜎𝜎𝑋𝑋2 = 5,69

6
INTRODUCCIÓN AL ANÁLISIS DE DATOS

EJERCICIOS RESUELTOS TEMA 10.

10.1. Para estimar la media poblacional de una variable X (cuya distribución es normal)
y cuya desviación típica poblacional es 4, hemos seleccionado mediante m. a. s.
una muestra de 100 personas, obteniendo un valor para la media en la muestra de
10. Trabajando con un nivel de confianza del 95%. ¿Cuáles son los límites del
intervalo confidencial? A) (8,968 y 11,032); B) (9,216 y 10,784); C) (8 y12).
10.2. En un estudio sobre el optimismo de los adolescentes andaluces, la amplitud del
intervalo de confianza es de 2,8 puntos para un nivel de confianza de 0,95. En una
muestra de adolescentes de la Comunidad Andaluza, extraída aleatoriamente de la
población, se ha obtenido un valor para la media de la variable optimismo de 16.
¿Cuáles son los límites entre los cuáles se estima está el optimismo medio de la
población de adolescentes? A) (10,4 y 21,6); B) (13,2 y 18,8); C) (14,6 y 17,4).
10.3. Se aplicó un test de fluidez verbal (cuya distribución en la población es normal) a
una muestra de 121 abogados. La muestra se obtuvo mediante m. a. s. de la
población de abogados de la Comunidad de Madrid. Se sabe que en la población
el test tiene una varianza de 100, habiéndose obtenido en la muestra de estudio un
valor para la media de 105. Con un nivel de riesgo de 0,05, ¿entre qué valores
estará comprendida la media poblacional en fluidez verbal de abogados de la
Comunidad de Madrid? A) (87,19 y 122,81); B) (100,95 y 109,05); C) (103,22 y
106,78).
10.4. Los límites del intervalo de confianza para la autoestima media de adolescentes
con anorexia es 3,02 y 4,98 en una muestra de tamaño n = 36, siendo el nivel de
confianza igual a 0,95 y  igual a 3. ¿Calcular el valor de la media de la muestra
de trabajo?: A) 4; B) 6; C) 8.
10.5. Se extrae, mediante m.a.s., una muestra de tamaño 100 de la población de
estudiantes de medicina de la UCM, a los que y se les administra un test que
valora la autoestima. Se calcula el intervalo de confianza con un nivel de
significación 0,05 para la autoestima media, siendo el valor de los límites:
8,50 y 11,50. ¿Se puede afirmar que la autoestima media de los estudiantes de
medicina de la UCM está entre 8,50 y 11,50? A) Con total seguridad; B) Con
ninguna seguridad; C) Con un nivel de riesgo de 0,05.
10.6. Para los datos del ejercicio anterior y sabiendo que la media de la muestra es 9,35
y la cuasidesviación típica 4,35, ¿cuál es el intervalo de confianza para la media
con un nivel de confianza de 99%?: A) (9,40 y 12,34); B) (7,45 y 10,99); C) (8,23
y 10,47).
10.7. Se sabe que la inteligencia espacial presenta una distribución normal en la
población de estudiantes universitarios. Mediante m.a.s. se extrae una muestra
aleatoria de 100 estudiantes de Bellas Artes de la UCM y se les mide (mediante el
test correspondiente) la inteligencia espacial, obteniendo un valor para la media
de 135 y una desviación típica de 16. ¿Cuál de los siguientes es el intervalo de
confianza de la media poblacional siendo el nivel de riesgo 0,01? A) (99,23 y
150,45); B) (130,78 y 139,22); C) (100,34 y 128,93).
INTRODUCCIÓN AL ANÁLISIS DE DATOS

10.8. Con los datos del ejercicio anterior, ¿cuál de los siguientes intervalos corresponde
estima la varianza manteniendo el nivel de riesgo en 0,01? A) (182,63 y 380,23);
B) (132,89 y 163,58); C) (197,76 y 245,89).
10.9. La proporción de alumnos del grado que aprueban la materia de memoria es
560/800. ¿Cuál de los siguientes intervalos se corresponde con el intervalo de
confianza para la proporción de aprobados en memoria en muestras de tamaño 30,
siendo A) (0,53 y 0,86); B) (0,48 y 0,86); C) (0,48; y 0,92).
10.10. El 70% de los estudiantes de un Centro Asociado utilizan para estudiar la
biblioteca. ¿Cuál de los siguientes intervalos se corresponde con el intervalo de
confianza en el que se encuentra el 95% de la proporción de estudiantes que
utilizan la biblioteca en muestras de tamaño 40? A) (0,51 y 0,89; B) (0,56 y 0,84);
C) (0,51 y 0,84).
10.11. Si incrementamos el tamaño de las muestras, ¿se verá afectado el intervalo de
confianza calculado? A) No, el tamaño muestral no afecta al intervalo: B) Sí,
aumentaría su precisión ya que disminuye su amplitud; C) No se puede responder
sin calcularlo ya que la distribución muestral de la proporción ya no se ajustaría a
la normal.
10.12. Se realiza una encuesta a 150 jóvenes de una determinada población y se
encuentra que 25 de ellos fuman sustancias tóxicas. ¿Cuál de los siguientes
intervalos de confianza corresponde a la proporción real de jóvenes que fuman
este tipo de sustancias aceptando un riesgo de 0,01? A) (0,0876 y 0,225); (B)
(0,106 y 0,225); C) (0,0876 y 0,244).
10.13. La media de una muestra compuesta por 80 sujetos en la variable neuroticismo es
98 y la cuasidesviación típica 25. ¿Cuál de los siguientes intervalos de confianza
para la media se corresponde con un nivel de confianza de 99%? A) (90,79 y
105,21); B) (92,52 y 103,48); C) (93,42 y 102,58).
10.14. Con los datos del ejercicio anterior, suponiendo que el intervalo de confianza
calculado fuese (93,42; 102,58), ¿se podría conocer a qué nivel de confianza se ha
trabajado? A) No, porque lo fija el investigador de forma arbitraria; B) Sí, pero
los datos son insuficientes; C) 0,90.
10.15. La distribución de la variable autoritarismo, medida mediante el test de RWA, se
distribuye en la población según la normal. Una muestra de 30 personas
responden al test y se obtiene una media de 45 puntos y un cuasivarianza de 100.
¿Cuál de los siguientes intervalos corresponde al de la varianza poblacional
siendo el nivel de confianza del 0,90? A) (68,14 y 163,71); B) (49,40 y 150,61);
C) (93,43 y 180,72).
10.16. El nivel de competencia lectora se distribuye normalmente en la población de
estudiantes de la ESO, con una desviación típica igual a 6. Si el error máximo de
estimación que estamos dispuestos a admitir no puede ser superior a 2, y siendo el
nivel de confianza de 0,95. ¿Qué tamaño debe tener la muestra para estimar la
media asumiendo población infinita? A) 35; B) 58; C) 69.
10.17. La amplitud deseada de un intervalo de confianza para la media asumiendo
población infinita es 4. Para un nivel de confianza igual a 0,95, ¿cuál debe ser el
INTRODUCCIÓN AL ANÁLISIS DE DATOS

tamaño de la muestra si la desviación típica de la población es 10? A) 24; B) 67;


C) 96.
10.18. En la estimación de la media, el error de estimación máximo es 2. Siendo n = 144
y Sn-1 = 12,24, ¿cuál es el nivel de confianza? A) 0,95; B) 0,975; C) 0,99

10.19. En una investigación sobre la inteligencia emocional, se ha extraído mediante


m.a.s. una muestra de 100 personas de una determinada población. Se sabe que la
varianza poblacional es 16 y que el límite superior en la estimación por intervalo
de la media es 3,784, con un nivel de confianza de 0,95. ¿Cuánto vale la media de
la muestra seleccionada? A) 1,7; B) 3; C) 2,5
10.20. Los límites superior e inferior del intervalo confidencial de la media poblacional
de una variable X (cuya distribución poblacional es normal) son 5,588 y 4,412
respectivamente. Suponiendo que la muestra seleccionada es de 100 personas, en
las que se ha obtenido una media igual a 5 y que se ha trabajado con un nivel de
confianza del 95%, ¿cuál es la desviación típica de la variable X en la población?
A) 9; B) 4; C) 3
10.21. Atendiendo al enunciado del ejercicio anterior, ¿cuál es el error de estimación
máximo? A) 0,588; B) 1,176; C) 1,96
10.22. En una investigación, la variable X se distribuye normalmente con varianza igual
a 16. Para estimar la media con un error de estimación máximo de 1,25 para un
nivel de confianza de 0,95, se determinó que el tamaño muestral necesario es 40.
Si el error de estimación máximo hubiese sido de 2,5 para el mismo nivel de
confianza, el tamaño muestral requerido sería: A) mayor; B) igual; C) menor
10.23. Se desea realizar una encuesta para determinar la proporción de alumnos de
tercero de la ESO de Madrid que tienen teléfono móvil. ¿Cuál es el tamaño
muestral necesario para que el error máximo de estimación no sea mayor de 0,05,
siendo el nivel de confianza 95% y el muestreo con reposición? A) 666; B) 385;
C) 248.
10.24. Se quiere estimar, con un nivel de confianza del 99% y con un error máximo de
estimación de 0,1, la proporción de familias de un municipio que tiene dos a más
hijos Estudios recientes han obtenido que esa proporción es 0,4. ¿Cuál es el
tamaño de la muestra necesario asumiendo población infinita? A) 160; B) 261; C)
166.
10.25. Un investigador estudia la satisfacción laboral de los trabajadores de una
empresa. Selecciona, mediante m.a.s., una muestra de 400 trabajadores y se les
evalúa mediante la encuesta de satisfacción laboral del Instituto de Salud y
Empleo. Se obtiene una satisfacción media de 8 y una cuasidesviación típica de 9.
¿Cuál es el error de estimación máximo para la varianza, sabiendo que el nivel de
confianza es 0,95?: A) 14,83; B) 1,25; C) 11,23.
INTRODUCCIÓN AL ANÁLISIS DE DATOS

SOLUCIONES

10.1. B
Variable con distribución normal y varianza poblacional conocida, por tanto, la
distribución muestral de la media es: ( ⁄ )

El intervalo confidencial viene definido por:

(̅ | ⁄ | ⁄ ̅ | ⁄ | ⁄ )
√ √

Siendo los límites:


̅ | ⁄ | ⁄ ̅ | ⁄ | ⁄
√ √

Sustituyendo:

n.c. = = 0,95 → | ⁄ | | | (Tabla III y IV)

Los límites buscados son: (9,216; 10,784)

10.2. C
Recuérdese que el IC se define de forma general:
IC = [ ] (pág. 458 libro)
Siendo los límites:
; )
Por tanto, la amplitud del intervalo de confianza es:
( ) ( )
En el problema que hemos planteado

Por tanto: 2,8 = 2 


INTRODUCCIÓN AL ANÁLISIS DE DATOS

Sustituyendo:
̅
̅
Por tanto, el intervalo correspondiente es: (14,6; 17,4)

10.3. C
Variable con distribución normal y varianza poblacional conocida. Por tanto, la
distribución muestral de la media es: ( ⁄ )

(̅ | ⁄ | ⁄ ̅ | ⁄ | ⁄ )
√ √
Siendo los límites:

̅ | | ⁄ ̅ | | ⁄
√ √
Aplicado a nuestros datos:
0,05 | ⁄ | | | (Tabla III y IV);

Por tanto, los límites del intervalo son: (103,22; 106,78)

10.4. A
Variable con distribución normal y varianza poblacional conocida. Por tanto, la
distribución muestral de la media es: ( ⁄ )

(̅ | ⁄ | ⁄ ̅ | ⁄ | ⁄ )
√ √
siendo los límites del intervalo de confianza:

̅ | | ⁄ ̅ | | ⁄
√ √
INTRODUCCIÓN AL ANÁLISIS DE DATOS

n.c. = 0,95 → | ⁄ | | ⁄ | | | (Tabla III y IV)

| ⁄ | ̅

De donde:

⁄ ̅

Caben tres soluciones:
̅ ̅
̅ ̅

10.5. C
10.6 C
Desconocemos la distribución de la variable autoestima en la población y,
tampoco conocemos la varianza poblacional. Dado que el tamaño muestral es grande
(n=100), podemos aplicar el Teorema del Límite Central y resolver mediante la
aproximación de la t de Student a la normal.
Por tanto:

(̅ | ⁄ | ̅ | ⁄ | )
√ √

Siendo los límites:

̅ | ⁄ | ̅ | ⁄ |
√ √

n.c. = 0,99 → | ⁄ | | ⁄ | | | (Tabla III Y IV)

Los límites son: (8,23; 10,47)


INTRODUCCIÓN AL ANÁLISIS DE DATOS

10.7. B
Dado que desconocemos la varianza poblacional pero sabemos que la variable
inteligencia espacial se distribuye en la población según la normal, la distribución
muestral de la ̅ bajo estas condiciones sigue la t de Student, ̅ ( )

Por tanto el intervalo de confianza queda definido como:

(̅ | ⁄
| ̅ | ⁄ )
| )
√ √

Siendo los límites:

̅ | | ̅ | |
⁄ ⁄
√ √

= 2,626 (Tabla VI)

Luego: √ √
Linf = 135 – 2,626 x = 130,78

Lsup = 135 + 2,626 x = 139,22


Los límites son: (130,78; 139,22)


10.8 A
Dado que la varianza muestral es un estimador sesgado de la varianza poblacional
deberemos emplear la cuasivarainza. Además, el tamaño de la muestra es menor que
100, por lo que no se puede aplicar la aproximación a la normal. Por tanto, el intervalo
para viene dado por:

( ) ( )
( )
( ⁄ )

Siendo los límites:

( ) ( )

Del ejercicio anterior sabemos que:


INTRODUCCIÓN AL ANÁLISIS DE DATOS

⁄ y ⁄ (Tabla V)

( ) ( )

( ) ( )

El intervalo es: (182,63; 380,23)

10.9. C
Dado que las muestras son de tamaño 30, podemos considerar la aproximación a la
normal, es decir la proporción de aprobados en memoria en muestras de tamaño 30 se
distribuye:
( )
( √ )

( ) ( )
( | ⁄ |√ | ⁄ |√ )

Y los límites:
( ) ( )
| ⁄ |√ | ⁄ |√

Aplicado a nuestros datos:

; 1 - p = 1 - 0,7 = 0,3; √

n.c. = 0,99 → | ⁄ | | ⁄ | | | (Tabla III y IV)

( )
| ⁄ |√

( )
| ⁄ |√

El intervalo es: (0,48; 0,92)

10.10. B
INTRODUCCIÓN AL ANÁLISIS DE DATOS

Dado que las muestras son de tamaño 40, podemos considerar la aproximación a la
normal. Es decir, la proporción de estudiantes que utilizan la biblioteca se distribuye
( )
N( √ )

donde:
( ) ( )
( | ⁄ |√ | ⁄ |√ )

Y los límites del intervalo son:

( ) ( )
| ⁄ |√ | ⁄ |√

Aplicado a nuestros datos:

; 1 - p = 1 - 0,7 = 0,3
( )
√ √

n.c. = 0,95 → | ⁄ | | ⁄ | | | (Tabla III y IV)

( )
| ⁄ |√ ( )

( )
| ⁄ |√

El intervalo es: (0,56; 0,84)

10.11. B (ver página 459 del libro)

10.12 C
| ⁄ | | ⁄ | | | (Tabla III y IV)
Dado que la muestra es de tamaño 150, podemos considerar la aproximación a la
normal. Es decir, la proporción de estudiantes que fuman sustancias se distribuye
( )
( √ )

donde:
INTRODUCCIÓN AL ANÁLISIS DE DATOS

( ) ( )
( | ⁄ |√ | ⁄ |√ )

Y los límites son:

( ) ( )
| ⁄ |√ | ⁄ |√

Aplicado a nuestros datos:


n.c. = 0,99 → | ⁄ | | ⁄ | | | (Tabla III y IV)

( )
√ √

Por tanto:
( )
| ⁄ |√ ( )

( )
| ⁄ |√ ( ) 0,244

El intervalo es: (0,0876; 0,244)

10.13. A
Desconocemos la distribución de la variable autoestima en la población y la varianza
poblacional. Dado que el tamaño muestral es grande (n = 80), podemos aplicar el
Teorema del Límite Central y resolver mediante la aproximación de t de Student a la
normal.
Por tanto:

(̅ | ⁄ | ̅ | ⁄ | )
√ √

Siendo los límites:

̅ | ⁄ | ̅ | ⁄ |
√ √

n.c. = 0,99 → | ⁄ | | ⁄ | | | (Tabla III y IV)


INTRODUCCIÓN AL ANÁLISIS DE DATOS

̅ | ⁄ |
√ √

̅ | ⁄ |
√ √
El intervalo es: (90,79; 105,21)

10.14. C

Podemos calcularlo a partir del o del El cálculo se va a hacer a partir del

̅ | ⁄ | | ⁄ |
√ √
de donde:

| ⁄ |

| ⁄ |

Acudiendo a la Tabla III y IV:

P (Z > 1,64) = 0,05; luego ⁄ = 0,05 

(n.c.) = 0,90

10.15. A

Dado que la muestra es menor de 100 elementos, no se puede aplicar la aproximación a


la normal. Por tanto, el intervalo para viene dado por:

( ) ( )
( )
( ⁄ )

Siendo los límites:

( ) ( )

INTRODUCCIÓN AL ANÁLISIS DE DATOS

Los valores de son:

⁄ (Tabla V)

Por tanto:

( ) ( )

( ) ( )

El intervalo es: (68,14; 163,71)

10.16. A
n.c. = 0,95 → ⁄ (Tabla III y IV)

⁄ 1,962  62
 34,57  35
22

10.17. C
n.c. = 0,95 → ⁄ (Tabla III y IV)

= 4/2 = 2

⁄ 1,96 2 x10 2
 96,04  96
22
10.18. A
=2
12,24
2  z / 2  z / 2  1,96
144
z / 2  1,96  1   / 2  0,975 (Tabla III y IV)
 / 2  1  0,975  0,025
  0,025  2  0,05
  0,05
1    1  0,05  0,95  n.c.  0,95
INTRODUCCIÓN AL ANÁLISIS DE DATOS

10.19. B
n.c. = 0,95 → ⁄ (Tabla III y IV)

 4
E máx  z / 2  1,96   0,784
n 100
LSup  X  Emax  X  LSup  Emax  3,784  0,784  3

10.20. A
n.c. = 0,95 → ⁄ (Tabla III y IV)

σ
5,588  5  1,96 
100

1,96   0,588
10
10  0,588 5,88
σ  3
1,96 1,96
10.21. A
Linf  X  Emax

4,412  5  Emax

Emax  5  4,412  0,588

10.22. C
Sería menor porque el error de estimación máximo es inversamente proporcional
al tamaño muestral (página 458)

10.23. B
Ya que se desconoce la proporción deberemos tomar el caso más desfavorable.
Es decir: P = 0,5 (página 465), y el muestreo es con reposición. Por tanto:


( )

10.24. A
Sabemos, por el estudio anterior que p = 0,4, por lo que: (1- p) = 0,6.
INTRODUCCIÓN AL ANÁLISIS DE DATOS


( )

10.25. C

Si n > 100 (en nuestro caso n = 400) podemos aplicar la aproximación a la normal,
siendo en este caso (pág. 455)

| ⁄ | √ √ 11,23

(NOTA: La fórmula empleada no se encuentra específicamente en el formulario, pero


su deducción es fácil a partir de la definición de la distribución muestral de la varianza
para muestras mayores de 100, definida como: ( √ ) Solo hay que tener

presente que el error típico de estimación es √ y, por tanto, según la definición del

error máximo, éste es: | ⁄ | √

También podría gustarte