Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadstica
Manual de teora y problemas
Licenciatura en Documentacin
Curso 2010-11
Contenidos
19
31
4. Probabilidad
39
5. Modelos de probabilidad
49
59
67
75
1
Tabulacin y representacin grfica de
los datos
Poblacin: conjunto de individuos con propiedades comunes sobre los que se realiza una investigacin de tipo estadstico.
Muestra: subconjunto de la poblacin.
Tamao muestral: nmero de individuos que forman la muestra.
Muestreo: proceso de obtencin de muestras representativas de la poblacin.
Variable: propiedad o cualidad que puede manifestarse bajo dos o ms formas distintas en un
individuo de una poblacin.
Modalidades, categoras o clases: distintas formas en que se manifiesta una variable.
Las variables se clasifican en:
5
J. Marn Fernndez
`i + `i+1
.
2
fi
.
n
Fi
.
n
Distribucin de frecuencias: tabla conteniendo las distintas clases y las frecuencias correspondientes a cada una de ellas.
Estadstica
J. Marn Fernndez
pas de
Computer
Lead
Sociological
procedencia
Abstracts
Abstracts
Abstracts
Pases Bajos
42
34
22
Francia
55
76
Alemania
162
37
14
Gran Bretaa
310
147
24
EEUU
966
265
552
Rusia
191
37
42
Otros
265
79
239
1.991
606
969
suma
Estadstica
10
J. Marn Fernndez
Problemas propuestos
Problema 1.1. El gasto de una biblioteca, en euros, durante un ao determinado, es:
Gasto en personal
6.570
Gasto en libros
3.450
Otros gastos
2.380
No de estantes
Francs
78
Alemn
47
Ruso
20
Espaol
30
16.110
63.350
Prstamo interbibliotecario
2.600
43.540
Reproduccin de catlogos
16.110
3.640
3.400
63.350
11.360
3.080
5.500
2.600
1.090
560
250
43.540
58.040
1.980
Prstamo interbibliotecario
Copias para usuarios de la biblioteca
11
Estadstica
Problema 1.5. El nmero de citas en diferentes campos de investigacin y en distintos aos viene
dado en la tabla siguiente:
1970
1980
1990
Sociologa
330
414
547
Economa
299
393
295
Poltica
115
357
137
Psicologa
329
452
258
10
11
12
13
14
No de artculos
12
10
15
16
17
18
19
20
21
22
23
24
25
26
27
N de libros
N de lneas
10
11
12
13
14
15
16
17
11
14
Determinar la distribucin de frecuencias acumuladas absolutas y hacer el grfico de frecuencias acumuladas absolutas.
Problema 1.9. Los siguientes datos corresponden al nmero de palabras por resumen de los artculos
cientficos de autores espaoles que han publicado en una determinada revista de investigacin
durante un ao concreto:
10
15
16
20
17
19
21
14
13
19
11
14
17
19
20
20
22
15
13
12
12
15
17
19
18
23
22
17
21
20
15
18
16
18
12
17
14
15
17
15
Determinar la distribucin de frecuencias absolutas, relativas, acumuladas absolutas y acumuladas relativas. Hacer un diagrama de barras de frecuencias absolutas, un polgono de frecuencias
relativas y un grfico de frecuencias acumuladas relativas.
12
J. Marn Fernndez
Problema 1.10. Los siguientes datos agrupados en intervalos se refieren al nmero de llamadas telefnicas recibidas en el servicio de informacin de una biblioteca pblica durante 45 das
elegidos al azar:
No de llamadas
(9,15]
(15,21]
(21,27]
(27,33]
(33,39]
(39,45]
(45,51]
14
10
No de das
1.050
2.500
3.000
3.000
1.500
2.500
995
995
3.000
3.000
1.200
1.450
2.500
2.750
3.000
1.600
3.000
2.250
2.750
1.800
1.250
3.250
1.800
1.750
3.250
2.100
4.500
2.100
995
3.500
2.500
1.700
2.100
1.250
3.500
3.250
1.200
950
3.250
1.700
3.000
1.500
3.500
1.500
995
2.750
3.500
2.150
1.750
2.000
2.200
1.750
2.800
750
2.000
1.500
3.500
4.500
1.950
3.000
2.200
1.600
1.200
2.400
750
1.850
2.400
1.250
3.000
800
2.750
4.000
2.050
5.500
3.750
950
995
3.750
1.500
1.800
1.200
2.500
1.250
Aunque la variable es cuantitativa discreta, se desea agrupar los datos en intervalos de la misma
amplitud. A partir de esta agrupacin, determinar la distribucin de frecuencias y dibujar el
histograma, el polgono de frecuencias y el grfico de frecuencias acumuladas relativas.
13
Estadstica
ngulos
Gasto en personal
6570
1900 74o
Gasto en libros
3450
1000 16o
Otros gastos
2380
690 10o
12400
3600 00o
suma
fi
hi
ngulos
Francs
78
00 4457
1600 452o
Alemn
47
00 2686
960 696o
Ruso
20
00 1143
410 148o
Espaol
30
00 1714
610 704o
175
10 0000
3600 000o
suma
14
J. Marn Fernndez
fi
%i
ngulos
Reproduccin de catlogos
16110
120 83
460 188o
63350
500 44
1810 584o
2600
20 07
70 452o
43540
340 67
1240 812o
125600
1000 00
3600 000o
Prstamo interbibliotecario
Copias para usuarios de la biblioteca
suma
fi
fi
fi
fi
Reproduccin de catlogos
16 110
3 640
3 400
63 350
11 360
3 080
5 500
2 600
1 090
560
250
43 540
58 040
1 980
Prstamo interbibliotecario
Copias para usuarios de la biblioteca
Diagrama de barras conjunto de frecuencias absolutas: se sitan en el eje horizontal las cuatro
categoras y sobre cada una de ellas se levanta un rectngulo de altura igual a la frecuencia
absoluta, fi , con distinto color o trama de relleno para cada una de las cuatro bibliotecas.
Solucin del problema 1.5. Tenemos 3 variables estadsticas cualitativas nominales cuyas categoras
son las mismas (sociologa, economa, poltica y psicologa). Por ejemplo, la primera de las
variables es rea de investigacin de las citas que aparecen en los artculos publicados en
1970. Los individuos a los que se les observa dicha variable son todas y cada una de las citas
que aparecen en los artculos publicados en 1970. Las otras dos variables se definen de forma
anloga (. . . 1980 y . . . 1990).
1970
Categoras (reas de investigacin)
1980
1990
fi
hi
fi
hi
fi
hi
Sociologa
330
00 3075
414
00 2562
547
00 4422
Economa
299
00 2787
393
00 2432
295
00 2385
Poltica
115
00 1072
357
00 2209
137
00 1108
Psicologa
329
00 3066
452
00 2797
258
00 2086
1 073
10 0000
1 616
10 0000
1 237
10 0000
suma
15
Estadstica
Diagrama de barras conjunto de frecuencias relativas: se sitan en el eje horizontal las cuatro
categoras y sobre cada una de ellas se levanta un rectngulo de altura igual a la frecuencia
relativa, hi , con distinto color o trama de relleno para cada uno de los tres aos.
Solucin del problema 1.6. La variable estadstica es el nmero de descriptores o keywords. Es
cuantitativa discreta. Los individuos a los que se les observa la variable son todos y cada uno
de los 72 artculos de investigacin de la muestra.
xi
10
11
12
13
14
fi
12
10
Diagrama de barras de frecuencias absolutas: se sitan en el eje horizontal los xi y sobre cada
uno de ellos se levanta un segmento rectilneo de altura igual a la correspondiente frecuencia
absoluta, fi .
Solucin del problema 1.7. La variable estadstica es la altura de los libros. Es cuantitativa continua.
Los individuos a los que se les observa la variable son los 31 libros de la muestra.
xi
15
16
17
18
19
20
21
22
23
24
25
26
27
fi
hi
0 129
0 129
0 065 0 129
0 161
0 065
0 065 0 065
0 032
00 032
Polgono de frecuencias relativas: se sitan los puntos que resultan de tomar en el eje horizontal
los distintos valores de la variable, xi , y en el eje vertical sus correspondientes frecuencias
relativas, hi , uniendo despus los puntos mediante segmentos rectilneos.
Solucin del problema 1.8. La variable estadstica es el nmero de palabras por lnea. Es cuantitativa discreta. Los individuos a los que se les observa la variable son todas y cada una de las 48
lneas de la pgina del libro.
xi
10
11
12
13
14
15
16
17
fi
11
14
Fi
16
27
41
44
46
47
48
16
J. Marn Fernndez
xi
fi
hi
Fi
Hi
10
00 025
00 025
11
00 025
00 050
12
00 075
00 125
13
00 050
00 175
14
00 075
10
00 250
15
00 150
16
00 400
16
00 050
18
00 450
17
00 150
24
00 600
18
00 075
27
00 675
19
00 100
31
00 775
20
00 100
35
00 875
21
00 050
37
00 925
22
00 050
39
00 975
23
00 025
40
10 000
(9,15]
(15,21]
(21,27]
(27,33]
(33,39]
(39,45]
(45,51]
fi
14
10
xi
12
18
24
30
36
42
48
Fi
14
28
38
44
45
Histograma: se sitan en el eje horizontal los intervalos de clase, (`i , `i+1 ], y sobre cada
uno se levanta un rectngulo de rea proporcional a la frecuencia absoluta. Como los
intervalos tienen la misma amplitud, basta con hacer las alturas de los rectngulos iguales
a las frecuencias absolutas, fi .
Polgono de frecuencias: se sitan los puntos que resultan de tomar en el eje horizontal
las marcas de clase, xi , y en el eje vertical sus correspondientes frecuencias absolutas, fi ,
uniendo despus los puntos mediante segmentos rectilneos.
17
Estadstica
Grfico de frecuencias acumuladas absolutas: se sitan los puntos que resultan de tomar
en el eje horizontal los extremos superiores de los intervalos de clase, `i+1 , y en el eje vertical sus correspondientes frecuencias acumuladas absolutas, Fi , uniendo despus dichos
puntos mediante segmentos rectilneos.
Solucin del problema 1.11. La variable estadstica es el nmero de socios de la biblioteca. Es cuantitativa discreta. Los individuos a los que se les observa la variable son las bibliotecas pblicas.
(`i , `i+1 ]
fi
xi
Hi
(675,1 375]
19
1 025
00 2262
(1 375,2 075]
22
1 725
00 4881
(2 075,2 775]
18
2 425
00 7024
(2 775,3 475]
14
3 125
00 8690
(3 475,4 175]
3 825
00 9643
(4 175,4 875]
4 525
00 9881
(4 875,5 575]
5 225
10 0000
Histograma: se sitan en el eje horizontal los intervalos de clase, (`i , `i+1 ], y sobre cada
uno se levanta un rectngulo de rea proporcional a la frecuencia absoluta. Como los
intervalos tienen la misma amplitud, basta con hacer las alturas de los rectngulos iguales
a las frecuencias absolutas, fi .
Polgono de frecuencias: se sitan los puntos que resultan de tomar en el eje horizontal
las marcas de clase, xi , y en el eje vertical sus correspondientes frecuencias absolutas, fi ,
uniendo despus los puntos mediante segmentos rectilneos.
Grfico de frecuencias acumuladas relativas: se sitan los puntos que resultan de tomar en
el eje horizontal los extremos superiores de los intervalos de clase, `i+1 , y en el eje vertical
sus correspondientes frecuencias acumuladas relativas, Hi , uniendo despus dichos puntos
mediante segmentos rectilneos.
2
Medidas descriptivas de los datos
20
J. Marn Fernndez
Cuartiles:
1er cuartil
o
= Q1 = C25
2 cuartil
Q2 = C50 = Me
3er cuartil
= Q3 = C75
Deciles:
1er decil
= D1 = C10
2o decil
..
.
= D2
..
.
9o decil
= D9 = C90
= C20
..
.
Si los datos estn agrupados en intervalos de clase, el intervalo que contiene a Cr es el primero
cuya frecuencia acumulada absoluta es igual o mayor que
nr
100
y el cuantil al r % se determina mediante la frmula:
nr
Fi1
Cr = `i + 100
(`i+1 `i ) ,
fi
donde (`i , `i+1 ] es el intervalo que contiene a Cr , fi es su frecuencia absoluta y Fi1 es la frecuencia
absoluta acumulada del intervalo anterior.
2.1.3. Media
Llamaremos media a la media aritmtica. (Hay otras medias, como, por ejemplo, la media geomtrica, la media cuadrtica y la media armnica.)
Si la variable se denota por X, la media de los datos de una muestra ser denotada por x. (Si
tenemos los datos de toda la poblacin, entonces representaremos la media por .)
a) Clculo con datos no agrupados en intervalos:
Si x1 , x2 , . . . , xn son los n valores de la muestra, entonces:
n
X
x=
i=1
xi
.
21
Estadstica
x=
xi f i
i=1
22
J. Marn Fernndez
s2x =
(xi x)
k
X
i=1
(xi x)2 fi
i=1
s2x =
k
X
x2i
i=1
x2 =
x2i fi
i=1
x2 .
De las frmulas anteriores se deduce que la unidad de medida de s2x es la unidad de la variable
elevada al cuadrado.
II) Desviacin tpica
Si la variable se denota por X, la desviacin tpica de los datos procedentes de una muestra ser
denotada por sx . (Si disponemos de los datos de toda la poblacin, entonces representaremos la
desviacin tpica por .)
La frmula de la desviacin tpica es:
sx =
Varianza .
23
Estadstica
n
X
Sx2 =
k
X
(xi x)
i=1
n1
(xi x)2 fi
i=1
n1
Sx2 =
!
x2i
k
X
nx2
i=1
n1
!
x2i fi
i=1
n1
nx2
.
De las frmulas anteriores se deduce que la unidad de medida de Sx2 es la unidad de la variable
elevada al cuadrado.
Relacin entre la varianza y la cuasivarianza:
n s2x = (n 1) Sx2 .
IV) Cuasidesviacin tpica o desviacin tpica corregida
Se utiliza, sobre todo, en Estadstica Inferencial.
La frmula de la cuasidesviacin tpica es:
Sx =
Cuasivarianza .
24
J. Marn Fernndez
xi
fi
Fi
10
13
xi
fi
Fi
10
12
Ejemplo 2.5. En una biblioteca se observa el tiempo (en das) que tardan los proveedores en suministrar las peticiones que la biblioteca les hace:
Tabla 2.3
No de das
No
6 7 8 9 10 11 12 13 14
de proveedores 1 2 3 4
a) Cul es la variable estadstica que se observa? De qu tipo es dicha variable? Cules son
los individuos a los que se les observa dicha variable? Cul es el tamao muestral?
b) Calcular la mediana. Interpretar el resultado.
Ejemplo 2.6. En una muestra de libros se observa el nmero de referencias bibliogrficas que contienen. Nos han proporcionado los datos agrupados en intervalos:
25
Estadstica
Tabla 2.4
No de referencias
No de libros
(3,9]
(9,15]
17
(15,21]
12
(21,27]
(27,33]
(33,39]
a) Cul es la variable estadstica que se observa? De qu tipo es dicha variable? Cules son
los individuos a los que se les observa dicha variable? Cul es el tamao muestral?
b) Calcular el valor aproximado de la mediana a partir del grfico de frecuencias acumuladas
absolutas.
c) Calcular la mediana mediante la frmula. Interpretar el resultado.
Ejemplo 2.7. Con los datos de la Tabla 2.3 calcular: el primer decil, el primer cuartil, el tercer cuartil
y el noveno decil. Interpretar los resultados.
Ejemplo 2.8. Con los datos de la Tabla 2.4 calcular el primer y el tercer cuartil. Interpretar los resultados.
Ejemplo 2.9. Calcular la media de los datos de la Tabla 2.3.
Ejemplo 2.10. Calcular la media de los datos de la Tabla 2.4.
Ejemplo 2.11. Cul es el grado de dispersin de los datos de la Tabla 2.3? Razonar la respuesta.
Ejemplo 2.12. Cul es el grado de dispersin de los datos de la Tabla 2.4? Razonar la respuesta.
Ejemplo 2.13. Con los datos de la Tabla 2.3 cul es el grado de representatividad de la mediana:
muy fuerte, fuerte, regular, dbil o muy dbil? Razonar la respuesta.
Ejemplo 2.14. Con los datos de la Tabla 2.4 cul es el grado de representatividad de la mediana:
muy fuerte, fuerte, regular, dbil o muy dbil? Razonar la respuesta.
Ejemplo 2.15. Con los datos de la Tabla 2.3 cul es el grado de representatividad de la media: muy
fuerte, fuerte, regular, dbil o muy dbil? Razonar la respuesta.
Ejemplo 2.16. Con los datos de la Tabla 2.4 cul es el grado de representatividad de la media: muy
fuerte, fuerte, regular, dbil o muy dbil? Razonar la respuesta.
26
J. Marn Fernndez
Problemas propuestos
Problema 2.1. Se pregunt a varias personas, elegidas al azar, el nmero de peridicos distintos que
lean trimestralmente, y se obtuvo las siguientes respuestas:
No de peridicos
No de lectores
13
18
15
11
N de das
47
59
62
64
71
76
78
80
10
17
16
10
[20,25]
(25,30]
(30,35]
(35,40]
(40,50]
(50,60]
41
123
44
13
No de personas
a) Dibujar el grfico de frecuencias acumuladas absolutas. A partir de este grfico, determinar el valor aproximado de la mediana. Determinar, despus, el valor de la mediana con
la frmula estudiada.
b) Cul es el grado de representatividad de la mediana? Justificar la respuesta.
Problema 2.4. Los siguientes datos corresponden al nmero mensual de nuevos socios de una determinada biblioteca:
27
40
12
30
16
20
21
30
12
45
18
25
22
35
24
37
12
21
35
17
21
27
14
15
25
45
12
24
27
Estadstica
Problema 2.5. El nmero de veces que fueron consultados 60 artculos de investigacin archivados
en una hemeroteca, durante un determinado ao, viene dado por la siguiente tabla:
8
25
20
19
21
20
22
23
24
21
22
20
22
21
24
21
21
22
22
12
20
26
46
10
37
14
25
50
26
38
46
36
35
23
45
36
65
46
37
Agrupar los datos en intervalos de la misma amplitud, y calcular, a partir de esta clasificacin,
el valor de la medida de posicin que resulte ms representativa del conjunto total de los datos.
Problema 2.6. A continuacin se ofrecen los datos correspondientes al tiempo de espera (en minutos)
de 50 usuarios de una biblioteca hasta que son atendidos por algn miembro del personal de
sta.
1
20
21
10
12
20
18
13
11
10
13
15
20
22
11
18
19
20
15
16
13
12
14
10
24
11
10
11
28
J. Marn Fernndez
a)
xi
fi
Fi
13
20
18
38
15
53
11
64
70
74
76
Grfico de frecuencias acumuladas absolutas: es la representacin grfica de las frecuencias acumuladas absolutas, F , para todo valor numrico, x. Es una grfica en
forma de escalera".
Mediana=Me = 20 5 peridicos.
b) La desviacin tpica es sx = 80 1677 personas. Como R/3 = 11, entonces se cumple que
sx es bastante menor que R/3 y, como consecuencia, la media es bastante representativa.
c) El recorrido intercuartlico es RI = 14 personas. Como R/2 = 160 5, entonces RI es
bastante menor que R/2 y, como consecuencia, la mediana es bastante representativa.
Solucin del problema 2.3.
a)
29
Estadstica
a)
fi
Fi
xi f i
(xi x)2 fi
4020 6711
2580 1378
12
48
4890 8844
14
14
820 2044
15
15
650 0711
16
16
490 9378
17
10
17
360 8044
18
11
18
250 6711
20
12
20
90 4044
21
15
63
120 8133
22
16
22
10 1378
24
18
48
10 7422
25
20
50
70 4756
27
22
54
300 9422
30
24
60
960 1422
35
26
70
2840 8089
37
27
37
1940 1378
40
28
40
2860 7378
45
30
90
9620 1422
692
32970 8 b
6
suma
Media=x = 230 0 b
6 socios.
Mediana=Me = 210 5 socios.
Solucin del problema 2.5. La distribucin de frecuencias con datos agrupados en intervalos de la
misma amplitud es:
30
J. Marn Fernndez
(`i , `i+1 ]
xi
fi
Fi
(00 8, 10]
50 4
23
23
(10, 190 2]
140 6
(19 2, 28 4]
26
22
48
23 8
(28 4, 37 6]
33 0
53
(370 6, 460 8]
420 2
58
(460 8, 56]
510 4
59
60
(56, 65 2]
60 6
Como la dispersin es grande, la medida de posicin ms adecuada es la mediana. Con los datos
b veces.
agrupados en estos intervalos de clase, el valor de la mediana es Me = 200 8 72
Solucin del problema 2.6.
a) La distribucin de frecuencias es:
xi
2 3
fi
1 1
Fi
2 3
7 10 13
17
20 23
xi f i
2 3
16 15 18
28
24 27
10 11
4
12 13
2
14
15 16
2
18 19
2
20
21
22
24
27 31
33 36
37
39 40
42 43
47
48
49
50
40 44
24 39
14
30 16
36 19
80
21
22
24
fi
xi
xi f i
Fi
(0,4]
14
(4,6]
30
13
(6,8]
49
20
(8,10]
63
27
(10,12]
11
66
33
(12,15]
130 5
81
39
(15,19]
17
68
43
50
(19,24]
suma
21 5
150 5
5210 5
Con esta clasificacin en intervalos, los resultados de las medidas descriptivas anteriores
son:
Media=x = 100 43 minutos.
Mediana=Me = 90 4286 minutos.
Los verdaderos resultados de estas medidas descriptivas son los calculados en el apartado
anterior.
3
Relacin entre dos variables
cuantitativas
sxy =
n
X
(xi x)(yi y)
n
X
i=1
i=1
xi yi
xy.
32
J. Marn Fernndez
Propiedad del coeficiente de correlacin lineal: el resultado de rxy siempre est comprendido entre
1 y 1; es decir,
1 rxy 1 .
Interpretacin descriptiva del coeficiente de correlacin lineal:
? Si rxy > 0, existe relacin lineal directa entre X e Y ; es decir, al aumentar la variable X,
aumenta la variable Y .
? Si rxy < 0, existe relacin lineal inversa entre X e Y ; es decir, al aumentar la variable X,
disminuye la variable Y .
? Si rxy = 1, existe dependencia lineal directa exacta entre X e Y ; es decir, los puntos del
diagrama de dispersin estn situados sobre una lnea recta de pendiente positiva.
? Si rxy = 1, existe dependencia lineal inversa exacta entre X e Y ; es decir, los puntos del
diagrama de dispersin estn situados sobre una lnea recta de pendiente negativa.
? Si rxy = 0, no existe dependencia lineal entre X e Y .
? Cuanto ms se aproxime rxy a 1 o a 1, ms dependencia lineal existe entre X e Y . Y cuanto
ms se aproxime rxy a 0, ms independencia lineal existe entre X e Y .
sy
sxy
= rxy
,
2
sx
sx
A = y B x.
Recta de regresin de X sobre Y : aquella que permite predecir los resultados de la variable X a
partir de los valores de la variable Y .
Ecuacin de la recta de regresin (mnimo cuadrtica) de X sobre Y :
= A + B Y ,
X
donde:
B =
sxy
sx
= rxy
,
2
sy
sy
A = x B y .
33
Estadstica
Frecuencia de uso
40
18
30
21
26
10
13
35
34
J. Marn Fernndez
Problemas propuestos
Problema 3.1. El nmero de libros prestados a los estudiantes y a los profesores de los diferentes
departamentos de una universidad en un curso acadmico determinado ha sido:
Departamento
Agricultura
Antropologa
Estudiantes
Profesores
396
70
1.122
340
Biologa
311
273
Botnica
562
181
Cristalografa
149
33
Fsica
1.446
704
Geologa
1.579
556
557
233
1.044
434
710
437
Informtica
Ingeniera
Matemticas
Mineraloga
52
22
1.153
495
Qumica
737
473
Zoologa
1.343
462
Psicologa
No de prstamos
100.000
100.000
1140 5
860 0
25 9
350 8
40 2
510 3
70 5
470 3
60 7
70 5
60 5
940 7
60 0
770 0
50 9
390 9
40 6
180 0
40 5
360 0
680 9
43
35
Estadstica
a) Calcular el coeficiente de correlacin lineal entre ambas variables. Cmo se puede calificar el grado de relacin lineal entre ambas variables: muy fuerte, fuerte, moderado, dbil
o muy dbil? Razonar la respuesta.
b) Pronosticar el nmero de libros prestados por las bibliotecas de una ciudad de un milln
de habitantes. Decir si es fiable este pronstico, razonando la respuesta.
Problema 3.3. Los siguientes datos se refieren al nmero de libros y de revistas que reciben mensualmente doce bibliotecas elegidas al azar.
libros
revistas
1.090
24
7.420
92
4.200
67
8.250
158
8.810
81
1.620
59
3.840
54
9.400
171
3.630
100
14.100
276
2.500
122
11.470
200
a) Calcular el coeficiente de correlacin lineal entre ambas variables. Cmo se puede calificar el grado de relacin lineal entre ambas variables: muy fuerte, fuerte, moderado, dbil
o muy dbil? Razonar la respuesta.
b) Estimar el nmero de revistas que recibira una biblioteca en un mes en el que le enviaran
5.000 libros. Es fiable esta estimacin? Justificar la respuesta.
36
J. Marn Fernndez
Estadstica
37
Esta prediccin es bastante fiable ya que el valor del coeficiente de correlacin lineal entre X
e Y est bastante prximo a 1 y, por tanto, los puntos de la recta de regresin y los puntos del
diagrama de dispersin estn bastante prximos.
4
Probabilidad
40
J. Marn Fernndez
41
Estadstica
42
J. Marn Fernndez
43
Estadstica
Despus
Antes
NO
NO
169
337
174
a) Calcular la probabilidad de que una mujer participe en dicho mercado laboral antes de ser
madre.
b) Calcular la probabilidad de que una mujer participe en dicho mercado laboral despus de
ser madre.
c) Calcular la probabilidad de que una mujer participe en dicho mercado laboral antes y
despus de ser madre.
d) Calcular la probabilidad de que una mujer participe en dicho mercado laboral antes o
despus de ser madre.
44
J. Marn Fernndez
Problemas propuestos
Problema 4.1. Un centro de informacin dispone de 10 ordenadores para consultar diversas bases
de datos. Se realiza el experimento que consiste en observar, en diferentes instantes del da,
el nmero de ordenadores que no estn ocupados. Determinar el espacio muestral. Poner dos
ejemplos de sucesos (A y B). Hallar los sucesos contrarios (A y B), el suceso unin (A B),
el suceso interseccin (A B), el suceso diferencia (A B), y los sucesos A B, A B y
A B.
Problema 4.2. El nmero de libros por estante de una biblioteca viene dado por:
No de libros
19
20
21
22
23
24
25
26
27
28
29
30
14
11
12
No de estantes
17
28
31
52
Mujer
23
39
50
75
No de horas
1o
2o
3o
4o
5o
menos de 1 hora
18
20
32
77
96
entre 1 y 3 horas
22
35
90
83
50
ms de 3 horas
60
70
80
60
14
45
Estadstica
Sexo
suma
libro
vdeo
hombre
195
215
410
mujer
315
205
520
510
420
930
suma
46
J. Marn Fernndez
Estadstica
47
5
Modelos de probabilidad
? Variable aleatoria discreta: slo puede tomar valores numricos aislados (fijados dos consecutivos, no puede existir ninguno intermedio).
? Variable aleatoria continua: puede tomar cualquier valor numrico dentro de un intervalo, de
modo que entre cualesquiera dos de ellos siempre existe otro posible valor.
49
50
J. Marn Fernndez
para todo t .
El valor de FX (t) coincide con el rea bajo la curva y = f (x) desde el valor ms pequeo que
puede tomar la variable hasta el valor t.
Para algunas variables aleatorias continuas los resultados de la funcin de distribucin se pueden determinar con cualquier paquete estadstico, como MINITAB o SPSS.
Si X es una variable aleatoria continua, entonces:
? P (X < a) = P (X a) = FX (a) para todo a.
? P (X > a) = P (X a) = 1 FX (a) para todo a.
? P (a < X < b) = P (a X b) = P (a X < b) = P (a < X b) = FX (b) FX (a)
para todo a y b.
51
Estadstica
2
donde es cualquier nmero, es cualquier nmero positivo y, en general, exp(t) significa et , siendo
e la base de los logaritmos neperianos.
Son equivalentes las dos afirmaciones siguientes: X tiene una distribucin Normal de parmetros
y y X es una variable aleatoria Normal de parmetros y .
La variable aleatoria Normal de parmetros y ser denotada por:
N (, ) .
Se cumplen las siguientes propiedades:
La media, la mediana y la moda de una variable aleatoria N (, ) coinciden entre s y tienen
por valor al parmetro .
La desviacin tpica de la distribucin N (, ) es igual al parmetro .
La curva que representa a la funcin de densidad de la distribucin N (, ) es simtrica respecto de la recta vertical de ecuacin x = .
El rea comprendida entre el eje horizontal y la curva que representa a la funcin de densidad
de la distribucin N (, ) vale 1 (como ocurre con cualquier distribucin continua).
5.2.2. Distribucin Normal Estndar
A la variable aleatoria Normal de parmetros 0 y 1 se le llama variable aleatoria Normal Estndar,
o Normal Tpica, y se le denota por N (0, 1).
5.2.3. Uso de la tabla de la funcin de distribucin
La tabla de la funcin de distribucin de la variable aleatoria Normal Estndar, Z, da las probabilidades a la izquierda de nmeros positivos; es decir, P (Z t), con t > 0. A partir de las propiedades
de simetra y de que el rea total bajo la curva de densidad es la unidad, pueden deducirse todos los
casos: probabilidades a la izquierda o a la derecha de nmeros positivos o negativos.
5.2.4. Uso de la tabla de los cuantiles
Adems de tener tabulados los resultados de la funcin de distribucin de la variable aleatoria
Normal Estndar, tambin tenemos tabulados los valores inversos de la funcin de distribucin; es
decir, los cuantiles.
52
J. Marn Fernndez
53
Estadstica
sigue una distribucin denominada t de Student con n grados de libertad, que se denota por tn .
El cuantil al 100p % de tn se representa por tn , p y es el valor que verifica:
P (tn tn , p ) = p ,
es decir, el rea comprendida entre la curva de densidad de la distribucin tn y el eje horizontal, a la
izquierda de tn , p , es igual a p.
Otra interpretacin es la siguiente: el valor tn , p deja por debajo el 100p % de todos los resultados
de una variable aleatoria t de Student con n grados de libertad.
El resultado de tn , p se puede determinar con cualquier paquete estadstico, como MINITAB o
SPSS (para cualquier valor de n y p) y con las tablas de los cuantiles de tn (para algunos valores de n
y p).
5.3.3. Distribucin F de Snedecor
Si tenemos dos variables aleatorias chi-cuadrado independientes, 2m y 2n , entonces la variable
aleatoria
2m
m
2n
n
sigue una distribucin denominada F de Snedecor con m grados de libertad en el numerador y n
grados de libertad en el denominador, que se denota por Fm , n .
El cuantil al 100p % de Fm , n se representa por Fm , n , p y es el valor que verifica:
P (Fm , n Fm , n , p ) = p ,
es decir, el rea comprendida entre la curva de densidad de la distribucin Fm , n y el eje horizontal, a
la izquierda de Fm , n , p , es igual a p.
Otra interpretacin es la siguiente: el valor Fm , n , p deja por debajo el 100p % de todos los resultados de una variable aleatoria F de Snedecor con m grados de libertad en el numerador y n grados de
libertad en el denominador.
El resultado de Fm , n , p se puede determinar con cualquier paquete estadstico, como MINITAB
o SPSS (para cualquier valor de m, n y p) y con las tablas de los cuantiles de Fm , n (para algunos
valores de m, n y p).
54
J. Marn Fernndez
Estadstica
55
Problemas propuestos
Problema 5.1. Si Z es una variable Normal Estndar, determinar:
a) P (Z 20 21).
b) P (Z < 30 47).
c) P (Z 10 75).
d) P (Z > 20 46).
e) P (Z 30 24).
f) P (Z > 30 08).
g) P (10 12 Z 20 68).
h) P (00 85 < Z < 10 27).
i) P (20 97 < Z 10 33).
Problema 5.2. Si X es una variable Normal con media 80 46 y desviacin tpica 10 14, hallar:
a) P (X 90 11).
b) P (X < 120 33).
c) P (X 60 41).
d) P (X > 100 52).
e) P (X 120 61).
f) P (X > 40 01).
g) P (60 11 X 110 91).
h) P (70 53 < X < 100 33).
i) P (50 05 X < 60 83).
Problema 5.3. Hallar el valor de los siguientes cuantiles:
a) Z00 58 .
b) Z00 42 .
c) Z00 999 .
d) Z00 001 .
Problema 5.4. El cociente intelectual de 5.600 alumnos del Grado en Informacin y Documentacin
de diversas universidades sigue una distribucin Normal de media 130 y desviacin tpica 6.
Calcular cuntos de ellos tienen un cociente intelectual:
a) mayor que 140.
b) entre 125 y 135.
c) menor que 120.
Problema 5.5. Calcular el valor de los siguientes cuantiles:
56
J. Marn Fernndez
a) 26 , 00 01 .
b) 26 , 00 99 .
c) 272 , 00 975 .
Problema 5.6. Sea X una variable aleatoria que sigue una distribucin chi-cuadrado de Pearson con
15 grados de libertad. Determinar el valor de a que verifica la siguiente igualdad:
a) P (X a) = 00 05.
b) P (X > a) = 00 99.
Problema 5.7. Calcular el valor de los siguientes cuantiles:
a) t26 , 00 9 .
b) t26 , 00 1 .
c) t75 , 00 8 .
Problema 5.8. Sea X una variable aleatoria que sigue una distribucin t de Student con 20 grados
de libertad. Determinar el valor de a que verifica la siguiente igualdad:
a) P (X a) = 00 99.
b) P (X a) = 00 25.
Problema 5.9. Calcular el valor de los siguientes cuantiles:
a) F8 , 6 , 00 975 .
b) F25 , 50 , 00 01 .
c) F45 , 35 , 00 01 .
Problema 5.10. Sea X una variable aleatoria que sigue una distribucin F de Snedecor con 10 grados
de libertad en el numerador y 8 grados de libertad en el denominador. Determinar el valor de a
que verifica la siguiente igualdad:
a) P (X < a) = 00 9.
b) P (X > a) = 00 05.
Estadstica
57
6
Contrastes no paramtricos en una
poblacin
60
J. Marn Fernndez
Regin de aceptacin: zona de la distribucin muestral del estadstico de contraste que corresponde a los valores que permiten aceptar la hiptesis nula.
Contraste unilateral o de una cola: la regin crtica se encuentra en una sola zona de la distribucin muestral del estadstico de contraste.
Contraste bilateral o de dos colas: la regin crtica se encuentra repartida entre dos zonas de la
distribucin muestral del estadstico de contraste.
Error de tipo I: error que se comete cuando se decide rechazar una hiptesis nula que en realidad
es verdadera.
Nivel de significacin: probabilidad de cometer un error de tipo I al contrastar una hiptesis. Se
denota por .
Error de tipo II: error que se comete cuando se decide aceptar una hiptesis nula que en realidad
es falsa. La probabilidad de cometer dicho error se denota por .
Potencia de un contraste: probabilidad de rechazar la hiptesis nula cuando es falsa. Por tanto,
la potencia es igual a 1 .
p-valor (o nivel crtico): es el nivel de significacin ms pequeo al que una hiptesis nula
puede ser rechazada con el estadstico de contraste obtenido. Se rechaza H0 si el p-valor es
claramente menor que ; se acepta H0 si el p-valor es claramente mayor que ; y se repite el
contraste con una muestra diferente si el p-valor tiene un resultado prximo a .
61
Estadstica
H0 : la muestra es aleatoria
H1 : la muestra no es aleatoria
condiciones
Los datos son slo de dos tipos o pueden reducirse a dos tipos.
N1 =nmero de datos de un tipo N2 =nmero de datos del otro tipo.
(R E(R)) 00 5
p
,
V (R)
donde
estadsticos
E(R) =
2N1 N2
+ 1,
N1 + N2
V (R) =
2N1 N2 (2N1 N2 N1 N2 )
.
(N1 + N2 )2 (N1 + N2 1)
62
J. Marn Fernndez
contraste
condiciones
n
X
Dexp
estadstico
n
n+1 X
Xi
2
i=1
i=1
= v
!2 ,
u n
n
u X
X
n tn
Xi2
Xi
i Xi
i=1
n
X
donde
i=1
i=1
regin crtica
63
Estadstica
10
X
i=1
xi
yi
zi
1550
220
1575
1640
230
1450
1000
140
1640
950
135
1670
750
110
1710
1700
255
1250
1650
228
1480
1860
270
1525
1900
280
1850
900
130
1730
zi = 158 8
10
X
i=1
Ejemplo 6.2. En la tabla siguiente aparecen los resultados del peso, en gramos, (X) y del precio, en
euros, (Y ) de una muestra de 12 libros.
64
J. Marn Fernndez
12
X
i=1
xi
yi
325
110
890
30
415
75
400
45
515
32
650
69
790
30
890
34
320
42
420
46
620
53
720
97
yi = 663
12
X
yi2 = 44589
i=1
65
Estadstica
Problemas propuestos
Problema 6.1. Los siguientes datos corresponden a las edades de una muestra de 10 personas que
visitan una biblioteca.
19
24
83
30
17
23
33
19
68
56
x2i
yi2
xi y i
42
22
1764
484
924
65
30
4225
900
1950
68
35
4624
1225
2380
55
30
3025
900
1650
35
20
1225
400
700
40
25
1600
625
1000
50
30
2500
900
1500
26
15
676
225
390
42
22
1764
484
924
10
56
38
3136
1444
2128
11
38
15
1444
225
570
12
50
34
2500
1156
1700
suma
567
316
28483
8968
15816
66
J. Marn Fernndez
Solucin del problema 6.2. X=Nmero mensual de materias buscadas por los usuarios de una biblioteca.
a) Hacemos el contraste de las rachas sobre aleatoriedad de la muestra en el que la hiptesis
nula es H0 :La muestra de datos de la variable X es aleatoria. El valor del estadstico
de contraste es R = 7. Como el nivel de significacin es = 00 05, entonces la regin
de aceptacin es el intervalo (3, +). En consecuencia, aceptamos H0 . Finalmente, la
respuesta a la pregunta es S.
b) Hacemos el contraste de DAgostino sobre normalidad en el que la hiptesis nula es
H0 :La variable aleatoria X es Normal. El valor del estadstico de contraste es Dexp =
00 282159. Como el nivel de significacin es = 00 05, entonces la regin de aceptacin
es el intervalo (00 2420, 00 2862). Por tanto, aceptamos H0 . Finalmente, la respuesta a la
pregunta es S.
7
Contrastes paramtricos en una
poblacin
estadstico
Z=
X 0
/ n
contraste
regin crtica
H0 : = 0
Z < Z1/2
H1 : 6= 0
Z > Z1/2
H0 : 0
H1 : < 0
H0 : 0
H1 : > 0
Z < Z1
Z > Z1
estadstico
T =
X 0
S/ n
contraste
regin crtica
H0 : = 0
H1 : 6= 0
H0 : 0
H1 : < 0
H0 : 0
H1 : > 0
67
T < tn1 , 1
T > tn1 , 1
68
J. Marn Fernndez
estadstico
n
X
U=
(Xi )2
i=1
02
contraste
regin crtica
H0 : 2 = 02
U < 2n , /2
H1 : 2 6= 02
U > 2n , 1/2
H0 : 2 02
H1 : 2 < 02
H0 : 2 02
H1 : 2 > 02
U < 2n ,
U > 2n , 1
Muestra aleatoria
simple de tamao n.
desconocida.
Poblacin Normal.
estadstico
V =
(n 1)S 2
ns2
=
02
02
contraste
regin crtica
H0 : 2 = 02
V < 2n1 , /2
H1 : 2 6= 02
H0 : 2 02
H1 : 2 < 02
H0 : 2 02
H1 : 2 > 02
V < 2n1 ,
V > 2n1 , 1
69
Estadstica
10
X
i=1
xi
yi
zi
1550
220
1575
1640
230
1450
1000
140
1640
950
135
1670
750
110
1710
1700
255
1250
1650
228
1480
1860
270
1525
1900
280
1850
900
130
1730
zi = 158 8
10
X
i=1
Ejemplo 7.2. Retomamos los datos del Ejemplo 6.2: En la tabla siguiente aparecen los resultados del
peso, en gramos, (X) y del precio, en euros, (Y ) de una muestra de 12 libros.
70
J. Marn Fernndez
12
X
i=1
xi
yi
325
110
890
30
415
75
400
45
515
32
650
69
790
30
890
34
320
42
420
46
620
53
720
97
yi = 663
12
X
yi2 = 44589
i=1
71
Estadstica
Problemas propuestos
Problema 7.1. El nmero medio recomendado de usuarios servidos semanalmente por cada miembro
del personal de una biblioteca es de 100. En una muestra aleatoria simple de 81 miembros del
personal de las bibliotecas de una determinada regin se obtiene una media de 1320 88 usuarios
servidos semanalmente, con una cuasidesviacin tpica de 550 19. Las bibliotecas de dicha
regin siguen la recomendacin mencionada?
Problema 7.2. El precio medio de los libros en rstica es de 630 4 euros, con una desviacin tpica de
140 8 euros. Una muestra aleatoria simple de 61 libros en rstica con ilustraciones en color tiene
un precio medio de 690 5 euros, con una cuasidesviacin tpica de 160 6 euros.
a) Permiten los datos afirmar que los libros en rstica con ilustraciones en color son ms
caros que el resto de libros en rstica?
b) La varianza del precio de los libros en rstica con ilustraciones en color es mayor que la
del precio de los libros en rstica?
Problema 7.3. Se sabe que el nmero medio de veces que un artculo cientfico es citado durante los 5
siguientes aos a su publicacin es de 60 5. Se eligen aleatoria e independientemente 71 artculos
de medicina, obtenindose una media de 70 8 citas durante los 5 siguientes aos a su publicacin,
con una cuasidesviacin tpica de 20 3. Se puede afirmar que durante los 5 siguientes aos a su
publicacin se citan ms los artculos de medicina que el resto de artculos cientficos?
Problema 7.4. En una muestra aleatoria simple de 15 individuos que consultan bases de datos, el
tiempo (en minutos) que estn utilizando el ordenador para realizar esta tarea es:
22
13
17
14
15
18
19
14
17
20
21
13
15
18
17
72
J. Marn Fernndez
Estadstica
73
y, por tanto, la media del tiempo empleado en consultar bases de datos por ordenador es
mayor que 15 minutos. Finalmente, la respuesta a la pregunta es S.
d) La pregunta que se nos hace es < 2? Esta pregunta es equivalente a 2 < 22 ? Por
tanto, hacemos un contraste sobre 2 , con desconocida. La hiptesis nula es H0 : 2
22 . El valor del estadstico de contraste es V = 280 4 3. Como el nivel de significacin
es = 00 05, entonces la regin crtica es V < 60 57063. En consecuencia, aceptamos
H0 y, por tanto, no se puede aceptar que la desviacin tpica (poblacional) del tiempo
empleado en consultar bases de datos por ordenador es menor que 2 minutos. Finalmente,
la respuesta a la pregunta es NO.
8
Contrastes paramtricos en dos
poblaciones
Poblaciones Normales.
1 , 2 desconocidas.
estadstico
contraste
regin crtica
S12
F = 2
S2
H0 : 12 = 22
H0 : 12 22
H0 : 12 22
H1 : 12 6= 22
H1 : 12 < 22
H1 : 12 > 22
F <
F <
75
1
Fn2 1,n1 1,1
76
J. Marn Fernndez
estadstico
contraste
regin crtica
X1 X2
Z=r 2
1 22
+
n1 n2
H0 : 1 = 2
H0 : 1 2
H0 : 1 2
H1 : 1 6= 2
H1 : 1 < 2
H1 : 1 > 2
Z < Z1
Z > Z1
Z < Z1/2
Z > Z1/2
estadstico
contraste
regin crtica
T =s
X1 X2
(n1 1)S12 + (n2 1)S22
n1 + n2 2
1
1
+
n1 n2
H0 : 1 = 2
H0 : 1 2
H0 : 1 2
H1 : 1 6= 2
H1 : 1 < 2
H1 : 1 > 2
77
Estadstica
condiciones
1 , 2 desconocidas y distintas.
X1 X2
T =r 2
S2
S1
+ 2
n1
n2
estadstico
2
S12 S22
+
n1
n2
o
g=n natural ms prximo a 2 2 2 2
S2
S1
n1
n2
+
n1 1
n2 1
grados de libertad
contraste
H0 : 1 = 2
H0 : 1 2
H0 : 1 2
H1 : 1 6= 2
H1 : 1 < 2
H1 : 1 > 2
T < tg , 1
T > tg , 1
T < tg , 1/2
regin crtica
T > tg , 1/2
condiciones
estadstico
contraste
regin crtica
T =
D
donde D y SD son la media y la cuasidesviacin tpica de D
SD
H0 : 1 = 2
H0 : 1 2
H0 : 1 2
H1 : 1 6= 2
H1 : 1 < 2
H1 : 1 > 2
T < tn1 , 1
T > tn1 , 1
78
J. Marn Fernndez
15
X
x1i = 734
i=1
15
X
x21i
x1i
x2i
75
110
32
30
30
45
34
69
42
46
57
53
51
97
36
43
82
42
45
37
58
48
66
45
40
105
35
61
51
57
= 39510
i=1
15
X
x2i = 888
i=1
15
X
x22i = 61426
i=1
a) Se puede aceptar, con un nivel de significacin de 00 05, que la varianza poblacional del
precio de los libros que se prestan poco es igual a la varianza poblacional del precio de los
libros que se prestan mucho?
b) Se puede aceptar, con un nivel de significacin de 00 05, que la media poblacional del
precio de los libros que se prestan poco es igual a la media poblacional del precio de los
libros que se prestan mucho?
Ejemplo 8.2. En la siguiente tabla aparece el nmero de palabras por resumen de una muestra aleatoria de 30 artculos cientficos escritos en francs (X1 ) y el nmero de palabras por resumen
de una muestra aleatoria de 30 artculos cientficos escritos en ingls (X2 ).
x1i
x2i
70
65
68
74
79
67
75
80
62
69
61
57
71
74
82
91
70
64
72
67
74
70
81
85
70
74
75
71
69
54
80
47
59
67
89
57
72
78
74
72
104
118
89
87
79
78
101
120
107
95
85
87
90
98
89
75
90
101
85
94
79
Estadstica
30
X
x1i = 2141
i=1
30
X
x21i = 154627
i=1
30
X
x2i = 2567
i=1
30
X
x22i = 227713
i=1
0
x2i
di = x1i x2i
x1i
x2i
di = x1i x2i
-1
-1
-1
-4
-3
-1
-2
-3
-2
-2
-1
-2
-3
30
X
i=1
di = 7
30
X
d2i = 101
i=1
Se puede aceptar, con un nivel de significacin de 00 05, que la media poblacional de los resultados de la opinin del primer experto es igual a la media poblacional de los resultados de la
opinin del segundo experto?
80
J. Marn Fernndez
Problemas propuestos
Problema 8.1. El precio de los libros de una biblioteca es una variable aleatoria Normal de media
630 3 euros y desviacin tpica 190 4 euros. Se sospecha que el precio medio de los libros de
ciencias fsicas es mayor que el precio medio de los libros de ciencias sociales. Para obtener
alguna evidencia sobre la sospecha, se selecciona una muestra aleatoria simple de 20 libros
de ciencias fsicas y otra de 30 libros de ciencias sociales, obtenindose una media de 570 5
euros para los primeros, y 520 6 euros para los segundos. Podemos afirmar, con un nivel de
significacin de 00 05, que es cierta nuestra sospecha?
Problema 8.2. Se nos ha sealado la posibilidad de que se paguen sueldos distintos a documentalistas
segn el sexo. Presumiblemente, a los hombres se les ha pagado ms que a las mujeres. Un
estudio de los sueldos anuales durante los cinco aos anteriores al actual arroja los siguientes
resultados:
media muestral
cuasidesviacin tpica muestral
hombres
mujeres
21.980
20.470
1.810
2.290
25
50
tamao muestral
A la vista de estos datos, y utilizando un nivel de significacin de 00 01, podemos afirmar que
el sueldo de los hombres documentalistas es mayor que el de las mujeres documentalistas?
Problema 8.3. Elegimos al azar 30 matrimonios y observamos el nmero de veces que los hombres
han visitado alguna biblioteca en los tres ltimos meses (X1 ) y el nmero de veces que las mujeres han visitado alguna biblioteca en los tres ltimos meses (X2 ). Los resultados se muestran
en la siguiente tabla.
x1i
x2i
di = x1i x2i
x1i
x2i
di = x1i x2i
x1i
x2i
di = x1i x2i
12
10
-2
25
14
11
30
11
19
14
15
-1
12
16
-4
10
12
-2
20
12
10
-2
20
16
13
19
-6
23
20
15
10
11
14
17
-3
14
10
-2
11
12
-1
-1
12
23
-11
10
-1
27
10
17
15
20
-5
32
27
42
35
14
18
-4
30
X
i=1
di = 51
30
X
i=1
d2i = 1273
81
Estadstica
Podemos afirmar que hay diferencia significativa entre los hombres y las mujeres de los matrimonios en cuanto al nmero de veces que van a la biblioteca?
Problema 8.4. En la siguiente tabla aparece el nmero de usuarios diarios de la biblioteca A (variable
X1 ) y el nmero de usuarios diarios de la biblioteca B (variable X2 ) en 10 das elegidos al azar.
x1i
x2i
di = x1i x2i
51
45
72
58
14
35
32
70
56
14
75
68
98
76
22
100
88
12
80
69
11
72
57
15
90
75
15
10
X
i=1
di = 119
10
X
d2i = 1685
i=1
a) Se puede aceptar, con un nivel de significacin de 00 05, que la muestra de las diferencias
di es aleatoria?
b) Se puede aceptar, con un nivel de significacin de 00 05, que la variable diferencia D =
X1 X2 es Normal?
c) Se puede aceptar, con un nivel de significacin de 00 05, que la media poblacional del
nmero de usuarios diarios de la biblioteca A es igual a la media poblacional del nmero
de usuarios diarios de la biblioteca B?
82
J. Marn Fernndez
Estadstica
83