Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PARA INVESTIGACIÓN
Preliminares
Conceptos Matemáticos Básicos
• Redondeo
Regla general: aproximación a 2 decimales
– Redondeo de números reales. Ejemplos:
56.2345 entonces es …
65.2583 entonces es …
Conceptos Matemáticos Básicos
• Porcentaje: expresión de un número como
fracción de 100
Desempeño
Excelente Bueno Regular Malo Muy malo
Primaria 8 3 4 2 2
Formación
Secundaria 25 19 16 14 10
Superior 27 23 25 22 20
39%
4020
3450 28%
24%
1340 9%
Desempeño
Excelente Bueno Regular Malo Muy malo
Primaria 8 3 4 2 2
Formación
Secundaria 25 19 16 14 10
Superior 27 23 25 22 20
CUADROS Y GRÁFICOS
CUADROS Y GRÁFICOS
¿Y EL ELEMENTO?
Reconocimiento de Variables
Forma I
• Caso 1:
– Variable: Sexo
– Valores: Hombre, Mujer
– Variable: Media
– Valores: radio, tv, prensa
Reconocimiento de Variables Forma II
Reconocimiento de Variables
Forma II
• Caso 2:
– Variable: Sexo
– Valores: Hombre, Mujer
– Variable: radio
– Valores: si, no
– Variable: prensa
– Valores: si, no
Ejercicio
Trabajador SEXO SUELDO CATEGORIA EDAD
1 HOMBRE 850 EMPLEADO 46
2 HOMBRE 1,270 EMPLEADO 48
3 HOMBRE 1,137 EMPLEADO 26
4 HOMBRE 1,202 EMPLEADO 53
5 MUJER 1,006 EMPLEADO 49
6 HOMBRE 976 EMPLEADO 47
7 HOMBRE 1,062 EMPLEADO 29
8 HOMBRE 1,004 EMPLEADO 51
9 MUJER 1,290 EMPLEADO 36
10 HOMBRE 1,003 EMPLEADO 25
11 HOMBRE 1,283 EMPLEADO 54
12 HOMBRE 1,037 EMPLEADO 31
13 HOMBRE 959 EMPLEADO 34
14 MUJER 1,262 EMPLEADO 42
15 HOMBRE 1,078 EMPLEADO 45
16 HOMBRE 890 EMPLEADO 26
17 MUJER 2,683 JEFE DE AREA 44
18 MUJER 2,134 JEFE DE AREA 35
19 HOMBRE 2,067 JEFE DE AREA 50
20 HOMBRE 2,900 JEFE DE AREA 51
21 MUJER 2,314 JEFE DE AREA 44
22 HOMBRE 2,979 JEFE DE AREA 27
23 MUJER 2,896 JEFE DE AREA 38
24 MUJER 6,060 GERENTE 43
25 HOMBRE 7,149 GERENTE 52
De la tabla de datos, se pide analizar las variables CATEGORÍA y SUELDO. En sus análisis
debe considerar un cuadro y un gráfico.
SEXO CANTIDAD %
MUJER 8 32%
HOMBRE 17 68%
TOTAL 25 100%
El sumatorio
• El sumatorio o la sumatoria es un operando
matemático que permite representar sumas de
muchos sumandos, n o incluso infinitos sumandos,
se expresa con la letra griega sigma ( Σ ), y se define
como:
• i: índice de la suma
• n: límite superior
• m: límite inferior
Tabla de Distribución de Frecuencias
Individuo Nombre Nro. de periódicos
leídos ayer
1 Luis 1
2 Pedro 0
3 Ana 1
4 Diego 1
5 Carol 2
6 Manuel 0
7 Susana 1
8 Jair 1
9 Lucas 3
10 María 1
TOTAL
Tabla de Distribución de Frecuencias
Variable Frecuencias
Frecuencias Frecuencias
“Nro. De absolutos Frecuencias relativas
absolutas relativas
periódicos acumulada
F.R. acumuladas F.R.A
leídos ayer” F.A.
F.A.A
0 2 2 (2/10)×100=20%
1 6 2+6= 8
2 1 2+6+1=9
3 1 2+6+1+1=10
TOTAL Σ F.A.= N = 10
Frecuencia relativa (F.R.)
Variable Frecuencias
Frecuencias Frecuencias
“Nro. De absolutos Frecuencias relativas
absolutas relativas
periódicos acumulada
F.R. acumuladas F.R.A
leídos ayer” F.A.
F.A.A
0 2 2 (2/10)×100=20%
1 6 2+6= 8 (6/10)×100=60%
2 1 2+6+1=9
3 1 2+6+1+1=10
TOTAL Σ F.A.= N = 10
Frecuencia relativa (F.R.)
Variable Frecuencias
Frecuencias Frecuencias
“Nro. De absolutos Frecuencias relativas
absolutas relativas
periódicos acumulada
F.R. acumuladas F.R.A
leídos ayer” F.A.
F.A.A
0 2 2 (2/10)×100=20%
1 6 2+6= 8 (6/10)×100=60%
2 1 2+6+1=9 (1/10)×100=10%
3 1 2+6+1+1=10
TOTAL Σ= N = 10
Frecuencia relativa (fi)
Variable Frecuencias
Frecuencias Frecuencias
“Nro. De absolutos Frecuencias relativas
absolutas relativas
periódicos acumulada
F.R. acumuladas F.R.A
leídos ayer” F.A.
F.A.A
0 2 2 (2/10)×100=20%
1 6 2+6= 8 (6/10)×100=60%
2 1 2+6+1=9 (1/10)×100=10%
3 1 2+6+1+1=10 (1/10)×100=10%
TOTAL Σ F.A.= N = 10
Frecuencia relativa acumulada (Fi)
Variable Frecuencias
Frecuencias Frecuencias
“Nro. De absolutos Frecuencias relativas
absolutas relativas
periódicos acumulada acumuladas F.R.A
leídos ayer” F.A. F.R.
F.A.A
0 2 2 20% (2/10)×100=20%
1 6 2+6= 8 60%
2 1 2+6+1=9 10%
3 1 2+6+1+1=10 10%
TOTAL Σ F.A.= N = 10 ΣF.R.= F=100%
Frecuencia relativa acumulada (Fi)
Variable Frecuencias
Frecuencias Frecuencias
“Nro. De absolutos Frecuencias relativas
absolutas relativas
periódicos acumulada acumuladas F.R.A
leídos ayer” F.A. F.R.
F.A.A
0 2 2 20% (2/10)×100=20%
1 6 2+6= 8 60% (8/10)×100=80%
2 1 2+6+1=9 10%
3 1 2+6+1+1=10 10%
TOTAL Σ F.A.= N = 10 ΣF.R.= F=100%
Frecuencia relativa acumulada (Fi)
Variable Frecuencias
Frecuencias Frecuencias
“Nro. De absolutos Frecuencias relativas
absolutas relativas
periódicos acumulada acumuladas F.R.A
leídos ayer” F.A. F.R.
F.A.A
0 2 2 20% (2/10)×100=20%
1 6 2+6= 8 60% (8/10)×100=80%
2 1 2+6+1=9 10% (9/10)×100=90%
3 1 2+6+1+1=10 10%
TOTAL Σni = N = 10 Σfi = F=100%
Frecuencia relativa acumulada (Fi)
Variable Frecuencias
Frecuencias Frecuencias
“Nro. De absolutos Frecuencias relativas
absolutas relativas
periódicos acumulada acumuladas F.R.A
leídos ayer” F.A. F.R.
F.A.A
0 2 2 20% (2/10)×100=20%
1 6 2+6= 8 60% (8/10)×100=80%
2 1 2+6+1=9 10% (9/10)×100=90%
3 1 2+6+1+1=10 10% (10/10)×100=100%
TOTAL Σ F.A.= N = 10 ΣF.R.= F=100%
Frecuencia relativa acumulada (Fi)
Variable Frecuencias
Frecuencias Frecuencias
“Nro. De absolutos Frecuencias relativas
absolutas relativas
periódicos acumulada acumuladas F.R.A
leídos ayer” F.A. F.R.
F.A.A
0 2 2 20% 20%
1 6 8 60% 80%
2 1 9 10% 90%
3 1 10 10% 100%
TOTAL Σ F.A.= N = 10 ΣF.R.= F=100%
Ejercicio I
Hogares No. De televisores en el
hogar
1 1
2 1
3 2
4 3
5 1
6 2
7 0
8 1
VARIABLE?
VALORES DE LA VARIABLE?
Variable Frecuencias
Frecuencias Frecuencias
Variable “Nro. De absolutos
absolutas relativas
“Televisores” periódicos leídos acumulada
ayer” F.A. F.R.
F.A.A
TOTAL
Ejercicio II – Distribución de frecuencias agrupadas
Trabajador Salario Trabajador Salario Trabajador Salario Trabajador Salario
TOTAL
Variable Frecuencias
Frecuencias Frecuencias
Variable “Nro. De absolutos
absolutas relativas
“Salario” periódicos leídos acumulada
ayer” F.A. F.R.
F.A.A
700 – 899
900 – 1,099
1,100 – 1,299
1,300 – 1,499
TOTAL
Construcción de un histograma
Construcción de un histograma
Trabajador Salario Trabajador Salario Trabajador Salario Trabajador Salario Trabajador Salario
0
1
2
3
4
5
6
705 7
789
13.95%
790
874
875
959
960
1044
1045
Histograma
1129
1130
Gráfico
1214
1215
1299
1300
1384
1385
1469
Ejercicio
142 109 62 64 84 35 142 109 62 64
105 97 65 134 83 81 105 97 65 134
60 102 123 136 140 71 60 102 123 136
119 60 74 118 48 73 119 60 74 118
48 116 142 41 127 121 48 116 142 41
141 144 99 114 76 92 141 144 99 114
60 57 144 93 99 58 60 57 144 93
121 127 91 67 80 103 121 127 91 67
50 123 135 144 90 109 50 123 135 144
123 142 125 73 63 41 123 142 125 73
Ejercicios
1. Elabore un solo gráfico para el siguiente cuadro. Las respuestas fueron obtenidas de una sola
muestra. Además, se conoce la pregunta del cuestionario:
¿Con qué frecuencia consumes?
FRECUENCIA
Diaria Semanal Mensual Anual Nunca
Manzana(*) 400 200 300 90 10
FRUTA
Plátano(*) 500 300 200 0 0
Pera(*) 100 200 400 180 120
Piña(*) 50 100 550 250 50
(*) Cualquier variedad
2. De la tabla adjunta, analice (en sus análisis debe considerar un cuadro y un gráfico):
a. Las variables SEXO – SUELDO – CATEGORÍA.
b. Las variables CATEGORIA – TIPO DE CONTRATO – CANTIDAD DE DEPENDIENTES.
3. De la tabla adjunta, elabore la tabla de frecuencia e Histograma de la variable TIEMPO DE SERVICIO
TIEMPO DE Cantidad de
SUELDO TIPO DE
Trabajador SEXO CATEGORIA SERVICIO dependientes
(Soles) CONTRATO
(MESES) del trabajador
1 HOMBRE 1,103 EMPLEADO 252 TEMPORAL 1
2 HOMBRE 1,547 EMPLEADO 202 PERMANENTE 2
3 HOMBRE 1,628 EMPLEADO 117 PERMANENTE 0
4 HOMBRE 1,489 EMPLEADO 223 TEMPORAL 4
5 MUJER 1,358 EMPLEADO 161 TEMPORAL 3
6 HOMBRE 1,281 EMPLEADO 119 PERMANENTE 2
7 HOMBRE 1,392 EMPLEADO 218 TEMPORAL 4
8 HOMBRE 1,304 EMPLEADO 163 TEMPORAL 4
9 MUJER 1,735 EMPLEADO 257 TEMPORAL 2
10 HOMBRE 1,398 EMPLEADO 241 TEMPORAL 3
11 HOMBRE 1,755 EMPLEADO 186 PERMANENTE 1
12 HOMBRE 1,247 EMPLEADO 273 TEMPORAL 3
13 HOMBRE 1,164 EMPLEADO 244 PERMANENTE 2
14 MUJER 1,471 EMPLEADO 289 TEMPORAL 2
15 HOMBRE 1,291 EMPLEADO 281 TEMPORAL 4
16 HOMBRE 1,222 EMPLEADO 149 PERMANENTE 3
17 MUJER 2,129 JEFE DE AREA 232 TEMPORAL 1
18 MUJER 1,670 JEFE DE AREA 289 TEMPORAL 4
19 HOMBRE 1,520 JEFE DE AREA 259 TEMPORAL 3
20 HOMBRE 2,456 JEFE DE AREA 270 PERMANENTE 2
21 MUJER 1,720 JEFE DE AREA 218 PERMANENTE 0
22 HOMBRE 2,386 JEFE DE AREA 294 PERMANENTE 4
23 MUJER 2,403 JEFE DE AREA 275 PERMANENTE 4
24 MUJER 6,060 GERENTE 205 PERMANENTE 4
25 HOMBRE 7,149 GERENTE 142 PERMANENTE 2
Medidas de Posición
Central
Media Aritmética (Media)
• Media Aritmética: es una medida de posición
central o tendencia central. Es igual a la suma
de una cantidad de números dividida entre el
número de sumandos.
Se representa por :
Media Aritmética (Media)
• Datos no agrupados en tabla de distribución
de frecuencias
Día Dólar Venta
9 2.847
10 2.847
11 2.886
12 2.886
13 2.886
14 2.940
15 2.929
16 2.946
= (2.847+2.847+2.886+2.886+2.886+2.940+2.929+2.946)/8=2.896
Media Aritmética (Media)
Cuando se tienen datos ordenados en tablas de
frecuencia, la media se obtiene sumando los
productos que resultan de multiplicar cada valor de
variable con su respectiva frecuencia absoluta;
luego, esa suma se divide entre el total de
elementos. O también, la suma de los productos
de cada valor de variable por su respectiva
frecuencia relativa, y esa suma entre el 100%.
Media Aritmética (Media)
Variable (Dólar Frecuencia Frecuencia
Venta) Absoluta Relativa
2.847 2 25.0%
2.886 3 37.5%
2.929 1 12.5%
2.940 1 12.5%
2.946 1 12.5%
= (2.847x2+2.886x3+2.929x1+2.940x1+2.946x1)/8=23.167/8=2.896
= (2.847x25%+2.886x37.5%+2.940x12.5%+2.929x12.5%+2.946x12.5%)/100%
= 2.896/1=2.896
Media Aritmética (Media)
Cuando se tiene tablas de frecuencias con
intervalos, el cálculo de la media es
aproximado. Para esto, se utiliza las marcas de
clase, los cuales sustituyen a los valores de la
variable.
Fórmula anterior
Media Aritmética (Media)
Marca de Frecuencia Frecuencia
Frecuencia
# Inferior Superior Clase Acumulada Relativa
1 705 789 747 6 6 13.953%
2 790 874 832 6 12 13.953%
3 875 959 917 4 16 9.302%
4 960 1,044 1,002 3 19 6.977%
5 1,045 1,129 1,087 3 22 6.977%
6 1,130 1,214 1,172 5 27 11.628%
7 1,215 1,299 1,257 4 31 9.302%
8 1,300 1,384 1,342 6 37 13.953%
9 1,385 1,469 1,427 6 43 13.953%
= (747x6+832x6+917x6+1,002x3+1,087x3+1,172x5+1,257x4+1,342x6+1,427x6)/43= 1,090.95
= (747x13.953%+832x13.953%+917x9.302%+1,002x6.977%+1,087x6.977%+1,172x11.628%
+1,257x9.302%+1,342x13.953%+1,427x13.953%) = 1,090.95
Media Aritmética (Media)
Media aritmética ponderada, en vez de tener
frecuencias tenemos ponderaciones (pesos).
Media Aritmética (Media)
Notas EST Pesos (wi) Xi x wi
12 3
14 3
11 1
19 1
15 1
8 1
18 1
Media Aritmética (Media)
Notas EST Pesos (wi) Xi x wi
12 3 36
14 3 42
11 1 11
19 1 19
15 1 15
8 1 8
18 1 18
11 149
Mediana
Es el valor de variable que ocupa la posición
del centro cuando los datos están ordenados en
forma creciente (o decreciente).
Se representa por:
Me
Mediana
• Cálculo de la mediana para datos
desagregados
– conveniente si es una muestra pequeña.
– Los datos se ordena ascendentemente
– Si el número de datos es impar, la mediana es el
número central
– Si el número de datos es par, la mediana es la
semisuma de los términos centrales
Ejemplo: 22, 18, 17, 11, 25, 10, 17, 20, 15, 10
Mediana
• Para Datos en tablas de Frecuencias
– Se debe tener elaborada la tabla de frecuencias
– La mediana es el valor de la variable cuya
frecuencia absoluta acumulada es superior o igual
a la mitad de los datos (es decir N/2)
Mediana
Nivel de Estudios Frec. Absolutas (ni) Frec. Abs. Acum.(Ni)
Mediana Sin estudios 1 1
Primaria 6 7
Secundaria 3 10
Técnico 7 17
Profesional 4 21
Total 21
El intervalo mediano, es 1,045 – 1,129; por 51% cerca del 50% ó N/2=43/2=21.5≈22
Trabajador Salari o
26 705
31 719
20 746
7 762
43 769
33 781
27 814
36 828
34 829
16 843
1 863
6 872
18 908
35 934
25 946
42 954
38 985
32 1 ,036
13 1 ,038
10 1 ,051
Mediana
3 1 ,055
40 1 ,109
39 1 ,130
14 1 ,137
15 1 ,174
5 1 ,199
37 1 ,211
41 1 ,226
12 1 ,255
4 1 ,272
28 1 ,289
11 1 ,317
30 1 ,343
21 1 ,347
17 1 ,364
22 1 ,370
9 1 ,373
8 1 ,427
2 1 ,431
23 1 ,442
19 1 ,453
24 1 ,459
29 1 ,466
Moda
Es el valor de la variable que aparece el mayor
número de veces.
Se representa por:
Mo
Moda
• Si los datos no se encuentran en tablas de
frecuencias, se busca aquel valor que más se
repite.
Día Dólar Venta
9 2.847
10 2.847
11 2.886
12 2.886
13 2.886
14 2.940
15 2.929
16 2.946
Mo = 2.886
Moda
La moda para en tablas de frecuencias:
Es el dato con mayor frecuencia absoluta y/o
relativa
Nivel de Estudios Frec. Absolutas (ni) Frec. Abs. Acum.(Ni)
Sin estudios 1 1
Primaria 6 7
Secundaria 3 10
Técnico 7 17
Profesional 4 21
Total 21
Mo = Técnico
Moda
ĄůĐƵůŽ ĚĞ ůa moda en tablas de
frecuencias con Intervalos :
• Se calcula el intervalo modal, esto es el
intervalo con mayor frecuencia absoluta y
relativa.
Moda
Li Ls Fi Fs Marca f.a f.a.a f.r f.r.a
1 100 109 99.5 109.5 104.5 2 2 10% 10%
2 110 119 109.5 119.5 114.5 3 5 15% 25%
3 120 129 119.5 129.5 124.5 1 6 5% 30%
4 130 139 129.5 139.5 134.5 2 8 10% 40%
5 140 149 139.5 149.5 144.5 3 11 15% 55%
6 150 159 149.5 159.5 154.5 5 16 25% 80%
7 160 169 159.5 169.5 164.5 1 17 5% 85%
8 170 179 169.5 179.5 174.5 1 18 5% 90%
9 180 189 179.5 189.5 184.5 1 19 5% 95%
10 190 199 189.5 199.5 194.5 1 20 5% 100%
ESTE GRUPO ES DE
MAYOR DISPERSIÓN
Grupos de datos en la recta numérica
Grupo 1
Grupo 2
Grupo 3
Grupos de datos en la recta numérica
Grupo 1
Grupo 2
Grupo 3
Medidas de Dispersión
• De los tres grupos, donde encuentro mayor
dispersión?
Nota – Media
Nota Xi Frecuencia ni
Xi - X
10 1 10-13.18=-3.18
11 6 -2.18
12 3 -1.18
13 7 -0.18
14 4 0.82
15 3 1.82
16 3 2.82
17 1 3.82
Medidas de Dispersión
Frecuencia Nota – Media (Nota – Media)^2
Nota Xi
ni Xi - X (Xi – X)^2
10 1 10-13.18=-3.18 -3.18 ×-3.18= 10.10
11 6 -2.18
12 3 -1.18
13 7 -0.18
14 4 0.82
15 3 1.82
16 3 2.82
17 1 3.82
Medidas de Dispersión
Frecuencia Nota – Media (Nota – Media)^2
Nota Xi
ni Xi - X (Xi – X)^2
10 1 10-13.18=-3.18 -3.18×-3.18= 10.10
11 6 -2.18 4.75
12 3 -1.18 1.39
13 7 -0.18 0.03
14 4 0.82 0.67
15 3 1.82 3.32
16 3 2.82 7.96
17 1 3.82 14.60
Medidas de Dispersión
Frecuencia Nota – Media (Nota – Media)^2
Nota Xi (Xi – X)^2 Χ ni
ni Xi - X (Xi – X)^2
10 1 10-13.18=-3.18 -3.18Χ-3.18= 10.10
11 6 -2.18 4.75
12 3 -1.18 1.39
13 7 -0.18 0.03
14 4 0.82 0.67
15 3 1.82 3.32
16 3 2.82 7.96
17 1 3.82 14.60
Medidas de Dispersión
Frecuencia Nota – Media (Nota – Media)^2
Nota Xi (Xi – X)^2 Χ ni
ni Xi - X (Xi – X)^2
10 1 10-13.18=-3.18 -3.18Χ-3.18= 10.10 10.10×1 = 10.10
11 6 -2.18 4.75
12 3 -1.18 1.39
13 7 -0.18 0.03
14 4 0.82 0.67
15 3 1.82 3.32
16 3 2.82 7.96
17 1 3.82 14.60
Medidas de Dispersión
Frecuencia Nota – Media (Nota – Media)^2
Nota Xi (Xi – X)^2 Χ ni
ni Xi - X (Xi – X)^2
10 1 10-13.18=-3.18 -3.18Χ-3.18= 10.10 10.10×1 = 10.10
11 6 -2.18 4.75 28.48
12 3 -1.18 1.39 4.17
13 7 -0.18 0.03 0.22
14 4 0.82 0.67 2.70
15 3 1.82 3.32 9.95
16 3 2.82 7.96 23.88
17 1 3.82 14.60 14.60
Medidas de Dispersión
Frecuencia Nota – Media (Nota – Media)^2
Nota Xi (Xi – X)^2 Χ ni
ni Xi - X (Xi – X)^2
10 1 10-13.18=-3.18 -3.18Χ-3.18= 10.10 10.10
11 6 -2.18 4.75 28.48
12 3 -1.18 1.39 4.17
13 7 -0.18 0.03 0.22
14 4 0.82 0.67 2.70
15 3 1.82 3.32 9.95
16 3 2.82 7.96 23.88
17 1 3.82 14.60 14.60
Σ=28 94.11
Medidas de Dispersión
• Si a este valor lo dividimos entre el número
total de elementos, se obtiene la Varianza que
mide la dispersión de los datos respecto a la
media aritmética, en base a la sumatoria de la
diferencia de los valores de variable y la media
y este resultado se eleva al cuadrado.
La media es
Medidas de Dispersión
Frecuencia Nota – Media (Nota – Media)^2
Nota Xi (Xi – X)^2 Χ ni
ni Xi - X (Xi – X)^2
10 6 10-13.18=-3.18 -3.18Χ-3.18= 10.10 60.62
11 7 -2.18 4.75 33.22
12 1 -1.18 1.39 1.39
13 1 -0.18 0.03 0.03
14 3 0.82 0.67 2.02
15 1 1.82 3.32 3.32
16 3 2.82 7.96 23.88
17 6 3.82 14.60 87.62
Σ=28 212.11
La media es 13.18
V=212.11/28=7.58 y S=2.75
Medidas de Dispersión - ¿cuál es más disperso?
8
6
V=3.36
5
4
S=1.83
3 Recordar que, ambos
2 conjuntos de datos tienen la
1
0
misma media y la misma
10 11 12 13 14 15 16 17 cantidad de datos.
8
V=7.58 3
S=2.75 1
0
10 11 12 13 14 15 16 17
Medidas de Dispersión
8
5
V=3.36
4
3
S=1.83
2
0
10 11 12 13 14 15 16 17
V=7.58 3
S=2.75 1
0
10 11 12 13 14 15 16 17
Medidas de Dispersión
¿Cuál es más disperso?
Ejercicio: Hallar la desviación estándar
Medidas de Dispersión
¿Cuál es más disperso?
Ejercicio 2
Muestreo
(Sampling)
El muestreo
El muestreo
El muestreo
El muestreo
• Se relaciona con:
– Metodología de investigación: Encuesta (y esta
con la medición de la opinión pública)
– Inferencia (la obtención de una muestra para
conocer una población)
Unidad de Muestreo
Unidad de muestreo son conjuntos dentro de la población
que cubren la población completa.
Definiciones
Población: (N) es el conjunto de datos o elementos de la
cual se desea obtener una información. Se le conoce
también como universo, y sobre esta población se realizan
las inferencias
Definiciones
Muestra: (n) conjunto de elementos seleccionados de una
población
Ejemplo:
•Datos del RENIEC o INEI
•Guía telefónica
•Datos de los alumnos de la base de datos de la UDEP
Ejemplos
• Investigación acerca discriminación contra la
mujer
Estudio de Investigación – Planificación
de la Investigación
1. Diseño
• Objetivo del estudio (estudio de variables y/o atributos)
• Se trabajará sobre universo o una muestra? Marco Muestral?
Error muestral y el grado de confianza? Tamaño de la muestra?
Técnica de muestreo probabilístico? Máxima indeterminación?
Otras consideraciones según la investigación.
• Costo
• Calendario
2. Recogida de Datos (información directa del individuo o estudios
anteriores)
3. Obtención de resultados
• Proceso de Cálculo (Histogramas, media, desviación estándar,
etc.)
4. Interpretación y Análisis
• Conclusiones
Métodos de Muestreo
• Métodos Probabilísticos
• Métodos No Probabilísticos
Métodos Probabilísticos -
Características
Poblacion Coste
Estrato Si o σi Ni×σi Ci √Ci (Ni×σi)/√Ci ni
Estrato Ni Muestreo
2≤X≤7 210 1.90 399.00 1 1 399.00 31 31
10 ≤ X ≤ 25 600 4.56 2,737.35 16 4 684.34 52 832
30 ≤ X ≤ 100 60 18.40 1,104.04 25 5 220.81 17 425
870 1,304.14 100 1,288
Muestreo Probabilístico
Muestreo Aleatorio por Conglomerados I
Se divide el universo en grupos (conglomerados).
Características:
• La unidad de estudio es el conglomerado. El
conglomerado puede estar conformado por elementos
o por unidades de muestreo. El conjunto de
conglomerados forma el universo.
• Cuando, dentro de cada conglomerado, se extraen los
individuos que formarán parte de la muestra por m.a.s.,
el muestreo se llama bietápico. Primera etapa (m.a. por
conglomerados). Segunda etapa (dentro del
conglomerado se realiza un m.a.s)
Muestreo Probabilístico
Muestreo Aleatorio por Conglomerados II
Características:
• Es un método rápido y de menor coste. Por
ejemplo, resulta mas económico encuestar a 50
familias de un distrito (el distrito es el
conglomerado) que a 50 familias repartidos entre
varios distritos
• El error estándar es mayor que en el muestreo
aleatorio simple o estratificado. En el caso de que
los elementos fueran personas, el error se debe a
que en un conglomerado es muy probable que las
personas tengan las mismas opiniones (repetición
de la información).
Muestreo Probabilístico
Muestreo Aleatorio por Conglomerados III
Características:
•El cálculo del error estándar es complejo
•Se utiliza en estudios que abarquen amplias
zonas geográficas o cuando es difícil conseguir
la lista de elementos
•Los conglomerados son homogéneos entre sí
pero en cada conglomerado ocurre que los
elementos son heterogéneos.
Muestreo Aleatorio por
Conglomerados IV
Muestreo Aleatorio por
Conglomerados V
Muestreo Aleatorio Simple Muestreo Aleatorio por
Conglomerados
Inferencia Estadística
Inferencia Estadística
Información de la
Estimador
Muestra
Información de la
Parámetro
Población
Estimador
• Estimador: es el estadístico muestral
usado para estimar un parámetro de
población.
• Parámetro: valores de población.
• El estimador puede ser:
– Puntual
– Por intervalo
Estimador. Análisis de la media
POBLACIÓN Tamaño 5 elementos
Tiempo de trabajo
Sr. Perez 20
Sr. Ramos 22
Sr. Miranda 24
Sr. López 26
Sr. Namuche 28
Estimador. Análisis de la media
Estimador. Análisis de la media
POBLACIÓN Tamaño 5 elementos
Tiempo de trabajo
Sr. Perez 20
Sr. Ramos 22
Sr. Miranda 24
Sr. López 26
Sr. Namuche 28
Estimador. Análisis de la media
MUESTRA Tamaño: 2 elementos
Tiempo de trabajo
Sr. Perez 20
Sr. Ramos 22
Sr. Miranda 24
Sr. López 26
Sr. Namuche 28
Estimador. Análisis de la media
MUESTRA Tamaño: 2 elementos
Media Muestral f
21 1
22 1
23 2
24 2
25 2
26 1
27 1
Estimador. Análisis de la media
Elementos Grupos de Combinaciones
10 4 210
POBLACION
11 Muestra em1 em2 em3 em4 Media Muestral
13 1 1 2 3 4 11 13 12 14 12.50
12 2 1 2 3 5 11 13 12 16 13.00
14 3 1 2 3 6 11 13 12 17 13.25
16 4 1 2 3 7 11 13 12 15 12.75
17 5 1 2 3 8 11 13 12 10 11.50
15 6 1 2 3 9 11 13 12 13 12.25
10 7 1 2 3 10 11 13 12 12 12.00
13 8 1 2 4 5 11 13 14 16 13.50
12 Henry Palomino: 9 1 2 4 6 11 13 14 17 13.75
… …
PROMEDIO
10 1 2 4 7 11 13 14 15 13.25
13.30 11 1 2 4 8 11 13 14 10 12.00
207 6 7 8 10 17 15 10 12 13.50
EL PROMEDIO DE TODAS LAS 208 6 7 9 10 17 15 13 12 14.25
MEDIAS MUESTRALES COINCIDE 209 6 8 9 10 17 10 13 12 13.00
210 7 8 9 10 15 10 13 12 12.50
CON LA MEDIA DE LA POBLACIÓN.
ENTONCES LA MEDIA ES UN Henry Palomino:
PROMEDIO DE TODAS LAS
ESTIMADOR INSESGADO. MEDIAS MUESTRALES 13.30
Estimador. Análisis de la media
Histograma
Li Ls Frecuencia F. Relativa 25.00%
11.25 11.73 5 2.38%
11.74 12.22 14 6.67% 20.00%
12.23 12.71 29 13.81%
12.72 13.20 42 20.00%
Frecuencia
15.00%
13.21 13.69 45 21.43%
13.7 14.18 38 18.10% 10.00%
14.19 14.67 24 11.43%
14.68 15.16 10 4.76% 5.00%
15.17 15.65 3 1.43%
210 100.00% 0.00%
11.73 12.22 12.71 13.20 13.69 14.18 14.67 15.16 15.65
Clase
Curtosis -0.43852791
Coef. Asimetría 0.038087304
Como se puede observar las dos distribuciones tienen un mismo valor en el parámetro sólo que
la distribución muestral de medias tiene una menor varianza, por lo que la media se convierte en
un estimador eficiente e insesgado.
Estimador por Intervalo de Confianza
• La estimación se realiza con los datos de muestra,
la cual se espera que tenga error en cuanto al
cálculo de los parámetros de población. Por eso
las estimaciones se pueden presentar en forma
de intervalo, de tal manera que dentro del
intervalo se encuentra el parámetro de población
que se quiere encontrar. Ej. Si en la muestra, el
cálculo de preferencia de cierto candidato es de
20%, se puede establecer un error de 5%, de tal
forma que: 20% ± 5%
Intervalo de Confianza para Media
Poblacional
• Poblaciones Infinitas:
Intervalo de Confianza para Media
Poblacional
• Poblaciones Finitas:
Intervalo de Confianza para Media
Poblacional
Ejemplo: En un determinado pueblo de 500
habitantes, una muestra aleatoria de 35
personas mostró que pasaban alrededor de 2.3
horas por día viendo TV, con una desviación
típica de 0.8 horas. Fijar un intervalo de
confianza de 90% para el tiempo medio de ver
TV en dicha población.
IC= 2.3 ± √(500-35)/ √(500-1)*1.64* 0.8/ √35
IC= 2.3 ± 0.21 => 2.09 y 2.51
Nivel o Grado de Confianza
• El grado de confianza es la probabilidad a priori de que el
intervalo de confianza a calcular contenga al verdadero valor
del parámetro
• El grado de confianza viene a expresar que los resultados
obtenidos a partir de un método funcionan correctamente el
x% de los casos.
Ejemplo. De una muestra, mi IC es 200 – 300 calculado con un
nivel de confianza de 95% . Esto significa que, tengo un 95%
de certeza que dicho intervalo contenga el verdadero
parámetro.
Pero de 100 muestras analizadas 95 estarán contienen el
verdadero parámetro
Nivel o Grado de Confianza
• Es un porcentaje, por ejemplo grado de confianza de 95%,
99%, etc.
Población finita
Error de estimación – Tamaño de
muestra – Media Muestral
Si se tiene la muestra , se puede calcular el error
de estimación:
Población infinita
√𝑆𝑆 2
𝜀𝜀 = ±𝑘𝑘 ×
√𝑛𝑛
Población finita
𝑁𝑁−𝑛𝑛 √𝑆𝑆 2
𝜀𝜀 = ±� × 𝑘𝑘 ×
𝑁𝑁−1 √𝑛𝑛
Ejercicio I
Un gabinete de investigación llevó a cabo un estudio para
conocer el tiempo medio dedicado a ver la televisión por los
habitantes de mayor edad de una determinada ciudad.
Consultando el censo se observa que el universo de interés
asciende a 250,000 personas.
Se dispuso de un presupuesto de S/. 30,000 para el trabajo de
campo, a razón de S/. 10 por entrevista. Los resultados del
estudio indicaron que el tiempo medio diario es de 220
minutos y que la desviación típica, en la misma muestra, es de
60 minutos.
Calcular el error muestral y el intervalo de confianza del
estudio.
Solución:
Ejercicio I
N=250,000 (Población Infinita)
- NC 90% k=1.64
Error muestral
- NC 95% k=1.96
Ejercicio III
El administrador de un centro recreativo local pretende
determinar el tiempo promedio que dedica cada cliente
en transportarse de su hogar al centro recreativo, y
viceversa. Con base a los resultados, planea aumentar las
tarifas de entrada. El administrador señala que los
clientes que viven cerca del centro recreativo no gastan
nada en transporte. Por otra parte los que no viven cerca
tienen que recorrer unos 20 Km, con un gasto de 0.20
soles por km. El administrador requiere una confianza de
95% en los resultados y que el error no exceda de ± 0.10.
Que tamaño de muestra debe usar el administrador para
determinar los gastos promedio de transporte?
Ejercicios III
Población Infinita
Mínimo gasto =0
Maximo gasto = 0.2×20=4 soles
4−0
𝑠𝑠 = = 0.67 Una aproximación burda de la desviación estándar
6
es asumir que el rango o amplitud de los datos es aproximadamente
6 veces la desviación estándar.
1.962 ∗ 0.67
𝑛𝑛 = = 171
0.12
Ejercicios IV
Se plantea una encuesta para determinar el
tiempo promedio que los estudiantes de nivel
de secundaria ven la televisión. Un estudio
piloto indicó que el tiempo medio por semana
es de 12 horas, con una desviación típica de 3
horas. Se desea estimar el tiempo medio dentro
de un cuarto de hora, utilizando el NC de 0.95
¿Cuántos estudiantes deben incluirse en el
estudio?
Ejercicios V
Se ha de calcular el tiempo medio, medido
en días al año, que le toma a los
vendedores para realizar actividades en
oficina. Se utilizará el grado de confianza de
90%. La media de un estudio piloto pequeño
fue de 150 días, con una desviación estándar
de 14. Si se desea calcular la media poblacional
en relación con 2 días, ¿Cuántos vendedores
deberían muestrearse?
Ejercicios VI
El propietario de una gasolinera desea estimar el
número medio de galones de combustible que
vende a sus clientes. De sus registros selecciona una
muestra de 60 ventas y concluye que el número
medio de galones vendidos es 8.60, con una
desviación estándar de 2.3 galones.
a. ¿Cuál es la estimación de la media poblacional?
b. Establezca un intervalo de confianza del 99%
para la media poblacional.
Inferencia Estadística II
Proporciones
1
Significado de p
Parámetro Estimador
• Población finita
3
Intervalo de Confianza
• Población infinita
𝑝𝑝̅ 𝑞𝑞�
𝐼𝐼𝐼𝐼 = 𝑝𝑝̅ ± 𝑘𝑘 ∗ �
𝑛𝑛
• Población finita
𝑁𝑁 − 𝑛𝑛 𝑝𝑝̅ 𝑞𝑞�
𝐼𝐼𝐼𝐼 = 𝑝𝑝̅ ± � ∗ 𝑘𝑘 ∗ �
𝑁𝑁 − 1 𝑛𝑛
4
Error de Estimación
• Población infinita
𝑝𝑝̅𝑞𝑞�
𝜀𝜀 = ±𝑘𝑘 ∗ �
𝑛𝑛
• Población finita
𝑁𝑁 − 𝑛𝑛 𝑝𝑝̅ 𝑞𝑞�
𝜀𝜀 = ±� ∗ 𝑘𝑘 ∗ �
𝑁𝑁 − 1 𝑛𝑛
5
Significado de q
• q: es la proporción complementaria (a 100%) de la
característica objeto de análisis en el universo o en la
muestra.
Ejemplo:
– Si se sabe que la probabilidad de compra de un cliente es
30%, el complemento es 100%-30%=70%, que significa que
la probabilidad que no realice una compra es de 70%
• Cuando se desconoce, se utiliza el valor de 50%, y se
dice que es el caso de máxima indeterminación.
• En las formulas se utiliza los equivalentes en decimales
6
Máxima Indeterminación
p q p*q
10% 90% 0.09
20% 80% 0.16
30% 70% 0.21
40% 60% 0.24
50% 50% 0.25
60% 40% 0.24
70% 30% 0.21
80% 20% 0.16
90% 10% 0.09
7
NC=95% y n=1,000
p q p*q K n ε
10% 90% 0.09 95% 1000 1.9%
20% 80% 0.16 95% 1000 2.5%
30% 70% 0.21 95% 1000 2.8%
40% 60% 0.24 95% 1000 3.0%
50% 50% 0.25 95% 1000 3.1%
60% 40% 0.24 95% 1000 3.0%
70% 30% 0.21 95% 1000 2.8%
80% 20% 0.16 95% 1000 2.5%
90% 10% 0.09 95% 1000 1.9%
8
Determinación de p y q
Ejemplo 1: Lanzar una moneda y queremos
que salga cara; p= 50% y q=50%, es decir en
este experimento per se es de máxima
indeterminación.
Ejemplo 2: De un grupo de 10 alumnos, 7
están aprobados y 3 desaprobados. Para este
grupo p=70% (o p=0.7) y q=30% (q=0.3)
9
Intervalo de Confianza – Proporciones
Ejemplo I
Se quiere estimar el resultado de un referéndum
mediante una encuesta. Para ello se realiza un
muestreo aleatorio simple con n=100 personas y
se obtienen 35% que votarán a favor de cierta
ley y 65% que no votarán a favor. Con un nivel
de confianza del 95%, calcule un intervalo de
confianza para el verdadero resultado de las
elecciones.
Solución:
10
Intervalo de Confianza – Proporciones
Ejemplo I
Población Infinita
NC 95% k=1.96
Error muestral
11
Intervalo de Confianza – Proporciones
Ejemplo II
La Encuesta Nacional de Micronegocios reportó
que un 16 por ciento de los 1,948 micronegocios
entrevistados eran propiedad de mujeres. ¿Cuál
es el intervalo de confianza para la población si
desea tener un 99.73% de confianza?
Solución:
12
Intervalo de Confianza – Proporciones
Ejemplo I
Población Infinita
𝑝𝑝̅ = 0.16; 𝑞𝑞� = 0.84
𝑛𝑛 = 1,948
NC 99.73% k=3
Error muestral
�𝑝𝑝̅ × 𝑞𝑞� √0.16 × 0.84
𝜀𝜀 = ±𝑘𝑘 × 𝜀𝜀 = ±3 × = ±0.0249
√𝑛𝑛 √1,948
13
Intervalo de Confianza – Proporciones
Ejemplo II
Tomada, al azar, una muestra de 120
estudiantes de una universidad, se encontró
que 54 de ellos hablaban inglés. Halle, con
un nivel de confianza del 90%, un intervalo
de confianza para estimar la proporción de
estudiantes que hablan el idioma inglés
entre los estudiantes de esa Universidad.
Solución:
14
Intervalo de Confianza – Proporciones
Ejemplo II
Población Infinita
NC 90% k=1.64
Error muestral
15
Tamaño de la muestra - Proporciones
• Al igual que en el caso de la media como
estimador, existe una relación entre el ε (error
muestral) y el tamaño de la muestra n.
• Poblaciones Infinitas
• Poblaciones Finitas
16
Tamaño de muestra – Proporciones
Ejemplo I
Se desea conocer el tamaño de la muestra necesario para
realizar una encuesta a la población mayor de 18 años, con
objeto de medir el voto de las próximas elecciones
municipales. El error máximo permitido es del 2.5% y se
supone un grado de confianza del 95%.
1. ¿Cuál es el tamaño de la muestra?
2. Si el error se estableciese en 2% ¿Cuál es el tamaño de la
muestra?
3. Si el grado de confianza fuese del 95.45% ¿Cuál es el
tamaño de la muestra?
4. Si el grado de confianza fuese del 99% y un error permitido
de 1% ¿Cuál es el tamaño de la muestra?
Solución:
17
Tamaño de muestra – Proporciones
Ejemplo I
Población Infinita
Máxima indeterminación ε=2.5%
NC 95% k=1.96
1. Tamaño muestra
2. ε=2%
18
Tamaño de muestra – Proporciones
Ejemplo I
Población Infinita
Máxima indeterminación ε=2.5%
NC 95% k=1.96
3. NC 95.45%
4. NC 99% ε=1%
19
Tamaño de muestra – Proporciones
Ejemplo II
En una muestra aleatoria de 300 personas mayores de
edad de una gran ciudad se encontró que 105 leían un
determinado periódico X. A la vista de esos datos se
pretende seleccionar una nueva muestra para conseguir
una cota de error de 3 centésimas como máximo, con un
nivel de confianza del 95%, para la estimación de la
proporción de lectores de ese periódico por medio de un
intervalo de confianza. Deduzca el número de individuos
de la población que, como mínimo, debe tener la
muestra.
Solución:
20
Tamaño de muestra – Proporciones
Ejemplo II
Población Infinita
ε=3%
NC 95% k=1.96
Tamaño muestra
21
Tamaño de muestra – Proporciones
Ejemplo III
Se desea realizar una encuesta entre la
población juvenil de una determinada localidad
para determinar la proporción de jóvenes que
estaría a favor de una nueva zona de ocio. El
número de jóvenes de dicha población es
N=2,000. Determinar el tamaño de muestra
necesario para estimar la proporción de
estudiantes que están a favor con un error de
estimación de 0.05 y un nivel de confianza del
95%. 22
Ejercicio I
María Wilson considera ser candidata para la
alcaldía de la ciudad. Antes de presentar su
candidatura, decide realizar un estudio entre los
electores de la ciudad. Una muestra de 400
reveló que 300 ciudadanos la apoyarían en la
elección. Calcule el intervalo de confianza del
99% para la proporción de votantes en la
población que apoyaría a la Sra. Wilson.
23
Ejercicio II
Se ha de calcular la proporción de contadores
públicos que han cambiado de compañía en tres
años dentro del 3%. Debe utilizarse el grado de
confianza de 95%. Un estudio anterior reveló que el
porcentaje de dichos profesionales era 21%.
• Determine el tamaño de muestra para este
estudio
• Si no tuviera información previa ¿Cuántos
contadores formarían parte del estudio?
24
Ejercicio III
Se desea realizar una encuesta para determinar
la proporción de la fuerza laboral que tiene dos
o mas empleos. Utilizamos un NC de 95% y que
la población estimada debe estar dentro del 2%
de la proporción de la población. Un estudio
piloto reveló que 5 de las 50 personas
muestreadas tienen 2 o mas empleos. ¿Cuántos
integrantes deben ser entrevistados para
cumplir las condiciones planeadas?
25
S3Wl~V'S3~dll'G SV':)ll'g'lf\131-V'li'J
~~~~~~~~~~~~~~-t---~~~~~~-- x
85 87 95
- 0.36 0 1.45
x; -µ 85-87
z1 =a/ .J;i = 22/ ../16· =-0.36
x -µ 95-87
Z2 = a/ .J;i = 221.J16=1.45
2
95%
z
-1 .96 0 l.96
- 1.96 0 l.96
2 a2 ()2
n = -2__ (1,96)2 (0.5)2 =25
e2 2
(0.20)
Por lo tanto, el numero de cajas que deben incluirse en la muestra
es de 25 .
422 Estadistica para Administraci6n y Economia
_!_
--'-
71 150 x,,-
''
-1.645 0 1.645
2 2
(1.645) (14)
n= 1
=132.59:::::133
(2r
Por lo tanto, el numero de vendedores que deben muestrearse es
de 133.
10. Se llevara a cabo una encuesta de muestreo para detenninar el
ingreso familiar medio en cierta area. La pregunta es, (,Cuantas
familias deben ser muestreadas? A fin de obtener mayor informaci6n
acerca del area, se realiz6 un peque:fio estudio piloto y se calcul6 la
desviaci6n estandar de la muestra en $500. El patrocinador de la
encuesta desea que se utilice el grado de confianza de 0.95. La
estimaci6n debe estar dentro de $100. (,Cuantas familias deben ,ser
entrevistadas?
Solucion
a = 500 e = 100 I.C. = 95%
n =?
z2a2
2 2
; (1,96) (500)
n = -- - = ::::: 97.00
2
e (100) 2
Por lo tanto, el numero de familias que deben muestrearse es de 97.
S3Tlflt!VS3tldLl\l3 SV::llll;ILl\l3J_l;ILl\I
EJERCICIOS RESUELTOS
1. Una muestra de 49 observaciones se toma a partir de una poblaci6n
nonnal. La media muestral es 55, y la desviaci6n estandar de Ja
muestra es 10. Determine el intervalo de confianza del 99% para la
media de la poblaci6n.
Solucion
Datos:
x = 55 s = lO N.C. =99% n=49
0.495 0.495
-2.576 0 2. 576 z
Para un area de0.495 Z = ±2.576 , obtenido al interpolar en
la tabla normal.
I.C.=[x - E, .x+E]
z s
% (2.576)(10) ,,
E = .j;; = J49 = .) .68
/.C.=[55 - 3.68, 55+3.68]=[51.32, 58.68]
Por lo tanto, el intervalo de confianza al 99% para la media de la
poblaci6n es [ 51.32, 58.68] .
2. El propietario de una gasolinera desea estimar el numero medio de
galones de combustible que vende a sus clientes. De sus registros
selecciona una muestra de 60 ventas y concluye que el numero
medio de galones vendidos es 8.60, con una desviaci6n estandar de
2.30 galones.
a) £,Cual es la estimaci6n de la media poblacional?
b) Establezca un intervalo de confianza del 99% para la media
poblacional.
Estimaci6n puntual y par intervalo 481·
Soluci6n
Datos:
x = 8.60 s = 2.30 N.C. = 99% n=60
a) µ = ?
µ = 8.60
Por tanto, la estimaci6n de la media poblacional sera de 8.60.
b)
0.495 0.495
-2.576 0 2.576 z
Para un area de 0.495 :::::> Z =±2.576. por interpolaci6n.
J.C.= [x-E,x +E]
E = (2.576)(2.30) = 0.
765
160
J.C.= [8.60-0.765, 8.60 + 0.765] = [7.835, 9.365]
Por tanto, el intervalo de confianza al 99% para ia media de los
galones de combustible vendidos es [7.835, 9.365].
3. Asistieron 400 espectadores a un partido de la liga menor de beisbol.
Una muestra aleatoria de 50 espectadores reve16 que el numero
medio de bebidas gaseosas que consumieron, fue de 1.86 con una
desviaci6n estandar de 0.50. Establezca un intervalo de confianza
de! 99% para el numero medio de refrescos consumidos.
Solucion
Datos:
x == 1.86 s == 0.50 N.C . = 99% n=50
- - - · .. ~,. ,,... ..., .. , ,,,.,..., r"l.Jl""\ 1 1 \..JI Al :J 1\.111\I
482
Estadistica para Administraci6n y Economia
0.495 0.495
x
- 2. 76 0 2. 76 z
Para un area de 0.495 :::::> Z = ±2.576, por interpolaci6n.
l.C. = [x-E, x +E]
E = Zas ~
2 f N -n = (2.576)(0.50)
J;; VN -1 EfJ
s 400 - 50
400 - 1
E = 0.1705
J.C. = [1.86-0.1705, i.86 + 0.] 705] =[1.6895, 2.0305]
Por tanto, el intervalo de confianza al 99% para el numero medio
de refrescos consumidos es [1 .6895, 2.0305].
4. Una muestra aleatoria de 85 dirigentes de grupo, supervisores y
personal similar en una empresa revel6 que, en promedio, una
persona permanece 6.5 afios en el puesto antes de que se le
promueva. La desviaci6n estandar fue 1.7 afios. Elabore un intervalo
de confianza de! 95% para el tiempo promedio poblacional.
Solucion
Datos:
x = 6.5 s = l .7 N.C. = 95% n = 85
0.475 0.475
µ
~1 x
-1.96 0 1.96 z
11 . Maria Wilson considera ser candidata para la alcaldia de la ciudad
de Arequipa, Peru. Antes de presentar su candidatura, decide
realizar un sondeo de electores en dicho lugar. Una muestra de 400
revel6 que 300 ciudadanos la apoyarfan en Ja elecci6n. Calcu1e el
intervalo de confianza del 99% para la proporci6n de votantes en la
poblaci6n que apoyarfa a la Sra. Wilson. O· (,"I 'I - o.( O{,
12. Suponga que una cadena de television planea sustituir uno de sus
programas que se transmite en el horario con mayor nt'.i.mero de
telespectadores, con una nueva comedia dirigida al pt'.i.blico familiar.
Antes de que se tome una decision final, se elige una muestra
aleatoria de 400 televidentes que acostumbran presenciar la
television durante dicho horario. Despues de ver un preprograma de
la comedia, 250 de !as personas indicaron que si la verian. Defina
un intervalo de confianza del 95% para la proporci6n de publico
que vera el nuevo espectaculo. () . .f !) (?. '1 j~
/
13. ~ay 300 soldadores empleados en la empresa Maine Shipyards
C~or~·- Un,a n~~~stra de 30 revel? que 18 se graduaron en un curso
. kcmco es~~c1a1. Establezca un mtervalo de confianza de] 95% Dara
la proporcion de soldadores egresados de dicha preparaci6n. O·
'{J3V- 0. ~I, b'1
14. De 900 consumidores que se entrevistaron, 414 sefialaron que estan
muy entusiasmados con un nuevo proyecto de decoraci6n para el
hogar. Elabore el intervalo de confianza de! 99% para la proporci6n
de la poblaci6n. O. l/ 11- - O. fOJ
15. Un banco tiene 650 clientes con cuenta de cheques. Una muestra
reciente de 50 de ellos mostr6 que 26 poseen la tarjeta de credito
que maneja el banco. Fije el intervalo de confianza del 99% para la
proporci6n de clientes con cuenta de cheques que disponen de la
tarjeta de credito citada. O· J'lf -O .,'i)·
17.Sup6ngase que el presidente de un pais desea un estimado de la
proporci6n poblacional que apoya su politica actual con respecto a: ·
una naci6n pequefia como Haiti. Tal funcionario desea que el calculo
se encuentre dentro de 0.04 de 1a proporci6n verdadera. Suponga uri
nivel de confianza del 95%. El Secretario de Estado de gobiemo ·
estim6 la proporci6n dei apoyo a la politica actual en 0.60.
a) L,Que tamano se requiere para la rnuestra? S ~~
b) L,De gue tamafio tendria que ser la muestra si el calculo del
Secretario de Estado no estuviera disponible? C, o l
1. Se desea investigar “las motivaciones por las que una persona optó por el comercio ambulatorio”
para lo cual se ha establecido determinar una muestra representativa. Así, se tienen los siguientes
cuadros relacionados con la población objeto de estudio (ver cuadros 1.1, 1.2 y 1.3). Además, se ha
establecido un nivel de confianza para la muestra de 0.99 y un margen de error de 3%.
2. En el establecimiento del tamaño de muestra para medición de rating, la empresa IBOPE considera
la proporción de hogares con televisor y la proporción de hogares sin televisor. Siguiendo esta
condición, se le pide establecer una muestra representativa para la medición de rating en Lima
metropolitana, considerando un error de 0.8% y un nivel de confianza de 95%. Para ello considere
los siguientes datos (ver la información en los cuadros 1).
Población Lima
Con TV 7,680,000
Sin TV 320,000
1
La información en los cuadros ha sido modificada para efectos de este examen. Los datos exactos los podrán
encontrar en los canales oficiales disponibles en web.
Mayores a 50 años 1,280,000
SOLUCIÓN
Población %
Con TV 7,680,000 96%
Sin TV 320,000 4%
8,000,000
k 1.96
e 0.80%
p 96%
q 4%
n 2304.96
Redondeando 2305
Hombres
Hombres 50% 1153
Mujeres 50% 1152 NSE
7.10% 25.90% 37.80% 29.20%
Edad Población % 35% 29 105 153 118 405
Menores de 18 años 2,800,000 35% 5% 3 15 22 17 57
Entre 18 y 20 años 400,000 5% 18% 15 54 78 61 208
Edad