Estadística

Estadística
PARA INVESTIGACIÓN
Preliminares
Conceptos Matemáticos Básicos
• Redondeo
Regla general: aproximación a 2 decimales
– Redondeo de números reales. Ejemplos:
56.2345 entonces es …
65.2583 entonces es …
• Porcentaje: expresión de un número como
fracción de 100
• El porcentaje se puede expresar como una

razón, fracción y un decimal.
• Redondeo de un Porcentaje. Ejemplos
-Redondear 43.5678%
-Redondear y expresar en porcentaje 0.23563
-Redondear y expresar en porcentaje 3/16
• Porcentaje
– Porcentaje de una Categoría
Lectores de Lectores de Total
Diario 1 Diario 2
Hombre 2,300 3,030 5,330
Mujer 2,010 2,700 4,710
Total 4,310 5,730 10,040
Ejemplo: Hallar % de Mujeres que leen Diario 1.

• Incrementos y decrementos
1995 1996 1997 1998 1999

Minutos de TV 211 214 209 210 213
Incremento anual en minutos
Incremento anual en porcentajes
Ejemplo : De la siguiente tabla muestra información de los
trabajadores de cierta empresa.
Desempeño
Excelente Bueno Regular Malo Muy malo
Primaria 8 3 4 2 2
Formación
Secundaria 25 19 16 14 10
Superior 27 23 25 22 20
-Calcular el % de trabajadores con formación superior

-Calcular el % de trabajadores con desempeño que no
cumple con al menos ser regular
-Calcular el % de trabajadores que al menos su desempeño
es bueno y con formación primaria.
Conceptos Matemáticos Básicos –
Gráficos
Años Leen Diarios %
14 – 23 1,340 9.30%
24 - 33 3,450 23.94%
34 - 43 4,020 27.90%
44 - 54 5,600 38.86%
Total 14,410
Leen Diarios Leen Diarios (%)

5600
39%
4020
3450 28%
24%
1340 9%
14-23 24-33 34-43 44-54

14-23 24-33 34-43 44-54
Conceptos Matemáticos Básicos -
Gráficos
Ejemplo : Grafique en porcentaje los datos de la siguiente
tabla.
Desempeño
Excelente Bueno Regular Malo Muy malo
Primaria 8 3 4 2 2
Formación
Secundaria 25 19 16 14 10
Superior 27 23 25 22 20
CUADROS Y GRÁFICOS
CUADROS Y GRÁFICOS
Excelente Bueno Regular Malo Muy Malo

Primaria 8 3 4 2 2 19
Secundaria 25 19 16 14 10 84
Superior 27 23 25 22 20 117
60 45 45 38 32 220
Primaria 8 3 4 2 2 19 8.6%
Secundaria 25 19 16 14 10 84 38.2%
Superior 27 23 25 22 20 117 53.2%
60 45 45 38 32 220
27.3% 20.5% 20.5% 17.3% 14.5%
Primaria 42.1% 15.8% 21.1% 10.5% 10.5% 100.0%
Secundaria 29.8% 22.6% 19.0% 16.7% 11.9% 100.0%
Superior 23.1% 19.7% 21.4% 18.8% 17.1% 100.1%
Primaria 3.6% 1.4% 1.8% 0.9% 0.9% 8.6%
Secundaria 11.4% 8.6% 7.3% 6.4% 4.5% 38.2%
Superior 12.3% 10.5% 11.4% 10.0% 9.1% 53.3%
100.1%
Términos Básicos
• Elemento, Es el objeto sobre el cual se realiza una
medición. En los estudios de poblaciones humanas,
con frecuencia ocurre que las unidades de
observación son los individuos
Términos Básicos
• Variable, característica o propiedad que representa a
un conjunto de valores.
• Valores de Variables, es un conjunto valores que la
variable es capaz de recibir. Pueden estar definidos
dentro de un rango
Ejemplo: determinar las Variables y los valores de
variable en la siguiente encuesta
Sexo: Hombre Mujer

Dedicó ayer su tiempo a algunos de estos medios?
Prensa Radio Televisión
Reconocimiento de Variables Forma I
Reconocimiento de Variables Forma I
¿Y EL ELEMENTO?
Reconocimiento de Variables
Forma I
• Caso 1:
– Variable: Sexo
– Valores: Hombre, Mujer
– Variable: Media
– Valores: radio, tv, prensa
Reconocimiento de Variables Forma II
Reconocimiento de Variables
Forma II
• Caso 2:
– Variable: Sexo
– Valores: Hombre, Mujer
– Variable: radio
– Valores: si, no
– Variable: prensa
– Valores: si, no
Ejercicio
Trabajador SEXO SUELDO CATEGORIA EDAD
1 HOMBRE 850 EMPLEADO 46
2 HOMBRE 1,270 EMPLEADO 48
5 MUJER 1,006 EMPLEADO 49
17 MUJER 2,683 JEFE DE AREA 44
19 HOMBRE 2,067 JEFE DE AREA 50
24 MUJER 6,060 GERENTE 43
25 HOMBRE 7,149 GERENTE 52
De la tabla de datos, se pide analizar las variables CATEGORÍA y SUELDO. En sus análisis
debe considerar un cuadro y un gráfico.
Ejemplo: Análisis de VARIABLE: SEXO
SEXO CANTIDAD %
MUJER 8 32%
HOMBRE 17 68%
TOTAL 25 100%
El sumatorio
• El sumatorio o la sumatoria es un operando
matemático que permite representar sumas de
muchos sumandos, n o incluso infinitos sumandos,
se expresa con la letra griega sigma ( Σ ), y se define
como:
• i: índice de la suma
• n: límite superior
• m: límite inferior
Tabla de Distribución de Frecuencias
Individuo Nombre Nro. de periódicos
leídos ayer
1 Luis 1
2 Pedro 0
3 Ana 1
4 Diego 1
5 Carol 2
6 Manuel 0
7 Susana 1
8 Jair 1
9 Lucas 3
10 María 1
VARIABLE? VALORES DE LA VARIABLE?

Variable Frecuencias Frecuencias

Frecuencias Frecuencias
“Nro. De absolutos relativas
absolutas relativas
periódicos leídos acumulada acumuladas
F.A. F.R.
ayer” F.A.A F.R.A
TOTAL
Variable Frecuencias Frecuencias

“Nro. De absolutos relativas
absolutas relativas
F.A. F.R.
ayer” F.A.A F.R.A
0
1
2
3
TOTAL
Frecuencia absoluta (F.A.)
Variable Frecuencias Frecuencias Frecuencias
Frecuencias
“Nro. De absolutas absolutos relativas
relativas
F.A. F.R.
ayer” F.A.A F.R.A
0 2
1
2
3
TOTAL
Frecuencias
relativas
F.A. F.R.
ayer” F.A.A F.R.A
0 2
1 6
2
3
TOTAL
Frecuencias
relativas
F.A. F.R.
ayer” F.A.A F.R.A
0 2
1 6
2 1
3 1
TOTAL Σ F.A.= N = 10
Frecuencia absoluta acumulada
(F.A.A.)
Variable Frecuencias Frecuencias absolutos Frecuencias Frecuencias

“Nro. De absolutas acumulada relativas relativas
periódicos
F.A. F.A.A F.R. acumuladas F.R.A
leídos ayer”
0 2 2
1 6
2 1
3 1
(F.A.A.)

periódicos
leídos ayer”
0 2 2
1 6 2+6= 8
2 1
3 1
(F.A.A.)

periódicos
leídos ayer”
0 2 2
1 6 2+6= 8
2 1 2+6+1=9
3 1
(F.A.A.)

periódicos
leídos ayer”
0 2 2
1 6 2+6= 8
2 1 2+6+1=9
3 1 2+6+1+1=10
Frecuencia relativa (F.R.)
Variable Frecuencias
“Nro. De absolutos Frecuencias relativas
absolutas relativas
periódicos acumulada
F.R. acumuladas F.R.A
leídos ayer” F.A.
F.A.A
0 2 2 (2/10)×100=20%
1 6 2+6= 8
2 1 2+6+1=9
3 1 2+6+1+1=10
absolutas relativas
F.A.A
0 2 2 (2/10)×100=20%
1 6 2+6= 8 (6/10)×100=60%
2 1 2+6+1=9
3 1 2+6+1+1=10
absolutas relativas
F.A.A
0 2 2 (2/10)×100=20%
1 6 2+6= 8 (6/10)×100=60%
2 1 2+6+1=9 (1/10)×100=10%
3 1 2+6+1+1=10
TOTAL Σ= N = 10
Frecuencia relativa (fi)
absolutas relativas
F.A.A
0 2 2 (2/10)×100=20%
1 6 2+6= 8 (6/10)×100=60%
2 1 2+6+1=9 (1/10)×100=10%
3 1 2+6+1+1=10 (1/10)×100=10%
Frecuencia relativa acumulada (Fi)
absolutas relativas
periódicos acumulada acumuladas F.R.A
leídos ayer” F.A. F.R.
F.A.A
0 2 2 20% (2/10)×100=20%
1 6 2+6= 8 60%
2 1 2+6+1=9 10%
3 1 2+6+1+1=10 10%
TOTAL Σ F.A.= N = 10 ΣF.R.= F=100%
absolutas relativas
F.A.A
0 2 2 20% (2/10)×100=20%
1 6 2+6= 8 60% (8/10)×100=80%
2 1 2+6+1=9 10%
3 1 2+6+1+1=10 10%
TOTAL Σ F.A.= N = 10 ΣF.R.= F=100%
absolutas relativas
F.A.A
0 2 2 20% (2/10)×100=20%
1 6 2+6= 8 60% (8/10)×100=80%
2 1 2+6+1=9 10% (9/10)×100=90%
3 1 2+6+1+1=10 10%
TOTAL Σni = N = 10 Σfi = F=100%
absolutas relativas
F.A.A
0 2 2 20% (2/10)×100=20%
1 6 2+6= 8 60% (8/10)×100=80%
2 1 2+6+1=9 10% (9/10)×100=90%
3 1 2+6+1+1=10 10% (10/10)×100=100%
TOTAL Σ F.A.= N = 10 ΣF.R.= F=100%
absolutas relativas
F.A.A
0 2 2 20% 20%
1 6 8 60% 80%
2 1 9 10% 90%
3 1 10 10% 100%
TOTAL Σ F.A.= N = 10 ΣF.R.= F=100%
Ejercicio I
Hogares No. De televisores en el
hogar
1 1
2 1
3 2
4 3
5 1
6 2
7 0
8 1
VARIABLE?
VALORES DE LA VARIABLE?
Variable “Nro. De absolutos
absolutas relativas
“Televisores” periódicos leídos acumulada
ayer” F.A. F.R.
F.A.A
TOTAL
Ejercicio II – Distribución de frecuencias agrupadas
Trabajador Salario Trabajador Salario Trabajador Salario Trabajador Salario
1 863 12 1,255 23 1,442 34 829

2 1,431 13 1,038 24 1,459 35 934
3 1,055 14 1,137 25 946 36 828
4 1,272 15 1,174 26 705 37 1,211
5 1,199 16 843 27 814 38 985
6 872 17 1,364 28 1,289 39 1,130
7 762 18 908 29 1,466 40 1109
8 1,427 19 1,453 30 1,343 41 1,226
9 1,373 20 746 31 719 42 954
10 1,051 21 1,347 32 1,036 43 769
11 1,317 22 1,370 33 781
Frecuencias
Frecuencias
Variable Frecuencias Frecuencias relativas
absolutos
“Salario” absolutas (ni) relativas (fi)% acumuladas
acumuladas (Ni)
(Fi)%
TOTAL
Variable “Nro. De absolutos
absolutas relativas
“Salario” periódicos leídos acumulada
ayer” F.A. F.R.
F.A.A
700 – 899
900 – 1,099
1,100 – 1,299
1,300 – 1,499
TOTAL
Construcción de un histograma
Trabajador Salario Trabajador Salario Trabajador Salario Trabajador Salario Trabajador Salario
1 863 11 1,317 21 1,347 31 719 41 1,226

2 1,431 12 1,255 22 1,370 32 1,036 42 954
3 1,055 13 1,038 23 1,442 33 781 43 769
4 1,272 14 1,137 24 1,459 34 829
5 1,199 15 1,174 25 946 35 934
6 872 16 843 26 705 36 828
7 762 17 1,364 27 814 37 1,211
8 1,427 18 908 28 1,289 38 985
9 1,373 19 1,453 29 1,466 39 1,130
10 1,051 20 746 30 1,343 40 1,109
AMPLITUD
a. Amplitud (A): es la diferencia entre el límite
superior e inferior
Fórmula: A=Ls-Li.
Ls: Límite superior
Li: Límite inferior
Trabajador Salario Trabajador Salario Trabajador Salario Trabajador Salario Trabajador Salario
1 863 11 1,317 21 1,347 31 719 41 1,226

2 1,431 12 1,255 22 1,370 32 1,036 42 954
3 1,055 13 1,038 23 1,442 33 781 43 769
4 1,272 14 1,137 24 1,459 34 829
5 1,199 15 1,174 25 946 35 934
6 872 16 843 26 705 36 828
7 762 17 1,364 27 814 37 1,211
8 1,427 18 908 28 1,289 38 985
9 1,373 19 1,453 29 1,466 39 1,130
10 1,051 20 746 30 1,343 40 1,109
La Amplitud en el ejemplo: A=1466-705=761

Clase (m) – Longitud (k)
b. Determinar el número de agrupaciones,
intervalos o clases (m), y la longitud (k) de
cada clase, de tal forma que el producto mk
sea mayor o igual a A. Es “recomendable” que
el número de clases este comprendido entre 6
y 15 por lo tanto...
m k =m*k
m k =m*k
6
7
8
9
10
11
12
13
14
15
m k =m*k
6 =761/6=126.83
7
8
9
10
11
12
13
14
15
m k =m*k
6 =761/6=126.83
7 =761/7=108.71
8
9
10
11
12
13
14
15
m k =m*k
6 =761/6=126.83
7 =761/7=108.71
8 =761/8=95.13
9
10
11
12
13
14
15
m k =m*k
6 =761/6=126.83
7 =761/7=108.71
8 =761/8=95.13
9 84.56
10 76.10
11 69.18
12 63.42
13 58.54
14 54.36
15 50.73
m k =m*k
6 127 762
REDONDEAMOS Y 7 109 763 MAYORES A A=761
CALCULAMOS m*k 8 95 760
9 85 765
10 76 760
11 69 759
12 63 756
13 59 767
14 54 756
15 51 765
c. Los límites de cada clase deben ser, por
conveniencia, múltiplos de 5, 10, 100,...
(sólo uno de los limites inferior o superior
debe ser múltiplo de 5, “de preferencia” el
límite inferior)
Los límites son los valores extremos de cada
clase
m k =m*k
6 127 762
7 109 763
8 95 760
9 85 765
10 76 760
11 69 759
12 63 756
13 59 767
14 54 756
15 51 765
Limites de Clase
# Inferior Superior
1
2
3
4
5
6
7
8
9
Limites de Clase
# Inferior Superior
1 705
2
3
4
5
6
7
8
9
Limites de Clase
# Inferior Superior
1 705 =705+85-1=789
2
3
4
5
6
7
8
9
Limites de Clase
# Inferior Superior
1 705 =705+85-1=789
2 790
3
4
5
6
7
8
9
Limites de Clase
# Inferior Superior
1 705 =705+85-1=789
2 790 =790+85-1=874
3
4
5
6
7
8
9
Limites de Clase
# Inferior Superior
1 705 =705+85-1=789
2 790 =790+85-1=874
3 875
4
5
6
7
8
9
Limites de Clase
# Inferior Superior
1 705 789
2 790 874
3 875 959
4 960 1,044
5 1,045 1,129
6 1,130 1,214
7 1,215 1,299
8 1,300 1,384
9 1,385 1,469
d. Marca de Clase (M): es la semisuma de los
limites inferior y superior
Limites de Clase
# Inferior Superior Marca de Clase
1 705 789 =(705+789)/2=747
2 790 874
3 875 959
4 960 1,044
5 1,045 1,129
6 1,130 1,214
7 1,215 1,299
8 1,300 1,384
9 1,385 1,469
Limites de Clase
# Inferior Superior Marca de Clase
1 705 789 =(705+789)/2=747
2 790 874 =(790+874)/2=832
3 875 959
4 960 1,044
5 1,045 1,129
6 1,130 1,214
7 1,215 1,299
8 1,300 1,384
9 1,385 1,469
Limites de Clase Marca de
# Inferior Superior Clase
1 705 789 747
2 790 874 832
3 875 959 917
4 960 1,044 1,002
5 1,045 1,129 1,087
6 1,130 1,214 1,172
7 1,215 1,299 1,257
8 1,300 1,384 1,342
9 1,385 1,469 1,427
f. Calculamos la tabla de distribución de
frecuencias
Limites de Clase Marca de Frecuencia Frecuencia Abs.
# Inferior Superior Clase Absoluta Acumulada
1 705 789 747 6 6
2 790 874 832 6 12
3 875 959 917 4 16
4 960 1,044 1,002 3 19
5 1,045 1,129 1,087 3 22
6 1,130 1,214 1,172 5 27
7 1,215 1,299 1,257 4 31
8 1,300 1,384 1,342 6 37
9 1,385 1,469 1,427 6 43
f. Calculamos la tabla de distribución de
frecuencias
Limites de Clase Marca de Frecuencia Frecuencia Rel.
# Inferior Superior Clase Relativa Acumulada
1 705 789 747 13.953% 13.953%
2 790 874 832 13.953% 27.906%
3 875 959 917 9.302% 37.208%
4 960 1,044 1,002 6.977% 44.185%
5 1,045 1,129 1,087 6.977% 51.162%
6 1,130 1,214 1,172 11.628% 62.790%
7 1,215 1,299 1,257 9.302% 72.093%
8 1,300 1,384 1,342 13.953% 86.046%
9 1,385 1,469 1,427 13.953% 99.999%≈100%
Gráfico
Frecuencia
0
1
2
3
4
5
6
705 7
789
13.95%
790
874
875
959
960
1044
1045
Histograma
1129
1130
Gráfico
1214
1215
1299
1300
1384
1385
1469
Ejercicio
142 109 62 64 84 35 142 109 62 64
105 97 65 134 83 81 105 97 65 134
60 102 123 136 140 71 60 102 123 136
119 60 74 118 48 73 119 60 74 118
48 116 142 41 127 121 48 116 142 41
141 144 99 114 76 92 141 144 99 114
60 57 144 93 99 58 60 57 144 93
121 127 91 67 80 103 121 127 91 67
50 123 135 144 90 109 50 123 135 144
123 142 125 73 63 41 123 142 125 73
Ejercicios
1. Elabore un solo gráfico para el siguiente cuadro. Las respuestas fueron obtenidas de una sola
muestra. Además, se conoce la pregunta del cuestionario:
¿Con qué frecuencia consumes?
FRECUENCIA
Diaria Semanal Mensual Anual Nunca
Manzana(*) 400 200 300 90 10
FRUTA
Plátano(*) 500 300 200 0 0
Pera(*) 100 200 400 180 120
Piña(*) 50 100 550 250 50
(*) Cualquier variedad
2. De la tabla adjunta, analice (en sus análisis debe considerar un cuadro y un gráfico):
a. Las variables SEXO – SUELDO – CATEGORÍA.
b. Las variables CATEGORIA – TIPO DE CONTRATO – CANTIDAD DE DEPENDIENTES.
3. De la tabla adjunta, elabore la tabla de frecuencia e Histograma de la variable TIEMPO DE SERVICIO
TIEMPO DE Cantidad de
SUELDO TIPO DE
Trabajador SEXO CATEGORIA SERVICIO dependientes
(Soles) CONTRATO
(MESES) del trabajador
1 HOMBRE 1,103 EMPLEADO 252 TEMPORAL 1
2 HOMBRE 1,547 EMPLEADO 202 PERMANENTE 2
5 MUJER 1,358 EMPLEADO 161 TEMPORAL 3
17 MUJER 2,129 JEFE DE AREA 232 TEMPORAL 1
18 MUJER 1,670 JEFE DE AREA 289 TEMPORAL 4
19 HOMBRE 1,520 JEFE DE AREA 259 TEMPORAL 3
20 HOMBRE 2,456 JEFE DE AREA 270 PERMANENTE 2
21 MUJER 1,720 JEFE DE AREA 218 PERMANENTE 0
22 HOMBRE 2,386 JEFE DE AREA 294 PERMANENTE 4
23 MUJER 2,403 JEFE DE AREA 275 PERMANENTE 4
24 MUJER 6,060 GERENTE 205 PERMANENTE 4
25 HOMBRE 7,149 GERENTE 142 PERMANENTE 2
Medidas de Posición
Central
Media Aritmética (Media)
• Media Aritmética: es una medida de posición
central o tendencia central. Es igual a la suma
de una cantidad de números dividida entre el
número de sumandos.
Se representa por :
• Datos no agrupados en tabla de distribución
de frecuencias
Día Dólar Venta
9 2.847
10 2.847
11 2.886
12 2.886
13 2.886
14 2.940
15 2.929
16 2.946
= (2.847+2.847+2.886+2.886+2.886+2.940+2.929+2.946)/8=2.896
Cuando se tienen datos ordenados en tablas de
frecuencia, la media se obtiene sumando los
productos que resultan de multiplicar cada valor de
variable con su respectiva frecuencia absoluta;
luego, esa suma se divide entre el total de
elementos. O también, la suma de los productos
de cada valor de variable por su respectiva
frecuencia relativa, y esa suma entre el 100%.
Variable (Dólar Frecuencia Frecuencia
Venta) Absoluta Relativa
2.847 2 25.0%
2.886 3 37.5%
2.929 1 12.5%
2.940 1 12.5%
2.946 1 12.5%
= (2.847x2+2.886x3+2.929x1+2.940x1+2.946x1)/8=23.167/8=2.896
= (2.847x25%+2.886x37.5%+2.940x12.5%+2.929x12.5%+2.946x12.5%)/100%
= 2.896/1=2.896
Cuando se tiene tablas de frecuencias con
intervalos, el cálculo de la media es
aproximado. Para esto, se utiliza las marcas de
clase, los cuales sustituyen a los valores de la
variable.
Fórmula anterior
Marca de Frecuencia Frecuencia
Frecuencia
# Inferior Superior Clase Acumulada Relativa
1 705 789 747 6 6 13.953%
2 790 874 832 6 12 13.953%
3 875 959 917 4 16 9.302%
4 960 1,044 1,002 3 19 6.977%
5 1,045 1,129 1,087 3 22 6.977%
6 1,130 1,214 1,172 5 27 11.628%
7 1,215 1,299 1,257 4 31 9.302%
8 1,300 1,384 1,342 6 37 13.953%
9 1,385 1,469 1,427 6 43 13.953%
= (747x6+832x6+917x6+1,002x3+1,087x3+1,172x5+1,257x4+1,342x6+1,427x6)/43= 1,090.95
= (747x13.953%+832x13.953%+917x9.302%+1,002x6.977%+1,087x6.977%+1,172x11.628%
+1,257x9.302%+1,342x13.953%+1,427x13.953%) = 1,090.95
Media aritmética ponderada, en vez de tener
frecuencias tenemos ponderaciones (pesos).
Notas EST Pesos (wi) Xi x wi
12 3
14 3
11 1
19 1
15 1
8 1
18 1
Notas EST Pesos (wi) Xi x wi
12 3 36
14 3 42
11 1 11
19 1 19
15 1 15
8 1 8
18 1 18
11 149
Mediana
Es el valor de variable que ocupa la posición
del centro cuando los datos están ordenados en
forma creciente (o decreciente).
Se representa por:
Me
Mediana
• Cálculo de la mediana para datos
desagregados
– conveniente si es una muestra pequeña.
– Los datos se ordena ascendentemente
– Si el número de datos es impar, la mediana es el
número central
– Si el número de datos es par, la mediana es la
semisuma de los términos centrales
Ejemplo: 22, 18, 17, 11, 25, 10, 17, 20, 15, 10
Mediana
• Para Datos en tablas de Frecuencias
– Se debe tener elaborada la tabla de frecuencias
– La mediana es el valor de la variable cuya
frecuencia absoluta acumulada es superior o igual
a la mitad de los datos (es decir N/2)
Mediana
Nivel de Estudios Frec. Absolutas (ni) Frec. Abs. Acum.(Ni)
Mediana Sin estudios 1 1
Primaria 6 7
Secundaria 3 10
Técnico 7 17
Profesional 4 21
Total 21
Mitad de los datos: N/2= 21/2= 10.5
El primer valor que supera 10.5 es 17, es decir que la mediana es

“Técnico”. Si coloco los datos ordenadamente me resulta
aproximadamente el mismo número de personas con nivel de
estudios “Técnico” o menos que con estudios “Técnico” o mas.
INDIVIDUO NIVEL DE EDUCACIÓN
1 SIN EDUCACIÓN
2 PRIMARIA
3 PRIMARIA
4 PRIMARIA
5 PRIMARIA
6 PRIMARIA
7 PRIMARIA
8 SECUNDARIA
9 SECUNDARIA
10 SECUNDARIA
11 TÉCNICO
Mitad de 12 TÉCNICO Mediana
13 TÉCNICO
los datos
14 TÉCNICO
15 TÉCNICO
16 TÉCNICO
17 TÉCNICO
18 PROFESIONAL
19 PROFESIONAL
20 PROFESIONAL
21 PROFESIONAL
Mediana
Otra forma de hallar la media es con las
frecuencias relativas. Del ejemplo:
Nivel de Estudios Frec. Absolutas (n i ) Frec. Abs. Acum.(N i ) fi Fi

Sin estudios 1 1 5% 5%
Primaria 6 7 29% 33%
Secundaria 3 10 14% 48%
Técnico 7 17 33% 81%
Profesional 4 21 19% 100%
Total 21
Se busca el valor de frecuencia relativa acumulada

mayor o igual al 50%
Mediana
• Para Datos en tabla de frecuencia con
intervalos, seguimos el siguiente
procedimiento:
– Determinamos el intervalo mediano a través de las
frecuencias absolutas (o relativas) acumuladas. El
intervalo mediano es aquel cuya frecuencia
absoluta acumulada sea igual o mayor que la
mitad de los datos
Mediana
Lim ites de Clase Fronteras de Clase Marca de Frecuencia Frecuencia Frecuencia Relativa
Frecuencia
# Inferior Superior Inferior Superior Clase Acumulada Relativa Acumulada
1 705 789 704.5 789.5 747 6 6 14% 14%
2 790 874 789.5 874.5 832 6 12 14% 28%
3 875 959 874.5 959.5 917 4 16 9% 37%
4 960 1,044 959.5 1044.5 1,002 3 19 7% 44%
5 1,045 1,129 1044.5 1129.5 1,087 3 22 7% 51%
6 1,130 1,214 1129.5 1214.5 1,172 5 27 12% 63%
7 1,215 1,299 1214.5 1299.5 1,257 4 31 9% 72%
8 1,300 1,384 1299.5 1384.5 1,342 6 37 14% 86%
9 1,385 1,469 1384.5 1469.5 1,427 6 43 14% 100%
43
El intervalo mediano, es 1,045 – 1,129; ya que

la F.A.A. es 51% que es mayor al 50% ó
N/2=43/2=21.5
Mediana
• Para Datos en tabla de frecuencia con
intervalos usamos la fórmula:
Mediana
Lim ites de Clase Fronteras de Clase Marca de Frecuencia Frecuencia Frecuencia Relativa
Frecuencia
# Inferior Superior Inferior Superior Clase Acumulada Relativa Acumulada
1 705 789 704.5 789.5 747 6 6 14% 14%
2 790 874 789.5 874.5 832 6 12 14% 28%
3 875 959 874.5 959.5 917 4 16 9% 37%
4 960 1,044 959.5 1044.5 1,002 3 19 7% 44%
5 1,045 1,129 1044.5 1129.5 1,087 3 22 7% 51%
6 1,130 1,214 1129.5 1214.5 1,172 5 27 12% 63%
7 1,215 1,299 1214.5 1299.5 1,257 4 31 9% 72%
8 1,300 1,384 1299.5 1384.5 1,342 6 37 14% 86%
9 1,385 1,469 1384.5 1469.5 1,427 6 43 14% 100%
43
El intervalo mediano, es 1,045 – 1,129; por 51% cerca del 50% ó N/2=43/2=21.5≈22
Trabajador Salari o
26 705
31 719
20 746
7 762
43 769
33 781
27 814
36 828
34 829
16 843
1 863
6 872
18 908
35 934
25 946
42 954
38 985
32 1 ,036
13 1 ,038
10 1 ,051
Mediana
3 1 ,055
40 1 ,109
39 1 ,130
14 1 ,137
15 1 ,174
5 1 ,199
37 1 ,211
41 1 ,226
12 1 ,255
4 1 ,272
28 1 ,289
11 1 ,317
30 1 ,343
21 1 ,347
17 1 ,364
22 1 ,370
9 1 ,373
8 1 ,427
2 1 ,431
23 1 ,442
19 1 ,453
24 1 ,459
29 1 ,466
Moda
Es el valor de la variable que aparece el mayor
número de veces.
Se representa por:
Mo
Moda
• Si los datos no se encuentran en tablas de
frecuencias, se busca aquel valor que más se
repite.
Día Dólar Venta
9 2.847
10 2.847
11 2.886
12 2.886
13 2.886
14 2.940
15 2.929
16 2.946
Mo = 2.886
Moda
La moda para en tablas de frecuencias:
Es el dato con mayor frecuencia absoluta y/o
relativa
Nivel de Estudios Frec. Absolutas (ni) Frec. Abs. Acum.(Ni)
Sin estudios 1 1
Primaria 6 7
Secundaria 3 10
Técnico 7 17
Profesional 4 21
Total 21
Mo = Técnico
Moda
ĄůĐƵůŽ ĚĞ ůa moda en tablas de
frecuencias con Intervalos :
• Se calcula el intervalo modal, esto es el
intervalo con mayor frecuencia absoluta y
relativa.
Moda
Li Ls Fi Fs Marca f.a f.a.a f.r f.r.a
1 100 109 99.5 109.5 104.5 2 2 10% 10%
2 110 119 109.5 119.5 114.5 3 5 15% 25%
3 120 129 119.5 129.5 124.5 1 6 5% 30%
4 130 139 129.5 139.5 134.5 2 8 10% 40%
5 140 149 139.5 149.5 144.5 3 11 15% 55%
6 150 159 149.5 159.5 154.5 5 16 25% 80%
7 160 169 159.5 169.5 164.5 1 17 5% 85%
8 170 179 169.5 179.5 174.5 1 18 5% 90%
9 180 189 179.5 189.5 184.5 1 19 5% 95%
10 190 199 189.5 199.5 194.5 1 20 5% 100%
Intervalo modal: 150 - 159, f.a=5; f.r.= 25%

Moda
Utilizamos la siguiente fórmula para
calcular la moda para tablas de frecuencias
con Intervalos :
Liimo es el límite inferior del intervalo modal

niamo es la F.A. del intervalo anterior al modal
nipmo es la F.A del intervalo posterior al modal
Aimo es la amplitud del intervalo modal
Moda
Li Ls Fi Fs Marca f.a f.a.a f.r f.r.a
1 100 109 99.5 109.5 104.5 2 2 10% 10%
2 110 119 109.5 119.5 114.5 3 5 15% 25%
3 120 129 119.5 129.5 124.5 1 6 5% 30%
4 130 139 129.5 139.5 134.5 2 8 10% 40%
5 140 149 139.5 149.5 144.5 3 11 15% 55%
6 150 159 149.5 159.5 154.5 5 16 25% 80%
7 160 169 159.5 169.5 164.5 1 17 5% 85%
8 170 179 169.5 179.5 174.5 1 18 5% 90%
9 180 189 179.5 189.5 184.5 1 19 5% 95%
10 190 199 189.5 199.5 194.5 1 20 5% 100%
Ejercicio
142 109 62 64 84 35 142 109 62 64
105 97 65 134 83 81 105 97 65 134
60 102 123 136 140 71 60 102 123 136
119 60 74 118 48 73 119 60 74 118
48 116 142 41 127 121 48 116 142 41
141 144 99 114 76 92 141 144 99 114
60 57 144 93 99 58 60 57 144 93
121 127 91 67 80 103 121 127 91 67
50 123 135 144 90 109 50 123 135 144
123 142 125 73 63 41 123 142 125 73
Medidas de Dispersión
Dispersión: es decir nos interesa ver la
disparidad de los valores de la variable
con respecto a un valor determinado, que suele
estar en la posición del centro. Es decir interesa
conocer el grado de distanciamiento de un
conjunto de valores respecto a su valor medio.
ESTE GRUPO ES DE
MAYOR DISPERSIÓN
Grupos de datos en la recta numérica
Grupo 1
Grupo 2
Grupo 3
Grupos de datos en la recta numérica
Grupo 1
Grupo 2
Grupo 3
• De los tres grupos, donde encuentro mayor
dispersión?
Distanciamiento Simple: (simple resta con la media)

Grupo 1 Grupo 2 Grupo 3 Distanciamiento Simple
0 0 5 -7 -7 -2
1 6 6 -6 -1 -1
13 8 8 6 1 1
14 14 9 7 7 2
Media 7 7 7 Σ 0 0 0
NO hay forma de ver cual es más disperso

• De los tres grupos, donde encuentro mayor
dispersión?
• Distanciamiento sin Negativos: (elevo al
cuadrado)
Grupo 1 Grupo 2 Grupo 3 Distanciamiento sin Negativos
0 0 5 49 49 4
1 6 6 36 1 1
13 8 8 36 1 1
14 14 9 49 49 4
Media 7 7 7 Σ 170 100 10
Hay mayor dispersión en el

Mayor Dispersión
grupo 1 que en el grupo 3.
• Se considera también a la Amplitud de los
datos o Rango, como un indicador de
dispersión.
Grupo 1 Grupo 2 Grupo 3
0 0 5
1 6 6
13 8 8
14 14 9
Rango 14 14 4
Los datos van desde 0 hasta 14

Frecuencia
Nota
Absoluta
10 1
11 6
12 3
13 7
14 4
15 3
16 3
17 1
Media: 13.18; N=28

Frecuencia Nota – Media

Nota
Absoluta Xi - X
10 1
11 6
12 3
13 7
14 4
15 3
16 3
17 1
Frecuencia Nota – Media

Nota
Absoluta Xi - X
10 1 10-13.18=-3.18
11 6
12 3
13 7
14 4
15 3
16 3
17 1
Nota – Media
Nota Xi Frecuencia ni
Xi - X
10 1 10-13.18=-3.18
11 6 -2.18
12 3 -1.18
13 7 -0.18
14 4 0.82
15 3 1.82
16 3 2.82
17 1 3.82
Frecuencia Nota – Media (Nota – Media)^2
Nota Xi
ni Xi - X (Xi – X)^2
10 1 10-13.18=-3.18 -3.18 ×-3.18= 10.10
11 6 -2.18
12 3 -1.18
13 7 -0.18
14 4 0.82
15 3 1.82
16 3 2.82
17 1 3.82
Nota Xi
10 1 10-13.18=-3.18 -3.18×-3.18= 10.10
11 6 -2.18 4.75
12 3 -1.18 1.39
13 7 -0.18 0.03
14 4 0.82 0.67
15 3 1.82 3.32
16 3 2.82 7.96
17 1 3.82 14.60
Nota Xi (Xi – X)^2 Χ ni
10 1 10-13.18=-3.18 -3.18Χ-3.18= 10.10
11 6 -2.18 4.75
12 3 -1.18 1.39
13 7 -0.18 0.03
14 4 0.82 0.67
15 3 1.82 3.32
16 3 2.82 7.96
17 1 3.82 14.60
10 1 10-13.18=-3.18 -3.18Χ-3.18= 10.10 10.10×1 = 10.10
11 6 -2.18 4.75
12 3 -1.18 1.39
13 7 -0.18 0.03
14 4 0.82 0.67
15 3 1.82 3.32
16 3 2.82 7.96
17 1 3.82 14.60
10 1 10-13.18=-3.18 -3.18Χ-3.18= 10.10 10.10×1 = 10.10
11 6 -2.18 4.75 28.48
12 3 -1.18 1.39 4.17
13 7 -0.18 0.03 0.22
14 4 0.82 0.67 2.70
15 3 1.82 3.32 9.95
16 3 2.82 7.96 23.88
17 1 3.82 14.60 14.60
10 1 10-13.18=-3.18 -3.18Χ-3.18= 10.10 10.10
11 6 -2.18 4.75 28.48
12 3 -1.18 1.39 4.17
13 7 -0.18 0.03 0.22
14 4 0.82 0.67 2.70
15 3 1.82 3.32 9.95
16 3 2.82 7.96 23.88
17 1 3.82 14.60 14.60
Σ=28 94.11
• Si a este valor lo dividimos entre el número
total de elementos, se obtiene la Varianza que
mide la dispersión de los datos respecto a la
media aritmética, en base a la sumatoria de la
diferencia de los valores de variable y la media
y este resultado se eleva al cuadrado.
∑𝑛𝑛𝑖𝑖=1(𝑋𝑋𝑖𝑖 − 𝑋𝑋�)2 × 𝑛𝑛𝑖𝑖 ∑𝑛𝑛𝑖𝑖=1 𝑋𝑋𝑖𝑖2 × 𝑛𝑛𝑖𝑖

𝑉𝑉 = = − 𝑋𝑋� 2
𝑁𝑁 𝑁𝑁
• La desventaja de la varianza es que presenta
unidades al cuadrado, así si se tratase de la
variable edad el resultado de varianza es
edad2; soles (salario), la varianza es soles2, etc.
Para eso se utiliza la desviación estándar (o
típica) que es la raíz positiva de la varianza, lo
cual simplifica el cuadrado.
10 1 10-13.18=-3.18 -3.18Χ-3.18= 10.10 10.10
11 6 -2.18 4.75 28.48
12 3 -1.18 1.39 4.17
13 7 -0.18 0.03 0.22
14 4 0.82 0.67 2.70
15 3 1.82 3.32 9.95
16 3 2.82 7.96 23.88
17 1 3.82 14.60 14.60
Σ=28 94.11
Del ejercicio la varianza es 3.36 y la desviación

estándar es 1.83. La media es 13.18
10 6
11 7
12 1
13 1
14 3
15 1
16 3
17 6
Σ=28
La media es
10 6 10-13.18=-3.18 -3.18Χ-3.18= 10.10 60.62
11 7 -2.18 4.75 33.22
12 1 -1.18 1.39 1.39
13 1 -0.18 0.03 0.03
14 3 0.82 0.67 2.02
15 1 1.82 3.32 3.32
16 3 2.82 7.96 23.88
17 6 3.82 14.60 87.62
Σ=28 212.11
La media es 13.18
V=212.11/28=7.58 y S=2.75
Medidas de Dispersión - ¿cuál es más disperso?
8
6
V=3.36
5
4
S=1.83
3 Recordar que, ambos
2 conjuntos de datos tienen la
1
0
misma media y la misma
10 11 12 13 14 15 16 17 cantidad de datos.
8
V=7.58 3
S=2.75 1
0
10 11 12 13 14 15 16 17
8
5
V=3.36
4
3
S=1.83
2
0
10 11 12 13 14 15 16 17
V=7.58 3
S=2.75 1
0
10 11 12 13 14 15 16 17
¿Cuál es más disperso?
Ejercicio: Hallar la desviación estándar
¿Cuál es más disperso?
Ejercicio 2
Muestreo
(Sampling)
El muestreo
El muestreo
El muestreo
El muestreo
• Se relaciona con:
– Metodología de investigación: Encuesta (y esta
con la medición de la opinión pública)
– Inferencia (la obtención de una muestra para
conocer una población)
• Objetivo del muestreo o de las encuestas por

muestreo
El Muestreo
•Muestrear consiste en seleccionar aquellos elementos del
universo que van a constituir una muestra .
•El objetivo de trabajar con encuestas por muestreo es

estimar el resultado que se obtendría si fuera posible
realizar el análisis a todo el universo. Para cumplir esto se
debe obtener muestras representativas utilizando
técnicas de muestreo.
•En los casos en que la muestra no sea representativa

(sondeo) los resultados solo son válidos para la muestra.
El muestreo – La inferencia
• Que se infiere: (uso de estimadores para
“estimar” parámetros)
Estimadores Parámetros
Media muestral Media Poblacional
Proporción muestral Proporción Poblacional
• Condiciones para realizar inferencias

– Muestra representativa (2 condiciones)
– Herramienta de medición
Definiciones
Elemento
Objeto sobre el que se toma una medición
Unidad de Muestreo
Unidad de muestreo son conjuntos dentro de la población
que cubren la población completa.
Definiciones
Población: (N) es el conjunto de datos o elementos de la
cual se desea obtener una información. Se le conoce
también como universo, y sobre esta población se realizan
las inferencias
Definiciones
Muestra: (n) conjunto de elementos seleccionados de una
población
Muestra sesgada: es una muestra no representativa y, por

tanto, no válida para proyecciones de resultados. Por
ejemplo, las muestras voluntarias que se caracterizan por la
decisión de los propios componentes en formar parte de la
muestra (se autoeligen) y, por tanto, no son probabilísticas
(aleatorios)
Definiciones
Marco de Muestreo
Definiciones
Marco de Muestreo
El marco de muestreo es el universo práctico, es decir el
soporte que se utilizará para seleccionar la muestra. La
muestra se selecciona de a partir de un medio físico o
soporte (directorio, archivo, etc.) que coincide en menor o
mayor grado con el universo.
Ejemplo:
•Datos del RENIEC o INEI
•Guía telefónica
•Datos de los alumnos de la base de datos de la UDEP
Ejemplos
• Investigación acerca discriminación contra la
mujer
Estudio de Investigación – Planificación
de la Investigación
1. Diseño
• Objetivo del estudio (estudio de variables y/o atributos)
• Se trabajará sobre universo o una muestra? Marco Muestral?
Error muestral y el grado de confianza? Tamaño de la muestra?
Técnica de muestreo probabilístico? Máxima indeterminación?
Otras consideraciones según la investigación.
• Costo
• Calendario
2. Recogida de Datos (información directa del individuo o estudios
anteriores)
3. Obtención de resultados
• Proceso de Cálculo (Histogramas, media, desviación estándar,
etc.)
4. Interpretación y Análisis
• Conclusiones
Métodos de Muestreo
• Métodos Probabilísticos
• Métodos No Probabilísticos
Métodos Probabilísticos -
Características
Azar (aleatorio): No puede determinarse el suceso antes de que suceda

Métodos Probabilísticos -
Características
• Elección de los elementos al azar (aleatorio).
• Todos los componentes del universo tienen probabilidad
(conocida no nula) de ser elegidos.
• Es posible estimar el error muestral cometido (según lo
demuestra el Teorema del Límite Central).
• Sus resultados pueden inferirse al universo o población,
con un determinado error muestral. El error Muestral o
error de Estimación es el error a causa de observar una
muestra en lugar de la población completa.
• Su coste económica es superior a los no probabilísticos.
Tipos de Muestreo Probabilístico
• Aleatorio Simple
• Sistémico
• Estratificado
• Conglomerados
Inconvenientes de los Métodos
Probabilísticos
• Deficiencias del marco de muestreo. Por
ejemplo: si el marco de muestreo es la guía
telefónica, pues existen números de
abonados que no figuran en la misma.
• Sesgos y no respuesta (en la encuesta). Este
efecto puede producirse por comportamiento
del encuestado y/o del encuestador.
Métodos no Probabilísticos -
Características
Características
Características
Características
• La elección de los elementos no es aleatorio.
se eligen a juicio del investigador y en algunos
casos los elementos se autoeligen.
• Las muestras son sesgadas
• No se puede calcular el error muestral
• Los resultados no se pueden inferir en la
población
• Son económicos
Tipos de Muestreo no Probabilístico
• Opináticos (arbitrio del encuestador)
• De cuotas
• Bola de nieve
• Accidental (incidental). Fácil accesibilidad
Muestreo Probabilístico
Muestreo Aleatorio Simple I
Características:
•Se necesita un listado ordenado de todos los
elementos.
•La muestra se seleccionan mediante las tablas
de números aleatorios (el tamaño de la
muestra se considera en el diseño)
•Todos los elementos tienen la misma
probabilidad de ser elegidos (según sea con o
sin reemplazo)
Muestreo Aleatorio Simple II
Características:
•La población debe ser homogénea respecto a la
característica de estudio y pequeña (finita).
•Suele utilizarse como referencia para el cálculo
del tamaño y error muestral.
•Es el método menos preciso (mayor error)
•Aplicaciones: mayormente en auditorias de
inventarios
1 ADRIANZEN RODRIGUEZ CLAUDIA CAROLI 31 JUAREZ VEGA MIRTHA MARIA
2 AGURTO ZEGARRA GRECIA PAOLA 32 LAVALLE AMAYA GRACIELLA
3 ALVA BAYONA ERICK HAROLD 33 MARTINEZ CANTELLI ROCIO MARIA DEL CARMEN
4 ANGULO BENITES GLENDA FABIOLA 34 MARTINEZ ENCALADA CECILIA FRANCISCA
5 APAESTEGUI SOTOMAYOR DOLPH
35 MAVILA OJEDA CHIARA MARIA
6 ARRUNATEGUI CACERES MARIA EUGENIA DEL CARMEN
36 MOURA GONZALEZ RITA ALESSANDRA
7 ARTEAGA LYSAYTAN VIOLETA CAROLINA
37 NEYRA MENDOZA LINDSAY SOLANGE
8 BAIGORRIA DE LA FUENTE FERNANDA DE
38 OQUELIS MELENDEZ MACARENA ARACELY
9 BAUTISTA CASTAÑEDA BLANCA PAULA DE
39 PAREDES ARISMENDIZ VICTOR RAUL
10 BENITES VEGAS KATHERINE MARIA
40 PASAPERA NEYRA NELSON NOE
11 BOJORQUEZ CHECYA MICHELLE
41 PERLA CHUNGA DORIS MILAGROS
12 CARDENAS MERINO CLAUDIA SOFIA
42 PIPOLI DRAGO MELISSA
13 CARDOZA JIMENEZ MARCIA ARACELLY
43 QUEZADA HIDALGO BRYAN GUSTAVO
14 CASTILLO CORONADO URSULA ANDREA
44 RAMIREZ CASTRO SOFIA DEL ROSARIO
15 CASTILLO RIVAS KATHERINE
45 RAMOS CORDOVA JORGE LUIS
16 CHIRA FACUNDO PRISCILLA YENIREE
17 CHUNGA YESQUEN CARLOS ENRIQUE

46 REQUENA ZAPATA SELENE NARELLA
18 CORONADO OLAYA ALANA DEL PILAR 47 REYES VASQUEZ ANTONIO JAFET
19 CRUZ HERRERA ANNIE LUCIA SOLANGE 48 RIVERA PALOMINO JHANDELYN STEFFANYA
20 ESPINOZA MEZA LYANNE JASMINE 49 ROJAS CORNEJO GONZALO
21 GARCIA GARCIA MAIRA ESTEFANI 50 RUBIO AZCARATE ANGGELA DE JESUS
22 GONZALES BENITES CECILIA EDITH 51 RUBIO CABRERA ANDREA DANIELA
23 GONZALES NUNCEBAY SULLON NANNERL S 52 SAAVEDRA COLAN ANA SOFIA

24 GONZALEZ CUMPA WILFREDO TOMAS 53 SANCHEZ MARTINEZ MIGUEL ALBERTO
25 GUERRA MONTUFAR CLAUDIA LUCIA 54 STEWART TIMARCHI ALLISON AISA
26 GUZMAN ALAMO FIORELLA 55 TORRES RIOFRIO LUIS ALEXANDER
27 HECK FRANCO EMILIO
56 VASQUEZ CASTILLO RUTH LIZETH
28 HERNANDEZ DELLY CLAUDIA GABRIELA
57 VIÑAS MORE PEDRO VICENTE
29 HUERTAS ABAD LADY DIANA
58 YNGA LEON MARIA FERNANDA
30 IPANAQUE CHAPILLIQUEN JOSE CESAR AUGUSTO
59 ZAPATA NOVOA MARIA GRACIA
Muestreo Aleatorio Sistemático I
Características:
• Únicamente se elige al azar el primer elemento
(por el método aleatorio simple). El resto de
elementos se selecciona sumándole una
determinada cantidad (coeficiente de elevación) al
elemento anterior
• Coeficiente de elevación: número de elementos
del universo representados por cada unidad
muestral. Ce=N/n (N: población; n muestra)
Muestreo Aleatorio Sistemático II
Ejemplo:
Consideramos una población de 5000 agricultores
pertenecientes a una determinada zona y de la que se
pretende extraer una muestra sistemática de 10
agricultores. El procedimiento a seguir es el siguiente:
Definir el tamaño el Ce = 5000/10 =500
Selecciona un numero aleatorio r entre 1 y 500, (por
ejemplo 96).
Seleccionar los restantes elementos de la muestra, 96,
96+500=596,596+500=1096, 1596, 2096, 2596, 3096,
3596, 4096, 4596
Muestreo Aleatorio Sistemático III
Características:
•Al igual que el aleatorio simple se necesita
conocer a todos los elementos de la población
y listarlos
•Aplicaciones: en control de la calidad de la
industria, encuesta telefónicas.
Muestreo Aleatorio Estratificado I
Es el método más utilizado en investigación
social.
La población no es homogénea cuando se le
estudia.
Características:
• Población se agrupa en estratos. Ejemplos:
 Niveles socioeconómicos.
 Estratificación geográfica (país, provincia, etc.) y
por tipo de hábitat (urbano, rural)
FUENTE: https://www.netquest.com/blog/es/blog/es/muestreo-
probabilistico-muestreo-estratificado
Muestreo Aleatorio Estratificado II
Características:
•Se calcula una submuestra en base a cada
estrato. La muestra final esta formado por
todas las submuestras.
•La fiabilidad en la cantidad de cada
submuestra depende del método de afijación.
•Aplicación: en investigación de audiencias.
Por ejemplo, audiencias de televisión.
Muestreo Aleatorio Estratificado III
Procedimientos de Afijación:
• Simple
–Cada estrato tiene el mismo número de elementos.
–ni = n/L; donde n es el tamaño total de la muestra; L es
el número de estratos y ni tamaño de la submuestra.
–Este tipo de afijación da la misma importancia a todos
los estratos, en cuanto a tamaño de la muestra, con lo
cual favorecerá a los estratos de menor tamaño y
perjudicara a los grandes en cuanto a precisión. Solo es
conveniente en poblaciones con estratos de tamaño
similar.
Muestreo Aleatorio Estratificado IV
Ejemplo: Sea el gasto por pago de pensión al año en
miles de unidades monetarias en una determinada
universidad, y que se muestra en la siguiente tabla de
distribución de frecuencias.
X 2 3 4 7 10 12 16 20 25 30 35 50 60 100
n 20 30 60 100 150 200 120 80 50 20 18 10 8 4
Asimismo, se divide a la población universitaria en 3

estratos, con los siguientes criterios: 2 ≤ X ≤ 7; 10 ≤ X ≤ 25
y 30 ≤ X ≤ 100. Se le pide que para una muestra "n" de
100 aplicar la afijación uniforme.
Muestreo Aleatorio Estratificado V
La afijación uniforme consiste en extraer de cada estrato el
mismo número de unidades para realizar la muestra. En este
caso, n/L=100/3= 33.33; donde L es el total de estratos y n es el
tamaño muestral. Por lo tanto, una afijación de este tipo
consiste en extraer 33 individuos del un estrato, 33 individuos de
otro estrato y 34 del estrato restante.
Poblacion Muestra
Estrato
Estrato Estrato
2≤X≤7 210 33
10 ≤ X ≤ 25 600 33
30 ≤ X ≤ 100 60 34
870 100
Muestreo Aleatorio Estratificado VI
•Proporcional
–Es el mas utilizado
–El número de elementos en cada estrato es
directamente proporcional a su tamaño
Ni es la población del estrato correspondiente

Muestreo Aleatorio Estratificado VII
Del ejemplo de la afijación simple, calcular el
número de elementos de cada submuestra por
la afijación proporcional.
Poblacion
Estrato Muestra Estrato ni ni
Estrato Ni
2 ≤ X ≤ 7 210 =100*210/870 24
10 ≤ X ≤ 25 600 =100*600/870 69
30 ≤ X ≤ 100 60 =100*60/870 7
870 100
Muestreo Aleatorio Estratificado VIII
• Óptimo
–Toma en cuenta la dispersión de la característica
analizada, lo cual hace que se tome mas datos en los
estratos que presentan mayores dispersiones y
tamaños
Es necesario conocer las desviaciones típicas (S o σ) de

todos los estratos, o aproximaciones por muestras
pilotos o de estudios anteriores
Muestreo Aleatorio Estratificado IX
Del ejemplo de la afijación simple, calcular el
número de elementos de cada submuestra por
la afijación óptima.
Estrato Estrato
2≤X≤7 10 ≤ X ≤ 25
Xi n n×Xi Xi-X (Xi-X)^2 n×(Xi-X)^2 Xi n n×Xi Xi-X (Xi-X)^2 n×(Xi-X)^2

2 20 40 -3.1 9.6 191.61 10 150 1,500 -4.5 19.8 2,970.38
3 30 90 -2.1 4.4 131.70 12 200 2,400 -2.5 6.0 1,200.50
4 60 240 -1.1 1.2 71.97 16 120 1,920 1.6 2.4 288.30
7 100 700 1.9 3.6 362.81 20 80 1,600 5.6 30.8 2,464.20
210 1,070 758.10 25 50 1,250 10.6 111.3 5,565.13
600 8,670 12,488.50
X 5.10
V 3.61 X 14.45
S 1.90 V 20.81
S 4.56
Muestreo Aleatorio Estratificado X
Estrato
30 ≤ X ≤ 100
Xi n n×Xi Xi-X (Xi-X)^2 n×(Xi-X)^2 Poblacion

30 20 600 -13.5 182.3 3,645.00 Estrato Si o σi Ni×σi ni
Estrato Ni
35 18 630 -8.5 72.3 1,300.50
50 10 500 6.5 42.3 422.50 2≤X≤7 210 1.90 399.00 9
60 8 480 16.5 272.3 2,178.00 10 ≤ X ≤ 25 600 4.56 2,737.35 65
100 4 400 56.5 3,192.3 12,769.00 30 ≤ X ≤ 100 60 18.40 1,104.04 26
60 2,610 20,315
870 4,240.39 100
X 43.50
V 338.58
S 18.40
La muestra estará compuesta por 9 elementos

del primer estrato, 65 del segundo y 26 del
tercero
Muestreo Aleatorio Estratificado XI
•Óptimo de costes variables
–Añade el coste total © ( C ) y el de cada una de las
etapas (Ci)
Ci, es el costo por unidad de muestreo en el estrato i

Muestreo Aleatorio Estratificado XI
Del ejemplo danterior, calcular el número de
elementos de cada submuestra por la afijación
óptima de costos variables si C1=1; C2=16 y C3=25.
Determine el costo total del muestreo.
Poblacion Coste
Estrato Si o σi Ni×σi Ci √Ci (Ni×σi)/√Ci ni
Estrato Ni Muestreo
2≤X≤7 210 1.90 399.00 1 1 399.00 31 31
10 ≤ X ≤ 25 600 4.56 2,737.35 16 4 684.34 52 832
30 ≤ X ≤ 100 60 18.40 1,104.04 25 5 220.81 17 425
870 1,304.14 100 1,288
Muestreo Aleatorio por Conglomerados I
Se divide el universo en grupos (conglomerados).
Características:
• La unidad de estudio es el conglomerado. El
conglomerado puede estar conformado por elementos
o por unidades de muestreo. El conjunto de
conglomerados forma el universo.
• Cuando, dentro de cada conglomerado, se extraen los
individuos que formarán parte de la muestra por m.a.s.,
el muestreo se llama bietápico. Primera etapa (m.a. por
conglomerados). Segunda etapa (dentro del
conglomerado se realiza un m.a.s)
Muestreo Aleatorio por Conglomerados II
Características:
• Es un método rápido y de menor coste. Por
ejemplo, resulta mas económico encuestar a 50
familias de un distrito (el distrito es el
conglomerado) que a 50 familias repartidos entre
varios distritos
• El error estándar es mayor que en el muestreo
aleatorio simple o estratificado. En el caso de que
los elementos fueran personas, el error se debe a
que en un conglomerado es muy probable que las
personas tengan las mismas opiniones (repetición
de la información).
Muestreo Aleatorio por Conglomerados III
Características:
•El cálculo del error estándar es complejo
•Se utiliza en estudios que abarquen amplias
zonas geográficas o cuando es difícil conseguir
la lista de elementos
•Los conglomerados son homogéneos entre sí
pero en cada conglomerado ocurre que los
elementos son heterogéneos.
Muestreo Aleatorio por
Conglomerados IV
Muestreo Aleatorio por
Conglomerados V
Muestreo Aleatorio Simple Muestreo Aleatorio por
Conglomerados
Inferencia Estadística
Inferencia Estadística
Información de la
Estimador
Muestra
Información de la
Parámetro
Población
Estimador
• Estimador: es el estadístico muestral
usado para estimar un parámetro de
población.
• Parámetro: valores de población.
• El estimador puede ser:
– Puntual
– Por intervalo
Estimador. Análisis de la media
POBLACIÓN Tamaño 5 elementos
Tiempo de trabajo
Sr. Perez 20
Sr. Ramos 22
Sr. Miranda 24
Sr. López 26
Sr. Namuche 28
Tiempo de trabajo
Sr. Perez 20
Sr. Ramos 22
Sr. Miranda 24
Sr. López 26
Sr. Namuche 28
MUESTRA Tamaño: 2 elementos
Sr. Perez Sr. Ramos

Sr. Perez Sr. Miranda
Sr. Perez Sr. López
Sr. Perez Sr. Namuche
Sr. Ramos Sr. Miranda
Sr. Ramos Sr. López
Sr. Ramos Sr. Namuche
Sr. Miranda Sr. López
Sr. Miranda Sr. Namuche
Sr. López Sr. Namuche
Tiempo de trabajo
Sr. Perez 20
Sr. Ramos 22
Sr. Miranda 24
Sr. López 26
Sr. Namuche 28
Sr. Perez Sr. Ramos 20 22

Sr. Perez Sr. Miranda 20 24
Sr. Perez Sr. López 20 26
Sr. Perez Sr. Namuche 20 28
Sr. Ramos Sr. Miranda 22 24
Sr. Ramos Sr. López 22 26
Sr. Ramos Sr. Namuche 22 28
Sr. Miranda Sr. López 24 26
Sr. Miranda Sr. Namuche 24 28
Sr. López Sr. Namuche 26 28
Media Muestral
Sr. Perez Sr. Ramos 20 22 21
Sr. Perez Sr. Miranda 20 24 22
Sr. Perez Sr. López 20 26 23
Sr. Perez Sr. Namuche 20 28 24
Sr. Ramos Sr. Miranda 22 24 23
Sr. Ramos Sr. López 22 26 24
Sr. Ramos Sr. Namuche 22 28 25
Sr. Miranda Sr. López 24 26 25
Sr. Miranda Sr. Namuche 24 28 26
Sr. López Sr. Namuche 26 28 27
Media Muestral f
21 1
22 1
23 2
24 2
25 2
26 1
27 1
Elementos Grupos de Combinaciones
10 4 210
POBLACION
11 Muestra em1 em2 em3 em4 Media Muestral
13 1 1 2 3 4 11 13 12 14 12.50
12 2 1 2 3 5 11 13 12 16 13.00
14 3 1 2 3 6 11 13 12 17 13.25
16 4 1 2 3 7 11 13 12 15 12.75
17 5 1 2 3 8 11 13 12 10 11.50
15 6 1 2 3 9 11 13 12 13 12.25
10 7 1 2 3 10 11 13 12 12 12.00
13 8 1 2 4 5 11 13 14 16 13.50
12 Henry Palomino: 9 1 2 4 6 11 13 14 17 13.75
… …
PROMEDIO
10 1 2 4 7 11 13 14 15 13.25
13.30 11 1 2 4 8 11 13 14 10 12.00
207 6 7 8 10 17 15 10 12 13.50
EL PROMEDIO DE TODAS LAS 208 6 7 9 10 17 15 13 12 14.25
MEDIAS MUESTRALES COINCIDE 209 6 8 9 10 17 10 13 12 13.00
210 7 8 9 10 15 10 13 12 12.50
CON LA MEDIA DE LA POBLACIÓN.
ENTONCES LA MEDIA ES UN Henry Palomino:
PROMEDIO DE TODAS LAS
ESTIMADOR INSESGADO. MEDIAS MUESTRALES 13.30
Histograma
Li Ls Frecuencia F. Relativa 25.00%
11.25 11.73 5 2.38%
11.74 12.22 14 6.67% 20.00%
12.23 12.71 29 13.81%
12.72 13.20 42 20.00%
Frecuencia
15.00%
13.21 13.69 45 21.43%
13.7 14.18 38 18.10% 10.00%
14.19 14.67 24 11.43%
14.68 15.16 10 4.76% 5.00%
15.17 15.65 3 1.43%
210 100.00% 0.00%
11.73 12.22 12.71 13.20 13.69 14.18 14.67 15.16 15.65
Clase
Curtosis -0.43852791
Coef. Asimetría 0.038087304
LA MEDIA MUESTRAL SIGUE UN

COMPORTAMIENTO DE CURVA NORMAL
Estimador Puntual
• Insesgado: es decir que tenga sesgo nulo.
Ejemplo: la media aritmética de la muestra es
el estimador insesgado de la media
poblacional.
Insesgado no significa que no tenga error de

estimación.
Estimador Puntual
Consistente: un estimador es consistente
cuando al aumentar el tamaño de la muestra,
el valor del estimador se acerca al parámetro
de población. Esto indica la teoría pero no
siempre conviene aumentar el tamaño de la
muestra.
Estimador Puntual
Eficiente: en caso que en una muestra se tenga
más de un estimador para la estimación de un
parámetro, se escogerá al estimador que tenga
una menor desviación estándar en su forma de
distribución.
Como se puede observar las dos distribuciones tienen un mismo valor en el parámetro sólo que
la distribución muestral de medias tiene una menor varianza, por lo que la media se convierte en
un estimador eficiente e insesgado.
Estimador por Intervalo de Confianza
• La estimación se realiza con los datos de muestra,
la cual se espera que tenga error en cuanto al
cálculo de los parámetros de población. Por eso
las estimaciones se pueden presentar en forma
de intervalo, de tal manera que dentro del
intervalo se encuentra el parámetro de población
que se quiere encontrar. Ej. Si en la muestra, el
cálculo de preferencia de cierto candidato es de
20%, se puede establecer un error de 5%, de tal
forma que: 20% ± 5%
Intervalo de Confianza para Media
Poblacional
• Poblaciones Infinitas:
Poblacional
• Poblaciones Finitas:
Poblacional
Ejemplo: En un determinado pueblo de 500
habitantes, una muestra aleatoria de 35
personas mostró que pasaban alrededor de 2.3
horas por día viendo TV, con una desviación
típica de 0.8 horas. Fijar un intervalo de
confianza de 90% para el tiempo medio de ver
TV en dicha población.
IC= 2.3 ± √(500-35)/ √(500-1)*1.64* 0.8/ √35
IC= 2.3 ± 0.21 => 2.09 y 2.51
Nivel o Grado de Confianza
• El grado de confianza es la probabilidad a priori de que el
intervalo de confianza a calcular contenga al verdadero valor
del parámetro
• El grado de confianza viene a expresar que los resultados
obtenidos a partir de un método funcionan correctamente el
x% de los casos.
Ejemplo. De una muestra, mi IC es 200 – 300 calculado con un
nivel de confianza de 95% . Esto significa que, tengo un 95%
de certeza que dicho intervalo contenga el verdadero
parámetro.
Pero de 100 muestras analizadas 95 estarán contienen el
verdadero parámetro
• Es un porcentaje, por ejemplo grado de confianza de 95%,
99%, etc.
Nivel (Grado) de confianza K

99.73% 3.00
99.00% 2.58
98.00% 2.33
96.00% 2.05
95.45% 2.00
95.00% 1.96
90.00% 1.64
80.00% 1.28
68.75% 1.00
50.00% 0.67
200 X 300
Error de estimación o error muestral
Al trabajar con muestras, es inevitable que los
estimadores presente un “error de estimación”
con respecto a los parámetros de población.
Entonces el error es el valor que indica cuanto
se ha acercado mi estimador al parámetro de
población.
Error de estimación – Nivel de
Confianza
Se puede establecer una probabilidad para cada
error de estimación. Esta probabilidad indica la
cantidad de veces en muestreo en que se exige
que el error de estimación sea menor a un valor
establecido.
Normalmente se aplicará a β, una probabilidad

de 1-α=95% (Nivel de confianza)
Error de estimación – Tamaño de
muestra
Para un error de estimación establecido, y una
probabilidad para ese error, se tiene un tamaño
de muestra que cumple con las dos condiciones
antes mencionadas. Esto sea un error y un nivel
de confianza se puede calcular un tamaño de
muestra en base al error y al nivel de confianza.
Así se tiene las siguientes fórmulas de tamaño
de muestra, para el estimador de media
muestral:
muestra – Media Muestral
Población infinita
Población finita
muestra – Media Muestral
Si se tiene la muestra , se puede calcular el error
de estimación:
Población infinita
√𝑆𝑆 2
𝜀𝜀 = ±𝑘𝑘 ×
√𝑛𝑛
Población finita
𝑁𝑁−𝑛𝑛 √𝑆𝑆 2
𝜀𝜀 = ±� × 𝑘𝑘 ×
𝑁𝑁−1 √𝑛𝑛
Ejercicio I
Un gabinete de investigación llevó a cabo un estudio para
conocer el tiempo medio dedicado a ver la televisión por los
habitantes de mayor edad de una determinada ciudad.
Consultando el censo se observa que el universo de interés
asciende a 250,000 personas.
Se dispuso de un presupuesto de S/. 30,000 para el trabajo de
campo, a razón de S/. 10 por entrevista. Los resultados del
estudio indicaron que el tiempo medio diario es de 220
minutos y que la desviación típica, en la misma muestra, es de
60 minutos.
Calcular el error muestral y el intervalo de confianza del
estudio.
Solución:
Ejercicio I
N=250,000 (Población Infinita)
Tamaño de muestra supedita al presupuesto económico.
No se indica el k (utilizaremos el mas utilizado NC 95% k=1.96)

Error muestral
IC = 220 ± 2.15 → 217.85 – 222.15

Ejercicio II
• Una cadena de TV desea conocer el consumo
medio de TV (horas/día) de una población con
350,000 habitantes. Se elige una muestra
aleatoria obteniéndose un promedio de 3h/día.
Teniendo en cuenta que la varianza vale 625
(horas/día) y que se dispuso de un presupuesto
de S/. 18,000 (S/.6 por encuesta) calcular:
– El tamaño de la muestra
– El error muestral con NC de 90%, 95% y 99%
– El IC con NC de 95.5%
Solución:
Ejercicios II
N=350,000 (Población Infinita)
Tamaño de muestra supedita al presupuesto económico.
- NC 90% k=1.64
Error muestral
- NC 95% k=1.96
Ejercicio III
El administrador de un centro recreativo local pretende
determinar el tiempo promedio que dedica cada cliente
en transportarse de su hogar al centro recreativo, y
viceversa. Con base a los resultados, planea aumentar las
tarifas de entrada. El administrador señala que los
clientes que viven cerca del centro recreativo no gastan
nada en transporte. Por otra parte los que no viven cerca
tienen que recorrer unos 20 Km, con un gasto de 0.20
soles por km. El administrador requiere una confianza de
95% en los resultados y que el error no exceda de ± 0.10.
Que tamaño de muestra debe usar el administrador para
determinar los gastos promedio de transporte?
Ejercicios III
Población Infinita
Mínimo gasto =0
Maximo gasto = 0.2×20=4 soles
4−0
𝑠𝑠 = = 0.67 Una aproximación burda de la desviación estándar
6
es asumir que el rango o amplitud de los datos es aproximadamente
6 veces la desviación estándar.
1.962 ∗ 0.67
𝑛𝑛 = = 171
0.12
Ejercicios IV
Se plantea una encuesta para determinar el
tiempo promedio que los estudiantes de nivel
de secundaria ven la televisión. Un estudio
piloto indicó que el tiempo medio por semana
es de 12 horas, con una desviación típica de 3
horas. Se desea estimar el tiempo medio dentro
de un cuarto de hora, utilizando el NC de 0.95
¿Cuántos estudiantes deben incluirse en el
estudio?
Ejercicios V
Se ha de calcular el tiempo medio, medido
en días al año, que le toma a los
vendedores para realizar actividades en
oficina. Se utilizará el grado de confianza de
90%. La media de un estudio piloto pequeño
fue de 150 días, con una desviación estándar
de 14. Si se desea calcular la media poblacional
en relación con 2 días, ¿Cuántos vendedores
deberían muestrearse?
Ejercicios VI
El propietario de una gasolinera desea estimar el
número medio de galones de combustible que
vende a sus clientes. De sus registros selecciona una
muestra de 60 ventas y concluye que el número
medio de galones vendidos es 8.60, con una
desviación estándar de 2.3 galones.
a. ¿Cuál es la estimación de la media poblacional?
b. Establezca un intervalo de confianza del 99%
para la media poblacional.
Inferencia Estadística II
Proporciones
1
Significado de p
Parámetro Estimador
• p: es la proporción de la característica, objeto

de análisis, en el universo.
• : es la proporción de la característica, objeto
de análisis, en la muestra.
2
Tamaño de muestra - Proporciones
• Población Infinita
• Población finita
3
Intervalo de Confianza
• Población infinita
𝑝𝑝̅ 𝑞𝑞�
𝐼𝐼𝐼𝐼 = 𝑝𝑝̅ ± 𝑘𝑘 ∗ �
𝑛𝑛
𝑁𝑁 − 𝑛𝑛 𝑝𝑝̅ 𝑞𝑞�
𝐼𝐼𝐼𝐼 = 𝑝𝑝̅ ± � ∗ 𝑘𝑘 ∗ �
𝑁𝑁 − 1 𝑛𝑛
4
Error de Estimación
• Población infinita
𝑝𝑝̅𝑞𝑞�
𝜀𝜀 = ±𝑘𝑘 ∗ �
𝑛𝑛
𝑁𝑁 − 𝑛𝑛 𝑝𝑝̅ 𝑞𝑞�
𝜀𝜀 = ±� ∗ 𝑘𝑘 ∗ �
𝑁𝑁 − 1 𝑛𝑛
5
Significado de q
• q: es la proporción complementaria (a 100%) de la
característica objeto de análisis en el universo o en la
muestra.
Ejemplo:
– Si se sabe que la probabilidad de compra de un cliente es
30%, el complemento es 100%-30%=70%, que significa que
la probabilidad que no realice una compra es de 70%
• Cuando se desconoce, se utiliza el valor de 50%, y se
dice que es el caso de máxima indeterminación.
• En las formulas se utiliza los equivalentes en decimales
6
Máxima Indeterminación
p q p*q
10% 90% 0.09
20% 80% 0.16
30% 70% 0.21
40% 60% 0.24
50% 50% 0.25
60% 40% 0.24
70% 30% 0.21
80% 20% 0.16
90% 10% 0.09
7
NC=95% y n=1,000
p q p*q K n ε
10% 90% 0.09 95% 1000 1.9%
20% 80% 0.16 95% 1000 2.5%
30% 70% 0.21 95% 1000 2.8%
40% 60% 0.24 95% 1000 3.0%
50% 50% 0.25 95% 1000 3.1%
60% 40% 0.24 95% 1000 3.0%
70% 30% 0.21 95% 1000 2.8%
80% 20% 0.16 95% 1000 2.5%
90% 10% 0.09 95% 1000 1.9%
8
Determinación de p y q
Ejemplo 1: Lanzar una moneda y queremos
que salga cara; p= 50% y q=50%, es decir en
este experimento per se es de máxima
indeterminación.
Ejemplo 2: De un grupo de 10 alumnos, 7
están aprobados y 3 desaprobados. Para este
grupo p=70% (o p=0.7) y q=30% (q=0.3)
9
Intervalo de Confianza – Proporciones
Ejemplo I
Se quiere estimar el resultado de un referéndum
mediante una encuesta. Para ello se realiza un
muestreo aleatorio simple con n=100 personas y
se obtienen 35% que votarán a favor de cierta
ley y 65% que no votarán a favor. Con un nivel
de confianza del 95%, calcule un intervalo de
confianza para el verdadero resultado de las
elecciones.
Solución:
10
Ejemplo I
Población Infinita
NC 95% k=1.96
Error muestral
IC = 35% ± 9.35% → 25.65% - 44.35%
11
Ejemplo II
La Encuesta Nacional de Micronegocios reportó
que un 16 por ciento de los 1,948 micronegocios
entrevistados eran propiedad de mujeres. ¿Cuál
es el intervalo de confianza para la población si
desea tener un 99.73% de confianza?
Solución:
12
Ejemplo I
Población Infinita
𝑝𝑝̅ = 0.16; 𝑞𝑞� = 0.84
𝑛𝑛 = 1,948
NC 99.73% k=3
Error muestral
�𝑝𝑝̅ × 𝑞𝑞� √0.16 × 0.84
𝜀𝜀 = ±𝑘𝑘 × 𝜀𝜀 = ±3 × = ±0.0249
√𝑛𝑛 √1,948
IC = 16% ± 2.49% → 13.51% - 18.49%
13
Ejemplo II
Tomada, al azar, una muestra de 120
estudiantes de una universidad, se encontró
que 54 de ellos hablaban inglés. Halle, con
un nivel de confianza del 90%, un intervalo
de confianza para estimar la proporción de
estudiantes que hablan el idioma inglés
entre los estudiantes de esa Universidad.
Solución:
14
Ejemplo II
Población Infinita
NC 90% k=1.64
Error muestral
IC = 45% ± 7.45% → 37.55% - 52.45%
15
Tamaño de la muestra - Proporciones
• Al igual que en el caso de la media como
estimador, existe una relación entre el ε (error
muestral) y el tamaño de la muestra n.
• Poblaciones Infinitas
• Poblaciones Finitas
16
Tamaño de muestra – Proporciones
Ejemplo I
Se desea conocer el tamaño de la muestra necesario para
realizar una encuesta a la población mayor de 18 años, con
objeto de medir el voto de las próximas elecciones
municipales. El error máximo permitido es del 2.5% y se
supone un grado de confianza del 95%.
1. ¿Cuál es el tamaño de la muestra?
2. Si el error se estableciese en 2% ¿Cuál es el tamaño de la
muestra?
3. Si el grado de confianza fuese del 95.45% ¿Cuál es el
tamaño de la muestra?
4. Si el grado de confianza fuese del 99% y un error permitido
de 1% ¿Cuál es el tamaño de la muestra?
Solución:
17
Ejemplo I
Población Infinita
Máxima indeterminación ε=2.5%
NC 95% k=1.96
1. Tamaño muestra
2. ε=2%
18
Ejemplo I
Población Infinita
Máxima indeterminación ε=2.5%
NC 95% k=1.96
3. NC 95.45%
4. NC 99% ε=1%
19
Ejemplo II
En una muestra aleatoria de 300 personas mayores de
edad de una gran ciudad se encontró que 105 leían un
determinado periódico X. A la vista de esos datos se
pretende seleccionar una nueva muestra para conseguir
una cota de error de 3 centésimas como máximo, con un
nivel de confianza del 95%, para la estimación de la
proporción de lectores de ese periódico por medio de un
intervalo de confianza. Deduzca el número de individuos
de la población que, como mínimo, debe tener la
muestra.
Solución:
20
Ejemplo II
Población Infinita
ε=3%
NC 95% k=1.96
Tamaño muestra
21
Ejemplo III
Se desea realizar una encuesta entre la
población juvenil de una determinada localidad
para determinar la proporción de jóvenes que
estaría a favor de una nueva zona de ocio. El
número de jóvenes de dicha población es
N=2,000. Determinar el tamaño de muestra
necesario para estimar la proporción de
estudiantes que están a favor con un error de
estimación de 0.05 y un nivel de confianza del
95%. 22
Ejercicio I
María Wilson considera ser candidata para la
alcaldía de la ciudad. Antes de presentar su
candidatura, decide realizar un estudio entre los
electores de la ciudad. Una muestra de 400
reveló que 300 ciudadanos la apoyarían en la
elección. Calcule el intervalo de confianza del
99% para la proporción de votantes en la
población que apoyaría a la Sra. Wilson.
23
Ejercicio II
Se ha de calcular la proporción de contadores
públicos que han cambiado de compañía en tres
años dentro del 3%. Debe utilizarse el grado de
confianza de 95%. Un estudio anterior reveló que el
porcentaje de dichos profesionales era 21%.
• Determine el tamaño de muestra para este
estudio
• Si no tuviera información previa ¿Cuántos
contadores formarían parte del estudio?
24
Ejercicio III
Se desea realizar una encuesta para determinar
la proporción de la fuerza laboral que tiene dos
o mas empleos. Utilizamos un NC de 95% y que
la población estimada debe estar dentro del 2%
de la proporción de la población. Un estudio
piloto reveló que 5 de las 50 personas
muestreadas tienen 2 o mas empleos. ¿Cuántos
integrantes deben ser entrevistados para
cumplir las condiciones planeadas?
25
S3Wl~V'S3~dll'G SV':)ll'g'lf\131-V'li'J
420 Estadistica para Administraci6n y Economia
Z= x-µ = 80-87 =-l 2?

a/ /;i 22/ ../16 ·
p(X > 80) = p(Z > - 1.27) = 0.5+ p(O < Z < 1.27) = 0.8980
p(X > 80) = 0.8980
Por lo tanto, la probabilidad de que la media sea mayor que 80
minutos es de 0.8980 6 89.80%.
d) p(85<X<95)=?
~~~~~~~~~~~~~~-t---~~~~~~-- x
85 87 95
- 0.36 0 1.45
x; -µ 85-87
z1 =a/ .J;i = 22/ ../16· =-0.36
x -µ 95-87
Z2 = a/ .J;i = 221.J16=1.45
2
p(85 < x < 95) = p( - 0.36<z<1.45)

p(85 < X < 95) = p(O < Z < 0.36)+ p(O < Z < 1.45) =0.5671
p(85 < x < 95) = 0.5671
Por lo tanto, la probabilidad de que la media este entre 85 y 95
minutos es de 0.5671656.71% .
7. Se plantea una encuesta para determinar el tiempo promedio que los
ejecutivos de una corporaci6n ven la television. Un estudio piloto
indic6 que el tiempo medio por semana es de 12 horas, con una
desviaci6n estandar de 3 horas. Se desea estimar el tiempo medio
dentro de un cuarto de hora, utilizando el grado de confianza de
0.95. z,Cuantos ejecutivos deben incluirse en el estudio?
Solucion
µ = 12 a =3 e = 0.25 I.C. = 95%
Muestreo y distribuciones muestrales 421
n =?
95%
z
-1 .96 0 l.96
Z!0"2 (1 96)2 (3)2

2
n =- 2
- = · 0
= 553.19 = 554
e (0.25t
Por lo tanto, el numero de ejecutivos que deben incluirse en la
muestra es de 554.
8. Un procesador de zanahorias corta la parte superior verde de cada
una, !as lava luego y coloca seis par paquete. Se colocan veinte
paquetes en una caja para su envio. Se revisan algunas cajas para
determinar su peso. El peso promedio fue de 20.4 libras y la
desviaci6n estandar de 0.5 libras. lCuantas cajas debe muestrear el
procesador para tener un 95% de seguridad de que la media muestral
no difiera de la media poblacional en mas de 0.2 libras?
Solucion
µ = 20.4 (J = 0.5 e = 0.20 I.C. = 95% n= ?
95%
- 1.96 0 l.96
2 a2 ()2
n = -2__ (1,96)2 (0.5)2 =25
e2 2
(0.20)
Por lo tanto, el numero de cajas que deben incluirse en la muestra
es de 25 .
9. Se ha de calcular el numero medio de dias de viaje al afio en el caso

de vendedores foraneos . Se utilizara el grado de confianza de 0.90.
La media de un estudio piloto pequefio fue de 150 dias, con una
desviaci6n estandar de 14. Si se debe calcular la media poblacional
en relaci6n con 2 dias, (,Cuantos de tales vendedores deberian
muestrearse?
Solucion
µ = 150 a = 14 e=2 J.C . = 90%
n =?
90%
_!_
--'-
71 150 x,,-
''
-1.645 0 1.645
2 2
(1.645) (14)
n= 1
=132.59:::::133
(2r
Por lo tanto, el numero de vendedores que deben muestrearse es
de 133.
10. Se llevara a cabo una encuesta de muestreo para detenninar el
ingreso familiar medio en cierta area. La pregunta es, (,Cuantas
familias deben ser muestreadas? A fin de obtener mayor informaci6n
acerca del area, se realiz6 un peque:fio estudio piloto y se calcul6 la
desviaci6n estandar de la muestra en $500. El patrocinador de la
encuesta desea que se utilice el grado de confianza de 0.95. La
estimaci6n debe estar dentro de $100. (,Cuantas familias deben ,ser
entrevistadas?
Solucion
a = 500 e = 100 I.C. = 95%
n =?
z2a2
2 2
; (1,96) (500)
n = -- - = ::::: 97.00
2
e (100) 2
Por lo tanto, el numero de familias que deben muestrearse es de 97.
S3Tlflt!VS3tldLl\l3 SV::llll;ILl\l3J_l;ILl\I
EJERCICIOS RESUELTOS
1. Una muestra de 49 observaciones se toma a partir de una poblaci6n
nonnal. La media muestral es 55, y la desviaci6n estandar de Ja
muestra es 10. Determine el intervalo de confianza del 99% para la
media de la poblaci6n.
Solucion
Datos:
x = 55 s = lO N.C. =99% n=49
0.495 0.495
-2.576 0 2. 576 z
Para un area de0.495 Z = ±2.576 , obtenido al interpolar en
la tabla normal.
I.C.=[x - E, .x+E]
z s
% (2.576)(10) ,,
E = .j;; = J49 = .) .68
/.C.=[55 - 3.68, 55+3.68]=[51.32, 58.68]
Por lo tanto, el intervalo de confianza al 99% para la media de la
poblaci6n es [ 51.32, 58.68] .
2. El propietario de una gasolinera desea estimar el numero medio de
galones de combustible que vende a sus clientes. De sus registros
selecciona una muestra de 60 ventas y concluye que el numero
medio de galones vendidos es 8.60, con una desviaci6n estandar de
2.30 galones.
a) £,Cual es la estimaci6n de la media poblacional?
b) Establezca un intervalo de confianza del 99% para la media
poblacional.
Estimaci6n puntual y par intervalo 481·
Soluci6n
Datos:
x = 8.60 s = 2.30 N.C. = 99% n=60
a) µ = ?
µ = 8.60
Por tanto, la estimaci6n de la media poblacional sera de 8.60.
b)
0.495 0.495
-2.576 0 2.576 z
Para un area de 0.495 :::::> Z =±2.576. por interpolaci6n.
J.C.= [x-E,x +E]
E = (2.576)(2.30) = 0.
765
160
J.C.= [8.60-0.765, 8.60 + 0.765] = [7.835, 9.365]
Por tanto, el intervalo de confianza al 99% para ia media de los
galones de combustible vendidos es [7.835, 9.365].
3. Asistieron 400 espectadores a un partido de la liga menor de beisbol.
Una muestra aleatoria de 50 espectadores reve16 que el numero
medio de bebidas gaseosas que consumieron, fue de 1.86 con una
desviaci6n estandar de 0.50. Establezca un intervalo de confianza
de! 99% para el numero medio de refrescos consumidos.
Solucion
Datos:
x == 1.86 s == 0.50 N.C . = 99% n=50
- - - · .. ~,. ,,... ..., .. , ,,,.,..., r"l.Jl""\ 1 1 \..JI Al :J 1\.111\I
482
Estadistica para Administraci6n y Economia
0.495 0.495
x
- 2. 76 0 2. 76 z
Para un area de 0.495 :::::> Z = ±2.576, por interpolaci6n.
l.C. = [x-E, x +E]
E = Zas ~
2 f N -n = (2.576)(0.50)
J;; VN -1 EfJ
s 400 - 50
400 - 1
E = 0.1705
J.C. = [1.86-0.1705, i.86 + 0.] 705] =[1.6895, 2.0305]
Por tanto, el intervalo de confianza al 99% para el numero medio
de refrescos consumidos es [1 .6895, 2.0305].
4. Una muestra aleatoria de 85 dirigentes de grupo, supervisores y
personal similar en una empresa revel6 que, en promedio, una
persona permanece 6.5 afios en el puesto antes de que se le
promueva. La desviaci6n estandar fue 1.7 afios. Elabore un intervalo
de confianza de! 95% para el tiempo promedio poblacional.
Solucion
Datos:
x = 6.5 s = l .7 N.C. = 95% n = 85
0.475 0.475
µ
~1 x
-1.96 0 1.96 z
11 . Maria Wilson considera ser candidata para la alcaldia de la ciudad
de Arequipa, Peru. Antes de presentar su candidatura, decide
realizar un sondeo de electores en dicho lugar. Una muestra de 400
revel6 que 300 ciudadanos la apoyarfan en Ja elecci6n. Calcu1e el
intervalo de confianza del 99% para la proporci6n de votantes en la
poblaci6n que apoyarfa a la Sra. Wilson. O· (,"I 'I - o.( O{,
12. Suponga que una cadena de television planea sustituir uno de sus
programas que se transmite en el horario con mayor nt'.i.mero de
telespectadores, con una nueva comedia dirigida al pt'.i.blico familiar.
Antes de que se tome una decision final, se elige una muestra
aleatoria de 400 televidentes que acostumbran presenciar la
television durante dicho horario. Despues de ver un preprograma de
la comedia, 250 de !as personas indicaron que si la verian. Defina
un intervalo de confianza del 95% para la proporci6n de publico
que vera el nuevo espectaculo. () . .f !) (?. '1 j~
/
13. ~ay 300 soldadores empleados en la empresa Maine Shipyards
C~or~·- Un,a n~~~stra de 30 revel? que 18 se graduaron en un curso
. kcmco es~~c1a1. Establezca un mtervalo de confianza de] 95% Dara
la proporcion de soldadores egresados de dicha preparaci6n. O·
'{J3V- 0. ~I, b'1
14. De 900 consumidores que se entrevistaron, 414 sefialaron que estan
muy entusiasmados con un nuevo proyecto de decoraci6n para el
hogar. Elabore el intervalo de confianza de! 99% para la proporci6n
de la poblaci6n. O. l/ 11- - O. fOJ
15. Un banco tiene 650 clientes con cuenta de cheques. Una muestra
reciente de 50 de ellos mostr6 que 26 poseen la tarjeta de credito
que maneja el banco. Fije el intervalo de confianza del 99% para la
proporci6n de clientes con cuenta de cheques que disponen de la
tarjeta de credito citada. O· J'lf -O .,'i)·
17.Sup6ngase que el presidente de un pais desea un estimado de la
proporci6n poblacional que apoya su politica actual con respecto a: ·
una naci6n pequefia como Haiti. Tal funcionario desea que el calculo
se encuentre dentro de 0.04 de 1a proporci6n verdadera. Suponga uri
nivel de confianza del 95%. El Secretario de Estado de gobiemo ·
estim6 la proporci6n dei apoyo a la politica actual en 0.60.
a) L,Que tamano se requiere para la rnuestra? S ~~
b) L,De gue tamafio tendria que ser la muestra si el calculo del
Secretario de Estado no estuviera disponible? C, o l
18.Suponga que usted planea realizar una encuesta para determinar la

proporci6n de ia fuerza labora1 que tiene dos o mas empleos. Utiliza
el grado de confianza de 0.95 y establece que la proporci6n estimada
debe estar dentro del 2% de la proporcion de la poblaci6n. Un
estudio piloto revel6 q'ue 5 de !as 50 personas muestreadas tienen
dos o mas empleos. L,Cuantos integrantes de tal grupo deben ser
entrevistados para cumplir con las condiciones planteadas? ~ c,5
19.Se ha de calcular ia proporci6n de contadores publicos que han
cambiado de compafiia en tres afios dentro de! 3%. Debe utilizarse el
grado de confianza de 0.95. Un estudio realizado hace varios afios
reve16 que el porcentaje de dichos profesionales era 21.
a) Para actualizar tal estudio, t,cuantos archivos de contadores
publicos deben estudiarse? ·... · ':lo q
b) Si no existiera informaci6n previa, la cuantos contadores se
recurriria? Job f
20. El portavoz en el Congreso de un partido politico quiere estimar la

proporci6n de diputados que estarian a favor de una polemica
proposici6n de ley. Su intenci6n es construir un intervalo de confianza
de! 99% cuya arnplitud maxima a cada lado de la media muestral sea
de 0,05 . (,Cuantas observaciones muestrales son necesarias? ' b 'f
.
EJERCICIOS DE AFIJACIÓN DE LA MUESTRA EN BASE A LOS ESTRATOS DE LA POBLACIÓN
1. Se desea investigar “las motivaciones por las que una persona optó por el comercio ambulatorio”
para lo cual se ha establecido determinar una muestra representativa. Así, se tienen los siguientes
cuadros relacionados con la población objeto de estudio (ver cuadros 1.1, 1.2 y 1.3). Además, se ha
establecido un nivel de confianza para la muestra de 0.99 y un margen de error de 3%.
Cuadro 1.1. Cuadro 1.2. Cuadro 1.3.

Sexo Total Edad Total Nivel de educación Total
Hombre 75,900 De 14 a 24 años 13.00% Inicial/Primaria 22.00%
Mujer 224,100 De 25 a 44 años 50.70% Secundaria 57.10%
De 45 a 64 años 29.10% Superior no universitaria 13.90%
De 65 a más años 7.20% Superior universitaria 7.00%
Solución:
N > 100,000
k= 2.58
p= 50%
q= 50%
e= 3%
Superior no Superior
Inicial / Primaria Secundaria
n= 1,849 universitaria universitaria
22% 57.1% 13.9% 7%
H M H M H M H M
Edad % 25.30% 74.70% 25.30% 74.70% 25.30% 74.70% 25.30% 74.70%
De 14 a 24 años 13.00% 13 40 35 103 8 25 4 13
De 25 a 44 años 50.70% 52 154 135 400 33 97 17 49
De 45 a 64 años 29.10% 30 88 78 230 19 56 10 28
De 65 a más años 7.20% 7 22 19 57 5 14 2 7
2. En el establecimiento del tamaño de muestra para medición de rating, la empresa IBOPE considera
la proporción de hogares con televisor y la proporción de hogares sin televisor. Siguiendo esta
condición, se le pide establecer una muestra representativa para la medición de rating en Lima
metropolitana, considerando un error de 0.8% y un nivel de confianza de 95%. Para ello considere
los siguientes datos (ver la información en los cuadros 1).
Población Lima
Con TV 7,680,000
Sin TV 320,000
Edad Cantidad Sexo % NSE %

Menores de 18 años 2,800,000 H 50% AB 7.10%
Entre 18 y 20 años 400,000 M 50% C 25.90%
Entre 21 y 30 años 1,440,000 D 37.80%
Entre 31 y 30 años 1,120,000 E 29.20%
Entre 41 y 50 años 960,000
1
La información en los cuadros ha sido modificada para efectos de este examen. Los datos exactos los podrán
encontrar en los canales oficiales disponibles en web.
Mayores a 50 años 1,280,000
SOLUCIÓN
Población %
Con TV 7,680,000 96%
Sin TV 320,000 4%
8,000,000
k 1.96
e 0.80%
p 96%
q 4%
n 2304.96
Redondeando 2305
Hombres
Hombres 50% 1153
Mujeres 50% 1152 NSE
7.10% 25.90% 37.80% 29.20%
Edad Población % 35% 29 105 153 118 405
Menores de 18 años 2,800,000 35% 5% 3 15 22 17 57
Entre 18 y 20 años 400,000 5% 18% 15 54 78 61 208
Edad
Entre 21 y 30 años 1,440,000 18% 14% 11 42 61 47 161

Entre 31 y 30 años 1,120,000 14% 12% 9 36 52 40 137
Entre 41 y 50 años 960,000 12% 16% 13 48 70 54 185
Mayores a 50 años 1,280,000 16% 1,153
Mujeres: se considera la misma

distribución de los hombres

Estadística - Fcom 2023

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadística - Fcom 2023

Cargado por

Copyright:

Formatos disponibles

• El porcentaje se puede expresar como una

Ejemplo: Hallar % de Mujeres que leen Diario 1.

1995 1996 1997 1998 1999

-Calcular el % de trabajadores con formación superior

Leen Diarios Leen Diarios (%)

14-23 24-33 34-43 44-54

Excelente Bueno Regular Malo Muy Malo

Sexo: Hombre Mujer

Ejemplo: Análisis de VARIABLE: SEXO

VARIABLE? VALORES DE LA VARIABLE?

Variable Frecuencias Frecuencias

Variable Frecuencias Frecuencias

Variable Frecuencias Frecuencias absolutos Frecuencias Frecuencias

Variable Frecuencias Frecuencias absolutos Frecuencias Frecuencias

Variable Frecuencias Frecuencias absolutos Frecuencias Frecuencias

Variable Frecuencias Frecuencias absolutos Frecuencias Frecuencias

1 863 12 1,255 23 1,442 34 829

1 863 11 1,317 21 1,347 31 719 41 1,226

1 863 11 1,317 21 1,347 31 719 41 1,226

La Amplitud en el ejemplo: A=1466-705=761

Mitad de los datos: N/2= 21/2= 10.5

El primer valor que supera 10.5 es 17, es decir que la mediana es

Nivel de Estudios Frec. Absolutas (n i ) Frec. Abs. Acum.(N i ) fi Fi

Se busca el valor de frecuencia relativa acumulada

El intervalo mediano, es 1,045 – 1,129; ya que

Intervalo modal: 150 - 159, f.a=5; f.r.= 25%

Liimo es el límite inferior del intervalo modal

Distanciamiento Simple: (simple resta con la media)

NO hay forma de ver cual es más disperso

Hay mayor dispersión en el

Los datos van desde 0 hasta 14

Media: 13.18; N=28

Frecuencia Nota – Media

Frecuencia Nota – Media

∑𝑛𝑛𝑖𝑖=1(𝑋𝑋𝑖𝑖 − 𝑋𝑋�)2 × 𝑛𝑛𝑖𝑖 ∑𝑛𝑛𝑖𝑖=1 𝑋𝑋𝑖𝑖2 × 𝑛𝑛𝑖𝑖

Del ejercicio la varianza es 3.36 y la desviación

• Objetivo del muestreo o de las encuestas por

•El objetivo de trabajar con encuestas por muestreo es

•En los casos en que la muestra no sea representativa

• Condiciones para realizar inferencias

Muestra sesgada: es una muestra no representativa y, por

Azar (aleatorio): No puede determinarse el suceso antes de que suceda

17 CHUNGA YESQUEN CARLOS ENRIQUE

18 CORONADO OLAYA ALANA DEL PILAR 47 REYES VASQUEZ ANTONIO JAFET

19 CRUZ HERRERA ANNIE LUCIA SOLANGE 48 RIVERA PALOMINO JHANDELYN STEFFANYA

20 ESPINOZA MEZA LYANNE JASMINE 49 ROJAS CORNEJO GONZALO

21 GARCIA GARCIA MAIRA ESTEFANI 50 RUBIO AZCARATE ANGGELA DE JESUS

22 GONZALES BENITES CECILIA EDITH 51 RUBIO CABRERA ANDREA DANIELA

23 GONZALES NUNCEBAY SULLON NANNERL S 52 SAAVEDRA COLAN ANA SOFIA

Asimismo, se divide a la población universitaria en 3

Ni es la población del estrato correspondiente

Es necesario conocer las desviaciones típicas (S o σ) de

Xi n n×Xi Xi-X (Xi-X)^2 n×(Xi-X)^2 Xi n n×Xi Xi-X (Xi-X)^2 n×(Xi-X)^2

Xi n n×Xi Xi-X (Xi-X)^2 n×(Xi-X)^2 Poblacion

La muestra estará compuesta por 9 elementos

Ci, es el costo por unidad de muestreo en el estrato i

Sr. Perez Sr. Ramos

Sr. Perez Sr. Ramos 20 22

LA MEDIA MUESTRAL SIGUE UN

Insesgado no significa que no tenga error de

Nivel (Grado) de confianza K

Normalmente se aplicará a β, una probabilidad