Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ingeniería Civil
Asignatura: Estadística Aplicada
MUESTREO
INVESTIGACIÓN CIENTÍFICA:
MÉTODO CIENTÍFICO:
ESTADÍSTICA E INVESTIGACIÓN
PROCESO DE INVESTIGACIÓN
Mala desición
Gráficos estadísticos
Cuadros de frecuencias
DEFINICIONES BÁSICAS
ESTADÍSTICA
Es una ciencia que nos ofrece un conjunto de métodos y
técnicas para:
Recolectar, Resumir, Procesar, Presentar, Analizar e Interpretar
un conjunto de datos, con la finalidad de conocer el problema,
proyectar su comportamiento y colaborar en la toma
decisiones sobre dicho problema.
DEFINICIONES BÁSICAS
DIVISIÓN DE LA ESTADÍSTICA
Estadística
POBLACIÓN (N)
DEFINICIONES BÁSICAS
VENTAJAS DEL MUESTREO:
a) Costos reducidos.
b) Mayor rapidez para obtener resultados.
c) Mayor exactitud o mejor calidad de la información, debido a los
siguientes factores
c.1 Volumen de trabajo reducido.
c.2 Puede existir mayor supervisión en el trabajo.
c.3 Se puede dar más entrenamiento al personal.
c.4 Menor probabilidad de cometer errores durante el procesamiento
de la información.
d) Factibilidad de hacer el estudio cuando la toma de datos implica :
Control de calidad.
Técnicas destructivas. Etc.
DEFINICIONES BÁSICAS
Población:
Muestra:
Es un subconjunto de elementos seleccionados convenientemente de
la población objetivo de tal manera que puede hacerse inferencias de
ella respecto a la población completa.
Es un conjunto de unidades seleccionadas de un marco muestral o de
varios marcos muestrales.
Error de muestreo
Es el error, originado por el hecho de inferir
características o propiedades para la población con
base en las observaciones de una muestra ( Diferencia
entre el parámetro y su estimador)
Es inherente a toda inferencia inductiva y se le
conoce también como el error inferencial
Censo
Censo Muestra
- Costoso - Un bajo costo
No Probabilístico o Probabilístico ò
No Aleatorio Aleatorio
San José
San Pablo
San Carlos
San Ricardo
San Roberto
San Benito
Santo domingo
San Pedro
Muestreo Aleatorio Simple
Ventajas del MAS Desventajas del MAS
•Sencillez conceptual
•Tedioso eligir todos los
•Necesita como marco números aleatorios si n es
muestral sólo una lista de grande
todos los elementos de la
población •No utiliza información
auxiliar sobre la población
•Es fácil calcular las •Necesita una lista completa
estimaciones de valores de los elementos de la
poblacionales población
•Es fácil calcular las •Puede tener baja precisión
estimaciones de precisión comparado con otros
(varianza muestral) métodos
Muestreo Aleatorio Simple
El MAS se puede realizar:
( n° de muestras:Nn ) ( n° de muestras:cN,n )
•Seleccionar una unidad
•Seleccionar una unidad
•“Sacarla” de la población
•“Reemplazarla” en la
•Seleccionar otra unidad de las que
población quedan y sacarla
•Seleccionar otra, de la •Continuar hasta obtener n unidades
población completa distintas
•Cada unidad puede estar incluida una
•Continuar hasta obtener una sola vez
muestra de tamaño n •Es más eficiente que el MASCR
•Se puede seleccionar la •Se usa en la práctica
misma unidad más que una
vez
Ejemplo del MAS
Encuesta de las empresas sobre Gastos en
insumos
Población completa
Empresa Gastos • Población de seis
1 $ 26,000 empresas (N = 6)
• Propósito: estimar
2 470,000
gastos para compras
3 63,800 de insumos
4 145,000 • Presupuesto permite
5 230,000 sólo una muestra de
dos empresas (n = 2)
6 12,500
Total 947,300
Muestras Gastos Estimación
posibles observados del total
(1,2) 496,000 1,488,000
(1,3) 89,800 269,400
(1,4) 171,000 513,000
(1,5) 256,000 768,000
(1,6) 38,500 115,500
(2,3) 533,800 1,601,400
(2,4) 613,000 1,845,000
(2,5) 700,000 2,100,000
(2,6) 482,500 1,447,500
(3,4) 208,800 626,400
(3,5) 293,800 881,400
(3,6) 76,300 228,900
(4,5) 375,000 1,125,000
(4,6) 157,500 472,500
(5,6) 252,500 727,500
15 muestras posibles promedio 947,300/6
ESTIMACION DEL TAMAÑO DE MUESTRA - “MAS”
VARIABLES CUANTITATIVAS
X
POBLACIÓN P= = Proporción poblacional
(N) N
Proporción muestral:
n
xi Xˆ ESTIMADOR DE
pˆ = = LA PROPORCION
i =1
n POBLACIONAL
n
MUESTRA
Clase Poblacional
Estimador del Total de
Xˆ = N pˆ
n
VARIANZA DE LA PROPORCION Y DEL TOTAL DE CLASE
MUESTRALES - “M.A.S”
PQ N − n pˆ qˆ N − n
V ( pˆ ) = n N − 1
VARIANZA DE LA
V ( pˆ ) = ˆ
PROPORCION
MUESTRAL n N −1
PQ N − n
( ) ˆ qˆ N − n
( )
2
VARIANZA DEL N
ˆ ˆ ˆ 2 p
ESTIMADOR DEL V X = V X =N
TOTAL DE CLASE n N −1 n N −1
n
donde: = f es la tasa muestral o fracción de muestreo
N
ESTIMACION DEL TAMAÑO DE MUESTRA - “MAS”
(VARIABLES CUALITATIVAS O DE ATRIBUTOS)
PQ N − n
Tenemos que: P pˆ − P Z = 1−
n N − 1
PQ N − n
Z pˆ e Z e
2 2
pˆ
2
Z 2
e 2
n N − 1
no
n e = d.P
1 + ( no − 1) , donde : no = Z PQ
2
d = error relativo
N e 2
aceptado (precisión)
MUESTREO SISTEMATICO
•Es otro muestreo que también le asigna igual probabilidad de
inclusión uniforme para todos, como el simple al azar.
•Nuevamente esta probabilidad es n/N.
•Es conveniente por su simplicidad ya que se necesita sólo un
número aleatorio.
•Fácil de seleccionar en campo o durante el operativo
•Se logra en general una muestra más “representativa” de la
población.
•No es necesario conocer el tamaño de la población N si se
conoce la fracción de muestreo.
•Origina muestras bien dispersas desde el punto de vista
geográfico.
•Se emplea generalmente en las últimas etapas en diseños en
varias etapas o más complejos.
¿Cómo se selecciona una muestra
sistemática?
➢1 ➢2 ➢3 ➢N
MUESTREO SISTEMATICO: Ejem. 1
➢Población de tamaño N = 30, muestras
posibles sistemáticas de tamaño n = 6.
➢Intervalo selección k = N / n = 30/6 = 5
➢Muestras posibles de tamaño n = 6 :
➢1ra muestra: 1 6 11 16 21 26
➢2da muestra: 2 7 12 17 22 27
➢3ra muestra: 3 8 13 18 23 28
➢4ta muestra: 4 9 14 19 24 29
➢5ta muestra: 5 10 15 20 25 30
Ejem. 2: Seleccionar muestra de n = 20
empresas de lista de N = 500 empresas
Esto significa que 1 de cada 25 empresas de la población se
seleccionará
Utilizando # al azar seleccionamos un número entre 1 y 25.
Suponga que el # seleccionado es 7.
Entonces la 1ra empresa. selecc. es el # 7.
Las otras 19 empresas de la muestra se obtienen sumando al 7
el intervalo de selección 25.
Es decir: 07, 32, 57 , ..........
Ejem.2 : La muestra de n = 20 empresas seleccionadas de
N = 500 empresas es:
➢07 32 57 82 107
➢132 157 182 207 232
➢257 282 307 332 357
➢382 407 432 457 482
POBLACION ESTRATOS
ESTRATO 1
(Empresas
grandes)
N1 n1
ESTRATO 2
(Empresas
medianas)
N2 n2
ESTRATO 3
(Empresas
pequeñas) N3 n3
L
Tal que, N = N1 + N 2 + N 3 N = Nh
h =1
L
n = n1 + n2 + n3 n = nh
h =1
ESTRATIFICACION DE LA POBLACION DE 267,694
CLIENTES (EDELNOR)
n1 + n2 + n3 + ..... + nL = n
1. AFIJACION PROPORCIONAL
Nh
nh = n = nWh
N
nh N h nh n
= o = o fh = f
n N Nh N
2. AFIJACION DE NEYMAN ( O DE MINIMA VARIANZA)
N S
nh = n L h h
N h Sh
h =1
2
donde : S : cuasivarianza poblacional del estrato h
h
3. AFIJACION DE OPTIMA
nh = n L
Ch estrato h (costo unitario)
N h Sh
Sh2 : cuasivarianza poblacional
Ch del estrato h
h =1
NOTA: Cuando Ch = constante h, la Afijación
Optima coincide con la Afijación de Neyman
MUESTREO POR CONGLOMERADOS
Es un proceso de muestreo en dos pasos:
• Agrupar la población en conglomerados que se
pueden identificar en mapas y en el terreno.
• Seleccionar una muestra de conglomerados y
entrevistar todos los elementos de aquellos.
• Conglomerados pueden ser agrupaciones naturales o
artificiales.
• Posiblemente disponibles de fuentes como el Censo
(manzanas, etc.)
• Los que diseñan la encuesta tal vez tengan que
conformarlos.
• Se entiende la población como jerarquía de unidades
personas viven en viviendas viviendas constituyen
manzanas muchas manzanas hacen una ciudad.
➢Encuesta de estudiantes
➢ = Escuelas ➢ = Estudiantes
➢Muestra por conglomerados
➢ = ➢ = Estudiantes ➢ = Seleccionados
Escuelas
MUESTREO POR CONGLOMERADOS
Ventajas: Desventajas:
• Se pueden utilizar aun • Tendencia de unidades
cuando no haya lista de vecinas de ser
unidades de la población. semejantes reduce la
• Para entrevistas personales, precision.
el tiempo y costo de viajes se • Dado n fijo, sería
reduce muchísimo, sobre menos eficiente
todo para poblaciones • Pero si se consideran
rurales. los costos en el terreno,
• Se necesita sólo una lista de la posibilidad de
conglomerados O la aumentar n implica
posibilidad de construirla. menor pérdida de
precisión en la práctica.
¿ PORQUE USAR MUESTREO POR
CONGLOMERADOS ?
La construcción de una lista de unidades de observación
para el marco de muestreo puede ser difícil, cara e
imposible.
La población podría estar muy dispersa geográficamente
o aparecer en cúmulos naturales, como las escuelas,
hospitales, manzanas, familias.
El muestreo por conglomerados se utiliza en la práctica
debido a que es más barato y conveniente obtener
muestras por conglomerados que al azar entre la
población.
MUESTREO POR
CONGLOMERADOS
La población está particionada en N conjuntos que llamaremos
“Conglomerados”
No se cuenta con una lista de unidades de la población, pero se
tiene una lista de los conglomerados.
La forma de obtener una muestra consiste en escoger n
conglomerados, y en cada uno de ellos se observan todas las
unidades de población que estaban en cada conglomerado
selecionado.
Este procedimiento de obtener la muestra se denomina muestreo
por conglomerados.
MUESTREO POR CONGLOMERADOS :
Ejemplo
Número de niños por manzana
Las 3510 manzanas de una ciudad se localizan en
90 poblados (urbanizaciones, conjuntos
habitacionales).
El número de manzanas en las diferentes
urbanizaciones, C.H. no es el mismo .
Se selecciona una muestra aleatoria simple de 15
poblados y se determina el # de niños por
manzana.
FORMULAS DEL TAMAÑO DE MUESTRA
Cualitativa Cuantitativa
VARIABLE
(Proporción Poblacional) (Promedio Poblacional)
Z 2 P(1 − P) N Z 2S 2 N
n= 2 n= 2
E ( N − 1) + Z 2 P(1 − P) E ( N − 1) + Z 2 S 2
POBLACION FINITA
(Cuando se conoce N)
PASOS A SEGUIR PARA DETERMINAR LA MUESTRA:
Z 2 PQ
Se desea estimar la n0 =
proporción de que esta en E2
desacuerdo con la explotación
del Cerro Quilish. Se desea 1.962 * (0.80)(0.20)
n0 = 2
= 246
considerar un 95% de (0.05)
confianza, un error de 5%.De 246
estudios anteriores se sabe n = = 219
246
que esta proporción es de 1+
2000
p=80% (estimada).
Si N = 2000. Calcular n
APLICACIÓN:
Variable Cuantitativa: Promedio Poblacional
n=
(W P Q ) =h h h 0.25
= 1067 1067
2
0.03 2 n = = 762
E 1067
(
1.96
) 1+
Z 2660