Está en la página 1de 58

FACULTAD DE INGENIERÍA

Escuela Profesional de Ingeniería Civil

Asignatura: Taller de Investigación II

MSc.Julio César Llallico Colca


Email: d.jllallico@upla.edu.pe
HUANCAYO - 2020
UNIDAD I RECOLECCIÓN DE DATOS

TEMA: Técnicas muestra de muestreo y


Selección de la muestra.

Objetivos:
 Describir y aplicar la selección de muestras.
Métodos y distribuciones
de muestreo
¿Por qué obtener muestras de la población?

• Existe una imposibilidad física de verificar todos los elementos


de la población.
• El costo de estudiar todos los elementos de una población es
alto.
• Los resultados de la muestra suelen ser adecuados.
• Contactar a toda la población es tardado, por la naturaleza
destructiva de ciertas pruebas.
Muestreo

Muestreo: Es el proceso de obtención de una muestra procedente de


una población.

Muestreo Aleatorio:
• Una muestra aleatoria es una muestra seleccionada de manera que
cada elemento o persona en la población que se estudia tiene una
probabilidad conocida de quedar incluido en la muestra.
• Todos los elementos de la población tienen la misma probabilidad
de aparecer en la muestra.
8-5

Métodos de muestreo aleatorio En Población Finita

• Muestra aleatoria simple: muestra formulada de manera que


cada elemento o persona en la población tiene la misma
oportunidad de quedar incluida.
Existen dos Tipos:
• Con Reposición
• Sin Reposición
Muestreo aleatorio sin reposición Población Finitas

• Los elementos no son devueltos a la población. Sólo pueden


aparecer una vez en la muestra.
Número de Muestras Posibles:
Ejemplo de Muestreo aleatorio Sin Reposición Población
Finitas
Población: N=3;
Elementos de la Población: (1, 2, 3)
Sus Parámetros: µ=2; σ2= 0.67
Muestras con n=2 (2 elementos en cada muestra)
𝑁! 3!
𝑉𝑁,𝑛 = = =6
(𝑁 − 𝑛)! (1)!
Tabla De Posibles Muestreo Aleatorio Sin Reposición y
sus Estimadores
Muestreo aleatorio Con reposición Para Poblaciones
Finitas
• Los elementos son devueltos a la
• población.
• Pueden aparecer más de una vez en la
• muestra.
• Muestreo aleatorio simple (muestreo
• aleatorio)
𝑛
• Número de muestras posibles: 𝑁
Ejemplo de Muestreo aleatorio Con Reposición
Poblaciones Finitas
Población: N=3;
Elementos de la Población: (1, 2, 3)
Sus Parámetros: µ=2; σ2= 0.67
Muestras con n=2 (2 elementos en cada muestra)
𝑉𝑁,𝑛 = 𝑁 𝑛 = 32 = 9
Tabla De Posibles Muestreo Aleatorio Sin Reposición y
sus Estimadores
Muestreo aleatorio en población
infinita
• Se asume que la población tiene infinitos elementos.
• El número de posibles muestras es infinito.
• También se pueden dar Muestreos
1. Con reposición.
2. En población infinita.

¿Ahora Como se comportaran los estimadores


de las muestras?
8-5

Métodos de muestreo aleatorio sistemática

• Los elementos de la población se colocan en cierto orden. Se


elige un punto de partida aleatorio y después se selecciona
uno cada k-ésimo elemento de la población para la muestra.
8-6

Muestreo aleatorio estratificado:

• Se divide la población en subgrupos, llamados estratos, y se


selecciona una muestra de cada estrato.
8-6

Muestreo por conglomeración

• Primero se divide la población en subgrupos (estratos), y se


selecciona un estrato. La muestra se toma del estrato
seleccionado.
Error de Muestreo

• El es la diferencia entre un estadístico muestral y su parámetro


correspondiente.
8-7

Distribución muestral de la Media

• Es la distribución de probabilidad de todas la medias


muestrales posibles de un tamaño de muestra dado,
seleccionadas de una población, y la probabilidad de
ocurrencia asociada con cada media muestral.

Dado una variable X


Parámetros (población): 𝐸 𝑋 = 𝜇 ; 𝜎𝑋 2 = 𝜎
𝜎 2
Estimadores (Muestras) 𝐸 𝑋ത = 𝜇 ; 𝜎𝑋ത 2 =
𝑛
EJEMPLO 1

• El gerente de Obras de la Mun. Del Tambo cuenta con cinco


expedientes de 5 empresas constructoras. Cada una de ellas
informan de cuentos meses de experiencia llevan en el
mercado.
Empresa Meses
A 22
B 26
C 30
D 26
D 22

El gerente debe seleccionar dos empresas ¿cuántas muestras diferentes son posibles
de elegir aleatoriamente?
EJEMPLO

• Ésta es la Empresas Total Media


1,2 48 24
combinación de 5
1,3 52 26
objetos tomados 1,4 48 24
de 2 en 2. Es 1,5 44 22
decir: 2,3 56 28
2,4 52 26
2,5 48 24
3,4 56 28
5!
𝐶52 = =10 3,5 52 26
2!3! 4,5 48 24
EJEMPLO
• Organice las medias muestrales en una
distribución de muestreo:

Media Frecuencia Frecuencia


muestral relativa
22 1 1/10
24 4 4/10
26 3 3/10
28 2 2/10
EJEMPLO

• Calcule la media de las medias muestrales y compárela con la


media poblacional:
– media de las medias muestrales = [(22)(1) + (24)(4) + (26)(3) +
(28)(2)]/10=25.2
– media poblacional = (22+26+30+26+22)/5 = 25.2
– observe que la media de las medias muestrales es igual a la media
poblacional.
Teorema del límite central

• Para una población con media  y variancia 2, la distribución


de muestreo de las medias de todas las muestras posibles de
tamaño n obtenidas de una población tendrá una distribución
normal aproximada —con la media de la distribución de
muestreo igual a  y la variancia igual a 2/n —si se supone
que el tamaño de la muestra es suficientemente grande.
TEORIA DE LA ESTIMACION
La estadística se divide en DESCRIPTIVA e INFERENCIAL

DESCRIPTIVA

ESTADISTICA Estimación
INFERENCIAL
Docimación
de
Hipótesis

En esta sesión se estudiará la estimación de la proporción poblacional (p) y de la


media poblacional ().
DOCIMACIÓN DE HIPOTESIS Es otra forma de hacer inferencia estadística ( inductiva ) cuyo objetivo es probar
una hipótesis acerca de los parámetros de una población
Tipos de Estimaciones

• Estimación Puntual: Un sólo número se utiliza para estimar un


parámetro desconocido. Para ser útil debe de estar
acompañado del error.
• Estimación por intervalos: Un intervalo de valores se utiliza
para estimar un parámetro desconocido. Se indica el error de
dos manera: por la extensión del intervalo y por la
probabilidad de obtener el verdadero parámetro de la
población que se encuentra dentro del intervalo.
Estimación Puntual:

Un sólo número se utiliza para estimar un parámetro


desconocido. Para ser útil debe de estar acompañado del error.

Ejemplo:
Para el próximo mes se espera que las ventas sean 700
unidades con un error de 10%
Estimación por Intervalo:

Un intervalo de valores se utiliza para estimar un parámetro


desconocido. Se indica el error de dos manera: por la extensión
del intervalo y por la probabilidad de obtener el verdadero
parámetro de la población que se encuentra dentro del
intervalo.

Ejemplo:
Para el próximo mes se espera que las ventas sean entre 670 y
730 unidades.
Criterios para seleccionar un buen estimador: CESI.

• Coherencia: si al aumentar n, el estimador se aproxima al


parámetro.
 Eficiencia: proporciona menor error estándar que otros
estimadores.
 Suficiente: utiliza mayor cantidad de la información contenida
en la muestra que otro estimador.
 Insesgado (o imparcial): si el estimador tiende a tomar valores
por encima y por debajo del parámetro que estima, con la
misma frecuencia.
Estimaciones puntuales

(A) De la media poblacional


La media muestral x a la media poblacional 
estima
(B) De la varianza y la desviación estándar
S2 estima 2
S estima 
(C) De la proporción poblacional
p p
INTERVALOS DE CONFIANZA

• Nivel de confianza: probabilidad que asociamos con una


estimación del intervalo. Se representa con (1 - a). Los niveles
más utilizados son 0,90 0,95 y 0,99.

• Intervalos de confianza: es el alcance de la estimación que


estamos haciendo.
Resumen de Parámetros de la Población:
Dado una variable X

Parámetros (población):

𝐸 𝑋 = 𝜇 ; Media Poblacional
𝜎𝑋 2 = 𝜎 2 ; Varianza Poblacional
𝜎 = Desviación Estandar
Resumen de Estimadores de la Muestra

• Estimadores (Muestras):
𝑋ത : Media Muestral (de una sola muestra)
𝑆 2 : Varianza de la Muestra (de una sola muestra)
s: Desviación típica de la Muestra (de una sola muestra)
Resumen de Estimadores de la Distribución Muestral

• Media de la Distribución Muestral


𝑋ത = 𝐸 𝑋ത = 𝜇 ;
• Varianza de la distribución Muestral
2 𝜎2 ത 𝑋)
σ(𝑋− ധ ത
σ(𝑋−𝜇)
𝜎𝑋ത = = = ;
𝑛 𝐾 𝐾
2 𝜎2 𝜎2 𝑁−𝑛
𝜎𝑋ത = ∗ fpc = * ; Cuando n=0.05*N
𝑛 𝑛 𝑁−1

• Error Estandar
𝜎𝑋ത = 𝜎𝑋ത 2 Se Utiliza (Factor para Corrección de Poblaciones Finitas :
𝑁−𝑛
fpc= ; solo cuando n>0.05*N
𝑁−1
Usos de la distribución Muestral de medias

• La importancia de la distribución muestral puede reconocerse


sólo si se recuerda que muchas decisiones se toman con base
en los resultados muestrales.

Usos de Distribución Normal:


Ejemplos
Distribuciones de las Proporciones Muestrales

• No solo se puede trabajar con Medias Muéstrales (variables Cuantitativas).


• También se puede utilizar Proporciones muéstrales (Variables Cualitativas)
Ejemplos:
• Determinar la Probabilidad de que un proyecto generara o no rendimiento
positivo.
• Determinar la probabilidad de que se obtenga o no el crédito necesario
para la realización del proyecto
En estos casos se utiliza la proporción muestral “p” para estimar el parámetro
desconocido “𝜋"
Proceso de Proporciones Muestrales

• El proceso de proporciones muestrales es muy similar al de las


medias.
• De cualquier población es posible obtener muchas muestras
diferentes de un tamaño dado.
• Cada muestra tendrá su propia proporción de éxitos.
• La Esperanza de proporción de cada una de las muestras nos
dará el valor de la proporción de la población. E[p]=π
Ejemplo
• De un total de 4 maestros de obra al ser
interrogados si tienen experiencia en la
construcción de edificios anticismicos, estos
respondieron.
Maestros de Experiencia Éxitos
• En este caso la Obra
proporción A Si 1
poblacional de B No 0
éxitos será ¾. Y de C Si 1
fracasos será ¼ D Si 1
Total 3
𝜋 = 0.75
Muestras tomadas de dos en dos
Muest Número de Éxitos Proporción de
ras Éxitos
AyB 1 0.5
AyC 2 1.0
AyD 2 1.0
ByC 1 0.5
ByD 1 0.5
CyD 2 1.0
Valor esperado de la σ 𝑝1 0.5+1+1+0.5+0.5+1 4.5
Distribución Muestral 𝐸𝑝 = = = = 0.75 = 𝜋
𝑘 6 6

Valor esperado de la 𝜋(1−𝜋) 0.75(0.25) 4−2


Distribución Muestral 𝜎𝑝 = ∗ 𝑓𝑝𝑐= ∗ = 0.09375 ∗ 0.8164 = 0.0765
𝑛 2 4−1

Se Utiliza (Factor para Corrección de Poblaciones Finitas :


𝑁−𝑛
fpc= ; solo cuando n>0.05*N
𝑁−1
Usos de la distribución Muestral de Proporciones

• La importancia de la distribución muestral proporcional es muy


alta dado que existen muchas variables cualitativas y sus
resultados muestrales se pueden aplicar a la población.

Usos de Distribución Normal


Proporcional: Ejemplos
r a l i t r b u i o n :  = 0 , 2 = 1

Áreas bajo la curva normal

0 . 4

Entre:
1. 68.26%
2. 95.44%
0 . 3 3. 99.74%

0 . 2
f ( x

0 . 1

. 0

  1
   1
- 5

  2
x
  2
  3   3
Estimación de intervalos
Muestras grandes (n>30)

Para la media poblacional:


x-
pero Z =

n
-Z0 Z0

Pr Z 0  Z  Z 0   1  a
 x 
Pr Z 0   Z0   1 a
 x 
   
Pr x  Z0    x  Z0   1  a
 n n 
Ejemplo

Una encuesta hecha a 400 familias del Distrito de el


Tambo dio un gasto medio anual energía eléctrica
de S/. 740 por familia. La desviación estándar fue
S/. 400. Establezca un intervalo de confianza al 0.95
de estimación del gasto medio anual de energía
eléctrica por familia en toda la población.
   
Pr  x  Z0    x  Z0   1  a
 n n 
 400 400 
Pr 740  (1.96)    740  (1.96)  0.95
 400 400 
Pr700.80    779.20  0.95
Interpretación

Hay 95% de confianza que el intervalo hallado se


encuentre dentro del grupo de intervalos que
contienen a la verdadera media poblacional ()

 Ls

LI

1 2 3 4 5 6 7
muestra
Estimación de intervalos
Muestras Pequeñas (n<30)

Para la media poblacional

Pero, x -
t=
S
-t0 t0 n

Pr t0  t  t0   1  a
 
 x 
Pr t0   t0   1  a
 S 
 n 
 s s 
Pr x  t0    x  t0   1a
 n n
Ejemplo
Nueve automóviles del mismo modelo fueron conducidos de
idéntica manera usando un litro de gasolina corriente. La
distancia media recorrida por estos automóviles fue de 8 Kms.
con una desviación estándar de 1,14 Kms. Obténgase un
intervalo de confianza al 0.95 para estimar el kilometraje medio
por litro de gasolina para este modelo de automóvil
Interpretación
GL= n - 1 = 8 t = 2.306

 1.14 1.14 
Pr8  2.306 ( )    8  2.306 ( )  0.95
 9 9 

Pr7.12372    8.87628  0.95

Interpretación:
Hay 0.95 de confianza que el intervalo hallado se
encuentre dentro del grupo de intervalos que contienen
a la verdadera media poblacional.
(B) Para la varianza poblacional
(n - 1)S2 ~ 2
Pero ,  ( n1)
 2

12-a 2 a2 2

 
Pr  1-2a   2  a2   1  a
 2 2
(B) Para la varianza poblacional
Entonces
 2 (n  1) S 2 
Pr  1-a   a 2   1  a
2


2
2 

 1 2 1  
Pr  2     1a
 1-a
 (n  1) S a 2 
2 2
2 

 (n  1) S
2
( n  1) S 2 

Pr   
2
  1a
 a 2
 1-a 2 
2 2

(B) Para la varianza poblacional

Ejemplo:
El peso de diez personas (n = 10) presenta una varianza de 9 (s2 =
9). Establezca un intervalo de confianza al 0.90.

 9(9) 9(9) 
Pr   2    0.90
Datos: 16,919 3,325 
S2 = 9
n = 10
a = 0.10
 81 81 
Pr   2    0.90
16,919 3,325 

 
Pr 4.7875   2  24,3609  0.90
(B) Para la varianza poblacional

Interpretación:
Hay 0.90 de confianza que el intervalo hallado se
encuentre dentro del grupo de intervalos que
contienen a la verdadera varianza poblacional.
Estimaciones de intervalo

 Un intervalo de confianza de 95% significa que cerca de 95% de los


intervalos similares contendrán el parámetro que se quiere estimar, o 95%
de las medias muestrales para un tamaño de muestra dado estarán dentro
de 1.96 deviaciones estándar de la media poblacional hipotética.
 Para el intervalo de confianza de 99%, un 99% de las medias muestrales
para un tamaño de muestra dado estará dentro de 2.58 desviaciones
estándar de la media poblacional hipotética.
8-22
Intervalo de confianza para una relación proporcional de
población
• El intervalo de confianza para una relación
proporcional de una población se estima
como: p  z p
• donde  p es el error estándar de la
proporción:

p(1  p)
p 
n
EJEMPLO 4
• Un planificador financiero, estudia los planes de retiro para
jóvenes ejecutivos. Una muestra de 500 ejecutivos que son
dueños de sus casas reveló que 175 planean venderlas y
migrar a Lima. Desarrolle un intervalo de confianza de 98%
para la proporción de ejecutivos que planean vender e irse
a Lima.
• Aquí, n=500, p=175/500=.35 y z=2.33
• el IC de 98% es

(.35)(.65)
.35  2.33 ó .35  .0497
500
EJEMPLO 5

• Dada la información del EJEMPLO 4, construya un


intervalo de confianza de 95% para el número
medio de horas estudiadas por semana si hay sólo
500 estudiantes en la escuela.
• Dado que n/N = 49/500 = .098>.05, se tiene que
usar el factor de corrección de población finita.

4 500  49
24  196
. ( )( )  [22.9352, 25.0648]
49 500  1
Selección del tamaño de muestra

• Existen 3 factores que determinan el tamaño de una muestra,


ninguno de ellos tiene una relación directa con el tamaño de la
población. Los factores son:
• El grado de confianza elegido.
– El error máximo permitido.
– La variación en la población.
Variación en la población

• Tamaño de la muestra para la media: una fórmula


computacional conveniente para determinar n es:

 Z  S 
2

n   
 E 
• donde: E es el error permitido, Z es el valor normal estándar
asociado con el grado de confianza seleccionado y S es la
desviación estándar estimada del estudio piloto.
Tamaño de la muestra para proporciones

• La fórmula para determinar el tamaño de la muestra en el caso


de una proporción es:
2
 Z
n  p(1  p) 
 E
• donde p es la proporción estimada, basada en la experiencia o
en un estudio piloto; z es el valor asociado con el nivel de
confianza deseado; E es el error máximo que tolerará el
investigador.
EJEMPLO 6

• Un grupo de consumidores desea estimar la media mensual en


los recibos de luz para una casa unifamiliar. Según estudios
similares la desviación estándar se estima en $20.00. Se desea
un nivel de confianza de 99%, con una precisión de ±$5.00.
¿Qué tamaño de muestra se requiere?

n  [( 2.58)( 20) / 5]2  106.5024  107

También podría gustarte