Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Teoria Elemental de Muestreo PDF
Teoria Elemental de Muestreo PDF
Tipos de muestreo
Muestreo de juicio o no probabilstico. (opintico). Se basa en el conocimiento de la
poblacin por parte de alguien, quien hace a la muestra representativa, dependiendo
de su intencin, por lo tanto es subjetiva.
Probabilstico(Errtico): Todos los elementos de la poblacin tienen la posibilidad
de pertenecer a la muestra.
Muestreo Aleatorio:
1. Muestreo aleatorio simple
2. Muestreo Sistemtico.
3. Muestreo Estratificado
4. Muestreo por Conglomerado
Muestreo de juicio: A travs del conocimiento y la opinin personal, basada en la
experiencia del investigador, se identifican los elementos de la poblacin que van a
formar parte de la muestra. Una muestra seleccionada por muestreo de juicio se basa en
el conocimiento de la poblacin por parte de alguien. Por ejemplo, un guardabosques
tomar una muestra de juicio si decide con antelacin que parte de una gran zona
reforestada deber recorrer para estimar el total de metros de madera que pueden
cortarse. En ocasiones el muestreo de juicio sirve de muestra piloto para decidir cmo
seleccionar despus una muestra aleatoria.
INFERENCIA ESTADISTICA
Muestreo aleatorio: Cuando se conoce la probabilidad de que un elemento de la
poblacin figure o no en la muestra, puede ser:
seleccionar a cada veinte producto hasta formar la muestra, para esto se escoge un
punto aleatorio de arranque en los primeros veinte productos y luego se escoge cada
vigsimo producto hasta completar la muestra. Una de las ventajas de este muestreo
es cuando los elementos presentan un patrn secuencial, tal vez requiera menos
N N! 10! 10.9.8.7.6.5!
= = = = 252 muestras.
n n!( N n)! 5!(10 5)1 5!.5.4.3.2.1
INFERENCIA ESTADISTICA
Por lo que considerando este caso, la distribucin muestral para un estadstico
muestra 1 X1
v muestra 2 X2
determinado, por ejemplo, la media X viene dado por:
M
muestra 252 X 252
X =
N n
X = para poblacione s finitas
n N 1
X = para poblacione s infinitas
n
La expresin es la desviacin estndar de la distribucin muestral de medias, se le
llama error tpico o estndar de la media y nos indica la diferencia promedio entre los
diversos valores de X y . Como se observa, a medida que el tamao de la muestra
aumenta este error dismunuye, las diversas medias muestrales se hacen ms uniforme
en su valor, y en consecuencia, cualquier media muestral es una buena estimacin de la
media poblacional .
INFERENCIA ESTADISTICA
Distribuciones Muestrales
Construccin
De una poblacin discreta, finita, de tamao N, extraer todas las muestras posibles de
tamao n
Calcular el valor del estadstico de inters de cada muestra
Hacer una tabla con dos columnas: en la primera los posibles valores diferentes del
estadstico y en la segunda, la frecuencia de ocurrencia.
=
x i55
== 5,5
N 10
=
2 ( xi ) 2
= 8,25
N
x = n i =
x 550
= 5,5
N 100
Calcular la media muestral sin reemplazamiento?
x2 =
( xi x ) 2 = 412,5 = 4,125
Nn 100
2
8,25
x2 = = = 4,125
n 2
Error estndar de la media: =
n
INFERENCIA ESTADISTICA
Distribuciones Muestrales
Cuando el muestreo se extrae de una poblacin distribuida normalmente, la distribucin
muestral de la media muestral tiene las siguientes propiedades:
1. La distribucin de la media es normal, independientemente del tamao de la muestra.
2. La Media de la distribucin de las medias es igual a la media de la poblacin.
3. La varianza de la distribucin de las medias es igual a la varianza de la poblacin,
dividida entre n.
Teorema del Lmite Central
Dada una poblacin con media y varianza finita 2, con cualquier distribucin, la
distribucin muestral de la media, calculada de muestras aleatorias de tamao n, est
distribuida normalmente con media y varianza finita 2/n, cuando n es grande.
La regla de oro dice que n30.
Ejemplo
La vida promedia de cierta herramienta es de 41.5 horas, con una desviacin estndar
de 2.5 horas. Cul es la probabilidad de que una muestra aleatoria de tamao 50
extrada de esta poblacin tenga una media entre 40.5 y 42 horas?
2
2
X1 X
= 1
+ 2
n1 n2
( X 1 X 2 ) ( 1 2 )
Z=
12 22
+
n1 n2
( X 1 X 2 ) ( 1 2 )
t=
2 2
Sp Sp
+
n1 n2
donde:
(n1 1) S1 + (n2 1) S 2
2 2
Sp =
2
n1 + n2 2
INFERENCIA ESTADISTICA
Ejemplo
Dos compaas fabrican lubricantes de alta temperatura, para el mismo mercado. La
compaa A anuncia que en promedio, su lubricante deja de ser efectivo a 505 F, con
una desv. est. de 10 F. La compaa B anuncia que su producto tiene una media de 475
F, con una desv. est. de 7 F. Suponga que una muestra de tamao 20 para la primera
compaa y otra independiente de tamao 25 para la segunda son extradas
aleatoriamente. Cul es la probabilidad de que la diferencia en temperatura promedio
de falla para las dos muestras est entre 25 y 35 F?
)
DISTRIBUCIN DE UNA PROPORCION MUESTRAL ( P ).-
Se define una proporcin muestral como el cociente:
nmero de casos favorables
p=
total de casos
Por ejemplo: si de una poblacin de N = 50, empleados de una empresa,
Muestra 2---- p 2
Muestra 3---- p 3
p.q
X = para poblacione s infinitas
n
Para el clculo de probabilidades relativa a proporciones, se trabaja de manera
anloga al caso de la distribucin muestral de medias.
Ejemplo: Un encuestador sabe que en cierta rea el 20 % est a favor de las emisiones
en bonos. Considerando una muestra de 64 personas, hallar la probabilidad de que la
proporcin muestral difiera de la proporcin real a lo sumo en un 0,06.
Solucin:
p = 0.20 proporcin de personas de la poblacin que estn a favor de la emisin
p = proporcin de personas de la muestra que estn a favor de la emisin
una estimacin , a partir de una muestra aleatoria de tamao n, se desconoce que tan
cerca (por defecto o exceso) est del parmetro a estimar . Por eso se utiliza
frecuentemente otro tipo de estimacin, la estimacin por intervalos, la cual nos
permite de acuerdo a un nivel de confianza especificado obtener una informacin ms
precisa sobre el parmetro a estimar.
x z / 2 , x + z/2
n n es una estimacin por intervalo de la media de la
poblacin para un nivel de confianza del (1-)%; por ejemplo, si se define un nivel de
confianza del 95 %, esto significa que por cada 100 muestras de tamao n 30 en 95
de ellas la media de la poblacin cae dentro de este intervalo.
INFERENCIA ESTADISTICA
Intervalo de confianza para medias con n < 30 (pequeas muestras):
Se utiliza la t de Student para estos casos y cuando se desconoce la desviacin de la
poblacin, utilizando la siguiente expresin:
S S
x t / 2 , x + t/2
n n
(1 - 2) ( X X ) Z . 1 + 2 , ( X X ) + Z . 1 + 2
2 2 2 2
1 2
n1 n2
1 2
n1 n 2
2 2
2 2 2 2
(X X ) t . S p + S p , (X X ) + t . S p + S p
(1 - 2) 1 2
n1 n2
1 2
n1 n2
2 2
para un nivel de confianza del (1 - )% y v = n 1 + n 2 2 g.l.
(n 1) S1 + (n2 1) S 2
2 2
donde S p = 1
2
n1 + n2 2
Intervalo de confianza para proporciones ( p ):
a) grandes muestras:
p.q p.q
p p Z . , p + Z .
2
n 2
n
INFERENCIA ESTADISTICA
b) pequeas muestras:
p.q p.q
p p t . , p + t .
2
n 2
n
Ejemplos:
S
= (20.38 , 26.11)
S 3.16 3,16
x t / 2 , x + t /2 = 24.2 2.567. , 24.2+ 2.567
n n 18 18
Esto significa, que por cada 100 muestras de tamao n =18 en 98 de ellas la media
poblacional cae dentro de este intervalo.
INFERENCIA ESTADISTICA
- diseo 2, como n = 20 < 30, para v = 19 g.l. se tiene que t = t 0.01 = 2.539 por lo
2
tanto
S
= (21.661 , 26.739)
S 4.47 4,47
x t / 2 , x + t /2 = 24.2 2.539. , 24.2+ 2.539
n n 20 20
2
(1 - 2) ( X 1 X 2 ) Z . 1 + 2 , ( X 1 X 2 ) + Z . 1 + 2
2 2 2
n1 n2 n1 n2
2 2
10 20
= (0.3 - 2.90 , 0.3 + 2.90 ) = ( 2.6 , 3.2 )
10 20
( 24.2 23 .9 ) 2.33. + , ( 24.2 23 .9 ) + 2.33. +
18 20 18 20
usando la relacin:
(n 1) S 2 (n - 1)S 2 17.10 17 .10
2
, = , = (5.09 , 26.52)
2
2
33,41 6,41
2
1-
2
Por cada 100 intervalos de tamao n = 18 en 98 de ellos la varianza poblacional 2 cae
dentro de este intervalo.
INFERENCIA ESTADISTICA
PRUEBA DE HIPTESIS
H0: = 0 = 2000 h
Para realizar una prueba de hiptesis relativa a un parmetro, se debe fijar el nivel
de confianza (1-) % , de aqu definimos el nivel de significacin como el valor de .
Si el nivel de confianza es del 95 %, 1- = 0,95 de donde =0,05.
INFERENCIA ESTADISTICA
Calcular el Estadstico de Prueba:
x x
z= t=
S
n n
( x1 x2 ) ( 1 2 )
z=
12 22
+
n1 n2
Pequeas muestras
( x1 x 2 ) ( 1 2 )
t=
S p2 S p2
+
n1 n2
H0 : 2 = 02 (para varianzas) (n 1) S 2
2 =
2
H0 : P = P 0 (para proporciones) p p
z=
p
p.q
p = p P =
n
H0 : P1 P2 = 0 (diferencia de
proporciones)
INFERENCIA ESTADISTICA
INFERENCIA ESTADISTICA
ya que el rea de las colas est muy cercana a cero (0,0000892649) entonces
los valores de < 0,0000892649 permiten aceptar la hiptesis nula; por lo que
el valor p = > 0,0000892649 permiten rechazar H0. Por lo tanto, es evidente
que para niveles de significacin del 1% ( =0,01), 5% (=0,05),10% (=0,1)
se rechaza H0. En conclusin se rechaza la hiptesis nula de que la
conductividad trmica del ladrillo es igual a 0,36; es decir, se acepta la
alternativa de que es diferente.
INFERENCIA ESTADISTICA
7 . 2,39 + 7 . 2,98
luego S p2 = = 2,69 , entonces se tiene que:
14
( x1 x 2 ) ( 1 2 ) - 0,1775
t= = = 0,6725
S p2 S p2 2,69 2,69
+ +
n1 n2 8 8
INFERENCIA ESTADISTICA
El valor p nos define los para el cual se rechaza H0. Considerando v = 14 g.l.
y el estadstico = -0,67 como valor crtico, se tiene que el rea a la izquierda de
0,67 y a la derecha de 0,67 es igual a 0,255. Por lo que, el valor p = >
0,255, en consecuencia, la hiptesis nula se rechaza para > 0,255. De
manera particular, se tiene que para los valores usuales de = 0,01, =0,05 y
= 0,1. La hiptesis nula H0 no se rechaza (se acepta). Por tanto, se concluye
que para estos niveles de significacin la diferencia del rendimiento medio no
es estadsticamente significativa.
Tamao de la Muestra.
La clave del problema estriba en escoger una muestra cuyo seleccin
garantice la representatividad de la poblacin objeto de estudio. En los
estudios socio-econmicos, una muestra de un 30% de la poblacin, tiene un
elevado nivel de representatividad (Ramrez 1995); sin embargo, esta
representatividad depende mayormente, del tipo de muestreo. Obviamente,
que el trabajar con muestras, por muy confiables que sean, no se obtiene el
100% de exactitud, sin embargo, ese pequeo error que acompaa siempre a
los estudios por muestreo, es compensado con el tiempo y costo ahorrado al
trabajar con grupos pequeos en vez de toda la poblacin.
2
Z
n= 2 . p.q
Donde:
n: Tamao de la muestra
Z/2: Valor terico en funcin del nivel de confianza, para 99 %,
Z/ 2 = 2,56 y para el 95%, Z/2 =1,96
: error de muestreo
P: Nmero de veces que se produce un evento en %
Q: Es el porcentaje complementario de P
Ejemplo:
Opinin de los electores sobre gestin de gobierno.
Se realiz un estudio piloto de 150 electores donde 60 opinan
favorablemente. A cuantas personas es necesario encuestar si se desea un
nivel de confiabilidad de 99 % y un error de muestreo +/- 1.5%.
Entonces se tiene:
2
Z
n= 2 . p.q El valor de P viene dado por:
2
2,56
De esta forma se tiene: n = . 0,4. 0,6 = 6.991 . Es necesario
0,015
encuestar a 6.991 personas para alcanzar cierta confiabilidad en los
resultados.
2
1,96
n= . 0,5. 0,5 = 4.268
0,015
Esto quiere decir que habr que encuestar a 4.268 personas.
Z .
2
n= 2
Ejemplo: Se quiere estudiar la vida til media de una marca de neumticos.
Si sabe por estudios anteriores que la desviacin estndar es de 800 Km .
Determinar el tamao de la muestra requerido para un nivel de confianza
del 95 %, fijando un error de 40.
Sustituyendo los valores se tiene
2 2
1,96. 800 1568
n= = = 1536,64 1537 neumticos
40 40