Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El Muestreo
El Muestreo
INFERENCIA ESTADISTICA
Sin reemplazamiento cuando un elemento de la poblacin solo puede ser
seleccionado una sola vez para formar parte de la muestra.
Poblacin: es una coleccin de todos los elementos que estamos estudiando y
acerca de los cuales se intenta extraer conclusiones. Puede ser infinita o finita.
Muestra: Una parte de la poblacin o un subconjunto del conjunto de unidades
obtenidas con el objeto de investigar las propiedades de la poblacin.
Muestreo estadstico: Es un enfoque sistemtico para seleccionar unos cuantos
elementos (una muestra) de un grupo de datos (poblacin) a fin de hacer algunas
inferencias sobre el grupo total. Desde el punto de vista matemtico, podemos
describir las muestras y las poblaciones mediante medidas como la media, la moda,
la desviacin estndar, etc. No es mas que el procedimiento a travs del cual se
obtienen las muestras.
Tipos de muestreo
Muestreo de juicio o no probabilstico. (opintico). Se basa en el conocimiento de la
poblacin por parte de alguien, quien hace a la muestra representativa, dependiendo
de su intencin, por lo tanto es subjetiva.
Probabilstico(Errtico): Todos los elementos de la poblacin tienen la posibilidad
de pertenecer a la muestra.
Muestreo Aleatorio:
1. Muestreo aleatorio simple
2. Muestreo Sistemtico.
3. Muestreo Estratificado
4. Muestreo por Conglomerado
Muestreo de juicio: A travs del conocimiento y la opinin personal, basada en la
experiencia del investigador, se identifican los elementos de la poblacin que van a
formar parte de la muestra. Una muestra seleccionada por muestreo de juicio se basa en
el conocimiento de la poblacin por parte de alguien. Por ejemplo, un guardabosques
tomar una muestra de juicio si decide con antelacin que parte de una gran zona
reforestada deber recorrer para estimar el total de metros de madera que pueden
cortarse. En ocasiones el muestreo de juicio sirve de muestra piloto para decidir cmo
seleccionar despus una muestra aleatoria.
INFERENCIA ESTADISTICA
Muestreo aleatorio: Cuando se conoce la probabilidad de que un elemento de la
poblacin figure o no en la muestra, puede ser:
investigador para seleccionar dicha muestra fue el de tomar 10 materiales que estaban
ms prximos a l; evidentemente esta muestra no es representativa de la poblacin, se
dice que esta sesgada, por lo que la inferencia estadstica que se realice ser errnea.
Por lo tanto, una muestra se dice que esta sesgada cuando los elementos seleccionados
tenan mayor probabilidad de pertenecer a la misma.
Cmo hacer el muestreo aleatorio
La forma ms fcil de realizarlo es usando nmeros aleatorios, para esto se puede
recurrir a una tabla o a un generador de nmeros aleatorios. Actualmente, se recurre a
computadora.
Muestreo Sistemtico o Secuencial.
Los elementos se seleccionan de la poblacin con un intervalo uniforme en el
tiempo, en el orden o en el espacio. Por ejemplo, supongamos que se quiere estudiar
una determinada caracterstica de un producto fabricado en serie y se decide
seleccionar a cada veinte producto hasta formar la muestra, para esto se escoge un
punto aleatorio de arranque en los primeros veinte productos y luego se escoge cada
vigsimo producto hasta completar la muestra. Una de las ventajas de este muestreo
es cuando los elementos presentan un patrn secuencial, tal vez requiera menos
tiempo y algunas veces cuesta menos que el mtodo de muestreo aleatorio.
INFERENCIA ESTADISTICA
Muestreo Estratificado.
Para aplicar el muestreo estratificado, se divide la poblacin en grupos
homogneos, llamados estratos, los cuales son hetergeneos entre si. Despus se recurre
a uno de dos mtodos posibles:
a) Se selecciona al azar en cada estrato un nmero especificado de elementos
correspondientes a la proporcin del estrato de la poblacin total
b) Se extrae al azar un nmero igual de elementos de cada estrato y damos un peso a
los resultados de acuerdo a la proporcin del estrato en la poblacin total
INFERENCIA ESTADISTICA
DISTRIBUCIONES MUESTRALES
1
experimental, sacando todas las muestras posibles de un tamao dado, calculando para
cada muestra el valor del estadstico que nos interesa. Ejemplo, supongamos que se
tiene una poblacin de tamao N = 10 y queremos extraer con reemplazamiento todas
n
N!
10!
10.9.8.7.6.5!
N
=
=
= 252 muestras.
=
n n!( N n)! 5!(10 5)1 5!.5.4.3.2.1
INFERENCIA ESTADISTICA
Por lo que considerando este caso, la distribucin muestral para un estadstico
v
determinado, por ejemplo, la media X viene dado por:
muestra 1
X1
muestra 2
X2
M
muestra 252 X 252
distribucin de
y desviacin
X =
X =
X =
N n
N 1
INFERENCIA ESTADISTICA
Distribuciones Muestrales
Construccin
De una poblacin discreta, finita, de tamao N, extraer todas las muestras posibles de
tamao n
55
= 5,5
10
N
( xi ) 2
2
=
= 8,25
N
INFERENCIA ESTADISTICA
8,25
x2 =
=
= 4,125
n
2
Error estndar de la media: =
INFERENCIA ESTADISTICA
Distribuciones Muestrales
Cuando el muestreo se extrae de una poblacin distribuida normalmente, la distribucin
muestral de la media muestral tiene las siguientes propiedades:
1. La distribucin de la media es normal, independientemente del tamao de la muestra.
2. La Media de la distribucin de las medias es igual a la media de la poblacin.
3. La varianza de la distribucin de las medias es igual a la varianza de la poblacin,
dividida entre n.
Teorema del Lmite Central
Dada una poblacin con media y varianza finita 2, con cualquier distribucin, la
distribucin muestral de la media, calculada de muestras aleatorias de tamao n, est
distribuida normalmente con media y varianza finita 2/n, cuando n es grande.
La regla de oro dice que n30.
Ejemplo
La vida promedia de cierta herramienta es de 41.5 horas, con una desviacin estndar
de 2.5 horas. Cul es la probabilidad de que una muestra aleatoria de tamao 50
extrada de esta poblacin tenga una media entre 40.5 y 42 horas?
P ( 40,5 x 42) = P ( 2,86 z 1,43) = P (0 z 2,86) + P (0 z 1,43) = 0,9215
DISTRIBUCIN MUESTRAL PARA LA DIFERENCIA DE MEDIAS (
X 1 X 2 ).-
de la muestra de la poblacin 1
X 1 = media de la muestra
1 = varianza de la poblacin 1
2
X 2 = media de la muestra 2
22 = varianza de la poblacin
1 - 2. La forma
INFERENCIA ESTADISTICA
En estos casos, los parmetros que definen esta distribucin muestral de las diferencias
de medias vienen dados por:
X1 X
X1 X
= 1
n1
2
2
n2
Z=
( X 1 X 2 ) ( 1 2 )
12
n1
22
n2
t=
( X 1 X 2 ) ( 1 2 )
Sp
n1
Sp
n2
donde:
(n1 1) S1 + (n2 1) S 2
n1 + n2 2
2
Sp =
2
INFERENCIA ESTADISTICA
Ejemplo
Dos compaas fabrican lubricantes de alta temperatura, para el mismo mercado. La
compaa A anuncia que en promedio, su lubricante deja de ser efectivo a 505 F, con
una desv. est. de 10 F. La compaa B anuncia que su producto tiene una media de 475
F, con una desv. est. de 7 F. Suponga que una muestra de tamao 20 para la primera
compaa y otra independiente de tamao 25 para la segunda son extradas
aleatoriamente. Cul es la probabilidad de que la diferencia en temperatura promedio
de falla para las dos muestras est entre 25 y 35 F?
)
DISTRIBUCIN DE UNA PROPORCION MUESTRAL ( P ).-
p =
Ejemplo:
Si se toma una muestra aleatoria de tamao n = 1000 y 425 personas satisfacen
un evento, entonces p = 425 / 1000 = 0,425. Esto significa que el 42,5 % de las
personas satisfacen dicho evento.
INFERENCIA ESTADISTICA
La distribucin de una proporcin muestral, se define de una manera anloga a a la
distribucin de media, o sea:
Muestra 1---- p 1
Muestra 2---- p 2
Muestra 3---- p 3
p = p = P
N n
N 1
X =
p.q
n
X =
p.q
para poblacione s infinitas
n
Solucin:
p = 0.20 proporcin de personas de la poblacin que estn a favor de la emisin
P ( p p 0,06) = P
0,06
p p
0,2.0,8
p.q
64
n
0,06
= P ( 0,27 Z 0,27 ) = 0,20 4
0,2.0,8
64
INFERENCIA ESTADISTICA
ESTIMACION DE PARAMETROS
a) ESTIMACIN PUNTUAL
Para estimar un parmetro de una poblacin se toma una muestra representativa
de la misma y se calcula el estadstico , el valor del estadstico se conoce como la
estimacin puntual del parmetro . Por ejemplo,
Parmetro
Estimacin puntual
= X (media muestral)
= S (varianza muestral)
=p
= p (proporcin muestral)
= 1 2
cerca (por defecto o exceso) est del parmetro a estimar . Por eso se utiliza
frecuentemente otro tipo de estimacin,
x z / 2
, x + z/2
poblacin para un nivel de confianza del (1-)%; por ejemplo, si se define un nivel de
confianza del 95 %, esto significa que por cada 100 muestras de tamao n 30 en 95
de ellas la media de la poblacin cae dentro de este intervalo.
INFERENCIA ESTADISTICA
Intervalo de confianza para medias con n < 30 (pequeas muestras):
Se utiliza la t de Student para estos casos y cuando se desconoce la desviacin de la
poblacin, utilizando la siguiente expresin:
x t / 2
S
S
, x + t/2
n
n
2
2
2
2
(1 - 2) ( X X ) Z . 1 + 2 , ( X X ) + Z . 1 + 2
1
2
1
2
n1
n2
n1
n 2
2
2
2
2
(X X ) t . S p + S p , (X X ) + t . S p + S p
2
1
2
(1 - 2) 1
n1
n2
n1
n2
2
2
(n 1) S1 + (n2 1) S 2
donde S p = 1
n1 + n2 2
Intervalo de confianza para proporciones ( p ):
2
a) grandes muestras:
p.q
p.q
p p Z .
, p + Z .
n
n
2
2
INFERENCIA ESTADISTICA
b) pequeas muestras:
p.q
p.q
p p t .
, p + t .
n
n
2
2
(n 1) S 2 (n - 1)S 2
,
2
2
1
2
2
2
Ejemplos:
n1= 18
Diseo 2
n2 =20
S12 = 10
X 1 =24.2
X 2 =23.9
S22 = 20
Solucin:
a) para un nivel de confianza del 98 % se tiene que = 1 0,98 = 0,02 y
/2 =
0,01.
x t / 2
, x + t /2
S
3.16
3,16
, 24.2+ 2.567
= 24.2 2.567.
n
18
18
= (20.38 , 26.11)
Esto significa, que por cada 100 muestras de tamao n =18 en 98 de ellas la media
poblacional cae dentro de este intervalo.
INFERENCIA ESTADISTICA
diseo 2, como n = 20 < 30, para v = 19 g.l. se tiene que t = t 0.01 = 2.539 por lo
tanto
x t / 2
, x + t /2
S
4.47
4,47
, 24.2+ 2.539
= 24.2 2.539.
n
20
20
= (21.661 , 26.739)
2
2
2
2
(1 - 2) ( X 1 X 2 ) Z . 1 + 2 , ( X 1 X 2 ) + Z . 1 + 2
n1 n2
n1 n2
2
2
10 20
10 20
( 24.2 23 .9 ) 2.33.
= (0.3 - 2.90 , 0.3 + 2.90 ) = ( 2.6 , 3.2 )
+
, ( 24.2 23 .9 ) + 2.33.
+
18
20
18 20
y 2 = 02.99 = 6,41
1-
usando la relacin:
(n 1) S 2 (n - 1)S 2
,
2
2
1
2
2
2
17.10 17 .10
,
= (5.09 , 26.52)
=
33,41 6,41
INFERENCIA ESTADISTICA
PRUEBA DE HIPTESIS
Para probar una hiptesis relativa a un parmetro se debe proceder de la siguiente
manera:
INFERENCIA ESTADISTICA
Calcular el Estadstico de Prueba:
HIPOTESIS NULA
ESTADISTICO DE PRUEBA
Grandes muestras Pequeas muestras
z=
t=
x
S
Grandes muestras
z=
( x1 x2 ) ( 1 2 )
12
n1
22
n2
Pequeas muestras
t=
( x1 x 2 ) ( 1 2 )
S p2
n1
H0 : 2 = 02 (para varianzas)
H0 : 12 = 22 (igualdad de varianzas)
2 =
F=
S p2
n2
(n 1) S 2
(nM 1) S M2
(nm 1) S m
(para proporciones)
z=
p p
p = p P =
H0 : P1 P2 = 0 (diferencia de
proporciones)
p.q
n
INFERENCIA ESTADISTICA
INFERENCIA ESTADISTICA
ya que el rea de las colas est muy cercana a cero (0,0000892649) entonces
los valores de < 0,0000892649 permiten aceptar la hiptesis nula; por lo que
el valor p = > 0,0000892649 permiten rechazar H0. Por lo tanto, es evidente
que para niveles de significacin del 1% ( =0,01), 5% (=0,05),10% (=0,1)
se rechaza H0. En conclusin se rechaza la hiptesis nula de que la
conductividad trmica del ladrillo es igual a 0,36; es decir, se acepta la
alternativa de que es diferente.
INFERENCIA ESTADISTICA
Catalizador 1 91.5
94.18 92.18
95.39 91.79
90.46 93.21
97.19
97.04
91.07
92.75
Existe alguna diferencia entre los rendimientos medios. Hallar el valor p.
Explique sus conclusiones.
Solucin:
- formulacin de hiptesis
H0: 1 - 2 = 0
Ha: 1 - 2 0
- clculo del estadstico de prueba
primero se calculan los estadsticos para la poblacin 1 y 2
respectivamente:
luego S p2 =
t=
x1 = 92,255
x 2 = 92,7325 S 22 = 2,98
7 . 2,39 + 7 . 2,98
= 2,69 , entonces se tiene que:
14
( x1 x 2 ) ( 1 2 )
S p2
n1
S12 = 2,39
S p2
n2
- 0,1775
2,69 2,69
+
8
8
= 0,6725
INFERENCIA ESTADISTICA
El valor p nos define los para el cual se rechaza H0. Considerando v = 14 g.l.
y el estadstico = -0,67 como valor crtico, se tiene que el rea a la izquierda de
0,67 y a la derecha de 0,67 es igual a 0,255. Por lo que, el valor p = >
0,255, en consecuencia, la hiptesis nula se rechaza para > 0,255. De
manera particular, se tiene que para los valores usuales de = 0,01, =0,05 y
= 0,1. La hiptesis nula H0 no se rechaza (se acepta). Por tanto, se concluye
n= 2
Donde:
n: Tamao de la muestra
. p.q
Entonces se tiene:
n= 2
. p.q
2,56
De esta forma se tiene: n =
. 0,4. 0,6 = 6.991 .
0,015
Es necesario
1,96
n=
. 0,4. 0,6 = 4098
0,015
INFERENCIA ESTADISTICA
En el caso de que no exista un Estudio Piloto.
1,96
n=
. 0,5. 0,5 = 4.268
0,015
Esto quiere decir que habr que encuestar a 4.268 personas.
Z / 2 . p.q.N
( n 1) + Z / 2 . p.q
2
INFERENCIA ESTADISTICA
Determinacin del Tamao de la Muestra en una poblacin para medias.
En este caso se utiliza la relacin:
Z .
n= 2
1,96. 800
1568
n=
=
= 1536,64 1537 neumticos
40
40
INFERENCIA ESTADISTICA
AJUSTES DE CURVAS.
Cuando se quiere estudiar la relacin entre variables se puede recurrir a dos
tipos de modelos:
a) modelo determinstico, la relacin viene definida a travs de una frmula. Por
ejemplo, sea y = x2, entonces se dice que y est en funcin de x, donde y se conoce
como variable dependiente y x variable independiente. La caracterstica
fundamental de este modelo es que para un valor particular de x siempre obtenemos
el mismo resultado en y, esto significa que la relacin entre las variables es perfecta.
Ver grfica.
INFERENCIA ESTADISTICA
Regresin simple: Se define como la curva que optimiza (minimiza), mediante el
mtodo de los mnimos cuadrados, los saltos o fluctuaciones de los datos. Es decir, es la
curva que mejor ajusta los valores del diagrama de dispersin convirtiendo el modelo
probabilstico en un modelo determinstico con la finalidad de realizar predicciones. De
igual forma, la curva de regresin permite modelar la tendencia de los valores. Los
modelos de regresin simple vienen definidos por y = f(x)+. A continuacin veamos
los distintos modelos con su respectivo ajuste o curva de regresin:
Modelos Probabilsticos
Curva de Regresin
INFERENCIA ESTADISTICA
INFERENCIA ESTADISTICA