Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Introduccin:
Como se mencion en el captulo uno las nociones de poblacin y muestra son
parte fundamental en cualquier investigacin , en este capitulo se estudiaran de
manera mas amplia, en particular en el contexto del concepto de variables
aleatorias, destacando la importancia de conocer la distribucin muestral de un
estadgrafo ya que con esta se puede realizar el proceso de inferencia del
parmetro, dado que casi nunca es posible tomar todas las muestras de una
poblacin , conociendo la distribucin del estimador se puede hacer la inferencia
del mismo a partir de una sola muestra , de igual forma se puede estimar el error
para un tamao de muestra dado.
RESUMEN
GLOSARIO
MUESTRA ALEATORIA DE TAMAO n : Es un conjunto de n individuos
tomado de tal manera que cada subconjunto de tamao n de la poblacin
tenga la misma probabilidad de ser elegido como muestra; es decir, si la
Pgina 1 de 39
poblacin tiene tamao N, cada una de las combinaciones posibles de n
elementos debe ser equiprobable.
PARAMETROS: Se llama parmetros poblacionales a cantidades que se
obtienen a partir de las observaciones de la variable y sus probabilidades y
que determinan perfectamente la distribucin de esta, as como las
caractersticas de la poblacin, por ejemplo: La media, , la varianza 2, la
proporcin de determinados sucesos, P.
ESTADISTICO: Es una medida cuantitativa, derivada de un conjunto de
datos de una muestra, con el objetivo de estimar o inferir caractersticas de
una poblacin o modelo estadstico.
Desarrollo temtico.
4.1 Teorema del lmite central.
4.2 Distribucin muestral de medias
4.3 Distribucin muestral de la varianza
4.4 Distribucin muestral de las proporciones
4.5 Estimacin por intervalos
Ejemplo:
Pgina 2 de 39
Profesor de matemticas Antigedad
A 16
B 10
C 8
D 26
1) Se pueden tener 4C2 =6 muestras posibles. La tabla lista todas las muestras
posibles de tamao 2, con sus respectivas medias muestrales.
A,B (16,10) 13
A,C (16,8) 12
A,D (16,26) 21
B,C (10,8) 9
B,D (10,26) 18
D,C (8,26) 17
16 10 8 26
15
4
13 12 21 9 18 17
x 15
6
Con lo cual podemos deducir que :
x
La media poblacional es igual a la media de todas las medias muestrales.
Pgina 3 de 39
4) La desviacin estndar de la poblacin est dada por:
x i
2
i 1
N
En este caso:
16 152 10 152 8 152 26 152 7
4
5) El error estndar o la desviacin estndar de la distribucin muestral es:
x
13 152 12 152 21 152 9 152 18 152 17 152
6
x 4,0414519
Si utilizamos la frmula del error estndar sin el factor de correccin por poblacin
finita tendramos que:
x
n
Donde " n" es el tamao de la muestra
Evaluando:
7
x 4,9497475
2
N n
x
n N 1
Pgina 4 de 39
Calculando
7 42
x 4,0414519
2 4 1
De lo cual concluimos que la desviacion estandart de las medias muestrales es
igual a la desviacion estandart poblacional sobre la raiz del tamao de las
muestras por el factor de correccion, en caso de ser poblaciones finitas.
x
Z
Donde
Z N de desviaciones es tan dart que esta" x" de la" "
x Variable Aleatoria
Media Poblaciona l
Desviacion Es tan dart Poblaciona l
Pgina 5 de 39
calcular la probabilidad del comportamiento del estadstico, en este caso la media
de la muestra , quedara de la siguiente manera:
x
Z
x
Donde
Z N de desviaciones es tan dart que esta" x" de la" "
x Media Muestral
Media Poblaciona l
x Desviacion Es tan dart de las medias muestrales
n
Desviacion Es tan dart Poblaciona l
n Tamao de muestra
En general se utiliza:
x
Z
n
y para poblaciones finitas y muestro con reemplazo:
x N n
Z
N 1
n
Ejemplo:
Una empresa elctrica fabrica 1000 focos diarios, que tienen una duracin que se
distribuye aproximadamente en forma normal, con media de 900 horas y
desviacin estndar de 50 horas. Encuentre la probabilidad de que una muestra
aleatoria de 20 focos tenga una vida promedio de:
Pgina 6 de 39
Solucin:
N= 1000
=900
n= 20
= 50
P x 890 ?
Grficamente:
Al estandarizar
Pgina 7 de 39
b)
N= 1000
=900
n= 20
= 50
P x 920 ?
Estandarizando
c)
N= 1000
=900
n= 20
= 50
P 850 x 950 ?
Estandarizando
Pgina 8 de 39
Por lo tanto
P 850 x 950 P 4,43 Z 4,43
Que en la tabla de la distribucin normal:
PZ 1,77 0,999995288 4,71165E - 06 0,999990577 100%
Z
x 1
x 2 1 2
12 22
n n
1 2
Ejemplo:
Dos tipos de pintura ofrecen un tiempo de secado promedio de 80 y 60 minutos
respectivamente con una desviacin estndar de 15 y 13 minutos , si tomamos
muestras aleatorias de tamaos 25 y 36 respectivamente .Encontrar la
probabilidad de que la media muestral calculada de las 25 mediciones exceda la
media muestral de Las 36 mediciones en por lo menos 10 minutos .
Pintura 1
1=80
n1= 25
1= 15
Pintura 2
2=60
n2= 36
2= 13
P x1 x2 10 ?
Pgina 9 de 39
Z
10 80 60 2,7
15 2 132
25 36
P x1 x2 10 PZ 2,7
Grficamente
Grupo 1
1=72
n1= 28
1= 8
Pintura 2
2=72
n2= 36
2= 8
Pgina 10 de 39
P x1 x2 3 ?
Z
3 0
8 2 82
28 36
2
n 1s 2
2
Ejemplo:
2
8 1 *1,2 2
15,75
0,8 2
Pgina 11 de 39
Este ser el valor critico (1,690) a la izquierda , y a la derecha ( 16,013)
Pgina 12 de 39
Como el estadgrafo esta dentro de estos valores podemos afirmar con un 95% de
confianza que el fabricante tiene la razn en su afirmacin respecto a la varianza
Pgina 13 de 39
4.4. Distribucin Muestral de las Proporciones2
pP N n
Z
N 1
P* Q
n
Pgina 14 de 39
Ejemplo:
La proporcin de hogares en cierta cuidad que usa gas natural es del 45% , si se
toma una muestra aleatoria de 250 hogares determinar la probabilidad de que La
proporcin de la muestra de hogares con gas natural sea :
a) menor del 40%
b) Mayor del 49%
a)
Solucin:
Datos:
n=250 Hogares
P 0,45
P p 0,40 ?
0,5
0,4 0,45
250
Z 1,65
0,45 * (1 0,45)
250
P p 0,40 PZ 1,65
PZ 1,65 0,0495 5%
Pgina 15 de 39
b)
Solucin:
Datos:
n=250 Hogares
P 0,45
P p 0,49 ?
0,5
0,49 0,45
250
Z 1,33
0,45 * (1 0,45)
250
P p 0,49 PZ 1,33
PZ 1,33 1 0,9082 0,0918 9%
Pgina 16 de 39
4.4.1. Distribucin Muestral de Diferencia de Proporciones
p1 p2 P1 P 2
Z
P1* Q1 P 2 * Q 2
n1 n2
Ejemplo
P1 = 0.25
P 2 = 0.20
n1 = 380 trabajadores
n2 = 450 trabajadores
P p1 p2 0,06 ?
Pgina 17 de 39
0,06 0,5
0.25 0.20
380 450
2
Z 0.45
0,25 * 0,75 0,2 * 0,8
380 450
P p1 p2 0,06 PZ 0.45
x
Z
n
Pgina 18 de 39
Se puede expresar as:
P Z Z Z 1
2 2
Reemplazando el estadstico Z
x
P Z Z 1
2 2
n
Despejando
x Z x Z
2 n 2 n
Donde
x : Estimador Puntual
Z : Error de Estimacion
2 n
Ejemplo:
Solucin
Para el primer intervalo de confianza (95%) tendremos en la distribucin normal:
Pgina 19 de 39
Datos
=50 horas
n=45
x 830
=?
50 50
830 1,96 830 1,96
45 45
Donde
x : 830 " Estimador Puntual "
50
1,96 14,61 : Error de Estimacion
45
Interpretacin: Con la evidencia tomada podemos afirmar que el 95% de todas las
muestras de tamao 45 la duracin de los focos estar entre 845 y 815 horas.
Pgina 20 de 39
50 50
830 2,57 830 2,57
45 45
Donde
x : 830 " Estimador Puntual "
50
2,57 19,16 : Error de Estimacion
45
ee Z
2 n
Donde
ee : Error de Estimacion
Despejando n
Z *
2
n 2
ee
Evaluando
2
1,96 * 50
n 96,04 96
10
x
T
s
n
Tiene una distribucin t de Student con n-1 grados de libertad.
3
La apariencia general de la distribucin t es similar a la de la distribucin normal
estndar: ambas son simtricas y unimodales, y el valor mximo de la ordenada
se alcanza en la media 0 Sin embargo, la distribucin t tiene colas ms
amplias que la normal; esto es, la probabilidad de las colas es mayor que en la
Pgina 21 de 39
distribucin normal. A medida que el nmero de grados de libertad tiende a infinito,
la forma lmite de la distribucin t es la distribucin normal estndar.
3
Tomado de: www.itch.edu.mx/academic/industrial/estadistica1/cap03.html
P t T t 1
2 2
Reemplazando el estadstico
t 1
x
P t
2 s 2
n
Despejando
s s
x t x t
2 n 2 n
Donde
x : Estimador Puntual
s
t : Error de Estimacion
2 n
Ejemplo
Pgina 22 de 39
xi
3200
3800
2800
3500
2900
3000
3700
2600
3500
3300
2600
2500
3200
2900
3150
2700
3600
Encontrar un intervalo de confianza del 95% para la resistencia media de toda la
placa. Adems la interventora establece que si el lmite inferior de la estimacin
esta por debajo de 3000 P.S.I. se tendr que demoler la placa.
Solucin
x 3114,705882
s 409,1777983
n=17
Los valores crticos para un intervalo de confianza del 95% con v=17-1 =16 grados
de libertad sern :
Pgina 23 de 39
En la tabla de la distribucin t el valor critico se establece asi:
Pgina 24 de 39
La estimacin por intervalos ser:
Pgina 25 de 39
409,18 409,18
3114,71 2,120 3114,71 2,120
17 17
Donde
Estimador Puntual 3114,71
Error de Estimacion 210,39
pP
Z
p*q
n
De la misma manera que en la estimacin de medias para muestras grandes
conociendo la desviacin estandart poblacional , para un intervalo de confianza
con la distribucin normal la estimacin por intervalos esta dada por:
p*q p*q
p Z * P p Z *
2 n 2 n
Donde
p : Pr oporcion muestral Estimador Puntual
q 1 p
p*q
Z * : Error de Estimacion
2 n
P : Pr oporcion Poblaciona l
Pgina 26 de 39
Ejemplo:
En cierta cuidad se selecciona una muestra aleatoria de 500 votantes y se
encuentra que 180 aprueban la gestin del alcalde .Encuentre el intervalo de
confianza del 96% para la fraccin de la poblacin votante que favorece la gestin
del alcalde. De otra parte cual debe ser el tamao de la muestra para que el error
de estimacin sea del 2%
Solucin:
180 320 180 320
*
*
180 180
2,05 * 500 500 P 2,05 * 500 500
500 500 500 500
Donde
p : Pr oporcion muestralEstimador Puntual 0,36
q 1 p 0,64
Error de Estimacion 0,04
2
Z
n 2 * p*q
ee
Evaluando
2
2.05
n * 0,36 * 0,64
0,02
n 2420,64 2421
Es decir se necesita consultar a 2421 personas para que el error de estimacin
sea del 2%.
Pgina 27 de 39
normales e independientes con varianzas desconocidas pero iguales, entonces un
intervalo de confianza del 1 por ciento para la diferencia entre medias es:
x 1
x 2 t * S p
2
1 1
n1 n2
1 2 x1 x 2 t * S p
2
1 1
n1 n2
Donde
x1 x 2 : Estimador Puntual
1 1
t * S p : Error de Estimacion
2 n1 n2
Con
2
SP
n1 1s12 n2 1s22
n1 n2 2
v n1 n2 2 "Grados de Libertad "
Ejemplo:
4
Un experimento publicado en una revista cientfica compara las economas en
combustible para dos tipos de camiones compactos a disel con similares
caractersticas. Se utilizaron 12 camiones Nissan y 10 Toyota en pruebas a
velocidad constante , si los camiones Nissan promediaron 16 km/litro, con una
desviacin estndar de 1 km/litro y los Toyota promediaron 11 km/litro, con una
desviacin estndar de 0,8 km/litro , construya un intervalo de confianza del 95%
para la diferencia entre los kilmetros promedio de estos dos camiones compactos
.Suponga que las distancias por litro para cada modelo de camin estn
distribuidas de forma aproximadamente normal con varianzas iguales.
4
Problema Propuesto Pagina 298 ( 9.42) en el libro de : Probabilidad y Estadstica
para Ingeniera y Ciencias Autores: Walpole , Myers y Myers Ye, Editorial Pearson
, edicin Octava 2007
Pgina 28 de 39
Solucin:
Nissan Toyota
x1 16 x 2 11
n 12 n 10
s1 1 s2 0,8
t 2,086
2
La varianza muestral asociada:
n 1s12 n2 1s22
S P2 1
n1 n2 2
12 112 10 10,82
S P2
20
S P 0,838
2
S P 0,915423399
El intervalo de confianza
x 1
x 2 t * S p
2
1
1
n1 n2
1 2 x1 x 2 t * S p
2
1
1
n1 n2
16 11 2,086 * 0,9154 1
1
1 2 16 11 2,086 * 0,9154
1
1
12 10 12 10
Donde
x1 x 2 5 " Estimador Puntual "
1 1
t * S p 0,82 " Error de Estimacion "
2 n1 n2
Pgina 29 de 39
5 0,82 5,82 6 Limite Superior
1 2
5 0,82 4,18 4 Limite Inferior
La diferencia de consumo entre los camiones Nissan y Toyota estar entre 4 y 6
kilmetros por litro a favor de Nissan ( ms econmico).
T
x1
x 2 1 2
S12 S 22
n1 n2
Con grados de Libertad:
2
s12 s22
v 12
n n2
2
s12 s22
n1 n2
n1 1 n2 1
Si despejamos del estadstico la diferencia de medias poblacionales la estimacin
por intervalos estar dada por:
Pgina 30 de 39
x x t
1 2
2
S12 S 22
n1 n2
1 2 x1 x 2 t
2
S12 S 22
n1 n2
Donde
x1 x 2 : Estimador Puntual
S12 S 22
t : Error de Estimacion
2 n1 n2
Con
2
s12 s22
v 12 2 2 :Grados de Libertad
n n
s12 s22
n1 n2
n1 1 n2 1
Ejemplo:
5
Una compaa de taxis trata de decidir si comprar neumticos de la marca A o de
la B para su flotilla. Para estimar la diferencia de las dos marcas, se lleva a cabo
un experimento utilizando 12 neumticos de cada marca .Los neumticos se
utilizan hasta que se desgastan los resultados fueron:
5
Problema Propuesto Pagina 298 ( 9.43) en el libro de : Probabilidad y Estadstica
para Ingeniera y Ciencias Autores: Walpole , Myers y Myers Ye, Editorial Pearson
, edicin Octava 2007
Pgina 31 de 39
Solucin:
Los grados de libertad:
2
5000 2 8500 2
12 12
v 2 2
17,79847307 18
5000 2 8500 2
12 12
12 1 12 1
El valor critico en la tabla t para estos grados de libertad.
t 2,101
2
El intervalo de confianza
x 2
x1 t
2
S12 S 22
n1 n2
2 1 x 2 x1 t
2
S12 S 22
n1 n2
Donde
x 2 x1 1.800 " Estimador Puntual "
2 2
S S
t 1
5981,08858 " Error de Estimacion "
2
2 n1 n2
Pgina 32 de 39
mismos autos con llantas regulares con cinturn y se manejan una vez ms por el
recorrido de prueba. Se registra el consumo de gasolina, en kilmetros por litro, de
la siguiente manera:
Automvil Llantas radiales Llantas con cinturn
1 4.2 4.1
2 4.7 4.9
3 6.6 6.2
4 7.0 6.9
5 6.7 6.8
6 4.5 4.4
7 5.7 5.7
8 6.0 5.8
9 7.4 6.9
10 4.9 4.9
11 6.1 6.0
12 5.2 4.9
13 5.7 5.3
14 6.9 6.5
15 6.8 7.1
16 4.9 4.8
6
Similar al propuesto en la pagina 360 (10.43) en el libro de: Probabilidad y
Estadstica para Ingeniera y Ciencias Autores: Walpole , Myers y Myers Ye,
Editorial Pearson , edicin Octava 2007
Pgina 33 de 39
SD S
d t D d t D
2 n 2 n
Donde D Media de las diferencia s para la poblacion en la economia de combustible
La notacin de D es para recordar que la muestra pareada produce datos de
diferencia . La media y la desviacin estandart de la muestra esta dada por:
n
d
i 1
i
d Media de las diferencias
n
d
n
2
i d
SD i 1
Desviacin Estandart para la diferencia de medias
n 1
Si suponemos que la poblacin tiene distribucin normal , se puede aplicar la
distribucin t con n-1 grados de libertad
d
Llantas Llantas con 2
Automvil radiales cinturn di i d
1 4,2 4,1 0,1 0,00097656
2 4,7 4,9 -0,2 0,10972656
3 6,6 6,2 0,4 0,07222656
4 7 6,9 0,1 0,00097656
5 6,7 6,8 -0,1 0,05347656
6 4,5 4,4 0,1 0,00097656
7 5,7 5,7 0 0,01722656
8 6 5,8 0,2 0,00472656
9 7,4 6,9 0,5 0,13597656
10 4,9 4,9 0 0,01722656
11 6,1 6 0,1 0,00097656
12 5,2 4,9 0,3 0,02847656
13 5,7 5,3 0,4 0,07222656
14 6,9 6,5 0,4 0,07222656
15 6,8 7,1 -0,3 0,18597656
16 4,9 4,8 0,1 0,00097656
Sumas 2,1 0,774375
n
d i 1
i
2.1
d 0.13125
n 16
d
n
2
i d
0.477375
SD i 1
0.2272
n 1 16 1
Pgina 34 de 39
El valor critico para v=16-1=15 grados de libertad
t 2,131
2
La estimacin
0,23 0,23
0,13 2,131 D 0,13 2,131
16 16
0,13 0,25 0,38 Limite Superior
D
0,13 0,25 0,12 Limite Inferior
Para este caso se usara la distribucin chi cuadrado que no es simtrica por lo
tanto los valores crticos son diferentes por ejemplo para 24 grados de libertad con
un intervalo de confianza de 95% sus valores son :
n 1s 2 2
n 1s 2
12 2
2 2
Ejemplo ( Tomado de Walpole Myers Pagina 307) , Probabilidad y Estadstica
para Ingeniera y Ciencias , Octava edicin , Editorial Pearson)
Solucin:
Pgina 35 de 39
al elevar este resultado al cuadrado se obtiene la varianza de la muestra
s2= 0.286.
Pgina 36 de 39
Se observa que la varianza corre en sentido contrario, pero esto es slo en
la grfica. La interpretacin quedara similar a nuestros temas anteriores
referentes a estimacin. Con un nivel de confianza del 95% se sabe que la
varianza de la poblacin de los pesos de los paquetes de semillas de pasto
esta entre 0.135 y 0.935 decagramos al cuadrado.
4.6 Autoevaluacin
Pgina 37 de 39
6) Se llevan a cabo dos experimentos independientes en lo que se comparan
dos tipos diferentes de pintura. Se pintan 18 especmenes con el tipo A y en
cada uno se registra el tiempo de secado en horas. Lo mismo se hace con el
tipo B. Se sabe que las desviaciones estndar de la poblacin son ambas
1.0. Suponga que el tiempo medio de secado es igual para los dos tipo de
pintura. Encuentre la probabilidad de que la diferencia de medias en el
tiempo de secado sea mayor a uno a favor de la pintura A.
Problema Propuesto en :
http://www.itch.edu.mx/academic/industrial/estadistica1/cap01c.html
7) Una muestra de 6 latas de sopa producidas por dos compaas produjo los
siguientes pesos netos, medidos en onzas:
Similar al planteado en :
http://www.itch.edu.mx/academic/industrial/estadistica1/cap03e.html
Medicamento 1 Medicamento 2
n1 = 14 n2 = 16
x1 = 17 x2 = 19
Pgina 38 de 39
Encuentre un intervalo de confianza de 99% para la diferencia promedio en
el tiempo de recuperacin para los dos medicamentos, suponga poblaciones
normales con varianzas iguales.
10)Una muestra de 12 latas de sopa producida por cierta compaa produjo los
siguientes pesos netos, medidos en onzas:
11.9 12.2 11.6 12.1 12.1 11.8
11.9 11.8 12.0 12.3 11.8 12.0
Si se supone normalidad en los pesos, construya un intervalo de confianza
del 95% para la varianza de todas las latas de sopa producidas por la
compaa.
Pgina 39 de 39