Está en la página 1de 25

Distribuciones

Muestrales
INFERENCIA ESTADÍSTICA
JTP. JUAN PABLO QUIROGA
Temario
vMuestras Aleatorias
vTeorema del Limite Central
vLa distribución muestra de la media muestral
vLa distribución muestral de la proporción muestral
vPlanes muestrales y diseños experimentales.
vEstadísticas y distribuciones muestrales.
Muestras Aleatorias
La forma en que una muestra se selecciona recibe el nombre de Plan Muestral o Diseño
experimental y determina la cantidad de información de una muestra. Saber el plan muestral
empleado permite determinar la confiabilidad de la Inferencia.
Muestreo aleatorio simple: Si una muestra de n elementos se selecciona de entre una población
de N elementos, usando un plan muestral en el que cada una de las
posibles muestras tiene la misma probabilidad de selección.
Muestreo aleatorio estratificado: Consiste en seleccionar una muestra aleatoria simple de cada
uno de uno de un número dado de subpoblaciones o estratos.
Muestreo aleatorio Conglomerado: Es una muestra aleatoria simple tomada de los
conglomerados disponibles en la población.
Muestras Aleatorias
Muestreo Aleatorio Sistemático 1 en k: involucra la selección aleatoria de uno de los primeros k
elementos de una población ordenada y luego la
selección sistemática de cada k-esimo elemento de ahí
en adelante.
Estadística y Distribuciones Muestrales
La definición muestral de una estadística es la distribución de probabilidad para los posibles
valores de la estadística, que resulta cuando muestras aleatorias de tamaño n se sacan
repetidamente de la población
Existen tres formas para hallar la distribución muestral de estadística
1. Deducir matemáticamente usando leyes de probabilidad.
2. Usar una simulación para aproximar la distribución (Sacar un gran número de muestras de
tamaño n, calculando el valor de la estadística à Tabular à Histograma de frecuencia
relativa. à Nos da muy cerca de distribución muestral teorica.
3. Usar teoremas estadísticos para obtener distribuciones muestrales exactas o aproximadas.
Teorema del Limite Central
El teorema del limite central establece que , en condiciones mas bien generales, las sumas y medias de muestras
aleatorias de mediciones tomadas de una población tienden a tener una distribución aproximadamente normal.
“Si muestras aleatorias de n observaciones se sacan de una población no normal con media finita µ desviación
estándar s, entonces, cuando n es grande, la distribución de muestreo de la media muestral x esta distribuida
normalmente en forma aproximada, con media µ y desviación estándar s “
𝜎
√𝑛
La aproximación se hace mas precisa cuando n se hace grande. Y las probabilidades se calculan usando la variable
aleatoria estándar:
𝐸𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 − 𝑚𝑒𝑑𝑖𝑎 𝑥̅ − 𝜇
𝑧= = 𝜎
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟
√𝑛
Error Estándar
La desviación estándar de una estadística empelada como estimador de un parámetro
poblacional también se denomina error estándar del estimador (SE) por que se refiere a la
precisión del estimador. Por lo tanto la desviación estándar de Escriba aquí la ecuación.
𝜎
𝑆𝐸 𝑥̅ =
√𝑛
Ejercicio
El CI de los alumnos de un centro, se distribuye normalmente con media 80 y desviación
estándar (𝜎) 10. Si extraemos una muestra aleatoria simple de 25 alumnos:
a) Si se extrae un sujeto al azar ¿cuál es la probabilidad de que obtenga como mínimo una
puntuación en CI de 75?
b) Cual es la probabilidad de que su media aritmética sea mayor de 75?
c) ¿cuál es la probabilidad de que su media aritmética sea como máximo 83?
d) ¿qué valor debería tomar la media aritmética para que la probabilidad de obtenerlo en esa
muestra sea como máximo 0,85?
Resolución
O̅ PQ UVPWX
a) 𝑃 𝑋 ≥ 75 = 𝑃 𝑧 ≥ R
=P z≥
YX
= 𝑃 𝑧 ≥ −0,5 = 0,6915
O̅ PQ UVPWX
b) 𝑃 𝑋 ≥ 75 = 𝑃 𝑧 ≥ _ =P z≥
YX/V
= 𝑃 𝑧 ≥ −2,5 = 0,9938
√`
O̅ PQ WfPWX
c) 𝑃 𝑋 ≤ 83 = 𝑃 𝑧 ≤ _ =P z≤
YX/V
= 𝑃 𝑧 ≤ 1,5 = 0,9332
√`

OjPWX YX
d) 𝑃 𝑋 ≤ 𝑋𝑖 = 0,85 → 𝑧0,85 = 1,04 = YX/V
= 𝑋𝑖 = 1,04 ∗
V
+ 80 = 82,08
Resolver
La duración de la enfermedad de Alzheimer desde el principio de los síntomas hasta el
fallecimiento varia de 3 a 20 años; el promedio es de 8 años con una desviación estándar de 4
años. El administrador de un centro medico selecciona al azar los registros médicos de 30
pacientes de Alzheimer ya fallecidos, de la base de datos del centro medico y anota la duración.
Encuentre las probabilidades aproximadas de estos eventos:
1. La duración Promedio es menor a 7 años.
2. La duración promedio excede a 7 años
3. La duración promedio esta a no mas de 1 año de la media poblacional 𝜇 = 8.
Resolución
Como se sacaron muestras aleatorias de la base de datos, se pueden sacar conclusiones acerca delos pacientes
pasados, presentes o futuros de Alzheimer de el centro medico, si el centro medico es representativo ( gran
Muestra) es posible sacar conclusiones de mas alcance.
La muestra no es simétrica, ya que la media no esa a la mitad de los valores mínimos y máximos, como la media
esta mas cerca del mínimo, la muestra esta sesgada a la derecha., con unos pocos pacientes viviendo largo
tiempo después de iniciada la enfermedad.
O̅ PQ UPW
1. 𝑃 𝑋<7 =𝑃 𝑧< _ =P z<
n/√fX
= 𝑃 𝑧 < −1.37 = 0,0853
√`
R
Usamos la en la formula para sacar z por que estamos buscando un área bajo la distribución normal para
o
xmedia, no bajo l adistribución d eprobabilidad para x.
1. El evento de que x exceda de 7 es el complemento del evento de que x sea menor que 7, entonces:
𝑃 𝑥̅ > 7 = 1 − 𝑃 𝑥̅ < 7 = 1 − 0,0853 = 0,917
La probabilidad de que x se encuentre a no mas de 1 año de 𝜇 = 8.
El valor de z para x = 7 es de -1,37 y z para x=9 es:
O̅ PQ rPW
𝑧 = _ = = 1.37
n/√fX
√`

P(7< 𝑥̅ < 9) = P(-1,37 < z < 1,37) = 0,9147 – 0,0853 = 0,8294


Resolver 2
Supongamos que el profesorado de una universidad, con el rango de profesor en instituciones
publicas que imparten carreras de dos años, ganan en promedio 71802 pesos por año con una
desviación estándar de 4000 pesos. En un intento por verificar este nivel de salario se selecciono
una muestra aleatoria de 60 profesores de entre una base de datos del personal para todas las
instituciones de dos años en Argentina.
1. Describa la distribución muestral de la media muestral 𝑥̅
2. ¿Dentro de que limites se esperaría que este el promedio mensual con probabilidad de .95?
3. Calcule la probabilidad de que la media muestral 𝑥̅ sea mayor que 73000 pesos.
4. Si su muestra aleatoria en realidad produjo una media de 73000 pesos ¿Consideraría que
esto es poco común? ¿qué conclusiones Obtendría?
Resolver 3
Un articulo en el American Demographics dice que mas del doble de compradores salen de
compras los fines de semana que durante la semana. No solo eso, porque esos compradores
tambien gastan mas dinero en sus compras en sábados y domingos. Suponga que la cantidad de
dinero gastada en centros comerciales, entre las 4 pm y 6 pm los domingos tiene una
distribución normal con media de $85 y una desviación estándar de $20. Un comprador se
selecciona al azar un domingo entre las 4pm y las 6pm y se le pregunta sobre su forma de gastar.
a) ¿cuál es la probabilidad de que el haya gastado mas de $95 en el centro comercial?
b) ¿cuál es la probabilidad de que el haya gastado entre $95 y $115?
c) Si dos compradores se seleccionan al azar ¿cuál es la probabilidad de que ambos
compradores hayan gastado mas de $115 en el centro comercial?
Distribución Muestral de la Proporción
Muestral
Si una muestra aleatoria de n observaciones se selecciona de una población binomial con
parámetro p, entonces la distribución muestral de la proporción muestral:
O
𝑝̂ =
o

Y tendrá una media 𝑝


Y una desviación estándar
u.v
𝑆𝐸 𝑝̂ = √ donde 𝑞 = 1 − 𝑝
o

Cuando el tamaño muestral de n es grande, la distribución muestral de𝑝̂ puede ser aproximada
por una distribución normal. La aproximación será adecuada si n.p > 5 y n.q > 5
Resolver
En una encuesta se pregunto a 500 madres y padres sobre la importancia del deporte para hijos
e hijas. De los padres entrevistados 60% estuvo de acuerdo en que los géneros son iguales y
deben tener iguales oportunidades de participar en deportes.
Describa la distribución muestral de la proporción muestral p de padres que están de acuerdo
en que los géneros son iguales y deben tener iguales oportunidades.
Resolución
Se puede suponer que los 500 padres representan una muestra aleatoria de los padres de todos
los hijos e hijas de Argentina y que la verdadera proporción de la población es igual a algún
valor desconocido que se puede llamar p.
La distribución muestral de𝑝̂ , puede ser aproximada por una distribución muestral con media
igual a p, ya que si se verifican las condiciones que permiten la aproximación normal a la
distribución de p, se puede ver que n=500 es adecuado para valores de p cercanos a 0,6 por que
tanto n.p = 300 como n.q =200 son mayores que 5
u.v uy.vy X,zX .(X,nX)
𝑆𝐸(𝑝̂ ) = ≈ = = 0,22
o o VXX
Como calcular probabilidades para la
proporción muestral 𝑝̂
1. Encuentre los valores necesarios de n y p.
2. Verifique si la aproximación normal a la distribución binomial es apropiada ( n.p>5 y n.q>5)
3. Escriba el evento de interés en términos de 𝑝̂ y localice el área apropiada en la curva normal.
4. Convierta los valores necesarios de 𝑝̂ en valores de z usando:
𝑝̂ . 𝑝
𝑧=
𝑝. 𝑞
𝑛
1. Use la tabla de distribución normal para calcular la probabilidad
Resolver
En una encuesta se pregunto a 500 madres y padres sobre la importancia del deporte para hijos
e hijas. De los padres entrevistados 60% estuvo de acuerdo en que los géneros son iguales y
deben tener iguales oportunidades de participar en deportes.
Describa la distribución muestral de la proporción muestral p de padres que están de acuerdo
en que los géneros son iguales y deben tener iguales oportunidades.
Ahora el dato de p = 0,55
¿Cuál es la probabilidad de observar una proporción muestral igual de grande o mayor que el
valor observado de 𝑝̂ = 0,60
Resolución
p = 0,55 y
u.v X,VV .(X.nV)
SE= = = 0,22
o VXX

Para encontrar el área bajo la curva, primero se debe calcular el valor de z correspondiente a 𝑝̂ =
0,60
uyPu X,zX P(X,VV)
𝑧 = = = 2.25
{.| X,}}}
`

P(𝑝̂ >0,60) ≈ 𝑃 𝑧 > 2.25 = 1 − 0,9878 = 0.0122


Por lo tanto si seleccionáramos una muestra aleatoria de n= 500 observaciones de una
población con proporción p = 0,55, la probabilidad de que la proporción muestral 𝑝̂ fuera tan
grande o mayor que 0,60 es de solo 0,0122
Ejercicios a resolver
1- Una Muestra aleatoria de n observaciones se selecciona de una población con desviación estándar
σ = 1. Calcule el error estándar de la media (SE) para estos valores de n
n=1 ; n=2; n=4
2. Se selecciona una muestra aleatoria de tamaño n=49 de una población con media µ=53 y
desviación estándar σ =21
¿Cuál será la forma aproximada de la distribución muestral de 𝑥̅ ?
¿Cuáles serán la media y la desviación estándar de la distribución muestral 𝑥̅ ?
3. Se selecciona una muestra aleatoria de tamaño n=40 de una población con media µ=100 y
desviación estándar σ=20
¿Cuál será la forma aproximada de la distribución muestral de 𝑥̅ ?
¿Cuáles serán la media y la desviación estándar de la distribución muestral 𝑥̅ ?
Ejercicios a resolver:
4.- Suponga que se selecciona una muestra aleatoria de n= 25 observaciones de una población
que esta distribuida normalmente, con media igual a 106 y desviación estándar igual a 12.
◦ Dé la media y desviación estándar de la distribución muestral de la media muestral 𝑥̅
◦ Encuentre la probabilidad de que 𝑥̅ exceda 110
◦ Encuentre la probabilidad de que la media muestral se desvíe de la media poblacional µ = 106 en no
mas de 4
5.- Se seleccionaron muestras aleatorias de tamaño n de poblaciones binomiales con parámetros
poblacionales p dados aquí. Encuentre la media y la desviación estándar de la distribución muestral de la
proporción 𝑝̂ en cada caso:
a) n= 100; p=0,3
b) n= 400; p=0,1
c) n= 250; p=0,6
Ejercicios a resolver
6.- Se seleccionaron muestras aleatorias de tamaño n = 75 de una población binomial con p=
0,4. Use la distribución normal para aproximar las siguientes probabilidades:
a) P(𝑝̂ ≤ 0,43)
b) P(0,35 ≤ 𝑝̂ ≤ 0,43)
7) Calcule 𝑆𝐸(𝑝̂ ) para n= 100 y estos valores de p:
a) p= 0,01 b) p= 0,10 c) p= 0,30 d) p= 0,50 e) p= 0,70
f) p= 0,90 g) p= 0,99
¿Para que valor de p es máxima la desviación estándar de la distribución muestral de 𝑝̂ ?
¿Qué ocurre al error estándar cuando p es cercano a 0 o 1?
Ejercicios a resolver
8.- Se selecciona una muestra aleatoria de tamaño n=80 de una distribución binomial con
proporción poblacional p = 0,25
a) ¿Cuál será la forma aproximada de la distribución muestral de 𝑝̂ ?
b) ¿Cuáles serán la media y la desviación estándar ( o error estándar) de la distribución muestral
de 𝑝̂ ?
c) Encuentre la probabilidad de que la proporción muestral 𝑝̂ cuando n= 400 y p= 0,80?

También podría gustarte