Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Muestrales
INFERENCIA ESTADÍSTICA
JTP. JUAN PABLO QUIROGA
Temario
vMuestras Aleatorias
vTeorema del Limite Central
vLa distribución muestra de la media muestral
vLa distribución muestral de la proporción muestral
vPlanes muestrales y diseños experimentales.
vEstadísticas y distribuciones muestrales.
Muestras Aleatorias
La forma en que una muestra se selecciona recibe el nombre de Plan Muestral o Diseño
experimental y determina la cantidad de información de una muestra. Saber el plan muestral
empleado permite determinar la confiabilidad de la Inferencia.
Muestreo aleatorio simple: Si una muestra de n elementos se selecciona de entre una población
de N elementos, usando un plan muestral en el que cada una de las
posibles muestras tiene la misma probabilidad de selección.
Muestreo aleatorio estratificado: Consiste en seleccionar una muestra aleatoria simple de cada
uno de uno de un número dado de subpoblaciones o estratos.
Muestreo aleatorio Conglomerado: Es una muestra aleatoria simple tomada de los
conglomerados disponibles en la población.
Muestras Aleatorias
Muestreo Aleatorio Sistemático 1 en k: involucra la selección aleatoria de uno de los primeros k
elementos de una población ordenada y luego la
selección sistemática de cada k-esimo elemento de ahí
en adelante.
Estadística y Distribuciones Muestrales
La definición muestral de una estadística es la distribución de probabilidad para los posibles
valores de la estadística, que resulta cuando muestras aleatorias de tamaño n se sacan
repetidamente de la población
Existen tres formas para hallar la distribución muestral de estadística
1. Deducir matemáticamente usando leyes de probabilidad.
2. Usar una simulación para aproximar la distribución (Sacar un gran número de muestras de
tamaño n, calculando el valor de la estadística à Tabular à Histograma de frecuencia
relativa. à Nos da muy cerca de distribución muestral teorica.
3. Usar teoremas estadísticos para obtener distribuciones muestrales exactas o aproximadas.
Teorema del Limite Central
El teorema del limite central establece que , en condiciones mas bien generales, las sumas y medias de muestras
aleatorias de mediciones tomadas de una población tienden a tener una distribución aproximadamente normal.
“Si muestras aleatorias de n observaciones se sacan de una población no normal con media finita µ desviación
estándar s, entonces, cuando n es grande, la distribución de muestreo de la media muestral x esta distribuida
normalmente en forma aproximada, con media µ y desviación estándar s “
𝜎
√𝑛
La aproximación se hace mas precisa cuando n se hace grande. Y las probabilidades se calculan usando la variable
aleatoria estándar:
𝐸𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 − 𝑚𝑒𝑑𝑖𝑎 𝑥̅ − 𝜇
𝑧= = 𝜎
𝐷𝑒𝑠𝑣𝑖𝑎𝑐𝑖ó𝑛 𝑒𝑠𝑡𝑎𝑛𝑑𝑎𝑟
√𝑛
Error Estándar
La desviación estándar de una estadística empelada como estimador de un parámetro
poblacional también se denomina error estándar del estimador (SE) por que se refiere a la
precisión del estimador. Por lo tanto la desviación estándar de Escriba aquí la ecuación.
𝜎
𝑆𝐸 𝑥̅ =
√𝑛
Ejercicio
El CI de los alumnos de un centro, se distribuye normalmente con media 80 y desviación
estándar (𝜎) 10. Si extraemos una muestra aleatoria simple de 25 alumnos:
a) Si se extrae un sujeto al azar ¿cuál es la probabilidad de que obtenga como mínimo una
puntuación en CI de 75?
b) Cual es la probabilidad de que su media aritmética sea mayor de 75?
c) ¿cuál es la probabilidad de que su media aritmética sea como máximo 83?
d) ¿qué valor debería tomar la media aritmética para que la probabilidad de obtenerlo en esa
muestra sea como máximo 0,85?
Resolución
O̅ PQ UVPWX
a) 𝑃 𝑋 ≥ 75 = 𝑃 𝑧 ≥ R
=P z≥
YX
= 𝑃 𝑧 ≥ −0,5 = 0,6915
O̅ PQ UVPWX
b) 𝑃 𝑋 ≥ 75 = 𝑃 𝑧 ≥ _ =P z≥
YX/V
= 𝑃 𝑧 ≥ −2,5 = 0,9938
√`
O̅ PQ WfPWX
c) 𝑃 𝑋 ≤ 83 = 𝑃 𝑧 ≤ _ =P z≤
YX/V
= 𝑃 𝑧 ≤ 1,5 = 0,9332
√`
OjPWX YX
d) 𝑃 𝑋 ≤ 𝑋𝑖 = 0,85 → 𝑧0,85 = 1,04 = YX/V
= 𝑋𝑖 = 1,04 ∗
V
+ 80 = 82,08
Resolver
La duración de la enfermedad de Alzheimer desde el principio de los síntomas hasta el
fallecimiento varia de 3 a 20 años; el promedio es de 8 años con una desviación estándar de 4
años. El administrador de un centro medico selecciona al azar los registros médicos de 30
pacientes de Alzheimer ya fallecidos, de la base de datos del centro medico y anota la duración.
Encuentre las probabilidades aproximadas de estos eventos:
1. La duración Promedio es menor a 7 años.
2. La duración promedio excede a 7 años
3. La duración promedio esta a no mas de 1 año de la media poblacional 𝜇 = 8.
Resolución
Como se sacaron muestras aleatorias de la base de datos, se pueden sacar conclusiones acerca delos pacientes
pasados, presentes o futuros de Alzheimer de el centro medico, si el centro medico es representativo ( gran
Muestra) es posible sacar conclusiones de mas alcance.
La muestra no es simétrica, ya que la media no esa a la mitad de los valores mínimos y máximos, como la media
esta mas cerca del mínimo, la muestra esta sesgada a la derecha., con unos pocos pacientes viviendo largo
tiempo después de iniciada la enfermedad.
O̅ PQ UPW
1. 𝑃 𝑋<7 =𝑃 𝑧< _ =P z<
n/√fX
= 𝑃 𝑧 < −1.37 = 0,0853
√`
R
Usamos la en la formula para sacar z por que estamos buscando un área bajo la distribución normal para
o
xmedia, no bajo l adistribución d eprobabilidad para x.
1. El evento de que x exceda de 7 es el complemento del evento de que x sea menor que 7, entonces:
𝑃 𝑥̅ > 7 = 1 − 𝑃 𝑥̅ < 7 = 1 − 0,0853 = 0,917
La probabilidad de que x se encuentre a no mas de 1 año de 𝜇 = 8.
El valor de z para x = 7 es de -1,37 y z para x=9 es:
O̅ PQ rPW
𝑧 = _ = = 1.37
n/√fX
√`
Cuando el tamaño muestral de n es grande, la distribución muestral de𝑝̂ puede ser aproximada
por una distribución normal. La aproximación será adecuada si n.p > 5 y n.q > 5
Resolver
En una encuesta se pregunto a 500 madres y padres sobre la importancia del deporte para hijos
e hijas. De los padres entrevistados 60% estuvo de acuerdo en que los géneros son iguales y
deben tener iguales oportunidades de participar en deportes.
Describa la distribución muestral de la proporción muestral p de padres que están de acuerdo
en que los géneros son iguales y deben tener iguales oportunidades.
Resolución
Se puede suponer que los 500 padres representan una muestra aleatoria de los padres de todos
los hijos e hijas de Argentina y que la verdadera proporción de la población es igual a algún
valor desconocido que se puede llamar p.
La distribución muestral de𝑝̂ , puede ser aproximada por una distribución muestral con media
igual a p, ya que si se verifican las condiciones que permiten la aproximación normal a la
distribución de p, se puede ver que n=500 es adecuado para valores de p cercanos a 0,6 por que
tanto n.p = 300 como n.q =200 son mayores que 5
u.v uy.vy X,zX .(X,nX)
𝑆𝐸(𝑝̂ ) = ≈ = = 0,22
o o VXX
Como calcular probabilidades para la
proporción muestral 𝑝̂
1. Encuentre los valores necesarios de n y p.
2. Verifique si la aproximación normal a la distribución binomial es apropiada ( n.p>5 y n.q>5)
3. Escriba el evento de interés en términos de 𝑝̂ y localice el área apropiada en la curva normal.
4. Convierta los valores necesarios de 𝑝̂ en valores de z usando:
𝑝̂ . 𝑝
𝑧=
𝑝. 𝑞
𝑛
1. Use la tabla de distribución normal para calcular la probabilidad
Resolver
En una encuesta se pregunto a 500 madres y padres sobre la importancia del deporte para hijos
e hijas. De los padres entrevistados 60% estuvo de acuerdo en que los géneros son iguales y
deben tener iguales oportunidades de participar en deportes.
Describa la distribución muestral de la proporción muestral p de padres que están de acuerdo
en que los géneros son iguales y deben tener iguales oportunidades.
Ahora el dato de p = 0,55
¿Cuál es la probabilidad de observar una proporción muestral igual de grande o mayor que el
valor observado de 𝑝̂ = 0,60
Resolución
p = 0,55 y
u.v X,VV .(X.nV)
SE= = = 0,22
o VXX
Para encontrar el área bajo la curva, primero se debe calcular el valor de z correspondiente a 𝑝̂ =
0,60
uyPu X,zX P(X,VV)
𝑧 = = = 2.25
{.| X,}}}
`