Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Clase 3
Clase 3
adrianap.pachon@urosario.edu.co
Estadística Inferencial
Outline
Resumen
Tipos de muestreo
Estimación puntual
Resumen
Inferencia Estadística
𝐸 𝑋ത = 𝜇
𝜎
𝜎𝑥 =
𝑛
𝜎 𝑁−𝑛
𝜎𝑥 = ∗
𝑛 𝑁−1
Resumen
Distribución de proporciones muestrales
Podemos utilizar la proporción muestral para hacer inferencias sobre la proporción poblacional.
Proporción muestral
𝑋
𝑃 =
𝑛
X es la suma de un conjunto de n variables aleatorias de Bernoulli independientes, cada una de las cuales tiene una probabilidad
de éxito P. El número de éxitos en una distribución binomial y la proporción de éxitos tienen una distribución de la que la
distribución normal es una buena aproximación. La aproximación es muy buena cuando : nP 1 − P > 9
𝑃(1 − 𝑃)
𝜎𝑃 =
𝑛
3) Si el tamaño de la muestra es grande, la variable aleatoria
𝑃 − 𝑃
𝑍=
𝜎𝑃
Resumen
Teorema del límite central
Sean 𝑋1 , 𝑋2 , … , 𝑋𝑛 una colección de n variables aleatorias INDEPENDIENTES e
IDENTICAMENTE DISTRIBUIDAS (iid) con 𝐸 𝑋𝑖 = 𝜇 y 𝑉𝑎𝑟 𝑋𝑖 = 𝜎 2 .
Entonces, para n suficientemente grande, 𝑛 ≥ 30 , se tiene que:
σ 𝑋𝑖 −𝑛𝜇
i. σ 𝑋𝑖 ~𝑁 𝑛𝜇, 𝑛𝜎 2 ⇒ ~𝑁(0,1)
𝜎 𝑛
σ𝑋 𝜎 2 ത
𝑋−𝜇
ii. 𝑋ത = 𝑖 ~𝑁 𝜇,
𝑛 𝑛
⇒
𝜎/ 𝑛
~𝑁(0,1)
i. 𝑋1 + 𝑋2 ~𝑁 𝜇1 + 𝜇2 , 𝜎12 + 𝜎22
σ 𝑋𝑖 𝜎2
𝑋ത = ~𝑁 𝜇,
𝑛 𝑛
Muestreo
1) Primer paso: ¿ Qué información se necesita?
2) Segundo paso: ¿Cuál es la población relevante y existe un listado de esa población?
3) Tercer paso: ¿Cómo deben seleccionarse los miembros de la muestra?
- Tipo de muestreo
- Número de miembros de la muestra
4) Cuarto paso: ¿Cómo debe obtenerse información de los miembros de la muestra?
- Obtener la mayor cantidad de respuestas posibles
- Obtener respuestas que sean lo más exactas y sinceras posible
5) Quinto paso: ¿Cómo debe utilizarse la información muestral para hacer inferencias
sobre la población?
6) Sexto paso: ¿Qué conclusiones pueden extraerse sobre la población?
Errores de muestreo y ajenos a él
No es posible saber cuál es exactamente el valor de cualquier parámetro poblacional como
la media o la proporcional debido a que sólo se dispone de información sobre un
subconjunto de todos los miembros de la población.
Todos los miembros de una población tienen la misma probabilidad de ser elegidos para la
muestra.
Supongamos que nuestra población esta formada por 1000 individuos, numerados del 1
al 1000 y que se necesita una muestra aleatoria simple de 100 miembros de la población.
Podemos generar una muestra aleatoria simple sacando al azar cada uno de los números.
Sólo consideraremos el muestreo sin repetición. El proceso continúa hasta que se
obtienen los 100 números diferentes.
Tipos de muestreo
Muestreo sistemático
Supongamos que la lista de la población se ordena de una forma que no tiene ninguna
relación con el tema de interés. El muestro sistemático implica la selección de todo j-
ésimo sujeto de la población, donde j es el cociente entre el tamaño de la población N y el
tamaño que se desea que tenga la muestra, n ; es decir; 𝑗 = 𝑁/𝑛. Se selecciona
aleatoriamente un número del 1 al j para obtener el primer sujeto que va a incluirse en la
muestra sistemática.
Ejemplo
Supongamos que se desea que el tamaño de muestra sea de 100 y que la población está
formada por 5000 nombres en orden alfabético. En ese caso, 𝑗 =50. Seleccionamos
aleatoriamente un número del 1 al 50. Si el número seleccionado es 15, seleccionamos
ese número y los sucesivos números obtenidos sumando 50 al número inicial.
𝑁1 + 𝑁2 + ⋯ + 𝑁𝑘 = 𝑁
Tipos de muestreo
Muestreo aleatorio estratificado
Análisis de los resultados de un muestreo aleatorio estratificado
𝐾 𝐾
𝑁𝑗 = 𝑁 𝑦 𝑛𝑗 = 𝑛
𝑗=1 𝑗=1
Sean las medias y varianzas muestrales de los estratos 𝑥ഥ𝑗 y 𝑠𝑗2 ( j=1,2,..,K) y la media del
conjunto de la población 𝜇.
donde
Tipos de muestreo
Muestreo aleatorio estratificado
Estimación del total poblacional
Tipos de muestreo
Muestreo aleatorio estratificado
Afijación del esfuerzo muestral a los distintos estratos ¿Cuántas de estas observaciones
muestrales deben asignarse a cada estrato?
Ante el dilema de no tener una lista fiable de la población (muestra aleatoria simple) o
querer hacer entrevistas personales con miembros de la muestra cuando los recursos
presupuestarios son limitados, el investigador puede recurrir al muestreo por
conglomerados. Este método es atractivo cuando la población puede subdividirse en
unidades relativamente pequeñas y geográficamente compactadas llamadas
conglomerados.
Es una técnica de muestro no probabilística. Los elementos se incluyen sin que haya una
probabilidad previamente especificada o conocida de que sean incorporados en la
muestra.
Tiene la ventaja de que es relativamente fácil seleccionar la muestra y recabar los datos;
sin embargo, es imposible evaluar su “bondad” en términos de representatividad de la
población. Una muestra de conveniencia puede dar buenos resultados o no, ningún
procedimiento justificado estadísticamente permite un análisis e inferencia
probabilísticos acerca de la calidad de los resultados muestrales.
Estimación puntual
Al efectuar los cálculos de 𝑝,Ƹ 𝑥ҧ y S se lleva a cabo el proceso estadístico conocido como
estimación puntual. A la media muestral 𝑥ҧ se le identifica como estimador puntual de la
media poblacional 𝜇.
Estimadores
lim 𝐸 𝜃መ = 𝜃
𝑛→∞
lim 𝑉𝑎𝑟 𝜃መ = 0
𝑛→∞