Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1 Inferencia estadística
Enlace: https://youtu.be/NaST4u0nUVY (13.07 min)
Introducción.
Inferencia estadística: es el proceso mediante el cual se generalizan a una población las
conclusiones obtenidas a partir una muestra de dicha población.
Métodos.
- Estimación de parámetros: a partir de la muestra obtener valores aproximados de los
parámetros de la población, ya sea puntualmente o por intervalo.
- Contraste de hipótesis: a partir de la muestra decidir sobre la validez o no de hipótesis
sobre algún parámetro poblacional.
Características de la muestra.
Representativa: que refleje lo mejor posible las características de la población.
Tamaño muestral: Depende si el problema es estimación o de contraste de hipótesis, de
las características de la población y la magnitud de los errores que estamos dispuesto a
cometer.
Muestra aleatoria: Se define como un conjunto de variables aleatorias independientes
X 1 , X 2 ,..., X n y con la misma distribución de probabilidad ℙ.
1 n
Fˆn ( x ) I ( X i x)
n i 1
Sea X 1 , X 2 ,..., X n una muestra aleatoria de una variable aleatoria X con función de
distribución acumulativa F (x) y sea Fˆn ( x ) la función de distribución empírica de la
muestra. Entonces, para cualquier valor de x se verifica, a medida que n
E Fˆn ( x) F ( x) 0
2
variable aleatoria F ( x) .
Conceptos
Ejemplos
Se puede estimar la esperanza de una variable mediante la media de una muestra aleatoria
de dicha variable.
Se puede estimar la proporción de una población mediante la proporción equivalente en
la muestra aleatoria.
Sesgo(ˆ) E ˆ
Precisión: Dado que un estimador es una variable aleatoria cuyo valor cambia con la
muestra, la precisión viene dada por la dispersión del estimador que se mide mediante su
varianza 2ˆ . A menor varianza, el estimador estará más centrado. La desviación típica
del estimador, se denomina Error estándar y viene dada por,
ˆ var(ˆ)
Estimador centrado y dispersión grande, habrán muestras con estimaciones alejadas del
valor del parámetro.
Estimador centrado y dispersión pequeña, la estimación obtenida estará próxima al valor
del parámetro.
Ilustración de diferentes casos de precisión y sesgo: (1) preciso, no exacto y sesgado (2)
preciso y exacto (3) ni preciso ni exacto (4) exacto pero no preciso
Error cuadrático medio: Es la medida conjunta del sesgo y la varianza de un estimador.
Es una medida útil cuando se debe elegir entre varios estimadores del mismo parámetro.
Viene dado por,
ECM ˆ E ˆ Sesgo ˆ
2 2
var(ˆ)
Es deseable que sea pequeño
lim P ˆ 1 0
n
A medida que aumenta el tamaño de la muestra, es más probable que el valor del
estimador esté más próximo al valor del parámetro.
Ejemplos
La media muestral es un estimador centrado de la media poblacional
1 n 1 n 1
E X E X i E X i n
n i 1 n i 1 n
1 n
Xi X
2
Sea la varianza muestral s 2
n i 1
n 1 2 1
Sesgo( s 2 ) E s 2 2 2 2
n n
1 n 1 n
X i X 2 con E X i var( X i ) 2
2 2
Nota: s 2 X i X
n i 1 n i 1
Sabemos que,
2
2
E X i var( X i ) E X i 2 2 y E X 2 var( X ) E X
2 2
2
n
1 n
1 1 n
2
E s 2 E X i X 2 E X i E X 2
2
n i 1 n n i 1
1 2 n 1 2
n( 2 2 ) 2
n n n
1 n
Xi X
2
Sea la cuasi-varianza muestral s 2
n 1 i 1
1 n 2 1 n 2
E s 2 E X i X E Xi X
n 1 i 1 n 1 i 1
1 n
2 1
E X i n X
2
n 2 2 2
n 1 i 1 n 1
Número de éxitos N
Sea pˆ E
Número de observaciones n
N 1 1
E pˆ E E E N E np p
n n n