Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estadstica Matemtica
Estimacin por intervalos ejemplo
Supongamos que tengo una poblacin normal con media y varianza conocida 2 entonces la media muestral tiene distribucinY normal Z con media y varianza 2/n. La variable estandarizada / n tiene distribucin normal (0,1). Podemos escribir entonces, conociendo los valores de la tabla normal
Y / n
1.96
1.96
0.95 0.95
Y 1.96 / n
Estadstica Matemtica
Estimacin por intervalos ejemplo Cmo interpretarlo? Cuando decimos que por ejemplo que Y 1.96 / n es el intervalo de confianza al 95% para , entendemos que este intervalo aleatorio contiene a con probabilidad de 0.95. Si = *
/2
/ n
Este es el estimador de intervalo de confianza para la media poblacional cuando es conocida Es aleatorio, como lo es un estimador puntual, ya que los extremos cambiarn segn tengamos muestras distintas
Estadstica Matemtica
Estimacin por intervalos ejemplo Cmo NO interpretarlo? la probabilidad de que est en dicho intervalo es 0.95 Una vez calculado, ej. 0.65 0.23, ya no hay interpretacin probabilstica, puede contener o no contener al verdadero parmetro poblacional, no lo sabremos nunca La interpretacin probabilstica correcta ex ante, es que si uno repite infinitamente el muestreo, para el 95% de las muestras aleatorias el intervalo de confianza construido contendr a
Estadstica Matemtica
Estimacin por intervalos ejemplo tabla C.2 JW, reproducida en parte Intervalos de confianza simulados de una distribucin normal ( ,1), con =2 Ejercicio: obtengo muestras aleatorias extradas de una poblacin normal que TIENE =2 y varianza unitaria. Luego obtengo para cada muestra el intervalo para la media muestral
1 2 3 4 5 6 7 8 9 ,,,, 19 20 Promedio muestral 1,98 1,43 1,65 1,88 2,34 2,58 1,58 2,23 1,96 1,16 1,75 Intervalo al 95% 1,36-2,60 0,81-2,05 1,03-2,27 1,26-2,50 1,72-2,96 1,96-3,20 0,96-2,20 1,61-2,85 1,34-2,58 0,54-1,78 1,13-2,37
Estadstica Matemtica
Estimacin por intervalos varianza desconocida
Si no conocemos la varianza, no podemos construir el intervalo de confianza como lo hicimos antes Debemos reemplazar la varianza poblacional por un estimador, la Y varianza muestral, pero entonces la variable S / n no se distribuye normal sino tn-1 (recuerden la definicin que ya vimos) Elegimos el nivel de confianza y nuevamente construimos el intervalo de confianza, ahora teniendo en cuenta que la variable se distribuye t. Los valores t se obtienen de tabla
n
P PY
/2
Y S/ n
/2
/2
1 t
/2
S/ n
S/ n
Estadstica Matemtica
Intervalo de confianza distribucin t
Estadstica Matemtica
Prueba de hiptesis
cmo evaluar las siguientes preguntas?
Es cierto que los profesionales tienen salarios ms altos que los no profesionales? Reciben las mujeres salarios ms bajos que los hombres? Son efectivos los programas de seguridad ciudadana?
Todas estas preguntas requieren una respuesta de SI/NO , ms que de grado. La prueba de hiptesis ser del estilo
Ho: = *, versus H1: *
Ho se denomina hiptesis nula. Vamos a disear contrastes de hiptesis (tests) para determinar si podemos rechazar o no rechazar la hiptesis nula.
Estadstica Matemtica
Prueba de hiptesis
Importante
La prueba de hiptesis involucra el parmetro, queremos saber por ejemplo si la media de una cierta variable es igual a 2. Pero como no conocemos la media poblacional y slo tenemos una muestra lo que en definitiva haremos es evaluar si nuestros datos son consistentes con tener una media igual a 2. Indirectamente ya lo hemos hecho cuando construimos un intervalo de confianza
Si el intervalo de confianza contena el nmero 2, entonces indirectamente no fuimos capaces de rechazar que la media poblacional era dos
Estadstica Matemtica
Prueba de hiptesis errores que podemos cometer
Error tipo I: rechazar la hiptesis nula cuando esta es verdadera Rechazamos que la media sea dos cuando efectivamente =2 (en slo una muestra de 20 en la tabla C.2) Error tipo II: no rechazar la hiptesis nula cuando sta es falsa Podemos calcular las probabilidades de cometer ambos errores, el problema es que no podemos reducir un error sin aumentar el otro Cuando definimos el nivel de confianza 1- estamos fijando el error tipo I. Por qu? Construimos el test bajo el supuesto que la hiptesis nula es cierta Veamos un ejemplo y la mecnica de construir un test de hiptesis
Estadstica Matemtica
Prueba de hiptesis ejemplo
Quiero disear un contraste o test para la media poblacional Quiero evaluar si es igual o distinta de dos Como no conozco la varianza poblacional debo usar la muestral y entonces tengo que usar la distribucin t. Cuando constru el intervalo de confianza obtuve
PY t
/2
S/ n
/2
S/ n
Estadstica Matemtica
Prueba de hiptesis ejemplo
Quiero evaluar Ho: =2 vs H1: 2 , entonces
Y 2
Si la hiptesis nula es cierta la variable t S / n tiene una distribucin t con n-1 gdl. Fijo el error tipo I, la probabilidad de rechazar Ho dado que Ho es cierta, =0.05 Estoy dispuesto a rechazar errneamente Ho el 5% de las veces en aras de detectar desviaciones con respecto a Ho Si quiero reducir el error tipo I, aumento el error tipo II, ver grfico en ejemplo ms simple
=2
=3
Error tipo II
Estadstica Matemtica
Prueba de hiptesis ejemplo
Errores que cometo segn decisin que tome y estado de la realidad
Decisin que tom Rechazar H0 No rechazar H0 Estado de la realidad H0 es cierta H0 es falsa Error tipo I: Decisin correcta Error tipo II: Decisin correcta
Estadstica Matemtica
Prueba de hiptesis ejemplo
Clculo del test. Supongamos que n=25 y
S/ n
Y
0.23
1.98
El test se calcula
tobs Y 2 S/ n 1.98 2 0.23 0.0866
Cae en zona de no rechazo (t crtico con 24 gdl es 2.39) No puedo rechazar Ho, los datos son consistentes con una media poblacional igual a dos
Estadstica Matemtica
Prueba de hiptesis p-value
Fijado el nivel de significancia una forma alternativa de evaluar si caemos en zona de rechazo o no rechazo es el valor-p. Supongamos que el t-observado es 1.8, el valor p es igual a p=P(|t|>|t-obs|) => zona sombreada en el grfico. Si n=25, p=0.077 Si conocemos el valor p y el valor sabemos si caemos en zona de rechazo o no rechazo. La regla es
i n 2
337 .3 / 8 42.16
var ( )
X i2 nS XX
^
41.4
error standard ( )
^ 2
var ( )
42.16 33,000
6.41
var ( )
S XX
^
.0013
^
error standard ( )
var ( )
.036
Ejemplo
El valor estimado para la pendiente es 0.509 (estimacin) y su correspondiente error estndar es 0.036.
Esta es una meida de cunto vara de una muestra a otra Podemos definir un intervalo de confianza o contrastar hiptesis acerca del estimador
Test de hiptesis
Definamos una hiptesis nula de que nuestro parmetro no es estadsticamente distinto de cero
H0: = 0 Qu significa?:
En el modelo de salarios y educacin, que la educacin no afecta el salario horario
Podemos evaluar si nuestros datos son consistentes o no con esta hiptesis Pero necesitamos saber cul es la distriabucin de estimador de . Hasta ahora slo hemos hablado de su esperanza y varianza
Test de hiptesis
Sabemos que es una funcin lineal de Y
Si asumimos que el error se distribuye normal con media 0 y varianza 2 podemos demostrar que se distribuye normal con esperanza y varianza
^ 2
Var ( )
S XX
Como no conocemos el verdadero 2 no podemos usar este resultado directamente, sino que utilizaremos un estadstico t, vuelvo a esto luego
Test de hiptesis
~ N( , ( )2) Podemos entonces, construir un intervalo de confianza o realizar una hiptesis
Son pasos equivalentes
tiene una distribucin normal con media 0 y una varianza como ya la escribimos, entonces:
Z /
x
2 i
~ N(0,1)
Test de hiptesis
Como no conocemos la verdadera varianza
La estimamos Luego tenemos:
2
2
^
/
^
xi2
~ t n -2 , n 2
2 i
where
-----------------------------------------------------------------------------ln_sal | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------educ | .1920541 .0056847 33.78 0.000 .1808614 .2032467 _cons | 7.154218 .05682 125.91 0.000 7.042344 7.266092 ------------------------------------------------------------------------------
H0: = 0
(0.1920541-0)/0.0056847=33.78
Valor crtico (99% nivel de confianza) t266=2.5944 Valor crtico (95% nivel de confianza) t266=1.9689 Valor crtico (90% nivel de confianza) t266=1.6506
1.96 xi2
^
.95
/
^
1.96 x
2 i
1.96 x
2 i
.95
-----------------------------------------------------------------------------ln_sal | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------educ | .1920541 .0056847 33.78 0.000 .1808614 .2032467 _cons | 7.154218 .05682 125.91 0.000 7.042344 7.266092 ------------------------------------------------------------------------------
H0: = 0.20
(0.1920541-0.20)/0.0056847=-1.3967
Valor crtico (99% nivel de confianza) t266=2.5944 Valor crtico (95% nivel de confianza) t266=1.9689 Valor crtico (90% nivel de confianza) t266=1.6506
p-value: Prob(t<-1.3967)+Prob(t>1.3967)=0.16 Slo podramos rechazar si eligieramos un nivel de confianza inferior al 0.84