Está en la página 1de 29

Estadstica Matemtica

Estimacin por intervalos y prueba de hiptesis


La estimacin puntual no proporciona informacin al investigador sobre qu tan cerca est del verdadero parmetro poblacional
Si obtengo un estimador de 1.2, qu puedo concluir? Necesito entonces apelar no slo al valor de la estimacin puntual sino a cmo luce la distribucin muestral del estimador
Qu tan lejos ests 1.2 de 1? Comenzar por intervalos de confianza, luego ir a las pruebas de hiptesis Comenzar con un ejemplo

Estadstica Matemtica
Estimacin por intervalos ejemplo
Supongamos que tengo una poblacin normal con media y varianza conocida 2 entonces la media muestral tiene distribucinY normal Z con media y varianza 2/n. La variable estandarizada / n tiene distribucin normal (0,1). Podemos escribir entonces, conociendo los valores de la tabla normal
Y / n

1.96

1.96

0.95 0.95

P Y 1.96 / n o sintticam ente Y 1.96 / n

Y 1.96 / n

Estadstica Matemtica
Estimacin por intervalos ejemplo Cmo interpretarlo? Cuando decimos que por ejemplo que Y 1.96 / n es el intervalo de confianza al 95% para , entendemos que este intervalo aleatorio contiene a con probabilidad de 0.95. Si = *

/2

/ n

Este es el estimador de intervalo de confianza para la media poblacional cuando es conocida Es aleatorio, como lo es un estimador puntual, ya que los extremos cambiarn segn tengamos muestras distintas

Estadstica Matemtica
Estimacin por intervalos ejemplo Cmo NO interpretarlo? la probabilidad de que est en dicho intervalo es 0.95 Una vez calculado, ej. 0.65 0.23, ya no hay interpretacin probabilstica, puede contener o no contener al verdadero parmetro poblacional, no lo sabremos nunca La interpretacin probabilstica correcta ex ante, es que si uno repite infinitamente el muestreo, para el 95% de las muestras aleatorias el intervalo de confianza construido contendr a

Estadstica Matemtica
Estimacin por intervalos ejemplo tabla C.2 JW, reproducida en parte Intervalos de confianza simulados de una distribucin normal ( ,1), con =2 Ejercicio: obtengo muestras aleatorias extradas de una poblacin normal que TIENE =2 y varianza unitaria. Luego obtengo para cada muestra el intervalo para la media muestral
1 2 3 4 5 6 7 8 9 ,,,, 19 20 Promedio muestral 1,98 1,43 1,65 1,88 2,34 2,58 1,58 2,23 1,96 1,16 1,75 Intervalo al 95% 1,36-2,60 0,81-2,05 1,03-2,27 1,26-2,50 1,72-2,96 1,96-3,20 0,96-2,20 1,61-2,85 1,34-2,58 0,54-1,78 1,13-2,37

Estadstica Matemtica
Estimacin por intervalos varianza desconocida
Si no conocemos la varianza, no podemos construir el intervalo de confianza como lo hicimos antes Debemos reemplazar la varianza poblacional por un estimador, la Y varianza muestral, pero entonces la variable S / n no se distribuye normal sino tn-1 (recuerden la definicin que ya vimos) Elegimos el nivel de confianza y nuevamente construimos el intervalo de confianza, ahora teniendo en cuenta que la variable se distribuye t. Los valores t se obtienen de tabla
n

P PY

/2

Y S/ n
/2

/2

1 t
/2

S/ n

S/ n

Estadstica Matemtica
Intervalo de confianza distribucin t

Estadstica Matemtica
Prueba de hiptesis
cmo evaluar las siguientes preguntas?
Es cierto que los profesionales tienen salarios ms altos que los no profesionales? Reciben las mujeres salarios ms bajos que los hombres? Son efectivos los programas de seguridad ciudadana?

Todas estas preguntas requieren una respuesta de SI/NO , ms que de grado. La prueba de hiptesis ser del estilo
Ho: = *, versus H1: *

Ho se denomina hiptesis nula. Vamos a disear contrastes de hiptesis (tests) para determinar si podemos rechazar o no rechazar la hiptesis nula.

Estadstica Matemtica
Prueba de hiptesis
Importante
La prueba de hiptesis involucra el parmetro, queremos saber por ejemplo si la media de una cierta variable es igual a 2. Pero como no conocemos la media poblacional y slo tenemos una muestra lo que en definitiva haremos es evaluar si nuestros datos son consistentes con tener una media igual a 2. Indirectamente ya lo hemos hecho cuando construimos un intervalo de confianza
Si el intervalo de confianza contena el nmero 2, entonces indirectamente no fuimos capaces de rechazar que la media poblacional era dos

Estadstica Matemtica
Prueba de hiptesis errores que podemos cometer
Error tipo I: rechazar la hiptesis nula cuando esta es verdadera Rechazamos que la media sea dos cuando efectivamente =2 (en slo una muestra de 20 en la tabla C.2) Error tipo II: no rechazar la hiptesis nula cuando sta es falsa Podemos calcular las probabilidades de cometer ambos errores, el problema es que no podemos reducir un error sin aumentar el otro Cuando definimos el nivel de confianza 1- estamos fijando el error tipo I. Por qu? Construimos el test bajo el supuesto que la hiptesis nula es cierta Veamos un ejemplo y la mecnica de construir un test de hiptesis

Estadstica Matemtica
Prueba de hiptesis ejemplo
Quiero disear un contraste o test para la media poblacional Quiero evaluar si es igual o distinta de dos Como no conozco la varianza poblacional debo usar la muestral y entonces tengo que usar la distribucin t. Cuando constru el intervalo de confianza obtuve
PY t
/2

S/ n

/2

S/ n

Ahora voy a ver la otra cara de la moneda

Estadstica Matemtica
Prueba de hiptesis ejemplo
Quiero evaluar Ho: =2 vs H1: 2 , entonces
Y 2

Si la hiptesis nula es cierta la variable t S / n tiene una distribucin t con n-1 gdl. Fijo el error tipo I, la probabilidad de rechazar Ho dado que Ho es cierta, =0.05 Estoy dispuesto a rechazar errneamente Ho el 5% de las veces en aras de detectar desviaciones con respecto a Ho Si quiero reducir el error tipo I, aumento el error tipo II, ver grfico en ejemplo ms simple

=2

=3

Error tipo II

Estadstica Matemtica
Prueba de hiptesis ejemplo
Errores que cometo segn decisin que tome y estado de la realidad
Decisin que tom Rechazar H0 No rechazar H0 Estado de la realidad H0 es cierta H0 es falsa Error tipo I: Decisin correcta Error tipo II: Decisin correcta

Otro concepto: poder de un test


Complemento del error tipo II: probabilidad de rechazar la hiptesis nula cuando esta es falsa

Estadstica Matemtica
Prueba de hiptesis ejemplo
Clculo del test. Supongamos que n=25 y
S/ n
Y

0.23

1.98

El test se calcula
tobs Y 2 S/ n 1.98 2 0.23 0.0866

Cae en zona de no rechazo (t crtico con 24 gdl es 2.39) No puedo rechazar Ho, los datos son consistentes con una media poblacional igual a dos

Estadstica Matemtica
Prueba de hiptesis p-value
Fijado el nivel de significancia una forma alternativa de evaluar si caemos en zona de rechazo o no rechazo es el valor-p. Supongamos que el t-observado es 1.8, el valor p es igual a p=P(|t|>|t-obs|) => zona sombreada en el grfico. Si n=25, p=0.077 Si conocemos el valor p y el valor sabemos si caemos en zona de rechazo o no rechazo. La regla es

Rechazo si p-value< Caigo en zona de rechazo Valores de p pequeos conducen a rechazo


0 Suma de las reas=p-value

Ejemplo en el modelo de regresin


Estimamos el siguiente modelo (n=10)
Y = 24.47 + 0.509 X se (6.41) (.036) t 3.813 14.243
Cmo obtenemos estos nmeros?
^ 2

i n 2

337 .3 / 8 42.16

Ejemplo en el modelo de regresin


^

var ( )

X i2 nS XX
^

322,000 42.16 10(33,000)


^

41.4

error standard ( )
^ 2

var ( )
42.16 33,000

6.41

var ( )

S XX
^

.0013
^

error standard ( )

var ( )

.036

Ejemplo
El valor estimado para la pendiente es 0.509 (estimacin) y su correspondiente error estndar es 0.036.
Esta es una meida de cunto vara de una muestra a otra Podemos definir un intervalo de confianza o contrastar hiptesis acerca del estimador

Test de hiptesis
Definamos una hiptesis nula de que nuestro parmetro no es estadsticamente distinto de cero
H0: = 0 Qu significa?:
En el modelo de salarios y educacin, que la educacin no afecta el salario horario

Podemos evaluar si nuestros datos son consistentes o no con esta hiptesis Pero necesitamos saber cul es la distriabucin de estimador de . Hasta ahora slo hemos hablado de su esperanza y varianza

Test de hiptesis
Sabemos que es una funcin lineal de Y
Si asumimos que el error se distribuye normal con media 0 y varianza 2 podemos demostrar que se distribuye normal con esperanza y varianza
^ 2

Var ( )

S XX

Como no conocemos el verdadero 2 no podemos usar este resultado directamente, sino que utilizaremos un estadstico t, vuelvo a esto luego

Test de hiptesis
~ N( , ( )2) Podemos entonces, construir un intervalo de confianza o realizar una hiptesis
Son pasos equivalentes

tiene una distribucin normal con media 0 y una varianza como ya la escribimos, entonces:

Z /

x
2 i

~ N(0,1)

Test de hiptesis
Como no conocemos la verdadera varianza
La estimamos Luego tenemos:
2

2
^

/
^

xi2

~ t n -2 , n 2
2 i

where

Test de hiptesis - Ejemplo


Source | SS df MS -------------+-----------------------------Model | 262.690453 1 262.690453 Residual | 61.2190831 266 .230146929 -------------+-----------------------------Total | 323.909536 267 1.21314433 Number of obs F( 1, 266) Prob > F R-squared Adj R-squared Root MSE = 268 = 1141.40 = 0.0000 = 0.8110 = 0.8103 = .47974

-----------------------------------------------------------------------------ln_sal | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------educ | .1920541 .0056847 33.78 0.000 .1808614 .2032467 _cons | 7.154218 .05682 125.91 0.000 7.042344 7.266092 ------------------------------------------------------------------------------

H0: = 0
(0.1920541-0)/0.0056847=33.78

Test de hiptesis - Ejemplo


Caigo en zona de rechazo

Valor crtico (99% nivel de confianza) t266=2.5944 Valor crtico (95% nivel de confianza) t266=1.9689 Valor crtico (90% nivel de confianza) t266=1.6506

Test de hiptesis - Ejemplo


Caigo en zona de rechazo

p-value: Prob(t<-33.78)+Prob(t>33.78)=nmero muy pequeo, 0.00(96 ceros)32

Intervalo de confianza - Ejemplo


P( 1.96 P 1.96 t 1.96 ) .95
^

1.96 xi2
^

.95

/
^

1.96 x
2 i

1.96 x
2 i

.95

P 1.96 se ( ) P 1.96 * 0.005 P 0.01114201 P 0.1809 0.2031

1.96 se ( ) .95 1.96 * 0.005 .95 0.01114201 .95 .95

Test de hiptesis - Ejemplo


Source | SS df MS -------------+-----------------------------Model | 262.690453 1 262.690453 Residual | 61.2190831 266 .230146929 -------------+-----------------------------Total | 323.909536 267 1.21314433 Number of obs F( 1, 266) Prob > F R-squared Adj R-squared Root MSE = 268 = 1141.40 = 0.0000 = 0.8110 = 0.8103 = .47974

-----------------------------------------------------------------------------ln_sal | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------educ | .1920541 .0056847 33.78 0.000 .1808614 .2032467 _cons | 7.154218 .05682 125.91 0.000 7.042344 7.266092 ------------------------------------------------------------------------------

H0: = 0.20
(0.1920541-0.20)/0.0056847=-1.3967

Test de hiptesis - Ejemplo


Caigo en zona de no rechazo

Valor crtico (99% nivel de confianza) t266=2.5944 Valor crtico (95% nivel de confianza) t266=1.9689 Valor crtico (90% nivel de confianza) t266=1.6506

Test de hiptesis - Ejemplo


Caigo en zona de no rechazo

p-value: Prob(t<-1.3967)+Prob(t>1.3967)=0.16 Slo podramos rechazar si eligieramos un nivel de confianza inferior al 0.84

También podría gustarte