Está en la página 1de 19

Estimación de intervalos e intervalos de confianza

y pruebas de hipótesis

Manuel Barrón

Fecha
La naturaleza de la estimación de intervalos

I La desviación estándar junto con una estimación puntual no


ofrecen ningún planteamiento directo acerca de la probabilidad
de que una estimación esté cerca al parámetro de la población.
I Esta limitación se supera al construir el intervalo de
confianza.
La naturaleza de la estimación de intervalos: ejemplo
I Suponga que la población tiene una distribución N(µ, 1) y sea
{Y1 , ..., Yn } una muestra aleatoria de esta población.
I El promedio muestral Y ∼ N(µ, 1/n).
I Se puede estandarizar Y , y debido a que la versión estándar
de Y tiene una distribución normal estándar:
 
Y −µ
P − 1.96 < √ < 1.96 = 0.95
1/ n
√ √
P(Y − 1.96/ n < µ < Y + 1.96/ n) = 0.95
I La probabilidad de que el intervalo aleatorio
√ √
[ Y − 1.96/ n, Y + 1.96/ n ] contenga a µ es 95%.
I Esto permite
√ construir una estimación del intervalo de µ:
y ± 1.96/ n.
I Esto significa
√ que el intervalo
√ aleatorio
[ Y − 1.96/ n, Y + 1.96/ n ] contiene a µ con una
probabilidad de 95%.
Intervalos de confianza para la media de una población
normalmente distribuida
I Para el caso en el que σ toma cualquier valor y es conocida:
√ √
[y − 1.96σ/ n, y + 1.96σ/ n]
I Para el caso en el que σ no es conocida:
I Sea la desviación estándar muestral:
 n 1/2
1 X
s= (yi − y )2
n−1
i=1

I Al remplazar σ con s no se preserva el nivel de confianza al


95%, ya que s depende de la muestra particular.
I En lugar de utilizar la distribución normal estándar, se debe
utilizar la t, ya que:

Y −µ
√ ∼ tn−1
S/ n
Intervalos de confianza para la media de una población
normalmente distribuida

I Para el caso en el que σ no es conocida:


I Sea c el valor tal que el 95% del área de la distribución tn−1
está entre −c y c. √
I El intervalo aleatorio Y ± c · S/ n contiene a µ con 95% de
probabilidad. Para una muestra particular:
√ √
[y − c · s/ n, y + c · s/ n]

I En término más generales, sea cα el percentil 100(1 − α) en la


distribución tn−1 . Entonces, se obtiene un intervalo de
confianza al 100(1 − α)% como:

[y ± cα/2 s/ n] ó [y ± cα/2 · σy ]

Donde σy es el error estándar de y . Obtener cα/2 requiere que


se elija α y se conozcan los grados de libertad n-1.
Una sencilla regla general para un intervalo de confianza al
95%

I [y ± cα/2 · σy ] se puede calcular para cualquier tamaño de


muestra y cualquier nivel de confianza.
I Dado que la distribución t se aproxima a la distribución normal
estándar a medida que aumentan los grados de liberta.
I Una regla general para un nivel de confianza aproximado al
95% es:
[y ± 2 · σy ]
Intervalos de confianza asintóticos para poblaciones no
normales

I Siempre y cuando el tamaño de la muestra sea lo bastante


grande para aplicar el teorema del lı́mite central se puede
aproximar la distribución de la media muestral Y .
I Para n grande, un intervalo de confianza aproximado al 95%
es:
[y ± 1.96 · σy ]
Donde 1.96 es el 97.5-ésimo percentil de la distribución
normal estándar.
Fundamentos de la prueba de hipótesis

I Sobre la base de la información muestral captada, el objetivo


es verificar si uno o más supuestos que se tienen sobre el
comportamiento de una variable pueden ser tomados como
válidos o deben ser considerados falsos.
I Hipótesis nula (H0 ): Es el supuesto que se hace acerca del
valor de un parámetro que permite establecer la población
hipotética, cuya validez será verificada de acuerdo con la
evidencia muestral captada.
I Hipótesis alternativa (H1 ): Es la hipótesis que se debe de
aceptar en caso de rechazar la hipótesis planteada.
Fundamentos de la prueba de hipótesis

I En la prueba de hipótesis se pueden cometer dos tipos de


errores:
I Error tipo I: Cuando se rechaza la H0 cuando es en realidad
verdadera.
I Error tipo II: Cuando no se rechaza la H0 cuando es en
realidad falsa.
I Las pruebas de hipótesis se construyen para hacer que la
probabilidad de cometer un error tipo I sea muy pequeña.
I En general, se define el nivel de significancia (α) de una
prueba como la probabilidad de cometer un error tipo I.
I Una vez elegido α puede desearse maximizar la potencia de
una prueba (φ):

π(θ) = P(RechazarH0 |θ) = 1 − P(TipoII |θ)


Pruebas de hipótesis para la media de una población
normal

I El estadı́stico T es alguna función de la muestra aleatoria y


cuando se calcula para una muestra particular, se obtiene t.
I Regla de rechazo (de H0 en favor de H1 ): comparar el valor
de t respecto a un valor crı́tico c.
I Para determinar c se debe decidir primero el α de la prueba.
I Luego, c, asociado con α, se determina mediante la
distribución T, suponiendo que la H0 sea verdadera.
I Los valores de t que resulten del rechazo de la H0 se conocen
de manera conjunta como la región de rechazo.
Pruebas de hipótesis para la media de una población
normal

I Para probar la hipótesis acerca de la media µ de una


población, la H0 se expresa como:

H0 : µ = µ0

Donde µ0 es un valor que se especifica.


I La regla de rechazo depende de la depende de la H1 :

H1 : µ > µ0 ; H1 : µ < µ0 ; µ 6= µ0
Pruebas de hipótesis para la media de una población
normal
I Para el caso H1 : µ > µ0 ,
I Se debe de rechazar H0 en favor de H1 cuando el valor
promedio muestral, y , es lo ”bastante” mayor que µ0 , al α
elegido.
I Para esto se debe de conocer la probabilidad de rechazar la H0 ,
cuando esta es verdadera.
I En lugar de usar y , se utiliza su versión estandarizada (σ se
remplaza con s):

t = n(y − µ0 )/s = (y − µ0 )/ee(y )

Donde ee(y ) = s/ n. √
I Se trabaja con t porque bajo la H0 , T = n(Y − µ0 )/S tiene
una distribución tn−1 .
I Supuesto: α = 5%. Entonces se elije c y la regla de rechazo
es:
t>c
Pruebas de hipótesis para la media de una población
normal

I Para el caso H1 : µ > µ0 ,

t < −c

I Para el caso H1 : µ 6= µ0 ,

|t| > c
Pruebas asintóticas para poblaciones no normales

I Si el tamaño muestral es lo bastante grande para aplicar el


teorema del lı́mite central la mecánica de la prueba de
hipótesis para las medias poblacionales es la misma.
I Bajo la H0 ,

T = n(Y − µ0 )/S ∼ N(0, 1)

I Por lo tanto, con n grande se puede comparar el estadı́stico


t = (y − µ0 )/ee(y ) con los valores crı́ticos de una distribución
normal estándar.
Cálculo de los p-values

I Alternativamente, se puede calcular un p-value que permita


realizar una prueba a cualquier nivel de significancia.
I p-value: nivel de significancia máximo al cual se puede
realizar la prueba y aun ası́ no rechazar la H0 .
Cálculo de los p-values

I Prueba de una cola (H0 : µ = 0 en una población N(µ, σ 2 ). t


es T, y n suficientemente grande para tratar a T como si
tuviera una distribución N(0,1)):

p − value = P(T > t|H0 ) = 1 − Φ(t)

Donde Φ(·) denota la fda normal estándar.


I Prueba de dos colas:

p − value = P(|Tn−1 | > |t|) = 2P(Tn−1 > |t|)


donde t es el valor del estadı́stico y Tn−1 es una variable
aleatoria t.
I Para poblaciones no normales, pueden encontrarse p-values
asintóticos.
Uso de los p-values

i) Se elije un estadı́stico T y decide la naturaleza de la


alternativa. Esto determina si la regla de rechazo es t > c,
t < −c, o |t| > c.
ii) Se usa el valor observado del estadı́stico t como valor crı́tico y
se calcula el nivel de significancia correspondiente de la
prueba. Este es el p-value.
I Si la regla de rechazo es de la forma t > c, entonces el
p-value=P(T > t).
I Si la regla de rechazo es t < −c, entonces el
p-value=P(T < t); si la regla de rechazo es |t| > c, entonces
el p-value=P(|T | > |t|).
iii) Si se eligió un nivel de significancia α entonces,
I Si el p-value< α, se rechaza H0 al nivel 100 · α%.
I Si el p-value≥ α, no se rechaza H0 al nivel 100·α%.
Por tanto, este es un p-value pequeño que lleva al rechazo.
La relación entre intervalos de confianza y pruebas de
hipótesis

I Existe una relación entre los intervalos de confianza y las


pruebas de hipótesis.
I Después de que se construye un intervalo de confianza, se
pueden realizar varias pruebas de hipótesis.
I En el caso de una media poblacional:

H0 = µ = µ 0

H1 = µ 6= µ0
I Suponga que se ha construido un intervalo de confianza a
95% para µ:
I Si µ0 no está en el intervalo de confianza, H0 se rechaza
contra H1 al nivel de 5% y viceversa.
Significancia práctica frente a significancia estadı́stica

I También es importante interpretar las magnitudes de las


estimaciones puntuales.
I El signo y magnitud de y determina su significancia práctica
y permite analizar la dirección de este, y si es ”grande” o
”pequeño”.
I La significancia estadı́stica de y depende de la magnitud de
su estadı́stico t = y /ee(y ).
I Una prueba consistente rechaza la H0 con probabilidad más
cerca a uno a medida que el tamaño de muestra tiende a
infinito, siempre que la H1 sea verdadera.

También podría gustarte