Está en la página 1de 2

Estadı́stica II

Formulario para exámenes

Intervalos de confianza y contraste de hipótesis para una y dos poblaciones.


Notación:
2
• µX y σX : media y varianza de una variable aleatoria/población X; X̄ y s2X : media y cuasi varianza muestrales
• pX proporción en la población para X ∼ Bernoulli(pX ), p̂X proporción en la muestra
• X n : muestra aleatoria simple (MAS) de tamaño n de X
• (1 − α) nivel de confianza, α nivel de significación
• zα un α cuantil superior de una distribución N(0,1); tn−1;α un α cuantil superior de una distribución tn−1

Parámetro Hipótesis: MAS(s) y Cantidad pivotal y distribución


X̄ − µX
µX Población normal, varianza conocida √ ∼ N (0, 1)
σX / n
X̄ − µX
µX Población normal, varianza desconocida √ ∼ tn−1
sX / n
X̄ − µX
µX Población no normal, tamaño de muestra grande √ ∼aprox. N (0, 1)
sX / n
p̂ − pX
pX Población Bernoulli, tamaño de muestra grande p X ∼aprox. N (0, 1)
p̂X (1 − p̂X )/n
(n − 1)s2X
2
σX y σX Población normal 2 ∼ χ2n−1
σX
D̄ − µD
µX − µY Diferencia normal Di = Xi − Yi , muestra emparejada √ ∼ tn−1
sD / n
X̄ − Ȳ − (µX − µY )
µX − µY Poblaciones normales, varianzas iguales q ∼ tnX +nY −2 , y
sp n1X + n1Y
(nX − 1)s2X + (nY − 1)s2Y
s2p =
nX + nY − 2
X̄ − Ȳ − (µX − µY )
µX − µY Poblaciones normales, varianzas conocidas q 2 2
∼ N (0, 1)
σX σY
nX + nY

X̄ − Ȳ − (µX − µY )
µX − µY Poblaciones no normales, tamaños de muestra grandes q 2 ∼aprox. N (0, 1)
sX s2Y
nX + nY

p̂ − p̂Y − (pX − pY )
pX − pY Poblaciones Bernoulli, tamaños de muestra grande rX   ∼aprox. N (0, 1), y
p̂0 (1 − p̂0 ) n1X + n1Y
nX p̂X + nY p̂Y
p̂0 =
nX + nY
2 s2X /σX
2
σX /σY2 and σX /σY Poblaciones normales ∼ FnX −1,nY −1
2
sY /σY2

2 2
Ejemplo: Para construir un intervalo de confianza (1 − α) para µX si X ∼ N (µX , σX ) con σX desconocida em-
pleamos:  
sx sx
IC1−α (µX ) = x̄ − tn−1;1−α/2 √ ; x̄ + tn−1;α/2 √
n n
Para llevar a cabo un contraste unilateral H0 : µX ≥ µ0 frente a H1 : µX < µ0 , la región de rechazo a un nivel de
significación α, RRα , es:

 z }| t 

 x̄ − µ {
 

0
RRα = t : √ < tn−1;1−α
 sx / n
 

 

1
Covarianza muestral y correlación para una muestra de pares de observaciones (x1 , y1 ), . . . , (xn , yn ):
n
X n
X n
X
sxy (xi − x̄) (yi − ȳ) xi yi − nx̄ȳ r(x,y) xi yi − nx̄ȳ
z }| { z }| { cov(x, y)
i=1 i=1 i=1
cov(x, y) = = , cor(x, y) = =v v
n−1 n−1 sx sy u n
uX
u n
uX
t 2 2
x − nx̄ t y 2 − nȳ 2
i i
i=1 i=1

Estimaciones de la pendiente y el intercepto en el modelo de regresión lineal simple yi = β0 + β1 xi + ui ,


donde ui ∼ iid N (0, σ 2 ), para obtener el modelo ajustado ŷi = β̂0 + β̂1 xi :
n n
1 X X
(xi − x̄) (yi − ȳ) xi yi − nx̄ȳ
cov(x, y) n − 1 i=1 i=1
β̂1 = = n = n , β̂0 = ȳ − β̂1 x̄.
s2x 1 X 2
X
(xi − x̄) x2i − nx̄2
n − 1 i=1 i=1
Pn
Cantidades pivotales para β1 , β0 , σ 2 , con residuos ei = yi − ŷi y varianza residual s2R = 2
i=1 ei /(n − 2):

β̂1 − β1 β̂0 − β0 (n − 2)s2R


∼ tn−2 ,  ∼ tn−2 , ∼ χ2n−2 .
σ2
s s
s2R x̄2

1
s2R +
(n − 1)s2X n (n − 1)s2X

Intervalos de confianza para la respuesta promedio y la respuesta puntual, y0 , dado X = x0 :


v ! v !
2 2
u u
u 1 (x 0 − x̄) u 1 (x 0 − x̄)
ŷ0 ± tn−2;α/2 ts2R + , ŷ0 ± tn−2;α/2 ts2R 1 + + .
n (n − 1)s2X n (n − 1)s2X

Tabla ANOVA para el modelo de regresión lineal simple (R-cuadrado R2 = SCM/SCT):


Fuente de variación SC Pn GL Media Cociente F
Modelo SCM = P i=1 (ŷi − ȳ)2 P 1 SCM/1 SCM/s2R
n n
Residuos/errores SCR = i=1 (yi − ŷi )2 = i=1 e2i n−2 SCR/(n − 2) = s2R
Total SCT = SCM + SCR n−1
Para contrastar H0 : β1 = 0 vs. H1 : β1 6= 0, el estadı́stico es F = SCM/s2R ∼ F1;n−2 y RRα = {F > F1,n−2;α }.

Formulación del modelo, estimaciones, modelo ajustado y residuos para el modelo de regresión lineal
múltiple yi = β0 + β1 xi1 + β2 xi2 + · · · + βk xik + ui , donde ui ∼ iid N (0, σ 2 ), en notación matricial:

y = Xβ + u, β̂ = (X T X)−1 X T y, ŷ = X β̂, e = y − ŷ, donde


 
    β0  
y1 1 x11 x12 ··· x1k  β1  u1
 y2   1 x21 x22 ··· x2k     u2 
y =  . , X =  , β =  β2  , u =  .
       
. .. .. .. .. ..
 ..

 .   . . . . .   ..  
 . 
yn 1 xn1 xn2 ··· xnk un
βk
Pn
Cantidades pivotales para σ 2 y βj , j = 0, 1, . . . , k, con varianza residual s2R = 2
i=1 ei /(n − k − 1):

(n − k − 1)s2R β̂j − βj
∼ χ2n−k−1 , ∼ tn−k−1 ,
σ2 s(β̂j )
q
donde s(β̂j ) = s2 (β̂j ) y s2 (β̂j ) es el j-ésimo elemento diagonal de la matriz de covarianza (estimada) para β̂, definida
como Sβ̂ = s2R (X T X)−1 .

Tabla ANOVA para el modelo de regresión lineal múltiple:


Fuente de variación SC GL Media Cociente F
Modelo SCM k SCM/k (SCM/k)/s2R
Residuos/errores SCR n−k−1 SCR/(n − k − 1) = s2R
Total SCT n−1

También podría gustarte