Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INFERENCIA ESTADSTICA
Poblacion
Muestra
Parametro
Estadistico
Inferencia estadistica
Estimacion
Estimacion de Puntual
Parametros
Intervalos de
Confianza
Inferencia
Prueba de Hipotesis
Hiptesis Estadstica
Una Hiptesis Estadstica es una afirmacin que se hace acerca
de un parmetro poblacional. Por ejemplo, el tiempo de vida
promedio para una persona diagnosticada con cncer de pulmn
es 180 das.
hiptesis nula, La afirmacin que est establecida y que se espera
sea rechazada despus de aplicar una prueba estadstica es
llamada la hiptesis nula y se representa por Ho.
x - Z/2 / n , x + Z/2 / n
Inferencias acerca de la Media Poblacional
(varianza conocida).
La siguiente tabla muestra los Z/2 ms usados.
Nivel de Z/2
Confianza
90 1.645
95 1.96
99 2.58
X z / 2s / n, X + z / 2s / n
Tambin se pueden hacer pruebas de hiptesis con
respecto a la media poblacional . Por conveniencia, en la
hiptesis nula siempre se asume que la media es igual a un
valor dado.
Existen dos mtodos para hacer la prueba de hiptesis: el
mtodo clsico y el mtodo del "P-value".
En el mtodo clsico, se evala la prueba estadstica de Z y
al valor obtenido se le llama Z calculado (Zcalc). Por otro
lado el nivel de significancia , definido de antemano
determina una regin de rechazo y una de aceptacin. Si
Zcalc cae en la regin de rechazo, entonces se concluye que
hay suficiente evidencia estadstica para rechazar la hiptesis
nula basada en los resultados de la muestra tomada.
Formulas para prueba de hipotesis de medias
Prueba Estadstica:
x o
Z =
n
Decisin:
Si Zcal < -Z entonces Si |Zcal |>Z/2 entonces Si Zcal >Z entonces
se rechaza Ho se rechaza Ho se rechaza Ho
Prueba de hipotesis usando p-values
El P-value llamado el nivel de significacin observado, es el valor de
al cual se rechazara la hiptesis nula si se usa el valor calculado de la
prueba estadstica. En la prctica un P-value cercano a 0 indica un
rechazo de la hiptesis nula. As un P-value menor que .05 indicar que
se rechaza la hiptesis nula.
One-Sample Z: colesterol
Test of mu = 220 vs > 220
The assumed standard deviation = 13
90%
Lower
Variable N Mean StDev SE Mean Bound Z P
colesterol 20 225.900 13.094 2.907 222.175 2.03 0.021
0.4
Curva Normal
Estandar
0.3
C2
0.2
0.1
t con 5gl.
0.0
-4 -3 -2 -1 0 1 2 3 4
x
Hecho por Edgar Acuna
Si de una poblacin Normal con media y
desviacin estndar se extrae una muestra de tamao n, entonces el
estadstico: x
t =
s
n
se distribuye como una t de Student con n-1 grados de libertad.
Recordar que la desviacin estndar s puede ser escrita en trminos de X
Un intervalo de confianza del 100 (1-) % para es de la forma:
X t / 2 s / n , X + t / 2 s / n
donde s es la desviacin estndar muestral. Aqu t(n-1,/2) es un valor de t
con n-1 grados de libertad y tal que el area a la derecha de dicho valor
es /2.
En MINITAB se sigue la secuencia Stat4Basic Statistics41-sample t
Ejemplo
Ejemplo 7.5. Los tiempos de sobrevivencia (en aos) de 12 personas que se
han sometido a un transplante de corazn son los siguientes:
3.1 .9 2.8 4.3 .6 1.4 5.8 9.9 6.3 10.4 0 11.5
Hallar un intervalo de confianza del 99 por ciento para el promedio de vida
de todas las personas que se han sometido a un transplante de corazn.
Solucin:
One-Sample T: tiempo
Variable N Mean StDev SE Mean 99% CI
tiempo 12 4.75000 4.04599 1.16798 (1.1224, 8.3775)
Prueba Estadstica
x
t = o
s
n
Interpretacin: El valor del P-value (el rea a la derecha de 0.64) es .267 mayor
que el nivel de significacin = .05, por lo tanto NO se rechaza la hiptesis nula y se
concluye de que no hay evidencia de que el tiempo promedio de vida despus del
transplante haya aumentado de 4 aos. Notar que el extremo inferior del intervalo de
confianza de un solo lado al 99% es 1.575 mucho menor que 4.
7.3 Inferencia para Proporciones
Cuando estamos interesados en estimar la proporcin p (o el porcentaje) de
ocurrencia de un evento. Se necesita definir una variable aleatoria X que
indique el nmero de veces que ocurre el evento en una muestra de tamao n
y con probabilidad de xito, p. Se puede mostrar que cuando el tamao de
muestra es grande, tal que np > 5, entonces el estadstico
p p
Z =
pq
n
Solucin:
Hay que hallar un intervalo de confianza del 90% para la proporcin p, y
probar la siguiente hiptesis:
H : p = .4 (la proporcin no cambi de 1990 a 1996).
0
(X i X )2
2 = i =1
2
se distribuye como una Ji-Cuadrado ( 2 ) con n-1 grados de libertad. La
distribucin Ji-Cuadrado no es simtrica, pero a medida que los grados de
libertad aumentan se va observando ms simetra.
Ji-Cuadrado con 9 grados de libertad
2
(n 1) s (X i X )
0.10
2
2 = s 2
=
2 n 1
f(x)
0.05
0.00
0 10 20 30 40 50 60
x
Hecho por Edgar Acuna
Usos de la Ji-Cuadrado
(n 1) s 2 (n 1) s 2
( , )
12 / 2 2 / 2
Ha : 2 < 2
0 Ha : 2 2
0 Ha : 2 > 2
0
Prueba Estadstica: = 2 (n 1) s
2
Solucin:
Se desea probar:
Ho : 2 = 100
Ha : 2 > 100
s12 12
s22 22
se distribuye como una F con m-1 grados de libertad en el numerador y
n-1 en el denominador.
Caso I Caso II Caso III
Ho : 1 = 2 Ho : 12 = 22 Ho : 1 = 2
2 2 2 2
Ha : 1 < 2 Ha : 1 > 2
2 2 2 2
Ha : 12 22
Prueba Estadstica:
s12
F= 2
s2
con m-1 g.l. en el numerador y n-1 g.l en el denominador
Decisin:
Si Fcal<F entonces Si Fcal<F/2 o Fcal >F1-/2 Si Fcal>F1- entonces
se rechaza Ho se rechaza Ho se rechaza Ho
MINITAB hace pruebas de igualdad de varianza de dos o ms grupos.
Para esto se selecciona la opcin 2 Variances del submen Basic
Statistics del men STAT. Otra posibilidad es elegir Test for Equal
Variances del submen ANOVA del men STAT.
( m 1) s 2
+ ( n 1) s 2
s 2p = 1 2
m+n2
1 1
x y t ( / 2,n + m 2) s p +
m n
Las pruebas de hiptesis son:
Caso I Caso II Caso III
Ho : =
1 2 Ho : = 1 2 Ho : =
1 2
Ha : <
1 2 Ha : 1 2 Ha : >
1 2
Prueba Estadstica:
xy
t= con m+n-2 grados de libertad
1 1
sp +
m n
Decisin:
Si t cal < t entonces Si t cal < t / 2 o t cal > t1 / 2 Si t cal > t1
se rechaza Ho se rechaza Ho se rechaza Ho
Ejemplo
Ejemplo 7.13. Se desea comparar si los estudiantes de escuelas privadas y
pblicas tienen igual rendimiento en la prueba de aprovechamiento
matemtico del College Board. Los datos aparecen en el Ejemplo 7.11.
Solucion
i
(d d )2
Prueba Estadstica:
d
t= sd
se distribuye con una t de Student con n-1 gl.
n
Decisin:
Si t<-t entonces Si | t |>t/2 entonces Si Tcal >t entonces
se rechaza Ho se rechaza Ho se rechaza Ho
Ejemplo 7.15
Un mdico desea investigar si una droga tiene el efecto de bajar la presin
sangunea en los usuarios. El mdico eligi al azar 15 pacientes mujeres y
les tom la presin, luego les recet la medicina por un perodo de 6 meses,
y al final del mismo nuevamente les tom la presin. Los resultados son
como siguen:
Sujetos
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Antes 70 80 72 76 76 76 72 78 82 64 74 92 74 68 84
Despus 68 72 62 70 58 66 68 52 64 72 74 60 74 72 74
Solucin:
Sea d que representa la media poblacional de las diferencias. Luego:
Ho: d = 0 (La droga no tiene ningn efecto)
Ha: d > 0 (La droga tiene efecto, la presin antes de usar la droga era mayor
que despus de usarla).
Ejemplo (Cont.)
Paired T-Test and Confidence Interval
Paired T for Antes Despus
N Mean StDev SE Mean
Antes 15 75.87 6.86 1.77
Despus 15 67.07 6.67 1.72
Difference 15 8.80 10.98 2.83
( p 1 p 2 ) ( p1 p 2 )
z=
p1 q1 p 2 q 2
+
m n
X
Donde p 1 = m1 , p 2 = X 2 , q1 = 1-p1 y q2 = 1-p2 se distribuye aproximadamente
n
como una normal estndar cuando n y m son grandes tal que, mp1 y np 2 son
mayores que 5.
Un intervalo de confianza
Un intervalo de confianza aproximado del 100(1-) para la diferencia de las
proporciones ser de la forma:
) ) p 1 q1 p 2 q 2
p1 p 2 z1 / 2 +
m n
X1 + X 2
donde, p es estimado por p= . Luego, las frmulas para pruebas de
m+n
Ha : p 1 < p2 Ha : p p 1 2
Ha : p > p
1 2
Prueba Estadstica:
) )
p1 p 2
Z=
1 1
p(1 p ) +
m n
Decisin:
Si Z cal < Z entonces
Si Z < Z / 2 o Z >Z1 / 2
cal cal
Si Z > Z 1
cal
Solucin:
La hiptesis nula es
Ho: p1 = p2 (las probabilidades de sufrir ataque cardaco son iguales para
ambos grupos) y
Ha: p1 < p2 (la probabilidad de sufrir ataque cardaco es menor en hombres
deportistas).
Test and CI for Two Proportions
Sample X N Sample p
1 10 100 0.100000
2 25 200 0.125000
Difference = p (1) - p (2)
Estimate for difference: -0.025
95% upper bound for difference: 0.0375666
Test for difference = 0 (vs < 0): Z = -0.64 P-Value = 0.262
Solucin:
Sea ph la proporcin de estudiantes admitidos entre todos los solicitantes de
escuela privada y pe la proporcin de estudiantes admitidos entre todas las
solicitudes de escuela pblica. Entonces, las hiptesis nula y alterna sern:
H 0 : p h = pe (o tambin ph-pe = 0)