Documentos de Académico
Documentos de Profesional
Documentos de Cultura
PH Con R Comander PDF
PH Con R Comander PDF
P (K ≤ kα ) = 1 − α .
La siguiente tabla muestra algunos valores crı́ticos para el estadı́stico
de Kolmogorov-Smirnov:
Ejemplo 1
Se tiene información sobre un grupo de 200 estudiantes de cierta uni-
versidad. A cada sujeto se le indagó por 10 varibles de interés: GE-
NERO(Hombre o Mujer), ESTATURA(en cms), MASA(en Kgr), HO-
RAS(dedicadas semanalmente a estudiar fuera de clases), EDAD(en
años), TIEMPO(requerido para llegar de su residencia a la Universidad
en min), PAPA(del semestre anterior), VMATRI(valor de matrı́cula en
miles de pesos), ESTRATO(de la residencia donde habita) y TRAB(SI
o NO). UN análisis descriptivo de las variables continuas se muestra a
contiación.
> summary(datos[,c(2,3,5,6,7,8)])
data: ESTATURA
W = 0.9922, p-value = 0.36
> lillie.test(ESTATURA)
data: ESTATURA
D = 0.042, p-value = 0.5266
data: TIEMPO
W = 0.8736, p-value = 7.053e-12
8
Usando KS-Lilliefors:
> lillie.test(TIEMPO)
data: TIEMPO
D = 0.1446, p-value = 5.753e-11
data: EDAD
W = 0.9688, p-value = 0.0002023
Debido a que existen muchos Test para probar Normalidad, una alter-
nativa es construyendo un gráfico especial conocido como QQplot. Este
grafica los cuantiles muestrales de los datos versus los cuantiles teóricos
de una distribución Normal. Si en efecto los datos prvienen de una dis-
tribución Normal, se debe evidenciun gráfico muy lineal, posiblemente
no en los extremos. Si el gráfico se aleja mucho de dicha lı́nea, es evi-
dencia de No normalidad. Para la variable Edad, en R-Commaner los
pasos se muestran en la figura 7. El QQplot se muestra en la figura 8.
9
2
b) σX es desconocida. En este caso el estadı́stico de prueba es:
X̄ − µ0
TC = SX
∼ t(n − 1) .
√
n
Ejemplo 2
Considere los datos del ejemplo 1. Se desea establecer si la estatura
promedio de los estudiantes es superior a 168 cms. Si X representa
la estatura de un estudiante de dicha Universidad, sedesea probar si
µX > 168. Previamente se probó que las Estaturas se distribuyen Nor-
malmente. Con esto en mente las hipótesis a probar son:
X̄ − 168
TC = SX
∼ t(n − 1) .
√
n
X̄ − µ0
ZC = σX aprox N (0, 1) .
√
n
2
b) Si σX es desconocida
X̄ − µ0
ZC = SX
aprox N (0, 1) .
√
n
13
Ejemplo 3
Con los datos de los estudiantes, se tiene la creencia de que el tiempo
medio requerido para llegar a la universidad es menor a 20 min. Primero
es necesario determinar si la muestra proviene de una población normal.
H0 : µX = 20 Ha : µX < 20 .
14
Estadı́stico de prueba:
X̄ − 20
ZC = SX
aprox N (0, 1) .
√
n
Var Tiempo
mean sd n
26.45714 20.85432 70
Ejemplo 4
Se desea establecer si la Masa propedio de los estudiantes de la univer-
sidad es superior a 63 kgr. Las hipótesis a probar son:
H0 : µX = 63 vs Ha : µX > 63 .
Para determinar el estadı́stico de prueba, es necesario establecer si las
masas se comportan normalmente o no. En este caso se desean probar
las hipótesis:
H0 : Las masas tienen una distribución normal
vs
H0 : Las masas NO tienen una distribución normal
Usando el Test Shapiro-Wilks
data: MASA
W = 0.982, p-value = 0.01159
15
X̄ − 63
ZC = aprox N (0, 1) .
√SX
200
X̄ − Ȳ − δ0
ZC = q 2 2
∼ N (0, 1) .
σX σX
n
+ m
16
2
2. σX y σY2 son desconocidas. En este caso la obtención del estadı́stico
de prueba dependerá de la relación entre las varianzas poblaciona-
les de ambas muestras. Una manera de establecer la relación entre
las varianzas de dos poblaciones es a través de un procedimiento
de Prueba de Hipótesis.
2
a) σX = σY2 . En este caso el estadı́stico de prueba es:
2
X̄ − Ȳ − δ0 (n − 1)SX + (m − 1)SY2
TC = q ∼ t(n+m−2) ; Sp2 = .
Sp n1 + m1 n+m−2
2
b) σX 6= σY2 . En este caso el estadı́stico de prueba es:
2 2
SX SY2
X̄ − Ȳ − δ0 n
+ m
TC = q 2 2
∼ t(ν) ; ν = 2 2 2 2 − 2 .
SX SX S S
X Y
n
+ m n m
n+1
+ m+1
La región de rechazo y el cálculo del Valor p están dados por:
TC | TC < −tα (ν) P (t(ν) < TC )
TC | TC > tα (ν) ; P (t(ν) > TC ) .
TC | |TC | > t 2 (ν) 2 P (t(ν) > |TC |)
α
Ejemplo 5
Retomando la base de datos de los estudiantes de la universidad, se
tiene la creencia de que la estatura media en los hombres es superior
a la estatura media en la mujeres. Primero se verifica si las Estaturas
se distribuyen Normalmente discriminando por género. Para lograrlo
se deben separar las muestras por Género. Usando R se utilizan los
comandos:
data: ESTATURA
W = 0.9918, p-value = 0.9926
data: ESTATURA
W = 0.9789, p-value = 0.7679
> lillie.test(est_muj[,2])
data: est_muj[, 2]
D = 0.056658, p-value = 0.6699
> lillie.test(est_hom[,2])
data: est_hom[, 2]
D = 0.056208, p-value = 0.5422
2
Sean µX y σX la media y varianza poblacionales de las Estaturas pa-
ra los hombres y sea µY y σY2 la media y varianza poblacionales de
las Estaturas para las Mujeres. Los resultados muestrales para ambas
muestras son:
mean sd data:n
HOMBRE 171.3184 10.036470 38
MUJER 163.2344 8.754634 32
H0 : µX − µY = 0 vs Ha : µX − µY > 0 .
donde
n = 38, x̄ = 171.318, sX = 10.036 ; m = 32, ȳ = 163.234, sY = 8.755 .
Usando R-Commander:
Fig. 16: Prueba de Hipótesis para Diferencia entre las estaturas Medias
22
X̄ − Ȳ − δ0
ZC = q 2 2
aprox N (0, 1) .
σX σY
n
+ m
X̄ − Ȳ − δ0
ZC = q 2 aprox N (0, 1) .
SX SY2
n
+ m
Ejemplo 6
Usando la misma base de datos de los estudiantes, se desea establecer
24
mean sd data:n
NO 27.07826 20.4698 46
SI 25.26667 21.9693 24
H0 : µX − µY = 0 vs Ha : µX − µY > 0 .
Para probar este par de hipótesis se requiere saber si los tiempos para
los que trabajan y para los que no trabajan se distribuyen normal-
mente. Primero se separan los datos para los que trabajan y los que
no-trabajan:
vs
Usando R-Commander:
25
X̄ − Ȳ − 0
ZC = q 2 aprox N (0, 1) .
SX SY2
n
+ m
Ejemplo 7
Se tiene la creencia de que el porcentaje de estudiantes que no trabajan
es superioral 60 %. ¿Es esta afirmación coherente con los datos recopila-
dos? Sea X la variable aleatoria nque representa el número de estudian-
tes que no trabajan en la muestra de 70. Se tiene que X ∼ Bin(70, p).
27
En resumen se tiene:
29
clase 1 2 k total
Frec observada n1 n2 ... nk n
Probabilidad p1 p2 ... pk 1
Frec esperada n p1 n p2 n pk n
Si n pi ≥ 5 ; i = 1, 2 . . . , k , la v.a.
k
X (Ni − n pi ) 2
X= ∼ χ 2 (k − 1) .
i=1
n pi
Observe que
k
X (Ni − n pi ) 2 X (f.obs − f.esp) 2
X= = ∼ χ2 (k − 1) .
i=1
n pi todas las celdas
f.esp
H0 : p i = pi 0 ; i = 1, 2 . . . , k vs Ha : ∃ j tal que pj 6= pj 0 .
Estadı́stico de Prueba:
k
X (ni − n pi ) 2
XC = ∼ χ 2 (k − 1) .
i=1
n pi
P (χ2 (k − 1) > XC ) .
Ejemplo 8
Con base en un estudio realizado el semestre pasado, se encontró que
los estudiantes estaban distribuı́dos en los seis estratos en los siguientes
porcentajes:
30
Estrato 1 2 3 4 5 6
P roporción 0.08 0.15 0.37 0.30 0.06 0.04
vs
Ha : Alguna de las proporciones ha cambiado
counts:
ESTRATO
1 2 3 4 5 6
10 5 25 21 5 4
Clase 1 2 3 4 5 6
F rec − Obs 10 5 25 21 5 4
F rec − Esp 5.6 10.5 25.9 21 4.2 2.8
6
X (Ni − ei )2
XC = ∼ χ2 (5) .
i=1
ei
Usando R-Commander:
31
counts:
ESTRATO
1 2 3 4 5
10 5 25 21 9
Clase 1 2 3 4 5
F rec − Obs 10 5 25 21 9
F rec − Esp 5.6 10.5 25.9 21 7
Estadı́stico de prueba:
5
X (Ni − ei )2
XC = ∼ χ2 (4) .
i=1
ei
Usando R-Commander: