Está en la página 1de 6

UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MEDELLN

ESCUELA DE ESTADSTICA
SEGUNDO TRABAJO

Pruebas de Hiptesis (15%)

SEM. 01 2015

Grupo

Nombre Completo

Luis Felipe Arevalo Corts

D. I.

1018469500

Nombre Completo

Ricardo Marulanda Grisales

D. I.

1020474299

La base de datos con la que le corresponde trabajar, se obtiene como una muestra aleatoria de
una gran base de datos. La base original corresponde a la informacin de 200 estudiantes de la
Universidad Nacional Sede Medelln. Dicha base contiene las variables: GENERO (HOMBRE o
MUJER), ESTATURA (en cm. del estudiante), EDAD (en aos), PAPA (obtenido en el semestre
anterior), ESTRATO y TRAB (trabaja SI o NO).
Cada pareja debe generar una base de datos, que corresponder a una muestra de tamao 60 de
la base original. Los datos originales estn en el archivo: base.txt, el cual est disponible en
Moodle. Para hacerlo debe seguir los siguientes pasos:
# Procedimiento para generar archivo de datos para el trabajo
# Primero leer el archivo de datos.
uno <- read.table(file.choose(), header=T)
# Copiar el siguiente cdigo en R
genera <- function(cedula){
set.seed(cedula)
data <- uno[sample(1:200,60),]
data
}
# Para crear la base de datos con la cual trabajara, debe ejecutar la siguiente lnea:
datos <- genera(1020474299)
# cedula representa el nmero de cedula de uno de los dos integrantes. En el trabajo debe indicar
cul nmero de cdula us.
Con la base ya creada debe resolver las siguientes preguntas:

1. Se tiene la creencia de que la Estatura media de los estudiantes es inferior a 170 cms. Es
esto cierto? Justifique su respuesta.

2. Puede afirmarse que el PAPA promedio de las mujeres es superior al de los Hombres?
Justifique su respuesta
Estrato
Proporcin

1
0.05

2
0.15

3
0.38

4
0.28

5
0.08

6
0.06

3. Se puede
afirmar que el
porcentaje de personas que trabajan es inferior al 30%? Justifique su respuesta.

4. Puede afirmarse que la distribucin de estudiantes por estrato es la que se muestra en la


siguiente tabla?

Consideraciones sobre el trabajo.


1. Para la solucin de cada pregunta se deben plantear todas las hiptesis de inters, definir
claramente los parmetros a ser utilizados y probar los supuestos que se requieran.
Finalmente la conclusin debe hacerse SOLO usando el valor P.
2. El trabajo debe contener mximo 7 pginas incluyendo estas dos pginas de instrucciones.
3. El trabajo debe ser entregado impreso al profesor el da 26 de mayo hasta las 5:00 p.m.
4. La solucin a las preguntas deben hacerse SOLO en R (con comando o usando
R-Commander).
Solucin:
NOTA: Se us el nmero de cdula 1020474299 de Ricardo Marulanda Grisales.
1. Con respecto a la estatura, primero se realiz una prueba de normalidad con el test de
Shapiro-Wilk para comprobar que la muestra se distribuye normalmente,

Debido a que el valor p es mucho mayor que la significancia que tomamos de 0.05,
concluimos que la muestra tomada se distribuye normalmente (Pues tal afirmacin es la

hiptesis nula) y procedemos a utilizar el estadstico t para la siguiente prueba de hiptesis.


De donde podemos hallar el valor p y posteriormente concluir.
H 0 : 170
H a : 170

Con un valor p de 0.4028 mayor que el alfa de 0.05, tenemos evidencia suficiente para no
rechazar Ho, por lo cual la hiptesis alterna no es verdadera. Por lo tanto, la estatura media de
los estudiantes no es menor a 170.
2. Se verific por medio del test de Shapiro-Wilk que las distribuciones fueran normales

Para el papa de los hombres, dado que el valor p de 0.05811 es mayor al alfa de 0.05, se
concluye que es normal. De igual manera, para el papa de las mujeres con un valor p de
0.283, se verifica que tambin es normal. Dada que ambas son normales y no se conocen las
desviaciones estndar poblacionales de ninguna de las dos categoras, procedemos a realizar
una prueba de hiptesis para comprobar si las dos varianzas de las muestras son iguales o
diferentes para saber qu estadgrafo de prueba usar.

Teniendo un valor P de 0.4339 mayor que el nivel de significancia de 0.05, se acepta la


hiptesis nula, por lo que hay evidencia muestral suficiente para sugerir que las varianzas son
iguales.
Sabiendo esto, podemos usar el estadgrafo de prueba T

H 0 : mujer h ombre
H a : mujer > h ombre

Dado un valor P para esta prueba de hiptesis de diferencia de medias de 1, mucho mayor
que el valor de significancia de 0.05, no rechazamos la hiptesis nula, por lo cual no hay
evidencia suficiente para decir que la media del PAPA de las mujeres es mayor que la de los
hombres.
3. Sea P la probabilidad de que un estudiante sacado aleatoriamente de la muestra trabaje.
H 0 : P 0.3
H a : P< 0.3
Z0=

p0

p 0 (1 p0 )
n

Dado que tenemos un valor P de 1, muy superior a la significancia de 0.05, hay evidencia
suficiente para no rechazar Ho, por lo tanto no hay evidencia suficiente para afirmar que el
porcentaje de personas que trabajan es inferior al 30%.
4.
H 0 : P1 =0.05, P2=0.15, P3=0.38, P 4=0.28, P5=0.08, P6=0.06
H 0 : P1 0.05, P2 0.15, P3 0.38, P4 0.28, P5 0.08, P6 0.06
Para hallar los valores esperados y el valor P, se recodifica la variable ESTRATO a una nueva
variable llamada prerestrato y se procede a realizar la distribucin chi cuadrado.
Como el valor P es mayor a 0.05, no se rechaza Ho, pero como el valor observado de los
estratos 1 y 6 es menor que 5, se procede a juntar tales categoras con la ms cercana a
cada una de ellas (la 1 con la 2 y la 6 con la 5).
k

X 2=
i=1

Estrato

(O iEi )2
Ei

Esperado

22.8

16.8

4.8

3.6

Observado

19

25

Ahora se recodific la variable prerestrato a una nueva variable llamada restrato uniendo las
categoras anteriormente mencionadas. Y se procedi a calcular la distribucin chi cuadrado
hallando as los valores observados de las nuevas categoras y el valor P con el que se
concluye.

Estrato

1-2

5-6

Esperado

12

22.8

16.8

8.4

Observado

19

25

Como el nuevo valor P es mayor que 0.05, no se rechaza Ho y hay evidencias suficientes para
decir que la distribucin de estudiantes por estrato es la que se muestra en la tabla.

También podría gustarte