Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Practica 20
Practica 20
PRACTICA
DE ORDENADOR 2: INTERVALOS DE CONFIANZA Y
CONTRASTES PARAMETRICOS
Y REGION
DE RECHAZO EN CONTRASTES DE
HIPOTESIS
En esta seccion recordaremos brevemente conceptos desarrollados en el Tema 3 relacionados con contrastes de hipotesis y que son necesarios para poder resolver algunos ejercicios
propuestos. Comenzaremos recordando un esquema de los posibles aciertos y errores que se
pueden cometer a la hora de llevar a cabo un contraste de hipotesis:
DECISION
Aceptar H0
Hip.
cierta
Aceptar H1
H0
correcta
erronea
H1
erronea
correcta
Teniendo en cuenta el esquema anterior, podemos cometer dos tipos de errores cuando
se resuelve un contraste de hipotesis:
Error de Tipo I: Rechazar H0 cuando es cierta.
Error de Tipo II: Aceptar H0 cuando es falsa.
La probabilidad de cometer un error de tipo I se de nota por y la probabilidad de cometer
un error de tipo II se denota por :
= P (Error tipo I)
Regi
on de Rechazo de un Contraste
El metodo tradicional de realizar un contraste es dividir el rango de discrepancias que
puede observarse cuando H0 es cierta en dos regiones: Una region de aceptacion de H0 y
otra de rechazo. Fijado , la region de rechazo se determina a partir de la distribucion del
estadstico de contraste cuando H0 es cierta.
Cuando el estadstico de contraste pertenece a la region de rechazo, se dice que se ha producido una diferencia significativa, y se rechaza la hipotesis H0 .
Ejemplo 1 Se elige una muestra de tama
no 4 de una poblacion de Poisson, para contrastar
las hipotesis H0 : = 1 frente a H1 : = 2.5 . Si el tama
no maximo del error de tipo I que
puede tolerarse es 0.1 y se consideran las regiones de rechazo C1 = {X1 + X2 + X3 + X4 > 7}
y C2 = {X1 + X2 + X3 + X4 > 9}, determina razonadamente cual es la mejor para elegir
entre las dos hipotesis.
PARAMETRICOS
PARA POBLACIONES NORMALES
EN SPSS.
SPSS obtiene intervalos de confianza y contrastes de hipotesis para la media de una poblacion
y para la diferencia de medias de dos poblaciones, siempre bajo la condicion de que los datos
provengan de una distribucion normal. Los contrastes de hipotesis que realiza el SPSS
son bilaterales, es decir, en caso de una media, el enunciado del contraste sera del tipo
H0 : = 0 y H1 : 6= 0 , mientras que en caso de una diferencia de medias las hipotesis
seran: H0 : 1 2 = 0 frente a H1 : 1 2 6= 0.
Los intervalos de confianza y los contrastes comparten el mismo procedimiento, que puede
ejecutarse en la opcion Prueba T.
En el boton Opciones podemos cambiar el nivel de confianza del intervalo o del contraste.
SPSS obtiene un primer cuadro con la media y la desviacion tpica muestral y en un
segundo cuadro con el valor del estadstico T y un intervalo de confianza para la diferencia
promedio. Sin embargo no nos proporciona la region crtica, en su lugar nos proporciona el
p-valor en la casilla Sig.(bilateral)
Ejemplo 2 En el fichero P2 Ejemplo 01.sav se recogen los valores sobre las longitudes en
micras de 40 filamentos de la produccion de una maquina. Suponiendo que la longitud de los
filamentos sigue una distribucion normal, calcular un intervalo de confianza para la longitud
media de la produccion al 90% de confianza.
Ejemplo 3 Cuando funciona correctamente, un proceso fabrica botes de champ
u cuyo contenido pesa, en promedio, 200 gramos. Una muestra aleatoria de nueve frascos de una remesa
presento los siguientes pesos (en gramos) para el contenido:
214
197
197
206
208
201
197
203
209
Asumiendo que la distribucion es normal, es posible concluir que el proceso no este funcionando correctamente?
2.1.2 Contrastes Unilaterales para la Media.
Si deseamos obtener el p-valor para los contrastes unilaterales con SPSS, tenemos que tener
en cuenta la distribucion del estadstico de contraste, y el tipo de hipotesis que deseamos
contrastar, seg
un el cuadro:
Contrastes Unilaterales para
Contraste )
H0 : 0
H1 : > 0
Estadstico Contraste
P [T > t0 ]
T =
H0 : 0
H1 : < 0
P-valor
0
X
t(n 1)
S/ n
P [T < t0 ]
Ejemplo 4 Con el objetivo de determinar si tiempo medio, en minutos, que tarda un autob
us
en realizar su recorrido completo es menor o igual a 35 minutos, se seleccionaron al azar 9
das, obteniendose los siguientes resultados
36
37
37
38
34
39
37
36
38
Asumiendo que la distribucion es normal, es posible concluir que el tiempo medio es inferior
o igual a 35 minutos?
El ejemplo anterior, dada la variable
X = Tiempo empleado N (, )
consiste en resolver el siguiente contraste unilateral:
H0 : 35
H1 : > 35
Para resolver el ejemplo anterior con SPSS debemos, una vez introducidos los datos, emplear
el mismo men
u que empleamos para resolver el correspondiente contraste bilateral, esto es
Analizar Comparar medias Prueba T para una muestra
Al ejecutar dicho men
u, debemos seleccionar como valor de prueba 35 y ejecutamos el proceso
Una vez obtenidos los resultados, en lugar de fijarnos en el valor de la casilla Sig.(bilateral),
que corresponde al p-valor del contraste bilateral, debemos fijarnos en los valores que aparecen en las casillas t y gl, que nos proporcionan, respectivamente, el valor del estadstico de
contraste t0 y los grados de libertad de la distribucion del estadstico de contraste.
As, tenemos que el valor t0 = 3.9 y los grados de libertad son 8 y teniendo en cuenta la tabla
de contrastes unilaterales, el p-valor correspondiente al contraste que queremos resolver es
p-valor = P [T
> 3.9] con T
t(8), que con la ayuda del men
u
Transformar/Calcular variable se determina facilmente y es igual a 0.0023 < = 0.05
con lo que se rechaza la hipotesis nula y se acepta la hipotesis alternativa y por tanto no
podemos aceptar que el tiempo medio que tarda el autobus es inferior o igual a 35 minutos.
Empresa A
Empresa B
15 23 30 22 22 29 25
12 21 25 22 15 21 15
Con esta informacion y con un nivel de significacion del 1%, se puede considerar que
los tiempos de entrega de los pedidos son iguales en ambas empresas?
2.2.2 Contrastes Unilaterales para la Diferencia de Medias. Muestras Independientes
Para calcular el p-valor de los contraste unilaterales para la diferencia de medias, debemos
primero tener en cuenta el resultado del contraste de Levene para la igualdad de varianzas.
De este modo si aceptamos que las varianzas son iguales, para obtener el p-valor de los
contrastes unilaterales para la diferencia de medias, debemos tener en cuenta el siguiente
cuadro:
Contrastes de Hipotesis para x y . Caso x2 = y2
Contraste
Estadstico Contraste
H0 : x y 0
H1 : x y > 0
H0 : x y 0
H1 : x y < 0
T =
Y 0
X
q
Sp (1/n) + (1/m)
Sp2
P-valor
t(n + m 2) P [T > t0 ]
(n 1)Sx2 + (m 1)Sy2
=
n+m2
P [T < t0 ]
Estadstico Contraste
H0 : x y 0
H1 : x y > 0
H0 : x y 0
H1 : x y < 0
T =q
Y 0
X
(Sx2 /n) + (Sy2 /m)
P-valor
t([])
P [T > t0 ]
P [T < t0 ]
Ejemplo 6 Se quiere comparar la duracion, en horas, de dos marcas de pilas distintas. Para
ello, se seleccionaron muestras de ambas marcas, con el siguiente resultado:
Marca A
Marca B
8.6
8.1
Suponiendo que ambas poblaciones siguen una distribucion normal, contrastar a nivel de
significacion del 5% si la duracion media de las pilas de la marca A es mayor o igual a la de
la marca B.
Debemos resolver el siguiente contraste unilateral:
H0 : x y 0
H1 : x y < 0
siendo:
X = Duracion de la pila de la marca A N (x , x )
Y = Duracion de la pila de la marca B N (y , y )
Para ello, ejecutamos en el SPSS, el mismo men
u que en caso del contraste bilateral:
Analizar Comparar medias Prueba T para muestras independientes
Una vez obtenido los resultados, primero determinamos si aceptamos la igualdad de varianzas
con la pruieba de Levene
En este caso, se acepta la igualdad de varianzasy por tanto, debemos fijarnos en la primera
fila y en las casillas t y gl
Ejemplo 7 Se desea comparar la calidad de dos nuevas clases de trigo. Para ello se toman
10 fincas al azar, plantando en cada una de ellas y en dos partes distintas ambas clases. Los
datos sobre la produccion en las 10 fincas son los siguientes:
Clase A
Clase B
57
55
49
48
60
58
55
56
57
54
48
48
50
52
61
56
52
50
56
58
Podemos aceptar que la produccion es la misma para ambas clases de trigo con un 95%
de confianza, suponiendo que las distribuciones son normales?
2.3.2 Contrastes Unilaterales para la Diferencia de Medias. Muestras Apareadas
En este caso, se procede como en casos anteriores, teniendo en cuenta el cuadro:
Contrastes Unilaterales para x y . Muestras apareadas.
Contraste
Estadstico Contraste
H0 : x y 0
H1 : x y > 0
H0 : x y 0
H1 : x y < 0
T =
P-valor
D0
D
t(n 1) P [T > t0 ]
SD / n
D =X Y
P [T < t0 ]
3. CONTRASTES PARAMETRICOS
PARA PROPORCIONES EN SPSS.
En Lista contrastar variables se introduce la variable con la muestra, y en valores esperados hay que introducir 1 p0 y p0 . El orden de los valores es importante; corresponde al
orden ascendente de los valores de categora de la variable de contraste. El primer valor de
la lista corresponde al valor mnimo de la variable de contraste y el u
ltimo valor corresponde
al valor maximo. En caso de trabajar con 0 y 1, y que la proporcion que contrastamos sea
la de 1, primero hay que introducir 1 p0 y luego p0 . Si p0 = 0.5 entonces podemos marcar
la opcion Todas las categoras iguales. SPSS nos devuelve varios resultados, pero los que
mas nos interesan estan en la tabla Estadsticos de contraste. En ella tenemos el valor del
estadstico T al cuadrado, pero para aceptar o rechazar debemos fijarnos en el p-valor (Sig.
asintot.).
Ejemplo 8 Se esta intentando probar que la proporcion de familias con vivienda en propiedad
totalmente pagada en una ciudad es del 20%. Para ello se toma una muestra que se encuentra en el fichero vivienda.sav Es consistente la hipotesis a probar con el resultado obtenido
de la muestra con un nivel de confianza del 95%?
CON FRECUEN3.1.2 CONTRASTE BILATERAL PARA UNA PROPORCION
CIAS MUESTRALES
En este caso, el procedimiento es el mismo, pero la forma de introducir los datos es diferente,
siguiendo con el mismo ejemplo anterior los datos de entrada ahora sera:
10
Estadstico Contraste
)
P [T > t0 ]
T =s
H0 : p p0
H1 : px < p0
P-valor
p p0
p0 (1 p0 )
n
N (0, 1)
P [T < t0 ]
Tambien debemos tener en cuenta que el valor del estadstico que proporciona SPSS en este
caso, es el cuadrado del estadstico T que aparece en el cuadro anterior, y por tanto es
necesario realizar la raz cuadrada del valor proporcionado por SPSS a la hora de obtener
un p-valor para un contraste unilateral.
11
Ejemplo 9 Se desea contrastar si la proporcion de das lluviosos en una determinada ciudad. Para ello, se tomo una muestras de 900 das, y se observo que 145 das fueron lluviosos.
Contrastar la hipotesis de que la proporcion de das lluviosos es inferior o igual al 15% con
un nivel de significacion del 5%.
El contraste que nos piden realizar, es el siguiente contraste unilateral:
(
H0 : p 0.15
H1 : p > 0.15
Para llevarlo a cabo con SPSS, debemos emplear el mismo procedimiento que con el contraste bilateral, rellenando previamente y ponderando los datos con frecuencias muestrales:
Al ejecutar el procedimiento bilateral para una proporcion, obtenemos los resultados correspondientes al contraste bilateral, por tanto en este caso, no nos interesa el p-valor sino el
estadstico de contraste
El valor del estadstico 0.871 viene al cuadrado, y por tanto debemos hacer la raz
cuadrado, cuyo valor es 0.933. As pues, teniendo en cuenta el cuadro de contrastes unilaterales, el p-valor viene dado por P [T > 0.933] siendo T N (0, 1), que se puede determinar
facilmente con SPSS y cuyo valor es 0.1754 > = 0.05 por tanto se acepta la hipotesis n
ula y la proporcion de das lluviosos es menor o igual al 15%.
13
La tabla Tabla de contingencia nos muestra un resumen de los datos y las proporciones
muestrales. En la tabla Pruebas de chi-cuadrado obtenemos el resultado del contraste,
concretamente en la primera fila, Chi-cuadrado de Pearson, SPSS nos devuelve el valor
del estadstico T al cuadrado, pero para aceptar o rechazar debemos fijarnos en el p-valor
(Sig. asintotica bilateral), obviando el resto de casillas.
Ejemplo 10 Se desea comparar dos comunidades respecto a la proporcion de personas seguidoras de un partido poltico. Se encuestaron un total de 1500 personas cuyos resultados est
an
en el fichero partido.sav
Hay suficiente evidencia estadstica para concluir, con un nivel de significacion del 5%,
que es igual la proporcion de seguidores en la comunidad A que en la B?
y al igual que en el caso de una sola proporcion, hay que ponderar los casos por las
frecuencias (ver seccion 2.1.2). Una vez realizada la ponderacion, el procedimiento es identico
al anterior (seccion 2.2.1).
14
Ejemplo 11 Repetir el ejemplo anterior, sabiendo ahora que en la comunidad A se encuestaron 500 personas de las cuales 300 se declararon seguidoras de este partido mientras que en
la comunidad B fueron encuestadas 1000 pers onas de las cuales 680 se declararon seguidoras
de dicho partido.
Estadstico Contraste
)
P [T > t0 ]
T =q
H0 : px py 0
H1 : px py < 0
P-valor
px py
n+m
p(1
nm
p)
N (0, 1)
P [T < t0 ]
Para llevar a cabo cualquier contraste del cuadro anterior, ejecutaremos el mismo procedimiento que para el caso bilateral. Con la raz cuadrada del estadstico proporcionado
por SPSS, y teniendo en cuenta el cuadro anterior, se puede determinar facilmente el p-valor
unilateral.
3. EJERCICIOS PROPUESTOS.
Ejercicio 1
Sea una moneda trucada con probabilidad de cara p. Se quiere contrastar la hipotesis nula de
que p = 0.4 frente a la alternativa de que p = 0.7, para ello se toma una m.a.s. de tama
no
10 y se decide rechazar H0 si el n
umero de caras aparecidas es mayor que 6. Determine el
nivel de significacion y la potencia del contraste.
Ejercicio 2 El tiempo que esperan los viajeros hasta coger el autob
us sigue una distribuci
on
Uniforme en el intervalo [0, ]. Dos amigos discuten si = 30 o = 40 minutos. Deciden
contrastar estas hipotesis (H0 : = 30, H1 : = 40), para ello un da cualquiera medir
an
el tiempo que esperan el autob
us y si este tiempo es mayor que 25 minutos rechazar
an la
hipotesis nula. Calcule la probabilidad de cometer los errores Tipo I y Tipo II si se toma esa
regla de decision.
Ejercicio 3 Se elige una muestra de tama
no 2 de una poblacion de Poisson, para contrastar
las hipotesis H0 : = 1 frente a H1 : = 2. Se considera la region crtica {X1 + X2 > 3}.
Halle el nivel de significacion y la potencia del contraste.
15
2
180,7
201,5
3
149,6
167,3
4
153,2
150,1
5
162,6
173,3
6
160,1
170,4
Suponiendo que la distribucion del volumen semanal de ventas es normal, construir un intervalo de confianza al 90% para la diferencia entre las ventas medias semanales antes y
despues del curso.
Ejercicio 6 Una empresa tiene dos delegaciones: A y B. La distribucion mensual de los
ingresos en miles de euros sigue una distribucion normal. Se han tomado m.a.s. de los
ingresos de las dos delegaciones obteniendo para la A: 10, 9, 3, 2 y 4, y para la B: 6, 5,
3, 3, 6, 3, 4 y 6 miles de euros. Compruebe que las varianzas de los ingresos en estas
delegaciones son distintas y calcule un intervalo de confianza del 95% para la diferencia de
ingresos medios mensuales de ambas delegaciones.
Ejercicio 7 Se ha hecho un estudio de las calificaciones obtenidas en una asignatura que
se imparte en dos carreras: A y B. Una m.a.s. de 10 alumnos que estudian la carrera
A obtuvieron las siguientes notas: 2, 6, 4, 3, 7, 5, 4, 6, 1 y 2. Las calificaciones de los
13 alumnos seleccionados de la carrera B, fueron: 1, 8, 8, 4, 6, 2, 0, 7, 7, 1, 7, 0 y 1.
Suponiendo que las calificaciones siguen un modelo normal:
a) Se puede afirmar con una confianza del 95% que las varianzas en ambas carreras son
iguales?
b) Obtenga un intervalo de confianza del 95% para la diferencia de notas medias pueden
considerarse iguales?
Ejercicio 8 Una cadena de supermercados afirma que su campa
na publicitaria le har
a aumentar el volumen medio de ventas anuales. Para verificar esta hipotesis elige 12 supermercados de su cadena y estudia las ventas anuales (en miles de euros) en cada uno de ellos,
durante el a
no anterior y el posterior a la campa
na publicitaria, obteniendo los siguientes
resultados
Antes
Despues
10
11
12
11
15
17
8
9
19
21
14
13
16
12
16
21
25
16
20
11
18
8
10
15
17
Suponiendo que las ventas se distribuyen normalmente, estudie si puede considerarse efectiva
la campa
na publicitaria.
Ejercicio 9 Un gerente esta considerando establecer un descanso adicional de 15 minutos
si hay evidencias de que se reduciran el n
umero de errores cometidos por sus trabajadores.
Para comprobarlo, el gerente toma una muestra aleatoria de 20 trabajadores dividiendolos en
dos grupos: los miembros del primer grupo contin
uan con el horario habitual mientras que a
los del segundo grupo se les otorga un descanso adicional de 15 minutos. La siguiente tabla
refleja el n
umero de errores cometidos en un mes por los trabajadores de la muestra
Grupo 1 7
Grupo 2 8
6
7
14
5
12
8
13 8 9 6 10
10 9 7 8 4
9
5
Suponiendo normalidad de los datos, estudie si puede considerarse efectivo el descanso adicional.
Ejercicio 10 Una empresa esta realizando un estudio sobre la satisfaccion de sus empleados en los distintos departamentos. Si de una muestra aleatoria de 500 trabajadores del
departamento de produccion, 210 se declararon satisfechos. Puede admitirse con un nivel
de confianza del 95%, que la mitad de los trabajadores de la empresa se sienten satisfechos
con el departamento?
Ejercicio 11 Dos grupos A y B estan formados por 100 personas cada uno, aquejados todas
de cierta enfermedad. Se suministra un suero al grupo A pero no al B; por lo demas ambos
reciben identico tratamiento. Se encuentra que 75 individuos del grupo A y 65 del B se
recuperan de la enfermedad. Contrastar la hipotesis de que el suero cura la enfermedad a
nivel de significacion 0.01.
17