Está en la página 1de 15

Asignatura Alumno Fecha

Análisis e interpretación de datos Espinosa García Claudia Montserrat 08/Feb/2021

CONTRASTE DE HIPOTESIS
Laboratorio
Análisis e Interpretación de Datos

Claudia Montserrat Espinosa Garcia

1|P á g in a
Asignatura Alumno Fecha
Análisis e interpretación de datos Espinosa García Claudia Montserrat 08/Feb/2021

Actividades
Laboratorio: Contraste de hipótesis

Todos los cálculos deben hacerse sin herramientas de software como SPSS, SAS, Minitab, R o
Python. Use Excel o similar y/o una calculadora. Justifique completa, pero brevemente, todas las
respuestas. Cualquier archivo añadido (como un Excel) se verá sólo si hay dudas. Toda las
justificación debe estar en el archivo Word.

1. Prueba de cola derecha

Dureza Brinell

Un ingeniero midió la dureza Brinell de 25 piezas de hierro dúctil que fueron creadas por medio
del procedimiento de enfriamiento subcrítico. Los datos obtenidos son:

170 167 174 179 179 187 179 183 179


156 163 156 187 156 167 156 174 170
183 179 174 179 170 159 187

El ingeniero piensa que la dureza Brinell de estas piezas es mayor a 170. Le interesa probar las
hipótesis:

H0: μ = 170
Ha: μ > 170

Para un 95% de nivel de confianza, ¿se acepta o rechaza la hipótesis nula? Llene la siguiente tabla
(y justifique todos los resultados):
tcalc or zcalc tcrit or zcrit p.value  Conclusión
1.2218 1.7109 0.116816398 0.05 Se debe aceptar la hipótesis nula
(H0) y rechazar la hipótesis
alternativa (Ha).

Se confirma que la dureza de las


piezas es igual a 170 con una
2|P á g in a
Asignatura Alumno Fecha
Análisis e interpretación de datos Espinosa García Claudia Montserrat 08/Feb/2021

significancia del 5%
Comenzamos obteniendo los datos de N, la media y la desviación estándar:
N 25
Media (𝑥 ̅) 172.52
Desv. Est. (s) 10.31

Ya que el tamaño de la muestra es menor a 30 podemos usar la siguiente fórmula para obtener la
t student:

x́−µ
t=
s
√n

𝑥 ̅- µ s/√n t
2.52 2.06 1.2218

Para obtener α: sabemos que el nivel de confianza más α es igual a 1, entonces:

NC + α 1
NC 95% 0.95
α 5% 0.05

Ahora obtenemos los grados de libertad (para posteriormente conocer el valor de T) y el p-value:

G. libertad 24
T 1.7109
p-value 0.1168164

3|P á g in a
Asignatura Alumno Fecha
Análisis e interpretación de datos Espinosa García Claudia Montserrat 08/Feb/2021

0.1168164 > 0.05

p-value vs α
H0 Se acepta
Ha No se acepta

Ya que p-value es mayor que α, se rechaza la hipótesis alternativa.


2. Prueba de cola izquierda

Altura de los Girasoles

A una bióloga le interesa determinar si las flores obtenidas de semillas tratadas con un extracto de
raíces de Vinca tuvieron como resultado una menor altura para las plantas que el promedio de
15.7 cm. La bióloga trató a n=33 muestras obtenidas aleatoriamente y al medir las plantas obtuvo
el siguiente resultado:

11.5 11.8 15.7 16.1 14.1 10.5 9.3 15.0 11.1


15.2 19.0 12.8 12.4 19.2 13.5 12.2 13.3
16.5 13.5 14.4 16.7 10.9 13.0 10.3 15.8
15.1 17.1 13.3 12.4 8.5 14.3 12.9 13.5
4|P á g in a
Asignatura Alumno Fecha
Análisis e interpretación de datos Espinosa García Claudia Montserrat 08/Feb/2021

Las hipótesis de la bióloga son:

H0 : μ = 15.7
HA: μ < 15.7

Con un 95% de nivel de confianza, ¿es correcta la hipótesis nula? Llene la siguiente tabla (y
justifique todos los resultados):

tcalc or zcalc tcrit or zcrit p.value  Conclusión


Se debe rechazar la hipótesis
nula (H0) y aceptar la hipótesis
alternativa (Ha).
0.0000317
-4.5990 -1.650 0.05
4
Nose puede confirmar que la
altura de los girasoles es igual a
15.7

Comenzamos obteniendo los datos de N, la media y la desviación estándar:


N 33
Media (𝑥 ̅) 13.6636364
Desv. Est. (s) 2.54359713

Usamos la siguiente formula para calcular z calculada:

x́ −µ
¿
z s
√n

𝑥 ̅- µ s/√n z calc


-2.04 0.44 -4.5990

Ahora para obtener Z critica: sabemos que α es igual a 0.05 por lo que buscamos en tabla Z.
Vemos que no existe el valor 0.05 por lo que tomaremos el valor más próximo que no lo rebase, es
decir: -1.65 = 0.0495

5|P á g in a
Asignatura Alumno Fecha
Análisis e interpretación de datos Espinosa García Claudia Montserrat 08/Feb/2021

NC + α 1
NC 95% 0.95
α 5% 0.05

G. Libertad 32
z crit -1.650
p value 0.00003174

6|P á g in a
Asignatura Alumno Fecha
Análisis e interpretación de datos Espinosa García Claudia Montserrat 08/Feb/2021

3. Prueba de dos colas

Espesor de la Goma

Una fabricante de goma de mascar afirma que el espesor de la goma de mascar que produce es de
7.5 centésimas de pulgada. Un especialista de control de calidad regularmente verifica el espesor
de la goma. En una corrida de producción tomaron una muestra con n=10 piezas de goma de
mascar y midieron el espesor obteniendo:

7.65 7.60 7.65 7.70 7.55


7.55 7.40 7.40 7.50 7.50

Las hipótesis del especialista en control de calidad son:

H0 : μ = 7.5
HA: μ ≠ 7.5

Con un 95% de nivel de confianza, ¿es correcta la hipótesis nula? Llene la siguiente tabla (y
justifique todos los resultados):

tcalc or zcalc tcrit or zcrit p.value  Conclusión


Se acepta la hipótesis nula y por
0.1581954
1.5390 2.2622 0.025 lo tanto se rechaza la hipótesis
2
alternativa.

Comenzamos obteniendo los datos de N, la media y la desviación estándar:

N 10
Media (𝑥 ̅) 7.55
Desv. Est. (s) 0.10274023

Ya que el tamaño de la muestra es menor a 30 podemos usar la siguiente fórmula para obtener la
t student:

7|P á g in a
Asignatura Alumno Fecha
Análisis e interpretación de datos Espinosa García Claudia Montserrat 08/Feb/2021

x́−µ
t=
s
√n

𝑥 ̅- µ s/√n t calc


0.05 0.03 1.5390

Para obtener α: sabemos que el nivel de confianza más α es igual a 1, y como se trata de una
hipótesis de 2 colas entonces dividimos α entre 2:

NC + α 1
NC 95% 0.95
α/2 5% 0.025

Ahora obtenemos los grados de libertad (para posteriormente conocer el valor de T) y el p-value:

8|P á g in a
Asignatura Alumno Fecha
Análisis e interpretación de datos Espinosa García Claudia Montserrat 08/Feb/2021

G. Libertad 9
t crit 2.2622
p value 0.15819542
tc1 -2.2622
tc2 2.2622

Ya que p-value es mayor que α, se rechaza la hipótesis alternativa.

4. Probando Proporciones

En Mayo 16 de 1994, la revista Newsweek reportó el resultado de una encuesta de opinión que
preguntó: “Considerando todo lo que sabe de Bill Clinton, ¿tiene la honestidad e integridad para
ser presidente? (p. 23). La encuesta se realizó entre 518 adultos. El resultado es que 233, o sea el
45% de ellos, menos que la mitad de la población norteamericana, dijo que si. ¿Pueden con esto
los adversarios del Sr. Clinton concluir que menos de la mitad de los norteamericanos, o sea una
minoría, piensan que tiene la honestidad e integridad para ser presidente (con un 95% de nivel de
confianza)?

Hipótesis nula: No hay una opinión claramente mayoritaria. Las proporciones entre lo que dijeron
si y no son ambas 0.50.

Hipótesis alternativa: Menos del 50% de la población dijo respondió que sí a la cuestión. La
mayoría de los norteamericanos no piensa que Clinton tiene la honestidad e integridad para ser
presidente. Con un 95% de nivel de confianza, ¿es correcta la hipótesis nula? Llene la siguiente
tabla (y justifique todos los resultados):

tcalc or zcalc tcrit or zcrit p.value  Conclusión


Debido a que el valor de Zcalc es
menor a 50% (0.5) se rechaza la
-2.3990739 -1.6500 0.00839484 0.05
hipótesis nula y se acepta la
hipótesis alternativa.

9|P á g in a
Asignatura Alumno Fecha
Análisis e interpretación de datos Espinosa García Claudia Montserrat 08/Feb/2021

Definimos las hipótesis y observamos que se trata de una cola izquierda:

H0 µ >= 0.50
Ha µ< 0.50

Usamos la siguiente fórmula para calcular Z:

ṕ−p
¿
z ṕ(1− p)
√ n

𝑝 ̅ 0.45
p 0.5
n 518

𝑝 ̅ (1 - p) /
𝑝 ̅ - p z calc
n
-0.05 0.02084138 -2.3990739

Volvemos a usar el valor -1.65 por es el más cercano en tabla Z para el valor 0.05.

z crit -1.6500
0.00839484
p value 1

5. Edad y Salud

En la sección de “Archivos” en la carpeta “Mayo-Sept 2020” encontrarás el archivo Excel “Lab


Hypothesis Testing Data-3.xlsx”. Observa la pestaña denominada “salud”. Estos datos representan
mediciones que se hicieron a 238. Gender es f para femenino y m para masculino. Age es la edad
en meses. Height es la altura en pulgadas y weight es el peso en libras. Se piensa que los hombres
tienen una mayor relación peso/altura (peso dividido entre la altura) que las mujeres. ¿es correcto
esto? Puedes suponer que las varianzas son iguales en los dos grupos, pero desconocidas. Discute

10 | P á g i n a
Asignatura Alumno Fecha
Análisis e interpretación de datos Espinosa García Claudia Montserrat 08/Feb/2021

el nivel de confianza que se debe usar. Llene la siguiente tabla pero justifique sus resultados más
abajo:

Media m Media f m f  pooled


1.65626907 1.62561817 0.236872687 0.247864326 0.242079848

tcalc or zcalc tcrit or zcrit p.value  Conclusión


No se rechaza la hipótesis nula
H0 que establece que los
0.9698531 1.6500 0.16655632 0.05
hombres tienen una mayore
relación altura/peso

H0 µm = µf
Ha µm > µf

n 𝑥 ̅
Masculino 126 1.65626907
Femenino 111 1.62561817

Desv.
Estandar VAR
Sm 0.236872687 0.05610867
Sf 0.247864326 0.06143672

sp= √ ¿ ¿ ¿

(nm + nf)
(nm-1)Sm^2 (nf -1)Sf^2 -2 sp
6.75803966
7.01358373 8 235 0.242079848
13.7716234

( x´1− x´2 )
z=
ơ 12 ơ 22
√ +
n1 n2 11 | P á g i n a
Asignatura Alumno Fecha
Análisis e interpretación de datos Espinosa García Claudia Montserrat 08/Feb/2021

((𝑥1) ̅−(𝑥2) ̅
) ơm^2/nm ơf^2/nf Raiz z calc
0.0004453 0.0005534 0.0316036
0.0306509 1 8 5 0.9698531

p-value 0.16655632
z crit 1.65

6. Calidad del Aire

En la sección de “Archivos” en la carpeta “Mayo-Sept 2019” encontrarás el archivo Excel “Lab


Hypothesis Testing Data-3.xlsx”. Observa la pestaña denominada “Contaminacion” Esta pestaña
contiene las lecturas de una estación de monitoreo de calidad ambiental durante el año 2015
situada en el centro de la ciudad de Monterrey. Hay una lectura por hora. Cada renglón reporta las
siguientes variables:

Abbrev Pollutant Unidades


Date Fecha en que se tomo la lectura
Month Mes del año
Day Dia del mes
Weekday Día de la semana (Domingo=1)
Hour Hora del dia
CO Monóxido de Carbono Ppm
NO Monóxido de Nitrógeno Ppb
NO2 Dióxido de Nitrógeno Ppb
NOx Suma de NO y NO2 Ppb
O3 Ozono Ppb
PM10 Particulas menores a 10 microns g/m3
PM2.5 Particulas menores a 2.5 microns g/m3
PRS Presión Mmhg
RAINF Lluvia Mm/hr
RH Humedad Relativa %
SR Radiación Solar KW/m2
TOUT Temperatura DegC
WSR Velocidad del Viento Km/hr

12 | P á g i n a
Asignatura Alumno Fecha
Análisis e interpretación de datos Espinosa García Claudia Montserrat 08/Feb/2021

WDV Dirección del viento Deg


Table 1. Variables de contaminación y clima reportados por la estación de monitoreo

El gobierno del estado de Nuevo León está preocupado particularmente por las variables O3 que
no debe exceder 120 ppb y por partículas que diámetro menor a 2.5 micrones (PM2.5) que no
debe exceder 40.5 g/m3. Se sospecha que el nivel de Ozono está relacionado con la temperatura
ambiental y con la radiación solar.
a) Divide la temperatura en 2 rangos. Grupo 1, menor a 25 grados y grupo 2, mayor o igual a
25 grados. Separa los datos en estos 2 grupos. Determina si hay diferencias en el promedio
de la concentración de Ozono entre estos grupos. Es decir H0: O1=O2. Donde Ox es el
promedio de la concentración de Ozono para ese grupo según el rango de temperatura.
¿Afecta la temperatura el nivel de Ozono en la atmósfera? Llena la siguiente tabla (no
olvides justificar todos sus resultados):

Media Media 
 O3  O3
O3 O3 poole t est t crit Conclusión
TMP<25 TMP≥25
TMP<25 TMP≥25 d
Se rechaza H0 con
-
12.213 40.559 6.195 12.905 9.252 -1.65 una significancia de
77.758
5%

b) También se sospecha que la temperatura influencia la contaminación por partículas


PM2.5. Realiza las mismas verificaciones de hipótesis. ¿Afecta la temperatura el nivel de
partículas PM2.5 en la atmósfera? Llena la siguiente tabla:

Media Media  PM  PM  t est t crit Conclusión


PM PM TMP<25 TMP≥25 pooled
TMP<25 TMP≥25
15.043 40.262 5.619 14.759 11.175 -70.19 -1.65 Se rechaza H0 con
una significancia de
5%

c) Se sospecha también que la radiación solar afecta la contaminación por Ozono. La


radiación solar normal se considera que es 0.2 KW/m 2. Utilice los siguientes rangos para
dividir los datos en 1 grupos: Grupo 1, menor a 0.2 y grupo 2 mayor o igual a 0.2 KW/m 2.
¿Afecta la radiación solar el nivel de Ozono en la atmósfera? Llena la siguiente tabla:

Media Media    t est t crit Conclusión


13 | P á g i n a
Asignatura Alumno Fecha
Análisis e interpretación de datos Espinosa García Claudia Montserrat 08/Feb/2021

O3 O3 SR<0.2 SR≥0. pooled


SR<0.2 SR≥0.2 2
0.026 0.528 0.047 0.204 0.120 -83.893 -1.65 Se rechaza H0 con
una significancia de
5%

d) Se sospecha que el tráfico vehicular está directamente relacionado con la contaminación


ambiental. Utilizaremos la hora del día como representante del tráfico, dado que hay una
correlación directa entre el tráfico vehicular y la hora del día. Divide los datos de
contaminación tanto de Ozono como PM2.5 en dos grupos. El primero es cuando la hora
esta entre las 8 y las 20 horas. Y el otro es entre las 21 y las 7 horas. Haz los mismos
cálculos que en los incisos anteriores y especifica si el tráfico está relacionado con la
contaminación. En caso de que no, ¿cuál podría ser otra fuente de contaminación?

Media Media  O3  O3
 t est t crit Conclusión
O3 O3 pooled
30.133 12.662 17.145 8.331 14.067 41.74 1.65 Se rechaza H0
3

Media Media   SR≥25  t est t crit Conclusión


SR<0.2 SR≥25 SR<25 pooled
27.475 27.943 16.706 290.354 16.850 - -1.65 Se rechaza H0
0.849

Nota: El archivo de datos no está completo debido a fallos en los sensores que son muy sensibles.
Se recomienda eliminar todos los renglones donde falte información (todos los espacios en
blanco).

Desarrollo de cada uno de los ejercicios en el archivo Excel adjunto

No se encontraron campos vacíos dentro del archivo para el ejercicio 6.

14 | P á g i n a

También podría gustarte