Está en la página 1de 14

TECNOLOGICO DE ESTUDIOS SUPERIORES DEL ORIENTE DEL ESTADO DE MEXICO

MATERIA. ESTADISTICA ADMINISTRATIVA I

PROFESOR. CARLOS GUTIERREZ REYNAGA

TEMA. UNIDAD V

INTEGRANTES. RAMIREZ ALVARADO ANA PATRICIA

HARUMI SANCEZ ALBERTO

RUIZ GARCIA MANUEL

QUIROZ ORTEGA CARLOS

ORTIZ TORRES MONICA


PRUEBA DE HIPOTESIS.
5.1. HIPOTESIS ESTADISTICA.

Una hipótesis puede definirse como una solución provisional (tentativa) para un
problema dado. El nivel de verdad que se le asigne a tal hipótesis dependerá de la
medida en que los datos empíricos recogidos apoyen lo afirmado en la hipótesis.
Esto es lo que se conoce como contrastación empírica de la hipótesis o bien
proceso de validación de la hipótesis. Este proceso puede realizarse de uno o dos
modos: mediante confirmación (para las hipótesis universales) o mediante
verificación (para las hipótesis existenciales).

En general, en un trabajo de investigación se plantean dos hipótesis mutuamente


excluyentes: la hipótesis nula o hipótesis de nulidad ( ) y la hipótesis de
investigación. Además, es posible plantear hipótesis alternas o hipótesis
alternativas. El análisis estadístico de los datos servirá para determinar si se
puede o no aceptar Ho. Cuando se rechaza Ho, significa que el factor estudiado
ha influido significativamente en los resultados y es información relevante para
apoyar la hipótesis de investigación planteada. Es muy importante tener presente
que la hipótesis de investigación debe coincidir con la hipótesis alternativa.
Plantear hipótesis de investigación que coincidan con Ho supondría una aplicación
incorrecta del razonamiento estadístico.

Las hipótesis son proposiciones provisionales y exploratorias y, por tanto, su valor


de veracidad o falsedad depende críticamente de las pruebas empíricas. En este
sentido, la replicabilidad de los resultados es fundamental para confirmar una
hipótesis como solución de un problema. La hipótesis es el elemento que
condiciona el diseño de la investigación y responde provisionalmente al problema,
verdadero motor de la investigación.

El propósito de la prueba de hipótesis es determinar si el valor supuesto


(hipotético de un parámetro poblacional, como la medida de la población, debe
aceptarse como verosímil con base en evidencia muéstrales. Recuerda que sobre
la distribución de muestreo, se dijo que, en general, una media muestral diferirá en
valor de la media poblacional. Si el valor observado de una estadística muestral,
como la media muestral, el valor de la media poblacional.

Si el valor observado de una estadística muestral, se acerca al valor para métrico


supuesto y solo difiere de él en un monto que cabria esperar del muestreo
aleatorio, el valor hipotético no se rechaza. Si la estadística muestral difiere de la
supuesta en un monto que no es posible atribuir al azar, la hipótesis se rechaza
por inverosímil.

Se han desarrollado tres procedimientos distintos para la prueba de hipótesis,


todos los cueles conducen a las mismas decisiones cuando se emplean los
mismos estándares de probabilidad (y riesgo). En este capítulo describiremos
primeramente el método del valor crítico para la prueba de hipótesis. De acuerdo
con este método, se determinan los así llamados valores críticos de la estadística
de prueba que dictarían el rechazo de una hipótesis, tras de lo cual la estadística
de prueba observada se compara con los valores críticos.

Este fue el primer método en desarrollarse, motivo por la cual buena parte de la
terminología de las pruebas de hipótesis se derivan de él. Más recientemente, el
método del valor P ha cobrado popularidad a causa de ser el más fácilmente
aplicable a software de computo. Este método se basa en la determinación de la
probabilidad condicional de que el valor observado de una estadística muestral
pueda ocurrir al zar, dado que su supuesto particular sobre el valor del parámetro
poblacional asociado sea en efecto correcto.

Finalmente, el método d intervalos de confianza se basa en la observación de si el


valor supuesto de un parámetro poblacional está incluido en el rango de valores
que define a un intervalo de confianza para ese parámetro.

5.2. ERRO TIPO I Y II

El error tipo I se define como el rechazo de la hipótesis nula Ho cuando ésta es


verdadera. También es conocido como ó nivel de significancia.

Si tuviéramos un nivel de confianza del 95% entonces el nivel de significancia


sería del 5%. Análogamente si se tiene un nivel de confianza del 90% entonces el
nivel de significancia sería del 10%.

Ahora supóngase que la verdadera rapidez promedio de combustión es diferente


de 50 cm/s, aunque la media muestral caiga dentro de la región de aceptación. En
este caso se acepta Ho cuando ésta es falsa. Este tipo de conclusión recibe el
nombre de error tipo II.

El error tipo II ó error se define como la aceptación de la hipótesis nula cuando


ésta es falsa.

Por tanto, al probar cualquier hipótesis estadística, existen cuatro situaciones


diferentes que determinan si la decisión final es correcta o errónea.

Decisión
Ho es verdadera
Ho es falsa

Aceptar Ho
No hay error
Error tipo II ó
Rechazar Ho
Error tipo I ó
No hay error

Los errores tipo I y tipo II están relacionados. Una disminución en la probabilidad


de uno por lo general tiene como resultado un aumento en la probabilidad del otro.

El tamaño de la región crítica, y por tanto la probabilidad de cometer un error tipo I,


siempre se puede reducir al ajustar el o los valores críticos.

Un aumento en el tamaño muestral n reducirá y de forma simultánea.

Si la hipótesis nula es falsa, es un máximo cuando el valor real del parámetro se


aproxima al hipotético. Entre más grande sea la distancia entre el valor real y el
valor hipotético, será menor

5.3. PRUEBAS UNILATERALES Y BILATERALES.

Un fabricante de equipo deportivo ha desarrollado un nuevo sedal sintético para


pesca que se considera tiene una resistencia a la ruptura de 8 kilógramos con una
desviación estándar de 0,5 kilógramos.
Pruébese la hipótesis de que Kg. en contraposición a la alternativa de que Kg.
si se  prueba una muestra aleatoria de 50 sedales y se encuentra que tiene una
resistencia promedio a la ruptura de 7,8 Kg. Utilize un navel de significación de
0,01

Ho=μ=8

H 1=μ ≠ 8
∝=0.01

RC =−Z 1−∝ ❑ <Z < Z−∝/2


2
X =7.8 n=5 σ =0.5

7.8−8
z= =−2.83
0.5
√ 50
⟹ RC :−0.995−0.995< z <0.995
⟹ RC :−2.57 < z< 2.57
σ =0.5

Se rechaza Ho, por tanto la resistencia a la ruptura es distinta de 8kg

2) Una muestra aleatoria de 100 muertos registrados en Chile durante el año


pasado mostró una vida promedio de 71,8 años. Suponiendo una desviación
estándar poblacional de 8,9 años. ¿Parecería esto indicar que la vida promedio
hoy día es mayor que 70 años? Utilize un nivel de significación de 0, 05

Ho=μ ≤ 70

H 1=μ>70
∝=0.05
RC =−Z 1−∝⟹ RC :−0.95 ⟹ RC : z=1.64

X =71.8 n=100 σ =8.9

71.8−70
z= =2.022
8.9
10
Se rechaza Ho, es decir que la vida promedio hoy en día supera los 70 años

5.5 Dos muestras: pruebas sobre dos medias utilizando la distribución


Normal y ¨t¨ de estudent

Ejercicio 1

El salario promedio mensual para una muestra de ni =30 empleados de una


empresa manufacturera grande es $280,000.00, con desviación estándar maestral
de σ 1 =$ 14,000 . En otra empresa grande, una muestra aleatoria de n2 =40
empleados tiene un salario promedio de $270,000.00,con una desviación
estándar maestral de σ 2=$ 10,000 .No se supone que las desviaciones estándar de
las dos poblaciones de salarios sean iguales. Se prueba la hipótesis de que no
existe diferencia entre los salarios promedio mensuales de las dos empresas,
utilizando un nivel de significancia del 5% de la siguiente manera.

H 0 : ( μ1−μ2 ) ≠ de la siguiente manera equivalente.

μ1=μ 2 s=$ 280,000 s=270,000

H 1 : ( μ 1−μ2 ) ≠ de la siguiente manera equivalente.

μ1 ≠ μ2 σ 1=$ 14,000 σ 2 =$ 10,000

n1 =30 n2=40

z Critica (∝=0.05 )=1.96

280,000−270,000 10000
¿ = =3.33
3005.58 3005.58

Donde
σ1 14,000 14,000
σ1= = = =2556.14
√ n1 √ 30 √ 5.477
σ 2 10000 10000
σ 2= = = =1581.03
√n2 √ 40 √6.325
2 2
σ 2−x 2=√ σ 1−σ 2=√ ( 2556.14 ) + ( 1581.03 ) =√ 6533851.7+2499655.86

= 30005.58

Región de rechazo.

Región de rechazo.

Región de aceptación

-1.96 1.96

El valor calculado de z, 3.33, se encuentra el la región de rechazo de la hipótesis,


tal como puede observarse en el modelo que se ilustra en la figura. Por ello se
rechaza la hipótesis nula y se acepta la hipótesis alternativa de que el salario
promedio mensual de las dos empresas es diferente.

EJERCICIO 2
Un conductor esta considerando dos lugares alternativos para un centro comercial
regional. Como los ingresos de los hogares de la comunidad son una importante
en esta selección, desea probar la hipótesis nula de que no existe diferencia entre
el ingreso promedio por hogar en las dos comunidades. Consiste con esta
hipótesis, supone que la desviación estándar del ingreso por hogar es también
igual en las dos comunidades, Para una muestra de n1 =30 hogares de la primera
comunidad, encuentra que el ingreso diario promedio es χ 1=35500 , con una
desviación estándar maestral de σ 1 =1800 . Para una muestra de n2 =40 hogares
de la segunda comunidad, X 2 =34600 y σ 2=2400. Probar la hipótesis nula en el
nivel de significancia del 5%.

μ0= ( μ1−μ2 ) =0 μ1 : ( μ1−μ2 ) ≠ 0

X 1 =35500 X 2=34600

σ 1 =1800 σ 2=2400

n1 =30 n2=40

Z critica ( ∝=0.05 )=1.96

2 ( n1−1 ) σ 2 + ( n 2−1 ) σ 2 ( 29 )( 1800 )2 +39 ( 2400 )2 318,600,000


σ = = =
n 1+ n2−2 30+ 40−2 68

Se combinan las varianzas debido a la suspensión de que los valores


de las desviaciones estándar de las poblaciones son iguales.

σ2 σ2 4685294 4685294
σ x −x =
1 2
√ + =
n1 n2 √ 30
+
40
= √156176.46+117132.25=522.79

X 1−¿ X 35500−34600
2 900
= = =+1.7 ¿
σ X −X 1
522.792
522.79
El valor calculado de z es de +1.72 se encuentra en la región de
aceptación de la hipótesis nula. Por ello, no es posible rechazar la
hipótesis nula al nivel de significancia de 5%, y se acepta la hipótesis
de que el ingreso promedio por hogar de las dos comunidades no es
diferente.

5.6 Una muestra: prueba sobre una sola proporción.

Prueba de una sola muestra con respecto a una sola media (varianza conocida).

Una empresa eléctrica fabrica focos que tienen una duración que se distribuye de
forma aproximadamente normal con una media de 800 hora y una desviación
estándar de 40 horas. Pruebe la hipótesis de que μ ≠ 800 horas si una muestra
aleatoria de 30 focos tiene una duración promedio de 788horas. Utilice un nivel de
significancia de 0.04.

Datos:
μ0 : μ1=800 H 1=μ2 =788

σ =40 Horas

X=788
Significancia=0.04
Formula
X−n 0
Z=
σ
√n
Valor de Z CONUNA SIGNIFICANCIA DE 0.04 = z= - 1.75
X−N 0
Z=
σ
√n
788−800
Z=
40
√30
−12
Z=
7.3029

Z=−1.64

Zona de aceptación. Zona de rechazo.

z=1.7
Z=-1.75 Z=-1.64
Con la resolución del ejercicio se ha llegado a la conclusión
de que la duración media delos focos si corresponde a 800
horas por lo que la hipótesis nula es aceptada.
5.6 Una muestra: prueba sobre una sola proporción

Cuando un proceso de producción se encuentra bajo control,


el porcentaje de artículos defectuosos que se tienen que
eliminar en el proceso de inspección no supera el 1%. Para
una muestra aleatoria de n=10 artículos, se encuentra uno
defectuoso. Con base en este resultado muestral ¿Puede
rechazarse la hipótesis nula de que el proceso está bajo
control aun nivel de significancia del 5%?
Para la hipótesis H 0 :π ≤ 0.01 y H 1 : π > 0.01 Con base de la
distribución binomial, la probabilidad de obtener uno o más
artículos defectuosos por efectos del azar, dado que π=0.01
es 1.0 menos la probabilidad de obtener cero defectuosos
(del apéndice 2, con n=10, p=0.01):
P ( X ≥ 1|n=10 , p=0.01 ) 1.000−0.9044=0.0956

Como esta probabilidad es mayor que 0.05, no puede


rechazarse la hipótesis nula. Para este problema, se tendrían
que encontrar dos o más artículos defectuosos para poder
rechazar la hipótesis nula, porque la probabilidad
correspondiente a este “extremo” de la distribución es inferior
al 0.05. Además la probabilidad de que dos o más artículos
estén defectuosos es también inferior a 0.01:
P ( X ≥ 2|n=10 , p=0.01 ) 0.0042+0.0001+0.0000+…=0.0043

PRUEBA SOBRE DOS PROPORCIONES

Ejemplo:

En un estudio de 10 años sobre de 3806 hombres de edad con niveles altos de colesterol pero sin
problemas cardiacos se dividieron en dos grupos. Los integrantes del primero recibieron un nuevo
medicamento diseñado para reducir los niveles de colesterol, mientras que los del segundo
recibieron diariamente dosis de un placebo. Además de reducir los niveles de colesterol, el
medicamento parecía eficaz para reducir la incidencia de infartos cardiacos. Durante los 10 años,
155 integrantes del primer grupo sufrieron un infarto, mientras que del grupo con placebos, 187
sufrieron un infarto. Suponga que los datos correspondientes están en el archivo CX11HRT,
codificados como 1=no sufrió un infarto y 2= sufrió un infarto.

Solución:

Suponiendo que los 3806 participantes se dividieron de manera aleatoria en dos grupos, había 1903
hombres en cada grupo. Así, las proporciones muestrales de infartos dentro de los dos grupos son
P1=155/1903 o P1=0.0815 Y P2= 187/1903 o P2= 0.0983.

Dado que la intención del estudio era evaluar la eficacia del nuevo medicamento, la prueba de
hipótesis será direccional. En términos de las proporciones poblacionales, la hipótesis nula y
alternativa es H 0 : π 2 Y H 1 :π 1< π 2. Las hipótesis también se pueden expresar como

HIPOTESIS NULA
Los usuarios del nuevo medicamento tienen una
H 0 :μ (P1−P2 )≥ 0 menos probabilidad de sufrir un infarto

HIPOTESIS ALTERNATIVA
Los usuarios del nuevo medicamento tienen cuando
H 0 :μ (P1−P2 )< 0 menos la misma probabilidad de sufrir un infarto

Para poner a prueba la hipótesis nula, utilizaremos el nivel de significancia de 0.05

La estimación combinada de las proporciones poblacionales (que se supone son iguales)se calcula
como

n1 p1+ n2 p 2 ( 1903 )( 0.0815 )+ (1903 )(0.0983)


Ṕ= = =0.0899
n1+ n2 1903+1903

El valor calculado del estadístico de prueba, z, es

p1− p2 0.0815−0.0983
z= = =−1.81
1 1 1 1
√ (
ṕ ( 1− ṕ ) +
n1 n2 ) √ 0.0899 ( 1−0.0899 )( +
1903 1903 )
Para el nivel de 0.05 en esta prueba de cola izquierda, el valor critico de z=-1.645.La regla de
decisión es rechazar H0 si el valor calculado del estadístico de la prueba es < -1.645; del contrario
no rechazar.

Bibliografía:
Introducción a la estadística de negocios

Ronald m. weiers

En la siguiente tabla, se incluyen las diferencias d ientre los datos de la tabla anterior. Estas
diferencias forman una muestra aleatoria PROCEDENTE DE UNA POBLACION cuya media es
μ ∆−μB, es decir la diferencia entre las medias poblacionales entre dos modelos de autos.

xi 19,4 18,8 20,6 17,6 19,2 20,9 18,3 20,4


yi 19,6 17,5 18,4 17,5 18,0 20,0 18,8 19,2
di -0,2 1,3 2,4 0,1 1,2 0,9 -0,5 1,2 Suma=6,2
d 2i 0,04 1,69 4,84 0,01 1,44 0.81 0,25 1,44 Suma= 10,52

La media y la varianza muestral de las diferencias en el consumo de gasolina pueden calcularse


según la información recogida en la tabla anterior. asi para la media el resultado es:

di +…+ dn 6.2
d́= = =0.775
n 8

Y para la varianza

∑ d 21−n d́ 10.52−( 8 )(1775)2


s2d = i=1 = =8.16
n−1 8−1

Por lo que la desviación muestral observada es: sd=√ 0.816=0.903

Tenemos que μA−μB=.807 sean x́ A Y x́ B las variables que representan al consumo promedio
de gasolina de los autos A Y B respectivamente. Nos piden calcular

P( x́ A− x́ B>O) Hagamos D́= X́ A− X́ B y dado que por la tabla t de student con n-1=7
grados libertad) encontramos que

P( x́ A− x́ B>O) = P ( D́>O )=P t > 0−μ σ́


( )

P ( 0−(−0.807)
.3413 )
= P(t¿ 2.3645 ¿ ≈ .025
Por consiguiente la probabilidad de que el consumo promedio de gasolina del auto A sea mayor
que el auto B es aproximadamente del .025

Bibliografía

Estadística inferencial

Humberto llinas solano

También podría gustarte