Está en la página 1de 42

Bienvenidos a la cuarta sesión de la materia “Estadística Aplicada” para la Licenciatura en

Administración de Empresas.

1
En esta sesión abordaremos el tema de Pruebas de Hipótesis

2
El objetivo general de esta sesión consiste en describir el procedimiento de prueba
de hipótesis identificando por medio de evidencias muestrales para determinar si
una prueba es razonable.

3
Esta es la agenda para esta sesión:

Subtema 1. Planteamiento de hipótesis;


Subtema 2. Errores de tipo I y II;
Subtema 3. Pruebas de uno y dos extremos;
Subtema 4. Pruebas de hipótesis para una media poblacional;
Subtema 5. Métodos para realizar pruebas de hipótesis;

4
Esta es la agenda para esta sesión:

Subtema 6. Prueba de hipótesis sobre una proporción poblacional;


Subtema 7. Pruebas de hipótesis sobre la diferencia entre dos medias;
Subtema 8. Pruebas de hipótesis sobre la diferencia entre dos proporciones;
Subtema 9. Prueba para la diferencia entre dos varianzas.

5
Los objetivos específicos de esta sesión son los siguientes.

Objetivo cognitivo: comparar los métodos de pruebas de hipótesis analizando sus


diferencias para contrastar hipótesis estadísticas.
Objetivo procedimental: distinguir entre las pruebas de hipótesis de una y dos
colas para determinar la más adecuada en el estudio estadístico para toma de
decisiones en problemas económicos.
Objetivo actitudinal: argumentar sobre la utilidad de realizar pruebas de hipótesis
al análisis de datos para contar con información confiable que permita tomar
decisiones acertadas.

6
En esta sesión en lugar de generar valores en el que se presente el parámetro
poblacional, se muestra un procedimiento para probar la validez de un enunciado
relacionado a un parámetro poblacional.
Ejemplo:
La velocidad media de los automóviles que pasan por la recta a Cholula es de 80
kilómetros por hora.
Se establece una afirmación o hipótesis y se reúnen datos que después se utilizan
para probar la aseveración. Por lo tanto:

Hipótesis: es una afirmación relativa a un parámetro de la población sujeta a verificación


(Lind, 2012, p. 334).

7
Una prueba de hipótesis tiene 5 partes:

1. La hipótesis nula, denotada por H0;


2. La hipótesis alternativa, denotada por Ha;
3. El estadístico de prueba y su valor p;
4. La región de rechazo;
5. La conclusión.

8
La hipótesis alternativa Ha es casi siempre la que el investigador apoya y la hipótesis
nula H0 una oposición de la hipótesis alternativa.
Es más sencillo apoyar la hipótesis alternativa al demostrar que la hipótesis nula es
falsa. Por lo tanto se comienza por suponer que la hipótesis nula H0 es verdadera. Y
se usan los datos muestrales para decidir si la evidencia está a favor de Ha más que
de H0 y saca una de dos conclusiones:
• Rechaza H0 y concluye que Ha es verdadera.
• Acepta (no rechaza) H0 como verdadera.

9
Ejemplo: Se desea demostrar que el promedio de salario por día de albañiles en Puebla es
diferente de $250, que es el promedio en México.
Ésta es la hipótesis alternativa 𝐻𝑎 : 𝜇 ≠ 250
La hipótesis nula es 𝐻0 : 𝜇 = 250
Se desearía rechazar la hipótesis nula, con lo que concluye que la media en Puebla no es
igual a $250.

10
Estadística de prueba: un solo número calculado a partir de los datos muestrales.

Valor p: probabilidad calculada usando la prueba estadística.

Una de estas mediciones o ambas sirven para decidir si rechazar o aceptar H0.

11
Para decidir aceptar o rechazar H0, el conjunto de valores que pueda tomar el estadístico
de prueba se divide en dos conjuntos.
Uno contiene los valores que apoyan la hipótesis alternativa y conducen a rechazar H0, se le
llama región de rechazo.
El otro, formado de valores que apoyan la hipótesis nula llamado región de aceptación.

12
Según Mendahall (2010, p. 347) un error tipo I para una prueba estadística es el error de
rechazar la hipótesis nula cuando es verdadera. El nivel de significancia para una prueba
estadística de hipótesis es:
α=P(error tipo I) = P(rechazar falsamente 𝐻𝑜 ) = P (rechazar 𝐻𝑜 cuando es verdadera).

Este valor α representa el máximo riesgo tolerable de rechazar incorrectamente 𝐻𝑜 .

13
Un error tipo II para una prueba estadística, es el error de aceptar la hipótesis nula cuando
es falsa y alguna hipótesis alternativa es verdadera.
La probabilidad de cometer un error tipo II se denota por el símbolo β (Mendahall 2010,
p.356).
Aceptar una hipótesis particular significa decidir en su favor.
Sea cual sea el resultado de una prueba no se está seguro que la hipótesis que se “acepte”
es verdadera. Siempre hay un riesgo de estar equivocado (medido por α o β).
Por lo tanto no acepte 𝐻𝑜 si β es desconocida o su valor es inaceptable. Si esto sucede se
debe detener el juicio y reunir más información.

14
Pruebas de significancia de una cola

Una prueba es de una cola cuando la hipótesis alternativa, 𝐻1 indica una dirección.
Ejemplo:
• 𝐻1 : La velocidad de los autos que viajan en la carretera 567 es menos de (µ<90)
kilómetros por hora.
• 𝐻1 : Menos del 32% de los clientes pagan con tarjeta su consumo de gasolina (µ<.20).

15
Pruebas de significancia de dos colas
Una prueba es con dos colas cuando no se especifica ninguna dirección en la hipótesis
alterna 𝐻1 .
Ejemplo:
• 𝐻1 : La cantidad pagada por los clientes en la cafetería Doña Chuy no es igual a $80.
(µ$80).
• 𝐻1 : El precio para un litro de gasolina no es igual a $19. (µ$19).

16
Prueba de aseveraciones acerca de una media poblacional (𝜎 conocida)
Para probar hipótesis hechas acerca de una media poblacional 𝜇 y suponiendo que se
conoce la desviación estándar poblacional 𝜎.
Suponemos además:
1. La muestra es aleatoria simple.
2. Se conoce el valor de la desviación estándar poblacional 𝜎.
3. Se satisface una o ambas de las siguientes condiciones: La población se distribuye
normalmente o 𝑛 > 30.
Estadístico de prueba para probar una aseveración sobre una media:
𝑋 −𝜇
z = 𝜎/𝑛
(Triola, 2004)

17
Prueba de aseveraciones acerca de una media poblacional (𝝈 desconocida)

Se supone que se desconoce 𝜎, como comúnmente sucede y además:


1. La muestra es una muestra aleatoria simple.
2. Se desconoce el valor de la desviación estándar poblacional 𝜎.
3. Se satisfacen una o ambas de las siguientes condiciones: La población se distribuye de
manera normal o 𝑛 > 30.
Se usa el siguiente estadístico:
𝑋 − 𝜇𝑋
𝑡=
𝑠/ 𝑛

(Triola, 2004)

18
Según Anderson (2008) los pasos en la prueba de hipótesis son:
Paso 1. Dar la hipótesis nula y la hipótesis alternativa.
Paso 2. Especificar el nivel de significancia.
Paso 3. Recabar los datos muestrales y calcular el valor del estadístico de prueba.
Método del valor-p
Paso 4. Emplear el valor del estadístico de prueba para calcular el valor-p.
Paso 5. Rechazar 𝐻0 si el valor −𝑃 ≤ 𝛼.
.
Método del valor crítico
Paso 4. Emplear el nivel de significancia para determinar el valor crítico y la regla de
rechazo.
Paso 5. Emplear el valor del estadístico de prueba y la regla de rechazo para determinar si
se rechaza 𝐻0 .

19
Método del intervalo de confianza para probar una hipótesis de la forma:
𝐻0 : 𝜇 = 𝜇0
𝐻𝑎 : 𝜇 ≠ 𝜇0
1. Seleccionar de la población una muestra aleatoria simple y emplear el valor de la
media muestral 𝑋 para obtener un intervalo de confianza para la media
poblacional μ.

𝜎
𝑋 ± 𝑍𝛼 2 𝑛

2. Si el intervalo de confianza contiene el valor hipotético 𝜇0 , no se rechaza 𝐻0 . Si no es así,


se rechaza 𝐻0 .

20
Según Lind (2012) una proporción es la razón entre el número de éxitos y el número de
observaciones. Si X se refiere al número de éxitos y n al de observaciones, la proporción de
éxitos en una cantidad fija de pruebas es X/n. Por consiguiente, la fórmula para calcular una
proporción muestral, p, es p = X/n.
Para probar una hipótesis relativa a una proporción de población, se elige una muestra
aleatoria de ésta. Se supone que se satisfacen los supuestos siguientes:
1. Los datos de la muestra que se recogen son resultado de conteos;
2. El resultado de un experimento se clasifica en una de dos categorías mutuamente
excluyentes éxito o fracaso;
3. La probabilidad de un éxito es la misma para cada prueba;
4. Las pruebas son independientes, lo cual significa que el resultado de una prueba
no influye en el resultado de las demás.
El tamaño de la muestra es n, y 𝜋, la proporción poblacional.
Se tiene la ventaja de que una distribución binomial puede aproximarse por medio de la
distribución normal.

21
Para algunos estudios estadísticos se necesitan hacer pruebas de hipótesis de dos
poblaciones y lo que interesa es la diferencia entre dos medias poblacionales.
𝐷0 denota la diferencia hipotética entre 𝜇1 y 𝜇2 , las tres formas que puede tener una
prueba de hipótesis son las siguientes:
𝐻0 : 𝜇1 − 𝜇2 ≥ 𝐷0 𝐻0 : 𝜇1 − 𝜇2 ≤ 𝐷0 𝐻0 : 𝜇1 − 𝜇2 = 𝐷0
𝐻𝑎 : 𝜇1 − 𝜇2 < 𝐷0 𝐻𝑎 : 𝜇1 − 𝜇2 > 𝐷0 𝐻𝑎 : 𝜇1 − 𝜇2 ≠ 𝐷0
En muchas aplicaciones 𝐷0 = 0
Con un ejemplo de una prueba de hipótesis de dos colas, cuando𝐷0 = 0
la hipótesis nula es 𝐻0 : 𝜇1 − 𝜇2 = 𝐷0 . En este caso, la hipótesis nula es que μ1 y μ2 son
iguales. Rechazar 𝐻0 lleva a la conclusión de que 𝐻𝑎 : 𝑢1 − 𝑢2 ≠ 0 es verdadera: 𝜇1 y 𝜇2 no
son iguales.

22
Los pasos anteriores para realizar una prueba de hipótesis se pueden utilizar. Elegir el nivel
de significancia, calcular el valor del estadístico de prueba y encontrar el valor-p para
decidir si se rechaza la hipótesis nula.
En el caso de dos muestras aleatorias independientes, se mostró que el estimador puntual
𝑋1 − 𝑋2 tiene un error estándar 𝜎𝑋1 −𝑋2 y cuando los tamaños de las muestras son
suficientemente grandes, la distribución de 𝑋1 − 𝑋2 se puede considerar como una
distribución normal.
En este caso, el estadístico de prueba para la diferencia entre dos medias poblacionales
cuando se conocen 𝜎1 y 𝜎2 es el siguiente:
𝑋1 − 𝑋2 − 𝐷0
𝑍=
𝜎 12 𝜎 22

𝑛1 𝑛2

23
Inferencias acerca de la diferencia entre dos medias poblacionales: σ1 y σ2 desconocidas
En este caso, para estimar las desviaciones estándar poblacionales desconocidas se
emplean las desviaciones estándar muestrales, 𝑠1 y 𝑠2 .
Se emplea la distribución t en lugar de la distribución normal estándar.
El estadístico que se debe usar es:

𝑋1 − 𝑋2 − 𝐷0
𝑡=
𝑠 12 𝑠 22
𝑛1 − 𝑛2

24
Se consideran las pruebas de hipótesis acerca de la diferencia entre las proporciones de
dos poblaciones. En el caso en que no hay diferencia entre las dos proporciones
poblacionales, las tres formas de las pruebas de hipótesis son las siguientes:
𝐻0 : 𝑝1 − 𝑝2 ≥ 0 𝐻0 : 𝑝1 − 𝑝2 ≤ 0 𝐻0 : 𝑝1 − 𝑝2 = 0
𝐻𝑎 : 𝑝1 − 𝑝2 < 0 𝐻𝑎 : 𝑝1 − 𝑝2 > 0 𝐻𝑎 : 𝑝1 − 𝑝2 ≠ 0
El estadístico a usar referente a 𝑝1 − 𝑝2 es:

𝑝1 − 𝑝2
𝑧=
1 1
𝑝 + (1 − 𝑝) 𝑛 + 𝑛
1 2

25
La primera aplicación de la distribución F ocurre cuando se pone a prueba la hipótesis de
que la varianza de una población normal es igual a la varianza de otra población normal
(Lind, 2012, p. 412).

La distribución F también sirve para probar suposiciones de algunas pruebas estadísticas,


para emplear esa prueba, algunas veces se supone que las varianzas de dos poblaciones
normales son iguales.

26
Sin importar si se desea determinar si una población varía más que otra o validar una
suposición de una prueba estadística, primero se formula la hipótesis nula. La hipótesis
nula es que la varianza de una población normal 𝜎12 es igual a la varianza de otra población
normal, 𝜎22 .
La hipótesis alternativa podría ser que las varianzas difieren. En este caso, las hipótesis nula
y alternativa son:
𝐻0 : 𝜎12 =𝜎22

𝐻1 : 𝜎12 ≠ 𝜎22

27
Para realizar la prueba, se selecciona una muestra aleatoria de 𝑛1 observaciones de una
población y una muestra aleatoria de 𝑛2 observaciones de la segunda población. El
estadístico de prueba se define como sigue:

Estadístico de Prueba Para Comparar Dos Varianzas

𝑠12
F = 𝑠2
2
𝑠12
Los términos y 𝑠22son las varianzas muestrales respectivas. Si la hipótesis nula es
verdadera, el estadístico de prueba sigue la distribución F con 𝑛1 – 1 y 𝑛2 – 1 grados de
libertad (Lind 2012).

28
Para que quede más claro el proceso de una prueba de hipótesis con los cinco pasos
cuando se conoce la desviación estándar poblacional y usando una prueba de dos colas se
mostrará un ejemplo de Lind (2012, p. 342):
Jamestown Steel Company fabrica y arma escritorios y otros muebles para oficina en
diferentes plantas. La producción semanal del escritorio modelo A325 en la planta de
Fredonia tiene una distribución normal con una media de 200 y una desviación estándar de
16.
Con motivo de la expansión del mercado, se introdujeron nuevos métodos de producción y
se contrató a más empleados. El vicepresidente de fabricación pretende investigar si hubo
algún cambio en la producción semanal del escritorio modelo A325.
En otras palabras, ¿La cantidad media de escritorios que se produjeron en la planta de
Fredonia es diferente de 200 escritorios semanales con un nivel de significancia de 0.01?

29
En este ejemplo:

La población de la producción semanal sigue una distribución normal.


La desviación estándar de esta distribución normal es de 16 escritorios por semana.
Por ello, es apropiado utilizar el estadístico z para resolver este problema. Aplique el
procedimiento de prueba de hipótesis estadística para investigar si cambió el índice de
producción de 200 escritorios semanales.

30
Paso 1: se establecen las hipótesis nula y alternativa.

La hipótesis nula es: “la media de la población es de 200”.


La hipótesis alternativa es: “la media es diferente de 200” o “la media no es de 200”.

Estas dos hipótesis se expresan de la siguiente manera:

𝐻0 : µ = 200
𝐻1 : µ ≠ 200

Ésta es una prueba de dos colas, pues la hipótesis alternativa no indica dirección alguna. En
otras palabras, no establece si la producción media es mayor o menor a 200. El
vicepresidente sólo desea saber si la tasa de producción es distinta de 200.

31
Paso 2: se selecciona el nivel de significancia.
Como ya se indicó, se utiliza el nivel de significancia de 0.01.

Éste es α, la probabilidad de cometer un error tipo I, que es la probabilidad de rechazar una


hipótesis nula verdadera.

32
Paso 3: se selecciona el estadístico de prueba.
El estadístico de prueba de una muestra grande es z.
La transformación de los datos de producción en unidades estándares (valores z) permite
que se les utilice no sólo en este problema, sino en otros relacionados con la prueba de
hipótesis.

33
Paso 4: se formula la regla de decisión.
Se formula al encontrar los valores críticos de z con ayuda del siguiente apéndice
B1.

34
Como se trata de una prueba de dos colas, la mitad de 0.01, o 0.005, se localiza en cada
cola.
Por consiguiente, el área en la que no se rechaza 𝐻0 , que se ubica entre las dos colas, es
0.99.
El apéndice B.1 se basa en la mitad del área bajo la curva, o 0.5000. Entonces, 0.5000-
0.0050 es 0.4950, por lo que 0.4950 es el área entre 0 y el valor crítico.
Se localiza 0.4950 en el cuerpo de la tabla. El valor más cercano a 0.4950 es 0.4951. En
seguida se lee el valor crítico en el renglón y columna correspondientes a 0.4951. Éste es
de 2.58.

35
Todas las facetas de este problema aparecen en el diagrama de la gráfica.

36
Por lo tanto, la regla de decisión es: rechazar la hipótesis nula y aceptar la hipótesis
alternativa (que indica que la media de la población no es 200), si el valor z
calculado no se encuentra entre -2.58 y +2.58. La hipótesis nula no se rechaza si z se
ubica entre -2.58 y +2.58.

37
Paso 5: se toma una decisión y se interpreta el resultado. Se toma una muestra de la
población (producción semanal), se calcula z, se aplica la regla de decisión y se llega a la
decisión de rechazar o no H0. La cantidad media de escritorios que se produjeron el año
pasado (50 semanas, pues la planta cerró 2 semanas por vacaciones) es de 203.5. La
desviación estándar de la población es de 16 escritorios semanales. Al calcular el valor z a
partir de la fórmula, se obtiene:

𝑋− µ 203.5−200
z= 𝜎 = 16 = 1.55
𝑛 50

38
Como 1.55 no cae en la región de rechazo, 𝐻0 no se rechaza.
La conclusión es: la media de la población no es distinta de 200. Por lo tanto, se informa al
vicepresidente de fabricación que la evidencia de la muestra no indica que la tasa de
producción en la planta de Fredonia haya cambiado de 200 semanales.
La diferencia de 3.5 unidades entre la producción semanal histórica y la del año anterior
puede deberse razonablemente al error de muestreo.

39
Esta información se resume en la siguiente figura.

40
¿Se demostró que el ritmo de montaje aún es de 200 a la semana? No. Lo que se hizo,
desde un punto de vista técnico, fue no desaprobar la hipótesis nula. No refutar la hipótesis
de que la media poblacional es de 200 no es lo mismo que probar que necesariamente es
verdadera.

En este caso se seleccionó el nivel de significancia de 0.01 antes de establecer la regla de


decisión y tomar una muestra de la población. Ésta es la estrategia correcta. El investigador
debe establecer el nivel de significancia, pero debe determinarlo antes de reunir la
evidencia de la muestra y no realizar cambios con base en la evidencia de ella.

41
Para profundizar en los temas de esta sesión te sugerimos la siguiente bibliografía.

42

También podría gustarte