Está en la página 1de 34

Prueba de Hipótesis

¿Motivación?
Usualmente es casi imposible conseguir los datos de toda la
población por lo que recurrimos a una muestra.

Usar un único estimador para tomar decisiones sobre la


población puede ser peligroso debido a su varianza y sesgo
respecto al parámetro poblacional.

Las pruebas de hipótesis permiten conocer la validez de


ciertas afirmaciones sobre una población a partir de una
muestra.

TEXTOS PARA
A diferencia de los Intervalos de confianza esto permiten
asociar el error a un lado en específico.
SEPARADORES
¡Imagínese que puede hacer con esa información!

Con esto se puede tomar decisiones mejores a lo que se


haría usando sólo la información muestral.
Ejemplo
Se desea conocer si efectivamente la media de
los desechos tóxicos que está produciendo cierta
fábrica supera la cantidad legalmente permitida

Se desea comprobar si el promedio de ventas de


su negocio ha decaído realmente respecto al
promedio del año pasado.

Ejemplo
Se desea probar si el salario del promedio de las
mujeres en una empresa es menor al que se
anuncia públicamente para evitar demandas.

Se desea conocer si el promedio de hormonas


debido a un medicamento es el correcto.
Ejercicio
Dos máquinas (A de Coca-Cola y B de Postobón) expendedoras de bebidas ubicadas en la entrada
TEXTOS PARA
de una sala de cines y hace 3 meses las máquinas no se han calibrado. Algunos clientes se quejan
de que la máquina A vierte poca bebida en sus vasos, recuerde que es una maquina automática
SEPARADORES
donde al oprimir un botón este llena el vaso automáticamente. Se considera que la máquina está
bien calibrada si vierte en promedio 200 ml de bebida en cada vaso. También se conoce si el vaso
de gaseosa ha sido de una bebida Light o normal.
¿Cuál es la medida estadística a la que se hace referencia en la pregunta? Ejercicio
¿Qué ocurre si vierte un poco más o un poco menos de 200 ml en promedio?

TEXTOS
¿Qué tanta variación en el promedio se puede tolerar?
PARA
¿Con qué regla o procedimiento se puede dar respuesta a esta pregunta?
SEPARADORES
¿Cuál es la población de referencia en la pregunta?
¿Por qué es útil tomar una muestra de bebidas servidas por la máquina?
¿Qué información extraeremos de las bebidas de la muestra y que se hace con eso?
En este caso se debe trabajar con : Promedio

No estamos buscando que sea un número exacto pero que se encuentre muy
cercano a 200.

Antes: Intervalos de confianza. Nuevo: Pruebas de Hipótesis!


Respuestas
Las medias muestrales se distribuyen de forma aproximadamente normal si el
tamaño de la muestra es mayor o igual a 30. (TLC)

Se toman muestras de un tamaño mayor o igual a 30 y para cada bebida se registra


la cantidad de bebida vertida en el vaso. Con los datos obtenidos se calcula el
promedio de bebidas.
La significancia o el error es un porcentaje normalmente en valores cómo : 1%, 2%,
5% o 10%. Significa que aceptamos que la probabilidad de cometer un error sea
respectivamente α. Fijamos la probabilidad de equivocarnos.
Proceso estadístico para contrastar hipótesis
Prueba de sobre los parámetros poblacionales usando la
información de la muestra.
Hipótesis Se establece un error permitido llamado
significancia asociado al error de rechazar la
hipótesis nula dado que no se debía rechazar.
¿Cuáles son los pasos que debe seguir al
momento de construir una prueba de hipótesis?
¿Qué errores podría cometer al momento de
llevar a cabo una prueba de hipótesis?
¿Cuál debería ser mi hipótesis nula y cuál la
Construcción de alterna?
una prueba de
¿Por qué no se hacen PH del 100% de confianza?
hipótesis (PH):
¿Cómo usaría una prueba de hipótesis en su
trabajo?
¿Qué información puede obtener de una prueba
de hipótesis?
El director de producción de Ventanas Norte, S.A.,
le ha pedido que evalúe un nuevo método
propuesto para producir su línea de ventanas de
doble hoja.
EJEMPLO
El proceso actual tiene una producción media de
PRUEBA DE 80 unidades por hora con una desviación típica
poblacional de 8.
HIPÓTESIS
PARA LA El director indica que no quiere sustituirlo por
otro método, a menos que existan pruebas
MEDIA contundentes de que el nivel medio de
producción es mayor con el nuevo método.

De una muestra de 25 observaciones ha


encontrado que la media es 83 y la desviación de
10.
Formulemos nuestras hipótesis:

Ejemplo:
Hipótesis Nula:
•Esta es la hipótesis la cual NO es sugerida por la muestra.
•Es sugerida como verdadera a menos que se demuestre lo contrario.
•Se denota con el símbolo 𝐻0 .
•Esta siempre describe la relación del parámetro(s) incluyendo la igualdad.
•Es la hipótesis rechazada o no rechazada por la prueba.
•Ejemplo 𝐻0 ∶ 𝜇 ≥ 200
Construcción de una
Hipótesis
prueba Alterna:
de hipótesis (PH):

•Esta es la hipótesis sugerida por la muestra.


•Verdadera si se rechaza la hipótesis nula.
•Se denota con el símbolo 𝐻1 𝑜 𝐻𝐴 .
•Esta siempre describe la relación del parámetro(s) SIN la igualdad.
•Ejemplo 𝐻𝐴 ∶ 𝜇 < 200

Recuerde que como conclusión DEBE elegir una de las hipótesis


𝐻0 : 𝜇 ≤ 80

𝐻𝐴 : 𝜇 > 80

¿Que dice nuestra evidencia estadística?

Ejemplo:
Estadístico de prueba (EP)

•Es el número que representa la cercanía entre la información muestral y la hipótesis nula.
•Es diferente para cada parámetro y depende de la información poblacional con la que se cuenta.
•Se puede buscar en la hoja de fórmulas.
•Está asociado a una distribución.
Construcción de una
P- prueba/de
Value hipótesis
Valor P (PH):

•Esta es la probabilidad que tiene su estadístico de prueba a la cola de prueba.


•Se debe comparar con la significancia para poder concluir.
•Será encontrado con la función DISTR. De Excel.
• Se usa la misma distribución que tenga su estadístico de prueba.
𝐻0 : 𝜇 ≤ 80

𝐻𝐴 : 𝜇 > 80
Ejemplo:
¿Que dice nuestra evidencia estadística?
𝐻0 : 𝜇 ≤ 80

𝐻𝐴 : 𝜇 > 80 ¿Que dice nuestra evidencia estadística?

Ejemplo: 𝐸𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑜 𝑑𝑒 𝑃𝑟𝑢𝑒𝑏𝑎:

𝑋ത − 𝜇0 83 − 80
𝐸𝑃 = = = 1,875
𝜎/ 𝑛 8/ 25

𝑃 − 𝑉𝑎𝑙𝑢𝑒:

𝐸𝑃~ 𝑍
𝑃 𝐸𝑃 > 1,875 = 1 − 𝐷𝐼𝑆𝑇𝑅. 𝑁𝑂𝑅𝑀. 𝐸𝑆𝑇𝐴𝑁𝐷 1,875

𝑃 − 𝑉𝑎𝑙𝑢𝑒 = 3,04%
𝐻0 : 𝜇 ≤ 80

𝐻𝐴 : 𝜇 > 80
Ejemplo:
𝐸𝑃 = 1,875 𝑃 − 𝑉𝑎𝑙𝑢𝑒 = 3,04%

¿Debemos rechazar o no?


Región de Rechazó

•Si el estadístico de prueba cae en la región de rechazo se debe Rechazar 𝐻0 .


• La región de rechazo está directamente relacionada a la significancia (el error).
• La región de rechazo puede ser de cola izquierda derecha o de 2 colas dependiendo de su 𝐻𝐴 .

Construcción de una
Punto Crítico
prueba de hipótesis (PH):

•Es el punto a partir el cual empieza la región de rechazo.


•Se puede encontrar teniendo la significancia y la distribución del estadístico de prueba.
•Para encontrarlo se usará la fórmula de Excel INV ya que la significancia representa una probabilidad
acumulada.
𝐻0 : 𝜇 ≤ 80
Ejemplo:
𝐻𝐴 : 𝜇 > 80

𝐸𝑃 = 1,875 𝑃 − 𝑉𝑎𝑙𝑢𝑒 = 3,04%

¿Debemos rechazar o no?

𝐻𝐴 : 𝜇 > # 𝐻𝐴 : 𝜇 < # 𝐻𝐴 : 𝜇 ≠ #
𝐻0 : 𝜇 ≤ 80

𝐻𝐴 : 𝜇 > 80
Ejemplo:
𝐸𝑃 = 1,875 𝑃 − 𝑉𝑎𝑙𝑢𝑒 = 3,04%

¿Debemos rechazar o no?


𝐻0 : 𝜇 ≤ 80 𝐸𝑃 = 1,875 𝑃 − 𝑉𝑎𝑙𝑢𝑒 = 3,04%

𝐻𝐴 : 𝜇 > 80 𝑃𝐶 = ? 𝛼 = 5%
Ejemplo: 𝑃𝑢𝑛𝑡𝑜 𝑐𝑟í𝑡𝑖𝑐𝑜 = 𝐼𝑁𝑉. 𝑁𝑂𝑅𝑀. 𝐸𝑆𝑇𝐴𝑁𝐷 1 − 𝛼

𝑃𝑢𝑛𝑡𝑜 𝑐𝑟í𝑡𝑖𝑐𝑜 = 𝐼𝑁𝑉. 𝑁𝑂𝑅𝑀. 𝐸𝑆𝑇𝐴𝑁𝐷 95%

𝑃𝑢𝑛𝑡𝑜 𝑐𝑟í𝑡𝑖𝑐𝑜 = 1,645

𝑃𝐶 = 1,645
𝐻0 : 𝜇 ≤ 80 𝐸𝑃 = 1,875 𝑃 − 𝑉𝑎𝑙𝑢𝑒 = 3,04%

𝐻𝐴 : 𝜇 > 80 𝑃𝑢𝑛𝑡𝑜 𝑐𝑟í𝑡𝑖𝑐𝑜 = 1,645 𝛼 = 5%


Ejemplo:

Como el EP cae en la región de rechazo:


Rechazamos Ho y la media poblacional será
mayor a 80 𝑃𝐶 = 1,645 𝐸𝑃 = 1,875
𝐻0 : 𝜇 ≤ 80 𝐸𝑃 = 1,875 𝑃 − 𝑉𝑎𝑙𝑢𝑒 = 3,04%

𝐻𝐴 : 𝜇 > 80 𝑃𝑢𝑛𝑡𝑜 𝑐𝑟í𝑡𝑖𝑐𝑜 = 1,645 𝛼 = 5%


Ejemplo:

𝑃 − 𝑉𝑎𝑙𝑢𝑒 = 3,04%

Como el P-Valor es menor a la significancia


𝛼 = 5%
se debe rechazar la hipótesis nula por lo la
media es mayor a 80.
Pasos sugeridos para un IC:
1. ¡Lea bien!

2. Enuncie sus hipótesis.

3. Identifique y calcule su Estadístico de Prueba. Consejo

4. Identifique su región de rechazo.

5. Defina con cual hipótesis se queda (usando P value o PC).

6. Interprete
El director de producción de Rodamientos Niquelados,
S.A., le ha pedido ayuda para evaluar un proceso
modificado de producción de rodamientos.

Cuando el proceso funciona correctamente, produce


rodamientos cuyo peso sigue una distribución normal
demedia poblacional 5 onzas y desviación típica
poblacional 0,1 onzas. Se ha recurrido aun nuevo
proveedor de materia prima para un lote reciente de
Ejercicio 1 producción y el director quiere saber si, como
consecuencia del cambio, el peso medio de los
rodamientos es menor.

Se especifica un nivel de significación del 5%.

En este problema, obtenemos una muestra aleatoria de


36 observaciones y la media muestral es 4,962.
El director de producción de Circuitos Ilimitados le ha
pedido ayuda para analizar un proceso de producción.
Este proceso consiste en hacer taladros cuyo diámetro
sigue una distribución normal de media poblacional 2
centímetros y desviación típica poblacional 0,06
centímetros. Una muestra aleatoria de 29 mediciones
Ejercicio 2 tenía una media muestral de 1,95 centímetros.

Utilice un nivel de significación de 5% para averiguar si la


media muestral observada es excepcional y sugiere que
debe ajustarse la taladradora.
Grand Junction Vegetables es un fabricante de una
amplia variedad de verduras congeladas. El presidente
de la empresa le ha pedido que averigüe si las ventas
semanales delas bolsas de brócoli congelado de 16
Ejercicio 3 onzas han aumentado. En los 6 últimos meses, se ha
vendido una media semanal de 2.400 bolsas. Ha
obtenido una muestra aleatoria de datos de ventas de
134 tiendas para realizar el estudio.
Recordar:
Cada parámetro poblacional tiene intervalos de confianza diferentes.

Por lo que se necesita recordar:

Parámetro Poblacional Estimador Muestral Funciones de muestra


aleatoria
μ 𝑋ത
σ s • Media
σ2 s2 • Desviación Estándar
P 𝑝Ƹ • Varianza
• Proporción
Recordar:
Estimador Muestral
Promedio aritmético. La suma de las observaciones dividido el número de
𝑛
σ1 𝑥𝑖
𝑋ത = observaciones. La variable X debe ser continua.
𝑛
La desviación estándar es una medida de dispersión de los datos respecto a
𝑆= 𝑆2 la media. La desviación tiene las mismas unidades de X y es la raíz de la
varianza.
2
𝑛
σ1 𝑥𝑖 − 𝑋ത 2
𝑆 = La varianza es una medida de dispersión de los datos. Tiene las mismas
𝑛−1
unidades de X2.
𝑛
σ1 𝑥𝑖
𝑃෠ =
𝑛 La proporción es la suma de las observaciones sobre el número de
observaciones sin embargo en este caso la variable X debe ser Binaria (1 si
éxito 0 si fracaso). La proporción también representa la probabilidad de un
evento.
Recordar:
Distribuciones de los estimadores

𝜎 2
𝑋ത − 𝜇
𝑋ത ~ 𝑁 𝜇 ; →
𝑛 𝜎/ 𝑛

𝑆 → 𝑁𝑜 𝑡𝑖𝑒𝑛𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑎𝑠𝑜𝑐𝑖𝑎𝑑𝑎

2
𝑆 2
2
∗ 𝑛 − 1 ~ 𝜒(𝑛−1)
𝜎

𝑃 ∗ (1 − 𝑃) 𝑃෠ − 𝑃
෠ 𝑁 𝑃;
𝑃~ →
𝑛 𝑃 ∗ (1 − 𝑃)
𝑛
Fórmulas útiles en Excel:
Funciones de PROBABILIDAD de algunas continuas de mayor aplicación:

• DISTR.NORM.ESTAND.N( Z ; ¿Acum? ) Probabilidad de la Normal Estándar.


• DISTR.NORM.N( X; Media; Desv. Estándar; ¿Acum?) Probabilidad de la Normal.
• DISTR.T.N( X ; GL ; ¿Acum? ) Probabilidad T - Student.
• DISTR.CHICUAD( X ; GL ; ¿Acum? ) Probabilidad Chi - cuadrado.
• DISTR.F.N( X ; GL1 ; GL2 ¿Acum? ) Probabilidad F – Fisher.

Donde X es el valor que acumula probabilidad a la izquierda.


Donde GL son los grados de libertad correspondientes a las distribuciones.
Fórmulas útiles en Excel:
Funciones INVERSAS de algunas continuas de mayor aplicación:

• INV.NORM.ESTAND( P ) Inversa de la Normal Estándar.


• INV.NORM( P ; Media ; Desv. Estándar) Inversa de la Normal.
• INV.T( P ; GL ) Inversa T - Student.
• INV.CHICUAD( P ; GL ) Inversa Chi - cuadrado.
• INV.F( P ; GL1 ; GL2 ) Inversa F – Fisher.

Donde P es la probabilidad acumulada a la Izquierda.


Donde GL son los grados de libertad correspondientes a las distribuciones.
Libros Guía

En el curso maestro encontrará los siguientes libros:

Estadística para Administración y Economía. Sexta


Edición. Paul Newbold, William Berry.

Probabilidad y estadística para ingeniería y ciencias.


Novena Edición. Walpole, Myers, Myers.
TEXTOS PARA
En el programa se especifican lecturas complementarias.
SEPARADORES
GRACIAS

También podría gustarte