Está en la página 1de 35

Prueba de Hipótesis

¿Motivación?
Usualmente es casi imposible conseguir los datos de toda la
población por lo que recurrimos a una muestra.

Usar un único estimador para tomar decisiones sobre la


población puede ser peligroso debido a su varianza y sesgo
respecto al parámetro poblacional.

Las pruebas de hipótesis permiten conocer la validez de


ciertas afirmaciones sobre una población a partir de una
muestra.

TEXTOS PARA
A diferencia de los Intervalos de confianza esto permiten
asociar el error a un lado en específico.
SEPARADORES
¡Imagínese que puede hacer con esa información!

Con esto se puede tomar decisiones mejores a lo que se


haría usando sólo la información muestral.
Ejemplo
Se desea conocer si efectivamente la media de
los desechos tóxicos que está produciendo cierta
fábrica supera la cantidad legalmente permitida

Se desea comprobar si el promedio de ventas de


su negocio ha decaído realmente respecto al
promedio del año pasado.

Ejemplo
Se desea probar si el salario del promedio de las
mujeres en una empresa es menor al que se
anuncia públicamente para evitar demandas.

Se desea conocer si el promedio de hormonas


debido a un medicamento es el correcto.
Ejercicio
Dos máquinas (A de Coca-Cola y B de Postobón) expendedoras de bebidas ubicadas en la entrada
TEXTOS PARA
de una sala de cines y hace 3 meses las máquinas no se han calibrado. Algunos clientes se quejan
de que la máquina A vierte poca bebida en sus vasos, recuerde que es una maquina automática
SEPARADORES
donde al oprimir un botón este llena el vaso automáticamente. Se considera que la máquina está
bien calibrada si vierte en promedio 200 ml de bebida en cada vaso. También se conoce si el vaso
de gaseosa ha sido de una bebida Light o normal.
¿Cuál es la medida estadística a la que se hace referencia en la pregunta? Ejercicio
¿Qué ocurre si vierte un poco más o un poco menos de 200 ml en promedio?
TEXTOS PARA
¿Qué tanta variación en el promedio se puede tolerar?
¿Con qué regla o procedimiento se puede dar respuesta a esta pregunta?
SEPARADORES ¿Cuál es
la población de referencia en la pregunta?
¿Por qué es útil tomar una muestra de bebidas servidas por la máquina?
¿Qué información extraeremos de las bebidas de la muestra y que se hace con eso?
En este caso se debe trabajar con : Promedio

No estamos buscando que sea un número exacto pero que se encuentre muy
cercano a 200.

Antes: Intervalos de confianza. Nuevo: Pruebas de Hipótesis!


Respuestas
Las medias muestrales se distribuyen de forma aproximadamente normal si el
tamaño de la muestra es mayor o igual a 30. (TLC)

Se toman muestras de un tamaño mayor o igual a 30 y para cada bebida se registra


la cantidad de bebida vertida en el vaso. Con los datos obtenidos se calcula el
promedio de bebidas.
La significancia o el error es un porcentaje normalmente en valores cómo : 1%, 2%,
5% o 10%. Significa que aceptamos que la probabilidad de cometer un error sea
respectivamente α. Fijamos la probabilidad de equivocarnos.
Proceso estadístico para contrastar hipótesis
Prueba de sobre los parámetros poblacionales usando la
información de la muestra.
Hipótesis Se establece un error permitido llamado
significancia asociado al error de rechazar la
hipótesis nula dado que no se debía rechazar.
¿Cuáles son los pasos que debe seguir al
momento de construir una prueba de hipótesis?

¿Qué errores podría cometer al momento de


llevar a cabo una prueba de hipótesis?

¿Cuál debería ser mi hipótesis nula y cuál la


Construcción de alterna?
una prueba de
¿Por qué no se hacen PH del 100% de confianza?
hipótesis (PH):
¿Cómo usaría una prueba de hipótesis en su
trabajo?

¿Qué información puede obtener de una prueba


de hipótesis?
El director de producción de Ventanas Norte, S.A.,
le ha pedido que evalúe un nuevo método
propuesto para producir su línea de ventanas de
doble hoja.
EJEMPLO
El proceso actual tiene una producción media de
PRUEBA DE 80 unidades por hora con una desviación típica
poblacional de 8.
HIPÓTESIS
PARA LA El director indica que no quiere sustituirlo por
otro método, a menos que existan pruebas
MEDIA contundentes de que el nivel medio de
producción es mayor con el nuevo método.

De una muestra de 25 observaciones ha


encontrado que la media es 83 y la desviación de
10 usando el nuevo método.
Formulemos nuestras hipótesis:

Ejemplo:
Hipótesis Nula:
• Esta es la hipótesis la cual NO es sugerida por la muestra.
• Es sugerida como verdadera a menos que se demuestre lo contrario.
• Se denota con el símbolo .
• Esta siempre describe la relación del parámetro(s) incluyendo la igualdad.
• Es la hipótesis rechazada o no rechazada por la prueba.
• Ejemplo
Construcción de una
prueba de hipótesis
Hipótesis
(PH):
Alterna:
• Esta es la hipótesis sugerida por la muestra.
• Verdadera si se rechaza la hipótesis nula.
• Se denota con el símbolo .
• Esta siempre describe la relación del parámetro(s) SIN la igualdad.
• Ejemplo

Recuerde que como conclusión DEBE elegir una de las hipótesis


¿Que dice nuestra evidencia estadística?

Ejemplo:
Estadístico de prueba (EP)

• Es el número que representa la cercanía entre la información muestral y la hipótesis nula.


• Es diferente para cada parámetro y depende de la información poblacional con la que se cuenta.
• Se puede buscar en la hoja de fórmulas.
• Está asociado a una distribución.
Construcción de una
prueba de hipótesis
P- Value
(PH): / Valor P

• Esta es la probabilidad que tiene su estadístico de prueba a la cola de prueba.


• Se debe comparar con la significancia para poder concluir.
• Será encontrado con la función DISTR. De Excel.
• Se usa la misma distribución que tenga su estadístico de prueba.
Ejemplo:
¿Que dice nuestra evidencia estadística?
¿Que dice nuestra evidencia estadística?
Ejemplo:
Ejemplo:
𝐸 𝑃=1,875 𝑃 −𝑉𝑎𝑙𝑢𝑒=3,04 %

¿Debemos rechazar o no?


Región de Rechazó

• Si el estadístico de prueba cae en la región de rechazo se debe Rechazar .


• La región de rechazo está directamente relacionada a la significancia (el error).
• La región de rechazo puede ser de cola izquierda, derecha o de 2 colas dependiendo de su .

Construcción de una
prueba de
Punto Críticohipótesis
(PH):

• Es el punto a partir el cual empieza la región de rechazo.


• Se puede encontrar teniendo la significancia y la distribución del estadístico de prueba.
• Para encontrarlo se usará la fórmula de Excel INV ya que la significancia representa una probabilidad
acumulada.
Ejemplo:

𝐸 𝑃=1,875 𝑃 −𝑉𝑎𝑙𝑢𝑒=3,04 %

¿Debemos rechazar o no?

𝐻 𝐴 : 𝜇> ¿ 𝐻 𝐴 : 𝜇< ¿ 𝐻 𝐴 :𝜇≠ ¿


Ejemplo:

𝐸 𝑃=1,875 𝑃 −𝑉𝑎𝑙𝑢𝑒=3,04 %

¿Debemos rechazar o no?

𝐻 𝐴 : 𝜇> ¿ 𝐻 𝐴 : 𝜇< ¿ 𝐻 𝐴 :𝜇≠ ¿


Ejemplo:
𝐸 𝑃=1,875 𝑃 −𝑉𝑎𝑙𝑢𝑒=3,04 %

¿Debemos rechazar o no?


𝐸 𝑃=1,875 𝑃 −𝑉𝑎𝑙𝑢𝑒=3,04 %

𝑃𝐶=? 𝛼=5 %
Ejemplo:

𝑃𝐶=1,645
𝐸 𝑃=1,875 𝑃 −𝑉𝑎𝑙𝑢𝑒=3,04 %

𝑃𝑢𝑛𝑡𝑜 𝑐𝑟 í 𝑡𝑖𝑐𝑜=1,645 𝛼=5 %


Ejemplo:

Como el EP cae en la región de rechazo:


Rechazamos Ho y la media poblacional será
mayor a 80
𝑃𝐶=1,645 𝐸𝑃 =1,875
𝐸 𝑃=1,875 𝑃 −𝑉𝑎𝑙𝑢𝑒=3,04 %

𝑃𝑢𝑛𝑡𝑜 𝑐𝑟 í 𝑡𝑖𝑐𝑜=1,645 𝛼=5 %


Ejemplo:

𝑃 − 𝑉𝑎𝑙𝑢𝑒=3,04 %

Como el P-Valor es menor a la significancia 𝛼 =5 %


se debe rechazar la hipótesis nula por lo la
media es mayor a 80.
Pasos sugeridos para un IC:
1. ¡Lea bien!

2. Enuncie sus hipótesis.

3. Identifique y calcule su Estadístico de Prueba. Consejo

4. Identifique su región de rechazo.

5. Defina con cual hipótesis se queda (usando P value o PC).

6. Interprete
El director de producción de Rodamientos Niquelados,
S.A., le ha pedido ayuda para evaluar un proceso
modificado de producción de rodamientos.

Cuando el proceso funciona correctamente, produce


rodamientos cuyo peso sigue una distribución normal de
media poblacional 5 onzas y desviación típica
poblacional 0,1 onzas. Se ha recurrido aun nuevo
proveedor de materia prima para un lote reciente de
Ejercicio 1 producción y el director quiere saber si, como
consecuencia del cambio, el peso medio de los
rodamientos es menor.

Se especifica un nivel de significación del 5%.

En este problema, obtenemos una muestra aleatoria de


36 observaciones y la media muestral es 4,962.
El director de producción de Circuitos Ilimitados le ha
pedido ayuda para analizar un proceso de producción.
Este proceso consiste en hacer taladros cuyo diámetro
sigue una distribución normal de media poblacional 2
centímetros y desviación típica poblacional 0,06
centímetros. Una muestra aleatoria de 29 mediciones
Ejercicio 2 tenía una media muestral de 1,95 centímetros.

Utilice un nivel de significación de 5% para averiguar si la


media muestral observada es excepcional y sugiere que
debe ajustarse la taladradora.
Grand Junction Vegetables es un fabricante de una
amplia variedad de verduras congeladas. El presidente
de la empresa le ha pedido que averigüe si las ventas
semanales de las bolsas de brócoli congelado de 16
onzas han aumentado. En los 6 últimos meses, se ha
Ejercicio 3 vendido una media semanal de 2.400 bolsas. Ha
obtenido una muestra aleatoria de datos de ventas de
134 tiendas para realizar el estudio. A continuación los
resultados de su estudio.
Recordar:
Cada parámetro poblacional tiene intervalos de confianza diferentes.

Por lo que se necesita recordar:

Parámetro Poblacional Estimador Muestral Funciones de muestra


aleatoria
μ
σ s • Media
σ2 s2 • Desviación Estándar
P • Varianza
• Proporción
Recordar:
Estimador Muestral
Promedio aritmético. La suma de las observaciones dividido el número de
observaciones. La variable X debe ser continua.

La desviación estándar es una medida de dispersión de los datos respecto a


la media. La desviación tiene las mismas unidades de X y es la raíz de la
varianza.

La varianza es una medida de dispersión de los datos. Tiene las mismas


unidades de X .
2

La proporción es la suma de las observaciones sobre el número de


observaciones sin embargo en este caso la variable X debe ser Binaria (1 si
éxito 0 si fracaso). La proporción también representa la probabilidad de un
evento.
Recordar:
Distribuciones de los estimadores
Fórmulas útiles en Excel:
Funciones de PROBABILIDAD de algunas continuas de mayor aplicación:

• DISTR.NORM.ESTAND.N( Z ; ¿Acum? ) Probabilidad de la Normal Estándar.


• DISTR.NORM.N( X; Media; Desv. Estándar; ¿Acum?) Probabilidad de la Normal.
• DISTR.T.N( X ; GL ; ¿Acum? ) Probabilidad T - Student.
• DISTR.CHICUAD( X ; GL ; ¿Acum? ) Probabilidad Chi - cuadrado.
• DISTR.F.N( X ; GL1 ; GL2 ¿Acum? ) Probabilidad F – Fisher.

Donde X es el valor que acumula probabilidad a la izquierda.


Donde GL son los grados de libertad correspondientes a las distribuciones.
Fórmulas útiles en Excel:
Funciones INVERSAS de algunas continuas de mayor aplicación:

• INV.NORM.ESTAND( P ) Inversa de la Normal Estándar.


• INV.NORM( P ; Media ; Desv. Estándar) Inversa de la Normal.
• INV.T( P ; GL ) Inversa T - Student.
• INV.CHICUAD( P ; GL ) Inversa Chi - cuadrado.
• INV.F( P ; GL1 ; GL2 ) Inversa F – Fisher.

Donde P es la probabilidad acumulada a la Izquierda.


Donde GL son los grados de libertad correspondientes a las distribuciones.
Libros Guía

En el curso maestro encontrará los siguientes libros:

Estadística para Administración y Economía. Sexta


Edición. Paul Newbold, William Berry.

Probabilidad y estadística para ingeniería y ciencias.


Novena Edición. Walpole, Myers, Myers.
TEXTOS PARA
En el programa se especifican lecturas complementarias.
SEPARADORES
GRACIAS

También podría gustarte