Está en la página 1de 46

UNIVERSIDAD NACIONAL

“SANTIGO ANTÚNEZ DE MAYOLO

Curso: Control estadístico de procesos

Prueba de Hipótesis para


una muestra
SEMANA 02

Huaraz, febrero del 2020


Prof. Walter Varela Rojas Dr. Walter Varela R.
CONTENIDO
Prof. Walter Varela R.

Hipótesis • Tipos de errores


estadística para • Media poblacional
una muestra • Proporción poblacional
• Varianza poblacional

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA
Prof. Walter Varela R.

Definición
Es una afirmación que se hace acerca de la distribución o
parámetros de una o más poblaciones.

Por ejemplo:
• El ingreso mensual medio de una familia es de 1920 soles,
es decir, µ = 1920.
• El porcentaje de artículos defectuosos producidos en una
fábrica por una máquina es menor al 2%, es decir, p < 0,02.

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA
Prof. Walter Varela R.

Hipótesis nula (Ho)

A partir de la información proporcionada por la muestra se


verificará la suposición sobre el parámetro estudiado.
La hipótesis que se contrasta se llama hipótesis nula.

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA
Prof. Walter Varela R.

Hipótesis alterna (H1)

Es la hipótesis que debe ser aceptada si se rechaza la


hipótesis nula.

Es la conclusión a la que se llegaría si hubiera suficiente


evidencia en la información de la muestra para decidir que es
improbable que la hipótesis nula sea verdadera.

El hecho de no rechazar la hipótesis nula no implica que ésta


sea cierta. Significa simplemente que los datos de la muestra
son insuficientes para inducir un rechazo de la hipótesis nula.

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA
Prof. Walter Varela R.

Ejemplo
La siesta, clave para mejorar la productividad.
Algunas empresas en el mundo ofrecen siestarios para que
sus empleados descansen durante el horario laboral. Los
especialistas aseguran que dormir “entre 20 y 30 minutos”
después del almuerzo mejora el rendimiento de los
trabajadores, aumenta la productividad y el desarrollo de la
creatividad. (31 de mayo del 2017. Fuente http://www.ambito.com)

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA
Prof. Walter Varela R.

Ejemplo

Hipótesis nula;

Ho: Tomar una siesta de 20 a 30 minutos después del


almuerzo, mejora el rendimiento de los trabajadores, aumenta
la productividad y el desarrollo de la creatividad.

Hipótesis alterna;

H1: Tomar una siesta de 20 a 30 minutos después del


almuerzo, no mejora el rendimiento de los trabajadores,
aumenta la productividad y el desarrollo de la creatividad.
Prof. Walter Varela Rojas
HIPÓTESIS ESTADÍSTICA
Prof. Walter Varela R.

Tipos de errores:
Cuando usamos los datos de una muestra para tomar
decisiones acerca de un parámetro existe el riesgo de llegar a
una conclusión incorrecta. De hecho, se pueden presentar dos
tipos diferentes de error cuando se aplica la metodología de la
prueba de hipótesis.
  Decisión estadística
Situación
No rechazar H Rechazar H

H0 verdadera No hay error Error tipo I (a)

H0 falsa Error tipo II (b) No hay error

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA
Prof. Walter Varela R.

Error tipo I
Ocurre cuando se rechaza la hipótesis Ho que es verdadera.
A la probabilidad de cometer un error de tipo I se le conoce como nivel de
significación o significación y es denotada por α. Es fijado por la persona
que realiza la investigación, por lo general, en 5% y es el valor que ese
usará si algún ejercicio de este curso no menciona el nivel de
significación.

Error tipo II

Ocurre cuando no se rechaza la hipótesis H0 que es falsa. La probabilidad


de cometer un error de tipo II es denotada por β.
Prof. Walter Varela Rojas
HIPÓTESIS ESTADÍSTICA
Prof. Walter Varela R.

Pasos a seguir en una prueba de hipótesis


N° Pasos Ejemplo

H0 : μ ≤ 10
1 Establecer la hipótesis nula y la alterna
H1: μ > 10

2 Determinar el nivel de significación α = 0,05

Elegir el estadístico apropiado de


prueba a utilizar, recolectar los datos y ‫ݔ‬ҧെߤ௢
3 ܼ௢ ൌ
calcular el valor del estadístico de ܵൗ
prueba apropiado
݊

La muestra es aleatoria.
Especificar los supuestos necesarios
4 La muestra proviene de
para la validez de la prueba.
una distribución normal
Establecer los valores críticos que
5 separan la región de rechazo y no
rechazo.
Tomar la decisión estadística y
6 expresar la conclusión en términos Rechazo H0
del problema. Prof. Walter Varela Rojas
HIPÓTESIS ESTADÍSTICA PARA
LA MEDIA POBLACIONAL Prof. Walter Varela R.

PRUEBAS UNILATERALES

Muestra Grande
• En este caso (n ≥ 25) se asume distribución normal
• Para pruebas de hipótesis acerca de la media de una
población se emplea el estadígrafo z

• Se determina si la desviación del valor numérico en


estudio es lo suficiente para justificar el rechazo de la
hipótesis nula

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA PARA
LA MEDIA POBLACIONAL Prof. Walter Varela R.

PRUEBAS UNILATERALES

• La probabilidades 0.05 y 0.01 de cometer


error tipo I están relacionadas con un valor
de z de –1.645 y –2.33 respectivamente
• Luego se debe rechazar H0 si el valor de es
menor a –1.645 o –2.33 dependiendo del
nivel de significancia.
• El valor z establece el límite de la región de
rechazo denominada valor crítico
Prof. Walter Varela Rojas
HIPÓTESIS ESTADÍSTICA PARA
LA MEDIA POBLACIONAL Prof. Walter Varela R.

PRUEBAS UNILATERALES

a=0.05 a=0.01

-1.645 0 2.33
Rechazar H0 Rechazar H0
Prof. Walter Varela Rojas
HIPÓTESIS ESTADÍSTICA PARA
LA MEDIA POBLACIONAL Prof. Walter Varela R.

PRUEBAS UNILATERALES CON VARIANZA POBLACIONAL


CONOCIDA

• Resumen de pruebas unilaterales sobre media de


una población. Si n25
• Unilateral izquierdo Unilateral derecho

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA PARA
LA MEDIA POBLACIONAL Prof. Walter Varela R.

PRUEBAS UNILATERALES CON VARIANZA POBLACIONAL


CONOCIDA

• Valor p
– Es el valor de probabilidad de obtener un
resultado de la muestra que sea al menos tan
improbable como lo que se observa
– Este valor corresponde al valor de la
probabilidad asignada al z calculado a partir del
valor numérico sometido a la prueba de
hipótesis
– Si p es menor al nivel de significancia
predefinido se debe
Prof. Walterrechazar
Varela Rojas H0
HIPÓTESIS ESTADÍSTICA PARA
LA MEDIA POBLACIONAL Prof. Walter Varela R.

PRUEBAS UNILATERALES CON VARIANZA POBLACIONAL


CONOCIDA
Muestra Pequeña
• En este caso (n < 25) se asume que la población tiene una
distribución normal
• Con distribución t se pueden hacer inferencias acerca de
la media de la población

• Para este estadígrafo se debe considerar los grados de


libertad asociados al tamaño de la muestra (n-1) para
definir el valor crítico que llevará al rechazo de H0. Por las
características de la tabla resulta complicado calcular el
valor de p por lo que seProf.
expresa enRojas
Walter Varela intervalos.
HIPÓTESIS ESTADÍSTICA PARA
LA MEDIA POBLACIONAL Prof. Walter Varela R.

PRUEBAS BILATERALES PARA LA MEDIA

Muestra grande
• La diferencia de esta prueba con respecto a las
unilaterales está en que la región de rechazo está ubicada
simultáneamente en ambas colas
• En las pruebas bilaterales de hipótesis siempre se
determina la región de rechazo colocando un área de
probabilidad igual a a/2 en cada cola de distribución
• Para este caso el valor de z para un nivel de significancia
de 0.05 corresponderá a 1.96

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA PARA
LA MEDIA POBLACIONAL Prof. Walter Varela R.

PRUEBAS BILATERALES PARA LA MEDIA

Muestra grande

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA PARA
LA MEDIA POBLACIONAL Prof. Walter Varela R.

PRUEBAS BILATERALES PARA LA MEDIA

Muestra grande
• Resumen de pruebas bilaterales sobre media de una
población. Si n25

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA PARA
LA MEDIA POBLACIONAL Prof. Walter Varela R.

PRUEBAS BILATERALES PARA LA MEDIA

• Valor p
– En una prueba bilateral se determina el p
duplicando el área en la cola
– Esta multiplicación busca comparar el valor de
p directamente con a y poder mantener la
misma regla de rechazo

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA PARA
LA MEDIA POBLACIONAL Prof. Walter Varela R.

Ejemplo 01, para muestra grande


Usted es gerente de un restaurante de comida rápida. Quiere
determinar si el tiempo de espera al pedir una orden se ha
modificado durante el último mes con respecto a su valor de
media poblacional previo de 4,5 minutos. Selecciona una muestra
de 25 órdenes durante un período de una hora.
La media muestral es de 5,1 minutos, determine si existe evidencia
de que, con un nivel de significancia de 0,05; el tiempo de espera
medio para servir una orden se ha modificado durante el último
mes con respecto a su valor de media poblacional previo de 4,5
minutos

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA PARA
LA MEDIA POBLACIONAL Prof. Walter Varela R.

Solución del ejemplo para muestra grande


Paso 1: Planteamiento de las hipótesis
La media poblacional no ha cambiado con respecto a su valor
previo de 4,5 minutos

La hipótesis alternativa es opuesta a la hipótesis nula. Es to es


que la media poblacional no es de 4,5 minutos.

𝐻 𝑎 : 𝜇≠ 4,5
Paso 2: Nivel de significancia es 0,05

Paso 3: Estadístico de prueba


𝑥 − 𝜇𝑜 5,1 − 4,5
𝑍𝑐 = = =2,5
𝜎 1,2
Prof. Walter Varela Rojas
√𝑛 √ 25
HIPÓTESIS ESTADÍSTICA PARA
LA MEDIA POBLACIONAL Prof. Walter Varela R.

Solución del ejemplo para muestra grande


Paso 4: Valores críticos

Los valores críticos del estadístico de prueba Z son -1,96 y +1,96. La


región de rechazo es Z<-1,96 o Z>+1,96 y la zona de no rechazo es -
1,96 < Z < +1,96
Puesto que 2,5 >+1,96, se rechaza Ho.

Paso 5: Se concluye que existe evidencia de que el tiempo de


espera al pedir una orden se ha modificado con respecto a su
valor de media poblacional previo de 4,5 minutos. El tiempo de
espera medio de los clientes ahora es mayor que el mes pasado, a
Prof. Walter Varela Rojas
un nivel de significancia del 5%
HIPÓTESIS ESTADÍSTICA PARA
LA MEDIA POBLACIONAL Prof. Walter Varela R.

Solución: Método del valor – p para la prueba de hipótesis

El valor – p, que a menudo se denomina nivel de significancia


observado, es el nivel más pequeño en el que se puede rechazar
Ho.
Las reglas de decisión para rechazar Ho en el método del valor-p
son:
• Si el valor-p es mayor o igual que α, no rechace la hipótesis nula
• Si el valor-p es menor que α, rechace la hipótesis nula.

Para nuestro ejemplo, se debe calcular


la probabilidad de un valor Z mayor que
2,50 y menor de -2,50
-2,50 2,50

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA PARA
LA MEDIA POBLACIONAL Prof. Walter Varela R.

Solución: Método del valor – p para la prueba de hipótesis

-2,50 2,50

P(Z<-2,5)=0,00621 y P(Z>2,5)=1- P(Z≤2,5)=1-0,99379=0,00621


Luego: 0,00621+0,00621=0,01242
Puesto que el valor-p=0,01242 < α=0,05 ; se debe de rechazar la Ho.

Por lo tanto, se concluye que existe evidencia de que el tiempo de


espera al pedir una orden se ha modificado, por lo que el tiempo de
espera es superior que el mes pasado.
Prof. Walter Varela Rojas
HIPÓTESIS ESTADÍSTICA PARA
LA MEDIA POBLACIONAL Prof. Walter Varela R.

PRUEBAS BILATERALES PARA LA MEDIA

Muestra pequeña
• Con una prueba bilateral y un nivel de significancia a definido
se debe considerar al estadígrafo t a/2 para determinar el área
de probabilidad asociado a los grados de libertad de la muestra

𝑥 −𝜇 𝑜
𝑇 𝑐= ≈ 𝑡 → 𝑆𝑡𝑢𝑑𝑒𝑛𝑡 (𝑛 −1)
𝑆
√𝑛

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA PARA
LA MEDIA POBLACIONAL Prof. Walter Varela R.

Ejemplo 01:
Por datos históricos se sabe que la media de la edad de los huéspedes del
hotel A es 36 años. La gerencia cree que la media de la edad de sus
huéspedes ha aumentado; para esto se seleccionó al azar una muestra
aleatoria de 20 pasajeros. Las edades de los huéspedes en la muestra se
presentan en la siguiente tabla:

41 43 36 17 62 50 48 39 44 32
45 46 22 48 40 37 25 28 64 25

Con la información presentada y usando un nivel de significación del 5%,


contraste la hipótesis de la gerencia. Asuma que la edad sigue una distribución
normal.

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA PARA
LA MEDIA POBLACIONAL Prof. Walter Varela R.

Solución ejemplo 02:


Paso 1: Planteamiento de las hipótesis
La edad media de los huésped es de 36 años

Paso 2: Nivel de significancia es 0,04


4
Paso 3: Estadístico de prueba, n=20, S=12,373 y

𝑥 − 𝜇 𝑜 39,6 − 36
𝑇 𝑐= = =1,3012
𝑆 12,373
√𝑛 √ 20

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA PARA
LA MEDIA POBLACIONAL Prof. Walter Varela R.

Solución ejemplo 02:


Paso 4: Valor crítico

t=1,729

El valor crítico del estadístico de prueba T es 1,729. La región de


rechazo es T >1,729 y la zona de no rechazo es T < 1,729
Puesto que 1,3012 < 1,729, no se rechaza Ho.

Paso 5: Se concluye que no existe evidencia suficiente de que la


edad de los huéspedes haya aumentado, al nivel de significancia
del 5%.

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA PARA
LA PROPORCIÓN POBLACIONAL Prof. Walter Varela R.

PRUEBA DE HIPOTESIS PARA UNA PROPORCIÓN

Sea una m. a. de tamaño n extraída de una

población de Bernoulli B(1;p) de parámetro p

Y sea la proporción muestral es

Donde {

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA PARA
LA PROPORCIÓN POBLACIONAL Prof. Walter Varela R.

Tipos de prueba para una proporción

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA PARA
LA PROPORCIÓN POBLACIONAL Prof. Walter Varela R.

Reglas de decisiones:

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA PARA
LA PROPORCIÓN POBLACIONAL Prof. Walter Varela R.

Ejemplo:

Se desea probar si hubo una variación en a proporción de 0,40 de mujeres


en la carrera de ingeniería. En el último examen de admisión realizado se
Selecciona una muestra de 200 ingresantes y se obtiene una proporción de
mujeres de 0,45. utilice un nivel de significancia del 1%.

Solución:

Paso 1: Planteamiento de las hipótesis


La proporción de mujeres en las carreras de ingeniería es
de 0,4

La proporción de mujeres en las carreras de ingeniería es


diferente de 0,4
𝐻𝑎: 𝑃 ≠ 0 , 4
Prof. Walter Varela Rojas
HIPÓTESIS ESTADÍSTICA PARA
LA PROPORCIÓN POBLACIONAL Prof. Walter Varela R.

Solución:

Paso 2: Nivel de significancia es 0,01


y como es de dos colas
Paso 3: Estadístico de prueba, n=200,

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA PARA
LA PROPORCIÓN POBLACIONAL Prof. Walter Varela R.

Solución:
Paso 4: Valor crítico
entonces Z=-2,575 y Z=2,575

Los valores críticos del estadístico de prueba Z son -2,575 y 2,575.


La región de rechazo es Z<-2,575 o Z>+2,575 y la zona de no
rechazo es -2,575 < Z < 2,575
Puesto que 1,45 pertenece a la zona de no rechazo [-2,575; 2,575]
no se rechaza Ho.

Paso 5: Se concluye que existe no existe evidencia de que La


proporción de mujeres en las carreras de ingeniería sea diferente
de 0,4; a un nivel de significancia del 1%
Prof. Walter Varela Rojas
HIPÓTESIS ESTADÍSTICA PARA
LA VARIANZA POBLACIONAL Prof. Walter Varela R.

Solución:
Consideremos que el carácter que estudiamos sobre la población sea una v.a.
normal cuya media y varianza son desconocidas. Vamos a contrastar la hipótesis

frente a otras hipótesis alternativas que podrán dar lugar a


contrastes bilaterales o unilaterales. La técnica consiste en
observar que el siguiente estadístico experimental que utiliza el
estimador insesgado de la varianza, posee una distribución con
n-1 grados de libertad:

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA PARA
LA VARIANZA POBLACIONAL Prof. Walter Varela R.

Contraste bilateral
 
Cuando el contraste a realizar es:

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA PARA
LA VARIANZA POBLACIONAL Prof. Walter Varela R.

Contrastes unilaterales
Para un contraste de significación al nivel α del tipo

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA PARA
LA VARIANZA POBLACIONAL Prof. Walter Varela R.

Contrastes unilaterales
Para el contraste contrario tenemos la formulación análoga:

Prof. Walter Varela Rojas


HIPÓTESIS ESTADÍSTICA PARA
LA VARIANZA POBLACIONAL Prof. Walter Varela R.

Estadísticos asociados a una muestra aleatoria simple,


procedente de una población normal

Prof. Walter Varela Rojas


EJERCICIOS
Prof. Walter Varela R.

1.- Una asociación de hosteleros rurales desea conocer la edad


media de los turistas que optan por los alojamientos rurales
durante el período veraniego. Un estudio realizado tres años
antes indicaba que esta edad se situaba en los 39 años. Sin
embargo, para planificar la campaña turística de este año, se
realiza un nuevo estudio seleccionando una muestra de 850
individuos que desean viajar durante sus vacaciones, resultando
que la edad media de los que planean pernoctar en
alojamientos rurales es de 40,7 años. Sabiendo que la
desviación típica de ese estudio fue de 4,8 años, y con un nivel
de confianza del 95%, ¿se puede concluir que la edad media de
los visitantes ha aumentado en los tres últimos años?

Prof. Walter Varela Rojas


EJRCICIOS
Prof. Walter Varela R.

2.- En la red de centros de menores de determinada región se


quiere comprobar si para determinado colectivo el promedio
de intentos de fuga por interno es mayor a 3. Se selecciona
aleatoriamente a 20 menores, obteniendo que el nº medio de
intentos es 3,5, con una deviación típica de 2,7. Para un nivel
de confianza del 99%, ¿puede considerarse que
efectivamente el promedio de intentos de fuga es mayor al
valor que se planteaba inicialmente?

Prof. Walter Varela Rojas


EJERCICIOS
Prof. Walter Varela R.

3.- En una encuesta del CIS (diciembre de 2014) se observa


que la proporción de españoles que leen semanal o
diariamente es del 45,4%, una proporción menor a la que
señalaba en 2012 la Federación de Gremios de Editores de
España (47,2%). Sabiendo que la encuesta ha sido respondida
por 2.477 individuos, ¿se puede considerar significativo este
descenso en la proporción de lectores habituales para un nivel
de significación de 0,01?

Prof. Walter Varela Rojas


EJERCICIOS
Prof. Walter Varela R.

4.- Según una encuesta sobre consumo de drogas realizada en


2021, el 9,1% de la población española había consumido
cocaína alguna vez en su vida. En un estudio realizado en 2017,
dicha proporción era del 10,3%. Suponiendo que la encuesta se
realizó a 2.200 individuos, se desea saber: a) Para un nivel de
confianza del 95% si el descenso en el consumo de cocaína es
significativo. b) ¿Cuál es y qué significa el p-valor del contraste?

Prof. Walter Varela Rojas


EJERCICIOS
Prof. Walter Varela R.

5.- En un estudio sobre consumo de drogas en la población


penitenciaria realizado en 2016 se obtuvo que el 63% de los
internos habían consumido alcohol un mes antes de ingresar
en prisión. En una nueva encuesta realizada en 2014 a 4.985
internos, 3.227 señalaron haber consumido alcohol en los 30
días previos a su ingreso. Sabiendo que la población
penitenciaria en 2014 era de 71.387 individuos, se desea
saber, con un nivel de confianza del 98% si ese porcentaje de
internos ha sufrido diferencias durante el período
considerado. Calcule el p-valor e interprete el valor obtenido.

Prof. Walter Varela Rojas


PRUEBA DE HIPÓTESIS
Prof. Walter Varela R.

tas
e g un
Pr
Gracias
Prof. Walter Varela Rojas

También podría gustarte