Está en la página 1de 29

UNIDAD VI.

PRUEBAS DE HIPÓTESIS
Es un proceso para determinar la validez de una aseveración hecha sobre la población
basándose en evidencia muestral.

Es una afirmación sobre la población, a nivel de sus parámetros:

▪ Media
▪ Varianza o desvío estándar
▪ Proporción

Debe plantearse antes de obtener la muestra.


Una prueba de hipótesis comprende cuatro componentes principales:

▪ Hipótesis Nula
▪ Hipótesis Alternativa
▪ Estadística de Prueba
▪ Región de Rechazo
La Hipótesis Nula, denotada
como H0 siempre especifica un
solo valor del parámetro de la
población si la hipótesis es
simple o un conjunto de valores
si es compuesta (es lo que
queremos desacreditar).

La Hipótesis Alternativa,
denotada como H1 es la que
responde nuestra pregunta, la
que se establece en base a la
evidencia que tenemos. Puede
tener cuatro formas:
Como las conclusiones a las que lleguemos se basan en una
muestra, hay posibilidades de que nos equivoquemos.

Dos decisiones correctas son posibles:

• Rechazar H0 cuando es falsa


• No Rechazar H0 cuando es verdadera.

Dos decisiones incorrectas son posibles:

• Rechazar H0 cuando es verdadera


• No Rechazar H0 cuando es falsa
H0 VERDADERA H0 FALSA
RECHAZAMOS H0 Error tipo I Decisión correcta
P (error tipo I) = α
NO RECHAZAMOS Decisión correcta Error tipo I
H0 P (error tipo I) = β
La Probabilidad de cometer un error
Tipo I se conoce como Nivel de
Significancia, se denota como α y es el
tamaño de la región de rechazo

El complemento de la región de
rechazo es 1 - α y es conocido como
el Coeficiente de Confianza

En una prueba de Hipótesis de dos


colas la región de no rechazo
corresponde a un intervalo de
confianza para el parámetro en cuestión
La Región de Rechazo es el conjunto
de valores tales que si la prueba
estadística cae dentro de este La región se encuentra en la
rango, decidimos rechazar la cola izquierda de la distribución
Hipótesis Nula de la estadística de prueba.

Su localización depende de la
forma de la Hipótesis Alternativa:

La región se divide en dos partes,


una parte estará en la cola derecha
de la distribución de la estadística
de prueba y la otra en la cola
La región se encuentra en la cola izquierda de la distribución de la
derecha de la distribución de la estadística de prueba.
estadística de prueba.
▪ Si rechazamos la Hipótesis Nula, concluimos que “hay suficiente evidencia
estadística para inferir que la hipótesis nula es falsa”.

▪ Si no rechazamos la Hipótesis Nula, concluimos que “no hay suficiente evidencia


estadística para inferir que la hipótesis nula es falsa”.
Con los datos observados se determina la
media de la muestra, 𝑋ത y el estadístico de
contraste Z.
Dada una población sobre la que se
observa una variable X, tal que Se sabe que el estadístico media muestral
sigue un modelo normal de media
X → N (μ, σ)
ത =μ
E (𝑋)
Se desea contrastar a un nivel de significación α
la hipótesis nula: y desviación típica

H0 = μ = μ0 σ𝑋ത = σ / 𝑛
Frente a la alternativa
El estadístico de contraste es
H0 = μ ≠ μ0

ത N (μ, σ / 𝑛) 𝓏 = 𝑋ത − 𝜇 / σ / 𝑛
𝑋→

Que sigue un modelo N (0, 1)


En general se desconoce la desviación
típica σ, de la población, por lo que suele
usarse un estimador usando los datos de la
muestra.

Para tamaños de muestra n ≥ 30 se puede


tomar la cuasi-desviación típica de la muestra,
s = 𝑠2, en sustitución del parámetro σ del
estadístico de contraste 𝓏, que se aproxima a
una N (0, 1).

𝓏= 𝑋ത − 𝜇 / s / 𝑛

N (0, 1)

𝑋ത = σ 𝑥𝑖𝑛𝑖 / N

s2 = σ 𝑥𝑖 − 𝑋ത 2 ni / N – 1
Contraste de hipótesis para la media

1. Un auditor desea contrastar a un nivel de significación de 0.05 la hipótesis


nula de que la media de las deudas por cobrar de una empresa es de
150,000 euros. Para ello se selecciona una muestra al azar de 50 de dichas
deudas con un valor medio y cuasi-desviación típica muestrales 189,000 y
de 80,000, respectivamente. Compruebe si se rechaza o acepta dicha
hipótesis

H0: μ = 150, 000

H1: μ ≠ 150, 000


SOLUCIÓN
Para α = 0.05 los límites de confianza en la normal estandarizada son ± 1.96.

Se determinar el estadístico de contraste Z con el estadístico muestral


transformándolo en un valor Z, usando la media de la muestra y la desviación típica
muestral, y se observa si cae en la zona de rechazo.

𝑋ത − 𝜇
z= 𝑠
𝑛

Sigue un modelo N (0, 1), dado que el tamaño de muestra es mayor que 30.

Sustituyendo en la fórmula:

𝓏= 189,000 – 150,000 = 3.447


80,000 / 50
Debido a que el valor Z= 3.447,
cae en zona de rechazo, fuera de
los límites (-1.96, 1.96).

Otra forma equivalente de


decisión es :

Si el p – valor es inferior al nivel


de significación 0.05.

p – valor < α → RECHAZO


Utilizando las tablas t de
p – valor > α → ACEPTO
Student, el valor es menor que
0.05. Por lo tanto, se rechaza
p – valor = P (|Z|) > 3.45) =
H0.
0.00056
El valor que se obtuvo es 3.447, se busca
este valor en la tabla t Student. El valor es
aproximado.

Este resultado se encuentra en la columna


de 0.01.

Como el valor se encuentra en 0.01,


entonces se rechaza H0.
Contraste de hipótesis para la media

2. Un fabricante arma que la vida media de un componente electrónico


supera las 1500 horas. Se selecciona una muestra de 900 componentes de la
producción para establecer un control de calidad, obteniéndose los
siguientes resultados. Media y cuasi-varianza muestrales iguales a 𝑋ത = 1450
y s2 = 650, respectivamente.

H0: μ > 1,500

H1: μ < 1,500


SOLUCIÓN
Para α = 0.05 los límites de confianza en la normal estandarizada son ± 1.96.

Se determinar el estadístico de contraste Z con el estadístico muestral


transformándolo en un valor Z, usando la media de la muestra y la desviación típica
muestral, y se observa si cae en la zona de rechazo.

𝓏= 𝑋ത − 𝜇 / s / 𝑛

Sigue un modelo N (0, 1), dado que el tamaño de muestra es mayor que 30.

Sustituyendo en la fórmula:

𝓏= 1,450 – 1,500 = -2.31


650 / 900
Debido a que el valor Z= -2.31,
cae en zona de rechazo, fuera de
los límites (-1.96, 1.96).

Otra forma equivalente de


decisión es :

Si el p – valor es inferior al nivel


de significación 0.05.

p – valor < α → RECHAZO


Utilizando las tablas t de
p – valor > α → ACEPTO
Student, el valor es menor que
0.05. Por lo tanto, se rechaza H0.
p – valor = P (|Z|) < -2.31) = 0.01
El valor que se obtuvo es -2.31, se busca
este valor en la tabla t Student. El valor es
aproximado.

Este resultado se encuentra en la columna


de 0.05.

Como el valor se encuentra en 0.05,


entonces se rechaza H0.
Contraste de hipótesis para la media

3. Se piensa que el tiempo medio que esta en paro un tipo de profesional de


un determinado sector es de 13.5 meses. Para contrastar esta hipótesis al
nivel α = 0.05 frente a la alternativa (que no es cierto) se tomó una muestra de 45
profesionales que estuvieron en paro en ese sector y se obtuvo una media de 17.2
meses y una cuasi-desviación típica de 15.3 meses

H0: μ = 13.5

H1: μ ≠ 13.5
SOLUCIÓN
Para α = 0.05 los límites de confianza en la normal estandarizada son ± 1.96.

Se determinar el estadístico de contraste Z con el estadístico muestral


transformándolo en un valor Z, usando la media de la muestra y la desviación típica
muestral, y se observa si cae en la zona de rechazo.

𝓏= 𝑋ത − 𝜇 / s / 𝑛

Sigue un modelo N (0, 1), dado que el tamaño de muestra es mayor que 30.

Sustituyendo en la fórmula:

𝓏= 17.2 – 13.5 = 1.62


15.3 / 45
Debido a que el valor Z= 1.62,
cae en zona de aceptación,
dentro de los límites (-1.96,
1.96).

Otra forma equivalente de


decisión es :

Si el p – valor es inferior al nivel


de significación 0.05.

p – valor < α → RECHAZO Utilizando las tablas t de


p – valor > α → ACEPTO Student, el valor es mayor que
0.05. Por lo tanto se acepta H0.
p – valor = P (|Z|) > 1.62) = 0.1
El valor que se obtuvo es 1.62, se busca este
valor en la tabla t Student. El valor es
aproximado.

Este resultado se encuentra en la columna


de 0.20.

Como el valor se encuentra en 0.2, entonces


se acepta H0.
Contraste de hipótesis para la proporción

1. En una muestra de 250 personas en edad laboral de una zona


determinada se encuentra que el 14% esta en paro. Los datos recogidos del
INE para el año anterior fueron de una tasa de paro del 10 %. ¿Puede
asumirse la hipótesis de estabilidad de la tasa de paro?. Contraste la
hipótesis de mantenimiento de la tasa en el 10 %, dada por la
Administración a un nivel del 5%.

H0: = 0.1

H1: ≠ 0.1
SOLUCIÓN
α = 0.05. La hipótesis alternativa define dos zonas de rechazo.

Para α/2 = 0.05/2 = 0.025, los límites de confianza en la normal estandarizada


son ± 1.96.

Se determina el estadístico de contraste Z con los datos de la muestra y se


observa si cae o no en la zona de rechazo. El estadístico muestral

𝓏= Up – p / p (1 – p) / 𝑛

Sigue un modelo N (0, 1), dado que el tamaño de muestra (n= 250) es grande.

Sustituyendo en la fórmula:

𝓏= 0.14 – 0.1 = 7.027


0.1 (0.9) / 250
Debido a que el valor Z= 7.027,
cae en zona de rechazo, fuera
de los límites (-1.96, 1.96).

Otra forma equivalente de


decisión es :

Si el p – valor es inferior al
nivel de significación 0.05.

p – valor < α → RECHAZO


Utilizando las tablas t de
p – valor > α → ACEPTO
Student, el valor es menor que
0.05. Por lo tanto se rechaza H0.
p – valor = P (|Z|) > 7.03) = 0
El valor que se obtuvo es 7.03, se busca este
valor en la tabla t Student. El valor es
aproximado.

Este resultado se encuentra en la columna


de 0.01.

Como el valor se encuentra en 0.01,


entonces se rechaza H0.

También podría gustarte