Está en la página 1de 44

TEMA 6

Contrastes de Hipótesis

6.1 Conceptos básicos: tipos de hipótesis, región crítica y región de


aceptación, tipos de errores, potencia del contraste.
6.2 Metodología del contraste de hipótesis.
6.3 Algunos contrastes.
De los 3 problemas presentados que resolvía la INFERENCIA ESTADÍSTICA, una
vez obtenida la información muestral hemos resuelto los dos primeros que
permitían ESTIMAR los valores desconocidos (parámetros, características,…)
tanto PUNTUALMENTE como POR INTERVALO DE CONFIANZA.

El tercer problema trataba de responder preguntas concretas sobre la


población (hipótesis) y sobre las que tomaremos decisiones sobre su posible
veracidad (por ejemplo, ¿será la media superior a 20?). A este campo le
denominamos genéricamente PRUEBAS o TEST o CONTRASTES DE HIPÓTESIS.

CONTRASTAR UNA HIPÓTESIS significa decidir si la afirmación que realizamos está


apoyada por la evidencia empírica recogida a través de una muestra.
En la práctica compararemos la afirmación con la afirmación contraria (o su negación) y
habrá que establecer una regla de decisión basada en la muestra y su realización
muestral.
6.1 Conceptos básicos: tipos de
hipótesis, región crítica y región
de aceptación, tipos de errores,
potencia del contraste.
Una HIPÓTESIS ESTADÍSTICA (H) es una afirmación sobre alguna
característica desconocida de la población de interés.

En general, se realizan sobre los parámetros de la población (media, varianza,…) y se


denominan HIPÓTESIS PARAMÉTRICAS. Se clasifican en:
• Hipótesis SIMPLE si asigna un único valor al parámetro (H: μ=5, H: σ=4,…)
• Hipótesis COMPUESTA si asigna un rango de valores al parámetro (μ>5, 2<σ<4,
μ≠3,…)
• BILATERALES o DE DOS COLAS: H: μ ≠ 10 (equivale a H: μ < 10 y μ > 10)
• UNILATERALES o DE UNA COLA: H: μ >10, H: μ < 5

Otros casos más generales que no se focalizan en los parámetros de la población


se denominan HIPÓTESIS NO PARAMÉTRICAS (H: X es Normal, H: X e Y son
independientes, H: la muestra es aleatoria, …).

Nota: En este curso estudiaremos fundamentalmente la resolución de hipótesis paramétricas .


Para CONTRASTAR LA HIPÓTESIS de interés y decidir si la información disponible
(muestra) apoya esta afirmación. Intuitivamente deberemos tener en cuenta que si rechazamos
o no damos por válida esta afirmación, asumiremos como correcta la afirmación contraria. De ahí
que denominemos
• HIPOTESIS NULA (H0) a la hipótesis de interés del investigador que
deseamos contrastar
• HIPOTESIS ALTERNATIVA (H1) a la contraria o complementaria a la nula.
De esta forma un contraste queda planteado como:
𝐇 : 𝛍=𝟓 𝐇𝟎 : 𝛍 ≤ 𝟓
ቊ 𝟎 ቊ
𝐇𝟏 : 𝛍 ≠ 𝟓 𝐇𝟏 : 𝛍 > 𝟓

Nota: La hipótesis nula suele siempre incluir la igualdad y es la hipótesis que mantendremos a no
ser que los datos indiquen su falsedad (evidencias suficientes).

Por ejemplo, si nos planteamos como interés saber si “hay la misma proporción de fallos en
un proceso productivo que de aciertos” (H0: p = 0,5) tomaremos la decisión de aceptar o
rechazar en base a la información de nuestra muestra. Cuando esta evidencia muestral
difiera mucho de la hipótesis, rechazaremos la hipótesis planteada. Por ejemplo, si en
nuestra muestra la proporción muestral de fallos es muy distinta de la proporción teórica
de errores. Consecuentemente estaremos aceptando que es diferente (H1: p ≠ 0,5)
El proceso de decisión consistirá en determinar si la información muestral (datos) ha
proporcionado evidencias para rechazar la hipótesis nula. En ese sentido debemos
entender que la hipótesis nula o de interés de alguna forma es la que hemos supuesto
como correcta y no debería ser realmente probada, de ahí que su aceptación no implica
necesariamente que sea correcta sino que la evidencia empírica no ha proporcionado
datos suficientes como para rechazarla.

Es casi equivalente al Principio de Presunción de Inocencia en los juicios (“Inocente


hasta que se demuestre lo contrario”) que sería la hipótesis nula del juicio. Aunque
se acepte la inocencia no significa que se tenga la certeza absoluta de ella, sino que
las pruebas no son suficientes para rechazar esta presunción de inocencia.

En un abuso del lenguaje de decisión en la terminología asociada a los contrastes


solemos indicar ”aceptar la hipótesis nula” aunque realmente se debería referir como
”no rechazar la hipótesis nula”. En caso de no aceptarla será porque hay evidencias o
pruebas significativas a partir de la muestra que apoyan la alternativa. Igualmente
diremos que la “hipótesis alternativa se acepta” o que “no se acepta la hipótesis
alternativa”.
En el proceso de decisión podemos cometer dos tipos de errores ya que tomamos
decisiones en una situación de incertidumbre:
Realidad
H0 cierta H0 falsa
Aceptar H0 Correcto Error tipo II
Decisión
Rechazar H0 Error tipo I Correcto

Se denomina ERROR TIPO I al que cometemos cuando rechazamos la hipótesis nula,


siendo cierta y ERROR TIPO II al que cometemos cuando aceptamos la hipótesis nula,
siendo falsa. Dado que siempre pueden existir, se acotan para que sean lo menores posibles.
Además no pueden cometerse simultáneamente pues corresponden a situaciones de la realidad
distintas. Denotaremos por α y β a estas probabilidades respectivamente.

• NIVEL DE SIGNIFICACIÓN es la probabilidad de cometer un error de tipo I


α = p(Rechazar H0 / H0 es cierta) = p(Error de tipo I)
• POTENCIA a la probabilidad de detectar que una hipótesis es falsa.
1-β = p(Rechazar H0 / H0 es falsa) = 1 - p(Error de tipo II)
Si reescribimos la tabla anterior con sus probabilidades queda como:
Realidad Nivel de confianza
H0 cierta H0 falsa
Correcto Error tipo II
Aceptar H0
(1-α) (β)
Decisión
Error tipo I Correcto
Rechazar H0
(α) (1-β )
Potencia
Nivel de significación
La solución ideal consistiría en minimizar los dos errores simultáneamente (hacerlos lo más pequeños
posible). Sin embargo, esto no es factible pues son dependientes y minimizar uno aumenta el otro.
Como el error tipo I es más grave (al ser la hipótesis nula la de interés) lo que se hace es acotar el
nivel de significación tolerable, es decir, el máximo error tipo I que se puede admitir y construir a
partir de esta asignación, un criterio de decisión que minimice el error tipo II (o maximice la potencia
del contraste).
Realidad Es más grave este error si suponemos
la presunción de inocencia, de ahí que
Inocente Culpable se acote. La rechazaremos si las
Inocente Correcto Error tipo II pruebas son muy relevantes, más allá
Decisión de cualquier duda razonable.
Culpable Error tipo I Correcto
6.2 Metodología del
contraste de hipótesis
La metodología que emplearemos se basa en el Lema de Neyman-Pearson que queda fuera del
objetivo del curso. Al aplicarla, fijado un nivel α de significación o error tipo I y maximizando
la potencia, se establece una regla basada en un ESTADÍSTICO DE CONTRASTE que
consigue una división en dos regiones del conjunto de valores de este estadístico de
contraste: la REGIÓN DE RECHAZO o REGIÓN CRÍTICA que tiene probabilidad α y la
REGIÓN DE ACEPTACIÓN que tiene probabilidad 1-α (ambas bajo H0, es decir, supuesto que H0
es verdadera que es la hipótesis de interés).

Esto permite disponer de una regla de decisión:


a) Si el valor del estadístico de contraste cae en la región de aceptación, no
existen razones suficientes para rechazar la hipótesis nula con ese nivel de
significación. Diremos que EL CONTRASTE NO ES ESTADÍSTICAMENTE
SIGNIFICATIVO o que ES ESTADÍSTICAMENTE NO SIGNIFICATIVO. Es decir, no
existe evidencia a favor de H1, la hipótesis alternativa. Consecuentemente no
rechazaremos la hipótesis nula.
b) Si el valor del estadístico cae en la región de rechazo, los datos no son
compatibles con H0 y la “rechazamos”. Decimos que EL CONTRASTE ES
ESTADÍSTICAMENTE SIGNIFICATIVO. Es decir, que existen evidencias
estadísticamente significativas a favor de H1. Consecuentemente
”rechazaremos” o no aceptaremos la hipótesis nula.
De forma resumida, podemos establecer las siguientes etapas en la resolución de un
contraste de hipótesis:

1. Especificar las hipótesis nula H0 y alternativa H1


2. Elegir un estadístico de contraste apropiado basado en la muestra aleatoria que
es una medida de discrepancia entre la hipótesis H0 y la muestra.
3. Fijar el nivel de significación α que muestre cómo es de importante cometer un error
tipo I (rechazar H0 cuando realmente sea es cierta)
4. Construir las regiones de aceptación y rechazo o crítica para el contraste
5. Evaluar el estadístico de contraste a partir de la realización muestral
6. Decidir si el contraste es estadísticamente significativo (no aceptamos H0) o no
al nivel de significación prefijado según el valor del estadístico de contraste se
encuentre en la región de rechazo o no, respectivamente.

Nota: El nivel de significación α (error tipo I) que se prefija es normalmente bajo: 1%, 5%, 10%

Veremos la resolución de un contraste de forma resumida a modo de ejemplo aunque después


presentaremos las tablas resumen para su realización y alguna alternativa a parte de este proceso.
Ejemplo: La gerencia de una empresa tiene interés en determinar si el tiempo
medio necesario para producir un producto sigue siendo de 10 minutos como
en el pasado que es el idóneo. Considera además que menos de 10 minutos
para la producción es imposible por el tipo de proceso de fabricación. El
objetivo es decidir si es necesario revisar el proceso productivo, y hacer los
ajustes pertinentes si el tiempo fuese superior a los 10 minutos.

1. Especificar las hipótesis nula y alternativa:


¿ H0: μ = 10 o H0: μ ≤ 10 o H0: μ > 10 o H0: μ ≠ 10 o ... ?
¿ H1: μ = 10 o H1: μ ≥ 10 o H1: μ > 10 o H1: μ ≠ 10 o … ?

𝐇𝟎 : 𝛍 = 𝟏𝟎

𝐇𝟏 : 𝛍 > 𝟏𝟎
2. Elección del estadístico de contraste.
Nuestro contraste se interesa por la media de la población, y parece natural
basarse en un estimador adecuado de la media. Sabemos que un buen estimador
ഥ por lo que nuestro estadístico de contraste se basará
de ella es la media muestral X
en este estimador.
3. Fijaremos el nivel de significación α o probabilidad del error tipo I. A modo de
ejemplo podemos tomar α=0,05 (5%).

4. Construir las regiones de aceptación y rechazo a partir del estadístico de


contraste.
¿Como actuaríamos intuitivamente para deseamos resolver el contraste?
𝐇𝟎 : 𝛍 = 𝟏𝟎

𝐇𝟏 : 𝛍 > 𝟏𝟎
▪ Realizaríamos experimentación, obtendríamos una muestra y
calcularíamos el valor de la media muestral X ഥ. Si el valor de X
ഥ en nuestra
realización muestral fuese muy superior a 10, no aceptaríamos la hipótesis
nula H0 : μ = 10 y en caso contrario sí la aceptaríamos.

Esto ya es una regla de decisión. La cuestión es desde qué valor


consideramos muy superior a 10 nuestra realización muestral.
ഥ que
Para determinar este valor nos basamos en la distribución del estimador X
empleamos.
Sabemos de los resultados vistos, que si la desviación típica es desconocida,
ഥ sigue una distribución normal si n es grande:
entonces 𝐗
ഥ ≈ 𝐍 𝛍, 𝐒𝐜 si n grande
𝐗
𝐧

𝐗
Bajo la hipótesis nula H0, X ഥ sigue una
distribución normal centrada en μ=10 y 𝐒𝐜
ഥ ≈ 𝐍 𝟏𝟎,
𝐗
𝐧
hemos señalado que no la aceptamos si la
media obtenida es muy superior a 10 (μ>>10)
μ=10
Esta regla de regla de decisión intuitiva parte esta distribución en dos zonas. A partir
de un determinado valor crítico A no aceptaremos y por debajo de él sí aceptaremos
H0 . ഥ
𝐗
Región de Rechazo o Crítica
Región de Aceptación ഥ ≫ 𝟏𝟎
𝐗

Tamaño de esta región = α

La obtención del valor crítico A se hace a partir de la distribución del estadístico (en
este caso normal) de forma que la región de rechazo tenga el tamaño (probabilidad de
error tipo I = α).
Si la hipótesis nula H0 es cierta, para una muestra grande, 𝐇 : 𝛍 = 𝟏𝟎
ቊ 𝟎
𝐒𝐜 ഥ − 𝟏𝟎
𝐗 𝐇𝟏 : 𝛍 > 𝟏𝟎
ഥ ≈ 𝐍 𝟏𝟎,
𝐗 o ≈ 𝐍 𝟎, 𝟏
𝐧 𝐒𝐜 ഥ ≈ 𝐍 𝛍, 𝐒𝐜 si n grande
𝐗
𝐧 𝐧

Así, seleccionaremos el valor A tal que


ഥ − 𝟏𝟎
𝐗 Que es la probabilidad de cometer un error de tipo I o Nivel de
𝛂=𝐏 >𝐀
𝐒𝐜 Significación,
𝐧 α = P(Rechazar H0 / H0 es cierta)

De esa forma quedan conformadas las regiones correspondientes a la regla de decisión

Región de RECHAZO o CRÍTICA


Región de ACEPTACIÓN
(A,+∞)
(-∞,A]
1-α α
A
5. Evaluar el estadístico de contraste a partir de la realización muestral
6. Decidir si el contraste es estadísticamente significativo (no aceptamos H0) o no
según el estadístico esté en la región de aceptación o la crítica.
Nota: Cuando se clasificaron las hipótesis compuestas se subdividieron en bilaterales y
unilaterales o también denominadas de dos colas o de una cola respectivamente. El
motivo de esta denominación puede venir explicado en función de la estructura de la
región crítica o de rechazo.

El estadístico tomará
𝐇 : 𝛍 = 𝟏𝟎
ቊ 𝟎 valores en la cola derecha
𝐇𝟏 : 𝛍 > 𝟏𝟎 si es cierta la alternativa
Región de Aceptación Región de Rechazo

El estadístico tomará
𝐇𝟎 : 𝛍 = 𝟏𝟎 valores en la cola
ቊ izquierda si es cierta la
𝐇𝟏 : 𝛍 < 𝟏𝟎
alternativa
Región de Rechazo Región de Aceptación

El estadístico tomará
valores en la cola derecha
𝐇𝟎 : 𝛍 = 𝟏𝟎
ቊ o izquierda si es cierta la
𝐇𝟏 : 𝛍 ≠ 𝟏𝟎 alternativa
Región de Rechazo Región de Aceptación Región de Rechazo

p(Región de Rechazo)=α p(Región de Aceptación)=1-α


Nota: El nivel de significación es prefijado por el investigador y en base a este valor, se
establecen las regiones de aceptación y rechazo con probabilidades respectivas 1-α y α. Lo que nos
indica es que si analizásemos todas las realizaciones muestrales posibles, en el caso de
que H0 fuese verdadera, un (1-α)% de ellas llevarían el valor del estadístico de contraste
a la región de aceptación y un α% a la región de rechazo. Es decir, si H0 es verdadera
solo un α% de las realizaciones muestrales nos llevarían a rechazar la hipótesis siendo
verdadera (error tipo I) y un (1-α)% de ellas nos llevarían a aceptar correctamente la
hipótesis nula. Ejemplo: α=0.05 indica que, si realizásemos el 100% de los muestras posibles,
solamente un 5% de ellos nos llevarían a rechazar H0 siendo cierta y un 95% de
ellas llevarían a aceptar H0 siendo cierta.

Nota: El resultado de un contraste depende del valor de la significación y podríamos


rechazar a un nivel del 10% y no rechazar a un nivel del 5%.

Región de Aceptación
Región de Rechazo

10%

5% Valor del estadístico de contraste


Nota: El desarrollo teórico del enfoque presentado se basa en los resultados de Neyman-Pearson pues no solo se
acota el error tipo I sino que se maximiza la potencia del contraste (no cometer error tipo II). Como no son
independientes, este enfoque conduce al denominado test más potente, el que maximiza la potencia fijada la
significación que es el error tipo I dispuestos a tolerar. En este sentido la potencia puede entenderse como la
capacidad que tiene un contraste para detectar la hipótesis alternativa. Existen otras alternativas para resolver los
contrastes como la metodología de Razón de Verosimilitudes que compara las funciones de verosimilitud bajo las
hipótesis nula y alternativa.

Ejemplo: La gerencia de una empresa tiene interés en determinar si el tiempo medio


necesario para producir un producto sigue siendo de 10 minutos como en el pasado que
es el idóneo. Considera además que menos de 10 minutos para la producción es
imposible por el tipo de proceso de fabricación. El objetivo es decidir si es necesario
revisar el proceso productivo, y hacer los ajustes pertinentes si el tiempo fuese superior
a los 10 minutos.
Se obtuvo una muestra aleatoria simple durante un día de 20 artículos y se midió el
tiempo de producción resultando que la media muestral fue de 12 minutos y la
cuasivarianza muestral de 4. Admitiendo que el tiempo de producción sigue un
comportamiento normal, decidir si se debe ajustar el proceso productivo con un 5% de
significación.

𝐇𝟎 : 𝛍 = 𝟏𝟎
ቊ 𝛂 = 𝟎. 𝟎𝟓 𝟓% significación
𝐇𝟏 : 𝛍 > 𝟏𝟎
Etapas en la resolución de un contraste de hipótesis:
1. Especificar las hipótesis nula H0 y alternativa H1
2. Elegir un estadístico de contraste apropiado basado en la muestra aleatoria
3. Fijar el nivel de significación α
4. Construir las regiones de aceptación y rechazo o crítica para el contraste
5. Evaluar el estadístico de contraste a partir de la realización muestral
6. Decidir si el contraste es estadísticamente significativo (no aceptamos H0) o no al
nivel de significación prefijado.

𝐇𝟎 : 𝛍 = 𝟏𝟎
X tiempo de producción ቊ 𝛂 = 𝟎. 𝟎𝟓 𝟓% significación
𝐇𝟏 : 𝛍 > 𝟏𝟎

Contexto de trabajo: Contraste sobre la media …el tiempo de producción sigue


X→ N(µ,σ) un comportamiento normal

σ desconocida

Contraste para la media poblacional de una población normal con


varianza poblacional desconocida
Contraste para la media poblacional con varianza poblacional desconocida
Poblaciones normales

Hipótesis nula Valor del estadístico de contraste bajo H0


𝐱ത − 𝛍𝟎
Estadístico de contraste H0: μ=μ0 𝐭𝟎 =
𝐒𝐜 / 𝐧
𝐱ത − 𝛍
≈ 𝐭 𝐧−𝟏 Hipótesis alternativa Criterios de rechazo
𝐒𝐜
𝐧 H1: μ≠μ0 Rechazar H0 si t 0 ≤ −t n−1,α/2 o t 0 ≥ t n−1,α/2
H1: μ>μ0 Rechazar H0 si 𝐭 𝟎 ≥ 𝐭 𝐧−𝟏,𝛂
H1: μ<μ0 Rechazar H0 si t 0 ≤ −t n−1,α

𝐭 𝐧−𝟏 = 𝐭 𝟏𝟗
𝛂 = 𝟎. 𝟎𝟓
𝐇𝟎 : 𝛍 = 𝟏𝟎

𝐇𝟏 : 𝛍 > 𝟏𝟎
Región de Aceptación Región de Rechazo

n=20 muestra aleatoria simple… de 20 artículos…


la media muestral fue de 12 minutos… la
DATOS 𝐱ത = 𝟏𝟐 𝐦𝐢𝐧 cuasivarianza muestral de 4.
𝐒𝐜𝟐 = 𝟒 𝐦𝐢𝐧
Hipótesis nula Valor del estadístico de contraste bajo H0
Estadístico de contraste 𝐱ത − 𝛍𝟎
𝐱ത − 𝛍 H0: μ=μ0 𝐭𝟎 =
≈ 𝐭 𝐧−𝟏 𝐒𝐜 / 𝐧
𝐒𝐜
Hipótesis alternativa Criterios de rechazo
𝐧
H1: μ>μ0 Rechazar H0 si 𝐭 𝟎 ≥ 𝐭 𝐧−𝟏,𝛂

4. Construir las regiones de aceptación y rechazo o crítica para el contraste


𝐭 𝟏𝟗
𝛂 = 𝟎. 𝟎𝟓
𝐇𝟎 : 𝛍 = 𝟏𝟎

𝐇𝟏 : 𝛍 > 𝟏𝟎
Región de Aceptación Región de Rechazo
𝐭 𝟏𝟗,𝟎.𝟎𝟓 = 𝟏. 𝟕𝟐𝟗 Punto Crítico

5. Evaluar el estadístico de contraste a partir de la realización muestral


𝐱ത − 𝛍𝟎 𝟏𝟐 − 𝟏𝟎
𝐭𝟎 = = = 𝟒, 𝟒𝟕𝟐𝟏
𝐒𝐜 / 𝐧 𝟐
𝟐𝟎
6. Decidir si el contraste es estadísticamente significativo (no aceptamos H0) o no.

El estadístico cae en la región de rechazo por lo que…


También podríamos decir que el test o el contraste ha resultado significativo…
Región de Rechazo Región de Aceptación

5% El rechazo es “más claro” en la


Valor del estadístico de contraste gráfica inferior porque el
estadístico de contraste se
encuentra “más evidentemente”
en la región de rechazo
Región de Rechazo Región de Aceptación

No sabemos realmente si el
5% rechazo es más o menos claro
Valor del estadístico de contraste
porque la metodología expuesta
no indica cuán cerca o lejos está
el estadístico de contraste del
valor crítico (esto depende de la
distribución del estadístico de
contraste bajo la hipótesis nula)

5% Valor del estadístico de contraste

Esta idea permite resolver el contraste de una forma distinta…


Un enfoque alternativo para la resolución (muy habitual en las salidas informáticas) es la
presentación del denominado NIVEL CRÍTICO o p-VALOR. Es una probabilidad que
representa el máximo nivel de significación al que podríamos aceptar la hipótesis nula H0
para la realización muestral disponible; es decir, la probabilidad de obtener una
discrepancia mayor que la observada con la realización muestral cuando H0 es cierta.
▪ La discrepancia entre la muestra observada y la hipótesis nula H0 es el valor del
estadístico de contraste evaluado bajo H0
▪ El p-valor mide la probabilidad de obtener discrepancias mayores y así… cuanto
menor sea el p-valor, menos factible es haber observado esa discrepancia o mayor
entre la muestra y H0. Consecuentemente menos coherencia existe entre la
realización muestral y la hipótesis nula, y más incompatibles serán. En resumen:

p-valor pequeño → alejadas la muestra y H0 Rechazo H0


p-valor grande → cerca la muestra y H0 Acepto H0

Nota: Cuanto menor sea el p-valor más seguridad tenemos a la hora de rechazar H0 . Un p-valor grande nos da
más seguridad a la hora de aceptar H0
Nota: Es el nivel de significación que deja al estadístico en el “borde” de la región de rechazo, el mínimo valor de
la significación que lleva a rechazar la hipótesis nula
Esto permite concluir en un contraste fijadas unas condiciones de investigación
(significación) entendiendo el p-valor como el mínimo nivel de significación al que
aceptaríamos la hipótesis nula… p-valor pequeño → alejadas la muestra y H 0
p-valor grande → cerca la muestra y H0

Para un nivel de significación α prefijado de interés:


p-valor < α → no aceptamos H0
p-valor > α → aceptamos H0

Región de Rechazo Región de Aceptación

p-valor
Valor del estadístico de contraste
α

Nota: En la práctica científica se suele considerar que si el p-valor es inferior a 0,01 se rechaza la
hipótesis nula, un p-valor superior a 0,1 indica que se acepta la hipótesis nula y los casos en los que
0,01<p-valor<0,1 no son determinantes.
El p-valor indica la probabilidad de que el estadístico esté justo en el límite del área de
rechazo. En su cálculo debe tenerse en cuenta la estructura de la región crítica o de
rechazo.

𝐇 : 𝛍 = 𝟏𝟎 Probabilidad de que el
ቊ 𝟎 p-valor
estadístico tome valores
𝐇𝟏 : 𝛍 > 𝟏𝟎 superiores al observado

Valor del estadístico


𝐇𝟎 : 𝛍 = 𝟏𝟎 Probabilidad de que el
ቊ p-valor estadístico tome valores
𝐇𝟏 : 𝛍 < 𝟏𝟎
inferiores al observado

Valor del estadístico


Probabilidad de que el
𝐇 : 𝛍 = 𝟏𝟎
ቊ 𝟎 p-valor p-valor
estadístico tome valores
𝐇𝟏 : 𝛍 ≠ 𝟏𝟎 más extremos que el
observado

Valor del estadístico Valor del estadístico


Ejemplo: La gerencia de una empresa….
𝐇 : 𝛍 = 𝟏𝟎
ቊ 𝟎 𝛂 = 𝟎. 𝟎𝟓 𝟓% significación
𝐇𝟏 : 𝛍 > 𝟏𝟎 Rechazáramos H0
DATOS: n=20 𝐱ത = 𝟏𝟐 𝐦𝐢𝐧 𝐒𝐜𝟐 = 𝟒 𝐦𝐢𝐧

𝐱ത − 𝛍𝟎
𝐭 𝟏𝟗 𝐭𝟎 = = 𝟒, 𝟒𝟕𝟐𝟏
𝐒𝐜 / 𝐧

p-valor 𝐩 − 𝐯𝐚𝐥𝐨𝐫 ≡ 𝐩(𝐭 𝐧−𝟏 ≥ 𝐭 𝟎 ) =


= p t19 ≥ 4,4721 = 0,000130607
Valor del estadístico
Ordenador

Para un nivel de significación α prefijado: Rechazamos H0


p-valor < α → no aceptamos H0 Rechazo “claro”… estadístico de
contraste se encuentra “muy
p-valor > α → aceptamos H0 claramente” en la región de rechazo
El test es significativo…

Nota: En las tablas no siempre tenemos el p-valor pero podemos acotarlo. Por ejemplo, en este caso
𝑝 𝑡19 ≥ 4.4721 ≤ 0.0005 puesto que 𝑝 𝑡19 ≥ 3.883 = 0.0005
• En los contrastes, debemos tener en cuenta siempre que la hipótesis nula es la que
admitimos como válida y que cuando rechazamos la hipótesis nula en base a una
realización muestral, es porque, a un nivel de significación prefijado, esta realización
muestral ha aportado evidencias significativas de que esa hipótesis no es cierta.
Estas evidencias significativas nos indican que si la hipótesis fuera cierta a ese nivel
de significación, la probabilidad de que el resultado de la realización muestral
discrepara tanto de ella sería tan pequeña como el nivel de significación. Por el
contrario, si aceptamos la hipótesis nula no es porque no dispongamos de pruebas
o evidencias a su favor, sino, más bien, porque no las tenemos en su contra.

• El p-valor es una herramienta útil en la resolución de los contrastes, en su uso deben


tenerse en cuenta los criterios de significación habituales en la práctica científica

En la resolución de un contraste, se debe tener siempre presente el tipo de


hipótesis alternativa para la obtención de:
• la estructura de la región de aceptación y de rechazo o
• el p-valor correspondiente.
6.3 Algunos Contrastes
Nos limitaremos a los contrastes sobre la media, varianza y proporción de los que
hemos resuelto la problemática de su estimación en temas anteriores para una
muestra y dos muestras.

En el caso de una muestra estudiaremos los contrastes que tienen una hipótesis
nula simple del tipo: H0: θ=θ0 , H0: θ≤θ0 y H0: θ≥θ0 siendo θ el parámetro de
interés y θ0 el valor que suponemos como válido para el mismo.

Para realizarlos emplearemos como estimadores los vistos para cada situación de
análisis y las distribuciones muestrales de ellos bajo la hipótesis nula.

En la resolución, se debe tener siempre presente el tipo de hipótesis


alternativa para la obtención de:
• la estructura de la región de aceptación y de rechazo
o
• el p-valor correspondiente.
Contraste para la media poblacional con varianza
poblacional conocida
Poblaciones normales y Poblaciones no normales (muestras grandes)

𝐱ത − 𝛍
Estadístico de contraste: 𝛔 ≈ 𝐍(𝟎, 𝟏)
𝐧
Hipótesis nula Valor del estadístico de contraste bajo H0
xത − μ0
H0: μ=μ0 Z0 =
σ/ n
Hipótesis alternativa Criterios de rechazo
H1: μ≠μ0 Rechazar H0 si Z0 ≤ −zα/2 o Z0 ≥ zα/2
H1: μ>μ0 Rechazar H0 si Z0 ≥ zα
H1: μ<μ0 Rechazar H0 si Z0 ≤ −zα
Contraste para la media poblacional con varianza
poblacional conocida
Poblaciones normales y Poblaciones no normales (muestras grandes)

Hipótesis nula Valor del estadístico de contraste bajo H0


xത − μ0
H0: μ=μ0 Z0 =
σ/ n
Hipótesis alternativa p-valor
H1: μ≠μ0 xത −μ0
2p Z ≥ σ = 2p(Z ≥ Z0 )
n

H1: μ>μ0 xത −μ0


p Z≥ σ = p(Z ≥ Z0 )
n

H1: μ<μ0 xത −μ0


p Z≤ σ = p(Z ≤ Z0 )
n
Contraste para la varianza poblacional con media
poblacional desconocida
Poblaciones normales
𝟐 σ(𝐱 𝐢 − 𝐱ത )𝟐
Estadístico de contraste: (𝐧 − 𝟏)𝐒𝐜 ≈ 𝛘𝟐𝐧−𝟏 𝐒𝐜𝟐 =
𝐧−𝟏
𝛔𝟐
Hipótesis nula Valor del estadístico de contraste bajo H0
(n − 1)Sc2
H0: 𝜎2 = 𝜎02 χ20 =
σ20
Hipótesis alternativa Criterios de rechazo
H1: 𝜎 2 ≠ 𝜎02 Rechazar H0 si χ20 ≤ χ2n−1,α/2 o χ20 ≤ χ2n−1,1−α/2
H1: 𝜎 2 > 𝜎02 Rechazar H0 si χ20 ≥ χ2n−1,α
H1: 𝜎 2 < 𝜎02 Rechazar H0 si χ20 ≤ χ2n−1,1−α
Contraste para la varianza poblacional con media
poblacional desconocida
Poblaciones normales

Hipótesis nula Valor del estadístico de contraste bajo H0


(n − 1)Sc2
2
H0: 𝜎 = 𝜎02 χ20 =
σ20
Hipótesis alternativa p-valor
H1: 𝜎 2 ≠ 𝜎02 2min{p χ2 ≤ χ20 , p χ2 ≥ χ20 }
H1: 𝜎 2 > 𝜎02 p(χ2 ≥ χ20 )
H1: 𝜎 2 < 𝜎02 p(χ2 ≤ χ20 )
Contraste para la proporción poblacional
Poblaciones Binomiales (muestras grandes)
ෝ−𝐩
𝐩
Estadístico de contraste: → 𝐍(𝟎, 𝟏)
𝐩(𝟏 − 𝐩)
𝐧
Hipótesis nula Valor del estadístico de contraste bajo H0
pො − p0
Z0 =
H0: p=p0 p0 (1 − p0 )
n
Hipótesis alternativa Criterios de rechazo
H1: p≠p0 Rechazar H0 si Z0 ≤ −𝑧α/2 o Z0 ≥ 𝑧α/2
H1: p>p0 Rechazar H0 si Z0 ≥ 𝑧𝛼
H1: p<p0 Rechazar H0 si Z0 ≤ −𝑧𝛼
Contraste para la proporción poblacional
Poblaciones Binomiales (muestras grandes)

Hipótesis nula Valor del estadístico de contraste bajo H0


pො − p0
Z0 =
H0: p=p0 p0 (1 − p0 )
n
Hipótesis alternativa p-valor
H1: p≠p0 2p(Z ≥ Z0 )
H1: p>p0 p(Z ≥ Z0 )
H1: p<p0 p(Z ≤ Z0 )
Relación entre contrastes de hipótesis e intervalos de confianza (1)
El enfoque presentado para la resolución de los contrastes de hipótesis guarda similitud
evidente con la construcción de los intervalos de confianza. Esto es debido a que los
estadísticos de contraste empleados son los mismos que los estadísticos pivote.

Por ejemplo, para el contraste bilateral de la media de una población normal con varianza
desconocida, a un nivel de significación α, aceptaremos la hipótesis nula H0: μ=μ0 si

xത − μ0
−t n−1,α/2 < < t n−1,α/2
Sc / n
Región de Aceptación
Es decir si,
Sc Sc
xത ∈ μ0 − t n−1,α/2 , μ0 + t n−1,α/2
n n
O alternativamente,
Sc Sc
μ0 ∈ xത − t n−1,α/2 , xത + t n−1,α/2
n n

Y éste es el intervalo de confianza de nivel 1-α. Consecuentemente la construcción de intervalos


de confianza para los parámetros estudiados, es un método alternativo para contrastar
una hipótesis simple sobre los mismos.
Relación entre contrastes de hipótesis e intervalos de confianza (2)
Aunque en el caso anterior hemos considerado únicamente las hipótesis alternativas
bilaterales puede extenderse el mecanismo para otros casos realizando la construcción
de intervalos de confianza de nivel 1-α adaptados a la estructura de la alternativa:

𝐇𝟎 : 𝛍 = 𝟏𝟎

𝐇𝟏 : 𝛍 > 𝟏𝟎
Región de Aceptación ≈ Intervalo de confianza

𝐇𝟎 : 𝛍 = 𝟏𝟎

𝐇𝟏 : 𝛍 < 𝟏𝟎
Región de Aceptación ≈ Intervalo de confianza

𝐇𝟎 : 𝛍 = 𝟏𝟎

𝐇𝟏 : 𝛍 ≠ 𝟏𝟎
Región de Aceptación ≈ Intervalo de confianza
Todo lo desarrollado para una muestra aleatoria se extiende de forma natural al caso de disponer
de dos muestras aleatorias y realizar la comparación de dos parámetros (2 medias, 2
varianzas, 2 proporciones).

Los casos más habituales de contrastes para la comparación de 2 parámetros θX y θY los


parámetros de interés que se estiman a partir de las dos muestras aleatorias disponibles
son del tipo:
❖ H0: θX=θY (o H0: θX-θY=0). Por ejemplo, comparar si el salario medio de las mujeres
es el mismo que el de los hombres, si las ventas de un producto en dos ciudades distintas
son iguales.
❖ H0: θX/θY=1 (o H0: θX=θY). Por ejemplo, comparar si la varianza (dispersión) del
salario de las mujeres es la misma que la de los hombres, si la volatilidad de una acción es
semejante a la de otra.
Muestras Independientes 𝛍𝐗 − 𝛍𝐘 y 𝛔𝟐𝐗 = 𝛔𝟐𝐘
Muestras pareadas 𝛍𝐃 = 𝛍𝐗 − 𝛍𝐘

Al igual que en el caso de una muestra, se debe tener siempre en cuenta el tipo de
hipótesis alternativa para determinar la estructura de la región de aceptación y de
rechazo o su p-valor.
Contraste para 2 medias poblacionales con varianzas
poblacionales conocidas
Poblaciones normales y Poblaciones no normales (muestras grandes independientes)
ഥ−𝐘
𝐗 ഥ
Estadístico de contraste: ≈ 𝐍(𝟎, 𝟏)
𝟐 𝟐
𝛔𝐗 𝛔𝐘
𝐧 +𝐦
Hipótesis nula Valor del estadístico de contraste bajo H0
ഥ−Y
X ഥ
Z0 =
H0: μX=μY σ2X σ2Y
n +m
Hipótesis alternativa Criterios de rechazo
H1: μX≠μY Rechazar H0 si Z0 ≤ −𝑧α/2 o Z0 ≥ 𝑧α/2
H1: μX>μY Rechazar H0 si Z0 ≥ 𝑧𝛼
H1: μX<μY Rechazar H0 si Z0 ≤ −𝑧𝛼
Contraste para 2 medias poblacionales con varianzas
poblacionales conocidas
Poblaciones normales y Poblaciones no normales (muestras grandes independientes)

Hipótesis nula Valor del estadístico de contraste bajo H0


ഥ−Y
X ഥ
Z0 =
H0: μX=μY σ12 σ22
n +m
Hipótesis alternativa p-valor
H1: μX≠μY 2p(Z ≥ Z0 )
H1: μX>μY p(Z ≥ Z0 )
H1: μX<μY p(Z ≤ Z0 )
Contraste para 2 proporciones poblacionales
Poblaciones Binomiales (muestras grandes independientes)
ෝ𝐗 − 𝐩
𝐩 ෝ𝐘
Estadístico de contraste: → 𝐍(𝟎, 𝟏)
𝟏 𝟏 𝐧ෝ
𝐩𝟏 + 𝐦ෝ
𝐩𝟐
ෝ(𝟏 − 𝐩
𝐩 ෝ)( + ) ෝ=
𝐩
𝐧 𝐦 𝐧+𝐦

Hipótesis nula Valor del estadístico de contraste bajo H0


pො X − pො Y
Z0 =
H0: pX=pY 1 1
pො (1 − pො )(n + m)

Hipótesis alternativa Criterios de rechazo


H1: pX≠pY Rechazar H0 si Z0 ≤ −𝑧α/2 o Z0 ≥ 𝑧α/2
H1: pX>pY Rechazar H0 si Z0 < −𝑧𝛼
H1: pX<pY Rechazar H0 si Z0 > 𝑧𝛼

Nota: Hay otras estimaciones posibles de la desviación típica del denominador.


Nota: Para muestras pareadas se emplea el estadístico de McNemar
Contraste para 2 proporciones poblacionales
Poblaciones Binomiales (muestras grandes independientes)

Hipótesis nula Valor del estadístico de contraste bajo H0


pො X − pො Y
Z0 =
H0: pX=pY 1 1
pො (1 − pො )(n + m)

Hipótesis alternativa p-valor


H1: pX≠pY 2p(Z ≥ Z0 )
H1: pX>pY p(Z ≥ Z0 )
H1: pX<pY p(Z ≤ Z0 )
CONTRASTES DE 1 MUESTRA
σX conocida
X normal
σX desconocida
SOBRE LA X con media µX y
MEDIA µX desv. típica σX n pequeña
X no normal σX conocida

n grande
σX desconocida
µX conocida
X normal
µX desconocida
SOBRE LA X con media µX y
VARIANZA σX desv. típica σX

X no normal

Nota: Las situaciones señaladas en rojo quedan fuera del alcance del curso. Se suele recurrir a técnicas de tipo no
paramétrico
Nota: Debe incluirse el contraste sobre la proporción en el caso de muestras grandes
CONTRASTES DE 2 MUESTRAS
σX σY conocida
X,Y normal Iguales
σX σY desconocida n pequeña
Distintas n grande
SOBRE LAS X µX σ X
MEDIAS µX -µY Y µY σ Y n pequeña
X,Y no normal σX σY conocida
XY
n grande Iguales
indep σX σY desconocida
Distintas
µX µY conocida
X,Y normal
SOBRE LAS X µX σ X µX µY desconocida
VARIANZAS σX=σY Y µY σ Y
X,Y no normal

X,Y normal
XY SOBRE LAS
paread MEDIAS µX -µY n pequeña
X,Y no normal
n grande

Nota: Las situaciones señaladas en rojo quedan fuera del alcance del curso. Se suele recurrir a técnicas de tipo no
paramétrico
Nota: Debe incluirse el contraste sobre la igualdad de proporciones en el caso de muestras grandes

También podría gustarte