Está en la página 1de 63

CONTRASTES DE HIPÓTESIS

Una vez estimados los parámetros de una variable de interés para la


población, se pueden probar hipótesis sobre los parámetros de tales
distribuciones.

La prueba de la HIPÓTESIS es el Contraste de la hipótesis.

Pueden presentarse en la práctica situaciones en las que exista una


teoría preconcebida relativa a la característica de la población
sometida a estudio, en tal caso uno de los objetivos está en corroborar
de forma empírica la hipótesis inicial sobre dicha población.

Ejemplo:
 ¿hay la misma proporción de chicos que de chicas en un concierto de
rock? o,
 el salario medio de los hombres y de las mujeres en el mundo
empresarial ¿es el mismo?

Este tipo de circunstancias son las que nos llevan al estudio de la


parcela de la Estadística Inferencial conocida por Contrastes de
Hipótesis
1
 La hipótesis que se establece, que suponemos cierta y que
deseamos contrastar se denomina hipótesis nula, y se denota por
H0.
 Para realizar el contraste, se compara la hipótesis nula con una
hipótesis alternativa que denotamos por H1.
 El objetivo del contraste es comprobar si los datos de la muestra
apoyan la hipótesis nula, o por el contrario la rechaza, lo que nos
llevaría a aceptar la hipótesis alternativa.

EJEMPLO 1:
H0: El salario medio de los orensanos es de 900€ (𝜇𝑆 = 900)
H1 : El salario medio de los orensanos mayor 900€ (𝜇𝑆 > 900)

EJEMPLO 2:
H0: Los beneficios medios en bolsa del grupo de eléctricas son
iguales al 12% (𝜇𝐵 = 12%)
H1 : Los beneficios medios en bolsa del grupo de eléctricas son
INFERIORES al 12% (𝜇𝐵 < 12%) 2
EJEMPLO 3:
H0: Los beneficios anuales en bolsa del grupo de eléctricas son
los mismos que los del grupo de telecomunicaciones. (𝜇𝐸 = 𝜇 𝑇 )
H1 : Los beneficios anuales en bolsa del grupo de eléctricas son
DISTINTOS que los del grupo de telecomunicaciones. (𝜇𝐸 ≠ 𝜇 𝑇 )

Cuando los datos muestrales discrepen mucho de la hipótesis nula,


entonces rechazaremos la hipótesis NULA.
En el Ejemplo 1, los datos muestrales discrepan mucho cuando el
salario medio de la muestra de orensanos sea muy distintos a 900€

3
Debemos distinguir entre dos tipos de hipótesis:
 Hipótesis SIMPLE: cuando se especifica un único valor.
 Salario medio =900€,
 Proporción de hombres = proporción de mujeres,
 porcentaje de desempleados=20%, etc.

 Hipótesis COMPUESTA: cuando se asigna un conjunto de posibles


valores.
 800€≤Salario medio≤900€
 Proporción de hombres > proporción de mujeres
 porcentaje de desempleados<20%, etc.

4
Volviendo al problema de la decisión:
Al resolver un contraste se nos pueden presentar la siguientes
situaciones:

No Rechazo H0 CORRECTO
La hipótesis nula
H0 es cierta
Rechazo H0 ERROR TIPO I

No Rechazo H0 ERROR TIPO II

La hipótesis nula
H0 es falsa

Rechazo H0 CORRECTO

5
Al realizar un Contraste de hipótesis, podemos cometer dos tipos de
error:
 Error de tipo I. Este error se comete si decidimos rechazar H₀
cuando realmente es cierta.
 Error de tipo II. Este error se comete si decidimos NO rechazar
H₀ cuando realmente es falsa.

No rechazar H0 Rechazar H0
H0 cierta Correcto Error tipo I (𝛼)
H0 falsa Error tipo II (𝛽) Correcto

6
ERROR TIPO I: NIVEL DE SIGNIFICACIÓN
A la probabilidad de cometer un error tipo I se le denomina nivel de
significación del contraste y se denota por (0 < 𝛼 < 1):

𝛼 = 𝑃(𝑒𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼) = 𝑃(𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻₀/𝐻₀ 𝑐𝑖𝑒𝑟𝑡𝑎)

y por tanto la probabilidad de NO rechazar H₀ cuando H₀ es cierta es


1 − 𝛼.

ERROR TIPO II
La probabilidad de cometer un error tipo II se denota por (0 < 𝛽 <
1):
𝛽 = 𝑃(𝑒𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼𝐼) = 𝑃(𝑎𝑐𝑒𝑝𝑡𝑎𝑟 𝐻₀/𝐻₀ 𝑓𝑎𝑙𝑠𝑎)
y por tanto la probabilidad de rechazar H₀ cuando H₀ es falsa es 1 −
𝛽.

Se denomina POTENCIA DEL CONTRASTE: 1 − 𝛽


7
Nos interesan contrastes que tengan bajas probabilidades de Error
tanto tipo I como tipo II, y por consiguiente que la Potencia sea
muy alta.
Lo ideal sería que las probabilidades de los dos tipos de error fuesen
lo más pequeñas posibles, pero esto no es posible, pues fijado un
tamaño muestral n, si disminuimos la probabilidad de un error entonces
aumenta la probabilidad de cometer el otro error.
La única manera de disminuir los dos errores es aumentar el tamaño
muestral.
En la práctica seguiremos el siguiente criterio de error:
Que únicamente se pretenda controlar el error de tipo I, cuando sólo
se rechaza H₀ si la evidencia en su contra es muy importante.
Fijamos el nivel α, generalmente 0.01, 0.05, 0.1, etc., se decide así
previamente la probabilidad máxima de error que comentemos al
rechazar la hipótesis nula H0 cuando esta es cierta.
Esta metodología es muy conservadora, ya que si no se tiene mucha
evidencia en contra de la hipótesis nula H0 entonces se tiende a
aceptarla.

8
EJEMPLO:
Un juez tiene que decidir si una persona va a la cárcel o no. En este
caso se pueden cometer dos tipos de errores: ingresar a la persona en
la cárcel cuando es inocente o dejarla en libertad siendo realmente
culpable. La postura del juez es dejar en libertad a la persona si no
tiene suficientes evidencias de que sea culpable, por tanto las hipótesis
del juez serían:

H₀: la persona es inocente


H₁: la persona es culpable

y como el juez fija el nivel de significación, por ejemplo 𝛼 = 0.01,


entonces la probabilidad de cometer un error de tipo I (rechazar H₀
cuando es cierta), es decir, de ingresar a la persona en la cárcel siendo
inocente es como máximo del 1%.
De modo que si la hipótesis nula H₀ es rechazada es porque los datos
aportan suficiente evidencia de que H₀ es falsa.
Pero que H₀ sea aceptada, no implica que la persona sea inocente, sino
que no hemos encontrado pruebas suficientes para declararlo culpable.
9
Para realizar el contraste, necesitamos un
Estadístico de contraste.
Es un estadístico que evaluando su valor en la muestra, nos permite
decidir hasta qué punto los datos están de acuerdo o no con la
hipótesis nula.
El estadístico de contraste es cualquier función de los datos
muestrales y del parámetro especificado por H₀, con distribución
conocida cuando H₀ es cierta.

Por ejemplo: Para contrastar una hipótesis sobre la media de una


distribución normal con varianza conocida, utilizaremos el siguiente
estadístico
𝑋−𝜇
𝑛 ∼ 𝑁(0,1)
𝜎

10
¿Cómo realizar un contraste?
Al fijar el nivel de significación 𝛼, se obtiene implícitamente una
división en dos regiones del conjunto de posibles valores que toma la
distribución del estadístico de contraste.
Recordemos que el estadístico que nos sirve de contraste es una
variable aleatoria que sigue una determinada distribución (por
ejemplo en el caso anterior una 𝑁(0,1)).

 REGIÓN DE ACEPTACIÓN (NO RECHAZO): de probabilidad


1 − 𝛼 bajo 𝐻0, si el valor del estadístico en la muestra cae en ella
el contraste NO ES SIGNIFICATIVO, NO PODEMOS
RECHAZAR LA HIPÓTESIS NULA.

 REGIÓN DE RECHAZO: de probabilidad 𝛼 bajo 𝐻0, si el valor del


estadístico en la muestra cae en ella el contraste ES
SIGNIFICATIVO, RECHAZAREMOS LA HIPÓTESIS NULA.

11
Construcción de las regiones de Aceptación-Rechazo
Las regiones de aceptación-rechazo dependen de la hipótesis
alternativa, 𝐻₁:

CASO 1: 𝑯₁: 𝜽 ≠ 𝜽₀. (BILATERAL)


La región de rechazo la forman las dos colas de la distribución del
𝛼
estadístico bajo 𝐻₀, ambas con la misma probabilidad 2 .

12
CASO 2: 𝑯₁: 𝜽 < 𝜽₀. (UNILATERAL)
La región de rechazo es la cola de la izquierda con probabilidad 𝛼.

13
CASO 3: 𝑯₁: 𝜽 > 𝜽₀. (UNILATERAL)
La región de rechazo es la cola de la derecha con probabilidad 𝛼.

14
P-VALOR (NIVEL CRÍTICO)
Sea 𝐷 el estadístico de contraste, y sea 𝑑 el valor del estadístico en
la muestra.
Se denomina 𝒑 − 𝒗𝒂𝒍𝒐𝒓 al mayor nivel de significación que permite
NO rechazar la hipótesis nula.
El p-valor sólo puede calcularse una vez tomada la muestra.
Una vez calculado el 𝑝 − 𝑣𝑎𝑙𝑜𝑟, la conclusión a cualquier nivel de
significación α resulta de comparar el nivel crítico con α
 Si 𝒑 − 𝒗𝒂𝒍𝒐𝒓 ≤ 𝜶: Rechazaremos la Hipótesis nula a nivel 𝜶
 Si 𝒑 − 𝒗𝒂𝒍𝒐𝒓 > 𝜶: No podemos Rechazar la Hipótesis nula a
nivel 𝜶.

Cuanto menor sea el 𝑝 − 𝑣𝑎𝑙𝑜𝑟 más incompatible es nuestra muestra


con la hipótesis nula.

15
CÁLCULO DEL P-VALOR
El cálculo del p-valor depende del tipo de contraste que tengamos:

CASO 1: 𝑯₁: 𝜽 ≠ 𝜽₀. La región de rechazo la forman las dos colas de


la distribución del estadístico bajo H₀, ambas con la misma
𝛼
probabilidad .
2
p−valor = 2 ⋅ min 𝑃 𝐷 > 𝑑 , 𝑃 𝐷 < 𝑑
CASO 2: 𝑯₁: 𝜽 < 𝜽₀. La región de rechazo es la cola de la izquierda
con probabilidad 𝛼.
p−valor = 𝑃 𝐷 < 𝑑
CASO 3: 𝑯₁: 𝜽 > 𝜽₀. La región de rechazo es la cola de la derecha
con probabilidad 𝛼.
p−valor = 𝑃 𝐷 > 𝑑 .

16
Contrastes paramétricos para una muestra Normal

𝜎 2 𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎
𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒 𝑝𝑎𝑟𝑎 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝜇
𝜎 2 𝑑𝑒𝑠𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎
𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑁𝑜𝑟𝑚𝑎𝑙
𝑋 ∼ 𝑁 𝜇, 𝜎 𝜇 𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎
𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒 𝑝𝑎𝑟𝑎 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝜎 2
𝜇 𝑑𝑒𝑠𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎

17
Contraste para la media 𝝁 de una población Normal con varianza
poblacional conocida, 𝝈𝟐.

Supongamos que disponemos de una muestra aleatoria simple


𝑋1 , … , 𝑋𝑛 de una variable aleatoria Normal de media 𝜇 y de varianza
conocida 𝜎 2
El estadístico pivote (pivotal) que vamos a considerar, al igual que en
los intervalos de confianza, es

𝜎 𝑋−𝜇
𝑋 ∼ 𝑁 𝜇, ⇔ 𝑛 ∼ 𝑁 0,1
𝑛 𝜎
siendo
𝑛
𝑖=1 𝑋𝑖
𝑋=
𝑛

18
CASO 1:
𝑯𝟎: 𝝁 = 𝝁₀ X  0 X  0
𝑯₁: 𝝁 ≠ 𝝁₀
Rechazo si n  z ó n z    z
 2  1
2 2

Normal(0,1)
Region Aceptación

Regiones de
rechazo

19
CASO 2:
𝑯𝟎: 𝝁 = 𝝁₀
𝑯₁: 𝝁 < 𝝁₀

X  0
Rechazo si n  z

z
CASO 3:
𝑯𝟎: 𝝁 = 𝝁₀
𝑯₁: 𝝁 > 𝝁₀

X  0
Rechazo si n  z1 =-z

z1
20
TABLA RESUMEN

Contraste 𝑯𝟎 𝑯𝟏 R. Aceptación
Bilateral 𝐻0 : 𝜇 = 𝜇0 𝐻1 : 𝜇 ≠ 𝜇0 −𝑧1−𝛼 , 𝑧1−𝛼
2 2
Unilateral izq. 𝐻0 : 𝜇 = 𝜇0 𝐻1 : 𝜇 < 𝜇0 −𝑧1−𝛼 , +∞
Unilateral der. 𝐻0 : 𝜇 = 𝜇0 𝐻1 : 𝜇 > 𝜇0 −∞, 𝑧1−𝛼

21
Ejemplo.
Un planta de envasado de agua quiere comprobar si realmente sus
botellas de 1 litro contienen la cantidad correcta de agua. Para ello se
toma una muestra de 25 botellas y se obtiene una media muestral de
0.995 litros. Se sabe que la capacidad de agua de una botella de 1 litro
sigue una distribución normal de desviación típica 0.01 litros.
Con estos datos, plantear un contraste de hipótesis que ayude a la planta
de envasado a determinar si sus botellas llevan, en media, la cantidad
correcta de agua con un nivel de significación 𝛼 = 0.01.

 X=“Capacidad de una botella” ∼ 𝑁(𝜇, 0.01)


 El contraste que se quiere realizar es (bilateral):
𝐻0 : 𝜇 = 1
𝐻1 : 𝜇 ≠ 1
𝑋−𝝁
 Estadístico de contraste: 𝑛 ∼ 𝑁(0,1)
𝜎
 Región de aceptación:
𝑅. 𝐴. = −𝑧1−𝛼 , 𝑧1−𝛼 = −𝑧0.995 , 𝑧0.995 = (−2.575, 2.575)
2 2
0.995−1
 Valor del estadístico: 25 = −2.5 ∈ 𝑅. 𝐴.
0.01
 NO HAY MOTIVOS SUFICIENTES PARA RECHAZAR que las botellas
lleven 1 litro de agua. 22
Contraste para la media 𝝁 de una población Normal con varianza
poblacional desconocida, 𝝈𝟐.

Supongamos que disponemos de una muestra aleatoria simple 𝑋1 , … , 𝑋𝑛


de una variable aleatoria Normal de media 𝜇 y de varianza desconocida
𝝈𝟐
Como no conocemos la varianza, tenemos que estimarla a partir de los
datos, usando la varianza muestral o la cuasivarianza muestral.
Al igual que en los Intervalos de confianza el estadístico pivote (pivotal)
que vamos a considerar es:

𝑋−𝜇 𝑋−𝜇
𝑛−1 = 𝑛 ∼ 𝑡𝑛−1
𝑆 𝑆
siendo
𝑛 𝑛 2 𝑛 2
𝑖=1 𝑋𝑖 𝑖=1 𝑋𝑖 − 𝑋 𝑖=1𝑋𝑖 − 𝑋
𝑋= , 𝑆2 = 𝑦 𝑆2 =
𝑛 𝑛 𝑛−1

23
CASO 1:
𝑯𝟎: 𝝁 = 𝝁₀ X  0 X  0
Rechazo si n  tn 1,  ó n  tn 1,   tn 1, 
𝑯₁: 𝝁 ≠ 𝝁₀ ˆ
S ˆ
S 1
2 2 2

CASO 2:
𝑯𝟎: 𝝁 = 𝝁₀ X - 0
Rechazo si n  tn-1,  -tn-1,1-
𝑯₁: 𝝁 < 𝝁₀ ˆ
S

CASO 3: X  0
𝑯𝟎: 𝝁 = 𝝁₀ Rechazo si n  tn 1,1
ˆ
S
𝑯₁: 𝝁 > 𝝁₀

24
TABLA RESUMEN

Contraste 𝑯𝟎 𝑯𝟏 R. Aceptación
Bilateral 𝐻0 : 𝜇 = 𝜇0 𝐻1 : 𝜇 ≠ 𝜇0 −𝑡𝑛−1,1−𝛼 , 𝑡𝑛−1,1−𝛼
2 2
Unilateral izq. 𝐻0 : 𝜇 = 𝜇0 𝐻1 : 𝜇 < 𝜇0 −𝑡𝑛−1,1−𝛼 , +∞
Unilateral der. 𝐻0 : 𝜇 = 𝜇0 𝐻1 : 𝜇 > 𝜇0 −∞, 𝑡𝑛−1,1−𝛼

25
Ejemplo con R:
Dada una muestra aleatoria de comerciales del sector automovilístico
de una ciudad , nos interesa saber si el salario medio es de 975€.

Contraste:
𝑯𝟎: 𝑴𝒆𝒅𝒊𝒂 𝒅𝒆 𝒔𝒂𝒍𝒂𝒓𝒊𝒐𝒔 𝒅𝒆 𝒍𝒂 𝒑𝒐𝒃𝒍𝒂𝒄𝒊ó𝒏 = 𝟗𝟕𝟓
𝑯₁: 𝑴𝒆𝒅𝒊𝒂 𝒅𝒆 𝒔𝒂𝒍𝒂𝒓𝒊𝒐𝒔 𝒅𝒆 𝒍𝒂 𝒑𝒐𝒃𝒍𝒂𝒄𝒊ó𝒏 ≠ 𝟗𝟕𝟓

Seleccionar el tipo de hipótesis


alternativa y fijar el valor de la
hipótesis nula

26
• El valor del estadístico es 0.03302752. Los grados de libertad de la
distribución t de Student son 13.
• El p-valor del contraste es 0.97415. Por lo tanto, si considero el nivel de
significación al 5%, el resultado del contraste es que no puedo rechazar la
hipótesis nula.
• La media muestral (estimador muestral) de los datos es de 975.8283

27
Contraste:
𝑯𝟎: 𝑴𝒆𝒅𝒊𝒂 𝒅𝒆 𝒔𝒂𝒍𝒂𝒓𝒊𝒐𝒔 𝒅𝒆 𝒍𝒂 𝒑𝒐𝒃𝒍𝒂𝒄𝒊ó𝒏 ≥ 𝟗𝟕𝟓
𝑯𝟏 : 𝑴𝒆𝒅𝒊𝒂 𝒅𝒆 𝒔𝒂𝒍𝒂𝒓𝒊𝒐𝒔 𝒅𝒆 𝒍𝒂 𝒑𝒐𝒃𝒍𝒂𝒄𝒊ó𝒏 < 𝟗𝟕𝟓

• El valor del estadístico sigue siendo el mismo y con los mismos grados de
libertad. La media muestral de los datos es la misma. Lo que cambia es el p-
valor ya que varía en función de la región de rechazo, en este caso unilateral
por la izquierda.
• El p-valor del contraste es 0.51292. Por lo tanto, si considero el nivel de
significación al 5%, el resultado del contraste es que no puedo rechazar la
hipótesis nula.

28
Contraste de hipótesis para la varianza 𝝈𝟐 de una población Normal
con media poblacional conocida, 𝝁.

Supongamos que disponemos de una muestra aleatoria simple 𝑋1 , … , 𝑋𝑛


de una variable aleatoria Normal de media conocida 𝜇 y de varianza 𝝈𝟐
El estadístico pivote (pivotal) que vamos a considerar para la varianza
es

𝑛 2
𝑖=1 𝑋𝑖 − 𝜇
∼ 𝜒𝑛2
𝜎2

Se procede como en los anteriores casos, teniendo en cuenta que la


2 2
distribución de 𝜒𝑛2 no es simétrica, es decir, 𝜒𝑛, 𝛼 ≠ −𝜒
𝑛,1−
𝛼
2 2

29
CASO 1: n 2 n 2

𝑯𝟎: 𝝈𝟐 = 𝝈𝟐𝟎  X i    X i  
𝑯₁: 𝝈𝟐 ≠ 𝝈𝟐𝟎 Rechazo si i 1
  2 ó i 1
 2
 02 n,  02 n,1-
2 2

n 2
CASO 2:
𝑯𝟎: 𝝈𝟐 = 𝝈𝟐𝟎  X i  
𝑯₁: 𝝈𝟐 < 𝝈𝟐𝟎 Rechazo si i 1
  n,2 
 02

n 2

CASO 3:  X i  
𝑯𝟎: 𝝈𝟐 = 𝝈𝟐𝟎 Rechazo si
i 1
  n,1-
2

𝑯₁: 𝝈𝟐 > 𝝈𝟐𝟎  02

30
TABLA RESUMEN

Contraste 𝑯𝟎 𝑯𝟏 R. Aceptación
Bilateral 𝐻0 : 𝜎 = 𝜎0 𝐻1 : 𝜎 ≠ 𝜎0 2
𝜒𝑛, 𝛼, 𝜒
2
𝛼
𝑛,1−
2 2
Unilateral izq. 𝐻0 : 𝜎 = 𝜎0 𝐻1 : 𝜎 < 𝜎0 2 , +∞
𝜒𝑛,𝛼
Unilateral der. 𝐻0 : 𝜎 = 𝜎0 𝐻1 : 𝜎 > 𝜎0 2
0, 𝜒𝑛,1−𝛼

31
Para el caso del contraste para la varianza 𝝈𝟐 de una población
Normal con media poblacional desconocida, 𝝁.
El único cambio es que ahora el estadístico pivotal es:

 X 
n
X
i
n 1 ˆ 2 n 2
i 1
 S  2S  n-1
2
2  2

2 2

 X   X 
n n
CASO 1: X X
i i
𝑯𝟎: 𝝈𝟐 = 𝝈𝟐𝟎 Rechazo si i 1
 2
ó i 1
 2
𝑯₁: 𝝈𝟐 ≠ 𝝈𝟐𝟎  02 n-1,  02 n-1,1-
2 2
2
CASO 2:
 X 
n
X
𝑯𝟎: 𝝈𝟐 = 𝝈𝟐𝟎 i

𝑯₁: 𝝈𝟐 < 𝝈𝟐𝟎 Rechazo si i 1


  n-1,
2

 02

32
2

 X 
n
CASO 3:
X
𝑯𝟎: 𝝈𝟐 = 𝝈𝟐𝟎 i

𝑯₁: 𝝈𝟐 > 𝝈𝟐𝟎 Rechazo si i 1


  n-1,1-
2

 02

TABLA RESUMEN

Contraste 𝑯𝟎 𝑯𝟏 R. Aceptación
Bilateral 𝐻0 : 𝜎 = 𝜎0 𝐻1 : 𝜎 ≠ 𝜎0 2
𝜒𝑛−1, 𝛼, 𝜒
2
𝛼
𝑛−1,1−
2 2
Unilateral izq. 𝐻0 : 𝜎 = 𝜎0 𝐻1 : 𝜎 < 𝜎0 2
𝜒𝑛−1,𝛼 , +∞
Unilateral der. 𝐻0 : 𝜎 = 𝜎0 𝐻1 : 𝜎 > 𝜎0 2
0, 𝜒𝑛−1,1−𝛼

33
Contrastes de hipótesis para dos muestras normales.

−𝜎𝑋2 , 𝜎𝑌2 𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎𝑠


−𝜎𝑋2 , 𝜎𝑌2 𝑑𝑒𝑠𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎𝑠
𝐷𝑎𝑡𝑜𝑠 𝑖𝑛𝑑𝑝𝑡𝑒𝑠
𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒𝑠 𝑝𝑎𝑟𝑎 𝑙𝑎 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑝𝑒𝑟𝑜 𝑖𝑔𝑢𝑎𝑙𝑒𝑠
𝑑𝑒 𝑚𝑒𝑑𝑖𝑎𝑠 𝜇𝑋 − 𝜇𝑌 −𝜎𝑋2 , 𝜎𝑌2 𝑑𝑒𝑠𝑐𝑜𝑛𝑜𝑐𝑖𝑑𝑎𝑠

𝐷𝑎𝑡𝑜𝑠 𝑝𝑎𝑟𝑒𝑎𝑑𝑜𝑠

𝐶𝑜𝑛𝑡𝑟𝑎𝑠𝑡𝑒𝑠 𝑝𝑎𝑟𝑎 𝑒𝑙 𝑐𝑜𝑐𝑖𝑒𝑛𝑡𝑒


𝜎𝑋2
𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎𝑠 2
𝜎𝑌

34
CASO 1: VARIANZAS CONOCIDAS

Supongamos que disponemos de DOS MUESTRAS ALEATORIAS


SIMPLES INDEPENDIENTES 𝑋1 , … , 𝑋𝑛 y 𝑌1 , … , 𝑌𝑛 de DOS variables
aleatorias Normales de medias 𝜇𝑋 y 𝜇𝑌 y de varianzas 𝜎𝑋2 y 𝜎𝑌2 .

El estadístico pivote (pivotal) que vamos a considerar para la diferencia


de medias es el siguiente:

X  Y    X  Y 
N(0,1)
 2
 2
X
 Y
n m

35
CASO 1:
X  Y  d0 X  Y  d0
H 0 :  X -Y  d0 Rechazo si  z ó z 
 2
 2
 2
 2 1
H1 :  X -Y  d0 X
 Y
2
X
 Y
2

n m n m

CASO 2:
X  Y  d0
H 0 :  X -Y  d 0 Rechazo si  z
 2
 2
H1 :  X -Y  d 0 X
 Y

n m

CASO 3: X  Y  d0
H 0 :  X -Y  d 0 Rechazo si  z1
 2
 2

H1 :  X -Y  d 0
X
 Y

n m

36
TABLA RESUMEN

Contraste 𝑯𝟎 𝑯𝟏 R. Aceptación
Bilateral 𝐻0 : 𝜇𝑋 − 𝜇𝑌 = 𝑑0 𝐻1 : 𝜇𝑋 − 𝜇𝑌 ≠ 𝑑0 −𝑧1−𝛼 , 𝑧1−𝛼
2 2
Unilateral izq. 𝐻0 : 𝜇𝑋 − 𝜇𝑌 = 𝑑0 𝐻1 : 𝜇𝑋 − 𝜇𝑌 < 𝑑0 −𝑧1−𝛼 , +∞
Unilateral der. 𝐻0 : 𝜇𝑋 − 𝜇𝑌 = 𝑑0 𝐻1 : 𝜇𝑋 − 𝜇𝑌 > 𝑑0 −∞, 𝑧1−𝛼

37
CASO 2: VARIANZAS DESCONOCIDAS PERO IGUALES

Supongamos que disponemos de DOS MUESTRAS ALEATORIAS


SIMPLES INDEPENDIENTES 𝑋1 , … , 𝑋𝑛 y 𝑌1 , … , 𝑌𝑛 de DOS variables
aleatorias Normales de medias 𝜇𝑋 y 𝜇𝑌 y de varianzas 𝜎𝑋2 = 𝜎𝑌2 que son
DESCONOCIDAS.

Como son desconocidas tengo que estimarlas, el estadístico pivote


(pivotal) que vamos a considerar para la diferencia de medias es el
siguiente:
X  Y    X  Y 
tn  m  2
1 1
Sˆ 
n m

con Sˆ 2 
 n  1 ˆ 2   m  1 Sˆ 2
S X Y

nm2

   
n m
1 1
 
2 2
siendo Sˆ X 
2
Xi  X y Sˆ 
2
Yj  Y
n  1 i 1 m  1 j 1
Y

38
CASO 1:

H 0 :  X -Y  d0 X  Y  d0 X  Y  d0
Rechazo si  tn  m  2  ó  tn  m  2 , 
1 1 1 1 1
H1 :  X -Y  d0 Sˆ  2
Sˆ  2

n m n m

CASO 2:
X  Y  d0
H 0 :  X -Y  d0 Rechazo si  tn  m  2,
1 1
Sˆ 
H1 :  X -Y  d0 n m

CASO 3: X  Y  d0
Rechazo si  tn  m  2,1
H 0 :  X -Y  d0 1 1
Sˆ 
H1 :  X -Y  d0 n m

39
TABLA RESUMEN

Contraste 𝑯𝟎 𝑯𝟏 R. Aceptación
Bilateral 𝐻0 : 𝜇𝑋 − 𝜇𝑌 = 𝑑0 𝐻1 : 𝜇𝑋 − 𝜇𝑌 ≠ 𝑑0 −𝑡 𝛼, 𝑡 𝛼
𝑛+𝑚−2,1− 2 𝑛+𝑚−2,1− 2

Unilateral izq. 𝐻0 : 𝜇𝑋 − 𝜇𝑌 = 𝑑0 𝐻1 : 𝜇𝑋 − 𝜇𝑌 < 𝑑0 −𝑡𝑛+𝑚−2,1−𝛼 , +∞


Unilateral der. 𝐻0 : 𝜇𝑋 − 𝜇𝑌 = 𝑑0 𝐻1 : 𝜇𝑋 − 𝜇𝑌 > 𝑑0 −∞, 𝑡𝑛+𝑚−2,1−𝛼

40
CASO 3: VARIANZAS DESCONOCIDAS Y DISTINTAS

Supongamos que disponemos de DOS MUESTRAS ALEATORIAS


SIMPLES INDEPENDIENTES 𝑋1 , … , 𝑋𝑛 y 𝑌1 , … , 𝑌𝑛 de DOS variables
aleatorias Normales de medias 𝜇𝑋 y 𝜇𝑌 y de varianzas 𝜎𝑋2 ≠ 𝜎𝑌2 que son
DESCONOCIDAS.

Como son desconocidas tengo que estimarlas, el estadístico pivote


(pivotal) que vamos a considerar para la diferencia de medias es el
siguiente:
Tamaños muestrales grandes (n,m≥30)
T  N  0,1
X  Y    X  Y 
T
Sˆ X2 SˆY2

n m Tamaños muestrales pequeños (n o m≤30)

T  t de Student t n+m-2-

41
Donde  es el entero más próximo a la siguiente cantidad
2
 Sˆ X2 SˆY2 
 m  1   n  1 
 n m

  Sˆ X2 
2
 SˆY2  
2

 m  1     n  1   
  n   m  

Las regiones de rechazo y de aceptación se calculan de igual modo que


en el caso anterior, realizando los cambios oportunos en el estadístico
y la distribución del mismo.

TABLA RESUMEN
Contraste 𝑯𝟎 𝑯𝟏 R. Aceptación
Bilateral 𝐻0 : 𝜇𝑋 − 𝜇𝑌 = 𝑑0 𝐻1 : 𝜇𝑋 − 𝜇𝑌 ≠ 𝑑0 −𝑡𝑛+𝑚−2−𝛿,1−𝛼 , 𝑡𝑛+𝑚−2−𝛿,1−𝛼
2 2
Unilateral izq. 𝐻0 : 𝜇𝑋 − 𝜇𝑌 = 𝑑0 𝐻1 : 𝜇𝑋 − 𝜇𝑌 < 𝑑0 −𝑡𝑛+𝑚−2−𝛿,1−𝛼 , +∞
Unilateral 𝐻0 : 𝜇𝑋 − 𝜇𝑌 = 𝑑0 𝐻1 : 𝜇𝑋 − 𝜇𝑌 > 𝑑0 −∞, 𝑡𝑛+𝑚−2−𝛿,1−𝛼
der.
42
Contraste de Hipótesis para la diferencia de medias con muestras
PAREADAS

Supongamos que disponemos de DOS MUESTRAS ALEATORIAS


SIMPLES PAREADAS 𝑋1 , … , 𝑋𝑛 y 𝑌1 , … , 𝑌𝑛 de DOS variables
aleatorias Normales de medias 𝜇𝑋 y 𝜇𝑌 y de varianzas 𝜎𝑋2 𝑦 𝜎𝑌2 .
Al igual que para intervalos de confianza,

Sea U  X - Y
Entonces disponemos de una muestra
U i i 1   X i - Yi i 1
n n

E U   U  E  X - Y    X  Y
El estadístico de contraste que vamos a utilizar es
U  U
n tn 1
SˆU

43
CASO 1:

H 0 :  X -Y  d0 U  d0 U  d0
Rechazo si n t  ó n t
H1 :  X -Y  d0 Sˆ
U
n 1,
2 Sˆ
U
n 1,1

2

CASO 2:
H 0 :  X -Y  d0 U  d0
Rechazo si n  tn 1,
H1 :  X -Y  d0 Sˆ
U

CASO 3:
H 0 :  X -Y  d0 U  d0
Rechazo si n  tn 1,
H1 :  X -Y  d0 Sˆ
U

44
TABLA RESUMEN

Contraste 𝑯𝟎 𝑯𝟏 R. Aceptación
Bilateral 𝐻0 : 𝜇𝑋 − 𝜇𝑌 = 𝑑0 𝐻1 : 𝜇𝑋 − 𝜇𝑌 ≠ 𝑑0 −𝑡𝑛−1,1−𝛼 , 𝑡𝑛−1,1−𝛼
2 2
Unilateral izq. 𝐻0 : 𝜇𝑋 − 𝜇𝑌 = 𝑑0 𝐻1 : 𝜇𝑋 − 𝜇𝑌 < 𝑑0 −𝑡𝑛−1,1−𝛼 , +∞
Unilateral der. 𝐻0 : 𝜇𝑋 − 𝜇𝑌 = 𝑑0 𝐻1 : 𝜇𝑋 − 𝜇𝑌 > 𝑑0 −∞, 𝑡𝑛−1,1−𝛼

45
Ejemplo con R:
Dadas dos muestras de ventas diarias en dos establecimientos
comerciales, tomadas en los mismos días, nos interesa saber si las
ventas medias diarias de dichos establecimientos son las mismas.

𝐻0 : 𝑉𝑒𝑛𝑡𝑎 𝑀𝑒𝑑𝑖𝑎 𝐷𝑖𝑎𝑟𝑖𝑎𝐴 = 𝑉𝑒𝑛𝑡𝑎 𝑀𝑒𝑑𝑖𝑎 𝐷𝑖𝑎𝑟𝑖𝑎𝐵


𝐻1 : 𝑉𝑒𝑛𝑡𝑎 𝑀𝑒𝑑𝑖𝑎 𝐷𝑖𝑎𝑟𝑖𝑎𝐴 ≠ 𝑉𝑒𝑛𝑡𝑎 𝑀𝑒𝑑𝑖𝑎 𝐷𝑖𝑎𝑟𝑖𝑎𝐵

46
• El valor del estadístico de contraste es de -1.905247. Los grados de libertad de
la distribución t de Student son 49.
• El p-valor del contraste es 0.062625. Es un valor un poco superior a 5%, por
tanto no podemos rechazamos la hipótesis nula. Sin embargo, a un nivel de
significación del 10% RECHAZARIAMOS la hipótesis nula de igualdad de medias.
• La diferencia de las medias muestrales es de -38.0648

47
Veamos que ocurre con un contraste unilateral, por ejemplo

𝐻0 : 𝑉𝑒𝑛𝑡𝑎 𝑀𝑒𝑑𝑖𝑎 𝐷𝑖𝑎𝑟𝑖𝑎𝐴 ≤ 𝑉𝑒𝑛𝑡𝑎 𝑀𝑒𝑑𝑖𝑎 𝐷𝑖𝑎𝑟𝑖𝑎𝐵


𝐻1 : 𝑉𝑒𝑛𝑡𝑎 𝑀𝑒𝑑𝑖𝑎 𝐷𝑖𝑎𝑟𝑖𝑎𝐴 > 𝑉𝑒𝑛𝑡𝑎 𝑀𝑒𝑑𝑖𝑎 𝐷𝑖𝑎𝑟𝑖𝑎𝐵

• El valor del estadístico de contraste y los grados de libertad son los mismos.
• Lo que cambia sustancialmente es el p-valor, en este caso vale 0.96869 por lo
que no podemos rechazar la hipótesis nula.

48
𝝈𝟐𝑿
CONTRASTE DE HIPÓTESIS PARA EL COCIENTE DE VARIANZAS .
𝝈𝟐𝒀

Supongamos que disponemos de DOS MUESTRAS ALEATORIAS


SIMPLES INDEPENDIENTES 𝑋1 , … , 𝑋𝑛 y 𝑌1 , … , 𝑌𝑛 de DOS variables
aleatorias Normales de medias 𝜇𝑋 y 𝜇𝑌 y de varianzas 𝜎𝑋2 𝑦 𝜎𝑌2
DESCONOCIDAS.
El estadístico que vamos a utilizar es,

2
𝜒𝑛−1 𝑆𝑋2
𝑛−1 𝜎𝑋2 𝜎𝑌2 𝑆𝑋2
2
= = 2 ⋅ 2 ∼ 𝐹𝑛−1,𝑚−1
𝜒𝑚−1 𝑆𝑌2 𝜎𝑋 𝑆𝑌
𝑚−1 𝜎𝑌2

49
CASO 1:

H 0 :  X2 = Y2 Sˆ X2 Sˆ X2
Rechazo si 2  F  ó F 
ˆ
SY   Sˆ 2 n 1, m 1,1
H1 :  X2   Y2
n 1, m 1,
2 Y 2

CASO 2:
H 0 :  =
2 2 Sˆ X2
X Y Rechazo si 2  Fn 1,m 1,
SˆY
H1 :  X2   Y2

CASO 3:
Sˆ X2
H 0 :  X2 = Y2 Rechazo si 2  Fn 1,m 1,1
SˆY
H1 :  X2   Y2

50
TABLA RESUMEN

Contraste 𝑯𝟎 𝑯𝟏 R. Aceptación
Bilateral 𝐻0 : 𝜎𝑋2 = 𝜎𝑌2 𝐻1 : 𝜎𝑋2 ≠ 𝜎𝑌2 𝐹𝑛−1,𝑚−1,𝛼 , 𝐹𝑛−1,𝑚−1,1−𝛼
2 2
Unilateral izq. 𝐻0 : 𝜎𝑋2 = 𝜎𝑌2 𝐻1 : 𝜎𝑋2 < 𝜎𝑌2 𝐹𝑛−1,𝑚−1,𝛼 , +∞
Unilateral der. 𝐻0 : 𝜎𝑋2 = 𝜎𝑌2 𝐻1 : 𝜎𝑋2 > 𝜎𝑌2 0, 𝐹𝑛−1,𝑚−1,1−𝛼

51
Ejemplo con R:
Dadas dos muestras aleatorias del gasto en telefonía realizado por
alumnos de la Facultad nos interesa saber si el gasto medio es el
mismo independientemente del sexo.

El objetivo es un contraste sobre la media para


muestras independientes. Las varianzas son
desconocidas, pero no sabemos si podemos
suponerlas iguales o no. Por tanto, en primer lugar,
debemos realizar un contraste sobre las
varianzas:

52
El contraste de hipótesis sería:
𝐻0 : 𝜎𝐻2 = 𝜎𝑀
2

𝐻1 : 𝜎𝐻2 ≠ 𝜎𝑀
2

• El valor del estadístico F es 0.6413271, los grados de libertad de la


distribución F de Fisher-Snedecor son 9 y 9 respectivamente.
• El p-valor del contraste bilateral es 0.51857, por lo tanto no se puede
rechazar la hipótesis nula de igualdad de varianzas.
• El valor del cociente de varianzas muestrales igual a 0.6413271

53
Ahora podemos aplicar el contraste para las medias suponiendo que las varianzas
son iguales.

• El valor del estadístico T es de -1.063528, los grados de libertad de la


distribución T de Student son 18.
• El p-valor del contraste bilateral es 0,3016, por lo tanto no se puede
rechazar la hipótesis nula de igualdad de medias.
• La media muestral de cada valor de sexo.
54
CONTRASTE DE HIPÓTESIS PARA MUESTRAS GRANDES NO
NORMALES

Si el tamaño muestral n es suficientemente grande, se puede hacer


uso de las propiedades asintóticas de los estimadores estudiados
anteriormente.

Intervalos de confianza para un parámetro cualquiera.

Si tenemos el estimador de máxima verosimilitud de 𝜃, llamémosle 𝜃


se sabe que asintóticamente se verifica
ˆ  
  N  0,1

n 
Var ˆ
Esta propiedad nos puede ayudar a realizar contrastes como

H 0 :   0
H1 :    0

55
TABLA RESUMEN

Contraste 𝑯𝟎 𝑯𝟏 R. Aceptación
Bilateral 𝐻0 : 𝜃 = 𝜃0 𝐻1 : 𝜃 ≠ 𝜃0 −𝑧1−𝛼 , 𝑧1−𝛼
2 2
Unilateral izq. 𝐻0 : 𝜃 = 𝜃0 𝐻1 : 𝜃 < 𝜃0 −𝑧1−𝛼 , +∞
Unilateral der. 𝐻0 : 𝜃 = 𝜃0 𝐻1 : 𝜃 > 𝜃0 −∞, 𝑧1−𝛼

56
Contraste de Hipótesis para la media 𝝁 de una población NO Normal

Supongamos que disponemos de una muestra aleatoria simple 𝑋1 , … , 𝑋𝑛


de una variable aleatoria NO Normal de media 𝜇
UTILIZANDO EL TEOREMA CENTRAL DEL LÍMITE

   X 
X   N  ,   n   N  0,1
n 
 n  n 

1 n
siendo X   X i
n i 1
Esto nos permite calcular el contraste de hipótesis análogo a como lo
hicimos antes:

Contraste 𝑯𝟎 𝑯𝟏 R. Aceptación
Bilateral 𝐻0 : 𝜇 = 𝜇0 𝐻1 : 𝜇 ≠ 𝜇0 −𝑧1−𝛼 , 𝑧1−𝛼
2 2
Unilateral izq. 𝐻0 : 𝜇 = 𝜇0 𝐻1 : 𝜇 < 𝜇0 −𝑧1−𝛼 , +∞
Unilateral der. 𝐻0 : 𝜇 = 𝜇0 𝐻1 : 𝜇 > 𝜇0 −∞, 𝑧1−𝛼

57
Contraste de hipótesis para proporciones
Se desea calcular un contraste para la proporción p de individuos de una
población que tiene una determinada característica.
Para ello se toma una muestra aleatoria de elementos de la población,
anotando un 1 si dicho elemento tiene la característica, y 0 en otro
caso, es decir, se tiene una muestra aleatoria {X1, X2, …, Xn} de una
distribución Binomial(1,p) o equivalentemente Bernoulli(p)

1 si tiene la característica con probabilidad p


X 
0 si NO tiene la característica con probabilidad 1- p
EX   p
Var  X   p 1  p 

 p 1  p  
Hemos visto en el tema anterior: pˆ  N  p, 
n   n 
 

58
CASO 1:
pˆ  p0 pˆ  p0
H 0 : p  p0 Rechazo si  z ó z 
p0 1  p0  2 p0 1  p0  1
2
H1 : p  p0 n n

CASO 2:
pˆ  p0
H 0 : p  p0 Rechazo si  z OJO!!!!
p0 1  p0 
H1 : p  p0
n

CASO 3:
pˆ  p0
Rechazo si  z1
H 0 : p  p0 p0 1  p0 
H1 : p  p0 n

59
TABLA RESUMEN

Contraste 𝑯𝟎 𝑯𝟏 R. Aceptación
Bilateral 𝐻0 : 𝑝 = 𝑝0 𝐻1 : 𝑝 ≠ 𝑝0 −𝑧1−𝛼 , 𝑧1−𝛼
2 2
Unilateral izq. 𝐻0 : 𝑝 = 𝑝0 𝐻1 : 𝑝 < 𝑝0 −𝑧1−𝛼 , +∞
Unilateral der. 𝐻0 : 𝑝 = 𝑝0 𝐻1 : 𝑝 > 𝑝0 −∞, 𝑧1−𝛼

60
Contrastes de hipótesis para la diferencia de dos proporciones

Se recogen sendas muestras aleatorias simples 𝑋1 , … , 𝑋𝑛 e 𝑌1 , … , 𝑌𝑛 de


las variables 𝑋 e 𝑌 donde

 1 si tiene la característica con probabilidad p X


X 
0 si NO tiene la característica con probabilidad 1- p X
E  X   pX
Var  X   p X 1  p X 

 1 si tiene la característica con probabilidad pY


Y 
0 si NO tiene la característica con probabilidad 1- pY
E Y   pY
Var Y   pY 1  pY 

61
De nuevo, para realizar el contraste para la diferencia de proporciones,
tenemos que usar:
pˆ X  pˆ Y   p X  pY 
  N  0,1
p X 1  p X  pY 1  pY 
n 


n m

pˆ X  pˆ Y   p X  pY 
Pero bajo H 0 : p X  pY se tiene que N  0,1
n 
1 1 
pˆ XY 1  pˆ XY    
dónde, n m
npˆ X  mpˆ Y
pˆ XY 
nm
OJO!!!!
CASO 1:
H 0 : p X  pY Rechazo si
pˆ X  pˆ Y
 z ó
pˆ X  pˆ Y
z 
H1 : p X  pY 1 1  1 1  1
pˆ XY 1  pˆ XY     2
pˆ XY 1  pˆ XY     2

n m n m

62
CASO 2:
H 0 : p X  pY pˆ X  pˆ Y
Rechazo si  z
1 1 
H1 : p X  pY pˆ XY 1  pˆ XY    
n m

CASO 3:
pˆ X  pˆ Y
H 0 : p X  pY Rechazo si  z1
1 1 
pˆ XY 1  pˆ XY     OJO!!!!
H1 : p X  pY n m

TABLA RESUMEN

Contraste 𝑯𝟎 𝑯𝟏 R. Aceptación
Bilateral 𝐻0 : 𝑝𝑋 = 𝑝𝑌 𝐻1 : 𝑝𝑋 ≠ 𝑝𝑌 −𝑧1−𝛼 , 𝑧1−𝛼
2 2
Unilateral izq. 𝐻0 : 𝑝𝑋 = 𝑝𝑌 𝐻1 : 𝑝𝑋 < 𝑝𝑌 −𝑧1−𝛼 , +∞
Unilateral der. 𝐻0 : 𝑝𝑋 = 𝑝𝑌 𝐻1 : 𝑝𝑋 > 𝑝𝑌 −∞, 𝑧1−𝛼
63

También podría gustarte