Está en la página 1de 24

L.A. – C.P.N.

ESTADÍSTICA 2019 FCE-UNCuyo

UNIDAD Nº 7 / PRUEBAS DE HIPOTESIS

1.- INTRODUCCIÓN
En la unidad anterior describimos los del hogar”, que podemos asumir que tiene una
procedimientos para hacer estimaciones puntuales densidad Bernoulli que depende del parámetro π
y por intervalos de los parámetros poblacionales, que en este caso representa la proporción de
como por ejemplo, estimar la tasa de presión mujeres que tienen alguna actividad laboral fuera
fiscal, estimar el porcentaje de amas de casa que de su hogar en la población considerada.
reconocen un producto por el color y forma del Puede alguien saber exactamente ¿cuál es ese
envase o estimar el nivel de ingresos de las porcentaje?, nadie puede saberlo; por lo tanto, esa
familias de cierta región. afirmación no corresponde necesariamente a un
Ahora bien, existen situaciones donde muchas hecho real.
afirmaciones que se escuchan a diario, que Se trata de una hipótesis estadística, y es
conciernen al campo de la estadística, pero se necesario validarla. Pero uno puede tener su
aborda la situación desde otra perspectiva. propia hipótesis basada en su experiencia. Por
ejemplo, puede ser: “el porcentaje de mujeres
Por ejemplo, tales como: que trabajan fuera del hogar es mayor al 55%”;
- El nivel medio de ventas para un producto ó también se podría cuestionar la afirmación
aumentó “significativamente” después de una inicial diciendo simplemente: “el porcentaje no
campaña publicitaria, es el 55%”.
- La vida media de las computadoras es 6 años, Para abordar estas situaciones se presentará
- El porcentaje de piezas defectuosas ha otra área de la inferencia conocida como “Prueba o
disminuido “significativamente”, después de contraste de una hipótesis estadística”. Como se
implementar un cambio en la tecnología verá, la prueba de una hipótesis estadística tiene
aplicada, una fuerte relación con el concepto de estimación.
- El 55% de las mujeres trabaja fuera del hogar, En términos generales, una hipótesis es una
- En cierta empresa multinacional no existen afirmación con respecto a alguna característica
diferencias significativas entre el sueldo desconocida de una población de interés. La esencia
promedio de hombres y el sueldo promedio de de probar una hipótesis estadística es el decidir si la
las mujeres en cargos gerenciales, afirmación se encuentra apoyada por la evidencia
experimental que se tiene a través de una muestra
En todos los casos, la afirmación se refiere a un aleatoria. De manera general, la afirmación
parámetro poblacional. Tengamos en cuenta que involucra a un parámetro de la distribución de
en general la variable aleatoria bajo estudio, interés a partir de la cual se obtiene una muestra
representada por X, tiene densidad aleatoria. La decisión acerca de si los datos
f X ( x, θ ) = f ( x, θ ) donde la forma de la muestrales apoyan estadísticamente la afirmación se
densidad (familia de distribución) es asumida toma con base en la probabilidad, y, si esta es
conocida excepto que contiene un parámetro pequeña, entonces será rechazada.
En gran medida, el enfoque de esta unidad será
desconocido.
Por ejemplo, en la afirmación “el 55% de las más intuitivo que teórico ya que el marco teórico
mujeres trabaja fuera del hogar”, la variable en el cual se fundamenta esta técnica escapa a los
aleatoria bajo estudio es X: “la mujer trabaja fuera contenidos de este curso.

2.- CONCEPTOS BÁSICOS 1


2.1- HIPÓTESIS ESTADÍSTICA
Para ilustrar la noción de una hipótesis estadística, veamos un ejemplo.

1
Probabilidad y Estadística, Aplicaciones y Métodos de George C. Canavos.
120
L.A. – C.P.N. ESTADÍSTICA 2019 FCE-UNCuyo

Ejemplo 1: supongamos que se tiene interés en el tiempo promedio necesario para terminar una unidad en una
línea de armado. Bajo condiciones de operación estándares, el objetivo es tener un tiempo promedio de armado
por unidad de a lo sumo 10 minutos. El gerente de la planta decide continuar con el proceso a menos que se
encuentre una evidencia sustancial de que el tiempo promedio es superior a 10 minutos.
Para este ejemplo la “Hipótesis Estadística” se podría plantear como,
H: “el tiempo promedio de armado por unidad es a lo sumo 10 minutos”, que es equivalente a escribir

H : µ ≤ 10

Ahora estamos en condiciones de dar una definición formal:

Definición
Una hipótesis estadística es una afirmación acerca de la distribución de una o más variables aleatorias, es
decir, es una afirmación acerca del valor del o los parámetros que identifican la distribución de una variable en
la población.
Si la hipótesis estadística especifica completamente a la distribución, es decir, se le indica un único valor al
parámetro se trata de una hipótesis simple; mientras que las hipótesis compuestas especifican un recorrido de
valores que puede tomar el parámetro.
En el ejemplo planteado al comienzo respecto de evaluar el tiempo promedio necesario para terminar una
unidad en una línea de armado, si planteamos
H : µ = 10 es una hipótesis simple
En cambio las siguientes opciones
H : µ ≤ 10 ó H : µ ≥ 10 ó H : µ ≠ 10
En todos los casos son hipótesis compuestas.

2.2.-HIPÓTESIS NULA E HIPÓTESIS ALTERNATIVA

En realidad en este procedimiento se plantean dos hipótesis acerca de los posibles valores de un parámetro. El
propósito principal de la prueba de hipótesis es hacer posible una elección adecuada entre dos hipótesis que se
refieren al valor de un parámetro.
Se llama hipótesis nula (H0) a la hipótesis a ser probada, generalmente se refiere a la hipótesis que
se quiere rechazar. Y el conjunto de valores del o los parámetros involucrados en dicha hipótesis se
escribe como Θ0 .
Tradicionalmente, se denomina nula la hipótesis que implica el valor existente del parámetro, o la que
suponemos más estable, siendo necesaria una elevada evidencia para rechazarla. En otras palabras, tienen el
beneficio de la duda.
La otra hipótesis que se plantea se llama hipótesis alternativa (H1) y es la hipótesis que se acepta cuando
es rechazada la hipótesis nula. Y el conjunto de valores del o los parámetros involucrados en dicha hipótesis se
escribe como Θ1 .
Si retomamos la situación planteada al comienzo, al considerar que bajo condiciones de operación
estándares, el objetivo es lograr un tiempo promedio de armado por unidad de a lo sumo 10 minutos. Las
hipótesis adecuadas para analizar este ejemplo son:
H0: “el tiempo promedio de armado por unidad es a lo sumo 10 minutos”,
H1: “el tiempo promedio de armado por unidad supera los 10 minutos”,
Que es equivalente a
H 0 : µ ≤ 10 versus H1 : µ > 10
Siendo Θ 0 = (0,10] (no tiene sentido considerar para la media valores negativos) y Θ1 = (10, ∞ )
Las hipótesis también podrían plantearse como…
H0: “Se continua con el proceso en una línea de armado”,
H1: “Se detiene el proceso en la línea de armado”,

Una hipótesis nula debe considerarse como verdadera a menos exista suficiente evidencia en contra. En otras
palabras, se rechazará la hipótesis nula de que el tiempo promedio de armado es a lo sumo 10 minutos, sólo si
la evidencia experimental así lo demuestra.

121
L.A. – C.P.N. ESTADÍSTICA 2019 FCE-UNCuyo

Un paralelo muy cercano a esta interpretación es el de los procesos judiciales en los que el acusado es inocente
hasta que no se demuestre lo contrario. Esto es, definiendo la hipótesis nula como “inocente”, se insiste en que
se rechazará sólo si el juicio proporciona evidencia suficiente en contra de ésta.
Ahora bien una vez planteadas las hipótesis recordemos que el gerente de la planta decide continuar con el
proceso a menos que se encuentre una evidencia sustancial de que el tiempo promedio es superior a 10 minutos.
La evidencia estará en una muestra aleatoria de tamaño n obtenida de la distribución de interés para el
tiempo de armado de una unidad. ¿Cómo debe decidirse si el proceso continúa en operación?, falta aún avanzar
en los temas para poder responder esta pregunta.
Hemos visto que la hipótesis nula enunciada involucra una afirmación, por lo que necesitamos una
“regla” que indique qué decisión tomar respecto de la hipótesis nula planteada una vez que se encuentre
disponible la evidencia muestral. Esta regla recibe el nombre de test o prueba de hipótesis.

2.3- TEST O PRUEBA DE UNA HIPÓTESIS ESTADÍSTICA (ττ)

Definición
Un “test” es una regla o procedimiento para decidir si se rechaza H0 a la luz de la información proporcionada
por una muestra extraída de la población bajo estudio.
Como la decisión se basa en la información que proporciona la muestra extraída de la población, se utiliza
un “representante” de la muestra que se comporte de una manera diferente cuando la hipótesis nula es
verdadera y cuando es falsa. Hemos visto que los “estadísticos” son medidas obtenidas desde la muestra que
utilizado en este contexto se lo reconoce como “estadístico de la prueba”.
Por ejemplo, recordando la hipótesis nula H 0 : µ ≤ 10 . Para un tamaño n dado de la muestra, suponemos a
modo de ejemplo que se decide Rechazar la Hipótesis Nula H 0 si se observa un valor de la media muestral
X que sean más grande que 12’. Entonces, X es el “estadístico de prueba”, x = 12 es un “valor crítico”,
y el conjunto de valores muestrales mayores a 12 constituyen la “Región Crítica de la Prueba” (ya
definiremos más adelante).

En el ejemplo: un posible test sería:


τ : Rechazar H0 ⇔ x > 12
Cabe aclarar en este punto que para escribir estos “test” o reglas que ayudan a tomar la decisión existen
teoremas y/o lemas que dadas las hipótesis planteadas, simples o compuestas y bajo ciertos supuestos
distribucionales en la población, proponen de manera teórica el “mejor” test para decidir entre las hipótesis
planteadas. Esta fundamentación desde el marco teórico no se verá en este curso. Por lo que plantearemos los
test intuitivamente, teniendo en cuenta los contenidos vistos en unidades anteriores.
Cuando se toma la decisión de rechazar la hipótesis nula, se opta en favor de la hipótesis alternativa, ya
que la evidencia muestral no es consistente con lo que propone la H0. Si la muestra no contradice
decididamente a H0 , se continúa creyendo en la validez de la hipótesis nula. Entonces, las dos conclusiones
posibles de un análisis por prueba de hipótesis son: Rechazar H0 o No rechazar H0 . En este sentido se dice
que la hipótesis nula es la hipótesis a ser probada.
Pero es importante recalcar en este punto que “rechazar una hipótesis no prueba que es falsa” sino que
significa que hay evidencia suficiente en los datos para tomar esa decisión. Como así también, “No Rechazar
una hipótesis no prueba que es verdadera” sino que significa que los datos son consistentes con lo que se
afirma ya que se puede acertar o fracasar en la decisión al no saber con certeza cuál es la verdadera.

2.4.-ZONA DE RECHAZO Y ZONA DE ACEPTACIÓN


Al establecer una regla de decisión para rechazar H0 estamos separando los posibles resultados muestrales en
dos regiones: la región de rechazo de la hipótesis nula y la de aceptación de la hipótesis nula.

CR= { (x1, ...,xn)/ (x1, ...,xn) es un valor observado de X1, .. . ,Xn para el cual se rechaza H0 }.
En nuestro ejemplo, de acuerdo a la regla antes enunciada:
{ }
C R = ( x1 , x2 ,..., xn ) / x > 12

122
L.A. – C.P.N. ESTADÍSTICA 2019 FCE-UNCuyo

Ahora bien, en el procedimiento de probar una hipótesis se puede acertar o fracasar en la decisión al no saber
con certeza cuál es la verdadera. En otras palabras, se pueden cometer errores al decidir entre las dos hipótesis
planteadas.

2.5.- TIPOS DE ERROR Y TAMAÑO DE LOS ERRORES

Considerando el ejemplo en el apartado 2.1 y las hipótesis


H0: “Se continua con el proceso en una línea de armado”,
Esto refleja que el tiempo promedio de armado por unidad es a lo sumo 10 minutos que es el estándar requerido.
H1: “Se detiene el proceso en la línea de armado”,
Esto refleja que el tiempo promedio de armado por unidad es superior a 10 minutos por lo que en ese caso el
gerente decide detener el proceso.

En este contexto, al decidir, se pueden cometer dos tipos de errores, que son:
-rechazar H0 cuando en realidad es verdadera,
-aceptar H0 cuando en realidad es falsa.

La situación queda reflejada en el cuadro siguiente:

Situación en la población
H0 H0
Verdadera Falsa
Correcta Errónea
Aceptar H0 Se decide continuar con el Se decide continuar con el proceso
proceso ya que se cumple a pesar de que no se cumple con el
con el estándar requerido. estándar requerido.
Decisión
Errónea Correcta
Rechazar H0 Se decide detener el proceso Se decide detener el proceso ya que
a pesar de que se cumple con no se cumple con el estándar
el estándar requerido. requerido.

2.5.1- Definiciones

Error de tipo I: Es rechazar la H0 cuando es verdadera, es decir se ha tomado una decisión errónea.
Error de tipo II: Es no rechazar la H0 (ó aceptar la H0) cuando es falsa, se ha cometido otro error.
En el caso que la hipótesis nula es cierta y se acepta, la decisión es correcta, lo mismo que cuando la hipótesis
nula es falsa y se rechaza.

Se llama tamaño del error de tipo I a la probabilidad de cometer un error de tipo I.

Tamaño del error tipo I = sup P( rechazar H0 │ H0 verdadera) = α

Se llama tamaño del error de tipo II a la probabilidad de cometer un error de tipo II.

Tamaño del error de tipo II = sup P(no rechazar H0 │ H0 es falsa) = β

Observación
La palabra “sup” indica el supremo de todos los valores de probabilidad con la condición dada. En la
hipótesis nula planteada H0: µ ≤ 10 (µ ≤ µ0) para cada uno de los infinitos valores de µ ≤ 10 que puede
tomar la probabilidad de rechazar la hipótesis nula cuando µ toma cada uno de estos valores es diferente. De
todos esos valores tomamos el mayor como tamaño del error de tipo I. Se puede probar que el mayor de estos
valores se obtiene en µ = µ0 , en el ejemplo en µ = 10.
Las definiciones anteriores son para el caso de hipótesis compuestas. Si las hipótesis fueran simples como

123
L.A. – C.P.N. ESTADÍSTICA 2019 FCE-UNCuyo

H 0 : µ = 10 versus H1 : µ = 15

Los tamaños de error son:

Tamaño del error tipo I = P( rechazar H0 │ H0 verdadera) = α

Tamaño del error de tipo II = P(no rechazar H0 │ H0 es falsa) = β

Veamos en este punto cómo se trabaja el tema de los errores medidos en términos de probabilidad.
Lógicamente uno desearía que fueran lo más pequeños posibles, esto es valores cercanos a cero, pero
lamentablemente esto no es posible de conseguir. Ya que si el tamaño de error de tipo I disminuye, el tamaño
de error de tipo II aumenta.
Se regresará a la analogía de un proceso judicial, como en el apartado 2.2. Si la hipótesis nula es
“inocente”, entonces, con toda seguridad, la hipótesis alternativa es “culpable”. El rechazo de la hipótesis nula,
implicaría que el juicio ha sido capaz de proporcionar suficiente evidencia para garantizar un veredicto de
culpable. Por otro lado, si el juicio no presenta evidencia sustancial, el veredicto será inocente. Esta decisión no
implica necesariamente que el acusado es inocente, más bien hace énfasis en la falta de evidencia sustancial
necesaria para condenar al acusado. Por lo tanto, en cierto sentido un veredicto de “culpable” (equivalente al
rechazo de H0) debe considerarse como una decisión más fuerte que un veredicto de “inocente” (equivale a
aceptar la H0), lo cual surge del principio judicial generalmente aceptado de que es peor condenar a una
persona inocente que dejar ir a una culpable.
Si el veredicto es culpable, se desea tener un grado muy alto de seguridad de que no se va a condenar a una
persona inocente. Por lo tanto en muchas situaciones el error de tipo I se considera como un error mucho más
grave que el error de tipo II.
En el marco de lo expuesto antes se trata de construir una prueba donde se establezca una probabilidad de
cometer un error de tipo I (α) pequeña. Y bajo esta condición, se trata de minimizar la probabilidad de cometer
un error de tipo II (β).

Entonces la idea es fijar, de antemano, cuál será el umbral para la probabilidad por debajo del cual
consideraremos que el riesgo de equivocarnos es “bajo” o no. Dicho valor se conoce como la significatividad
del contraste y es justamente la probabilidad de cometer el error de tipo I, es decir, α. Una interpretación del
mismo sería: α es la máxima probabilidad de equivocarnos que estamos dispuestos a asumir en caso de que
rechacemos la hipótesis nula. En la práctica el valor usual para α es 0.05.
En algunos casos utilizaremos los valores 0.01 ó 0.10 dependiendo de si queremos asumir menos o más
riesgo de equivocarnos, respectivamente, en caso de rechazar la hipótesis nula.

El siguiente cuadro resume los conceptos vistos:

Situación en la población
H0 H0
Verdadera Falsa
Aceptar 1-α β
H0 Nivel de confianza
Decisión Rechazar β
1-β
H0 α Potencia de la prueba
Suma 1 1

Nótese que cada una de estas probabilidades es una probabilidad condicional, y que la suma de las
probabilidades de cada columna es igual a 1, ya que los sucesos con los que están asociadas son
complementarios.

124
L.A. – C.P.N. ESTADÍSTICA 2019 FCE-UNCuyo

3.- MÉTODOS PARA PROBAR HIPÓTESIS ESTADÍSTICAS


3.1.- Estadístico de Prueba y P-Valor
En una situación de incertidumbre proveniente del muestreo realizado en una población, el problema de
decisión que se trata de resolver es el de elegir una entre dos proposiciones mutuamente excluyentes que se
refieren a un parámetro poblacional.
Para elegir entre aceptar la hipótesis nula (lo que equivale a rechazar la alternativa), o rechazar la hipótesis
nula (aceptando la alternativa), se tiene como única base la evidencia muestral.
Una técnica intuitiva muy útil para enunciar el “test”, es decir la “regla” que nos ayude a tomar la decisión,
es encontrar un estadístico que se comporte de una manera diferente cuando la hipótesis nula es verdadera y
cuando es falsa.
El método estándar para resolver este problema de decisión consiste, primero, en admitir que la hipótesis
nula es verdadera. Luego, usando la teoría de las probabilidades podemos establecer los criterios que
seguiremos para decidir si existe evidencia suficiente para rechazar la H0 . Finalmente, se toma una muestra,
se compara la evidencia muestral con los criterios y se decide si aceptamos o rechazamos H0.
Veamos un ejemplo para ir aclarando estas ideas.

Ejemplo 2
Para una cadena de supermercados las ventas del fin de semana adquieren especial importancia, aplicándoseles
a las mismas estrategias especiales de publicidad. Supongamos que los montos de las ventas de fin de semana
tienen distribución aproximadamente normal con media igual 5 (millones de $) desviación estándar igual a
500 (en unidades de mil $).
El gerente de marketing sospecha que el nivel de ventas está disminuyendo y decide investigar. Determinar
si la sospecha del gerente es válida a un nivel de significación igual a 0,05.
En este ejemplo la variable aleatoria la variable aleatoria es “montos de las ventas de fin de semana” y
suponemos que tiene una distribución normal, es decir,
X: montos de las ventas de fin de semana.
X∼ N (µ, σ 2)

El parámetro al cual se refiere la prueba es la media poblacional, y las hipótesis se podrían plantear como:
H 0 : µ = 5.000.000 versus H 1 : µ < 5.000.000
También es válido plantearlas como
H 0 : µ ≥ 5.000.000 versus H1 : µ < 5.000.000

En el segundo paso elegimos un estadístico que nos permita aceptar o rechazar la hipótesis nula, es decir, que
se comporte de forma distinta frente a la hipótesis nula y a la alternativa. Este estadístico debe satisfacer tres
condiciones:

1) Su función densidad de probabilidad ha de ser conocida al considerar que la hipótesis nula es verdadera.
2) Debe contener el parámetro al que ser refiere la prueba.
3) Todos los otros términos deben ser conocidos o calculables por medio de la muestra.

Para esta situación ya conocemos que X es un buen estimador de µ . Habrá que determinar la proximidad
de x respecto del valor supuesto en la hipótesis nula para µ. Porque un valor de x cercano a 5.000.000 nos
induciría aceptar H0, mientras que un valor mucho menor que 5.000.000 nos llevaría a rechazarla.

Entonces, teniendo en cuenta las condiciones expuestas antes, deberíamos considerar un estadístico a partir de
X − µ 0 (µ 0 valor especificado del parámetro en la hipótesis nula), cuya distribución de muestreo sea
conocida cuando la hipótesis nula es verdadera. Así podremos decidir si la diferencia lleva a un valor
razonablemente posible de la distribución, es decir con alta probabilidad, o se trata de un valor raro con baja
probabilidad. Frente a esta última situación podemos sospechar que la hipótesis nula no es verdadera.

125
L.A. – C.P.N. ESTADÍSTICA 2019 FCE-UNCuyo

Para decidir, podemos considerar como estadístico de prueba a


X − µo
Z0 =
σ
n
El símbolo µ0 es el valor de µ especificado por la hipótesis nula. La distribución de Z0 ∼ N(0,1), bajo la
hipótesis nula verdadera . De hecho si la hipótesis nula es verdadera, el valor de este estadístico será cercano
a cero , en cambio, cuando la hipótesis alternativa sea la verdadera, será “muy pequeño”, es decir lejano al
cero hacia la izquierda en términos de variable aleatoria Z,
En consecuencia, un test natural para estas hipótesis es:
x − µo
τ : Rechazar H 0 ⇔ z 0 = < zα (1)
σ
n
zα es un valor crítico que también se suele escribir como zc , en términos de la variable Z, que se obtiene a
partir de α, fijado de antemano que recordemos que es el nivel de significación y representa la máxima
probabilidad de equivocarnos que estamos dispuestos a asumir en caso de que rechacemos la hipótesis nula.
Fijado el nivel para el error de tipo I, por ejemplo si α = 0.05, resulta z c = z 0.05 = −1.645
Observemos que esto determina una región crítica en términos de la distribución de Z que es
C R = (− ∞,−1.645] que se reconoce como Zona de Rechazo de la hipótesis nula y es el área debajo de la curva
Normal estándar que corresponde a esos valores.
En base a resultados observados en una muestra de tamaño igual a 9, se obtiene
x = $4.650.000, calculamos el valor observado del estadístico de prueba en la muestra que llamamos z 0

x − µo 4.650 .000 − 5.000 .000


z0 = = = −2,1
σ 500.000 / 3
n

En esta instancia sepodría decidir, con el test enunciado anteriormente (1), dado que
z 0 = −2,1 < z 0.05 = −1.645 que Rechazamos la H0.
Lo que ocurre es que hemos llegado a esta conclusión teniendo en cuenta un valor fijado arbitrariamente de
antemano, como es el nivel de significación α, sin tomar en cuenta el “peso” de la evidencia muestral.
En este sentido la duda que nos planteamos es, ¿provee el valor z 0 = − 2,1 del estadístico del test
suficiente evidencia para rechazar la hipótesis nula a favor de la alternativa?
¿Cómo podemos medir el peso de la evidencia que nos proporciona la muestra, en términos estadísticos,
para rechazar una hipótesis nula a favor de la hipótesis alternativa?
El peso de la evidencia para rechazar la hipótesis nula se llama p-level o p- valor o nivel de significación
alcanzado por la prueba.
Primero calcularemos este valor a partir del ejemplo planteado y luego presentaremos su definición.

Para saber si z0 es un valor raro, es decir se encuentra en una zona de baja probabilidad de la distribución del
estadístico de prueba, calcularemos la probabilidad asociada al mismo

126
L.A. – C.P.N. ESTADÍSTICA 2019 FCE-UNCuyo

 
 
X − µ
P o
< −2,1 µ o = 5.000.000  = pnorm (− 2.1) = 0.01786442
 σ 
 
 n 
El área por debajo de la Normal Estándar para valores menores o iguales a -2.1 es 0,01786442. Esto quiere
decir que si la hipótesis nula fuera cierta, obtendríamos menos de dos veces cada 100 un valor tan o más
extremos que -2.1 en la dirección de la hipótesis alternativa (hacia valores menores). Esta es una frecuencia
muy baja, uno sospecha que la diferencia entre media muestral y µ 0 no es atribuible al azar. Por lo tanto
sospechamos de la validez de la H0.

Definición p-valor:
El área, bajo de la distribución del estadístico de prueba (en este caso la Normal Estándar) para valores tan o
más extremos como el valor observado del estadístico del test en dirección de la hipótesis alternativa, se llama
p-valor o p- level. Corresponde a la proporción de valores del estadístico del test, tan o más extremos, que se
obtendrían como resultado del muestreo aleatorio si la hipótesis nula fuera verdadera. Cuanto más pequeño sea
el p- valor, tanto mayor será la evidencia a favor de la hipótesis alternativa.
A medida que el estadístico de prueba se adentra en la región de rechazo, el peso de la evidencia para
rechazar la hipótesis nula es más decisivo y el valor p se hace más pequeño.
El criterio para decidir en base al p-valor en una prueba es el siguiente:
τ: Rechazar H0 ⇔ p-valor < α
Si al realizar un test, el valor-p resulta menor que α, decimos que la diferencia observada con el valor
especificado en la hipótesis nula es estadísticamente significativa con un nivel α.

En el ejemplo,
 
 
X − µ
p − valor = P  o
< −2,1 µ o = 500.000  = 0.01786442
 σ 
 
 n 
Si comparamos el p-valor con α, resulta
p-valor = 0.01786442 < α= 0.05.

Entonces, rechazamos la hipótesis nula y concluimos que µ es significativamente menor que $5.000.000.
La figura siguiente muestra el tamaño del error de tipo I (sombreado) y el p-valor (punteado sobre el
sombreado). Claramente el valor p es menor que el mayor error aceptado (0.05) lo cual indica que el valor
observado del estadístico de prueba se encuentra en la zona de rechazo.

Es importante además de tomar la decisión de rechazar o no la hipótesis nula, interpretar en términos del
problema. En este ejemplo, el p-valor es menor que el nivel de significación del test, entonces se rechaza H0 .
187
L.A. – C.P.N. ESTADÍSTICA 2019 FCE-UNCuyo

La muestra estaría confirmando la sospecha del gerente y se concluye que el nivel medio de ventas de fin de
semana es menor a $5.000.000.

En la práctica los tests de hipótesis se realizan utilizando programas estadísticos que muestran
los valores-p.

El camino seguido para tomar la decisión es habitual y se repite siempre de la misma manera, tal es así que
podrían resumirse en los siguientes pasos:

1. Plantear las hipótesis nula y alternativa.


2. Determinar el estadístico apropiado para la prueba y el test correspondiente.
3. Fijar el tamaño del error de tipo I.
4. Tomar la muestra y calcular el valor observado del estadístico de la prueba.
5. Calcular el valor p.
6. Tomar la decisión estadística e interpretar.

En el ejemplo anterior se consideró la hipótesis alternativa, H1 : µ X < µ 0 , para la misma situación anterior,
consideraremos en el siguiente cuadro las distintas hipótesis alternativas que podríamos encontrar y la forma de
hallar el valor-p para cada una de ellas.
Estamos bajo el supuesto de una población Normal, X∼ N(µ, σ2), con σ 2 conocida, entonces Z ∼ N(0,1), es el
estadístico de prueba apropiado según el problema, y zo el valor observado a partir de la muestra considerada.

Hipótesis Nula Estadístico de prueba bajo H0

X − µo
Z0 = ~ N (0,1)
H 0 : µ X = µ0 σ
n

Hipótesis Alternativa test τ : Rechazar H0 ⇔ p-valor<α

H1 : µ X ≠ µ 0 p − valor = P ( Z > z 0 ) = 2 .P (Z > z 0 )


H1 : µ X > µ 0 p − valor = P(Z > z 0 )
H1 : µ X < µ 0 p − valor = P(Z < z 0 )

3.2.- CON INTERVALOS DE CONFIANZA


Sean las hipótesis:
H 0 : µ = µ 0 versus H1 : µ ≠ µ 0
Si la hipótesis nula es verdadera la media muestral X debería estar cerca de µ 0 por lo tanto construiremos un
intervalo alrededor de µ , si el µ 0 cae adentro de dicho intervalo aceptamos la hipótesis nula, sino la
rechazamos.

Entonces, un intervalo de confianza bilateral (ya que la prueba planteada es bilateral) será
(l1 ( X 1 ,.., X n ) , l 2 ( X 1 ,...X n )) con un nivel de confianza γ.
Un test apropiado es
τ : Rechazar H 0 ⇔ µ 0 ∉ (l1 (x1 ,...xn ) , l2 (x1 ,...xn ))
Donde (x1 ,...xn ) es la muestra observada.
188
L.A. – C.P.N. ESTADÍSTICA 2019 FCE-UNCuyo

Volvamos sobre el ejemplo 2, si consideramos las hipótesis:

H 0 : µ ≥ 5.000.000 versus H1 : µ < 5.000.000

Debemos calcular un intervalo unilateral (ya que la prueba planteada es unilateral), ¿de qué forma? Si H0 es
verdadera, la media muestral deberá tomar valores iguales o mayores a $5.000.000 (µ 0 ) por lo tanto
( )
construiremos un intervalo para µ , de la forma − ∞ , a si el µ 0 cae adentro de dicho intervalo aceptamos la
hipótesis nula, sino la rechazamos.
El test apropiado es:
τ : Rechazar H 0 ⇔ µ 0 = 5.000.000 ∉ (− ∞ , a )
En el ejemplo anterior para el valor observado de la muestra, el intervalo de γ = 1 − α = 0.95 es
(− ∞ , 4.924.142 ) .
Como µ 0 = 5.000.000 ∉ (− ∞ , 4.924.124) , rechazamos H0.

4.- PRUEBAS DE HIPÓTESIS PARA MUESTRAS DE POBLACIONES NORMALES


4.1.- TEST PARA LA MEDIA
Sea X1, ..., Xn una muestra aleatoria de una densidad normal con media µ y varianza σ 2. Supongamos que
estamos interesados en una prueba para la media µ.

Consideremos las hipótesis:


H 0 : µ = µ 0 versus H1 : µ ≠ µ 0

1. Supongamos que se conoce la varianza σ 2


El estadístico de prueba es:
X − µo si H0 es verdadera.
Z0 = ~ N (0,1)
σ
n
El test lo podemos escribir,

x − µo
τ : Rechazar H 0 ⇔ z 0 = > z1−α / 2 ,
σ
n
o equivalentemente comparando las áreas,
 
 
 X − µ
τ : Rechazar H 0 ⇔ p − valor = P o
> z0 µ = µ o  < α .
 σ 
 
 n 
Fijado el tamaño del error de tipo I, α, hallaremos el p-valor que determinará en forma equivalente si
rechazamos o no la hipótesis nula. Es decir,

   
   
p-valor = P  X − µ o > z 
µ =µ0 = 2 P 
X − µ0
> z0 µ = µ0 
 σ 0
  σ 
   
 n   n 
189
L.A. – C.P.N. ESTADÍSTICA 2019 FCE-UNCuyo

dada la simetría respecto del cero de la distribución N(0,1).

2. Supongamos que se desconoce la varianza σ 2


Para resolver los problemas que involucran Pruebas de Hipótesis respecto de la media poblacional µ cuando σ
2
es desconocida, debe utilizarse otro estadístico.
El estadístico de prueba adecuado es X − µo , que bajo la H0 verdadera tiene distribución t de
T0 = ~ t n −1
S
n
Student donde (n − 1) son los grados de libertad, siempre bajo el supuesto de Normalidad en la población.

Ejemplo 3
Una agencia inmobiliaria publicita que el tiempo medio que tarda en vender una casa es de 40 días o menos
desde que se les encarga la operación. Compruebe si la publicidad puede considerarse fidedigna.
En este ejemplo la variable aleatoria es “el tiempo de demora en vender una propiedad” y suponemos que
tiene una distribución normal, es decir,
X: tiempo de demora en vender una propiedad y X∼ N (µ,σ 2)
Las hipótesis serían las siguientes:
H 0 : µ ≤ 40 versus H 1 : µ > 40

El estadístico de prueba es X − 40 si H0 es verdadera.


T0 = ~ t (n −1)
S
n
Si llamamos t = x − 40 al valor observado del estadístico de prueba, el test correspondiente es
0
s
n
x − 40
τ : Rechazar H 0 ⇔ t 0 = > t c = t1−α ,n −1
s/ n
o en forma equivalente,
τ : Rechazar H 0 ⇔ p − valor < α
Teniendo en cuenta que el
 X − 40   X − 40 
p − valor = sup P  > t 0 µ ≤ 40  = P  > t 0 µ = 40 
 S/ n   S/ n 

Dado que una muestra de 25 ventas recientes da un tiempo medio de ventas de 45 días y una desviación
estándar de 20 días, es decir x = 45 y s = 20 , obtenemos t0 = 1.25. Así el p-valor es (calculando con R):

p − valor = P (T0 > 1,25 ) = 1 − pt (1.25,24) = 0.1116757

Aún sin haber fijado un tamaño de error de tipo I para este test, sabemos que este p-valor es demasiado grande
para rechazar la hipótesis nula. En efecto, el valor de α debería ser mayor que este valor para rechazarla lo
cual no es aceptado en ningún contexto. Luego, no rechazamos la hipótesis nula y concluimos que la media no
es significativamente mayor que 40 días y por lo tanto la publicidad puede considerarse fidedigna.

En el ejemplo anterior se consideró la hipótesis alternativa, H1 : µ X > µ 0 , para la misma situación


anterior consideraremos en el siguiente cuadro las distintas hipótesis alternativas que podríamos encontrar y la
forma de hallar el valor-p para cada una de ella

190
L.A. – C.P.N. ESTADÍSTICA 2019 FCE-UNCuyo

Hipótesis nula Estadístico de prueba bajo H0

H 0 : µ X = µ0 T0 =
X − µo
~ t( n −1)
S
n
Hipótesis test τ : Rechazar H0 ⇔ p-valor<α Comando R, para un α = 0.05
alternativa

H1 : µ X ≠ µ 0 p − valor = P ( T > t 0 ) = 2 .P (T > t 0 ) t.test (x, mu=µ 0)

H1 : µ X > µ 0 p − valor = P (T > t 0 ) t.test (x, mu=µ 0, alternative=”greater”)

p − valor = P (T < t 0 )
H1 : µ X < µ 0 t.test (x, mu=µ 0, alternative=”less”)

4.2.- TEST PARA LA VARIANZA POBLACIONAL

Sea X1,. . .,Xn una muestra aleatoria de una población normal con media µ y varianza σ2.
Consideremos las hipótesis:
H 0 : σ 2 = σ 02 versus H 0 : σ 2 ≠ σ 02

El estadístico de prueba apropiado es U 0 = (n − 1) S ~ χ n2−1 si H0 es verdadera


2

2
σ0
El test asociado es,
τ : Rechazar H 0 ⇔ u 0 < χ α2 / 2 ,n −1 ∨ u 0 > χ12−α / 2,n −1

Donde u 0 = (n − 1) s es el valor observado del estadístico de prueba con la muestra observada. Y los cuantiles
2

2
σ 0

χ α / 2 ,n−1 y χ
2 2
1−α / 2 ,n −1
son los valores críticos determinados por el valor de α, en la distribución del estadístico
de prueba.
El test planteado considerando el p-valor resulta

  (n − 1) S 2   ( n − 1) S 2  
τ : Rechazar .H 0 ⇔ p − valor = 2 min  P > u  
0  ; P < u 0  <α
  σ 0   σ0
2 2
 

Ejemplo 4
Suponga que alguien piensa comprar los derechos de distribución de los productos de cierta fábrica. Se sabe que las
utilidades mensuales provenientes de esta concesión se distribuyen normalmente. Lo que ahora interesa es la
variabilidad de las utilidades mensuales, pues dicha variabilidad es una medida del riesgo que se asume en el negocio.
El interesado decide que, si la desviación estándar de las utilidades es diferente de 8 (en miles de pesos),
no comprará los derechos de la distribución.
En este ejemplo la variable aleatoria es “utilidades mensuales obtenidas” y suponemos que tiene una
distribución normal, es decir,
X: utilidades mensuales y X∼ N (µ,σ 2)

El parámetro al cual se refiere la prueba es la varianza ( o de manera equivalente el desvío) poblacional, y las
hipótesis se podrían plantear como:
191
L.A. – C.P.N. ESTADÍSTICA 2019 FCE-UNCuyo

H 0 : σ = 8 versus H1 : σ ≠ 8
Que es equivalente a
H 0 : σ 2 = 64 versus H1 : σ 2 ≠ 64

O también de una forma más general,


H 0 : σ 2 = σ 02 versus H1 : σ 2 ≠ σ 02

Así, si se acepta H0 lo procedente sería hacer la inversión, en tanto que si se acepta H1 convendría no
hacerla.

El estadístico de prueba apropiado, bajo el supuesto que µ es desconocida será:


(n − 1) S 2
U0 = ~ χ (2n−1) si H0 es verdadera
64
Y el test correspondiente:
  (n − 1) S 2   ( n − 1) S 2 
τ : Rechazar .H 0 ⇔ p − valor = 2 min  P < u 0 σ 2 = 64 ;  > u 0 σ 2 = 64  < α
  64   64 

Supóngase que se decide tomar una muestra de tamaño n=12 y que se elige α= 0,05.

Suponga que la muestra da una varianza s2= 36. El valor del estadístico de prueba es u 0 = 11× 36 = 6.1875 .
64
El p-valor resulta,
  (n − 1) S 2   ( n − 1) S 2 
p − valor = 2 min  P < 6.1875 σ 2 = 64 ; P > 6.1875 σ 2 = 64 
  64   64 
= 2 min{pchisq(6.1875,11), 1 − pchisq (6.1875,11)}
= 2 min{0.1394348, 0.8605652} ≈ 0.28

Este valor es (además de mayor que α) demasiado grande para que pueda rechazarse la hipótesis nula. En la
gráfica siguiente vemos que si quisiéramos representar el valor de α dado que en la hipótesis alternativa figura
el signo “distinto de”, esta valor de α (como el p-valor) representaría un área repartida en las dos colas de la
distribución chi-cuadrado con once grados de libertad. α/2 a la izquierda y α/2 a la derecha (p-valor/2 a la
izquierda y p-valor/2 a la derecha).

Por lo tanto no se rechaza la hipótesis nula con lo cual es aconsejable invertir dinero en el negocio, pues se
considera que la varianza de las utilidades mensuales no es significativamente diferente de 64.

192
L.A. – C.P.N. ESTADÍSTICA 2019 FCE-UNCuyo

Si utilizamos un intervalo de confianza para probar las hipótesis de este ejemplo, el camino a seguir es:
(n − 1) S 2
1- Elegir una cantidad pivotal: Q= ~ χ (2n−1)
σ2

2- Construir un intervalo de confianza de la forma (a ; b)


Recordemos que P χ 2  reemplazando la cantidad pivotal y despejando σ2 el
 1−γ ,n −1 < Q < χ 1+γ ,n −1  = γ = 1 − α
2

 2 2 
 
intervalo que resulta es  (n − 1) S 2 ( n − 1) S 2  .
 2 ; 2 
 χ 1+γ , n−1 χ 1−γ , n−1 
 2 2 
En el ejemplo, α=0.05=1-γ, de donde γ=0.95 y χ 12−γ = χ 02.025,11 ≈ 3.82 además
, n −1
2

χ 12+γ , n − 1 = χ 02.975, 11 ≈ 21.92 .


2

Dado que s 2 = 36 , el intervalo de confianza del 95% para σ 2 resulta: (18.07 ;L103.66) .

3- Determinar el test y concluir,


τ : Rechazar H 0 ⇔ σ 02 ∉ (18.07;103.66 )
Como σ 02 = 64 ∈ (18 .07;103 .66 ) no se rechaza H0 , la misma conclusión que antes , con lo cual es
aconsejable invertir dinero en el negocio, pues se considera que la varianza de las utilidades mensuales no es
significativamente diferente de 64.

Es decir, en forma general, para las hipótesis:


H 0 : σ 2 = σ 02 versus H1 : σ 2 ≠ σ 02
El test lo podemos escribir:
 
 (n − 1) s 2 (n − 1) s 2 
τ : Rechazar H 0 ⇔ σ ∉  2  donde γ = 1 − α
2
, 2
χ χ
0
 1+γ , n−1 1−γ
, n −1

 2 2 

En el ejemplo anterior se consideró la hipótesis alternativa, H1 : σ 2 ≠ σ 02 , para la misma situación anterior


consideraremos en el siguiente cuadro las distintas hipótesis alternativas que podríamos encontrar y la forma de
hallar el valor-p para cada una de ellas.

Hipótesis Nula Estadístico de prueba bajo H0

( n − 1) S 2
H 0 : σ 2 = σ 02 U0 = ~ χ n2−1
σ0 2

Hipótesis
Alternativa
test τ : Rechazar H0 ⇔ p-valor<α

H1 : σ 2 ≠ σ 02 p − valor = 2 min {P(U 0 > u 0 ) ; P (U 0 < u 0 ) }

H1 : σ 2 > σ 02 p − valor = P(U 0 > u 0 )

H1 : σ 2 < σ 02 p − valor = P (U 0 < u 0 )

193
L.A. – C.P.N. ESTADÍSTICA 2019 FCE-UNCuyo

5.- PRUEBAS DE HIPÓTESIS ACERCA DE LOS PARÁMETROS DE OTRAS


DISTRIBUCIONES NO NORMALES.
5.1- TEST PARA LA PROPORCIÓN DE BERNOULLI.
En muchas situaciones, el parámetro a probar es la proporción de observaciones que poseen cierto atributo.
Cuando las observaciones son independientes entre sí (por muestreo con reposición) y el atributo de interés
ocurre o no ocurre en cada observación, el estadístico de prueba apropiado es asintóticamente normal.

Sean las siguientes hipótesis:


H 0 : π = π 0 versus H1 : π ≠ π 0

El estadístico de prueba a utilizar es X −πo ~ N (0,1)


Z0 = →
π o (1 − π o )
n
Por el Teorema del Límite Central, si n → ∞

Ejemplo 5
Se tiene que reparar una máquina en cierta fábrica si produce más de 10% de artículos defectuosos del gran
lote de producción de un día. Una muestra aleatoria de 100 artículos de la producción diaria contiene 18
defectuosos, y el capataz decide que debe repararse la máquina. ¿La evidencia de la muestra apoya su
decisión? Utilice α= 0,01.
En este ejemplo la variable aleatoria es “el artículo seleccionado resulta defectuoso” y podemos suponer
que tiene una distribución Bernoulli, es decir,
X: el artículo seleccionado resulta defectuoso y X∼ B (π)
El parámetro al cual se refiere la prueba es la proporción de artículos defectuosos en la población y las
hipótesis se podrían plantear como:

H 0 : π = 0.10 versus H1 : π > 0.10


Que es equivalente a plantear
H0: “No debe reparase la máquina” verus H1: “Debe reparase la máquina”
El estadístico de prueba es:
X −π0 ~

bajo H0 verdadera
Z0 = N (0,1)
π 0 (1 − π 0 ) n →∞

n
Y el test correspondiente es:
τ : Rechazar H 0 ⇔ z 0 > z c = z1−α

o de forma equivalente,
 
 
X −π0
τ : Rechazar H 0 ⇔ p − valor = P  > z0 π = π 0  < α
 π 0(1 − π 0 ) 
 
 n 
Reemplazando en el estadístico de prueba el valor observado de la muestra,

0,18 − 0,10
z0 = = 2.67
0,10. 0,90
100
Luego,
194
L.A. – C.P.N. ESTADÍSTICA 2019 FCE-UNCuyo

 
 
X − 0 ,10
p − valor = P  > 2 ,67 π = 0 ,10  = 1 − pnorm ( 2 .67 ,0 ,1) = 0 .0038
 0 ,10 × 0 ,90 
 
 100 

Este p-valor nos da la posibilidad de rechazar la hipótesis nula siempre que consideremos un tamaño de error
de tipo I mayor, por ejemplo, α=0.05. Con este tamaño de error rechazamos la hipótesis nula y por lo tanto la
evidencia de la muestra apoyaría la decisión adoptada por el capataz.

5.2.- PRUEBAS DE HIPÓTESIS ACERCA DE LOS PARÁMETROS DE OTRAS


DISTRIBUCIONES NO NORMALES.

En los casos en que se deban realizar pruebas de hipótesis para los parámetros referidos a otras distribuciones
No Normales (Poisson, Uniforme, Pareto, etc…) recurriremos al teorema del límite central si el tamaño de
muestra es lo suficientemente grande.

6.- PRUEBAS DE HIPÓTESIS PARA LOS PARÁMETROS DE DOS


POBLACIONES NORMALES
6.1.- INTRODUCCIÓN

Consideremos dos poblaciones Normales e independientes N µ X ,σ X2 ( ) y N (µ Y )


,σ Y2 . De cada una de esas
poblaciones se extraen muestras aleatorias X 1 , X 2 ,..., X n y Y1 , Y2 ,..., Ym de tamaños n y m
respectivamente e independientes entre sí.
En este contexto, las Pruebas de Hipótesis se plantean para comparar las medias de ambas poblaciones
µ X y µY y también la variabilidad de ambas poblaciones es decir σ X y σ Y ya que en general los
2 2

parámetros son desconocidos.


Por ejemplo, es interesante evaluar la diferencia de medias poblacionales, µ X − µ Y , para ver si son
iguales, lo que implica que la diferencia es nula. O bien una mayor que la otra, lo que implica que la diferencia
es positiva o negativa.
Ya que X es un estimador de µ X , Y es un estimador de µ Y , tenemos entonces que la estadística de la
prueba apropiada es la diferencia de las medias muestrales X − Y , la cual se utilizará para estimar
µ X − µY la diferencia de las medias poblacionales.
Y, además se puede afirmar que la distribución es este estimador, si las muestras han sido extraídas de
poblaciones Normales independientes entre sí, es

 σ2 σ2 
X −Y ~ N  µ X − µY , X + Y 
 n m

Entonces es necesario saber en primer lugar si las varianzas poblacionales son conocidas o no lo son.

195
L.A. – C.P.N. ESTADÍSTICA 2019 FCE-UNCuyo

6.2.- TEST PARA LA DIFERENCIA DE MEDIAS DE DOS POBLACIONES NORMALES


INDEPENDIENTES CON VARIANZAS CONOCIDAS

Bajo los supuesto considerados en la introducción, supongamos que estamos interesados en realizar una prueba
para probar la igualdad de medias poblacionales, µ X = µY , ó lo que lo mismo la diferencia de medias
poblacionales µ X − µY = 0 , o más general aún podemos plantear la diferencia es igual a un cierto valor δ0 .
Supóngase que se desea probar la hipótesis nula.

H 0 : µ X − µY = 0
Contra una de las siguientes alternativas
H 1 : µ X − µY ≠ 0 , H 1 : µ X − µY > 0 ó H 1 : µ X − µY < 0

Parece razonable rechazar la hipótesis nula si un valor de X − Y , con base en la muestra aleatoria, es lo
suficientemente diferente, mayor ó menor que cero, dependiendo de la hipótesis alternativa considerada.
Entonces necesitamos determinar la distribución de X − Y

 2 
Como X − Y ∼ N  µ X − µY , σ X + σ Y 
2

 n m 

Entonces

X − Y − (µ X − µ Y )
Z= ∼ N (0,1)
σ X2 σ Y2
+
n m
Si la hipótesis nula es verdadera tenemos µ X − µY = 0 , por lo tanto el estadístico de prueba es
X −Y si H0 es verdadera.
Z0 = ∼ N (0,1)
σ 2
σ 2
X
+ Y
n m

 Si la hipótesis alternativa es: H 1 : µ X − µY ≠ 0


El test τ es,
τ : Rechazar H 0 ⇔ z0 > z1−α / 2 , o bien

τ : Rechazar H 0 ⇔ p − valor = P( Z 0 > z 0 µ X − µ Y = 0) = 2 P (Z 0 > z 0 µ X − µ Y = 0) < α

 Si la hipótesis alternativa es: H 1 : µ X − µ Y > 0


El test τ es,
τ : Rechazar H 0 ⇔ z0 > z1−α , o bien

τ : Rechazar H 0 ⇔ p − valor = P (Z 0 > z 0 µ X − µY = 0 ) < α


 Si la hipótesis alternativa es: H 1 : µ X − µY < 0
El test τ es,
τ : Rechazar H 0 ⇔ z 0 < zα , o bien
τ : Re chazar H 0 ⇔ p − valor = P (Z 0 < z0 µ X − µY = 0 ) < α

Fijado el tamaño del error de tipo I, α, hallamos el p-valor para saber si z0 cae en la región de rechazo o no.
Para esto comparamos el p-valor con α.
196
L.A. – C.P.N. ESTADÍSTICA 2019 FCE-UNCuyo

En el caso de utilizar un Intervalo de Confianza, el planteo es el siguiente. Supongamos tenemos las


siguientes hipótesis para evaluar simplemente si las medias poblacionales pueden considerarse iguales o no,

H 0 : µ X − µY = 0 versus H 1 : µ X − µY ≠ 0

Construyendo el Intervalo de Confianza a partir de la cantidad pivotal

Q=
(X − Y ) − (µ X − µY )
~ N (0 ,1)
σ X2 σ Y2
+
n m
Un test apropiado es
 

(
τ : Rechazar H 0 ⇔ 0 ∉  X − Y − z 1−α )  σ X2 σ Y2 
 n + n  ; X − Y − zα
  ( )  σ X2 σ Y2 
n + n 
  

 2  X Y  2  X Y 

6.3.- TEST PARA EL COCIENTE DE VARIANZAS DE DOS POBLACIONES NORMALES


INDEPENDIENTES

Si las varianzas poblacionales no son conocidas, que es lo que sucede habitualmente, hay que determinar si es
que son iguales, es decir σ X2 = σ Y2 = σ 2 o bien si son distintas σ X2 ≠ σ Y2 . Para lograr este propósito planteamos
una Prueba de Hipótesis para evaluar el supuesto mencionado antes.

Consideremos la prueba para la hipótesis


H 0 : σ X2 = σ Y2
Contra una de las siguientes hipótesis alternativas:

H 1 : σ X2 ≠ σ Y2 , H 1 : σ X2 > σ Y2 o H 1 : σ X2 < σ Y2
Los estadísticos de interés son las varianzas muestrales S X2 y S Y2

 Para la H 1 : σ X2 ≠ σ Y2 , , parece razonable rechazar la hipótesis nula si el estimador S X2 es


suficientemente diferente de S Y2 .
 En el caso de las hipótesis: H 1 : σ X2 > σ Y2 , , un valor del estimador S X2 suficientemente
2
mayor que S nos conduciría al rechazo de la H0.
Y

 En el caso de las hipótesis: H 1 : σ X2 < σ Y2 , , un valor del estimador S X2 suficientemente


2
menor que S nos conduciría al rechazo de la H0
Y

Debemos determinar la distribución del estadístico de prueba a considerar.


S Y2
V = (m − 1)
2
Recordemos que las cantidades U = (n − 1) S X y en virtud de la independencia de las
2
σX σ Y2
muestras son dos variables aleatorias independientes, con distribución chi-cuadrada con n − 1 y (m − 1) ( )
grados de libertad respectivamente.

Entonces F =
U
(n − 1) tiene una distribución F de Snedecor con (n − 1) y
(m − 1) grados de libertad.
V
(m − 1)

197
L.A. – C.P.N. ESTADÍSTICA 2019 FCE-UNCuyo

S X2
Luego el estadístico F = σ X2 tiene una distribución F de Fisher-Snedecor con (n − 1) y (m − 1) grados de
SY2
σ Y2
libertad.
Como el estadístico considerado F establece un “cociente de varianzas” es muy común escribir las hipótesis
de la siguiente forma…
σ X2 σ X2
H0 : =1 versus H1 : ≠1
σ Y2 σ Y2
O también
σ X2 σ X2
H0 : ≤1 versus H1 : >1
σ Y2 σ Y2
O también
σ X2 σ X2
H0 : ≥1 versus H1 : <1
σ Y2 σ Y2
En todos los casos, bajo la hipótesis nula verdadera, σ X2 = σ Y2 ,  σ X = 1 el estadístico de prueba se reduce a
2

σ2 
 Y 
2
S
F0 = X2
SY

Dado que la distribución F de Fisher-Snedecor es asimétrica y con probabilidades no nulas sólo en intervalos
de números positivos (similar a la distribución chi-cuadrado utilizada como distribución del estadístico de
prueba para hipótesis sobre la varianza de una población normal), los p-valores asociados a hipótesis sobre la
comparación de dos varianzas se calculan de manera equivalente al caso de una. Las posibilidades, siempre en
relación a la hipótesis alternativa, se muestran en la tabla siguiente.

Hipótesis nula estadístico de prueba bajo H0


S X2
H 0 : σ X2 = σ Y2 Fo = ~ F( n −1,m−1)
SY2
Hipótesis
alternativa
test τ : Rechazar H0 ⇔ p<α Comando R para un α = 0.05

H 1 : σ X2 ≠ σ Y2 p − valor = 2 min {P (F0 > f 0 ) ; P (F0 < f 0 ) } var.test(x,y)

H 1 : σ X2 > σ Y2 p − valor = P (F0 > f 0 ) var.test(x,y,alternative=”greater”)

H 1 : σ X2 < σ Y2 p − valor = P (F0 < f 0 ) var.test(x,y,alternative=”less”)

En el caso de utilizar un Intervalo de Confianza, el planteo es el siguiente. Supongamos tenemos las siguientes
hipótesis para evaluar simplemente si las varianzas poblacionales pueden considerarse iguales o no,
σ X2 σ X2
H0 : =1 versus H1 : ≠1
σ Y2 σ Y2

Construyendo el Intervalo de Confianza a partir de la cantidad pivotal


198
L.A. – C.P.N. ESTADÍSTICA 2019 FCE-UNCuyo

SY2 σ Y2
Q= ~ F(m−1,n−1)
S X2 σ X2
Un test apropiado es
 S X2 S X2 
τ : Rechazar H 0 ⇔ 1 ∉  q1 ; q 
S Y2 
2
 S Y2

Donde los cuantiles son q1 = f y q2 = f


(m −1,n −1) ,α ( m −1,n −1) ,1− α
2 2

6.4.- TEST PARA LA DIFERENCIA DE MEDIAS DE DOS POBLACIONES NORMALES


INDEPENDIENTES CON VARIANZAS DESCONOCIDAS

6.4.1- Supongamos que se concluyó que las Varianzas son Iguales , es decir σ X2 = σ Y2
Sea σ2 su valor, es decir, σ X2 = σ Y2 = σ 2 . Luego, parece razonable rechazar la hipótesis nula si un valor
de X − Y , con base en la muestra aleatoria, es lo suficientemente diferente ( mayor o menor) que 0,
dependiendo de la hipótesis alternativa considerada.

Entonces el Estadístico de Prueba es X − Y − (µ X − µ Y )


T0 = ∼ t( n + m − 2 )
 S p2 S p2 
 + 
n m 

El cual tiene una distribución t de Student con (n + m − 2) grados de libertad.

Siendo S p2 , el estimador ponderado de la varianza común σ2, dado por:


( n − 1 ) S X2 + ( m − 1 ) S Y2
S p2 =
n +m−2
Donde S X2 y SY2 son las varianzas de las muestras consideradas.
Por lo que, cuando H 0 : µ X − µY = 0 es verdadera, el estadístico de prueba es
X −Y
T0 = ∼ t ( n + m− 2 )
 S p2 S p2 
 + 
 n m
 

Igualmente que en el caso anterior, a un nivel de significación α las regiones críticas para las hipótesis
alternativas unilateral y bilateral, deben ser evidentes para el lector. Estas se encuentran resumidas en el
siguiente cuadro.

El test para cada una de las posibles hipótesis alternativas consiste como siempre en rechazar la hipótesis
nula si el p-valor es menor que el tamaño de error de tipo I, α.
La forma de calcular el valor p es equivalente a cualquier otro juego de hipótesis con signos iguales y para
las cuales el estadístico de prueba tiene distribución simétrica. Ellos se muestran en la tabla siguiente

199
L.A. – C.P.N. ESTADÍSTICA 2019 FCE-UNCuyo

Hipótesis nula Estadístico de prueba bajo H0


X −Y
To = ~ t( n+ m−2 )
H 0 : µ X − µY = 0  S p2 S p2 
 + 
n m 
 

Hipótesis alternativa test τ : Rechazar H0 ⇔ Comando R para α=0.05


p-valor<α

H1 : µ X ≠ µ 0 p − valor = P ( T > t 0 ) = 2 .P (T > t 0 t.test (x, y,var.equal=T)


t.test(x,y, var.equal=T,
alternative=”greater”)
H1 : µ X > µ 0
p − valor = P (T > t 0 ) t.test (x,y, var.equal=T
H1 : µ X < µ0 ,alternative=”less”)
p − valor = P(T < t 0 )

6.4.2- Supongamos que se concluyó que las Varianzas son Distintas, es decir σ X2 ≠ σ Y2 Estamos
en la situación de que σ X2 y σ Y2 son diferentes y desconocidas. Para determinar una prueba con un nivel de
significación α para H0, parece razonable rechazar la hipótesis nula si un valor de X − Y , con base en la
muestra aleatoria, es lo suficientemente diferente, mayor o menor que 0, dependiendo de la hipótesis
alternativa considerada.
Entonces el Estadístico de Prueba es:
X −Y
T0 = ∼ t (ν )
S X2 SY2
+
n m

El cual tiene una distribución t de Student con ν grados de libertad cuando la hipótesis nula es verdadera. En
este caso la expresión de los grados de libertad, dada por Welch, es

2
 S X2 S Y2 
 + 
n m 

ν=
(S n2
X S2 m
+ Y
) (
2
)
2

n −1 m −1

En la siguiente tabla se resumen los criterios de rechazo para la prueba de hipótesis con respecto a las medias
de dos distribuciones normales e independientes, con varianzas desconocidas y distintas.

200
L.A. – C.P.N. ESTADÍSTICA 2019 FCE-UNCuyo

Hipótesis nula Estadístico de Prueba bajo H0


X −Y
T0 = ∼ t (ν )
H 0 : µ X − µY = 0 S X2 SY2
+
n m
Hipótesis alternativa test τ : Rechazar H0 ⇔ Comando R para α=0.05
p-valor<α

H 1 : µ X − µY ≠ 0 p − valor = P ( T > t 0 ) = 2 .P (T > t 0 ) t.test (x,y)


t.test (x,y,alternative=”greater”)
p − valor = P (T > t 0 )
t.test (x,y,alternative=”less”)
H1 : µ X − µY > 0

H 1 : µ X − µY < 0 p − valor = P (T < t 0 )

Donde t0 es el valor observado del estadístico de prueba a partir de las muestras. Por otro lado, en el
comando de R expuesto el “t.test” para comparar medias poblacionales supone por defecto que σ X2 ≠ σ Y2 .

Para los casos planteados en este último punto respecto de plantear hipótesis para evaluar si las medias de dos
poblaciones normales con varianzas desconocidas pueden considerarse iguales, si se enuncia el test utilizando
un Intervalo de Confianza el procedimiento es idéntico a lo planteado en apartado 6.2, sólo cambia la cantidad
pivotal a partir de la cual se construye el intervalo.

Ejemplo 7
En un estudio sobre los depósitos bancarios, se quieren comparar los volúmenes medios de depósitos
semanales en dos sucursales (llamémoslas A y B) del mismo banco. A tal efecto se toman dos muestras de
tamaño 10, n=m=10, una de cada una de las sucursales. Los resultados (en miles de pesos) se muestran en la
tabla siguiente:

sucursal A 53 51 40.5 48 48 35.6 49 51 45.2 47


.6 .6 .4 .4 .4 .8 .8
sucursal B 30 30 39.4 35 46 53.0 72 59 49.4 43
.0 .1 .4 .7 .7 .9 .9

Vamos a suponer que las variables aleatorias XA y XB que representan los volúmenes de las respectivas
sucursales son normales e independientes. Es decir,
XA : “volumen de depósitos semanales en sucursal A” y XB : “volumen de depósitos semanales en
(
sucursal B”, siendo X A ~ N (µ A ,σ A2 ) y X B ~ N µ B ,σ B2 . )
De acuerdo a lo que hemos visto anteriormente para realizar un test para comparar las medias de los
volúmenes de depósitos en ambas sucursales deberíamos saber si podemos considerar a las varianzas iguales o
no ya que ambas son desconocidas.

1º) Para esto planteamos las hipótesis,

H 0 : σ A2 = σ B2 versus H 1 : σ A2 ≠ σ B2

Y realizamos el test para probar estas hipótesis.

201
L.A. – C.P.N. ESTADÍSTICA 2019 FCE-UNCuyo

De acuerdo al resultado anterior el test es,


τ : Rechazar H 0 ⇔ p − valor = 2 min{ P( S A2 / S B2 < f 0 ), P( S A2 / S B2 > f 0 )} < α
2
Donde f = s A = 30.33344 = 0.16684 y donde el estadístico de prueba tiene distribución F de Fisher-Snedecor
0
s B2 181.8072
con 9 y 9 grados de libertad. F0 = S A2 / S B2 ~ F (9,9) .

Luego,
P ( S A2 / S B2 < 0.16684 ) = pf (16684 ,9,9) = 0.007
P( S A2 / S B2 > 0.16684) = 1 − pf (16684,9,9) = 0.993 .
Entonces,
p − valor = 2 min{ P( S A2 / S B2 < f 0 ), P( S A2 / S B2 > f 0 )} = 2 min{ 0.007 ,0.993 }
= 2 ⋅ 0.007 = 0.014

Este p-valor es demasiado pequeño para aceptar que las varianzas son iguales. Luego, rechazamos la
hipótesis nula y por lo tanto suponemos que las varianzas son diferentes, σ X2 ≠ σ Y2

2ª) Planteamos ahora las hipótesis sobre las medias:


H 0 : µ A = µB versus H1 : µ A ≠ µ B
Debido a que no podemos suponer igualdad de las varianzas, el estadístico de prueba es:

2
 S A2 S B2 
 + 
XA−XB  n A n B 
T0 = ∼ t (ν ) con ν=
S A2 S B2
+
(
S A2 n A ) (
2
S2 n
+ B B
2
)
n A nB nA −1 nB − 1

Donde n A = n B = 10 . El valor observado del estadístico de prueba y sus grados de libertad son:

xA − xB 47.23 − 46.05
t0 = = = 0.2562 con ν = 11.922
s2
s 2
 30.33344 181.8072 
A
+ B
 + 
10 10  10 10 

El test correspondiente a las hipótesis sobre las medias es


Rechazar H 0 ⇔ p − valor = 2 P (T0 > 0.2562) ) < α = 0.05

p − valor = 2 P(T0 > 0.2562) ) = 2 ⋅ (1 − pt (0.2562,11.922)) = 2 ⋅ 0.4010819 = 0.8022


Este valor es excesivamente grande comparado con cualquier α razonable. Luego, no rechazamos la hipótesis
nula y concluimos que los volúmenes medios de depósitos semanales en ambas sucursales no difieren
significativamente.

Todo el larguísimo y pesado cálculo que hemos hecho para resolver este problema lo podríamos haber
realizado con R en los siguientes pasos:

Prueba de Hipótesis para comparar las varianzas


H 0 : σ A2 = σ B2 versus H 1 : σ A2 ≠ σ B2

202
L.A. – C.P.N. ESTADÍSTICA 2019 FCE-UNCuyo

Cargando previamente los datos en dos vectores llamados A y B respectivamente el comando de R es


“var.test (A,B)”

Salida de R:
F test to compare two variances
data: A and B
F = 0.1668, num df = 9, denom df = 9, p-value = 0.01358
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.04144169 0.67171298
sample estimates: ratio of variances 0.166844

Luego con el p-valor = 0.01358 se rechaza la hipótesis nula y se concluye que las varianzas son
significativamente diferentes.
A la misma conclusión se llega si en la salida tenemos en cuenta el valor observado del Intervalo de
Confianza ya que 1 ∉ (0.0414 , 0.6717).

Prueba de Hipótesis para comparar las medias

H 0 : µ A = µB versus H1 : µ A ≠ µ B

Cargando previamente los datos en dos vectores llamados A y B respectivamente el comando de R


“t.test(A,B)”

Salida de R
Welch Two Sample t-test
data: A and B
t = 0.2562, df = 11.922, p-value = 0.8022
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-8.862636 11.222636
sample estimates: mean of x mean of y
47.23 46.05

Luego con el p-valor = 0.8022 por lo que no rechazamos la hipótesis nula y concluimos que los volúmenes
medios de los depósitos en ambas sucursales no son significativamente diferentes.
A la misma conclusión se llega si en la salida tenemos en cuenta el valor observado del Intervalo de
Confianza ya que 0 ∈ (- 8.8626 , 11.2226).

Observación: Si las varianzas hubieran podido considerarse iguales, entonces el comando de R hubiera sido:

t.test(A,B,var.equal=TRUE)
ya que por default R calcula el test para varianzas diferentes.

203

También podría gustarte