Está en la página 1de 20

Prueba de Hipótesis Estadística: una

explicación desde cero


OCTUBRE 14, 2016 por FEDE 8 COMENTARIOS
Contenidos [Mostrar]

Introducción: ¿qué es una prueba de hipótesis estadística?


Supongamos que un amigo nuestro afirma que en cada partido de
fútbol que juega, mete tres o cuatro goles. Impresionados con su
excelente performance, vamos a verlo jugar cinco partidos
seguidos. Pero ocurre que en esos cinco partidos no mete ningún
gol. ¿No sospecharíamos que tal vez nos mintió? ¿No es muy
incompatible “lo observado” con su afirmación inicial de que mete
tres o cuatro goles por partido? Este mini-ejemplo muestra la
lógica que hay detrás de una prueba de hipótesis estadística.

Una prueba de hipótesis es un procedimiento, con el que se


busca tomar una decisión sobre el valor de verdad de
una hipótesis estadística. Al realizar una prueba de hipótesis
decidimos si rechazar o no rechazar esa hipótesis estadística.
Basamos la decisión en la evidencia muestral.

Un esquema muy simplificado que resume el proceso sería el


siguiente:
Por eso muchas veces se compara un proceso de prueba de
hipótesis con un juicio: hay que recoger evidencias para analizar
si la hipótesis de base (la inocencia del acusado en el caso del
juicio) se sostiene o se rechaza.

Ejemplo intuitivo (sin detalles “técnicos”)


Entender muy bien que es una prueba de hipótesis implica
comprender muchos conceptos (variable, parámetro, hipótesis
estadística, estadístico de prueba, etc). Y también las relaciones
entre ellos. Pero la idea general de que es una prueba de
hipótesis no es difícil de entender. De hecho, es muy intuitiva.
Vamos a ver un ejemplo que en forma natural expresa el
razonamiento y procedimiento detrás de una prueba de hipótesis.

Situación

Un fabricante de galletitas produce paquetes en los cuales el


peso nominal impreso es de 500500 gramos. Pero el contenido
real en gramos es una variable aleatoria. No tienen
exactamente 500500 gramos todos los paquetes. El fabricante,
basándose en información histórica, afirma que la media de esa
variable XX es μ=500μ=500 gramos con un desvío estándar
de 55 gramos. Se desconfía de la afirmación del fabricante
acerca de que μ=500μ=500 gramos. Se quiere analizar si en
realidad el peso promedio de los paquetes es inferior
a 500500 gramos.
La variable

La variable que nos interesa observar es XX: peso en gramos de


un paquete de galletitas de la fábrica.
Las hipótesis en juego

Las dos afirmaciones que se contraponen en esta situación son:


 Afirmación del fabricante, que llamaremos hipótesis nula: la
media de XX es 500: μ=500μ=500
 Afirmación alternativa: Hipótesis alternativa: la media
de XX es menor que 500: μ<500μ<500

No podemos conocer el verdadero valor del parámetro, pero podemos estimarlo

Cómo se trata de una discusión acerca del valor de un parámetro,


no es fácil decidir cuál afirmación es correcta. Habría que medir
todos los paquetes de la producción para conocer la verdadera
esperanza de XX. En general esto es inviable. Para no tener que
medir el peso en todos los paquetes de la producción se puede
tomar una muestra aleatoria de nnpaquetes, y analizar si los
valores observados de XX son o no coherentes con la afirmación
del fabricante.
Para lo que sigue a continuación es requisito saber sobre la
distribución de la variable media muestral.

Supongamos que se toma una muestra aleatoria de 100


paquetes, y se mide el peso (utilizando una balanza muy precisa)
en cada uno de los 100100 paquetes. Obtenemos entonces una
muestra aleatoria de la variable XX:
X1,X2,X3…,X100X1,X2,X3…,X100
Sabemos que la medía muestral ¯XX¯ es un buen estimador de
la media poblacional μμ. Entonces vamos a calcular la media
muestral del peso de los 100 paquetes, para contrastarla con la
hipótesis nula.

 Si obtenemos un valor de ¯XX¯ “muy inferior a 500”, es decir


una diferencia ¯x–μx¯–μ “muy grande”, rechazaremos la
hipótesis nula.
 Si obtenemos un valor de ¯XX¯ “muy cercano a 500”, es
decir una diferencia ¯x–μx¯–μ“pequeña”, diremos que no
existe evidencia suficiente para rechazar la hipótesis nula.

Veamos que conclusión sacaríamos en los siguientes casos.


Caso A de evidencia muestral: se obtiene una media muestral muy contraría a la
afirmación inicial

Si se obtiene que el promedio de los pesos es


de ¯x=421,3x¯=421,3 gramos, podríamos concluir que la
evidencia muestral no es compatible con la afirmación del
fabricante. Se obtuvo un valor muy por debajo de 500 gramos.
Podríamos rechazar la afirmación del fabricante. No puede ser
cierto que E(X)=500E(X)=500, pero que se
observe ¯x=421,3x¯=421,3. Cómo ¯x=421,3x¯=421,3de
hecho se observó, entonces rechazamos la hipótesis nula.
Caso B de evidencia muestral: se obtiene una media muestral “cercana” a la
afirmación inicial

Si se obtiene que el promedio de los pesos es


de ¯x=499,8x¯=499,8 gramos, podríamos pensar que el valor
de ¯XX¯ obtenido es muy cercano al valor de μμ propuesto por
la hipótesis inicial… y entonces concluir que no hay evidencia
contraria a esa hipótesis.
Caso C de evidencia muestral: se obtiene una media muestral que no es
concluyente “a simple vista” respecto de la afirmación inicial

Si se obtiene que el promedio de los pesos de 100 paquetes es


de ¯x=497,3x¯=497,3 gramos… ¿Qué concluimos? ¿Es
coherente con una media poblacional de 500 o no? Este caso
resulta más dilemático y no permite decidir tan fácilmente. Se
presenta el problema de decidir que es “cerca” y que es “lejos” de
500. Más adelante vamos a ver cómo se decide un punto de corte
o punto crítico que permite definir una zona “cercana” (zona de no
rechazo) y una zona “lejana” (zona de rechazo).
Definición intuitiva

Entonces una prueba de hipótesis es un proceso en el que,


partiendo de dos hipótesis estadísticas contrapuestas (una nula y
una alternativa), tomamos información muestral para decidir si se
rechaza o no la hipótesis inicial en favor de la hipótesis
alternativa.
Problema del abordaje intuitivo que acabamos de hacer

El problema que tiene este abordaje es que no queda bien


definido que sería que ¯XX¯ esté “cerca” o “lejos” de 500
gramos. Para el caso A y B elegimos valores que “a ojo” parecen
muy por debajo (421,3) o muy cercanos (499,8) a 500. Pero
tenemos que poder tener un criterio objetivo con el que tomar la
decisión sobre si la evidencia muestral es contraría o no a la
afirmación inicial. A continuación, nos vamos a meter con esta
complicación técnica. Pero la idea básica de que es una prueba
de hipótesis, es la que comentamos en este ejemplo.
Para resolver el problema técnico, va a ser necesario tener bien
claros los siguientes conceptos.

Definiciones de conceptos fundamentales


Para entender bien que es una prueba de hipótesis hay que tener
bien claros (entre otros) los conceptos de: variable, parámetro,
estimador de un parámetro, hipótesis estadística y estadístico de
prueba.

¿Qué es una variable?

Una variable es una característica de interés, que tienen los


individuos de una población.

 Ejemplo 1: el peso de un paquete de galletitas


 Ejemplo 2: la cantidad de alumnos de una escuela de CABA
 Ejemplo 3: la localidad en la que está ubicada un comercio
de una cierta cadena
¿Qué es un parámetro?

En estadística, un parámetro es una constante asociada a la


distribución de probabilidades de una variable aleatoria.
 Ejemplo 1: Si una variable tiene distribución binomial, sus
parámetros son nn y pp.
 Ejemplo 2: Si una variable tiene distribución normal, sus
parámetros son μμ y σσ.
 Ejemplo 3: Si una variable tiene distribución Bernoulli, su
único parámetro es la probabilidad de éxito pp.

¿Qué es un estimador de un parámetro?

El estimador de un parámetro es un estadístico (estadístico:


variable aleatoria función de las observaciones muestrales) que
toma “valores cercanos” al verdadero valore del parámetro.

Fundamentalmente nos interesan los siguientes estimadores:

 La media muestral ¯xx¯ es un estimador de la media


poblacional μμ.
 El desvío estándar muestral ss es un estimador del desvío
estándar poblacional σσ
 La proporción muestral ^pp^, es un estimador de la
proporción poblacional pp.
Parámetros
poblacionales y estimadores de esos parámetros

¿Qué es un estadístico de prueba?

Esta es la definición más difícil de esta serie. Por eso vamos a dar
muchos ejemplos.

Un estadístico de prueba es:

 Una variable aleatoria


 De distribución conocida
 Que vincula a un parámetro de interés, con un estimador de
ese parámetro.

Vamos a ver algunos ejemplos de estadísticos de prueba que


nos van a interesar más adelante.

EJEMPLO 1

Si X∼N(μ,σ)X∼N(μ,σ), y X1,X2,…,XnX1,X2,…,Xn, es una


muestra aleatoria de XX, y conocemos σσentonces:
¯X–μσ√ n ∼N(0,1)X¯–μσn∼N(0,1)
Es un estadístico de prueba. Porque es una variable aleatoria,
con distribución conocida (normal estándar), y que relaciona al
parámetro μμ con su estimador ¯xx¯.
Observación: no demostramos recién por qué es esa la
distribución de ¯X–μσ√ n X¯–μσn. No nos interesa hacerlo acá para
no distraer la atención. Pero la fundamentación tiene que ver con:

1. Si XX es normal, una combinaicón lineal de XiXi va a ser


normal también.
2. La esperanza de ¯XX¯ es μμ.
3. La varianza de ¯XX¯ es σ2/nσ2/n
4. La estandarización de variables aleatorias normales.

EJEMPLO 2

Si X∼N(μ,σ)X∼N(μ,σ), y X1,X2,…,XnX1,X2,…,Xn, es una


muestra aleatoria de XX, y no conocemos σσpero lo estimamos
con SS entonces:
¯X–μS√ n ∼tn–1X¯–μSn∼tn–1
Es un estadístico de prueba. Porque es una variable aleatoria,
con distribución conocida (ttde student n–1n–1 grados de
libertad), y que relaciona al parámetro μμ con su
estimador ¯XX¯.
Observación: no demostramos por qué es esa la distribución. Hay
que aceptarlo así :).

EJEMPLO 3

Si XX tiene una distribución desconocida,


y X1,X2,…,XnX1,X2,…,Xn, es una muestra aleatoria
de XX(con n>30n>30), y no conocemos σσ pero lo estimamos
con SS entonces:
¯X–μS√ n ≈N(0,1)X¯–μSn≈N(0,1)
Es un estadístico de prueba. Porque es una variable aleatoria,
con distribución conocida (en realidad aproximadamente
conocida, porque se aproxima a la distribución normal estándar),
y que relaciona al parámetro μμ con su estimador ¯XX¯.
Observación: no demostramos por qué es esa la distribución.
Tiene que ver con el teorema central del límite.

EJEMPLO 4

Si X∼Bernoulli(p)X∼Bernoulli(p) y X1,X2,…,XnX1,X2,…,Xn
es una muestra aleatoria de XX, con n>30n>30entonces:
^p–p√ p(1–p)n ≈N(0,1)p^–pp(1–p)n≈N(0,1)
Es un estadístico de prueba. Porque es una variable aleatoria,
con distribución conocida (en realidad aproximadamente
conocida, porque se aproxima a la distribución normal estándar),
y que relaciona al parámetro pp con su estimador ^pp^.
Observación: no demostramos por qué es esa la distribución.
Tiene que ver con el teorema central del límite.

EJEMPLO 5

Si X∼N(μ,σ)X∼N(μ,σ) y X1,X2,…,XnX1,X2,…,Xn, es una


muestra aleatoria de XX, entonces:
S2(n–1)σ2∼χ2n–1S2(n–1)σ2∼χn–12
Es un estadístico de prueba. Porque es una variable aleatoria,
con distribución conocida, y que relaciona al parámetro σ2σ2 con
su estimador S2S2.
Observación: no demostramos por qué es esa la distribución. Hay
que aceptarlo así :).

Una tabla que resume las condiciones que deben darse, el


parámetros de interés y un estadístico de prueba adecuado es la
siguiente:
¿Qué es una hipótesis estadística?

Una hipótesis estadística es una afirmación acerca de la


distribución de una variable aleatoria.

 Si la afirmación es sobre el valor de un parámetro, es una


hipótesis estadística paramétrica.
 Si la afirmación es sobre la forma de la distribución de
probabilidades, es una hipótesis estadística no paramétrica.

Veamos algunos ejemplos de afirmaciones y establezcamos si


son o no son hipótesis estadísticas.

 Afirmación 1: “La molécula de agua está compuesta por dos


átomos de hidrógeno y un átomo de oxígeno”.
 Afirmación 2: “La variable X tiene distribución Binomial”.
 Afirmación 3: “La media de una muestra de 100
observaciones es de ¯x=45,32x¯=45,32gramos”
 Afirmación 4: “La media de la
variable X∼(μ,σ)X∼(μ,σ) es μ=134μ=134”
 Afirmación 5: “La media de la
variable X∼(μ,σ)X∼(μ,σ) es μ<134μ<134”

La afirmación 1 predica sobre la composición de una molécula.


Será una afirmación… pero no es de tipo “estadístico”. Y en
particular no dice nada sobre ninguna variable aleatoria. No es
una hipótesis estadística.

La afirmación 2 predica sobre la forma que tiene la distribución de


una variable aleatoria. Está diciendo algo acerca de una variable
aleatoria. Así que podemos decir que es una hipótesis estadística.
Pero es una hipótesis estadística no paramétrica.

La afirmación 3 es sobre la media muestral de una variable


aleatoria. La media muestral no es un parámetro, sino que es una
variable aleatoria. No es una hipótesis estadística porque no
afirma nada ni sobre el tipo de distribución (binomial, normal,
etc…) ni sobre sus parámetros.

La afirmación 4 sí es una hipótesis estadística (paramétrica)


porque asevera que el parámetro media poblacional de cierta
variable es igual a 134.
Ejemplo de prueba de hipótesis detallado paso a paso
(incluyendo los detalles “técnicos”)
El enunciado

Un fabricante de galletitas produce paquetes en los cuales el


peso nominal impreso es de 500500 gramos. Pero el contenido
real es una variable aleatoria con distribución normal. No tienen
exactamente 500500 gramos todos los paquetes. El fabricante,
basándose en información histórica, afirma que la media de esa
variable X es μ=500μ=500 gramos con un desvío estándar
de 55 gramos. Se desconfía de la afirmación del fabricante
acerca de que μ=500μ=500 gramos. Se quiere analizar si en
realidad el peso promedio de los paquetes es inferior
a 500500 gramos.
Para esto se toma una muestra de tamaño 100, y se obtiene una
media muestral de 497,3497,3gramos.
Realizar una prueba de hipótesis con un nivel de significación
de 0,050,05.
La variable

La variable sobre la que vamos a trabajar es XX: peso real de un


paquete de galletitas de 500 gramos de la fábrica.
El enunciado afirma que la distribución de XX es normal. No se
conoce μμ, pero sí se conoce σ=5σ=5.
Hipótesis nula e hipótesis alternativa

H0H0 es la hipótesis nula. Hipótesis nula es la hipótesis de no


cambio. Es la hipótesis de que todo queda igual. Hay otra
hipótesis que es la hipótesis de cambio. Siempre en esta
hipótesis va a estar el igual.
H0:μ=500H0:μ=500
H1H1 es la hipótesis alternativa. Es complementaría a la nula.
Niega a la hipótesis nula.
Las hipótesis son complementarias. La nula tiene el símbolo de
igualdad siempre. Entonces en la otra no puede aparecer el igual.
En la hipótesis alternativa se utiliza o bien el símbolo de
distinto ≠≠, o bien mayor >> o bien menor <<.
H1:μ<500H1:μ<500
Error de tipo 1 y error de tipo 2

Uno querría tomar la decisión correcta. Rechazar la hipótesis


nula, cuando esta es falsa, es una decisión correcta posible. No
rechazar la hipótesis nula, cuando esta es verdadera es otra
forma de tomar una decisión correcta.

Pero cuando se toma una decisión basada en información


muestral, se pueden cometer errores. Si la hipótesis nula fuera
verdadera, y tomamos la decisión de rechazarla estaremos
cometiendo un error. Este error se conoce cómo el error de tipo 1.
Si la hipótesis nula fuera falsa, y no la rechazamos estaríamos
cometiendo otro error. Este otro error se conoce cómo el error de
tipo 2.

En un proceso de prueba de hipótesis, no es posible tener


garantía absoluta de no estar cometiendo algún error.

La siguiente tabla resume los escenarios posibles.


Error de tipo 1: Si la hipótesis nula es en realidad verdadera, y
se la rechaza, se comete el error de tipo 1. También se llama nivel
se significación de la prueba. La probabilidad de cometerlo se
representa cómo:

α=P(errortipo1)=P(RHo|H0esV)α=P(errortipo1)=P(RHo|H0es
V)
Decisión correcta 1: Si la hipótesis nula es en realidad
verdadera, y no se la rechaza, se está tomando una decisión
correcta. La probabilidad de que ocurra esto se representa:

1–α=P(NoRHo|H0esV)1–α=P(NoRHo|H0esV)
Error de tipo 2: Si la hip’otesis nula es falsa y no se la rechaza,
se comete el error de tipo 2. La probabilidad de cocmeterlo se
representa cómo:
β=P(errortipo2)=P(NoRH0|H0esF)β=P(errortipo2)=P(NoRH0|
H0esF)
Decisión correcta 2: Si la hipótesis nula es falsa, se la rechaza,
se está tomando una decisión correcta. Diferente de la decisión
correcta 1, así que le podemos llamar decisión correcta 2. (No es
un nombre estándar). La probabilidad de que esto ocurra se
conoce cómo “potencia del test” y se representa cómo:

1–β=Potenciadeltest=P(RH0|H0esF)1–
β=Potenciadeltest=P(RH0|H0esF)
El nivel de significación (probabilidad de cometer el error de tipo
1) se establece a priori. Es la probabilidad de rechazar la
hipótesis nula cuando esta es verdadera. En general el enunciado
del ejercicio (o el investigador) establece un nivel de significación.

El error de tipo 1 se considera un error grave, que se quiere


evitar. Hay necesidad de controlarlo. αα debe ser pequeño.
Valores usuales de αα pueden ser:
α=⎧⎪⎨⎪⎩0,010,050,10α={0,010,050,10
Estadístico de prueba

Basándonos en que X∼N(μ,σ)X∼N(μ,σ), y que conocemos σσ,


entonces es posible afirmar que:
¯X–μσ√ n ∼N(0,1)X¯–μσn∼N(0,1)
Este es un estadístico de prueba que nos puede servir para
realizar la prueba de hipótesis sobre μμ.
En el proceso se asume que H0H0 es verdadera hasta que se
demuestre lo contrario (cómo en un juicio se supone la
inocencia hasta que se demuestre lo contrario).
Si asumimos que H0H0 es verdadera (μ=500μ=500) entonces el
estadístico de prueba es:
eprueba=¯X–5005√ 100 ∼N(0,1)eprueba=X¯–5005100∼N(0,1)
En el numerador tenemos la diferencia ¯X–μX¯–μ si esa
diferencia es “muy negativa” entonces rechazaremos la hipótesis
nula (porque significa que ¯XX¯ está muy por debajo de μμ).
Entonces ¿cómo se decide si se rechaza o no a la hipótesis nula?
Los valores que puede tomar el estadístico de prueba de dividen
en dos zonas: “la zona de rechazo” y la “zona de no rechazo”. Si
el estadístico de prueba toma un valor dentro de la zona de
rechazo se rechaza la hipótesis nula. Si el estadístico de prueba
toma un valor fuera de la zona de rechazo, no se rechaza la
hipótesis nula.

Rechazaremos H0H0 si:


¯X–5005√ 100 <ValorcríticoX¯–5005100<Valorcrítico
Más adelante vamos a ver cómo hallar ese valor crítico.

Nivel de significación

En este enunciado se establece que el nivel de significación


(probabilidad de cometer el error de tipo 1) es α=0,05α=0,05.
Zona de rechazo y regla de decisión

Si el estadístico de prueba cae en zona de rechazo


(asumiendo H0H0verdadera) estaríamos cometiendo el error de
tipo 1 (RH0|H0esVRH0|H0esV). Luego el nivel de significación
es igual al área bajo la curva del estadístico de prueba y
sobre la región de rechazo.
Entonces: el nivel de significación determina, conjuntamente con
la distribución del estadístico de prueba, cuál va a ser el valor
crítico que define la zona de rechazo.

zCzC debe ser aquel valor de la variable normal estándar que


acumula un área de 0,05 a su izquierda. Mirando la tabla de
probabilidades normales, o bien usando un software, se puede
determinar que:
Φ(zC)=0,05⇒zc=–1,64Φ(zC)=0,05⇒zc=–1,64
Regla de decisión:
 Se rechaza H0H0 si el valor observado del estadístico de
prueba es menor o igual a –1,64–1,64.

 No se rechaza H0H0 si el valor observado del estadístico de


prueba es mayor que –1,64–1,64.

Calcular el valor observado del estadístico de prueba

Hasta aquí no se utilizó la información recogida en la muestra.


Recién ahora tomamos el dato sobre la media muestral
observada y reemplazamos en la expresión de estadístico de
prueba para obtener el valor observado del estadístico de prueba:

eprueba,obs=497,3–5000,5=–5,4eprueba,obs=497,3–5000,5=–
5,4
Obtener la conclusión

En general la conclusión tiene dos versiones: una breve, y otra


más detallada.

LA CONCLUSIÓN BREVE (O “LA DECISIÓN”)

Cómo el valor observado del estadístico de prueba -5,4, cae en la


zona de rechazo (–∞,–1,64)(–∞,–1,64) se decide rechazar la
hipótesis nula.
Esta conclusión está muy bien, pero no refiere a la situación
general del problema concreto. Solo dice si se rechaza o no la
hipótesis nula.

LA CONCLUSIÓN DETALLADA

En la conclusión detallada queremos informar:

 El nivel de significación con el que se realiza la conclusión.


 Cuál es la variable en cuestión.
 Cuál es el parámetro en cuestión.
 Si se rechaza o no se rechaza la hipótesis nula a favor de la
alternativa.
 Qué implica la decisión tomada en términos del problema
concreto

Por ejemplo en este caso podríamos escribir una conclusión


detallada así:

Con un nivel de significación de 0,050,05 se rechaza la hipótesis


nula, que afirma que la media del peso de los paquetes de
galletitas es de 500500 gramos, a favor de la hipótesis
alternativa, que afirma que la media del peso de los paquetes de
galletitas es inferior a 500500 gramos. Habría que re-calibrar la
máquina que rellena los paquetes para que la media sea
de 500500gramos.
Pasos que se dan para realizar una prueba de hipótesis
Después de haber resulto completamente un ejercicio de prueba
de hipótesis podemos detectar que se siguió la siguiente
secuencia de pasos:

1. Primer paso: Reconocer y definir la o las variables


2. Segundo paso: Formular las hipótesis nula y alternativa
3. Tercer paso: Establecer un estadístico de prueba adecuado
4. Cuarto paso: Seleccionar un nivel de significación
5. Quinto paso: Determinar la zona de rechazo y establecer la
regla de decisión
6. Sexto paso: Calcular el valor observado del estadístico de
prueba
7. Séptimo paso: Obtener la conclusión

{Primero:rechazoonoH0Luego:expresarlaentérminosdelproble
ma{Primero:rechazoonoH0Luego:expresarlaentérminosdel
problema
Otros problemas de prueba de hipótesis pueden ser muy
diferentes. Otras variables, otros estadísticos de prueba, hipótesis
diferentes… etc. Pero en todos los problemas de prueba de
hipótesis se puede seguir esta secuencia de pasos.

Final
Este texto pretende ser una introducción al tema. Hay mucho que
no explicamos acá. No explicamos pruebas a dos colas, para
otros parámetros, con dos poblaciones, que es el valor p de una
prueba, etc. Eso vamos a escrbirlo en otros posteos.