5 - Test de Hipótesis

Test de Hipótesis
Tests Paramétricos
Las pruebas o tests de hipótesis son procedimientos o métodos estadísticos de estimación que
nos ayudan a la toma de decisiones sobre poblaciones, con base en la información que nos da
la muestra, es decir que permite decidir si a partir de una muestra se puede definir el
comportamiento de una población en términos de los parámetros de la misma.
Esta técnica consiste en suponer que uno o más parámetros que caracterizan e identifican una
variable aleatoria X tienen un cierto valor que tenemos a priori por información previa. A este
valor supuesto lo denominaremos Hipótesis Nula (H0) y la someteremos a una prueba de
resistencia estadística. Plantearemos esta prueba como un contraste entre nuestra Hipótesis
Nula (H0) y otra Hipótesis Alterna (Ha).
Las Hipótesis Estadísticas son entonces ciertos supuestos o conjeturas sobre el valor de los
parámetros de las poblaciones. Es decir que son aquellas suposiciones acerca del valor de uno
o más parámetros de una población que se consideran con el propósito de discutir su validez.
Dichas hipótesis se formularan sobre la media poblacional μ, la proporción poblacional p, la
varianza , la homogeneidad de dos varianzas y , una diferencia de medias , el
coeficiente de correlación de Pearson (concepto que veremos en breve), etc.
Recordemos brevemente alguno de estos conceptos:
Media Poblacional (μ): esta medida resume en un valor las características de una constante
teniendo en cuenta a todos los casos y se utiliza con variables cuantitativas.
Si se tiene una muestra estadística de valores para una variable X con distribución de
probabilidad F(x, θ) (donde θ es un conjunto de parámetros de la distribución).
Proporción Poblacional (p): se define como , donde x es el número de elementos en

la población que poseen cierta característica y n es el total de elementos de la población.
En general, la media en una muestra suele ser distinta a la media de la población, de la cual se
extrae la muestra. Lo normal suele ser que tal diferencia entre la media muestral y poblacional
sea pequeña y debida al azar, pero podría suceder que dicha diferencia no esté justificada por
el azar y se deba a un cambio en la población, y debamos modificar los datos que conocemos
previamente. Para ello se aplican los test de hipótesis
Pasos para realizar un TEST de HIPOTESIS

1. Establecer la hipótesis nula y la alternativa
 Hipótesis Nula (H0): Es una afirmación acerca del valor de un parámetro de la

población, y es aquella que se formula y la cual se quiere contrastar o rechazar. Sirven
por ejemplo, para decidir si un procedimiento es mejor que otro, y tiene como base
definir que no hay diferencia entre los procedimientos.
 Hipótesis Alterna (Ha): Es una afirmación que es aceptada si la muestra provee la
evidencia de que la hipótesis nula es falsa. Es decir, es cualquier otra hipótesis
contraria a la hipótesis nula, de forma que la aceptación de la hipótesis nula implica el
rechazo de la hipótesis alternativa, y viceversa, el rechazo de la hipótesis nula implica
la aceptación de la hipótesis alternativa.
Ha)  ≠ 0  bilateral a 2 colas
o también, e.g.
Ha)  > 0  unilateral a una sola cola

Ha)  < 0  unilateral a una sola cola
2. Establecer el estadístico de contraste
El siguiente paso es elegir un estadístico de contraste, al que llamaremos E, y del que tenemos
que conocer su distribución estadística como variable aleatoria. El estadístico E se calcula a
partir de los datos de una muestra (X1, X2,…,Xn) de la r.v. X bajo estudio. E es un número real.
Si se supone que la hipótesis nula es verdadera, pero encontramos que los resultados de una
muestra aleatoria difieren marcadamente de los esperados bajo la hipótesis nula (por sobre el
azar de la teoría del muestreo) podremos decir que las diferencias observadas son
significativas (demasiado grandes) y nos inclinamos a rechazar la hipótesis nula, o al menos a
no aceptarla debido a la evidencia obtenida.
3. Seleccionar el nivel de significación.
El nivel de significación se refiere a la probabilidad de rechazar la Hipótesis Nula (H0) cuando

en realidad es verdadera. Utilizaremos para identificarlo y 1 – para identificar el nivel de
confianza.
Tipos de error: Al hacer un test pueden ocurrir cuatro situaciones:
V: verdadera F: falsa
Real
Test H0 (V) H0 (F)
H0 (V) Correcto Error Tipo 2
H0 (F) Error Tipo 1 Correcto

 Error Tipo 1: Rechazar H0, siendo que es verdadera. La probabilidad de cometer un
error de Tipo 1 es el nivel de significación , i.e. P (Error Tipo 1) = 
 Error Tipo 2: aceptar la hipótesis nula siendo que es falsa (H0)
Generalmente el error más grave que se puede cometer en un test o prueba es el del Tipo 1.
Por ejemplo, si una persona acude a un hospital porque sospecha que tiene una enfermedad
infecciosa altamente contagiosa, y en el hospital le realizan una prueba, análisis o test, y el
resultado es negativo siendo que en realidad ha contraído esa enfermedad (Error Tipo 1), la
persona seguirá su vida normal pensando que no está infectada y contagiará a todo su
entorno. Por otra parte, si no está infectado y el resultado del test le da positivo (Error Tipo 2),
lo peor que puede suceder es que lo internen un tiempo y lo sometan a un tratamiento, hecho
incomparablemente menos grave que el anterior. Es por ello que acostumbramos a minimizar
la probabilidad de cometer un error Tipo 1, es decir que elegimos un margen de error  muy
pequeño (e.g.  =0,05 ó  = 0,03,  = 0,01,  = 0,001, o menor a 1).
4. Identificar las regiones de Rechazo y de No Rechazo
Recordemos que el estadístico de contraste es un valor numérico determinado a partir de la

información de la muestra, usado para decidir si rechazar o no la hipótesis nula. Recordemos
también que podemos considerar al estadístico de contraste como una variable aleatoria de la
cual conocemos su distribución estadística. Esta distribución depende del parámetro que
estamos testeando, y puede ser una ley Binomial, Normal, Poisson, Geométrica,
Hipergeométrica, Binomial negativa (Pascal), Multinomial, Exponencial, Chi Cuadrado, Beta,
etc.
Valor crítico: El punto que divide la región entre el lugar en el que la hipótesis nula es
rechazada y la región donde la hipótesis nula es no rechazada.
Luego, con este  vamos a una tabla de la distribución estadística de E y luego definimos él o
los valores críticos EC.
n Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estu
n Estudiantil Versión Estudiantil 1-α
Versión Estudiantil Versión Estudiantil Versión Estudiantil
Zona de no Rechazo
n Estudiantil (de H0) Versión Estudiantil Versión
Versión Estudiantil ZonaEstudiantil
de Rechazo (de H0) Estudiantil
Versión
Versión Estudiantil Versión Estudiantil α
Versión Estudiantil Versión Estudiantil Versión Estu
Ec (valor critico ó teórico)
Ahora ubicamos en el eje real por el valor del estadístico E:
ón Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudian
Versión Estudiantil Versión Estudiantil No Rechazo
Versión Estudiantil Versión Estudiantil Versión Estudian
ón Estudiantil Versión Estudiantil Versión Estudiantil
(H0) Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil - α Estudiantil
1Versión Zona Versión
de Rechazo (de H0)
Estudiantil Versión Estudian
ón Estudiantil Versión Estudiantil Versión Estudiantil
E
Versión Estudiantil Versión Estudiantil
E Ec (valor critico ó teórico)
5. Formular una regla de decisión.
La región crítica será aquella región del campo de variación del estadístico tal que si contiene
al valor evaluado del mismo con los datos muestrales nos llevará a rechazar la hipótesis. La
designaremos por R1. Otro concepto importante es el de región de aceptación que es la región
complementaria de la anterior. Si el valor evaluado del estadístico pertenece a ella No
rechazamos la hipótesis (las hipótesis nunca se aceptan de forma definitiva, sólo se aceptan
provisionalmente, es decir ,no se rechazan, a la espera de una nueva información que
eventualmente pueda llevarnos a rechazarla en el futuro). La designaremos por R0.
Evidentemente los conjuntos de puntos que forman ambas regiones son disjuntos.
Regla de decisión:
• Si E > Ec  rechazamos Ho con un nivel de significación 

• Si E < Ec  no rechazamos Ho y nos quedamos con Ha con un nivel de significación 
Se debe distinguir entre dos tipos de contraste o test, que determinan la región de aceptación
y la región de rechazo.
Estadísticos de contraste para tests de hipótesis
paramétricos
Test de hipótesis para una media

Con varianza conocida
vs.
̅
Estadístico de contraste
√
Con varianza desconocida
vs.
̅
√
Test de hipótesis para diferencia de medias

Con varianzas
vs.
̅ ̅
√
Con varianzas e iguales
vs.
̅ ̅
√
donde
Con varianzas y distintas
vs.
̅ ̅
donde
( )
( ) ( )
Para observaciones pareadas
Sean las diferencias entre los datos apareados de ambas muestras, es decir de
dos mediciones X e Y realizadas sobre la misma unidad de recolección. Suponemos que estas
diferencias son independientes y normales
Haremos un test acerca de estas diferencias en base a los posibles valores de :
vs.
̅ ̅
√
donde
∑ ̅
Test de hipótesis para una varianza
Para la varianza
vs.
Test de hipótesis para homogeneidad de varianzas

Antes de realizar un test de diferencias de medias antes debemos asegurarnos que las
varianzas de las dos poblaciones o muestras sean parecidas estadísticamente. Para saber si dos
poblaciones de las cuales hemos tomado una muestra de cada una tienen varianzas parecidas
o si por el contrario son muy diferentes, se puede realizar un test de homogeneidad de
varianzas. En este test se utiliza un estadístico que sigue la distribución F para ver si podemos
asegurarnos la homogeneidad de varianzas y entonces pasar a realizar el test de diferencia de
medias.
vs.
donde son, respectivamente los df de las distribuciones Chi-Cuadrado independientes

del numerador y del denominador de la distribución F de Fisher- Snedecor
Test de hipótesis para la mediana

(test del signo)
vs.
Donde mna es la mediana teórica de la población X de la cual fue extraída una muestra de
tamaño n, y es la mediana empírica de la muestra
U = cantidad de positivos ~ B ( )
Donde
y B es la distribución Binomial.
Test de hipótesis para el coeficiente de correlación estimado
vs.
√
∑ ̅
√
√
que tiene una distribución estadística t de Student con n – 2 grados de libertad.
Veamos con un poco más de detalle este ultimo test
Test de hipótesis para el de Pearson

Recordemos que: , y recordemos también que se trata de un parámetro
poblacional.
Su estimador muestral, como ya vimos anteriormente, es:
∑
̅ ̅
̂
∑ ∑
√ ̅ √ ̅
Podemos someter el estimador r = ̂ de Pearson a un test de hipótesis para evaluar su

calidad. Las hipótesis correspondientes son:
Ho :  = 0
vs.
Ha :  ≠ 0 (bilateral a 2 colas)
Tomemos un nivel de significación α, e.g. α = 0,05 ; α = 0,01 ; o α = 0,001
El estadístico de contraste para este test y su distribución estadística son
Ejemplo de aplicación (Test de media con varianza conocida)
Un gremio se encuentra atravesando un periodo de alta conflictividad con su patronal.

Se cree que el tiempo medio que está en paro un trabajador de ese gremio es de 13.5 días por
bimestre. Para contrastar esta hipótesis al nivel de significación del 5 % frente a la alternativa
que sostiene el gremio de que no es cierto, se tomó una muestra de 45 trabajadores que
estuvieron en paro en ese sector y se obtuvo una media de 17,2 días por bimestre,
conociéndose que el desvío típico poblacional es de 15,3 días. Queremos comprobar si
estadísticamente hablando, debemos aceptar o rechazar dicha hipótesis.
En primer lugar plantemos las hipótesis a contrastar
vs.
Tomamos como nivel de significación o probabilidad de cometer un Error de Tipo 1,

de la manera que planteamos la hipótesis alterna, estamos pensando en un test bilatero, “a
dos colas”. Descargamos en cada una de las dos colas y encontramos en la
tabla Z = N (0 ; 1) los cuantiles correspondientes a esas colas, que resultan ser -1,96 (umbral
izquierdo) y 1,96 (umbral derecho). Así determinamos las regiones de rechazo y no rechazo de
la hipótesis nula.
El estadístico de contraste es
̅
De acuerdo a los datos obtenemos el estadístico de contraste
Regla de decisión: como -1,96 = - , no rechazamos la . En

consecuencia podemos asumir que la es verdadera, lo que significa que el supuesto de que
un trabajador de ese gremio está en paro 13,5 días por bimestre es correcto
Otra forma: viendo si el p-valor es o no inferior al nivel de significación del 5
| |
Por tanto se acepta la hipótesis nula
Ejemplo de aplicación (Test de una media  con varianza desconocida)
Estamos interesados en evaluar la temperatura media diaria en Rio Gallegos durante el mes de
Julio de 2011.
X : T (temperatura media diaria de julio 2011 en Río Gallegos, en ºC, datos oficiales del Servicio
Meteorológico Nacional, SMN)
Los datos observados son los siguientes:
Día (Julio) T 12 0.1 24 2.2

1 2.2 13 1.9 25 3.2
2 1.3 14 2.4 26 3.2
3 2.2 15 -0.3 27 3.1
4 1.7 16 -1.8 28 0.3
5 1.3 17 1 29 -2.8
6 2.6 18 0.4 30 -0.8
7 2.4 19 1.2 31 0.7
8 2.2 20 3.6
9 0.2 21 3.7
10 -1.2 22 2.6
11 2.4 23 3.5
Recordemos que en este caso el estadístico de contraste es:
̅ √
Como en este caso no conocemos la varianza poblacional debemos estimarla con su

estimador muestral
∑ ̅
Establecemos las hipótesis correspondientes para testear el parámetro  = 
H0:  = 0 = 1,3 (°C)

vs
Ha:  > 0
Al indicar de esta manera la hipótesis alterna queremos decir que sospechamos que la
temperatura media puede ser mayor que 1,3°C. En consecuencia estamos planteando en este
caso un test unilátero o a “una cola”. También podríamos haber testeado la hipótesis nula
contra una hipótesis alterna que estableciera que  ≠ 0 = 1,3 (°C). De ese modo estaríamos
planteando un test bilátero o “a dos colas”
Calculamos el estadístico E:
̅ √
Como dijimos recién, al no conocer la varianza poblacional debemos estimarla con y

entonces la distribución del estadístico de contraste pasa a ser t de Student con n – 1 grados
de libertad. Calculamos entonces este estadístico de contraste:
̅ √
Como vemos, estamos aproximando la distribución verdadera del estadístico de contraste

con la normal standard Z. Esto puede hacerse en virtud de que, como hemos visto al estudiar
la distribución t de Student, cuando sus grados de libertad son 10 o más tiende a coincidir con
la normal standard. Luego, bajo H0
Buscamos ahora por tabla Z el valor crítico , que coincide con el valor critico y elegimos el
nivel de significación, =0,05 o simplemente trabajamos con el p-valor si es que disponemos
de un software estadístico.
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil
No Rechazo
Versión Estudiantil 0,95
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil
α = 0,05 Versión Estudiantil
E = 0,47
Versión Estudiantil Versión Estudiantil Ec = 1,645
estadístico
Regla de decisión: Como = 0,47 < = 1,645  no rechazamos H0, i.e,

consideramos que  = 0 = 1,3 (°C)
Ejemplo de aplicación (Test de diferencia de medias con varianzas desconocidas e iguales y

muestras independientes)
Se lleva a cabo un estudio estadístico de recursos humanos para analizar si los salarios por
hora de los obreros de la construcción, categoría “oficial especializado”, son los mismos,
mayores o menores en la provincia de Buenos Aires que en Santa Cruz. Los datos obtenidos en
las dos muestras independientes tomadas en Junio de 2017 son, en pesos:
Provincia Salarios medios por Desviación standard Tamaño de la

hora de la muestra muestra
Buenos Aires 90.41 4.41 200
Santa Cruz 138.79 9.15 175
La empresa consultora desea probar la hipótesis a un nivel de significación del 5% de que (en
promedio) no hay diferencia estadística significativa entre los salarios por hora de dichos
trabajadores de las dos provincias. Planteamos las hipótesis del test. En principio proponemos
una hipótesis alterna bilatera (a dos colas) para abarcar las dos alternativas, es decir que en
algunas de las dos provincias el salario medio sea diferente:
vs.
Notamos:
̅ : Media de la muestra de los salarios de la provincia de Buenos Aires,
̅ : Media de la muestra de los salarios de la provincia de Santa Cruz,
: Desvío standard de la muestra de los salarios de la provincia Buenos Aires,

: Desvío standard de la muestra de los salarios de la provincia de Santa Cruz,
: Tamaño de la muestra en provincia de Buenos Aires

: Tamaño de la muestra en provincia de Santa Cruz
En nuestro ejemplo: ̅ = 90.41; = 4,41; = 200 y ̅ = 138.79; 9.15, = 175.
El estadístico de contraste correspondiente es
̅ ̅
En nuestro caso:
√
√
donde sabemos que bajo , , y los grados de libertad v los calculamos

con la expresión
( )
( ) ( )
( )
( ) ( )
Como la distribución del estadístico es entonces podemos utilizar directamente la

tabla Z = N (0 ; 1) para establecer las regiones de rechazo y no rechazo de a un nivel de
significación del 5%, bilatero.
Regla de decisión: como , rechazamos la hipótesis

nula al 5% de significación. En consecuencia podemos asumir que los salarios medios de los
obreros de la construcción son significativamente diferentes desde el punto de vista
estadístico entre Buenos Aires y Santa Cruz.
Ejemplo de aplicación (Test de hipótesis para homogeneidad de varianzas)
Supongamos que estamos comparando el largo de un perno (en centímetros) de una

misma marca, pero algunos fabricados en una planta de Mendoza y otros en una planta de San
Juan. Queremos saber si estas plantas producen pernos de igual calidad o si una de ellas
produce pernos de mejor calidad que la otra. Para saber si la calidad de sus producciones son
parecidas o si existe evidencia estadística suficiente como para pensar que son
significativamente distintas y en consecuencia pensar que una planta produce pernos de mejor
calidad que la otra, tomamos entonces una muestra de tamaño n = 7 de cada población
(planta) y hemos registrado las siguientes observaciones o datos acerca de la longitud de los
pernos que producen, medida en centímetros :
SAN JUAN MENDOZA
3,5 3,6
3,2 3,3
3,7 3,9
3,1 3,5
3,2 3,4
3,3 3,3
3,6 3,2
3,5 3,59
3,2 3,29
3,75 3,84
3,25 3,34
3,25 3,34
3,35 3,33
3,35 3,44
vs.
donde son, respectivamente los df de las distribuciones Chi-Cuadrado independientes

del numerador y del denominador de la distribución F de Fisher- Snedecor. En nuestro ejemplo
las varianzas muestrales son
= 0,04105769
= 0,04408846
El estadístico de contraste
El valor crítico teórico tabular para el contraste lo obtenemos de una tabla F de Fisher -
Snedecor con 13 grados de libertad en el numerador y 13 en el denominador, y nos da:
Fc (tabla) = 2,577
Regla de decision: como no
rechazamos la hipotesis nula y en consecuencia podemos suponer que las varianzas de ambas
poblaciones son homogeneas en el sentido de que su diferencia no es estadisticamente
significativa.
Ejemplo de aplicación (Test de hipótesis para la varianza)
Una nueva empresa de colectivos de línea se instala en la ciudad de Rio Gallegos, y desea
ganar una buena imagen con los habitantes haciendo que sus conductores sean puntuales en
los horarios de llegada a las paradas. La empresa desea que haya poca variabilidad en dichos
tiempos y que la varianza sea de 4 minutos o menos. Esta hipótesis se va a testear con un nivel
de significación
Se tomó una muestra aleatoria de 24 llegadas a la parada que se encuentra ubicada en la calle
Zapiola esquina Fagnano, de la cuales la varianza muestral encontrada es de
En primero lugar formulamos la hipótesis correspondientes
vs.
De esta manera estamos planteando un contraste unilatero (cola derecha). El estadístico de

contraste es
Grados de libertad: n-1 = 24 – 1 = 23 (renglones en la tabla)
Utilizamos la tabla de distribución Chi-Cuadrado para obtener el valor crítico
Regla de decisión: como , rechazamos la hipótesis

nula y tenemos que reconocer que la varianza del tiempo entre llegadas de colectivos a esa
parada es superior a 4.9 minutos y por lo tanto debemos ajustar y mejorar el sistema.
Ejemplo de aplicación (Test del coeficiente de correlacion de Pearson)
Recordemos que en el ejemplo climático anterior realizado un test para media de la

temperatura media diaria (T) para el mes de Julio de 2011 en Río Gallegos. Ahora queremos
observar si existe alguna asociación lineal entre la temperatura media (T) medida en °C y la
humedad relativa del ambiente (H) medida en %. Los datos observados de temperatura (T) y
humedad (H) para Julio de 2011 en Rio Gallegos son los siguientes:
Día (Julio) T H 12 0.1 88 24 2.2 92

1 2.2 79 13 1.9 90 25 3.2 94
2 1.3 84 14 2.4 99 26 3.2 89
3 2.2 82 15 -0.3 86 27 3.1 92
4 1.7 80 16 -1.8 86 28 0.3 82
5 1.3 88 17 1 78 29 -2.8 85
6 2.6 90 18 0.4 73 30 -0.8 80
7 2.4 85 19 1.2 67 31 0.7 78
8 2.2 86 20 3.6 65
9 0.2 86 21 3.7 69
10 -1.2 87 22 2.6 73
11 2.4 85 23 3.5 74
Aplicando la fórmula de trabajo que expusimos más arriba
∑
̅ ̅
̂
∑ ∑
√ ̅ √ ̅
Obtenemos un valor de ̂ -0,09595 ( correlación lineal significativa) con n = 31.
Planteamos, para testear el , las hipótesis nula y alterna:

Ho :  = 0
Ha :  ≠ 0 (bilateral a 2 colas)
t29 ~Z = N (0,1)
No Rechazo
Rechazo Rechazo
0,025 0,025
-1,96 1,68 1,96
t0 estadístico
Regla de decisión
Como t0 = 1,68 < t29; 0,975 = 1,96  No rechazamos Ho y consideramos
válido  = 0, con una P (error tipo I) = 0,05 = P (rechazar H0 siendo
verdadera) = α
En consecuencia podemos asumir que no existe una asociación lineal (proporcional) entre la
temperatura media y la humedad en Julio de 2011 para la ciudad de Rio Gallegos.
Recordemos una vez mas que en lugar de establecer un nivel de significación α y utilizar las
tablas estadísticas Z y t de Student, podemos trabajar con el p-valor si disponemos de un
software estadístico.
p – valor
A partir del uso de las computadoras ya no se utilizan más las tablas de las distribuciones
estadísticas en la vida práctica porque los software estadísticos específicos (como por ejemplo
Infostat, SPSS, SAS, Statistics, Stata, etc) las tienen incorporadas. Por este motivo tampoco se
usa más el nivel de significación ya que no es necesario. En lugar de la tabla y el nivel de
significación , el software nos informa cual es el p -valor (p – value) correspondiente al test.
Este número llamado p – valor es el área o probabilidad que queda entre el estadístico de
contraste y el final de la cola de rechazo, es decir que el p – valor es la probabilidad que queda
a la derecha (o a la izquierda, o en ambas colas, según se haya planteado la hipótesis alterna)
del estadístico.
Si el p – valor es muy pequeño, por ejemplo menor que un milésimo, podemos considerar que
el estadístico ha caído en lo profundo de la cola de rechazo, y en consecuencia podemos
interpretar la regla de decisión como que rechazamos H 0. Si por el contrario el p – valor no es
pequeño, por ejemplo mayor que un centésimo, podemos considerar que el estadístico de
contraste no se encuentra en lo profundo de la cola de rechazo, y en consecuencia podemos
aceptar la hipótesis nula. No hay valores fijos determinados del tamaño del p – valor tanto
para rechazar como para aceptar H0, el valor y la interpretación de los mismos quedan a
consideración de quien realiza el test y del contexto del mismo así como del grado de exigencia
del resultado.

5 - Test de Hipótesis

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

5 - Test de Hipótesis

Cargado por

Copyright:

Formatos disponibles

Test de Hipótesis

Recordemos brevemente alguno de estos conceptos:

Proporción Poblacional (p): se define como , donde x es el número de elementos en

Pasos para realizar un TEST de HIPOTESIS

 Hipótesis Nula (H0): Es una afirmación acerca del valor de un parámetro de la

Ha)  ≠ 0  bilateral a 2 colas

Ha)  > 0  unilateral a una sola cola

2. Establecer el estadístico de contraste

3. Seleccionar el nivel de significación.

El nivel de significación se refiere a la probabilidad de rechazar la Hipótesis Nula (H0) cuando

Tipos de error: Al hacer un test pueden ocurrir cuatro situaciones:

H0 (V) Correcto Error Tipo 2

H0 (F) Error Tipo 1 Correcto

 Error Tipo 2: aceptar la hipótesis nula siendo que es falsa (H0)

4. Identificar las regiones de Rechazo y de No Rechazo

Recordemos que el estadístico de contraste es un valor numérico determinado a partir de la

ón Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil Versión Estudiantil

5. Formular una regla de decisión.

• Si E > Ec  rechazamos Ho con un nivel de significación 

Test de hipótesis para una media

Con varianza desconocida

Test de hipótesis para diferencia de medias

Con varianzas e iguales

Con varianzas y distintas

Para observaciones pareadas

Haremos un test acerca de estas diferencias en base a los posibles valores de :

Test de hipótesis para homogeneidad de varianzas

donde son, respectivamente los df de las distribuciones Chi-Cuadrado independientes

Test de hipótesis para la mediana

Test de hipótesis para el coeficiente de correlación estimado

que tiene una distribución estadística t de Student con n – 2 grados de libertad.

Veamos con un poco más de detalle este ultimo test

Test de hipótesis para el de Pearson

Podemos someter el estimador r = ̂ de Pearson a un test de hipótesis para evaluar su

Tomemos un nivel de significación α, e.g. α = 0,05 ; α = 0,01 ; o α = 0,001

El estadístico de contraste para este test y su distribución estadística son

Ejemplo de aplicación (Test de media con varianza conocida)

Un gremio se encuentra atravesando un periodo de alta conflictividad con su patronal.

En primer lugar plantemos las hipótesis a contrastar

Tomamos como nivel de significación o probabilidad de cometer un Error de Tipo 1,

De acuerdo a los datos obtenemos el estadístico de contraste

Regla de decisión: como -1,96 = - , no rechazamos la . En

Otra forma: viendo si el p-valor es o no inferior al nivel de significación del 5

Por tanto se acepta la hipótesis nula

Ejemplo de aplicación (Test de una media  con varianza desconocida)

Día (Julio) T 12 0.1 24 2.2

Recordemos que en este caso el estadístico de contraste es:

Como en este caso no conocemos la varianza poblacional debemos estimarla con su

Establecemos las hipótesis correspondientes para testear el parámetro  = 

H0:  = 0 = 1,3 (°C)

Como dijimos recién, al no conocer la varianza poblacional debemos estimarla con y

Como vemos, estamos aproximando la distribución verdadera del estadístico de contraste

Regla de decisión: Como = 0,47 < = 1,645  no rechazamos H0, i.e,

Ejemplo de aplicación (Test de diferencia de medias con varianzas desconocidas e iguales y

Provincia Salarios medios por Desviación standard Tamaño de la

: Desvío standard de la muestra de los salarios de la provincia Buenos Aires,

: Tamaño de la muestra en provincia de Buenos Aires

En nuestro ejemplo: ̅ = 90.41; = 4,41; = 200 y ̅ = 138.79; 9.15, = 175.

El estadístico de contraste correspondiente es

donde sabemos que bajo , , y los grados de libertad v los calculamos

Como la distribución del estadístico es entonces podemos utilizar directamente la

Regla de decisión: como , rechazamos la hipótesis

Ejemplo de aplicación (Test de hipótesis para homogeneidad de varianzas)