Está en la página 1de 43

Pruebas de Hipótesis

Estadística inferencial
PROF. RODRIGO VERA
El rol de la hipótesis

• La hipótesis es central a toda construcción


de conocimiento.
• Puede ser el punto inicial de una
investigación de carácter confirmatorio.
• Puede ser el punto final de una investigación
de carácter exploratorio.
Teoría
Deducir

Hipótesis

Inducir

Hechos
¿Qué es una hipótesis?

• Una proposición acerca del comportamiento de


algún fenómeno.
• Esta proposición se simplifica y se
especifica como una relación entre dos
aspectos de un fenómeno o variables.
• La estadística tiene, a menudo, el objetivo
de poner a prueba estas hipótesis.
Hipótesis Conceptual
• El planteamiento de la proposición a nivel
abstracto
– Los ingresos varían entre tipos de
personas.
– La tendencia política de una persona
depende de su afiliación religiosa.
– Países más pobres tienen peor
distribuciones de ingreso.
Hipótesis Operacional
• El planteamiento de la proposición a nivel
concreto (operacional)
– Los ingresos mensuales, por concepto de
sueldo en pesos chilenos, varían entre
hombres y mujeres.
– El partido político a que pertenece una
persona depende de si es católico,
protestante o judío.
– Mientras más bajo el PIB/capita de un país,
mayor es el coeficiente Gini de ese país.
Hipótesis Nula (Ho)
• La negación de la hipótesis operacional:
– Los ingresos mensuales, por concepto de
sueldo en pesos chilenos, NO varían entre
hombres y mujeres.
– El partido político a que pertenece una
persona NO depende de si es católico,
protestante o judío.
– Mientras más bajo el PIB/capita de un país,
MENOR O IGUAL es el coeficiente Gini de ese
país.
Hipótesis Estadística

• Hipótesis • Hipótesis Nula


Operacional – HO: μH = μM
– H1: μH ≠ μM
– H1: ρ < 0 – HO: ρ ≥ 0
Asociación v/s Causación

• Al plantear una hipótesis, es importante


establecer si la hipótesis simplemente apunta
a la existencia de una relación o si implica
una situación de causa y efecto.
• Causalidad requiere:
– Establecer una asociación (relación)
– Establecer un orden en el tiempo
– Descartar relaciones espurias.
Hipótesis y Nivel de Medición
• Los ingresos mensuales, en términos de sueldo
en pesos chilenos, varían entre hombres y
mujeres. (Numérica y Categórica)

• El partido político a que pertenece una


persona depende de si es católico,
protestante o judío. (Categórica y
Categórica)

• Mientras más bajo el PIB/capita de un país,


mayor es el coeficiente Gini de ese país.
(Numérica y Numérica)
¿Cómo se pone a prueba una
hipótesis?
• Para empezar, la estadística pone a prueba la
hipótesis nula (HO).
• Luego de tomar una decisión sobre la
hipótesis nula, esto se interpreta como apoyo
o carencia de apoyo para nuestra hipótesis
operacional.
• Ese apoyo (o falta de), a su vez, se
interpreta como apoyo (o falta de) para
nuestra hipótesis conceptual.
La lógica de la prueba de hipótesis

• Partimos del supuesto que tenemos una muestra


y queremos saber qué ocurre en la población.
• La hipótesis nula se considera lo esperado.
• Los datos obtenidos se considera lo
observado.
• La prueba de hipótesis se convierte en una
comparación entre lo esperado y lo observado.
Por ejemplo:

Tenemos la siguiente hipótesis:


Los ingresos mensuales, por concepto de sueldo
en pesos chilenos, varían entre hombres y
mujeres.
– La hipótesis nula establece que el sueldo promedio
de los hombres es igual al sueldo promedio de las
mujeres (diferencia esperada = 0)
– Sin embargo, en promedio, los hombres ganan $70,000
más por mes que las mujeres (diferencia observada =
$70,000).
• La pregunta ahora es, ¿la diferencia que he
observado en mi muestra, refleja una
diferencia real en la población?

• Para poder responder eso necesito calcular


ciertos estadígrafos que me permitan decidir
si rechazo o no rechazo mi hipótesis nula.
• Volviendo a la lógica...
• La idea es establecer un umbral (un valor
crítico) que me permita decir, con un cierto
grado de confianza, que lo que he observado
efectivamente refleja una realidad externa y
no se deba solamente a errores de medición o
de muestreo.
• Entonces, con los datos observados calculo un
estadígrafo (valor observado) que contrasto
con el umbral (valor crítico).
• Si el valor observado es mayor o igual que el
valor crítico...
– Rechazo la hipótesis nula,
– Apoyo la hipótesis operacional, y
– Apoyo la hipótesis conceptual.
• Si el valor observado es menor que el valor
crítico...
– NO rechazo la hipótesis nula,
– NO apoyo la hipótesis operacional, y
– NO apoyo la hipótesis conceptual.
Errores

• Como la estadística es una ciencia


probabilística (y no determinística), siempre
existe la posibilidad de cometer errores.
• Por suerte, las probabilidades de cometer
errores pueden ser calculadas.
• Esos cálculos de probabilidades se basan en
la lógica del área bajo a curva normal.
Tipos de errores
• Al tomar las decisiones en función de mis
valores críticos y observados, yo puedo
cometer 2 tipos de errores:
– Rechazar una hipótesis nula que no debería
ser rechazada (que es verdadera); y
– No rechazar una hipótesis nula que debería
ser rechazada (que es falsa).
H O verdadera H O falsa
Rechazo H O Error Tipo I α  Correcto
No rechazo H O Correcto Error tipo II β 
El error 

• Es difícil de calcular, por ende quiero


simplemente hacer dos comentarios al
respecto:
– Está fuertemente vinculado a lo que se
denomina “la potencia” de una prueba
estadística (su capacidad de detectar
diferencias pequeñas); y
– Su relación con el error tipo  no es
lineal y sí es muy compleja.
El error 

• Es posible que el error tipo  probablemente


ya lo hayan visto.
• Recuerden que cuando se habla de Intervalos
de Confianza, a menudo se dice que queremos
estar 95% seguros de nuestros resultados.
• A esto le llamamos el nivel de confianza.
• El  es el grado de inseguridad (1 – 0.95)...
• La probabilidad de cometer un error
• La tradición en el mundo de la ciencia (y esto
es común en casi todas las ciencias, tanto las
sociales como las naturales), es que la
probabilidad de cometer un error no debería
ser mayor a 0.05 (5%, o 1 en 20).
• A veces, se puede usar 0.01 o 0.001 pero 0.05
es lo más común.
• Cuando podemos estar 95% seguro (o más) de
nuestra decisión de rechazar la hipótesis
nula, se dice que “el resultado es
significativo”.
Los pasos (clásicos) para probar
hipótesis
1. Decida sobre el valor de  con que quiere
trabajar (que probabilidad de cometer un
Error Tipo I está dispuesto a correr);
2. Identifique el valor crítico (el umbral)
utilizando una tabla especialmente diseñada
para estos fines (disponibles en todo texto
de estadística; Tablas de z, t, F, Chi,
etc.);
3. Calcule el valor observado (el estadígrafo)
con los datos a su disposición;
4. Compare el valor observado con el valor
crítico; y
5. Tome una decisión...
1. Si vo  vc  Rechace Ho
2. Si vo  vc  No rechace Ho
6. En función de su decisión anterior, apoye o
no apoye su hipótesis operacional y, por
ende, su hipótesis conceptual.
7. NOTA BENE: En la estadística nunca se
prueba una hipótesis, solamente se apoya!!
Los pasos (modernos) para probar
hipótesis
1. Decida sobre el valor de  con que quiere
trabajar (que probabilidad de cometer un
Error Tipo I está dispuesto a correr);
2. Pídale al computador que calcule el
estadígrafo correspondiente y que informe
sobre su “significancia”;
La “significancia” es el cálculo exacto
de la probabilidad de cometer un error
tipo .
3. Identifique el valor de la significancia
(sig., p, prob., etc.);
4. Compare sig. con .
5. Tome una decisión:
1. Si sig.    Rechace Ho
2. Si sig.    No rechace Ho
6. En función de su decisión anterior, apoye o
no apoye su hipótesis operacional y, por
ende, su hipótesis conceptual.
¿Paramétrica o no paramétrica?

• Para usar técnicas paramétricas:


– Se supone variables de tipo numérica,
– Que se distribuyen normalmente,
– Y que tengamos, mínimamente, 30 casos por
grupo (si estamos comparando grupos) o 30
casos por variables (si estamos
correlacionando dos variables).
t  Usada para inferir sobre una y dos
medias poblacionales

Grupos A y B Una variable


Sólo permite
Escala Proveniente de
comparar 2 grupos Nominal u Ordinal intervalo o razón

No existe diferencia significativa entre las


medias de los grupos comparados
Comparación de la media muestral
con la poblacional
con T-Student
Prueba de hipótesis con t-Student

Hipótesis Nula ( H0 ): Ho : 1 = 2

Hipótesis Alterna ( H1 ): H1: 1 ≠ 2 Siendo: G.l. = n-1

X obtenido 
tObtenido 
S
n: tamaño de la muestra
n
X: Media muestral
: Media poblacional
S: Desviación estándar

tCrítico  Valor obtenido de la tabla t-Student


Significancia estadística: Prueba de hipótesis

tObtenido = Cálculo a partir de los datos de la


muestra.
tCrítico = Valor de tabla con n-1 grados de libertad

Relación mejorada:

Si |tObtenido |  |tCrítico|, entonces se rechaza la


hipótesis nula (Ho); y por lo tanto, se acepta la
hipótesis alterna H1.
Problema:
Suponga que usted tiene una técnica que puede modificar la
edad a la cual los niños comienzan a hablar. En su localidad,
el promedio de edad, en la cual un niño emite su primera
palabra, es de 13,0 meses. No se conoce la desviación
estándar poblacional. Usted aplica dicha técnica a una
muestra aleatoria de 15 niños. Los resultados arrojan que la
edad media muestral en la que se pronuncia la primera
palabra es de 11.0 meses, con una desviación estándar de
3,34.

1. ¿Cuál es la hipótesis alterna ?


2. ¿Cuál es la hipótesis nula?
3. ¿Funciona la técnica? Utilice =0,052colas
Hipótesis Nula H0: La técnica no afecta la edad en
que los niños comienzan a hablar.

Por lo tanto, la muestra con X obtenido  11,0 es una


muestra aleatoria , extraída de una población con 
= 13,0.

Hipótesis alterna H1: La técnica afecta la edad en


que los niños comienzan a hablar.

Por lo tanto, la muestra con X obtenido  11,0 es una


muestra aleatoria, extraída de una población donde
 ≠ 13,0.
X obtenido  11,0 13,0 2
tObtenido     2,32
S 3,34 0,863
n 15

tCrítico  2,145

Si tObtenido  tCrítico , entonces , no se acepta la


Hipótesis nula; por lo que se acepta la hipótesis alterna:
“La técnica afecta la edad en que los niños comienzan
a hablar”.
Distribución t-Student para
dos grupos independientes
y dos grupos dependientes
DIFERENCIA DE MEDIAS GRUPOS INDEPENDIENTES (T)
ejemplo: Se desea saber si existen diferencias entre ambos grupos

GRUPO 1 6,2 6,3 5,4 4,5 5,0 4,7 5,7 3,3


GRUPO 2 5,8 6,6 6,8 5,9 5,4 5,0 6,5 6,7

n1  8 x1  5,14 S1  0,99
n2  8 x2  6,09 S2  0,66
___ ___

t  X X 1 2

(n 1 ) s  (n 1 ) s  1 1
2 2

1 1   2 2 
(n  1)  (n  1)  
1 n n 2 1 2
DIFERENCIA DE MEDIAS GRUPOS INDEPENDIENTES (T)

n1  8 x1  5,14 S1  0,99
n2  8 x2  6,09 S2  0,66
___ ___

t  X X 1 2

(n 1 ) s  (n 1 ) s  1 1
2 2

1 1  
2 2 
(n  1)  (n  1)  
1 n n
2 1 2

CÁLCULO DEL VALOR T OBSERVADO

5,14  6,09
t 
(8  1)0,992  (8  1)0,662  1 1 
  
(8  1)  (8  1) 8 8
DIFERENCIA DE MEDIAS GRUPOS INDEPENDIENTES (T)

Valor calculado
to  2.28

 = 0.05 bilateral Existen diferencias de rend. favorables


al grupo 2 (M=6,09) respecto del grupo 1
valor critico (M=5,14), t(14)=2,28, p<.05.
t0.025;14  2.14
t0.975;14  2.14
grados de libertad to  2.28
(n1-1)+(n2-1)

Se Rechaza Ho
DIFERENCIA DE MEDIAS GRUPOS RELACIONADOS
con T de Student .

Un Director de un colegio intentaba encontrar un modo


eficaz de estimular la concentración de los niños,
entendida como la capacidad que tienen para centrarse
en aquello que están realizando en cada momento. Con el
fin de elegir la técnica más apropiada, probó en un
Segundo básico dos opciones, una basada en ejercicios
de respiración y relajación y otra basada en el efecto
Mozart, pues tenía antecedentes que la música también
incide en la concentración, la atención y la memoria,
fundamentales para el proceso del aprendizaje. Los
resultados fueron medidos a través de los tiempos de
concentración de cada niño en cada una de las
experiencias.
DIFERENCIA DE MEDIAS GRUPOS RELACIONADOS (T)
En nuestro caso, se obtienen los siguientes valores:
TÉC. ERR TÉC. EM d
15 27 -12
12 25 -13 ___
22
20
17
30
5
-10
X d  4,83
18 22 -4
16 19 -3 s d
 5,61
14 15 -1
19
17
22
25
-3
-8
n  12
10 19 -9
25 23 2
20 22 -2
DIFERENCIA DE MEDIAS GRUPOS RELACIONADOS (T)
CÁLCULO DEL VALOR T OBSERVADO

___

n  12 X d  4,83 s d
 5,61

___

Xd SUSTITUYENDO
 4,83
tO  tO   2,99
5, 61
Sd 12
n
DIFERENCIA DE MEDIAS GRUPOS RELACIONADOS (T)
Valor calculado  = 0.05 bilateral
to  2,99 valor critico
t0.025;11  2,201

t0.975;11  2,201 grados de libertad n-


1
to  2,99

Se Rechaza Ho
Al comparar los valores, podemos rechazar la hipótesis nula de la
igualdad de las técnicas de estimulación de la concentración, con un
margen de error de 5%, por lo cual podemos afirmar que la existen
diferencias entre ellas, a favor de la técnica basada en el efecto
Mozart.

También podría gustarte