Está en la página 1de 27

ESTADÍSTICA INFERENCIAL

𝑟𝑥𝑦
PRUEBA t PARA CORRELACIONES 𝑡𝑜 =
2
1 − 𝑟𝑥𝑦
𝑛−2

ANÁLISIS DE VARIANZA
Contraste de hipótesis

Propósito: Identificar la existencia de la correlación

Ho: Las unidades de una variable no se correlación con las unidades de la otra.
H1: Las unidades de una variable se correlación con las unidades de la otra.

La prueba de hipótesis se realiza con el estadístico: Correlación de Pearson.


Correlación directa Correlación inversa

Índice de masa corporal (Kg/m2)


Peso del recién nacido (gramos)

Hemoglobina de la madre (mg/dl) Actividad física (horas/semana)


Planteamiento de hipótesis para la correlación

Ho: 𝒓𝒙𝒚 = 𝟎 No existe correlación


A dos colas
H1: 𝒓𝒙𝒚 ≠ 𝟎 Existe correlación

Ho: 𝒓𝒙𝒚 ≤ 𝟎 No existe correlación directa


H1: 𝒓𝒙𝒚 > 𝟎 Existe correlación directa
A una cola
Ho: 𝒓𝒙𝒚 ≥ 𝟎 No existe correlación inversa
H1: 𝒓𝒙𝒚 < 𝟎 Existe correlación inversa
Prueba “t” para correlaciones

Las correlaciones son uno de los procedimientos más utilizados en el análisis de resultados obtenidos en
investigaciones del comportamiento. Siendo el comportamiento humano un factor afectado por un número plural
de variables, es evidente que las mismas interactúan mutuamente y se afectan unas a otras, asociándose de
diversas maneras.

La correlación es una técnica estadística que permite estudiar el nivel de asociación de dos o más variables.
Vamos a estudiar si el coeficiente de correlación obtenido entre dos variables es estadísticamente diferente que
cero y por lo tanto, si la asociación de estas variables es válida.

Para representar al coeficiente de correlación se utilizará en símbolo 𝑟𝑥𝑦 , y la prueba de hipótesis se


desarrollará siguiendo el mismo procedimiento que en los casos anteriores.
𝑟𝑥𝑦
𝑡𝑝 =
1 − (𝑟𝑥𝑦 )2
𝑛−2
Prueba “t” para correlaciones

La correlación es una técnica estadística que permite estudiar el nivel de asociación de dos o
más variables. Los grados de libertad son iguales a n-2
1. Hipótesis estadísticas:
Ejemplo 1: 𝐻𝑜 : 𝑟𝑥𝑦 ≤ 0
𝐻1 : 𝑟𝑥𝑦 > 0
A una muestra de 20 estudiantes
2. Nivel de significación
universitarios se les aplicó una prueba de 𝛼 = 0,025 𝑢𝑛𝑎 𝑐𝑜𝑙𝑎
razonamiento verbal con el fin de gl = 20 - 2 = 18 tc= 2,10
determinar si esta variable se asocia 3. Estadístico de prueba:
𝑟𝑥𝑦 0,38
positivamente con los puntajes 𝑡𝑝 = = 2
= 1,74
1−(𝑜,38)
1−𝑟2
𝑥𝑦 20−2
correspondientes al índice académico de los 𝑛−2

4. Regla de decisión: Se acepta Ho


dos primeros semestres de una carrera
universitaria. El coeficiente de correlación 5. Conclusión: No existe correlación directa entre la puntuación
fue de 0,38. 𝛼 = 0,025 ¿Es esta de la prueba de razonamiento verbal y los correspondientes
correlación estadísticamente significativa, o al índice académico de los dos primeros semestres de una
sea, es verdaderamente positiva? carrera universitaria.
Ejemplo 2
1. Hipótesis estadísticas:
Dos investigadores del comportamiento 𝐻𝑜 : 𝑟𝑥𝑦 ≤ 0
desarrollaron un estudio para determinar si 𝐻1 : 𝑟𝑥𝑦 > 0
existe una correlación significativa entre 2. Nivel de significación
ansiedad y razonamiento lógico. 𝛼 = 0,05 𝑢𝑛𝑎 𝑐𝑜𝑙𝑎
Seleccionaron una muestra de 28 sujetos, gl = 28 - 2 = 26 tc= 1,71

obtuvieron mediciones de estas variables y 3. Estadístico de prueba:


correlacionaron las mismas obteniéndose el 𝑟𝑥𝑦 0,30
𝑡𝑝 = = = 1,60
1−(𝑜,30)2
1−𝑟2
𝑥𝑦 28−2
coeficiente de correlación r = 0,30. 𝑛−2

Determina la significancia de esta 4. Regla de decisión: Se acepta Ho


5. Conclusión: No existe correlación directa entre la
correlación, con alfa de 0,05
ansiedad y el razonamiento lógico.
Ejemplo 3
1. Hipótesis estadísticas:

𝐻𝑜 : 𝑟𝑥𝑦 ≤ 0
Una muestra de 42 estudiantes fue 𝐻1 : 𝑟𝑥𝑦 > 0
evaluada en los factores depresión y 2. Nivel de significación
rendimiento en matemática. Los 𝛼 = 0,05 𝑢𝑛𝑎 𝑐𝑜𝑙𝑎
resultados obtenidos obtuvieron un gl = 42 - 2 = 40 tc= 1,68

coeficiente de correlación r = 0,29. Es 3. Estadístico de prueba:


𝑟𝑥𝑦 0,29
esta correlación significativa, a un 𝑡𝑝 = = = 1,92
1−(𝑜,29)2
1−𝑟2
𝑥𝑦 42−2
nivel alfa de 0,05. 𝑛−2

4. Regla de decisión: Se rechaza Ho


5. Conclusión: La correlación entre estas variables es
significativa, es decir, es positiva.
ANÁLISIS DE VARIANZA

Las pruebas de hipótesis analizadas, hacían énfasis en la comparación de la media aritmética de una
muestra con una media poblacional, o se comparaban dos medias aritméticas provenientes de dos
muestras. Estos casos se analizaron tanto para muestras grandes ( n> 30 sujetos), en los cuáles se
utilizaba el estadísticas Z y la curva normal como modelo de probabilidades, al igual que para las
muestras pequeñas ( n ≤ 30) casos en los que se utilizaba la prueba “t de student”, respaldada por el
modelo de probabilidad denominado t de student. En ambos casos el número máximo de medias
aritméticas que se podían comparar era de dos; pero si hay tres o más medias, ninguno de los dos
modelos probabilísticos es adecuado. En estos casos, el procedimiento adecuado se denomina
ANOVA o análisis de varianza que utiliza como modelo de probabilidades una distribución
denominada F de Fisher y la prueba F como procedimiento de análisis estadístico.
ANÁLISIS DE VARIANZA DE UN FACTOR (ANOVA)

Es una herramienta estadística que analiza la varianza de un factor para una variable dependiente
cuantitativa.

Se busca contrastar la hipótesis de que varias medias (más de dos) son iguales o diferentes. Esta
técnica es una extensión de la prueba t.

La prueba ANOVA corrige el error que se deriva de las comparaciones de medias de k grupos para
evitar aumentar la probabilidad del error tipo 1.

Tipos:

- ANOVA de un factor entre sujetos o grupos independientes.

- ANOVA de un factor de medias repetidas o de medidas relacionadas.


Ejemplo:

Tres psicólogos de la escuela de psicología han desarrollado, de manera independiente, tres


tratamientos dirigidos a disminuir la ansiedad en los estudiantes que desarrollan las pruebas
de admisión a dicha escuela.

Variable independiente: Tratamiento


Aplicado a tres niveles (k) El nivel es el tratamiento desarrollado por cada uno de los profesores

Variable dependiente: Ansiedad

El experimento trata de verificar el efecto de los tratamientos sobre la ansiedad y si se


observan diferencias entre dichos tratamientos con relación al efecto producido en la
ansiedad.

Como son tres grupos se decide aplicar una ANOVA para determinar la efectividad de los
tratamientos.
La distribución F
El ANOVA es un procedimiento de análisis estadístico que se aplica cuando estamos interesados en
determinar si tres o más medias son estadísticamente diferentes. Aunque este procedimiento permite
determinar la diferencia entre las medias, se vale de la varianza de los datos para determinar si hay o
no diferencias. El procedimiento permite obtener una 𝐹𝑝 que proviene del cociente de la estimación
de dos varianzas que provienen de la misma población:
1. 𝜎12 : que es la estimación de la varianza que proviene de los efectos observados en las muestras
que se están analizando, los cuáles son independientes entre sí.
2. 𝜎22 : que es la estimación de los errores aleatorios dentro de cada una de las muestras analizadas.
Esta relación se puede presentar a través de la siguiente ecuación:

𝑭𝒑
El resultado obtenido a través de este cociente
Fp, se compara con la F crítica (Fc) obtenida
de la tabla correspondiente, de acuerdo al
nivel alfa establecido y los grados de libertad
correspondientes al problema. Esto significa
que, al igual como sucede con la normal y la
“t”, existe una distribución muestral resumida
en una tabla, en la cual se asocian los valores
teóricos de F con sus correspondientes
probabilidades, dando como resultado los
valores Fc que son los que separan la zona de
rechazo de Ho con la zona de no rechazo de
dicha hipótesis.
El objetivo del ANOVA es establecer cuánto de la variabilidad observada en los grupos se debe a
los efectos entre los tratamientos y cuánto se debe a efectos aleatorios dentro de los tratamientos.

Por ser la prueba F un procedimiento aplicado en nuestras pequeñas, los valores de Fc variarán de
acuerdo con los grados de libertad, que para efectos de esta distribución, se deben tomar en cuenta
dos valores: los gl para el numerador (efectos entre las muestras) y los gl para el denominador
(efectos aleatorios dentro de cada muestra)

gl del numerador= k- 1 gl del denominador= n- k

Donde:
n= número de observaciones
k = número de tratamientos
𝑭𝒑

Numerador
𝑭𝒑

Denominador

La comparación de la Fp con la Fc determina si se rechaza o no se rechaza la Ho siguiendo el


modelo que a continuación presentamos:
Si Fp > Fc, se rechaza la Ho
Si Fp ≤ Fc, no se rechaza la Ho
EJEMPLO 4
Tres psicólogos clínicos han desarrollado de manera independiente, tres tratamientos para reducir la
ansiedad en estudiantes que aspiran a ingresar a la escuela de psicología. Los tratamientos se aplican
a tres muestras aleatorias de aspirantes, y posteriormente se les evalúa su nivel de ansiedad, con el
fin de evaluar si los tratamientos ejercen distintos efectos sobre los grupos. A continuación se
presentan los resultados obtenidos.
Prueba de hipótesis:

1. Hipótesis estadísticas:
𝐻𝑜 : 𝜇1 = 𝜇2 = 𝜇3 Al menos una de
las medias es
𝐻1 : 𝜇1 ≠ 𝜇2 ≠ 𝜇3 distinta

2. Nivel de significación
𝛼 = 0,05 𝑑𝑜𝑠 𝑐𝑜𝑙𝑎𝑠
Grados de libertad:
numerador: k-1 = 3-1= 2
denominador: n – k = 27-3 = 24
gl = 2, 24 𝐹𝑐 = 3,40
𝑭𝒑

3. Estadístico de prueba:
𝑭𝒑 =

𝑭𝒑

𝑆 2 𝑒𝑛𝑡𝑟𝑒 202,26
𝐹𝑝 = 𝑆 2 𝑑𝑒𝑛𝑡𝑟𝑜
= 2,38 = 84,98
4. Decisión: Si Fp > Fc, se rechaza la Ho
Si Fp ≤ Fc, no se rechaza la Ho
𝐹𝑝 = 84,98 𝐹𝑐 = 3,40

Se rechaza 𝐻0

4. Conclusión:

Por lo menos una de las medias es distinta.


EJEMPLO 4 CON EXCEL

Decisión:

Si Fp > Fc, se rechaza la Ho


Si Fp ≤ Fc, no se rechaza la Ho

Si p − 𝑣𝑎𝑙𝑜𝑟 > 𝛼, se rechaza la Ho

Varianza entre
ANÁLISIS DE VARIANZA grupos

Origen de las Suma de Grados de Promedio de Valor crítico


variaciones cuadrados libertad los cuadrados F Probabilidad para F

Entre grupos 404.52 2.00 202.26 85.00 0.00 3.40


Dentro de los
grupos 57.11 24.00 2.38

Varianza dentro
Total 461.62963 26 de los grupos
Prueba de comparación de dos medias de Tukey

La prueba de Tukey se aplica al rechazar la hipótesis de igualdad de medias en la prueba ANOVA. Es


parte de un conjunto de pruebas llamadas Post-Hoc

𝑥1ҧ − 𝑥ҧ2
𝑄𝑝 =
𝑆 2𝑑
𝑛

Donde:
𝑥ҧ1 𝑦 𝑥ҧ2 son los promedios obtenidos en cada tratamiento.
𝑆 2 𝑑 es la varianza dentro de las muestras.
n es el valor mínimo de los tamaño de muestra.
Prueba de comparación de dos medias de Tukey
Prueba Q
Las tres medias ordenadas de mayor a menor: 𝑥ҧ2 > 𝑥ҧ1 > 𝑥ҧ3
Hipótesis:
𝐻𝑜 : 𝑥ҧ2 ≤ 𝑥ҧ1 ≤ 𝑥ҧ3
𝐻1 : 𝑥ҧ2 > 𝑥1ҧ > 𝑥ҧ3
Nivel de significancia:
𝛼 = 0,05
𝑥ҧ1 − 𝑥ҧ2
𝑄𝑐(𝑘,𝑛−𝑘) = 3,53 𝑄𝑝 =
𝑆2𝑑
Comparación 𝑥ҧ2 − 𝑥ҧ1 𝑛
16,78 − 12,78
𝑄𝑝 = = 7,78
2,38
9
En vista de que 𝑄𝑝 = 7,78 > 3,53 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0
El tratamiento 1 presentó un promedio de ansiedad menor que
el tratamiento 2. Dicho tratamiento es más efectivo en la
reducción de la ansiedad.
Prueba de comparación de dos medias de Tukey
Prueba Q
Las tres medias ordenadas de mayor a menor: 𝑥ҧ2 > 𝑥ҧ1 > 𝑥ҧ3
Hipótesis:
𝐻𝑜 : 𝑥ҧ2 ≤ 𝑥ҧ1 ≤ 𝑥ҧ3 Comparación 𝑥ҧ1 − 𝑥ҧ3
𝐻1 : 𝑥ҧ2 > 𝑥1ҧ > 𝑥ҧ3
12,78 − 7,33
𝑄𝑝 = = 10,60
Nivel de significancia: 2,38
𝛼 = 0,05 𝑥ҧ1 − 𝑥ҧ2 9
𝑄𝑐(𝑘,𝑛−𝑘) = 3,53 𝑄𝑝 = En vista de que 𝑄𝑝 = 10,60 > 3,53 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0
𝑆2𝑑
𝑛 El tratamiento 3 presentó un promedio de ansiedad menor que
Comparación 𝑥ҧ2 − 𝑥ҧ3 el tratamiento 1. Dicho tratamiento es más efectivo en la
16,78 − 7,33 reducción de la ansiedad.
𝑄𝑝 = = 18,38
2,38
9 El nivel de efectividad de los tratamientos
En vista de que 𝑄𝑝 = 18,38 > 3,53 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0 para reducir la ansiedad fue el siguiente: 3,
1 y2
El tratamiento 3 presentó un promedio de ansiedad menor que
el tratamiento 2. Dicho tratamiento es más efectivo en la
reducción de la ansiedad.
Si p − 𝑣𝑎𝑙𝑜𝑟 > 𝛼, se rechaza la Ho

𝐻𝑜 : 𝜇1 = 𝜇2 = 𝜇3 No hay diferencia significativa


𝐻1 : 𝜇1 ≠ 𝜇2 ≠ 𝜇3 Si hay diferencia significativa

Q TEST
group 1 group 2 mean std err q-stat lower upper p-value mean-crit Cohen d
T1 T2 4 0.5142 7.7790 2.1838 5.8162 0.0000 1.8162 2.5930 si hay diferencias
T1 T3 5.4444 0.5142 10.5882 3.6283 7.2606 0.0000 1.8162 3.5294 si hay diferencias
T2 T3 9.4444 0.5142 18.3672 7.6283 11.2606 0.0000 1.8162 6.1224 si hay diferencias
EJEMPLO 5

Se desarrolla una investigación para establecer la eficacia de tres métodos de enseñanza de un curso
de psicofisiología. Los métodos investigados son los siguientes: 1. Lectura personalizada, 2.
Discusión de grupos y 3. Tutorías. Se conforman aleatoriamente 3 grupos de 10 estudiantes cada uno,
con los mismos pre-requisitos para recibir el curso. Los resultados con los siguientes:

Con alfa de 0.05, determine si hay diferencias significativas entre los tratamientos. De ser así,
determine las mismas
EJEMPLO 6
EJEMPLO 7

También podría gustarte