Está en la página 1de 36

ESCUELA PROFESIONAL DE PSICOLOGIA HUMANA

Curso:
ESTADÍSTICA APLICADA A LA
INVESTIGACION
Semana 12

Ciclo: 2021-2

Docente: Mg. Herwin Walter Vásquez Tanta


Contenidos de la Unidad_3
SEMANA XII : CASOS ESPECIALES DE CORRELACION

1. Correlación Tetracórica
2. Coeficiente de Contingencia
1. EL COEFICIENTE DE CORRELACIÓN TETRACORICO(rt)

Este coeficiente de correlación se utiliza cuando hay una demanda en la


investigación de dicotomizar las variables implicadas.

La correlación tetracórica requiere que:


• N (número total de casos) debe ser mayor o igual que 100.
• Los valores de cada variable deben ser mayores o iguales que el 10%
del valor de n (es decir, el valor mínimo debe ser 10).
• Las variables que se trabajen deben ser dicotómicas, es decir, se crea
una dicotomía artificial con las variables.
• Las variables deben ser continuas, distribuidas de manera normal
(campana) y relacionadas entre sí de manera lineal.
• Si una de las variables involucradas tiene valor cero, la correlación no
se puede solucionar (pero se puede evitar tener un valor cero, si se
modifica el punto de corte).
1.1 DICOTOMIZACIÓN DE UNA VARIABLE
Consiste en asignarle a las puntuaciones de los sujetos únicamente dos
posibles valores.
Ejemplo:
Tenemos 6 sujetos y tenemos medido el rendimiento en matemáticas de los 6
sujetos, lo que hacemos es dividir la muestra en 2.

• A los sujetos de rendimiento bajo en matemáticos les ponemos un (-)


como valores de la variable dicotomizada.
• A los sujetos de rendimiento alto en matemáticas les ponemos un (+).
De esa manera todos los sujetos tienen asignados o un menos o un mas, por lo
tanto la variable ya es dicotómica.
1.3 INTERPRETACIONES
Los coeficientes de correlación tetracórica toman los mismos valores que
la correlación de Pearson y son interpretados de la misma forma,
indicando el grado de asociación que existe entre las variables estudiadas.
Los valores de la correlación tetracórica van desde -1 a 1, la interpretación
de estos valores es la siguiente:

• Correlación negativa absoluta cuando rt=-1, es decir que la disminución


en la frecuencia de una de las variables, tendrá incidencia en el
aumento de la otra.
• No existe correlación alguna cuando rt=0, es decir los valores de las
variables no están vinculados de forma alguna.
• Correlación positiva absoluta cuando rt=1, en este caso el aumento de
la frecuencia de alguna de las variables, se vería reflejado en un
aumento de frecuencia de la otra variable estudiada.
Como puede verse, en el caso de las correlaciones absolutas (rt=-1 o rt=1),
todos los puntos se encuentran exactamente sobre una línea recta, esto
quiere decir que la asociación entre estas variables puede ser expresada
como una ecuación lineal.
1.4 LIMITACIONES
Entre las limitantes de la correlación tetracorica se encuentran
precisamente las condiciones necesarias para su aplicación, es decir que
no puede darnos ninguna información sobre variables discretas que no
tenga forma de ser expresadas como variables continuas, ni puede usarse
para estudiar la correlación de variables no dicotómicas y ninguna
proporción marginal debe ser inferior a 0,05, tampoco deben haber
frecuencias nulas o muy inferiores a las demás. Además para que tenga
alguna utilidad las variables estudiadas deben ser normales (Abascal y
Grande, 2014).
La no convergencia hace referencia a la incapacidad de estimar valores
positivos suficientemente pequeños a partir de las interacciones entre
ítems, de forma que puedan indicar alguna similitud entre el modelo
propuesto y los datos obtenidos de las variables observadas. Esto provoca
que en ocasiones el programa utilizado tenga dificultades para generar
una matriz positiva (covariance matrix nonpositive definite), es decir que
todos los valores sean superiores a cero, es decir, provocando un margen
de error de ejecución e interrumpe el análisis (Cuttance, 2009).
Adicionalmente hay que tomar en cuenta la pérdida de información
resultante de la dicotomización artificial, ya que para esto se elige un
punto de corte, lo cual debe hacerse con sumo cuidado con el propósito de
no alterar la correlación entre variables.
1.5 CALCULO DEL COEFICIENTE DE CORRELACION TETRACORICO
Existen varias formas de calcular el coeficiente de correlación tetracorica.
Nosotros utilizaremos la formula de la siguiente manera:

1° Se calcula la tabla de frecuencias de las 2° Se aplica la formula


variables dicotomizadas.
EJEMPLO
Se ha medido a 20 sujetos en los cursos de matemáticas y razonamiento, obteniéndose los
siguientes resultados. Se pide determinar el coeficiente de correlación tetracorico y su
interpretación.
SOLUCION
1° Hay que ordenar los datos
2° Hallar la mediana de ambas
variables para realizar la
dicotomización. En excel se usa la
función : Mediana
3° Se genera 1 columna a cada
variable para hacer la
dicotomizacion
4° Para dicotomizar la variable
Matematicas, se coloca el símbolo
(+) a todos los datos de esa
variable que sean mayores que
4.5(mediana) y el símbolo(-) a los
datos que sean menores de 4.5.
5° Para dicotomizar la variable
Razonamiento, coloco el signo(+) a
todos los valores que sean
mayores que 50(mediana) y el
símbolo(-) si son menores de 50.
6° Para rellanar la columna Letra,
tengo que valerme de la tabla de
frecuencias de las variables
dicotomizadas
7° Para determinar la letra A (la cual
esta ubicado entre la intersección
de matemática + y razonamiento -
), se verifica que sujetos tienen (+)
en matemática y (–) en
razonamiento.
8° Para determinar la letra B (la cual
esta ubicado entre la intersección
de matemática + y razonamiento
+), se verifica que sujetos tienen
(+) en matemática y ( +) en
razonamiento. De igual manera se
realiza para C y D, quedando la
columna LETRA, tal como se
muestra.
9° Se suman la cantidad
de As, Bs, Cs y Ds que
se encuentra en la
columna Letra y se
coloca los resultados
en tabla de
frecuencias de las
variables
dicotomizadas.
10° Los datos obtenidos en la tabla de frecuencias de las variables
dicotomizadas, se reemplazan en la formula y obtenemos el
siguiente resultado:
2. EL COEFICIENTE DE CONTINGENCIA ( C )
El coeficiente de contingencia es una medida de asociación entre dos grupos de
datos (o valores) de dos variables medidas en escala nominal, donde las dos
variables tienen la misma cantidad de clases o categorías. El coeficiente de
contingencia lo representamos por C y se puede calcular mediante la fórmula

Donde : n = número total de observaciones( cantidad de unidades de estudio en la muestra)


Nota: Para hallar este y otros coeficientes de correlación que veremos más adelante,
se necesita construir una tabla de frecuencias para datos bivariados (tabla de
contingencia) como la siguiente:
En la que los c niveles b1 , b2 ,…, bc del factor b
encabezan las columnas y los r niveles a1, a2 ,…, ar del
factor a encabezan las filas.
Y donde oij es la frecuencia observada (absoluta) en cada
celda ( i, j) de la tabla anterior y eij es la frecuencia
esperada, la cual puede ser estimada mediante la fórmula:º

ni. la suma de la fila i–ésima que corresponde a las frecuencias


absolutas de ai y n.j la suma de la columna j-ésima que corresponde a las
frecuencias absolutas de bj
2.1 DISTRIBUCION JI-CUADRADA O CHI-CUADRADA O X2
Es una prueba útil para variables categóricas y es aplicable cuando la variable nominal está
compuesta por dos o más categorías. Tiene dos aplicaciones:
1. La prueba de bondad de ajuste (1variable)
2. La prueba Chi-cuadrada de asociación (2 variables)
3. Prueba de homogeneidad (2 variables)
Las dos últimas pruebas se utilizan para determinar si las frecuencias observadas (O) en las
categorías difieren significativamente de las frecuencias esperadas (E).
Es una prueba estadística que permite evaluar hipótesis acerca de la relación entre dos
variables categóricas (nominal u ordinal). Por ejemplo:
Ho: Las variables X e Y son independientes, (X e Y no están relacionados)
H1: Las variables X e Y no son independientes, (X e Y están relacionados)
2.2 PROPIEDADES QUE CUMPLE EL COEFICIENTE DE CONTINGENCIA
• Mide el grado en que dos conjuntos de datos se encuentran relacionados.
• C toma valores comprendidos entre 0 y 1, sin incluir a ambos.
• Con más precisión, C toma valores entre 0< C <Cmax , siendo

donde k representa el número de categorías o clases establecidas para cada variable


2.3 USO DEL COEFICIENTE DE CONTINGENCIA
Se puede utilizar en la búsqueda de relación o asociación entre dos conjuntos de datos (o
valores) de dos variables medidas en escala nominal, pero con la misma cantidad de clases o
categorías.
2.4 INTERPRETACION DEL COEFICIENTE DE CONTINGENCIA
• Si 0<C ≤0,2, entonces puede decirse que la correlación es despreciable.
• Si 0,2<C ≤0,3, entonces puede decirse que la correlación es débil.
• Si 0,3<C ≤0,5, entonces puede decirse que la correlación es moderada.
• Si 0,5<C ≤0,7, entonces puede decirse que la correlación es fuerte.
• Si 0,7<C ≤Cmax , entonces puede decirse que la correlación es muy fuerte.
2.5 EJEMPLO: RELACION ENTRE 2 VARIABLES CUALITATIVAS ES DECIR LOS
VALORES DE LAS VARIABLES NO SON NUMERICOS SINO CATEGORIAS.
SE TIENE LOS SIGUIENTES DATOS SOBRE 4 TRATAMIENTOS REALIZADOS A 560 PACIENTES Y TRES NIVELES DE RESPUESTA .
LOS PACIENTES HAN SIDO TRATADOS CON 4 DOSIS DIFERENTES DE FARMACOS PARA VER LA RESPUESTA AL
TRATAMIENTO. SEGÚN LOS DATOS DE LA TABLA DE CONTINGENCIA, LOS QUE HAN SIDO TRATDOS CON LA 1RA DOSIS 7
HAN EMPEORADO, 28 HAN PERMANECIDO IGUAL Y 115 HAN MEJORADO, ETC
SE PIDE DETERMINAR EL COEFICIENTE DE CONTINGENCIA Y SU INTERPRETACION PARA PODER DECIDIR POR LOS
FARMACOS ADECUADOS.
TABLA DE CONTINGENCIA
1° Se determinan las frecuencias
marginales, sumando las
frecuencias observadas en las
filas y columnas.

f1 = (7 + 28 + +115) = 150
f2 = (15 + 20 + 85) = 120
f3 = (10 + 30 +90) = 130
f4 = (5 + 40 + 115 ) = 160
FRECUENCIAS OBSERVADAS
2° Se calculan las frecuencias
esperadas(valor que cabria en ese lugar si
la respuesta no dependiera del
tratamiento)

fe11 = (37 x150)/560 = 9.91


fe12 = (28 x 150)/560 = 31.61
fe13 = (405 x 150)/560 = 108.48 FRECUENCIAS ESPERADAS
fe21 = (37 x120)/ 560 = 7.93
fe22 = (118 x120)/ 560 =25.68
fe23 = (405 x120)/ 560 =86.79
fe31 = (37 x130)/560 = 8.59
fe32 = (118 x 130)/560 = 27.39
fe33 = (405 x 130)/560 = 94.02
fe41 = (37 x160)/ 560 = 10.57
fe42 = (118 x160)/ 560 =33.72
fe43 = (405 x160)/ 560 =115.71
3°Reemplazamos valores en la ecuación del Chicuadrado
4° Reemplazamos valores en el coeficiente de contingencia C, tenemos:

C = RAIZ ((13.87)/(13.87 + 560 )) = 0.97

• Si 0<C ≤0,2, entonces puede decirse que la


correlación es despreciable. Segun la tabla, se puede decir que
• Si 0,2<C ≤0,3, entonces puede decirse que la existe una correlación muy fuerte
correlación es débil.
• Si 0,3<C ≤0,5, entonces puede decirse que la
correlación es moderada.
• Si 0,5<C ≤0,7, entonces puede decirse que la
correlación es fuerte.
• Si 0,7<C ≤Cmax , entonces puede decirse que la
correlación es muy fuerte.
EJERCICIOS PROPUESTOS
1. En una muestra de 10 personas se les pregunto cuál era su ingreso al mes y cuál
era su peso y se coloco en la tabla anexa. Calcular la correlación tetracorica, que existe
entre las personas gordas y flacas con las ricas y pobres. Tomando como punto de
corte 75 kg y 8.500 bfs respectivamente.
2. En un estudio realizado a 10 estudiantes que cursan de matemática se les aplico un examen para evaluar su
conocimiento de la materia, entonces se desea determinar si existe relación entre las horas de estudio y las
notas adquiridas.

Sujetos Horas de Notas (Y)


estudio (X)

1 2 5

2 3 5

3 6 18

4 6 9

5 7 8
ത 6,8
Punto de corte para X: 𝑋=
6 7 14
Punto de corte para Y: 10 por ser la mínima
7 7 14 nota para aprobar.
8 10 15

9 10 16

10 10 17
3. Se desea conocer la relación entre el nivel de estrés y si fuman o no a un grupo de
120 sujetos, para ello se aplica un instrumento que mide la tendencia al estrés físico
(que reporta valores por encima de lo estándar)
En los resultados se asigna un valor binario arbitrario respecto a la dicotomizacion de
las variables. Para este ejercicio se tomaron en cuenta las respuestas que coincidieron
en presencia de estrés y la cantidad de cigarrillos y las que no, por lo que se toma las
opciones si y no.
4. Se realizo un cuestionario de personalidad en donde dos las preguntas eran: 1. ¿le gusta a usted estar
con mucha gente? Sí, No. 2. ¿le gusta a usted mas trabajar con otras personas que solo? Sí, No. Los
resultados están en el cuadro siguiente. ¿Cuál es la relación entre estas respuestas de los sujetos a
cada pregunta?

PREGUNTA 1

Sí No

Sí 374 541
PREGUNTA 2

No 186 389
5. Se encuestó a 180 alumnos de una IE sobre la motivación y el rendimiento
académico en matemática. Los resultados se muestran en la siguiente tabla de
contingencia de 2x2. Se pide verificar si existe asociación entre el rendimiento
académico y la motivación en matemática. Use el coeficiente de contingencia C, e
interprete el resultado.
6. Medir la relación entre el color de pelo y el color de ojos.Utilice la
correlacion de contingencia
6. Observe el siguiente video e indique los pasos para hallar el coeficIente de
contingencia en el programa SPSS.
https://www.youtube.com/watch?v=lJceteiKrzk
Páginas y videos vinculados a los temas de la Unidad Temática

COEFICIENTE DE CORRELACIÓN TETRACÓRICA (1), ESTADÍSTICA DESCRIPTIVA II, EJERCICIO 22


https://www.youtube.com/watch?v=Fibf-w18uVg

Cálculo del coeficiente de correlación tetracórico


https://www.youtube.com/watch?v=XpkjmkD1ZBA

Prueba chi cuadrada para tablas de contingencia


https://www.youtube.com/watch?v=tWfNv_z_bB0
Uso de la tabla chi-cuadrada
https://www.youtube.com/watch?v=teJ2of7rtKo

Análisis de la relación entre dos variables cualitativas: Test Chi cuadrado. Módulo 4
https://www.youtube.com/watch?v=XvPEeQAjTW8&t=251s

06. Qué es el test de Chi cuadrado y cuando se utiliza | Curso de SPSS


https://www.youtube.com/watch?v=wG7uD4fY5R4
Preguntas de autoevaluación

• ¿Qué has aprendido?


• ¿Qué te ha parecido mas interesante?
• ¿En qué o Cómo aplicarías los conocimientos adquiridos?
¡Gracias!

También podría gustarte