Está en la página 1de 18

Qwertyuiopasdfghjklzxcvbnmqwertyu

iopasdfghjklzxcvbnmqwertyuiopasdfg
hjklzxcvbnmqwertyuiopasdfghjklzxcv
bnmqwertyuiopasdfghjklzxcvbnmqwe
CURSO: ESTADISTICA II
Semestre 2015-II
rtyuiopasdfghjklzxcvbnmqwertyuiopa
UNIDAD TEMÁ TICA II:
sdfghjklzxcvbnmqwertyuiopasdfghjklz
ÁNALISIS DE LA RELACIÓN O
ASOCIACIÓN ENTRE DOS
xcvbnmqwertyuiopasdfghjklzxcvbnmq
VARIABLES
wertyuiopasdfghjklzxcvbnmqwertyuio SESIÓN 7

Universidad Nacional Mayor de San Marcos


pasdfghjklzxcvbn E.A.P de Estadística
Facultad de Ciencias Matemá ticas

Mqwertyuiopasdfghjklzxcvbnmqwerty Profesores:
Lic. Fernando Camones Gonzales
Mg. Ana María Cárdenas Rojas

uiopasdfghjklzxcvbnmqwertyuiopasdf
Lic. Lucy Vega Calero

ghjklzxcvbnmqwertyuiopasdfghjklzxc
vbnmqwertyuiop
Curso: Estadística II EAPE_FCM-UNMSM-2015-II

Unidad Temática II: Relación o Asociación entre dos variables.

Karl Pearson, científico, matemático,


estadístico, Biólogo y pensador
británico, que estableció la disciplina
de la estadística matemática.
Desarrolló una intensa investigación
sobre la aplicación de los métodos
estadísticos en la biología y fue
fundador de la bioestadística. Nacido
en Londres el 27 de marzo de 1857 y
falleció en 1936.

Sesión de Aprendizaje 7: Medidas de asociación de dos


variables

1. Análisis de asociación de dos variables medidas en escala ordinal.


2. Análisis de asociación de dos variables medidas en escala razón
3. Práctica dirigida N°7:

Indicadores de asociación para variables categóricas medidas en


escala ordinales y variables medidas en escala de razón.

3.-Laboratorio N°7:

Aplicar las medidas de asociación estudiadas a datos reales y a la


base de datos del proyecto de investigación.

MEDIDAS DE ASOCIACIÓN PARA VARIABLES BIDIMENSIONALES (X ,Y):


AMBAS CUALITATIVAS O CATEGÓRICAS medidas en escala ordinal.

Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 2
Curso: Estadística II EAPE_FCM-UNMSM-2015-II

Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 3
Curso: Estadística II EAPE_FCM-UNMSM-2015-II

ANÁLISIS DE ASOCIACIÓN DE DOS VARIABLES MEDIDAS EN ESCALA ORDINAL:

Las variables cualitativas ordinales son aquellas cuyas categorías se presentan jerarquizadas, ya
que reconocen una disposición inalterable.

Ejemplo: la variable “edad” considerada en un nivel de medición ordinal podría presentar las
siguientes categorías: niño, joven, adulto, anciano. Decimos que la disposición de las categorías
es inalterable ya que no se puede ser adulto antes de ser joven, anciano antes que niño, etc.).

Dada esta característica es posible observar la existencia o no de asociación en el


comportamiento de dos variables de este tipo,

Cuando se considera la ordenación de individuos en dos variables X e Y , es posible determinar


comparativamente cuando dos pares son concordantes, discordantes o empatados.

Dos pares de datos (xi,yi) y Dos pares de datos (xi,yi) y Dos pares de datos
(xj,yj) son concordantes si sus (xj,yj) son discordantes si sus (xj,yj) son empatados
producto cruzado de las producto cruzado de las producto cruzado
diferencias es de signo diferencias es de signo diferencias es igual a cero, y
positivo, y se expresa: negativo, y se expresa: se expresa:
(x j - xi) (yj – yi) > 0 (x j - xi) (yj – yi) < 0 (x j - xi) (yj – yi)
Dicho en otra forma: Dicho en otra forma: Dicho en otra forma:

x 1 es inferior a x 2 y y 1 es x 1 es superior a x 2 y y 1 es Dos pares son empatados


inferior a y 2 o x 1 es superior inferior a y 2 o x 1 es inferior solo en X si: x 1
a x 2 y y 1 es superior a y 2 . a x 2 y y 1 es superior a y 2 .
Dos pares son empatados
solo en Y si: y 1 es igual a y

Dos pares son


simultáneamente empatados
en X e Y si: x 1
y 1 es igual a y 2

Para el caso de los empates, observemos que podemos descomponer en empate solo en X,
empate solo en Y, empate en X e Y.

NOTACIONES:

Profesores: Mg. Ana


C: María
NúmeroCá total
rdenas, Lic. Fernando
de pares Camones, Lic. Lucy Vega
concordantes Pá gina 4

D: Número total de pares discordantes.

E: Número total de pares empatados


Curso: Estadística II EAPE_FCM-UNMSM-2015-II

E: Número total de pares empatados

c i j : frecuencia total de casos concordantes

d i j : frecuencia total de casos discordantes

Cálculo de C, D y E

C = Σ i Σ j f ij c ij D = Σ i Σ j f ij d ij fij(fij−1)
E xy =∑
2
donde c i j = Σ k>i Σ l>j f kl donde d i j = Σ k>i Σ l<j f kl

Ejemplo 1:

En un estudio realizado sobre el pandillaje en el asentamiento humano del distrito de Comas, se


tomó una muestra aleatoria a 221 familias. A continuación se presenta parte de las preguntas del
estudio formuladas al jefe de familia.

X Nivel Educativo Y

Ingresos Alto Medio Bajo Total

Alto 45S 23 12d 80

Medio 37 11 18 66

Bajo 22 19 34 75

Total 104 53 64 221

La diagonal positiva (la que contiene las celdas “alto–alto” y “bajo–bajo”) va del extremo
superior izquierdo al extremo inferior derecho. La diagonal negativa (la que contiene las celdas
“alto–bajo” y “bajo–alto”) va del extremo inferior izquierdo al extremo superior derecho. La
celda s es el final de la diagonal positiva, y d, el final de la diagonal negativa.

a) Cálculo del número total de pares concordantes ( C ):

C = Σ i Σ j f i j c i j donde c i j = Σ k>i Σ l>j f kl

Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 5
Curso: Estadística II EAPE_FCM-UNMSM-2015-II

c 11 = Σ k>1 Σ l >1 f kl = Σ k=2, 3 Σ l=2, 3 f kl = f 22+ f 23+ f 32+ f33 = 11+18+19+34=82

Vamos a observarlo gráficamente.

45

11 18

19 34

f 11 C 11 = 45*(11+18+19+34) = 3690

c 12 = Σ k>1 Σ l >2 f kl = Σ k=2, 3 Σ l= 3 f kl = f 23+ f 33 = 18+34= 52

23

18

34

f12 c 12 = 23*(18+34 )= 1196

c 13 = Σ k>1 Σ l >3 f kl = Σ k=2, 3 Σ l=4 f kl = 0

f13 c 13 = 12 * 0 = 0

c 21 = Σ k>2 Σ l >1 f kl = Σ k= 3 Σ l=2, 3 f kl = f 32+ f 33 = 19+34= 53

37

19 34

f21 c 21 = 37*(19+34 )=1961

c 22 = Σ k>2 Σ l >2 f kl = Σ k= 3 Σ l= 3 f kl = f33 = 34

11

34

Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 6
Curso: Estadística II EAPE_FCM-UNMSM-2015-II

f22 c 22 = 11*34=374

Luego, el número total de pares concordantes C = Σ i Σ j f i j c i j = 3690+1196+0 +1961+374 =7221

b) Cálculo del número total de pares discordantes (D)

D = Σ i Σ j f i j d i j donde d i j = Σ k> i Σ l < j f kl

12

37 11

22 19

f 13 d 13 = 12*(37+11+22+19)= 1068

23

37

22

f 12 d 12 = 23*(37+22)= 1357

f 11 d 11 = 0

18

22 19

f 23 d 23 = 18*(22+19) =738

11

22

f 22 d 22 = 11*22=242

Luego, el número total de pares discordantes D = Σ i Σ j f i j d i j = 1068+1357+738+242=3405

Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 7
Curso: Estadística II EAPE_FCM-UNMSM-2015-II

c) Cálculo de pares empatados (Ey):

45

37

22

f 11 * (f21 +f31) + f21* f31= 45*(37+22) + 37 + 22 =2655 + 814 = 3469

23

11

19

f 12 * ( f 22 + f 23 ) + f22 * f23 = 23*(11+19) + 11 * 19 =690 + 209 = 899

12

18

34

f 13 * (f 23 + f33) + f 23 * f 33 = 12*(18+34) + 18 * 34= 624+ 612 = 1236

Ey = 3469 + 899 + 1236 = 5604

d) Cálculo de pares empatados (Ex):

45 23 12

f 11 *( f 12 +f 13) + f 12 *f 13) = 45*(23+12) + 23 * 12 =1575 + 276 = 1851

37 11 18

f 21 *( f 22 + f 23) + f22 * f 23= 37*(11+18) + 11 *18 =1073 + 198 = 1271

22 19 34

Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 8
Curso: Estadística II EAPE_FCM-UNMSM-2015-II

f 31 *( f 32 + f 33) + f32 * f 33= 22*(19+34) + 19*34 =1166+ 646 = 1812

Ex = 1851 + 1271 + 1812 = 4934

e) Cálculo de pares empatados en ambas variables (Exy): se calcula mediante una ecuación, en la
que f es la frecuencia de cada celda.

fij(fij−1)
E xy =∑
2

45 x (45 – 1) / 2 = 990 37 x (37 – 1) / 2 = 666 22 x (22 – 1) / 2 = 231

23 x (23 – 1) / 2 = 253 11 x (11 – 1) / 2 = 55 19 x (19 – 1) / 2 = 171

12 x (12 – 1) / 2 = 66 18 x (18 – 1) / 2 = 153 34 x (34 – 1) / 2 = 561

Exy = 990 + 666 + 231 + 253 + 55 + 171 + 66 + 153 + 561 = 3146

Efectivamente el número total de pares que se pueden formar, que difieran en uno al menos de
sus elementos es n(n-1) / 2 = 221(220) / 2 = 24310

Verificando:C +D +Ex +Ey + E xy = 7221 + 3505 + 4934 + 5604 + 3146 = 24310

Estamos ya en condiciones de aplicar coeficientes de asociación para determinar el grado de


asociación entre variables ordinales.

En todos los coeficientes veremos que el numerador es C – D, la diferencia entre los pares
concordantes y los discordantes. Esta diferencia nos indicará el sentido de la asociación: positivo
si C > D, negativo si C < D

a) El estadístico a usar es “Gamma” de Goodman y Kruskall ( 1979) para el caso simétrico:

(existencia, magnitud, dirección)

γ =¿ = C – D / C + D

-1 < γ < 1

Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 9
Curso: Estadística II EAPE_FCM-UNMSM-2015-II

Si D = 0 → γ = 1 (cuando todos los pares son concordantes)

y si C = 0 → γ = -1 (cuando todos los pares son discordantes)

Cuando γ = 0 hay ausencia de relación

γ = 1 existe relación positiva perfecta

γ = -1 existe relación negativa perfecta

NOTA: Se usa para tablas de contingencia de cualquier dimensión, pero es apropiado para tablas
de contingencia cuadradas ( igual número de filas y columnas)

Para el ejemplo tenemos:

7221−3405
γ= =0.35912
7221+3405

Podemos decir que existe una asociación positiva leve entre nivel de educación y los ingresos

Observaciones:

Esto es lo que distingue al coeficiente Gamma (γ) de Goodman y Kruskal. Es también una medida
simétrica, como el tau–a de Kendal, pero, puede alcanzar los extremos (1 y –1).

b) Coeficiente Tau–b de Kendall

Es el más sencillo de los coeficientes, y se define como la razón entre la diferencia de pares
concordantes y discordantes, sobre la media geométrica entre el número de pares no empatados
en la variable Y y el número de pares no empatados en la variable X.

La ecuación es la siguiente:

C− D❑
τb=
√( C + D+ E X −E XY ) (C+ D+ EY −Exy)
Medida de asociación para variables ordinales, cuyos valores posibles oscilan de -1 a 1.

Con los valores absolutos mayores indicando las relaciones más fuertes. Tau b puede obtenerse
sólo un valor de -1 o +1 para tablas cuadradas. El signo del coeficiente indica la dirección de la
relación. Este coeficiente muestra un coeficiente de órdenes de rangos.

Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 10
Curso: Estadística II EAPE_FCM-UNMSM-2015-II

En una tabla cuadrada, si τb=1 ,significa que todas las observaciones están en la diagonal
principal de la tabla (o sea no existe discordancia alguna)

Si τb=−1 , , significa que todas las observaciones se hallan en la en la diagonal secundaria, es


decir la discordancia es máxima.

Si existe independencia entre las variables , τb = 0

Una de las limitaciones es que en las tablas que no son cuadradas, no pueden nunca alcanzar los
valores de (1,-1).

En el ejemplo

7221−3405
τb= =¿
√(7221+ 3405+5604−2255❑)(7221+3405+ 4934❑−2255)
Interpretación:

c) Coeficiente de correlación de Spearman.

Este coeficiente permite medir la relación entre los rangos asignados a una variable y los rangos
asignados a la otra variable.

6 ∑ d 2i
r s=1−
[
n( n2−1) ] (*)

Donde di es la diferencia de rangos entre X e Y.

Cuando los coeficientes −1 ≤r s ≤ 1 alcanzarán el máximo valor si todos los individuos ocupan
exactamente los mismos rangos o posiciones en X e Y

PROCEDIMIENTO PARA EL CALCULO DEL COEFICIENTE DE SPEARMAN

 Se anota el rango de cada individuo en la variable X y en la variable Y.


 Se determina la diferencia entre los rangos , d i.
 Se elevan al cuadrado estas diferencias y luego se suman.
Aplicar la fórmula (*)

Ejemplo 2:

Un investigador está interesado en conocer si el desarrollo mental de un niño está asociado a la


educación formal de su madre. De esta manera, obtiene la calificación de desarrollo mental en la
escala de Gesell de ocho niños elegidos aleatoriamente y se informa del grado de escolaridad de
las madres.
Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 11
Curso: Estadística II EAPE_FCM-UNMSM-2015-II

Escolaridad de la Madre (X) Calificación del desarrollo mental


de los niños(Y)

Primero de secundaria. 90

Primero de Primaria, 87

Profesional. 89

Sexto de primaria. 80

Tercero de secundaria. 85

Tercero de primaria. 84

Analfabeta. 75

Preparatoria. 91

Solución:

Se desea medir asociación o correlación. Las calificaciones de la educación formal de las madres
están dadas en una medición cualitativa, pero tienen una escala ordinal, por lo cual es posible
ordenarlas en rangos al igual que las calificaciones del desarrollo mental del niño a pesar de ser
una variable cuantitativa. Podemos aplicarr s

Rango de la Rango del desarrollo di d 2i


educación materna mental del niño.

5 7 -2 4

2 5 -3 9

8 6 2 4

4 2 2 4

6 4 2 4

3 3 0 0

1 1 0 0

7 8 -1 1

∑ d 2i =4 +9+ 4+ 4+ 4+1=26
Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 12
Curso: Estadística II EAPE_FCM-UNMSM-2015-II

6∗26
r s=1−
[ ]
8 ( 63 )
=0.6905

Existe asociación moderada entre los rangos asignados a la escolaridad de la madre y los rangos
asignados a la calificación del desarrollo mental de los niños.

EJEMPLO 3:

Los datos que siguen muestran las puntuaciones en nivel de lectura (X) y la conducta mostrada en
clase Y de 10 niños con problemas de conducta y de lectura, sometidos a un programa de
recuperación cuyo fin era manifestar la eficacia de las técnicas de modificación de la conducta en
la superación de dichos problemas.

TABLA

Nivel de RANGOS d i di2


lectura Conducta en clase

X Y X Y

2.7 40 4 1 3 9

2.2 14 8 9 -1 1

2.3 18 7 7 0 0

2.6 20 5 5 0 0

3.1 22 3 4 -1 1

3.4 36 2 3 -1 1

1.9 17 10 8 2 4

2.1 13 9 10 -1 1

2.4 39 6 2 4 16

3.9 19 1 6 -5 25

Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 13
Curso: Estadística II EAPE_FCM-UNMSM-2015-II

Total 0 58

rs = 1 – [6 Σ d i 2 / n(n 2 – 1)] = 1 - [6*58 / 10(102 -1)] = 1 – 0.35 = 0.65

Existe una asociación moderada entre los rangos asignados.

Si se hubiera asignado los rangos en ambas variables desde el mínimo hasta el máximo, el valor del
coeficiente sería el mismo.

NOTA: Respecto a los rangos, es indiferente atribuir en ambas variables el valor 1 al sujeto con la
máxima puntuación, el valor 2 al inmediato inferior etc., que atribuir el valor 1 al sujeto con
mínima puntuación, el 2 al inmediato superior etc. El valor de r s será el mismo en uno u otro caso

10.00 


rango nivel de lectura

8.00

6.00 

4.00 

2.00 

2.00 4.00 6.00 8.00 10.00

rango nivel de conducta


Relación aproximada lineal entre los rangos

ASOCIACION DE DOS VARIABLES MEDIDAS EN ESCALA RAZÓN

a) Coeficiente de correlación lineal producto momento de Pearson: r (existencia, magnitud,


dirección, forma)

r=S xy / S xS y -1 ≤ r ≤ 1

donde

S xy es la covarianza de X e Y

S x y S y son las desviaciones estándar de X y de Y, respectivamente.

EJEMPLO 4:

Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 14
Curso: Estadística II EAPE_FCM-UNMSM-2015-II

Con los datos de las variables X e Y de la tabla anterior, vamos a calcular el valor del coeficiente de
correlación lineal. Para tal efecto, agregaremos columnas a la tabla 13 con los cálculos necesarios.

TABLA N° 14

X Y XY X^2 Y^2

2.7 40 108 7.29 1600

2.2 14 30.8 4.84 196

2.3 18 41.4 5.29 324

2.6 20 52 6.76 400

3.1 22 68.2 9.61 484

3.4 36 122.4 11.56 1296

1.9 17 32.3 3.61 289

2.1 13 27.3 4.41 169

2.4 39 93.6 5.76 1521

3.9 19 74.1 15.21 361

26.6 238 650.1 74.34 6640

media de X 2.66   media de Y 23.8

varianza de X 0.3584   Varianza de Y 97.56

desvest X 0.598665182   desvest Y 9.87724658

COV(X,Y) 1.702   COEF. DE CORREL. 0.287832387

Se puede decir que entre X e Y no hay relación lineal.

Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 15
Curso: Estadística II EAPE_FCM-UNMSM-2015-II


puntuac.nivel de lectura

3.50

3.00


2.50



2.00

20.00 30.00 40.00

puntuac.conducta en clase
No se aprecia relación lineal entre las puntuaciones de

XeY

Los gráficos siguientes son diagramas de dispersión que muestran la existencia, el grado
y la dirección de la relación entre dos variable, y que se miden con el coeficiente de
correlación lineal.

b) Coeficiente de determinación R 2
Por ahora lo podemos definir como R 2 = r 2

Nos indica la proporción de variabilidad de una variable explicada por el conocimiento que se
posee del valor de la otra variable y se acostumbra expresarse en porcentaje.

Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 16
Curso: Estadística II EAPE_FCM-UNMSM-2015-II

En el ejemplo, el 28.78 % de la variabilidad de las puntuaciones del nivel de lectura es explicado


por el conocimiento que se tienen de la variabilidad de las puntuaciones del nivel de conducta en
clase.

I. ACTIVIDAD APLICATIVA Nº 7

Analizar la asociación existente entre las variables del proyecto de investigación


descriptivo correlacional.
IV.

II. LABORATORIO Nº 7

a. Usar las Bases de datos elegidas por cada grupo y realizar el análisis de
asociación de las variables medidas en escala ordinall.

b. En el aula crear una 4ta guía de Laboratorio sobre indicadores de


asociación de las variables bivariadas medidas en escala ordinal
conjuntamente con los estudiantes usando programas estadísticos o Excel.

Bibliografía

Amón, J. (1985). Estadística para Psicólogos. Estadística descriptiva. Tomo 1.


Ediciones Pirámide S. A. Madrid, 7ª Edición.

Babbie E. (1998) Métodos de Investigación por Encuestas. Ed. Fondo de


Cultura Económica.

Fernández, S., Cordero, J. y Córdova, A. (1996). Estadística Descriptiva.


Editorial ESIC, Madrid.

Gómez, D. (2006). Estadística Descriptiva con soporte de SPSS y


MATLAB. Fondo Editorial de la UNMSM. Lima- Perú.

Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 17
Curso: Estadística II EAPE_FCM-UNMSM-2015-II

Hernández S., Fernández C. y Baptista L. (2014). Metodología de la


Investigación. (5ta.edic) Mc Graw Hill.

Jhonson, R, Kuby (1999). Estadística Elemental. International Editores.

Levin, R. y Rubin, D. (2004). Estadística para Administración y Economía.


Pearson Educación. México.

Lind, Marchal, Wathen (2008). Estadística aplicada a los negocios y la


economía. Mc Graw Hill.

Milton, S. (2002). Estadística para Biología y Ciencias de la Salud. Editorial Mc


Graw Hill

Mitacc, M. (2011). Tópicos de Estadística Descriptiva y Probabilidad

Pagano, R. (2008). Estadística para las Ciencias del Comportamiento.


International Thomson Editores.

Solanas, A. y otros (2005). Estadística Descriptiva en Ciencias del


Comportamiento. Editorial Thomson-España.

Veliz, C. (2000). Estadística Aplicaciones.

Ya-Lun Chou, (1975). Análisis Estadístico. Interamericana, 2ª Edición

Tukey, H y Mosteller. Understanding Robustand Exploratory-Data Analysis.

Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 18

También podría gustarte