Documentos de Académico
Documentos de Profesional
Documentos de Cultura
iopasdfghjklzxcvbnmqwertyuiopasdfg
hjklzxcvbnmqwertyuiopasdfghjklzxcv
bnmqwertyuiopasdfghjklzxcvbnmqwe
CURSO: ESTADISTICA II
Semestre 2015-II
rtyuiopasdfghjklzxcvbnmqwertyuiopa
UNIDAD TEMÁ TICA II:
sdfghjklzxcvbnmqwertyuiopasdfghjklz
ÁNALISIS DE LA RELACIÓN O
ASOCIACIÓN ENTRE DOS
xcvbnmqwertyuiopasdfghjklzxcvbnmq
VARIABLES
wertyuiopasdfghjklzxcvbnmqwertyuio SESIÓN 7
Mqwertyuiopasdfghjklzxcvbnmqwerty Profesores:
Lic. Fernando Camones Gonzales
Mg. Ana María Cárdenas Rojas
uiopasdfghjklzxcvbnmqwertyuiopasdf
Lic. Lucy Vega Calero
ghjklzxcvbnmqwertyuiopasdfghjklzxc
vbnmqwertyuiop
Curso: Estadística II EAPE_FCM-UNMSM-2015-II
3.-Laboratorio N°7:
Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 2
Curso: Estadística II EAPE_FCM-UNMSM-2015-II
Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 3
Curso: Estadística II EAPE_FCM-UNMSM-2015-II
Las variables cualitativas ordinales son aquellas cuyas categorías se presentan jerarquizadas, ya
que reconocen una disposición inalterable.
Ejemplo: la variable “edad” considerada en un nivel de medición ordinal podría presentar las
siguientes categorías: niño, joven, adulto, anciano. Decimos que la disposición de las categorías
es inalterable ya que no se puede ser adulto antes de ser joven, anciano antes que niño, etc.).
Dos pares de datos (xi,yi) y Dos pares de datos (xi,yi) y Dos pares de datos
(xj,yj) son concordantes si sus (xj,yj) son discordantes si sus (xj,yj) son empatados
producto cruzado de las producto cruzado de las producto cruzado
diferencias es de signo diferencias es de signo diferencias es igual a cero, y
positivo, y se expresa: negativo, y se expresa: se expresa:
(x j - xi) (yj – yi) > 0 (x j - xi) (yj – yi) < 0 (x j - xi) (yj – yi)
Dicho en otra forma: Dicho en otra forma: Dicho en otra forma:
Para el caso de los empates, observemos que podemos descomponer en empate solo en X,
empate solo en Y, empate en X e Y.
NOTACIONES:
Cálculo de C, D y E
C = Σ i Σ j f ij c ij D = Σ i Σ j f ij d ij fij(fij−1)
E xy =∑
2
donde c i j = Σ k>i Σ l>j f kl donde d i j = Σ k>i Σ l<j f kl
Ejemplo 1:
X Nivel Educativo Y
Medio 37 11 18 66
Bajo 22 19 34 75
La diagonal positiva (la que contiene las celdas “alto–alto” y “bajo–bajo”) va del extremo
superior izquierdo al extremo inferior derecho. La diagonal negativa (la que contiene las celdas
“alto–bajo” y “bajo–alto”) va del extremo inferior izquierdo al extremo superior derecho. La
celda s es el final de la diagonal positiva, y d, el final de la diagonal negativa.
Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 5
Curso: Estadística II EAPE_FCM-UNMSM-2015-II
45
11 18
19 34
f 11 C 11 = 45*(11+18+19+34) = 3690
23
18
34
f13 c 13 = 12 * 0 = 0
37
19 34
11
34
Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 6
Curso: Estadística II EAPE_FCM-UNMSM-2015-II
f22 c 22 = 11*34=374
12
37 11
22 19
f 13 d 13 = 12*(37+11+22+19)= 1068
23
37
22
f 12 d 12 = 23*(37+22)= 1357
f 11 d 11 = 0
18
22 19
f 23 d 23 = 18*(22+19) =738
11
22
f 22 d 22 = 11*22=242
Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 7
Curso: Estadística II EAPE_FCM-UNMSM-2015-II
45
37
22
23
11
19
12
18
34
45 23 12
37 11 18
22 19 34
Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 8
Curso: Estadística II EAPE_FCM-UNMSM-2015-II
e) Cálculo de pares empatados en ambas variables (Exy): se calcula mediante una ecuación, en la
que f es la frecuencia de cada celda.
fij(fij−1)
E xy =∑
2
Efectivamente el número total de pares que se pueden formar, que difieran en uno al menos de
sus elementos es n(n-1) / 2 = 221(220) / 2 = 24310
En todos los coeficientes veremos que el numerador es C – D, la diferencia entre los pares
concordantes y los discordantes. Esta diferencia nos indicará el sentido de la asociación: positivo
si C > D, negativo si C < D
γ =¿ = C – D / C + D
-1 < γ < 1
Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 9
Curso: Estadística II EAPE_FCM-UNMSM-2015-II
NOTA: Se usa para tablas de contingencia de cualquier dimensión, pero es apropiado para tablas
de contingencia cuadradas ( igual número de filas y columnas)
7221−3405
γ= =0.35912
7221+3405
Podemos decir que existe una asociación positiva leve entre nivel de educación y los ingresos
Observaciones:
Esto es lo que distingue al coeficiente Gamma (γ) de Goodman y Kruskal. Es también una medida
simétrica, como el tau–a de Kendal, pero, puede alcanzar los extremos (1 y –1).
Es el más sencillo de los coeficientes, y se define como la razón entre la diferencia de pares
concordantes y discordantes, sobre la media geométrica entre el número de pares no empatados
en la variable Y y el número de pares no empatados en la variable X.
La ecuación es la siguiente:
C− D❑
τb=
√( C + D+ E X −E XY ) (C+ D+ EY −Exy)
Medida de asociación para variables ordinales, cuyos valores posibles oscilan de -1 a 1.
Con los valores absolutos mayores indicando las relaciones más fuertes. Tau b puede obtenerse
sólo un valor de -1 o +1 para tablas cuadradas. El signo del coeficiente indica la dirección de la
relación. Este coeficiente muestra un coeficiente de órdenes de rangos.
Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 10
Curso: Estadística II EAPE_FCM-UNMSM-2015-II
En una tabla cuadrada, si τb=1 ,significa que todas las observaciones están en la diagonal
principal de la tabla (o sea no existe discordancia alguna)
Una de las limitaciones es que en las tablas que no son cuadradas, no pueden nunca alcanzar los
valores de (1,-1).
En el ejemplo
7221−3405
τb= =¿
√(7221+ 3405+5604−2255❑)(7221+3405+ 4934❑−2255)
Interpretación:
Este coeficiente permite medir la relación entre los rangos asignados a una variable y los rangos
asignados a la otra variable.
6 ∑ d 2i
r s=1−
[
n( n2−1) ] (*)
Cuando los coeficientes −1 ≤r s ≤ 1 alcanzarán el máximo valor si todos los individuos ocupan
exactamente los mismos rangos o posiciones en X e Y
Ejemplo 2:
Primero de secundaria. 90
Primero de Primaria, 87
Profesional. 89
Sexto de primaria. 80
Tercero de secundaria. 85
Tercero de primaria. 84
Analfabeta. 75
Preparatoria. 91
Solución:
Se desea medir asociación o correlación. Las calificaciones de la educación formal de las madres
están dadas en una medición cualitativa, pero tienen una escala ordinal, por lo cual es posible
ordenarlas en rangos al igual que las calificaciones del desarrollo mental del niño a pesar de ser
una variable cuantitativa. Podemos aplicarr s
5 7 -2 4
2 5 -3 9
8 6 2 4
4 2 2 4
6 4 2 4
3 3 0 0
1 1 0 0
7 8 -1 1
∑ d 2i =4 +9+ 4+ 4+ 4+1=26
Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 12
Curso: Estadística II EAPE_FCM-UNMSM-2015-II
6∗26
r s=1−
[ ]
8 ( 63 )
=0.6905
Existe asociación moderada entre los rangos asignados a la escolaridad de la madre y los rangos
asignados a la calificación del desarrollo mental de los niños.
EJEMPLO 3:
Los datos que siguen muestran las puntuaciones en nivel de lectura (X) y la conducta mostrada en
clase Y de 10 niños con problemas de conducta y de lectura, sometidos a un programa de
recuperación cuyo fin era manifestar la eficacia de las técnicas de modificación de la conducta en
la superación de dichos problemas.
TABLA
X Y X Y
2.7 40 4 1 3 9
2.2 14 8 9 -1 1
2.3 18 7 7 0 0
2.6 20 5 5 0 0
3.1 22 3 4 -1 1
3.4 36 2 3 -1 1
1.9 17 10 8 2 4
2.1 13 9 10 -1 1
2.4 39 6 2 4 16
3.9 19 1 6 -5 25
Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 13
Curso: Estadística II EAPE_FCM-UNMSM-2015-II
Total 0 58
Si se hubiera asignado los rangos en ambas variables desde el mínimo hasta el máximo, el valor del
coeficiente sería el mismo.
NOTA: Respecto a los rangos, es indiferente atribuir en ambas variables el valor 1 al sujeto con la
máxima puntuación, el valor 2 al inmediato inferior etc., que atribuir el valor 1 al sujeto con
mínima puntuación, el 2 al inmediato superior etc. El valor de r s será el mismo en uno u otro caso
10.00
rango nivel de lectura
8.00
6.00
4.00
2.00
r=S xy / S xS y -1 ≤ r ≤ 1
donde
S xy es la covarianza de X e Y
EJEMPLO 4:
Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 14
Curso: Estadística II EAPE_FCM-UNMSM-2015-II
Con los datos de las variables X e Y de la tabla anterior, vamos a calcular el valor del coeficiente de
correlación lineal. Para tal efecto, agregaremos columnas a la tabla 13 con los cálculos necesarios.
TABLA N° 14
X Y XY X^2 Y^2
Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 15
Curso: Estadística II EAPE_FCM-UNMSM-2015-II
puntuac.nivel de lectura
3.50
3.00
2.50
2.00
puntuac.conducta en clase
No se aprecia relación lineal entre las puntuaciones de
XeY
Los gráficos siguientes son diagramas de dispersión que muestran la existencia, el grado
y la dirección de la relación entre dos variable, y que se miden con el coeficiente de
correlación lineal.
b) Coeficiente de determinación R 2
Por ahora lo podemos definir como R 2 = r 2
Nos indica la proporción de variabilidad de una variable explicada por el conocimiento que se
posee del valor de la otra variable y se acostumbra expresarse en porcentaje.
Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 16
Curso: Estadística II EAPE_FCM-UNMSM-2015-II
I. ACTIVIDAD APLICATIVA Nº 7
II. LABORATORIO Nº 7
a. Usar las Bases de datos elegidas por cada grupo y realizar el análisis de
asociación de las variables medidas en escala ordinall.
Bibliografía
Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 17
Curso: Estadística II EAPE_FCM-UNMSM-2015-II
Profesores: Mg. Ana María Cá rdenas, Lic. Fernando Camones, Lic. Lucy Vega Pá gina 18