Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Muestrabi PDF
Muestrabi PDF
Para visualizar la relación entre los datos de una muestra bivariada, es útil graficarlos en una
representación que se denomina diagrama de dispersión.
Ejemplo
Se tiene una muestra de las calificaciones de 10 estudiantes de los exámenes parcial y final.
Examen
60 74 66 34 60 66 57 71 39 57
Parcial
Examen
72 82 75 46 73 74 70 82 60 61
Final
Se observa que los datos están relacionados con una tendencia lineal con pendiente positiva
PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS
2.11.1 CORRELACIÓN
Se usa el término correlación para describir la relación entre los datos de muestras bivariadas.
Ejemplo.- Se puede decir que los datos en el ejemplo anterior tienen correlación lineal positiva
Sean
X, Y: Variables muestrales
n: Tamaño de la muestra
X, Y : Media aritmética de X, Y, respectivamente
SX, SY: Desviaciones estándar muestrales
SXY: Covarianza muestral
Definiciones
SXY
r= , -1 ≤ r ≤ 1
SX SY
Es importante que se mida la correlación entre variables cuya asociación tenga algún sentido
Asmismo, si las variables no están correlacionadas linealmente, pudiera ser que si lo estén
mediante una relación no lineal
Si se usa la notación
X1 = X, SX1 = SX
X2 = Y, SX2 = SY
Definición: Matriz de varianzas y covarianzas
⎡ S2X SX1X2 ⎤
⎡S ⎤ = ⎢ 1
⎥
⎣ Xi X j ⎦ ⎢ S 2 ⎥
S X2 ⎦
⎣ X 2 X1
Es una matriz simétrica
Si se usa la notación
X1 = X, SX1 = SX
X2 = Y, SX2 = SY
S Xi X j
rij = coeficiente de correlación lineal entre Xi y Xj
S Xi S X j
Definición: Matriz de correlación
⎡r r ⎤
⎡rij ⎤ = ⎢ 1,1 1,2 ⎥
⎣ ⎦
⎣r2,1 r2,2 ⎦
Es una matriz simétrica. Los valores en la diagonal principal son iguales a 1
Ejemplo
Se tienen una muestra de las calificaciones de 10 estudiantes del primer parcial y del segundo
parcial.
Primer
60 74 66 34 60 66 57 71 39 57
Parcial
Segundo
72 82 75 46 73 74 70 82 60 61
Parcial
Solución
Sean:
X: Calificación del primer parcial
Y: Calificación del segundo parcial
1 n 1
x= ∑ xi = 10 (60 + 74 + 66 + 34 + 60 + 66 + 57 + 71 + 39 + 57) = 58.4
n i=1
1 n 1
s2X = ∑ (xi − x)2 = 9[(60 − 58.4)2 + (74 − 58.4)2 + ... + (57 − 58.4)2 ] = 166.4889
n − 1 i=1
sx = s2X = 166.4889 = 12.9031
1 n 1
y= ∑
n i=1
yi =
10
(72 + 82 + 75 + 46 + 73 + 74 + 70 + 82 + 60 + 61) = 69.5
1 n 1
s2Y = ∑ (yi − y)2 = 9[(72 − 69.5)2 + (82 − 69.5)2 + ... + (61 − 69.5)2 ] = 121.8333
n − 1 i=1
sY = s2Y = 121.8333 = 11.0378
1 n
SXY = ∑ (xi − x)(yi − y)
n − 1 i=1
1
= [(60 − 58.4)(72 − 69.5) + (74 − 58.4)(82 − 69.5) + ...
9
+ (57 − 58.4)(61 − 69.5)] = 134.1111
Coeficiente de correlación
S 134.1111
r = XY = = 0.9416
SX SY (12.9031)(11.0378)
Sean X1 = X, S X1 = S X
X2 = Y, SX2 = SY
Matriz de varianzas-covarianzas
⎡ S2 SX1X2 ⎤ ⎡166.4889 134.1111⎤
⎡ S X X ⎤ = ⎢ X1 ⎥=⎢
⎣ i j ⎦ ⎢S 2 ⎥ ⎥
⎣ X 2 X1 SX2 ⎦ ⎣ 134.1111 121.8333 ⎦
PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS
Matriz de correlación
S Xi X j
Con la definición: rij = , sustituyendo los valores respectivos se obtiene
S Xi S X j
⎡ r1,1 r1,2 ⎤ ⎡ 1 0.9416 ⎤
⎡ ⎤
⎣rij ⎦ = ⎢r ⎥ =⎢
1 ⎥⎦
⎣ 2,1 r2,2 ⎦ ⎣ 0.9416