Está en la página 1de 5

PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS

2.11 MUESTRAS BIVARIADAS


Es común tener que estudiar muestras con datos que miden dos características, siendo de
interés determinar si hay alguna relación entre las dos variables.

Para visualizar la relación entre los datos de una muestra bivariada, es útil graficarlos en una
representación que se denomina diagrama de dispersión.

Ejemplo
Se tiene una muestra de las calificaciones de 10 estudiantes de los exámenes parcial y final.

Examen
60 74 66 34 60 66 57 71 39 57
Parcial
Examen
72 82 75 46 73 74 70 82 60 61
Final

Dibuje el diagrama de dispersión.

Sean X: Calificación del primer parcial (variable independiente)


Y: Calificación del examen final (variable dependiente)

Se observa que los datos están relacionados con una tendencia lineal con pendiente positiva
PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS

2.11.1 CORRELACIÓN
Se usa el término correlación para describir la relación entre los datos de muestras bivariadas.

Gráficos para apreciar la correlación entre dos variables

Ejemplo.- Se puede decir que los datos en el ejemplo anterior tienen correlación lineal positiva

2.11.2 COEFICIENTE DE CORRELACION LINEAL


Es una definición para cuantificar el grado de correlación lineal entre las variables. Es una
medida adimensional útil para comparar variables con unidades de medida diferentes. Primero
de establecen algunas definiciones impotantes

Sean
X, Y: Variables muestrales
n: Tamaño de la muestra
X, Y : Media aritmética de X, Y, respectivamente
SX, SY: Desviaciones estándar muestrales
SXY: Covarianza muestral

Definiciones

Medias aritméticas muestrales


1 n 1 n
X = ∑ Xi , Y = ∑ Yi
n i=1 n i=1
Varianzas muestrales
1 n 1 n
S2X = ∑ i
n − 1 i =1
(x − x)2
, S 2
Y = ∑ (yi − y)2
n − 1 i =1
Covarianza muestral
1 n
SXY = ∑ (xi − x)(yi − y)
n − 1 i=1
PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS

Definición: Coeficiente de correlación lineal

SXY
r= , -1 ≤ r ≤ 1
SX SY

Si r está cercano a 1, entonces X y Y tienen correlación lineal positiva fuerte


Si r está cercano a -1, entonces X y Y tienen correlación lineal negativa fuerte
Si r está cercano a 0, entonces X y Y no están correlacionadas linealmente, o es muy débil

Es importante que se mida la correlación entre variables cuya asociación tenga algún sentido
Asmismo, si las variables no están correlacionadas linealmente, pudiera ser que si lo estén
mediante una relación no lineal

2.11.3 MATRIZ DE VARIANZAS Y COVARIANZAS


Es una representación ordenada de las varianzas y las covarianzas entre las variables

Si se usa la notación
X1 = X, SX1 = SX
X2 = Y, SX2 = SY
Definición: Matriz de varianzas y covarianzas

⎡ S2X SX1X2 ⎤
⎡S ⎤ = ⎢ 1

⎣ Xi X j ⎦ ⎢ S 2 ⎥
S X2 ⎦
⎣ X 2 X1
Es una matriz simétrica

2.11.4 MATRIZ DE CORRELACION


Es una representación ordenada de los coeficientes de correlación de cada variable con la otra
variable y consigo misma.

Si se usa la notación
X1 = X, SX1 = SX
X2 = Y, SX2 = SY
S Xi X j
rij = coeficiente de correlación lineal entre Xi y Xj
S Xi S X j
Definición: Matriz de correlación

⎡r r ⎤
⎡rij ⎤ = ⎢ 1,1 1,2 ⎥
⎣ ⎦
⎣r2,1 r2,2 ⎦
Es una matriz simétrica. Los valores en la diagonal principal son iguales a 1

Las definiciones de matriz de varianzas-covarianzas y matriz de correlación, pueden


extenderse directamente a más variables
PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS

Ejemplo
Se tienen una muestra de las calificaciones de 10 estudiantes del primer parcial y del segundo
parcial.
Primer
60 74 66 34 60 66 57 71 39 57
Parcial
Segundo
72 82 75 46 73 74 70 82 60 61
Parcial

Encuentre el coeficiente de correlación lineal e interprete el resultado

Solución

Sean:
X: Calificación del primer parcial
Y: Calificación del segundo parcial

1 n 1
x= ∑ xi = 10 (60 + 74 + 66 + 34 + 60 + 66 + 57 + 71 + 39 + 57) = 58.4
n i=1
1 n 1
s2X = ∑ (xi − x)2 = 9[(60 − 58.4)2 + (74 − 58.4)2 + ... + (57 − 58.4)2 ] = 166.4889
n − 1 i=1
sx = s2X = 166.4889 = 12.9031
1 n 1
y= ∑
n i=1
yi =
10
(72 + 82 + 75 + 46 + 73 + 74 + 70 + 82 + 60 + 61) = 69.5

1 n 1
s2Y = ∑ (yi − y)2 = 9[(72 − 69.5)2 + (82 − 69.5)2 + ... + (61 − 69.5)2 ] = 121.8333
n − 1 i=1
sY = s2Y = 121.8333 = 11.0378
1 n
SXY = ∑ (xi − x)(yi − y)
n − 1 i=1
1
= [(60 − 58.4)(72 − 69.5) + (74 − 58.4)(82 − 69.5) + ...
9
+ (57 − 58.4)(61 − 69.5)] = 134.1111

Coeficiente de correlación
S 134.1111
r = XY = = 0.9416
SX SY (12.9031)(11.0378)

El resultado indica que la correlación es fuertemente positiva

Escriba las matrices de varianzas-covarianzas y de correlación.

Sean X1 = X, S X1 = S X
X2 = Y, SX2 = SY
Matriz de varianzas-covarianzas
⎡ S2 SX1X2 ⎤ ⎡166.4889 134.1111⎤
⎡ S X X ⎤ = ⎢ X1 ⎥=⎢
⎣ i j ⎦ ⎢S 2 ⎥ ⎥
⎣ X 2 X1 SX2 ⎦ ⎣ 134.1111 121.8333 ⎦
PROBABILIDAD Y ESTADÍSTICA BÁSICA PARA INGENIEROS

Matriz de correlación
S Xi X j
Con la definición: rij = , sustituyendo los valores respectivos se obtiene
S Xi S X j
⎡ r1,1 r1,2 ⎤ ⎡ 1 0.9416 ⎤
⎡ ⎤
⎣rij ⎦ = ⎢r ⎥ =⎢
1 ⎥⎦
⎣ 2,1 r2,2 ⎦ ⎣ 0.9416

También podría gustarte