Está en la página 1de 4

AUTOR: ING. FELIPE SALINAS VELAZQUEZ.

TITULAR DE LA MATERIA: ESTADISTICA INFERENCIAL II

1.4 MEDIDAS DE VARIACIÓN

Cuando se estudian dos características, una pregunta que surge con frecuencia es
si existe alguna relación entre ellas. Como ejemplo podemos mencionar el peso y
la estatura de un grupo de personas, el ingreso y el consumo por familia, las
ventas en una empresa y el número de empleados.

La covarianza es una medida de asociación entre dos características que


llamaremos X e Y, su valor depende de las unidades en que se miden las
variables de interés.

Sean (𝑥1 , 𝑦1 ) ; (𝑥2 , 𝑦2 ) , . . . ,(𝑥𝑛 , 𝑦𝑛 ), n pares de datos de dos características X e Y,


y sean 𝑋̅ , 𝑌̅ sus respectivas medias:

LA COVARIANZA. ( 𝑺𝑿𝒀 )

1 (∑𝑛 𝑛
𝑖=1 𝑥1 )(∑𝑖=1 𝑦𝑖 )
𝑆𝑋𝑌 = [∑𝑛𝑖=1 𝑥𝑖 𝑦𝑖 − ]
𝑛−1 𝑛

𝑥𝑖 𝑦𝑖 =36712 ∑𝑛𝑖=1 𝑥1 = 466 ∑𝑛


𝑖=1 𝑦𝑖 = 748 n= 10

1 (466)(748)
𝑆𝑋𝑌 = [36712 − ]=
10−1 10

1 ( 348568 )
𝑆𝑋𝑌 = [36712 − ]=
10−1 10
1
𝑆𝑋𝑌 = [36712 − 34856.8]=
10−1
1
𝑆𝑋𝑌 = [1855.2]= 206.1333
10−1

Cálculo de la covarianza de otra manera:

1 1
𝑆𝑋𝑌 = ∑(𝑋𝑖 − 𝑋̅ )(𝑌𝑖 − 𝑌̅)= (1885.2)= 206.133 de otra manera
𝑛−1 9

Propiedades

La covarianza es positiva cuando los valores de x aumentan con los valores de y.


Y cuando los valores de x disminuyen al aumentar los valores de y tendremos una
covarianza negativa.

Si comparamos la covarianza (𝑆𝑋𝑌 ), con la varianza (𝑠𝑥2 ), y si imaginamos una


ecuación para la covarianza de X obtenemos la ecuación de la varianza; es decir
que podemos pensar en la varianza como un caso especial de la covarianza.

𝑥𝑖 𝑦1 𝑥𝑖 − 𝑋̅ 𝑦𝑖 − 𝑌̅ (𝑥𝑖 − 𝑋̅)(𝑦𝑖 − 𝑌̅)


39 65 -7.6 -9.8 74.48
43 75 -3.6 0.2 -0.72
21 52 -25.6 -22.8 583.68
64 82 17.4 7.2 125.28
57 92 10.4 17.2 178.88
43 80 -3.6 5.2 -18.72
38 73 -8.6 -1.8 15.48
75 98 28.4 23.2 658.88
34 56 -12.6 -18.8 236.88
52 75 5.4 0.2 1.08
∑ 466 1855.2
𝑋̅ = 46.6 𝑌̅ = 74.8

El coeficiente de correlación (𝑟𝑥𝑦 ). Es una medida de asociación en donde una


variable llamada independiente(x) influye o impacta sobre otra variable llamada
independiente (y).

La medición utilizadas en las variables.

Si son valores positivos el coeficiente de correlación indica que las variables


tienden a crecer o decrecer simultáneamente.

Si son valores negativos el coeficiente de variación indica que cuando una variable
aumenta la otra disminuye.

Este valor puede encontrarse entre los valores de -1 y 1 por lo tanto -1≤ 𝑟𝑥𝑦 ≤1
COEFICIENTE DE CORRELACIÓN. (𝑟𝑥𝑦 )

𝑆𝑋𝑌 206.133 206.133


𝑟𝑥𝑦 = = = = 0.90707
𝑆𝑋 𝑆𝑌 15.699 𝑋 14.474 227.249

𝑆𝑋 = 15.699 𝑆𝑌 = 14.474 de otra manera:

𝑆𝑃𝑋𝑌
𝑟𝑥𝑦 =
√(𝑆𝑃𝑋𝑋 )(𝑆𝑃𝑌𝑌 )
(∑ 𝑥)2 (∑ 𝑦)2
𝑆𝑋𝑋 = ∑ 𝑥 2 - 𝑆𝑌𝑌 = ∑ 𝑦 2 -
𝑛 𝑛

∑ 𝑥 = 466 ∑ 𝑦= 748∑ 𝑥 2 =23934 (∑ 𝑥)2 = 217156

∑ 𝑦 2= 57836 (∑ 𝑦)2= 559504 𝑆𝑋𝑌 = 1885.2


217156
𝑆𝑃𝑋𝑋 = 23934 - = 2218.4
10

559504
𝑆𝑃𝑌𝑌 = 57836 - =1885.6
10

∑ 𝑋𝑖 ∑ 𝑌𝑖 466 𝑥 748
𝑆𝑃𝑋𝑌 = ∑ 𝑋𝑖 𝑌𝑖 - = 36712 – = 36712 – 34856.8 = 1855.2
𝑛 10

𝟏𝟖𝟖𝟓.𝟐
𝒓𝒙𝒚 = = 0.922 el resultado indica que la correlación es
√(𝟐𝟐𝟏𝟖.𝟒)(𝟏𝟖𝟖𝟓.𝟔)
fuertemente positiva.

Coeficiente de determinación. Es una medida de bondad de ajuste de los datos


de la recta y al calcularlo define con mayor claridad sobre la relación entre las dos
variables de estudio. (Infante, G.S. Y Zarate de Lara, G.P. 1990).

El coeficiente de determinación es un número que varía entre 0 y 1. Representa la


proporción de la variación total presente en los valores de Yque es quitada o
explicada por la ecuación de regresión, (Christensen, B.H. 1990), si el coeficiente
de determinación es cero, entonces se dice que la ecuación de regresión no da
cuenta de nada de la variación de la variable dependiente (y). Si es igual a uno,
entonces se dice que la ecuación de regresión da cuenta de toda la variación en
los valores de Y
2
El coeficiente de determinación ajusta los datos de la recta, ya que a mayor 𝑟𝑥𝑦
menos es la S.C.ERROR.

̂𝟏 ∑(𝑋𝑖 − 𝑋̅)(𝑌𝑖 − 𝑌̅) 𝜷


𝜷 ̂𝟏 [𝒏 ∑ 𝒙𝒚−(∑ 𝒙)(∑ 𝒚)]
2
𝑟𝑥𝑦 = ∑(𝑦−𝑌̅ )2
= =
𝑛 ∑ 𝑦 2 − (∑ 𝑦)2

𝑥𝑖 𝑦1 𝑥𝑖 − 𝑋̅ 𝑦𝑖 − 𝑌̅ (𝑥𝑖 − 𝑋̅)(𝑦𝑖 − 𝑌̅) (𝑦 − 𝑌̅ )2


39 65 -7.6 -9.8 74.48 96.04
43 75 -3.6 0.2 -0.72 0.04
21 52 -25.6 -22.8 583.68 519.84
64 82 17.4 7.2 125.28 51.84
57 92 10.4 17.2 178.88 295.84
43 80 -3.6 5.2 -18.72 27.04
38 73 -8.6 -1.8 15.48 3.24
75 98 28.4 23.2 658.88 538.24
34 56 -12.6 -18.8 236.88 353.44
52 75 5.4 0.2 1.08 0.04
∑ 466 1855.2 1885.6
𝑋̅ 𝑌̅
= 46.6 = 74.8

̂𝟏 ∑(𝑋𝑖 − 𝑋̅)(𝑌𝑖 − 𝑌̅) 0.836(1885.2) 1576.0272


𝜷
2
𝑟𝑥𝑦 = ∑(𝑦−𝑌̅ )2
= = =0.8358=0.84
1885.6 1885.6

̂𝟏 = 0.836
𝜷

𝜷̂𝟏[𝒏 ∑ 𝒙𝒚−(∑ 𝒙)(∑ 𝒚)]


2
𝑟𝑥𝑦 = 2 = 0.8225
𝑛 ∑ 𝑦2 − (∑ 𝑦)

Esto significa que el 82% de la variabilidad total en la calificación final puede ser
explicada por la calificación parcial obtenida por los alumnos, por lo tanto la línea
estimada se ajusta muy bien a los datos.