Está en la página 1de 11

Universidad de San Carlos de Guatemala.

Facultad de Ingeniería. Centro de Investigaciones -CII-


Técnicas de Estudio e Investigación. Inga. Cinthya Ortiz.
Segundo semestre 2022. Martes 13 de septiembre. Sección E. Auxiliar: Daniel Quixtan.
MATERIAL DE APOYO 5.
Covarianza.
La covarianza de una variable bidimensional es la media aritméti ca de los
productos de las desviaciones de cada una de las variables respecto a sus medias
respecti vas. N=tamaño de la muestra.
La covarianza se representa por s x y  o σ x y .

La covarianza indica el senti do de la correlación entre las variables


Si σ x y  > 0 la correlación es directa.
Si σ x y  < 0 la correlación es inversa.
La covarianza presenta como inconveniente, el hecho de que su valor depende de
la escala elegida para los ejes.
Es decir, la covarianza variará si expresamos la altura en metros o en
centí metros. También variará si el dinero lo expresamos en euros o en dólares.
Ejemplos
Las notas de 12 alumnos de una clase en Matemáti cas y Física son las siguientes:
Valores de X y Y Ʃ Promedio
Matemáti cas (X) 2 3 4 4 5 6 6 7 7 8 10 10 72 6
Física (Y) 1 3 2 4 4 4 6 4 6 7 9 10 60 5
Xi*Yi 2 9 8 16 20 24 36 28 42 56 90 100 431 --
Calcular la covarianza de la distribución.
xi yi x i  · y i

2 1 2

3 3 9

4 2 8

4 4 16

5 4 20

6 4 24

6 6 36

7 4 28

7 6 42

8 7 56

10 9 90

10 10 100

S umat oria. 72 60 431

1
Universidad de San Carlos de Guatemala.
Facultad de Ingeniería. Centro de Investigaciones -CII-
Técnicas de Estudio e Investigación. Inga. Cinthya Ortiz.
Segundo semestre 2022. Martes 13 de septiembre. Sección E. Auxiliar: Daniel Quixtan.
Después de tabular los datos Se calculan las  medias aritméti cas :

La covarianza será entonces:

Correlación.
La correlación trata de establecer la relación o dependencia que existe entre las
dos variables que intervienen en una distribución bidimensional .
Es decir, determinar si los cambios en una de las variables infl uyen en los cambios
de la otra. En caso de que suceda, diremos que las variables están
correlacionadas o que hay correlación entre ellas.

Tipos de correlación.
1. Correlación directa.
La correlación directa se da cuando al aumentar una de las variables la otra
aumenta.
La recta correspondiente a la nube de puntos de la distribución es una recta
creciente.

2. Correlación inversa.
La correlación inversa se da cuando al aumentar una de las variables la otra
disminuye.
La recta correspondiente a la nube de puntos de la distribución es una recta
decreciente.

2
Universidad de San Carlos de Guatemala.
Facultad de Ingeniería. Centro de Investigaciones -CII-
Técnicas de Estudio e Investigación. Inga. Cinthya Ortiz.
Segundo semestre 2022. Martes 13 de septiembre. Sección E. Auxiliar: Daniel Quixtan.
3. Correlación nula.
La correlación nula se da cuando no hay dependencia de ningún ti po entre las
variables.
En este caso se dice que las variables no ti enen correlación y la nube de puntos
ti ene una forma redondeada.

Grado de correlación.
El grado de correlación  indica la proximidad que hay entre los puntos de la nube
de puntos. Se pueden dar tres ti pos:
1. Correlación fuerte.
La correlación será fuerte cuanto más cerca, estén los puntos de la recta.

2. Correlación débil.
La correlación será débil cuanto más separados estén los puntos de la recta.

3
Universidad de San Carlos de Guatemala.
Facultad de Ingeniería. Centro de Investigaciones -CII-
Técnicas de Estudio e Investigación. Inga. Cinthya Ortiz.
Segundo semestre 2022. Martes 13 de septiembre. Sección E. Auxiliar: Daniel Quixtan.
El coefi ciente de correlación lineal  es el cociente entre la  covarianza y el
producto de las desviaciones tí picas  de ambas variables.

El coefi ciente de correlación lineal  se expresa mediante la letra r.

Propiedades del coefi ciente de correlación.


1. El coefi ciente de correlación  no varía al hacerlo la escala de medición. Es
decir, si expresamos la altura en metros o en centí metros el coefi ciente de
correlación no varía.
2. El signo del coefi ciente de correlación  es el mismo que el de la covarianza.
 Si la covarianza es positi va, la correlación es directa.
 Si la covarianza es negati va, la correlación es inversa.
 Si la covarianza es nula, no existe correlación.
3. El coefi ciente de correlación lineal  es un número real comprendido entre −1 y
1.
−1 ≤ r ≤ 1.
4. Si el coefi ciente de correlación lineal  toma valores cercanos a −1 la
correlación es fuerte e inversa, y será tanto más fuerte cuanto más se
aproxime r a −1.
5. Si el coefi ciente de correlación lineal  toma valores cercanos a 1 la correlación
es fuerte y directa, y será tanto más fuerte cuanto más se aproxime r a 1.
6. Si el coefi ciente de correlación lineal  toma valores cercanos a 0, la
correlación es débil.
7. Si r = 1 ó −1, los puntos de la nube están sobre la recta creciente o
decreciente. Entre ambas variables hay  dependencia funcional.
Ejemplos
Las notas de 12 alumnos de una clase en Matemáti cas y Física son las siguientes:
Matemáti cas 2 3 4 4 5 6 6 7 7 8 10 10
Física 1 3 2 4 4 4 6 4 6 7 9 10

4
Universidad de San Carlos de Guatemala.
Facultad de Ingeniería. Centro de Investigaciones -CII-
Técnicas de Estudio e Investigación. Inga. Cinthya Ortiz.
Segundo semestre 2022. Martes 13 de septiembre. Sección E. Auxiliar: Daniel Quixtan.
Calcular el coefi ciente de correlación  de la distribución e interpretarlo.
xi yi x i  ·y i xi2 yi2

2 1 2 4 1

3 3 9 9 9

4 2 8 16 4

4 4 16 16 16

5 4 20 25 16

6 4 24 36 16

6 6 36 36 36

7 4 28 49 16

7 6 42 49 36

8 7 56 64 49

10 9 90 100 81

10 10 100 100 100

72 60 431 504 380


1. Se calculan las medias aritméti cas .

2. Calculamos la covarianza .

3. Calculamos las desviaciones tí picas o estándar .


Varianza X = 6. Varianza Y = 6,67.

4. Aplicamos la fórmula del coefi ciente de correlación lineal .

r = 0,9352. Con cuatro cifras signifi cati vas. r 2 = 0,8747. (Valor que aparece
en la gráfi ca de Excel).
Al ser el coefi ciente de correlación  positi vo, la correlación es directa.
Como coefi ciente de correlación  está muy próximo a 1 la correlación es muy
fuerte.
5
Universidad de San Carlos de Guatemala.
Facultad de Ingeniería. Centro de Investigaciones -CII-
Técnicas de Estudio e Investigación. Inga. Cinthya Ortiz.
Segundo semestre 2022. Martes 13 de septiembre. Sección E. Auxiliar: Daniel Quixtan.
Para un coefi ciente de correlación de 0,8 a 1,0 la correlación es directa y fuerte.
Si ti ene el signo negati vo la correlación es inversa y fuerte.
Para un coefi ciente de correlación menor a 0,8 la correlación es directa y débil.
Si tengo signo negati vo, para menor de 0,8 la correlación es inversa y débil.
Calcular el coefi ciente de correlación con 4 cifras signifi cati vas.

Recta de regresión.
La recta de regresión es la que mejor se ajusta a la  nube de puntos.

La recta de regresión pasa por el punto   llamado centro de gravedad.


Recta de regresión de Y sobre X.
La recta de regresión de Y sobre X se uti liza para esti mar los valores de la Y a
parti r de los de la X.
La pendiente de la recta es el cociente entre la covarianza y la varianza de la
variable X.
Y = mX+b. Donde m es la pendiente.

Que datos necesito par formular la recta de regresión lineal de Y en función de X.


Y=f(X).
1. Y promedio.
2. Covarianza (X,Y).
3. Varianza de X.
4. X promedio.

Recta de regresión de X sobre Y.


La recta de regresión  de X sobre Y se uti liza para esti mar los valores de la X a
parti r de los de la Y.
La pendiente de la recta es el cociente entre la covarianza y la varianza de la
variable Y.

Si la correlación es nula, r = 0, las rectas de regresión son perpendiculares entre


sí, y sus ecuaciones son:
y = 
x = 

La ecuación de X = f(Y) se necesitan los siguientes datos:


1. X promedio.
2. Covarianza (X,Y)
3. Varianza de Y.
4. Y promedio.

6
Universidad de San Carlos de Guatemala.
Facultad de Ingeniería. Centro de Investigaciones -CII-
Técnicas de Estudio e Investigación. Inga. Cinthya Ortiz.
Segundo semestre 2022. Martes 13 de septiembre. Sección E. Auxiliar: Daniel Quixtan.
Ejemplo
Las notas de 12 alumnos de una clase en Matemáti cas y Física son las siguientes:
Matemáti cas 2 3 4 4 5 6 6 7 7 8 10 10
Física 1 3 2 4 4 4 6 4 6 7 9 10

Encontrar las rectas de regresión y representarlas.


xi yi x i  ·y i xi2 yi2

2 1 2 4 1

3 3 9 9 9

4 2 8 16 4

4 4 16 16 16

5 4 20 25 16

6 4 24 36 16

6 6 36 36 36

7 4 28 49 16

7 6 42 49 36

8 7 56 64 49

10 9 90 100 81

10 10 100 100 100

72 60 431 504 380

1. Se calculan las medias ariméti cas .

2. Se calcula la covarianza .

3. Se calculan las varianzas .

4. Recta de regresión de Y sobre X.

7
Universidad de San Carlos de Guatemala.
Facultad de Ingeniería. Centro de Investigaciones -CII-
Técnicas de Estudio e Investigación. Inga. Cinthya Ortiz.
Segundo semestre 2022. Martes 13 de septiembre. Sección E. Auxiliar: Daniel Quixtan.
Y-5 = 0,9867X –5,92.Y = 0,9867X -5,92 +5
Y = 0,9867X – 0,92.
Y = mX-b. El punto intercepto es negati vo.

5. Recta de regresión de X sobre Y.

X-6 = 0,888 (Y – 5)
X-6 = 0,888Y – 4,44
X = 0,888Y -4,44+6
X = 0,888Y +1,56
X = mY + b. Punto intercepto es positi vo.

FÓRMULAS

σ xy =
∑ (x i −x )( y i− y ) σ xy =
∑ (x i y i ) −x∗y
N N

σ xy
r=
σxσ y

σ 2x =
∑ ( x2i ) −(x )2 σ 2y=
∑ ( y 2i ) −( y )2 σ 2z =
∑ ( z i −z )2
N N VARIANZA N
Desviación estándar

σ x=
√ ∑ x 2i −( x )2
N
σ y=
√ ∑ y 2i −( y )2
N

8
Universidad de San Carlos de Guatemala.
Facultad de Ingeniería. Centro de Investigaciones -CII-
Técnicas de Estudio e Investigación. Inga. Cinthya Ortiz.
Segundo semestre 2022. Martes 13 de septiembre. Sección E. Auxiliar: Daniel Quixtan.
Desviación estándar es la raíz cuadrada de la varianza.

Recta de regresión de X sobre Y. Recta de regresión de Y sobre X

σ xy σ xy
x − x= ( y− y ) y − y= ( x−x )
σ 2y σ 2x

9
Universidad de San Carlos de Guatemala.
Facultad de Ingeniería. Centro de Investigaciones -CII-
Técnicas de Estudio e Investigación. Inga. Cinthya Ortiz.
Segundo semestre 2022. Martes 13 de septiembre. Sección E. Auxiliar: Daniel Quixtan.
HOJA DE TRABAJO 7. EJERCICIOS DE REGRESIÓN Y CORRELACIÓN.

1. Cinco niños de 2, 3, 5, 7 y 8 años de edad pesan, respecti vamente, 14, 20,


32, 42 y 44 kilos.
a. Calcular la ecuación de la recta de regresión de la edad sobre el peso.
b. ¿Cuál sería el peso aproximado de un niño de seis años?

2. Un centro comercial sabe en función de la distancia, en kilómetros, a


la que se sitúe de un núcleo de población , acuden los clientes, en
cientos, que figuran en la tabla:
Nº de clientes (X) 8 7 6 4 2 1
Distancia (Y) 15 19 25 23 34 40

a. Calcular el coefi ciente de correlación lineal .


b. Si el centro comercial se sitúa a 2 km, ¿cuántos clientes puede esperar?
c. Si desea recibir a 500 clientes, ¿a qué distancia del núcleo de población
debe situarse?

3. Las notas obtenidas por cinco alumnos en Matemáti cas y Química son:
Matemáti cas 6 4 8 5 3. 5
Química 6. 5 4. 5 7 5 4
Determinar las rectas de regresión y calcular la nota esperada en Química para un
alumno que ti ene 7.5 en Matemáti cas.

4. Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son:


Estatura (X) 186 189 190 192 193 193 198 201 203 205
Pesos (Y) 85 85 86 90 87 91 93 103 100 101
Calcular:
a. La recta de regresión de Y sobre X.
b. El coefi ciente de correlación .
c. El peso esti mado de un jugador que mide 208 cm.

10
Universidad de San Carlos de Guatemala.
Facultad de Ingeniería. Centro de Investigaciones -CII-
Técnicas de Estudio e Investigación. Inga. Cinthya Ortiz.
Segundo semestre 2022. Martes 13 de septiembre. Sección E. Auxiliar: Daniel Quixtan.
5. A parti r de los siguientes datos referentes a horas trabajadas en un taller
(X), y a unidades producidas (Y), determinar la  recta de regresión  de Y
sobre X, el coefi ciente de correlación lineal  e interpretarlo. Si una
Horas (X) 80 79 83 84 78 60 82 85 79 84 80 62
Pr o d u c ci ó Sumatoria
n (Y)
300 302 315 330 300 250 300 340 315 330 310 240 (∑)
∑xy
Xy
24000 23858 26145 27720 23400 15000 24600 28900 24885 27720 24800 14880

∑x 2
Xi 2 6400 6241 6889 7056 6084 3600 6724 7225 6241 7056 6400 3844

10890 11560 10890 ∑y 2


Yi2
90000 91204 99225 90000 62500 90000 99225 96100 57600
0 0 0
persona trabaja 70 horas, ¿cuántas unidades produce?
R// Recta y sobre x; Y = 3.510X+30.25
R// Correlación = 0.9230; Las variables no posee una dependencia tan marcada
la una de la otra.
R// 275.95 Unidades producidas

6. La tabla siguiente nos da las notas del test de apti tud (X) dadas a seis
dependientes a prueba y ventas del primer mes de prueba (Y) en cientos
de euros.
X 25 42 33 54 29 36
Y 42 72 50 90 45 48

a. Calcular el coefi ciente de correlación  e interpretar el resultado obtenido.


R// Correlación = 0.9312; El valor y es considerablemente dependiente del
valor x.
b. Calcular la recta de regresión de Y sobre X.
R// 1.770X-6.78
c. Predecir las ventas de un vendedor que obtenga 47 en el test.
R// 76.41 ventas.
Mediana, moda, coefi ciente de variación.
Mediana: (N+1)/2 posición, orden datos de menor a mayor.
Moda: valor que más se repite.
Coefi ciente de variación: (Sx/X(promedio))*100
Sx ó σx= deviación estándar

11

También podría gustarte