Está en la página 1de 25

Probabilidad y Estadístia INMT-51

Profesor: Mario Rojas Plaza


Primer Semestre 2020
Semana 3
Estadística Descriptiva, Covarianza
Covarianza

Cuando analizábamos las variables unidimensionales


considerábamos, entre las medida de dispersión, la
varianza. Ahora si tenemos dos variables X e Y , una
medida de dispersión conjunta de ambas variables es la
covarianza, que se denota como Cov (X , Y ) y se define
como:
Covarianza

a) Datos no agrupados
Consideremos (x1 , y1 ), (x2 , y2 ), . . . , (xn , yn ) una muestra de n
observaciones de una variable bidimensional cuantitativa (X , Y ). La
covarianza se define como:
n
1X
Cov (x, y ) = (xi − x)(yi − y )
n
i =1

o bien una forma más sencilla de escribir está dada por


n
1X
Cov (x, y ) = xi yi − x y
n
i =1
Covarianza

Demostración

n
1X
Cov (x, y ) = (xi − x)(yi − y )
n
i =1
n
1X
= (xi yi − xi y − yi x + xy )
n
i =1
n n n n
1X 1X 1X 1X
= xi yi − y xi − x yi + x y
n n n n
i =1 i =1 i =1 i =1
n
1X
= xi yi − y x − x y + x y
n
i =1
n
1X
= xi yi − y x.
n
i =1
Covarianza

Interpretación de la Covarianza

i) Si Cov (x, y ) > 0, hay dependencia directa


(positiva), es decir, a grandes valores de x
corresponden grandes valores de y .
2i) Si Cov (x, y ) = 0. Una covarianza 0 se
interpreta como la no existencia de una
relación lineal entre las dos variables
estudiadas.
3i) Si Cov (x, y ) < 0, hay dependencia inversa
(negativa), es decir, a grandes valores de x
corresponden pequeños valores de y .
Covarianza

Ejemplo

Los estudiantes universitarios que aprenden más rápido


tienen mejores calificaciones promedio (X) y por lo tanto,
mejores oportunidades de obtener buenos empleos después
de graduarse. Supongase que los datos que se presentan a
continuación representan las calificaciones promedio de 15
recien graduados y sus correspondientes salarios iniciales
(Y) en miles de dolares. Deternime la covarianza e
interprete el valor obtenido.
Covarianza

i X Y
1 2.95 18.5
2 3.20 20.0
3 3.40 21.1
4 3.60 22.4
5 3.20 21.2
6 2.85 15.0
7 3.10 18.0
8 2.85 18.8
9 3.05 15.7
10 2.70 14.4
11 2.75 15.5
12 3.10 17.2
13 3.15 19.0
14 2.95 17.2
15 2.75 16.8
Covarianza

Solución
15
X
xi = 45,6
i =1
15
X
yi = 270,8
i =1
15
X
xi yi = 830,425
i =1

  
830,425 45,6 270,8
Cov (x, y ) = −
15 15 15
= 0,4795

Ahora bien, interpreta el resultado.


Covarianza

Diagrama de Dispersión

Un diagrama de dispersión es una representación gráfica


de los n pares de observaciones (xi , yi ), i = 1, 2, . . . , n.
como puntos de un sistema bidimensional.
Covarianza

Ejemplo

En nuestro caso el digrama de dispersión para los datos


dados anteriormente es.
Covarianza

Diagrama de Dispersión

La simple observación de las posiciones relativas de estos


puntos sugiere el comportamiento de la nube de puntos.
Un aumento o disminución en los valores observados de X
puede permitir describir simultáneamente un aumento o
disminución de los valores de Y , o viceversa. Aún más,
puede seceder que la nube de puntos no insinúe alguno de
estos comportamientos mencionados.
Covarianza

b) Datos agrupados
Supongamos que las m clases de la variable X son A1 , A2 , . . . , Am y
las r clases de la variable Y son B1 , B2 , . . . , Br , con marcas de
clases C1 , C2 , . . . , Cm para X y D1 , D2 , . . . , Dr para Y , además de
las frecuencias absolutas conjuntas nij , entonces
m r
1 XX
Cov (x, y ) = nij (Ci − x)(Dj − y )
n
i =1 j=1

o bien una forma más sencilla de escribir está dada por


m r
1 XX
Cov (x, y ) = Ci Dj nij − x y
n
i =1 j=1
Covarianza

Ejemplo

Construya una tabla de frecuencias bidimensional para el


ejemplo anterior con 3 intervalos de clases para la variable
calificación promedio y 4 intervalos para la variable salario
inicial. Además obtenga e interpreta el resultado de la
covarianza.
Covarianza

Solución
X Y
xmin = 2,70 ymin = 14,4
xmax = 3,60 ymax = 22,4
0,9 8
A= = 0,3 A= =2
3 4

X \Y [14.4 ; 16.4] (16.4 ; 18.4] (18.4 ; 20.4] (20.4 ; 22.4]


[2.70 ; 3.00]
(3.00 ; 3.30]
(3.30 ; 3.60]
Covarianza

Solución

Título: Distribución de frecuencia conjunta asociada a la


variable calificación promedio y salario inicial de 15 personas
recien graduadas

X \Y [14.4 ; 16.4] (16.4 ; 18.4] (18.4 ; 20.4] (20.4 ; 22.4] ni·


[2.70 ; 3.00] 3 2 2 0 7
(3.00 ; 3.30] 1 2 2 1 6
(3.30 ; 3.60] 0 0 0 2 2
n·j 4 4 4 3 n=15
Covarianza

Solución

3
X 4
X 3 X
X 4
ni · Ci = 45,75 , n·j Dj = 273 , nij Ci Dj = 836,65
i =1 j=1 i =1 j=1

3 4
1 XX
Cov (x, y ) = Ci Dj nij − x y
15
i =1 j=1
  
836,65 45,75 273
= −
15 15 15
= 55,7767 − 55,51
= 0,2667

Muy bien, ahora interprta el resultado.


Covarianza

Propiedades de la Covarianza

1. La covarianza de (X , Y ) es igual a la de (Y , X ), es
decir, Cov (x, y ) = Cov (y , x).
2. La covarianza de (X , X ) es igual a la varianza de X,
es decir, Cov (x, y ) = Var (x).
3. En el supuesto que la variable Y se relacione con la
variable X según la relación yi = a + bxi para cada
par de datos observado (xi , yi ), i = 1, 2, . . . , n, la
covarinaza queda determinada por

Cov (x, y ) = Cov (x, a + bx)


= b · Cov (x, x)
= bSx2
Covarianza

Ejemplo

1.- La Tabla adjunta presenta la gravedad de


1000 accidentes producidos en tres turnos
diferentes, entregue la siguiente información
al encargado de seguridad.
Turno
Gravedad Día Tarde Noche Total
Leve 390 240 140 770
Grave 110 60 60 230
Total 500 300 200 1000
Covarianza

Ejemplo

a) En el turno día, el porcentaje de accidentes


graves.
b) De los accidentes leves, el porcentaje de
accidentes producidos en el turno noche.
c) El porcentaje de accidentes en la empresa,
considerando graves y producidos en el
turno de día.
d) El porcentaje de accidentes en la empresa,
considerando leves y producidos en el turno
de noche.
Covarianza

Ejemplo

2.- Los siguientes pares de datos (X , Y ),


obtenidos en cada alumno de un cierto
curso, representan los puntajes en las
asignaturas de matemáticas y estadística
respectivamente:

(9,8) ; (11,12) ; (14,17) ; (11,13) ; (16,15)


(13,11) ; (15,14) ; (12,12) ; (16,18) ; (14,14)
(10,16) ; (11,14) ; (14,15) ; (6,8) ; (12,13)
(10,16) ; (13,16) ; (10,12) ; (13,13) ; (10,14)
Covarianza

a) Con los datos anteriores complete la


siguiente tabla de frecuencias.

X \Y [8 ; 10] (10 ; 12] (12 ; 14] (14 ; 16] (16 ; 18] Total
[6 ; 8]
(8 ; 10]
(10 ; 12]
(12 ; 14]
(14 ; 16]
Total
Covarianza

Las siguientes preguntas deberán ser contestadas a partir


de la tabla anterior.
b) Si en matemáticas aprueba el 25 % de los
alumnos. ¿Cuál es el puntaje mínimo para
aprobar esta asignatura?.
c) Calcule la moda y el primer cuartil de los
puntajes en estadística para aquellos
alumnos cuyo puntaje en matemáticas es
mayor que 10 puntos y menor o igual a 16
puntos. Interprete los resultados.
d) El profesor de matemáticas afirma que el
puntaje de los alumnos es más homogéneos
en su asignatura que en la de estadística.
¿Está usted de acuerdo con esta
afirmación?. Justifique su respuesta.
Covarianza

Ejemplo
3.- En una planta mecánica se analiza la relación entre
la velocidad X de un motor (revoluciones por
minuto) y la temperatura Y (en o C ) obteniéndose
la siguiente información.

X \Y [50 ; 60] (60 ; 70] (70 ; 80] (80 ; 90] (90 ; 100] Total
[600 ; 800] 4 2 0 0 0 6
(800 ; 1000] 3 6 1 0 0 10
(1000 ; 1200] 0 1 5 2 0 8
(1200 ; 1400] 0 0 3 2 1 30
Total 7 9 9 4 1 30
Covarianza

a) Construya una tabla completa y un gráfico


adecuado para mostrar la velocidad de los motores y
en la tabla calcule e interprete, N3 , F2 y la mediana.
b) Para la temperatura de los motores determine un
intervalo centrado en la media aritmética y de
longitud dos veces la desviación estándar. ¿Qué
porcentaje de casos cae dentro de este intervalo?.
c) El encargado del Departamento de control considera
que el 20 % de los motores de más baja temperatura
y el 15 % de los motores de más alta temperatura
no cumplen las normas de calidad. Determine los
límites de calidad para tomar tal decisión.
d) El mecánico jefe afirma que la velocidad de los
motores es más homogénea cuando la temperatura
está entre 60 o C y 70 o C que cuando la temperatura
está entre 70 o C y 80 o C. ¿Qué opina usted al
respecto?. Justifique su respuesta con cifras
estadísticas indicadoras.

También podría gustarte