Está en la página 1de 11

Análisis descriptivo bivariado:

Objetivos del capítulo


Vamos a estudiar descriptores de interacción entre dos variables o más.

Es fundamental entender que la interacción entre variables puede tomar


muchas formas diferentes y de la misma manera que analizarlas una a la
vez, podría dejar de lado las interacciones entre pares.

Una de las limitantes importantes a la hora de estudiar interacciones


desde el punto de vista gráfico es el hecho de que no es muy fácil
representar conjuntos con muchas dimensiones en el plano.

Al finalizar este capítulo el estudiante debe conocer los supuestos y


estimación de parámetros en el análisis de regresión lineal simple,
probar si existe relación lineal entre dos variables, calcular el
coeficiente de determinación y el coeficiente de correlación.
Contenido
● Descriptores numéricos de interacción
○ Covariancia
○ Correlación
● Descriptores gráficos de interacción
○ Diagrama de dispersión
○ Diagrama de dispersión con colores
○ Diagrama de densidad
○ Mosaico
● Datos Bivariados
○ 1. Categórica y categórica.
○ 2. Categórica y numérica.
○ 3. Numérica y numérica.
Covariancia
La covarianza es el valor que refleja en qué cuantía dos variables
aleatorias varían de forma conjunta respecto a sus medias.
Nos permite saber cómo se comporta una variable en función de
lo que hace otra variable. Es decir, cuando X sube ¿Cómo se
comporta Y?

La covarianza puede tomar los siguiente valores:


● Covarianza (X,Y) es menor que cero cuando “X” sube e “Y”
baja. Hay una relación negativa.
● Covarianza (X,Y) es mayor que cero cuando “X” sube e “Y”
sube o ambos bajan. Hay una relación positiva.
● Covarianza (X,Y) es igual que cero cuando no hay relación
existente entre las variables “X” e “Y”.
Una alta covarianza no implica efecto causal.
Cálculo de la Covariancia
La fórmula de la covarianza se expresa como sigue:

Dónde:
● y barra es la media de la variable Y.
● x barra es media de la variable X.
● “i” es la posición de la observación.
● “n” el número total de observaciones.
Propiedades de la Covariancia
● Cov (X, b) = 0, b es una constante.
● Cov (X, X) = Var(X) , la covarianza de una variable y de sí
misma es igual a su varianza.
● Cov (X, Y) = Cov(Y,X)
● Cov (b·X, c·Y) = c·b ·Cov(X,Y), b y c dos constantes.
● Cov (b+X, c+Y) = Cov(X,Y) sumar dos constantes cualesquiera
a cada variable, no afecta a la covarianza.
Correlación (r para la muestra) (ρ para población)
La correlación, también conocida como coeficiente de correlación
lineal, es una medida estadística que cuantifica la dependencia o
la fuerza de relación lineal entre dos variables cuantitativas.
La correlación de dos variables NO necesariamente implica
causalidad.

Valores de r
● Si r >0, la correlación lineal es positiva
Ejemplo: altura y peso

● Si r < 0, la correlación lineal es negativa


Ejemplo: tiempo y velocidad

● Si r = 0, no existe correlación lineal entre las variables, pero


podría existir otro tipo de correlación.
Correlación (r)
Coeficiente de correlación lineal

También se le conoce como coeficiente de correlación de


Pearson, en honor a Karl Pearson quien lo desarrolló
originalmente.

-1≤ r ≤ 1
En resumen tenemos:

r
Propiedades de la Correlación
● rX,Y es invariante (salvo el signo) frente a cambios de escala y
origen en las unidades de medida de X y/o Y.
● −1 ≤ rX,Y ≤ 1
● | rX,Y| = 1 ⇔ existe dependencia funcional lineal (positiva o
negativa, en función del signo) entre X e Y .
Covarianza vs. Correlación
● La covarianza provee la dirección (positiva, negativa, cercana
a cero), de la relación lineal de dos variables, mientras la
correlación contiene la dirección y la intensidad.
● La covarianza es no acotada pues su tamaño depende de la
escala de las variables, mientras que la correlación toma
valores entre -1 y 1 independiente de la escala de las
variables.
● La correlación a diferencia de la covarianza nos da la
intensidad de la relación entre dos variables.

También podría gustarte