Está en la página 1de 28

Estadística Bivariada

Análisis de Correlación
Andy Domínguez
adominguez@utb.edu.co

Estadística y Probabilidad
TABLAS CRUZADAS

Con frecuencia, los directivos o quienes deben


tomar decisiones requieren métodos tabulares o
gráficos que les ayuden a entender la relación
entre dos o más variables. La tabulación cruzada y
los diagramas de dispersión son dos métodos de
este tipo.
TABLAS CRUZADAS
Nro X Y
Fuma Sexo
1 Si F
2 No M
3 no F
. . .
. . .
. . .
Total . .
TABLAS CRUZADAS
Nro X Y Z

1 X1 Y1 Z1
2 X2 Y2 Z2
3 X3 Y3 Z3
. . . .
. . . .
. . . .
Total . . .

https://www.deia.eus/actualidad/coronavirus/2020/03/19/muertos-coronavirus-euskadi-tenia-30/1025735.html
TABLA CRUZADA
Una tabulación cruzada es un resumen tabular de los datos de
dos variables.
Ej: Se realizó una
investigación
sobre la calidad y
precio de las
comidas de 300
restaurantes en
Los Ángeles.
TABLA CRUZADA
Luego de ordenar los datos, se obtiene la tabla:

OBSERVACIONES:
•El mayor número de restaurantes en la muestra (64) tiene calificación de muy buena calidad y un precio de
comida en el rango $20 - $29.
•Solo 2 restaurantes tienen una calificación de excelente y un precio en el rango $10 - $19
•Del margen derecho obtenemos que, de los 300 restaurantes, 84 son buenos, 150 muy buenos y 66 excelentes.
DIAGRAMA DE DISPERSIÓN
oUn diagrama de dispersión es la presentación gráfica de la
relación entre 2 variables cuantitativas.
oUna línea de tendencia es aquella que proporciona una
aproximación de la relación entre 2 variables.
DIAGRAMA DE DISPERSIÓN
Tipos de Relación que aparecen en los Diagramas de Dispersión
DIAGRAMA DE DISPERSIÓN
• Por ejemplo, considera la relación publicidad/ventas para
una tienda de equipos de computo en Bogotá. Durante los 3
meses pasados, en 10 ocasiones la tienda usó los
comerciales de televisión para promover las ventas en sus
establecimientos. Los gerentes quieren investigar si existe
una relación entre el número de comerciales transmitidos y
las ventas en la tienda durante la semana siguiente. Los
datos se registran en una tabla:
DIAGRAMA DE DISPERSIÓN
DIAGRAMA DE DISPERSIÓN
Análisis de Correlación

El primer paso habitual es trazar los datos en un Diagrama de Dispersión


Análisis de Correlación

La covarianza es una medida descriptiva de la asociación entre dos


variables
La interpretación de la covarianza:
𝐶𝑜𝑣 ( 𝑥 , 𝑦 )= 𝑆 𝑥𝑦 =
∑ ( 𝑥 𝑖 − 𝑥 )( 𝑦 𝑖 − 𝑦 )
𝑛 −1 • No hay relación
• varían en la misma dirección
• varían en dirección opuesta

NOTA: Es sensible a las UNIDADES de medidas de las variables


Análisis de Correlación

https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3551767
Análisis de Correlación
𝐶𝑜𝑣 ( 𝑥 , 𝑦 )= 𝑆 𝑥𝑦 =
∑ ( 𝑥 𝑖 − 𝑥 )( 𝑦 𝑖 − 𝑦 )
𝑛 −1

Ejemplo
Análisis de Correlación
Ejemplo
En el siguiente diagram se puede ver inicialmente la
nube de puntos de dos variables que toma los
siguientes 6 pares de valores:
X 2 4 6 8 10 12

y 8 7 7 6 6 4

1) A la vista de la nube de puntos ¿qué tipo de dependencia se puede suponer?


2) Calcular la covarianza y confirmar la afirmación anterior.
Análisis de Correlación

Se estima con la siguiente fórmula:

𝑟=
∑ ( 𝑥 𝑖 − 𝑥 )( 𝑦 𝑖 − 𝑦 )
=
𝑆 𝑥𝑦
(𝑛 −1) 𝑆𝑥 𝑆 𝑦 𝑆𝑥 𝑆𝑦

Donde es la covarianza entre (X,Y)


Análisis de Correlación
𝑆 𝑥𝑦
𝑟=
Análisis de Correlación 𝑆𝑥 𝑆 𝑦
Correlación casi perfecta
Correlación fuerte
Correlación moderada
Correlación débil
Correlación cercana a cero
Correlación negativa
Correlación no lineal
𝑆 𝑥𝑦
Análisis de Correlación 𝑟=
𝑆𝑥 𝑆 𝑦

Ejemplo

Existe relación lineal positiva perfecta entre x , y


EJERCICIO

Calcular el coeficiente de correlación entre las dos


variables. ¿Qué puede concluir?

También podría gustarte