Está en la página 1de 92

Estadı́stica

Tema 2: Estadı́stica Bivariante de datos

Tema 2: Estadı́stica Bivariante de datos 1 / 41


Contenidos

1 Tabla de contingencia
Distribución marginal
Distribución condicionada

2 Análisis bivariante de datos


Diagrama de dispersión. Covarianza
Coeficiente de correlación.
Mı́nimos cuadrados: recta de regresión

Tema 2: Estadı́stica Bivariante de datos 2 / 41


Tabla de contingencia

Contenido

1 Tabla de contingencia
Distribución marginal
Distribución condicionada

2 Análisis bivariante de datos


Diagrama de dispersión. Covarianza
Coeficiente de correlación.
Mı́nimos cuadrados: recta de regresión

Tema 2: Estadı́stica Bivariante de datos 3 / 41


Tabla de contingencia

Tabla de contingencia

Las tablas de doble entrada o tablas de contingencia, son útiles para


resumir la información de dos variables X e Y .

Tema 2: Estadı́stica Bivariante de datos 4 / 41


Tabla de contingencia

Tabla de contingencia

Las tablas de doble entrada o tablas de contingencia, son útiles para


resumir la información de dos variables X e Y .

X=Tipo Vivienda Y=Status Económico

Propiedad Bajo
Hipoteca Medio
Propiedad Medio
Alquiler Alto
Propiedad Alto
Alquiler Medio
Hipoteca Medio
Hipoteca Medio
Propiedad Alto
Propiedad Bajo
Hipoteca Medio
Hipoteca Bajo
Alquiler Alto
Hipoteca Alto
Hipoteca Medio
Propiedad Bajo
Propiedad Medio
Hipoteca Alto
Hipoteca Alto
Propiedad Medio

Tema 2: Estadı́stica Bivariante de datos 4 / 41


Tabla de contingencia

Tabla de contingencia

Las tablas de doble entrada o tablas de contingencia, son útiles para


resumir la información de dos variables X e Y .

X=Tipo Vivienda Y=Status Económico

Propiedad Bajo SES (Status


Hipoteca Medio
Propiedad Medio socio–económico)
Alquiler Alto
Propiedad Alto Vivienda Bajo Medio Alto
Alquiler Medio
Hipoteca Medio Alquiler
Hipoteca Medio
Propiedad Alto Hipoteca
Propiedad Bajo
Hipoteca Medio Propiedad
Hipoteca Bajo
Alquiler Alto
Hipoteca Alto
Hipoteca
Propiedad
Medio
Bajo
Frecuencia conjunta
Propiedad Medio
Hipoteca Alto La frecuencia absoluta con la que X toma el
Hipoteca Alto
Propiedad Medio valor i e Y toma el valor j.

Tema 2: Estadı́stica Bivariante de datos 4 / 41


Tabla de contingencia

Tabla de contingencia

Las tablas de doble entrada o tablas de contingencia, son útiles para


resumir la información de dos variables X e Y .

X=Tipo Vivienda Y=Status Económico

Propiedad Bajo SES (Status


Hipoteca Medio
Propiedad Medio socio–económico)
Alquiler Alto
Propiedad Alto Vivienda Bajo Medio Alto
Alquiler Medio
Hipoteca Medio Alquiler 0
Hipoteca Medio
Propiedad Alto Hipoteca
Propiedad Bajo
Hipoteca Medio Propiedad
Hipoteca Bajo
Alquiler Alto
Hipoteca Alto
Hipoteca Medio
Propiedad Bajo
Propiedad Medio
Hipoteca Alto
Hipoteca Alto
Propiedad Medio

Tema 2: Estadı́stica Bivariante de datos 4 / 41


Tabla de contingencia

Tabla de contingencia

Las tablas de doble entrada o tablas de contingencia, son útiles para


resumir la información de dos variables X e Y .

X=Tipo Vivienda Y=Status Económico

Propiedad Bajo SES (Status


Hipoteca Medio
Propiedad Medio socio–económico)
Alquiler Alto
Propiedad Alto Vivienda Bajo Medio Alto
Alquiler Medio
Hipoteca Medio Alquiler 0 1
Hipoteca Medio
Propiedad Alto Hipoteca
Propiedad Bajo
Hipoteca Medio Propiedad
Hipoteca Bajo
Alquiler Alto
Hipoteca Alto
Hipoteca Medio
Propiedad Bajo
Propiedad Medio
Hipoteca Alto
Hipoteca Alto
Propiedad Medio

Tema 2: Estadı́stica Bivariante de datos 4 / 41


Tabla de contingencia

Tabla de contingencia

Las tablas de doble entrada o tablas de contingencia, son útiles para


resumir la información de dos variables X e Y .

X=Tipo Vivienda Y=Status Económico

Propiedad Bajo SES (Status


Hipoteca Medio
Propiedad Medio socio–económico)
Alquiler Alto
Propiedad Alto Vivienda Bajo Medio Alto
Alquiler Medio
Hipoteca Medio Alquiler 0 1 2
Hipoteca Medio
Propiedad Alto Hipoteca
Propiedad Bajo
Hipoteca Medio Propiedad
Hipoteca Bajo
Alquiler Alto
Hipoteca Alto
Hipoteca Medio
Propiedad Bajo
Propiedad Medio
Hipoteca Alto
Hipoteca Alto
Propiedad Medio

Tema 2: Estadı́stica Bivariante de datos 4 / 41


Tabla de contingencia

Tabla de contingencia

Las tablas de doble entrada o tablas de contingencia, son útiles para


resumir la información de dos variables X e Y .

X=Tipo Vivienda Y=Status Económico

Propiedad Bajo SES (Status


Hipoteca Medio
Propiedad Medio socio–económico)
Alquiler Alto
Propiedad Alto Vivienda Bajo Medio Alto
Alquiler Medio
Hipoteca Medio Alquiler 0 1 2
Hipoteca Medio
Propiedad Alto Hipoteca 1
Propiedad Bajo
Hipoteca Medio Propiedad
Hipoteca Bajo
Alquiler Alto
Hipoteca Alto
Hipoteca Medio
Propiedad Bajo
Propiedad Medio
Hipoteca Alto
Hipoteca Alto
Propiedad Medio

Tema 2: Estadı́stica Bivariante de datos 4 / 41


Tabla de contingencia

Tabla de contingencia

Las tablas de doble entrada o tablas de contingencia, son útiles para


resumir la información de dos variables X e Y .

X=Tipo Vivienda Y=Status Económico

Propiedad Bajo SES (Status


Hipoteca Medio
Propiedad Medio socio–económico)
Alquiler Alto
Propiedad Alto Vivienda Bajo Medio Alto
Alquiler Medio
Hipoteca Medio Alquiler 0 1 2
Hipoteca Medio
Propiedad Alto Hipoteca 1 5
Propiedad Bajo
Hipoteca Medio Propiedad
Hipoteca Bajo
Alquiler Alto
Hipoteca Alto
Hipoteca Medio
Propiedad Bajo
Propiedad Medio
Hipoteca Alto
Hipoteca Alto
Propiedad Medio

Tema 2: Estadı́stica Bivariante de datos 4 / 41


Tabla de contingencia

Tabla de contingencia

Las tablas de doble entrada o tablas de contingencia, son útiles para


resumir la información de dos variables X e Y .

X=Tipo Vivienda Y=Status Económico

Propiedad Bajo SES (Status


Hipoteca Medio
Propiedad Medio socio–económico)
Alquiler Alto
Propiedad Alto Vivienda Bajo Medio Alto
Alquiler Medio
Hipoteca Medio Alquiler 0 1 2
Hipoteca Medio
Propiedad Alto Hipoteca 1 5 3
Propiedad Bajo
Hipoteca Medio Propiedad
Hipoteca Bajo
Alquiler Alto
Hipoteca Alto
Hipoteca Medio
Propiedad Bajo
Propiedad Medio
Hipoteca Alto
Hipoteca Alto
Propiedad Medio

Tema 2: Estadı́stica Bivariante de datos 4 / 41


Tabla de contingencia

Tabla de contingencia

Las tablas de doble entrada o tablas de contingencia, son útiles para


resumir la información de dos variables X e Y .

X=Tipo Vivienda Y=Status Económico

Propiedad Bajo SES (Status


Hipoteca Medio
Propiedad Medio socio–económico)
Alquiler Alto
Propiedad Alto Vivienda Bajo Medio Alto
Alquiler Medio
Hipoteca Medio Alquiler 0 1 2
Hipoteca Medio
Propiedad Alto Hipoteca 1 5 3
Propiedad Bajo
Hipoteca Medio Propiedad 3
Hipoteca Bajo
Alquiler Alto
Hipoteca Alto
Hipoteca Medio
Propiedad Bajo
Propiedad Medio
Hipoteca Alto
Hipoteca Alto
Propiedad Medio

Tema 2: Estadı́stica Bivariante de datos 4 / 41


Tabla de contingencia

Tabla de contingencia

Las tablas de doble entrada o tablas de contingencia, son útiles para


resumir la información de dos variables X e Y .

X=Tipo Vivienda Y=Status Económico

Propiedad Bajo SES (Status


Hipoteca Medio
Propiedad Medio socio–económico)
Alquiler Alto
Propiedad Alto Vivienda Bajo Medio Alto
Alquiler Medio
Hipoteca Medio Alquiler 0 1 2
Hipoteca Medio
Propiedad Alto Hipoteca 1 5 3
Propiedad Bajo
Hipoteca Medio Propiedad 3 3
Hipoteca Bajo
Alquiler Alto
Hipoteca Alto
Hipoteca Medio
Propiedad Bajo
Propiedad Medio
Hipoteca Alto
Hipoteca Alto
Propiedad Medio

Tema 2: Estadı́stica Bivariante de datos 4 / 41


Tabla de contingencia

Tabla de contingencia

Las tablas de doble entrada o tablas de contingencia, son útiles para


resumir la información de dos variables X e Y .

X=Tipo Vivienda Y=Status Económico

Propiedad Bajo SES (Status


Hipoteca Medio
Propiedad Medio socio–económico)
Alquiler Alto
Propiedad Alto Vivienda Bajo Medio Alto
Alquiler Medio
Hipoteca Medio Alquiler 0 1 2
Hipoteca Medio
Propiedad Alto Hipoteca 1 5 3
Propiedad Bajo
Hipoteca Medio Propiedad 3 3 2
Hipoteca Bajo
Alquiler Alto
Hipoteca Alto
Hipoteca Medio
Propiedad Bajo
Propiedad Medio
Hipoteca Alto
Hipoteca Alto
Propiedad Medio

Tema 2: Estadı́stica Bivariante de datos 4 / 41


Tabla de contingencia

http://www.rtve.es/deportes/juegos-olimpicos-invierno/medallero

Pases \ Medalla Oro Plata Bronce


China 51 21 28
Estados Unidos 36 38 36
Rusia 23 21 28
Reino Unido 19 13 15
Alemania 16 10 15

Tema 2: Estadı́stica Bivariante de datos 5 / 41


Tabla de contingencia Distribución marginal

Contenido

1 Tabla de contingencia
Distribución marginal
Distribución condicionada

2 Análisis bivariante de datos


Diagrama de dispersión. Covarianza
Coeficiente de correlación.
Mı́nimos cuadrados: recta de regresión

Tema 2: Estadı́stica Bivariante de datos 6 / 41


Tabla de contingencia Distribución marginal

Distribuciones marginales

Distribuciones marginales. es la suma de las frecuencias conjuntas para uno de las dos
variables.

Tema 2: Estadı́stica Bivariante de datos 7 / 41


Tabla de contingencia Distribución marginal

Distribuciones marginales

Distribuciones marginales. es la suma de las frecuencias conjuntas para uno de las dos
variables.

Ejemplo
Distribución de la variable X
c
X SES (Status
fi,• = fi,j socio–económico) (Y)
j=1 Vivienda (X) Bajo Medio Alto
Alquiler 0 1 2
Hipoteca 1 5 3
Propiedad 3 3 2

Tema 2: Estadı́stica Bivariante de datos 7 / 41


Tabla de contingencia Distribución marginal

Distribuciones marginales

Distribuciones marginales. es la suma de las frecuencias conjuntas para uno de las dos
variables.

Ejemplo
Distribución de la variable X
c
X SES (Status
fi,• = fi,j socio–económico) (Y)
j=1 Vivienda (X) Bajo Medio Alto
Alquiler 0 1 2 3
Hipoteca 1 5 3 9
Propiedad 3 3 2 8

Tema 2: Estadı́stica Bivariante de datos 7 / 41


Tabla de contingencia Distribución marginal

Distribuciones marginales

Distribuciones marginales. es la suma de las frecuencias conjuntas para uno de las dos
variables.

Ejemplo
Distribución de la variable X
c
X SES (Status
fi,• = fi,j socio–económico) (Y)
j=1 Vivienda (X) Bajo Medio Alto
Alquiler 0 1 2 3
Distribución de la variable Y . Hipoteca 1 5 3 9
Propiedad 3 3 2 8
r
X
f•,j = fi,j
i=1

Tema 2: Estadı́stica Bivariante de datos 7 / 41


Tabla de contingencia Distribución marginal

Distribuciones marginales

Distribuciones marginales. es la suma de las frecuencias conjuntas para uno de las dos
variables.

Ejemplo
Distribución de la variable X
c
X SES (Status
fi,• = fi,j socio–económico) (Y)
j=1 Vivienda (X) Bajo Medio Alto
Alquiler 0 1 2 3
Distribución de la variable Y . Hipoteca 1 5 3 9
Propiedad 3 3 2 8
r
X 4 9 7
f•,j = fi,j
i=1

Tema 2: Estadı́stica Bivariante de datos 7 / 41


Tabla de contingencia Distribución marginal

Distribuciones marginales

Distribuciones marginales. es la suma de las frecuencias conjuntas para uno de las dos
variables.

Ejemplo
Distribución de la variable X
c
X SES (Status
fi,• = fi,j socio–económico) (Y)
j=1 Vivienda (X) Bajo Medio Alto
Alquiler 0 1 2 3
Distribución de la variable Y . Hipoteca 1 5 3 9
Propiedad 3 3 2 8
r
X 4 9 7
f•,j = fi,j
i=1
f•,Alto =

Tema 2: Estadı́stica Bivariante de datos 7 / 41


Tabla de contingencia Distribución marginal

Distribuciones marginales

Distribuciones marginales. es la suma de las frecuencias conjuntas para uno de las dos
variables.

Ejemplo
Distribución de la variable X
c
X SES (Status
fi,• = fi,j socio–económico) (Y)
j=1 Vivienda (X) Bajo Medio Alto
Alquiler 0 1 2 3
Distribución de la variable Y . Hipoteca 1 5 3 9
Propiedad 3 3 2 8
r
X 4 9 7
f•,j = fi,j
i=1
f•,Alto = 7

Tema 2: Estadı́stica Bivariante de datos 7 / 41


Tabla de contingencia Distribución condicionada

Contenido

1 Tabla de contingencia
Distribución marginal
Distribución condicionada

2 Análisis bivariante de datos


Diagrama de dispersión. Covarianza
Coeficiente de correlación.
Mı́nimos cuadrados: recta de regresión

Tema 2: Estadı́stica Bivariante de datos 8 / 41


Tabla de contingencia Distribución condicionada

Distribuciones condicionadas

La frecuencia del valor i de la variable X condicionada al valor j de la


variable Y es la razón de la frecuencia conjunto (i, j) con respecto a la
marginal de
fi,j
fi|j =
f•,j

Tema 2: Estadı́stica Bivariante de datos 9 / 41


Tabla de contingencia Distribución condicionada

Distribuciones condicionadas

La frecuencia del valor i de la variable X condicionada al valor j de la


variable Y es la razón de la frecuencia conjunto (i, j) con respecto a la
marginal de
fi,j
fi|j =
f•,j

Ejemplo

SES (Status fAlquiler |Bajo =


socio–económico)
Vivienda Bajo Medio Alto fHipoteca|Alto =
Alquiler 0 1 2 3
Hipoteca 1 5 3 9 fMedio|Propiedad =
Propiedad 3 3 2 8
4 9 7

Tema 2: Estadı́stica Bivariante de datos 9 / 41


Tabla de contingencia Distribución condicionada

Distribuciones condicionadas

La frecuencia del valor i de la variable X condicionada al valor j de la


variable Y es la razón de la frecuencia conjunto (i, j) con respecto a la
marginal de
fi,j
fi|j =
f•,j

Ejemplo

SES (Status fAlquiler |Bajo =


socio–económico) fAlquiler ,Bajo /f•,Bajo = 0/4 = 0
Vivienda Bajo Medio Alto fHipoteca|Alto =
Alquiler 0 1 2 3
Hipoteca 1 5 3 9 fMedio|Propiedad =
Propiedad 3 3 2 8
4 9 7

Tema 2: Estadı́stica Bivariante de datos 9 / 41


Tabla de contingencia Distribución condicionada

Distribuciones condicionadas

La frecuencia del valor i de la variable X condicionada al valor j de la


variable Y es la razón de la frecuencia conjunto (i, j) con respecto a la
marginal de
fi,j
fi|j =
f•,j

Ejemplo

SES (Status fAlquiler |Bajo =


socio–económico) fAlquiler ,Bajo /f•,Bajo = 0/4 = 0
Vivienda Bajo Medio Alto fHipoteca|Alto =
Alquiler 0 1 2 3 fHipoteca,Alto /f•,Alto = 3/7
Hipoteca 1 5 3 9 fMedio|Propiedad =
Propiedad 3 3 2 8
4 9 7

Tema 2: Estadı́stica Bivariante de datos 9 / 41


Tabla de contingencia Distribución condicionada

Distribuciones condicionadas

La frecuencia del valor i de la variable X condicionada al valor j de la


variable Y es la razón de la frecuencia conjunto (i, j) con respecto a la
marginal de
fi,j
fi|j =
f•,j

Ejemplo

SES (Status fAlquiler |Bajo =


socio–económico) fAlquiler ,Bajo /f•,Bajo = 0/4 = 0
Vivienda Bajo Medio Alto fHipoteca|Alto =
Alquiler 0 1 2 3 fHipoteca,Alto /f•,Alto = 3/7
Hipoteca 1 5 3 9 fMedio|Propiedad =
Propiedad 3 3 2 8 fPropiedad,Medio /fPropiedad,• = 3/8
4 9 7

Tema 2: Estadı́stica Bivariante de datos 9 / 41


Tabla de contingencia Distribución condicionada

Tabla de contingencia (cuantitativa vs. cualitativa)

Grado Nota
Marketing 3.3
Marketing 5.6
Marketing 9.2
Marketing 8.9
Marketing 6.0
Dir.Empresa 5.0
Dir.Empresa 7.4
Marketing 8.4
Dir.Empresa 3.9
Dir.Empresa 8.4
Dir.Empresa 7.1
Marketing 3.7
Marketing 6.7
Marketing 7.0
Marketing 6.5
Dir.Empresa 5.3
Marketing 8.6
Marketing 4.9
Marketing 5.0
Dir.Empresa 6.3

Tema 2: Estadı́stica Bivariante de datos 10 / 41


Tabla de contingencia Distribución condicionada

Tabla de contingencia (cuantitativa vs. cualitativa)

Grado Nota
Marketing 3.3
Marketing 5.6
Marketing 9.2
Marketing 8.9
Marketing 6.0
Dir.Empresa 5.0 Dir. Empresa Marketing
Dir.Empresa 7.4
Marketing 8.4
(3,5] 2 4
Dir.Empresa 3.9
Dir.Empresa 8.4
(5,7] 5 2
Dir.Empresa
Marketing
7.1
3.7
(7,9] 4 2
Marketing 6.7 (9,10] 1 0
Marketing 7.0
Marketing 6.5
Dir.Empresa 5.3
Marketing 8.6
Marketing 4.9
Marketing 5.0
Dir.Empresa 6.3

Tema 2: Estadı́stica Bivariante de datos 10 / 41


Tabla de contingencia Distribución condicionada

Tabla de contingencia (cuantitativa vs. cuantitativa)

Estatura 164 175 165 170 178 157 167 172 177 160
Peso 53 62 48 60 52 63 54 60 55 70

Estatura 168 160 164 174 170 182 161 171 173 193
Peso 63 51 50 80 65 63 60 62 63 86

Tema 2: Estadı́stica Bivariante de datos 11 / 41


Tabla de contingencia Distribución condicionada

Tabla de contingencia (cuantitativa vs. cuantitativa)

Estatura 164 175 165 170 178 157 167 172 177 160
Peso 53 62 48 60 52 63 54 60 55 70

Estatura 168 160 164 174 170 182 161 171 173 193
Peso 63 51 50 80 65 63 60 62 63 86

La tabla de doble entrada que resume estos datos es:

Estatura \ Peso [45,55[ [55,65[ [65,75[ [75,85[ [85,95[


[150,160[ 1
[160,170[ 5 4 1 1
[170,180[ 1 4 1
[180,190[ 1
[190,200[ 1

Tema 2: Estadı́stica Bivariante de datos 11 / 41


Análisis bivariante de datos

Contenido

1 Tabla de contingencia
Distribución marginal
Distribución condicionada

2 Análisis bivariante de datos


Diagrama de dispersión. Covarianza
Coeficiente de correlación.
Mı́nimos cuadrados: recta de regresión

Tema 2: Estadı́stica Bivariante de datos 12 / 41


Análisis bivariante de datos Diagrama de dispersión. Covarianza

Contenido

1 Tabla de contingencia
Distribución marginal
Distribución condicionada

2 Análisis bivariante de datos


Diagrama de dispersión. Covarianza
Coeficiente de correlación.
Mı́nimos cuadrados: recta de regresión

Tema 2: Estadı́stica Bivariante de datos 13 / 41


Análisis bivariante de datos Diagrama de dispersión. Covarianza

Diagrama de dispersión
La distribución conjunta de dos variables continuas se representa un
diagrama de dispersión.
Se representa cada par de datos con un punto en el plano (cartesiano).

10.9 4.2 2.9 4.5 10.0 ●



14.9 5.5 19.6 10.1 ●

9.8 -0.5 13.8 5 ● ●
●●

22 7.4 13.9 4.8 7.5 ● ●●

15.6 7.5 18.7 9.6 ●


9.9 8 18.1 8.9 beneficios



● ●
5.0 ●

16.4 6.3 17 4.7 ●

17.7 8.2 18.6 5.3


16.9 6.6 17.9 8.3 2.5

12.5 0.9 14.4 8.1 ●


21.6 7.4 4.1 1.3 ●

15.9 5.2 17.1 9.5 0.0


5 10 15 20
producción

Tema 2: Estadı́stica Bivariante de datos 14 / 41


Análisis bivariante de datos Diagrama de dispersión. Covarianza

Covarianza

1 Para tabla de doble entrada:


r c
1 XX
cov (X , Y ) = SXY = (xi − x)(yj − y )fi,j
n−1
i=1 j=1

r = número de filas, c = número de columnas y n = tamaño de la


muestra.

Tema 2: Estadı́stica Bivariante de datos 15 / 41


Análisis bivariante de datos Diagrama de dispersión. Covarianza

Covarianza

1 Para tabla de doble entrada:


r c
1 XX
cov (X , Y ) = SXY = (xi − x)(yj − y )fi,j
n−1
i=1 j=1

r = número de filas, c = número de columnas y n = tamaño de la


muestra.

2 Para distribución conjunta de dos variables:


n
1 X
cov (X , Y ) = SXY = (xi − x)(yi − y ),
n−1
i=1

Tema 2: Estadı́stica Bivariante de datos 15 / 41


Análisis bivariante de datos Diagrama de dispersión. Covarianza

Covarianza

Ejemplo

x\y 0 1
0 5 3 8 x̄ =
1 4 2 6 ȳ =
9 5

cov (x, y )

Tema 2: Estadı́stica Bivariante de datos 16 / 41


Análisis bivariante de datos Diagrama de dispersión. Covarianza

Covarianza

Ejemplo

x\y 0 1
0 5 3 8 x̄ = 6/14
1 4 2 6 ȳ =
9 5

cov (x, y )

Tema 2: Estadı́stica Bivariante de datos 16 / 41


Análisis bivariante de datos Diagrama de dispersión. Covarianza

Covarianza

Ejemplo

x\y 0 1
0 5 3 8 x̄ = 6/14
1 4 2 6 ȳ = 5/14
9 5

cov (x, y )

Tema 2: Estadı́stica Bivariante de datos 16 / 41


Análisis bivariante de datos Diagrama de dispersión. Covarianza

Covarianza

Ejemplo

x\y 0 1
0 5 3 8 x̄ = 6/14
1 4 2 6 ȳ = 5/14
9 5

cov (x, y )

Tema 2: Estadı́stica Bivariante de datos 16 / 41


Análisis bivariante de datos Diagrama de dispersión. Covarianza

Covarianza

Ejemplo

x\y 0 1
0 5 3 8 x̄ = 6/14
1 4 2 6 ȳ = 5/14
9 5

1
cov (x, y ) = ((0 − 6/14) · (0 − 5/14) · 5 + (0 − 6/14) · (1 − 5/14) · 3+
14 − 1
(1 − 6/14) · (0 − 5/14) · 4 + (1 − 6/14) · (1 − 5/14) · 2))
= −0.01098901

Tema 2: Estadı́stica Bivariante de datos 16 / 41


Análisis bivariante de datos Diagrama de dispersión. Covarianza

Gráfico de dispersión variables independientes

10

20

5
y

y
10

0
−5

−4 −2 0 2 4 −4 −2 0 2 4
x x

Tema 2: Estadı́stica Bivariante de datos 17 / 41


Análisis bivariante de datos Diagrama de dispersión. Covarianza

Gráfico de dispersión con relación lineal

50

125

100
45

75
y

y
40

50

35
25

0 10 20 30 40 20 25 30 35 40
x x

Relación lineal positiva (applet) Relación lineal negativa

Tema 2: Estadı́stica Bivariante de datos 18 / 41


Análisis bivariante de datos Diagrama de dispersión. Covarianza

Gráfico de dispersión con relación no lineal

15

10
y

−4 −2 0 2 4
x

Tema 2: Estadı́stica Bivariante de datos 19 / 41


Análisis bivariante de datos Coeficiente de correlación.

Contenido

1 Tabla de contingencia
Distribución marginal
Distribución condicionada

2 Análisis bivariante de datos


Diagrama de dispersión. Covarianza
Coeficiente de correlación.
Mı́nimos cuadrados: recta de regresión

Tema 2: Estadı́stica Bivariante de datos 20 / 41


Análisis bivariante de datos Coeficiente de correlación.

Coeficiente de correlación LINEAL


Definición
El coeficiente de correlación lineal, r , se calcula como:

SXY
r= ,
SX SY
donde SXY es la covarianza entre las dos variables y SX y SY son las
desviaciones tı́picas muestrales de X e Y , respectivamente.

Comentarios
r cerca de +1 ⇒ los datos están cerca de una recta ascendente (una
relación lineal positiva).

Tema 2: Estadı́stica Bivariante de datos 21 / 41


Análisis bivariante de datos Coeficiente de correlación.

Coeficiente de correlación LINEAL


Definición
El coeficiente de correlación lineal, r , se calcula como:

SXY
r= ,
SX SY
donde SXY es la covarianza entre las dos variables y SX y SY son las
desviaciones tı́picas muestrales de X e Y , respectivamente.

Comentarios
r cerca de +1 ⇒ los datos están cerca de una recta ascendente (una
relación lineal positiva).
r cerca de −1 ⇒ los datos están cerca de una recta descendente
(relación lineal negativa).

Tema 2: Estadı́stica Bivariante de datos 21 / 41


Análisis bivariante de datos Coeficiente de correlación.

Coeficiente de correlación LINEAL


Definición
El coeficiente de correlación lineal, r , se calcula como:

SXY
r= ,
SX SY
donde SXY es la covarianza entre las dos variables y SX y SY son las
desviaciones tı́picas muestrales de X e Y , respectivamente.

Comentarios
r cerca de +1 ⇒ los datos están cerca de una recta ascendente (una
relación lineal positiva).
r cerca de −1 ⇒ los datos están cerca de una recta descendente
(relación lineal negativa).
Cuando r = 0, no existe ninguna relación lineal entre X e Y .

Tema 2: Estadı́stica Bivariante de datos 21 / 41


Análisis bivariante de datos Coeficiente de correlación.

Coeficiente de correlación LINEAL


Definición
El coeficiente de correlación lineal, r , se calcula como:

SXY
r= ,
SX SY
donde SXY es la covarianza entre las dos variables y SX y SY son las
desviaciones tı́picas muestrales de X e Y , respectivamente.

Comentarios
r cerca de +1 ⇒ los datos están cerca de una recta ascendente (una
relación lineal positiva).
r cerca de −1 ⇒ los datos están cerca de una recta descendente
(relación lineal negativa).
Cuando r = 0, no existe ninguna relación lineal entre X e Y .
En la práctica, existe relación lineal, si |r | ≥ √2
n

Tema 2: Estadı́stica Bivariante de datos 21 / 41


Análisis bivariante de datos Coeficiente de correlación.

Ejemplos del coeficiente de correlación

Una compañı́a de seguros considera que el número de accidentes (y ) ,


puede relacionarse con el número de vehı́culos (x) que circulan por ella a
más de 120 km/h. Durante 5 dı́as obtuvo los siguientes resultados:

Accidentes 5 7 2 1 9
Vehı́culos 15 18 10 8 20

Calcula el coeficiente de correlación


lineal.

Tema 2: Estadı́stica Bivariante de datos 22 / 41


Análisis bivariante de datos Coeficiente de correlación.

Ejemplos del coeficiente de correlación

Una compañı́a de seguros considera que el número de accidentes (y ) ,


puede relacionarse con el número de vehı́culos (x) que circulan por ella a
más de 120 km/h. Durante 5 dı́as obtuvo los siguientes resultados:

Accidentes 5 7 2 1 9
Vehı́culos 15 18 10 8 20
SXY
Calcula el coeficiente de correlación r= = 0.995
SX SY
lineal.

2
1 X
n |0.995| ≥ √ ∼= 0.89442
SXY = (xi −x)(yi −y ) = 13.64 5
n−1
i=1

(asociación lineal positiva)

Tema 2: Estadı́stica Bivariante de datos 22 / 41


Análisis bivariante de datos Coeficiente de correlación.

Ejemplo

xi yi (xi − x) (xi − x)2 (yi − y ) (yi − y )2 (xi − x)(yi − y )


9.7 9
8.6 8.9
7.1 5.3
9.8 9.4
1.2 1.6
36.4 34.2

Tema 2: Estadı́stica Bivariante de datos 23 / 41


Análisis bivariante de datos Coeficiente de correlación.

Ejemplo

xi yi (xi − x) (xi − x)2 (yi − y ) (yi − y )2 (xi − x)(yi − y )


9.7 9
8.6 8.9
7.1 5.3
9.8 9.4
1.2 1.6
36.4 34.2

x̄ = 7.28 y ȳ = 6.84

Tema 2: Estadı́stica Bivariante de datos 23 / 41


Análisis bivariante de datos Coeficiente de correlación.

Ejemplo

xi yi (xi − x) (xi − x)2 (yi − y ) (yi − y )2 (xi − x)(yi − y )


9.7 9 2.42 5.8564
8.6 8.9 1.32 1.7424
7.1 5.3 -0.18 0.0324
9.8 9.4 2.52 6.3504
1.2 1.6 -6.08 36.9664
36.4 34.2 50.948

x̄ = 7.28 y ȳ = 6.84

Sx2 = n−1
1
(xi − x̄)2 = 41 50.948 = 12.737 y Sx = 12.737 = 3.5688
P

Tema 2: Estadı́stica Bivariante de datos 23 / 41


Análisis bivariante de datos Coeficiente de correlación.

Ejemplo

xi yi (xi − x) (xi − x)2 (yi − y ) (yi − y )2 (xi − x)(yi − y )


9.7 9 2.42 5.8564 2.16 4.6656
8.6 8.9 1.32 1.7424 2.06 4.2436
7.1 5.3 -0.18 0.0324 -1.54 2.3716
9.8 9.4 2.52 6.3504 2.56 6.5536
1.2 1.6 -6.08 36.9664 -5.24 27.4576
36.4 34.2 50.948 45.292

x̄ = 7.28 y ȳ = 6.84

Sx2 = n−1
1
(xi − x̄)2 = 41 50.948 = 12.737 y Sx = 12.737 = 3.5688
P


Sy2 = n−1
1
(yi − ȳ )2 = 41 45.292 = 11.323 y Sy = 11.323 = 3.364967
P

Tema 2: Estadı́stica Bivariante de datos 23 / 41


Análisis bivariante de datos Coeficiente de correlación.

Ejemplo

xi yi (xi − x) (xi − x)2 (yi − y ) (yi − y )2 (xi − x)(yi − y )


9.7 9 2.42 5.8564 2.16 4.6656 5.2272
8.6 8.9 1.32 1.7424 2.06 4.2436 2.7192
7.1 5.3 -0.18 0.0324 -1.54 2.3716 0.2772
9.8 9.4 2.52 6.3504 2.56 6.5536 6.4512
1.2 1.6 -6.08 36.9664 -5.24 27.4576 31.8592
36.4 34.2 50.948 45.292 46.534

x̄ = 7.28 y ȳ = 6.84

Sx2 = n−1
1
(xi − x̄)2 = 41 50.948 = 12.737 y Sx = 12.737 = 3.5688
P


Sy2 = n−1
1
(yi − ȳ )2 = 41 45.292 = 11.323 y Sy = 11.323 = 3.364967
P

1
(xi − x̄)(yi − ȳ ) = 14 46.534 = 11.6335
P
Sxy = n−1

Tema 2: Estadı́stica Bivariante de datos 23 / 41


Análisis bivariante de datos Coeficiente de correlación.

Ejemplo

xi yi (xi − x) (xi − x)2 (yi − y ) (yi − y )2 (xi − x)(yi − y )


9.7 9 2.42 5.8564 2.16 4.6656 5.2272
8.6 8.9 1.32 1.7424 2.06 4.2436 2.7192
7.1 5.3 -0.18 0.0324 -1.54 2.3716 0.2772
9.8 9.4 2.52 6.3504 2.56 6.5536 6.4512
1.2 1.6 -6.08 36.9664 -5.24 27.4576 31.8592
36.4 34.2 50.948 45.292 46.534

x̄ = 7.28 y ȳ = 6.84

Sx2 = n−1
1
(xi − x̄)2 = 41 50.948 = 12.737 y Sx = 12.737 = 3.5688
P


Sy2 = n−1
1
(yi − ȳ )2 = 41 45.292 = 11.323 y Sy = 11.323 = 3.364967
P

1
(xi − x̄)(yi − ȳ ) = 14 46.534 = 11.6335
P
Sxy = n−1
Sxy 11.6335
r= = = 0.9687151
Sx Sy 3.5688 · 3.364967

Tema 2: Estadı́stica Bivariante de datos 23 / 41


Análisis bivariante de datos Coeficiente de correlación.

Ejemplo
Ejemplo Pág 42 manual
Risin Hills Manufacturing Inc. desea estudiar la relación entre el
número de trabajadores y mesas producidas

Datos

Tema 2: Estadı́stica Bivariante de datos 24 / 41


Análisis bivariante de datos Coeficiente de correlación.

Ejemplo
Ejemplo Pág 42 manual
Risin Hills Manufacturing Inc. desea estudiar la relación entre el
número de trabajadores y mesas producidas
La empresa ha tomado una muestra aleatoria de 10 horas de
producción.

Datos

Tema 2: Estadı́stica Bivariante de datos 24 / 41


Análisis bivariante de datos Coeficiente de correlación.

Ejemplo
Ejemplo Pág 42 manual
Risin Hills Manufacturing Inc. desea estudiar la relación entre el
número de trabajadores y mesas producidas
La empresa ha tomado una muestra aleatoria de 10 horas de
producción.
Analiza brevemente la relación entre el número de trabajadores y el
número de mesas producidas por hora.

Datos

Tema 2: Estadı́stica Bivariante de datos 24 / 41


Análisis bivariante de datos Coeficiente de correlación.

Ejemplo
Ejemplo Pág 42 manual
Risin Hills Manufacturing Inc. desea estudiar la relación entre el
número de trabajadores y mesas producidas
La empresa ha tomado una muestra aleatoria de 10 horas de
producción.
Analiza brevemente la relación entre el número de trabajadores y el
número de mesas producidas por hora.
En la tabla se muestran las observaciones recogidas.

Datos

Tema 2: Estadı́stica Bivariante de datos 24 / 41


Análisis bivariante de datos Coeficiente de correlación.

Ejemplo
Ejemplo Pág 42 manual
Risin Hills Manufacturing Inc. desea estudiar la relación entre el
número de trabajadores y mesas producidas
La empresa ha tomado una muestra aleatoria de 10 horas de
producción.
Analiza brevemente la relación entre el número de trabajadores y el
número de mesas producidas por hora.
En la tabla se muestran las observaciones recogidas.

Datos
Llamamos x: número de trabajadores.

Tema 2: Estadı́stica Bivariante de datos 24 / 41


Análisis bivariante de datos Coeficiente de correlación.

Ejemplo
Ejemplo Pág 42 manual
Risin Hills Manufacturing Inc. desea estudiar la relación entre el
número de trabajadores y mesas producidas
La empresa ha tomado una muestra aleatoria de 10 horas de
producción.
Analiza brevemente la relación entre el número de trabajadores y el
número de mesas producidas por hora.
En la tabla se muestran las observaciones recogidas.

Datos
Llamamos x: número de trabajadores.
Llamamos y : número de mesas producidas, Y , en su planta de
Redwood Falls.

Tema 2: Estadı́stica Bivariante de datos 24 / 41


Análisis bivariante de datos Coeficiente de correlación.

Ejemplo
Ejemplo Pág 42 manual
Risin Hills Manufacturing Inc. desea estudiar la relación entre el
número de trabajadores y mesas producidas
La empresa ha tomado una muestra aleatoria de 10 horas de
producción.
Analiza brevemente la relación entre el número de trabajadores y el
número de mesas producidas por hora.
En la tabla se muestran las observaciones recogidas.

Datos
Llamamos x: número de trabajadores.
Llamamos y : número de mesas producidas, Y , en su planta de
Redwood Falls.
Muestra 10h de producción
Tema 2: Estadı́stica Bivariante de datos 24 / 41
Análisis bivariante de datos Coeficiente de correlación.

Ejemplo: Solución

xi yi (xi − x) (xi − x)2 (yi − y ) (yi − y )2 (xi − x)(yi − y )


12 20 -9.3 86.49 -21.2 449.44 197.16
30 60 8.7 75.69 18.8 353.44 163.56
15 27 -6.3 39.69 -14.2 201.64 89.46
24 50 2.7 7.29 8.8 77.44 23.76
14 21 -7.3 53.29 -20.2 408.04 147.46
18 30 -3.3 10.89 -11.2 125.44 36.96
28 61 6.7 44.89 19.8 392.04 132.66
26 54 4.7 22.09 12.8 163.84 60.16
19 32 -2.3 5.29 -9.2 84.64 21.16
27 57 5.7 32.49 15.8 249.64 90.06
213 412 378.1 2505.6 962.4

n
1 X SXY
SXY = (xi − x)(yi − y ) = r= =
n − 1 i=1 SX SY
106.93
962.4 √ √ = 0.989
= 106.93 42.01 278.4
9
Tema 2: Estadı́stica Bivariante de datos 25 / 41
Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

Contenido

1 Tabla de contingencia
Distribución marginal
Distribución condicionada

2 Análisis bivariante de datos


Diagrama de dispersión. Covarianza
Coeficiente de correlación.
Mı́nimos cuadrados: recta de regresión

Tema 2: Estadı́stica Bivariante de datos 26 / 41


Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

¿Qué es una función?

Explicar un fenómeno a
partir de los factores que
intervienen, a través de
una relación matemática.

Tema 2: Estadı́stica Bivariante de datos 27 / 41


Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

¿Qué es una función?

Explicar un fenómeno a
partir de los factores que
intervienen, a través de
una relación matemática.

Las entrada es variables


independiente (x) y la
variable explicada es la
salida (y )

Tema 2: Estadı́stica Bivariante de datos 27 / 41


Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

¿Qué es una función?

Explicar un fenómeno a
partir de los factores que
intervienen, a través de
una relación matemática.

Las entrada es variables


independiente (x) y la
variable explicada es la
salida (y )
y = f (x).

Tema 2: Estadı́stica Bivariante de datos 27 / 41


Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

Intuición

10.0 ●

● ●

●●
● ●
7.5 ● ●●



beneficios

● ●
5.0 ●
● ●

2.5


0.0

5 10 15 20
producción
Tema 2: Estadı́stica Bivariante de datos 28 / 41
Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

Mı́nimos cuadrados
Deseamos encontrar unos valores b1 y b0 tal que la fórmula

yb = b0 + b1 x

se verifique en los puntos (xi , yi ) con el menor error de predicción. El


criterio usado se denomina mı́nimos cuadrados.
 Pn 2
i=1 [yi − (b1 xi + b0 )]
mı́n
n

Tema 2: Estadı́stica Bivariante de datos 29 / 41


Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

Mı́nimos cuadrados
Deseamos encontrar unos valores b1 y b0 tal que la fórmula

yb = b0 + b1 x

se verifique en los puntos (xi , yi ) con el menor error de predicción. El


criterio usado se denomina mı́nimos cuadrados.
 Pn 2
i=1 [yi − (b1 xi + b0 )]
mı́n
n

error de predicción = valor observado - valor previsto

Tema 2: Estadı́stica Bivariante de datos 29 / 41


Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

Mı́nimos cuadrados
Deseamos encontrar unos valores b1 y b0 tal que la fórmula

yb = b0 + b1 x

se verifique en los puntos (xi , yi ) con el menor error de predicción. El


criterio usado se denomina mı́nimos cuadrados.
 Pn 2
i=1 [yi − (b1 xi + b0 )]
mı́n
n

error de predicción = valor observado - valor previsto


2
SXY
Coeficiente de determinación: r 2 = Proporción que la variable
SX2 SY2
dependiente (y ) que es explicada a través de su relación con las variable
independiente (x).
Tema 2: Estadı́stica Bivariante de datos 29 / 41
Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

Gráfica para ajuste por mı́nimos cuadrados.

10.0 ●

● ●

●●
● ●
7.5 ● ●●



beneficios

● ●
5.0 ●
● ●

2.5


0.0

5 10 15 20
producción
Tema 2: Estadı́stica Bivariante de datos 30 / 41
Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

Gráfica para ajuste por mı́nimos cuadrados.

10.0 ●

● ●

●●
● ●
7.5 ● ●●



beneficios

● ●
5.0 ●
● ●

2.5


0.0

5 10 15 20
producción
Tema 2: Estadı́stica Bivariante de datos 30 / 41
Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

Gráfica para ajuste por mı́nimos cuadrados.

10.0 ●

● ●

●●
● ●
7.5 ● ●●



beneficios

● ●
5.0 ●
● ●

2.5


0.0

5 10 15 20
producción
Tema 2: Estadı́stica Bivariante de datos 30 / 41
Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

Gráfica para ajuste por mı́nimos cuadrados.

10.0 ●

● ●

●●
● ●
7.5 ● ●●



beneficios

● ●
5.0 ●
● ●

2.5


0.0

5 10 15 20
producción
Tema 2: Estadı́stica Bivariante de datos 30 / 41
Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

Coeficientes de la recta de regresión

cov(x, y ) sy
b1 = 2
=r ,
sx sx

b0 = y − b1 x

Tema 2: Estadı́stica Bivariante de datos 31 / 41


Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

Ejemplo de recta de regresión

i xi yi xi − x̄ (xi − x̄)2 yi − ȳ (yi − ȳ )2 (xi − x̄)(yi − ȳ )


1 101.21 16.38
2 125.51 32.64
3 94.93 21.66
4 167.86 50.02
5 129.89 30.43
P
619.4 151.13

P P
xi yi
x̄ = = 123.88 ȳ = = 30.23
n n

Tema 2: Estadı́stica Bivariante de datos 32 / 41


Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

Ejemplo de recta de regresión

i xi yi xi − x̄ (xi − x̄)2 yi − ȳ (yi − ȳ )2 (xi − x̄)(yi − ȳ )


1 101.21 16.38 -22.67 513.93 -13.85 191.71 313.89
2 125.51 32.64 1.63 2.66 2.41 5.83 3.93
3 94.93 21.66 -28.95 838.1 -8.57 73.38 247.99
4 167.86 50.02 43.98 1934.24 19.79 391.8 870.54
5 129.89 30.43 6.01 36.12 0.2 0.04 1.23
P
619.4 151.13

P P
xi yi
x̄ = = 123.88 ȳ = = 30.23
n n

Tema 2: Estadı́stica Bivariante de datos 32 / 41


Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

Ejemplo de recta de regresión

i xi yi xi − x̄ (xi − x̄)2 yi − ȳ (yi − ȳ )2 (xi − x̄)(yi − ȳ )


1 101.21 16.38 -22.67 513.93 -13.85 191.71 313.89
2 125.51 32.64 1.63 2.66 2.41 5.83 3.93
3 94.93 21.66 -28.95 838.1 -8.57 73.38 247.99
4 167.86 50.02 43.98 1934.24 19.79 391.8 870.54
5 129.89 30.43 6.01 36.12 0.2 0.04 1.23
P
619.4 151.13 3325.04 662.76 1437.58

P P
xi yi
x̄ = = 123.88 ȳ = = 30.23
n n

Tema 2: Estadı́stica Bivariante de datos 32 / 41


Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

Ejemplo de recta de regresión

i xi yi xi − x̄ (xi − x̄)2 yi − ȳ (yi − ȳ )2 (xi − x̄)(yi − ȳ )


P
619.4 151.13 3325.04 662.76 1437.58

P P
xi yi
x̄ = = 123.88 ȳ = = 30.23
n n
(xi − x̄)2 √
P
3325.04
sx2 = = = 831.26 sx = 831.26 = 28.83
n−1 4
(yi − ȳ )2 √
P
662.76
sy2 = = = 165.69 sy = 165.69 = 12.87
n−1 4
P
(xi − x̄)(yi − ȳ ) 1437.58 sxy 359.40
sxy = = = 359.40 r= = = 0.97
n−1 4 sx sy 28.83 · 12.87
b1 = rsy /sx = 0.97 · 12.87/28.83 = 0.43 b0 = ȳ − b1 x̄ = −23.4

La recta de regresión es y = 0.43x − 23.04

Tema 2: Estadı́stica Bivariante de datos 33 / 41


Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

Gráfica de la solución encontrada

50 ●

40
beneficios

30 ●


20

110 130 150 170


producción
Tema 2: Estadı́stica Bivariante de datos 34 / 41
Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

Un ejemplo con más datos


x y
106.63 24.15 ●
83.82 14.75 ●
121.23 43.95 50

139.18 52.3
96.4 14.48 ●
108.44 36.76
40
105.72 34.98
beneficios
141.59 55.2 ●

119.44 21.2
78.81 19.42 30

La recta de regresión
es ●


20
y = 0.62x − 36.66 ●

● ●
Coeff. Correlación
80 100 120 140
r = 0.85 producción

Tema 2: Estadı́stica Bivariante de datos 35 / 41


Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

Sensibilidad a datos atı́picos (heterogeneidad)


x y
106.63 24.15
83.82 14.75 100 ●

121.23 43.95
139.18 52.3
96.4 14.48
108.44 36.76 75

105.72 34.98
141.59 55.2
beneficios

119.44 21.2 ●

50
78.81 19.42

10 100

La recta de regresión ●

es
25 ●


y = −0.29x + 67.09 ● ●

Tema 2: Estadı́stica Bivariante 50de datos 100


36 / 41
Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

Heterogeneidad por grupos con diferentes caracterı́sticas


Dos grupos cuyo coeficiente
puede ser cercano a uno, al

unirse puede resultar un número
pequeño.
x y
100
92.63 79.49
76.74 65.99
93.3 79.07
92.72 79.03
84.15 72.17
90
64.6 76.47 ●

beneficios
70.71 81.69

77.05 86.19
79.94 89.17
104.05 107.62 ●
80
El primer grupo tiene un ●
●●


coeficiente de correlación de

r1 = 0.998 y el segundo grupo 70

r2 = 0.999. Sin embargo, los dos



grupos tienen un coeficiente 70 80 90 100
producción
r = 0.50

Tema 2: Estadı́stica Bivariante de datos 37 / 41


Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

Causalidad y correlación

Curva de Phillips
Estudios
Advertencia cuantitativos
Un coeficiente de relacionaron que a
correlación cercano a 1 o mayor inflacción
-1 no significa que una hay menor
variable sea la causa de la desempleo.
otra, sino que los datos Polı́ticas
existentes se ajustan. inflaccionistas nos
Puede que la causa de hicieron enseñar
dichos valores dependan que la inflacción
de otras variables. no reduce el
Fuente: Wikipedia. Del artı́culo
desempleo.
original de Phillips (1955)

Tema 2: Estadı́stica Bivariante de datos 38 / 41


Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

Datos actuales más claros

Tema 2: Estadı́stica Bivariante de datos 39 / 41


Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión

En prácticas

Atención
En prácticas veréis una ampliación de la regresión lineal: regresión
multilineal

Tema 2: Estadı́stica Bivariante de datos 40 / 41

También podría gustarte