Documentos de Académico
Documentos de Profesional
Documentos de Cultura
TEMA2
TEMA2
1 Tabla de contingencia
Distribución marginal
Distribución condicionada
Contenido
1 Tabla de contingencia
Distribución marginal
Distribución condicionada
Tabla de contingencia
Tabla de contingencia
Propiedad Bajo
Hipoteca Medio
Propiedad Medio
Alquiler Alto
Propiedad Alto
Alquiler Medio
Hipoteca Medio
Hipoteca Medio
Propiedad Alto
Propiedad Bajo
Hipoteca Medio
Hipoteca Bajo
Alquiler Alto
Hipoteca Alto
Hipoteca Medio
Propiedad Bajo
Propiedad Medio
Hipoteca Alto
Hipoteca Alto
Propiedad Medio
Tabla de contingencia
Tabla de contingencia
Tabla de contingencia
Tabla de contingencia
Tabla de contingencia
Tabla de contingencia
Tabla de contingencia
Tabla de contingencia
Tabla de contingencia
Tabla de contingencia
http://www.rtve.es/deportes/juegos-olimpicos-invierno/medallero
Contenido
1 Tabla de contingencia
Distribución marginal
Distribución condicionada
Distribuciones marginales
Distribuciones marginales. es la suma de las frecuencias conjuntas para uno de las dos
variables.
Distribuciones marginales
Distribuciones marginales. es la suma de las frecuencias conjuntas para uno de las dos
variables.
Ejemplo
Distribución de la variable X
c
X SES (Status
fi,• = fi,j socio–económico) (Y)
j=1 Vivienda (X) Bajo Medio Alto
Alquiler 0 1 2
Hipoteca 1 5 3
Propiedad 3 3 2
Distribuciones marginales
Distribuciones marginales. es la suma de las frecuencias conjuntas para uno de las dos
variables.
Ejemplo
Distribución de la variable X
c
X SES (Status
fi,• = fi,j socio–económico) (Y)
j=1 Vivienda (X) Bajo Medio Alto
Alquiler 0 1 2 3
Hipoteca 1 5 3 9
Propiedad 3 3 2 8
Distribuciones marginales
Distribuciones marginales. es la suma de las frecuencias conjuntas para uno de las dos
variables.
Ejemplo
Distribución de la variable X
c
X SES (Status
fi,• = fi,j socio–económico) (Y)
j=1 Vivienda (X) Bajo Medio Alto
Alquiler 0 1 2 3
Distribución de la variable Y . Hipoteca 1 5 3 9
Propiedad 3 3 2 8
r
X
f•,j = fi,j
i=1
Distribuciones marginales
Distribuciones marginales. es la suma de las frecuencias conjuntas para uno de las dos
variables.
Ejemplo
Distribución de la variable X
c
X SES (Status
fi,• = fi,j socio–económico) (Y)
j=1 Vivienda (X) Bajo Medio Alto
Alquiler 0 1 2 3
Distribución de la variable Y . Hipoteca 1 5 3 9
Propiedad 3 3 2 8
r
X 4 9 7
f•,j = fi,j
i=1
Distribuciones marginales
Distribuciones marginales. es la suma de las frecuencias conjuntas para uno de las dos
variables.
Ejemplo
Distribución de la variable X
c
X SES (Status
fi,• = fi,j socio–económico) (Y)
j=1 Vivienda (X) Bajo Medio Alto
Alquiler 0 1 2 3
Distribución de la variable Y . Hipoteca 1 5 3 9
Propiedad 3 3 2 8
r
X 4 9 7
f•,j = fi,j
i=1
f•,Alto =
Distribuciones marginales
Distribuciones marginales. es la suma de las frecuencias conjuntas para uno de las dos
variables.
Ejemplo
Distribución de la variable X
c
X SES (Status
fi,• = fi,j socio–económico) (Y)
j=1 Vivienda (X) Bajo Medio Alto
Alquiler 0 1 2 3
Distribución de la variable Y . Hipoteca 1 5 3 9
Propiedad 3 3 2 8
r
X 4 9 7
f•,j = fi,j
i=1
f•,Alto = 7
Contenido
1 Tabla de contingencia
Distribución marginal
Distribución condicionada
Distribuciones condicionadas
Distribuciones condicionadas
Ejemplo
Distribuciones condicionadas
Ejemplo
Distribuciones condicionadas
Ejemplo
Distribuciones condicionadas
Ejemplo
Grado Nota
Marketing 3.3
Marketing 5.6
Marketing 9.2
Marketing 8.9
Marketing 6.0
Dir.Empresa 5.0
Dir.Empresa 7.4
Marketing 8.4
Dir.Empresa 3.9
Dir.Empresa 8.4
Dir.Empresa 7.1
Marketing 3.7
Marketing 6.7
Marketing 7.0
Marketing 6.5
Dir.Empresa 5.3
Marketing 8.6
Marketing 4.9
Marketing 5.0
Dir.Empresa 6.3
Grado Nota
Marketing 3.3
Marketing 5.6
Marketing 9.2
Marketing 8.9
Marketing 6.0
Dir.Empresa 5.0 Dir. Empresa Marketing
Dir.Empresa 7.4
Marketing 8.4
(3,5] 2 4
Dir.Empresa 3.9
Dir.Empresa 8.4
(5,7] 5 2
Dir.Empresa
Marketing
7.1
3.7
(7,9] 4 2
Marketing 6.7 (9,10] 1 0
Marketing 7.0
Marketing 6.5
Dir.Empresa 5.3
Marketing 8.6
Marketing 4.9
Marketing 5.0
Dir.Empresa 6.3
Estatura 164 175 165 170 178 157 167 172 177 160
Peso 53 62 48 60 52 63 54 60 55 70
Estatura 168 160 164 174 170 182 161 171 173 193
Peso 63 51 50 80 65 63 60 62 63 86
Estatura 164 175 165 170 178 157 167 172 177 160
Peso 53 62 48 60 52 63 54 60 55 70
Estatura 168 160 164 174 170 182 161 171 173 193
Peso 63 51 50 80 65 63 60 62 63 86
Contenido
1 Tabla de contingencia
Distribución marginal
Distribución condicionada
Contenido
1 Tabla de contingencia
Distribución marginal
Distribución condicionada
Diagrama de dispersión
La distribución conjunta de dos variables continuas se representa un
diagrama de dispersión.
Se representa cada par de datos con un punto en el plano (cartesiano).
5 10 15 20
producción
Covarianza
Covarianza
Covarianza
Ejemplo
x\y 0 1
0 5 3 8 x̄ =
1 4 2 6 ȳ =
9 5
cov (x, y )
Covarianza
Ejemplo
x\y 0 1
0 5 3 8 x̄ = 6/14
1 4 2 6 ȳ =
9 5
cov (x, y )
Covarianza
Ejemplo
x\y 0 1
0 5 3 8 x̄ = 6/14
1 4 2 6 ȳ = 5/14
9 5
cov (x, y )
Covarianza
Ejemplo
x\y 0 1
0 5 3 8 x̄ = 6/14
1 4 2 6 ȳ = 5/14
9 5
cov (x, y )
Covarianza
Ejemplo
x\y 0 1
0 5 3 8 x̄ = 6/14
1 4 2 6 ȳ = 5/14
9 5
1
cov (x, y ) = ((0 − 6/14) · (0 − 5/14) · 5 + (0 − 6/14) · (1 − 5/14) · 3+
14 − 1
(1 − 6/14) · (0 − 5/14) · 4 + (1 − 6/14) · (1 − 5/14) · 2))
= −0.01098901
10
20
5
y
y
10
0
−5
−4 −2 0 2 4 −4 −2 0 2 4
x x
50
125
100
45
75
y
y
40
50
35
25
0 10 20 30 40 20 25 30 35 40
x x
15
10
y
−4 −2 0 2 4
x
Contenido
1 Tabla de contingencia
Distribución marginal
Distribución condicionada
SXY
r= ,
SX SY
donde SXY es la covarianza entre las dos variables y SX y SY son las
desviaciones tı́picas muestrales de X e Y , respectivamente.
Comentarios
r cerca de +1 ⇒ los datos están cerca de una recta ascendente (una
relación lineal positiva).
SXY
r= ,
SX SY
donde SXY es la covarianza entre las dos variables y SX y SY son las
desviaciones tı́picas muestrales de X e Y , respectivamente.
Comentarios
r cerca de +1 ⇒ los datos están cerca de una recta ascendente (una
relación lineal positiva).
r cerca de −1 ⇒ los datos están cerca de una recta descendente
(relación lineal negativa).
SXY
r= ,
SX SY
donde SXY es la covarianza entre las dos variables y SX y SY son las
desviaciones tı́picas muestrales de X e Y , respectivamente.
Comentarios
r cerca de +1 ⇒ los datos están cerca de una recta ascendente (una
relación lineal positiva).
r cerca de −1 ⇒ los datos están cerca de una recta descendente
(relación lineal negativa).
Cuando r = 0, no existe ninguna relación lineal entre X e Y .
SXY
r= ,
SX SY
donde SXY es la covarianza entre las dos variables y SX y SY son las
desviaciones tı́picas muestrales de X e Y , respectivamente.
Comentarios
r cerca de +1 ⇒ los datos están cerca de una recta ascendente (una
relación lineal positiva).
r cerca de −1 ⇒ los datos están cerca de una recta descendente
(relación lineal negativa).
Cuando r = 0, no existe ninguna relación lineal entre X e Y .
En la práctica, existe relación lineal, si |r | ≥ √2
n
Accidentes 5 7 2 1 9
Vehı́culos 15 18 10 8 20
Accidentes 5 7 2 1 9
Vehı́culos 15 18 10 8 20
SXY
Calcula el coeficiente de correlación r= = 0.995
SX SY
lineal.
2
1 X
n |0.995| ≥ √ ∼= 0.89442
SXY = (xi −x)(yi −y ) = 13.64 5
n−1
i=1
Ejemplo
Ejemplo
x̄ = 7.28 y ȳ = 6.84
Ejemplo
x̄ = 7.28 y ȳ = 6.84
√
Sx2 = n−1
1
(xi − x̄)2 = 41 50.948 = 12.737 y Sx = 12.737 = 3.5688
P
Ejemplo
x̄ = 7.28 y ȳ = 6.84
√
Sx2 = n−1
1
(xi − x̄)2 = 41 50.948 = 12.737 y Sx = 12.737 = 3.5688
P
√
Sy2 = n−1
1
(yi − ȳ )2 = 41 45.292 = 11.323 y Sy = 11.323 = 3.364967
P
Ejemplo
x̄ = 7.28 y ȳ = 6.84
√
Sx2 = n−1
1
(xi − x̄)2 = 41 50.948 = 12.737 y Sx = 12.737 = 3.5688
P
√
Sy2 = n−1
1
(yi − ȳ )2 = 41 45.292 = 11.323 y Sy = 11.323 = 3.364967
P
1
(xi − x̄)(yi − ȳ ) = 14 46.534 = 11.6335
P
Sxy = n−1
Ejemplo
x̄ = 7.28 y ȳ = 6.84
√
Sx2 = n−1
1
(xi − x̄)2 = 41 50.948 = 12.737 y Sx = 12.737 = 3.5688
P
√
Sy2 = n−1
1
(yi − ȳ )2 = 41 45.292 = 11.323 y Sy = 11.323 = 3.364967
P
1
(xi − x̄)(yi − ȳ ) = 14 46.534 = 11.6335
P
Sxy = n−1
Sxy 11.6335
r= = = 0.9687151
Sx Sy 3.5688 · 3.364967
Ejemplo
Ejemplo Pág 42 manual
Risin Hills Manufacturing Inc. desea estudiar la relación entre el
número de trabajadores y mesas producidas
Datos
Ejemplo
Ejemplo Pág 42 manual
Risin Hills Manufacturing Inc. desea estudiar la relación entre el
número de trabajadores y mesas producidas
La empresa ha tomado una muestra aleatoria de 10 horas de
producción.
Datos
Ejemplo
Ejemplo Pág 42 manual
Risin Hills Manufacturing Inc. desea estudiar la relación entre el
número de trabajadores y mesas producidas
La empresa ha tomado una muestra aleatoria de 10 horas de
producción.
Analiza brevemente la relación entre el número de trabajadores y el
número de mesas producidas por hora.
Datos
Ejemplo
Ejemplo Pág 42 manual
Risin Hills Manufacturing Inc. desea estudiar la relación entre el
número de trabajadores y mesas producidas
La empresa ha tomado una muestra aleatoria de 10 horas de
producción.
Analiza brevemente la relación entre el número de trabajadores y el
número de mesas producidas por hora.
En la tabla se muestran las observaciones recogidas.
Datos
Ejemplo
Ejemplo Pág 42 manual
Risin Hills Manufacturing Inc. desea estudiar la relación entre el
número de trabajadores y mesas producidas
La empresa ha tomado una muestra aleatoria de 10 horas de
producción.
Analiza brevemente la relación entre el número de trabajadores y el
número de mesas producidas por hora.
En la tabla se muestran las observaciones recogidas.
Datos
Llamamos x: número de trabajadores.
Ejemplo
Ejemplo Pág 42 manual
Risin Hills Manufacturing Inc. desea estudiar la relación entre el
número de trabajadores y mesas producidas
La empresa ha tomado una muestra aleatoria de 10 horas de
producción.
Analiza brevemente la relación entre el número de trabajadores y el
número de mesas producidas por hora.
En la tabla se muestran las observaciones recogidas.
Datos
Llamamos x: número de trabajadores.
Llamamos y : número de mesas producidas, Y , en su planta de
Redwood Falls.
Ejemplo
Ejemplo Pág 42 manual
Risin Hills Manufacturing Inc. desea estudiar la relación entre el
número de trabajadores y mesas producidas
La empresa ha tomado una muestra aleatoria de 10 horas de
producción.
Analiza brevemente la relación entre el número de trabajadores y el
número de mesas producidas por hora.
En la tabla se muestran las observaciones recogidas.
Datos
Llamamos x: número de trabajadores.
Llamamos y : número de mesas producidas, Y , en su planta de
Redwood Falls.
Muestra 10h de producción
Tema 2: Estadı́stica Bivariante de datos 24 / 41
Análisis bivariante de datos Coeficiente de correlación.
Ejemplo: Solución
n
1 X SXY
SXY = (xi − x)(yi − y ) = r= =
n − 1 i=1 SX SY
106.93
962.4 √ √ = 0.989
= 106.93 42.01 278.4
9
Tema 2: Estadı́stica Bivariante de datos 25 / 41
Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión
Contenido
1 Tabla de contingencia
Distribución marginal
Distribución condicionada
Explicar un fenómeno a
partir de los factores que
intervienen, a través de
una relación matemática.
Explicar un fenómeno a
partir de los factores que
intervienen, a través de
una relación matemática.
Explicar un fenómeno a
partir de los factores que
intervienen, a través de
una relación matemática.
Intuición
10.0 ●
● ●
●●
● ●
7.5 ● ●●
●
●
●
beneficios
● ●
5.0 ●
● ●
●
●
2.5
●
●
0.0
●
5 10 15 20
producción
Tema 2: Estadı́stica Bivariante de datos 28 / 41
Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión
Mı́nimos cuadrados
Deseamos encontrar unos valores b1 y b0 tal que la fórmula
yb = b0 + b1 x
Mı́nimos cuadrados
Deseamos encontrar unos valores b1 y b0 tal que la fórmula
yb = b0 + b1 x
Mı́nimos cuadrados
Deseamos encontrar unos valores b1 y b0 tal que la fórmula
yb = b0 + b1 x
10.0 ●
● ●
●●
● ●
7.5 ● ●●
●
●
●
beneficios
● ●
5.0 ●
● ●
●
●
2.5
●
●
0.0
●
5 10 15 20
producción
Tema 2: Estadı́stica Bivariante de datos 30 / 41
Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión
10.0 ●
● ●
●●
● ●
7.5 ● ●●
●
●
●
beneficios
● ●
5.0 ●
● ●
●
●
2.5
●
●
0.0
●
5 10 15 20
producción
Tema 2: Estadı́stica Bivariante de datos 30 / 41
Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión
10.0 ●
● ●
●●
● ●
7.5 ● ●●
●
●
●
beneficios
● ●
5.0 ●
● ●
●
●
2.5
●
●
0.0
●
5 10 15 20
producción
Tema 2: Estadı́stica Bivariante de datos 30 / 41
Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión
10.0 ●
● ●
●●
● ●
7.5 ● ●●
●
●
●
beneficios
● ●
5.0 ●
● ●
●
●
2.5
●
●
0.0
●
5 10 15 20
producción
Tema 2: Estadı́stica Bivariante de datos 30 / 41
Análisis bivariante de datos Mı́nimos cuadrados: recta de regresión
cov(x, y ) sy
b1 = 2
=r ,
sx sx
b0 = y − b1 x
P P
xi yi
x̄ = = 123.88 ȳ = = 30.23
n n
P P
xi yi
x̄ = = 123.88 ȳ = = 30.23
n n
P P
xi yi
x̄ = = 123.88 ȳ = = 30.23
n n
P P
xi yi
x̄ = = 123.88 ȳ = = 30.23
n n
(xi − x̄)2 √
P
3325.04
sx2 = = = 831.26 sx = 831.26 = 28.83
n−1 4
(yi − ȳ )2 √
P
662.76
sy2 = = = 165.69 sy = 165.69 = 12.87
n−1 4
P
(xi − x̄)(yi − ȳ ) 1437.58 sxy 359.40
sxy = = = 359.40 r= = = 0.97
n−1 4 sx sy 28.83 · 12.87
b1 = rsy /sx = 0.97 · 12.87/28.83 = 0.43 b0 = ȳ − b1 x̄ = −23.4
50 ●
40
beneficios
30 ●
●
20
139.18 52.3
96.4 14.48 ●
108.44 36.76
40
105.72 34.98
beneficios
141.59 55.2 ●
●
119.44 21.2
78.81 19.42 30
La recta de regresión
es ●
●
20
y = 0.62x − 36.66 ●
● ●
Coeff. Correlación
80 100 120 140
r = 0.85 producción
121.23 43.95
139.18 52.3
96.4 14.48
108.44 36.76 75
105.72 34.98
141.59 55.2
beneficios
119.44 21.2 ●
●
50
78.81 19.42
●
10 100
●
La recta de regresión ●
es
25 ●
●
●
y = −0.29x + 67.09 ● ●
beneficios
70.71 81.69
●
77.05 86.19
79.94 89.17
104.05 107.62 ●
80
El primer grupo tiene un ●
●●
●
coeficiente de correlación de
●
r1 = 0.998 y el segundo grupo 70
Causalidad y correlación
Curva de Phillips
Estudios
Advertencia cuantitativos
Un coeficiente de relacionaron que a
correlación cercano a 1 o mayor inflacción
-1 no significa que una hay menor
variable sea la causa de la desempleo.
otra, sino que los datos Polı́ticas
existentes se ajustan. inflaccionistas nos
Puede que la causa de hicieron enseñar
dichos valores dependan que la inflacción
de otras variables. no reduce el
Fuente: Wikipedia. Del artı́culo
desempleo.
original de Phillips (1955)
En prácticas
Atención
En prácticas veréis una ampliación de la regresión lineal: regresión
multilineal