Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA CONTABILIDAD
BIDIMENSIONAL.
REGRESIÓN Y
CORRELACIÓN
f. j
b) Con relación al total de fila : h. j =
n
f ij
c) Con relación al total de columna : hij =
n
25
21.3
20
16.0
Frecuencia (%)
15
10.7 10.7
9.3 9.3
10 8.0 8.0
6.7
0
Costa Sierra Selva
(f − eij )
k l
2
El estadístico se define como: ij
2 = i =1 j =1
Donde: eij
fij : son las frecuencias observadas de la muestra
eij : son las frecuencias esperadas , se obtiene ( f )( f . j )
eij = i.
k: número de categorías de la variable en fila n
l: número de categorías de la variable en columna
x i f
a) Media o promedio de la variable X : x= i=1
i. n
l
l
d) Varianza de la variable Y : f.j (yi − y)2
S2y = j=1
n
f
ij
Cov (x, y ) = i =1 j =1
n
c) Coeficiente de correlación de Pearson (R): mide el grado de
asociación lineal entre las variables X e Y
cov(X ,Y )
R= Donde : −1 R 1
S xS y
Estatura en Peso en kg
cm [50, 60> [60, 70> [70, 80>
[160, 165> 12 18 3
[165, 170> 15 25 8
[170, 175> 4 10 5
[175, 180> 1 3 10
a) Hallar las distribuciones marginales
b) Interprete f22 , f33 , f41, f1. , f.2
c) Encuentre e interprete el peso y la talla promedio
d) Encuentre la covarianza entre peso y estatura
e) Hallar el coeficiente de correlación de Pearson
Mg. Anne Aniceto C. 16
REGRESION Y CORRELACION LINEAL SIMPLE
13 40 20
15 44 0
19 69 0 5 10 15 20
18 55
Tipos de diagrama de dispersión
Covarianza de dos variables X e Y
• La covarianza entre dos variables, Sxy, nos indica si la
posible relación entre dos variables es directa o
inversa:
S xy = (x i − x)( yi − y)
1
– Directa: Sxy > 0 n i
– Inversa: Sxy < 0
– Incorrelacionadas: Sxy = 0
iRelación Relación
nversa directa casi
perfecta Variables
perfecta
negativa incorrelacionada
s
-1 +1
Mg.0
Anne Aniceto C. 26
correlaciones positivas
330 130
120
280
110
230 100
90
180 80
70
130 60
50
80 r=0,1 40
r=0,4
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
110 100
100 90
90 80
80
70
70
60
60
50 50
40 r=0,6 40 r=0,8
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
100
90
80
70
60
50
40 r=1
30
140 150 160 170 180 190 200
80 80
70 70
60 60
50 50
40 40
30 30
20 20
10 r=-0,95 10 r=-0,999
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
yˆ = a + b x
26
Mg. Anne Aniceto C.
Interpretación de los
coeficientes de regresión lineal
• La pendiente b1(b): indica el cambio promedio en la
variable respuesta (y), cuando la variable predictora
(x) aumenta en una unidad adicional.
• El intercepto b0 (a)indica el valor promedio de la
variable respuesta (y), cuando la variable predictora
(x) es igual a cero. Sin embargo carece de
interpretación práctica si dicho valor está fuera del
rango del conjunto de valores X.
• Y= b0 + b1 X o también Y= a + bX
Para determinar el modelo de regresión lineal simple
utilizaremos el método de mínimos cuadrados:
y = na + b x
xy = a x + b x 2
ŷ = y + b1 (x − x)
Otras fórmulas adicionales
Sxy
r=
b = SXY2 a = y −bx SxS y
SX
S =
2
x 2
−x 2 S 2
=
y2
− y 2
x y
n n
Bondad de ajuste: Coeficiente de Determinación