Documentos de Académico
Documentos de Profesional
Documentos de Cultura
El Coeficiente de correlación lineal “r” mide el grado de intendsidad de la relación lineal entre las variables X, Y
Formulas del coeficiente de correlacion lineal:
n ∑ XY −∑ X ∑ Y
r= 2 2
√ √
n ∑ X 2−( ∑ X) n ∑ Y 2−( ∑ Y )
∑ (X − X́ )2( Y −Ý )2
∑ XY −n X́ Ý COV XY Cov XY n
r= r= = =
σXσY SX SY
√ n ∑ X 2−n X́ 2 √∑ Y 2−n Ý 2 ∑ (X− X́ ) ∑ (Y −Ý )2
2
√ n √ n
∑ ( Y^ −Ý )2 SX
r =±
√ Variaqción Explicada
Variacióntotal √
=±
SCR
SCT
=±
√ ∑ ( Y −Ý )2
r =B
SY
Dado el diagrama de dispersión, formado por los pares de puntos: (Xi , Yi)
El cuadrado asegura que las diferencias serán siempre positivas, además se debe tratar
que S sea siempre lo más pequeño o mínimo posible, se llama curva de mínimos
cuadrados, porque se está considerando el mínimo del cuadrado de la desviación S. Si se
ajusta una curva con el criterio de que S sea el mínimo, se llama curva de mínimos
cuadrados.
Se llama recta de ajuste por mínimos cuadrados a aquella recta que se obtiene bajo el
procedimiento de que la suma de desviaciones al cuadrado
Demostración:
Demostrar que para obtener la recta que representa el mínimo error respecto a los
puntos del diagrama de dispersión, debe satisfacer el sistema normal de ecuaciones.
S=( y− ^y )2
Luego
∂S
Derivar parcialmente e igualar a cero. = 2 ( y− A−Bx )(−1 ) =0
∂A ∑
∂S
= 2 ( y− A−Bx ) (−x )=0
∂B ∑
En la otra derivada
Ecuación 1: ∑ y=An+ B ∑ x
Ecuación 2: ∑ yx=A ∑ x+ B ∑ x 2
Si resolvemos este sistema obtenemos los valores A, B que son los parámetros de la
ecuación lineal y= A + B x
B=
∑ XY −n X́ Ý
n ∑ X 2−n X́ 2
4
Ing. Mario Marañón Álvarez
se
ERROR ESTANDA DE LA PENDIENTE S B= 2 2
√∑ X −n X́
∑ X2 ¿
ERROR ESTANDAR DE LA ORDENADA
Luego la ecuación de estimación es: Ŷ= A + BX. Otras fórmulas:
S A =Se
√ n ∑ X 2−¿¿ ¿
A=
∑ Y −B ∑ X A=Ý −B X́
n
( Y −Ý )=B ( X− X́ )
COV XY
( Y −Ý )= ( X− X́ )
σ 2X
SY SY
Y^ =Ý + r ( ) ( )
SX
X −r
SX
X́
El método de mínimos cuadrados hace que la suma de cuadrados de errores sea mínima; es decir:
∑ (Y −Ý )2=Mínima Y= A + B X
(Y −Y^ )2
VR= Varianza Residual ( con n-2 grados de libertad) VR=S 2e =S 2yx = ∑
n−2
∑ ( Y^ −Ý )2
VE= Varianza Explicada VE=
n
2 ∑ (Y −Y^ )2
S yx =
n
∑ (Y −Y^ )2 ∑ (Y −Y^ )2
√S 2
yx =
√ n
SYX =
√ n
SSXY COV XY σX SY
B= A=Ý −B X́ B= 2 r =B B=r =¿
SSX σ X
σY SX
MSE= ECM= Error Cuadrático Medio SSE= SCE= Suma Cuadrados Error= Σ (Y – Ŷ)2
2
SSE
SSE=SCE=SSY −¿ ¿ MSE=
n−2 Se =
√ ∑ (Y −Y^ ) =√ MSE
n−2
Por ejemplo: Si tenemos: Y= 4,4 + 1,08 X y se calculo: S e= 0,907 y para X=10, se estimo : Ŷ= 15,2; entonces
obtenemos el intervalo: Ŷ ± Se: I= [16.11 , 14.29 ]
Ŷ ± Se 15,2 ± 0,907 Implica que 68,3 % de los puntos caen entre estas rectas paralelas a Y= 4,4 + 1,08 X.
31,7% restante de las observaciones estarían fuera de este intervalo [16.11 , 14.29 ].
BONDAD DE AJUSTE r, R2
R2 Mide el poder explicativo del modelo de regresión lineal; es decir, la parte de la variación de Y explicada
por la variación de X.
1° Estimación del intervalo para para el valor medio de Y, dado un vaor de X; es decir, podría interesarnos
estimar la media poblacional para todos los valores de Y (y no solo “n=15” como la muestra) cuando X es
igual a un valor dado.
Por ejemplo podría interesarnos el promedio de todos ventas de todos los meses en que gastamos 1000 $us en
publicidad (es decir X= 1000) es lo que se llama la media condicional. Este intervalo es una estimación del
valor medio o promedio de Y para todos los valores en que X es igual a una cantidad específica
2° Estimación de un intervalo de confianza para estimar un valor único de Y cuando X toma un valor
específico. A este estimador se llama INTERVALO PREDICTIVO. Este intervalo estima Y en cualquier
valor único de X.
Interpretación se puede confiar al 95% en que la media poblacional verdadera de Y se encuentra entre
Y^ ±t n−2 S Y Para todo aquellos valores de X
Implica predecir un valor único de Y si X es una cantidad dada una sola vez. El IC predictivo de Y también se presta a
dos interpretaciones, en el caso que los calculos son con el nivel de confianza del 95%:
8
Ing. Mario Marañón Álvarez
a) Si ponemos X= a una cantidad s´solo una vez, obtendríamos un único valor resultante de Y. Podemos estar
seguros al 95% de que dicho valor de Y cae dentro del intervalo espacificado.
b) Si tomamos muechas muestra y se utilizase cada una para construir un intervalo de confianza predictivo el
95% de esos intervalos contendrían el verdadero valor de Y.
Para hallar este intervalo predictivo primero se calcula el error típico o estandar de la predicción S Yi la fórmula de
cálculo es:
2
1 (X − X́ )
SYi =Se
√ 1+ +
n SSX
Luego el intervalo predictivo de un solo valor de Y, YX, es entonces: Y X =Y^ ±t n−2 SYi
Interpretación: Podemos estar seguros en un 95% que con un solo valor de X, el valor único resultante de Y
se encontrará entre Y^ ±t n−2 S Yi
Ecuación 1 ∑ fy =A ∑ f + B ∑ fx
Ecuación 2 ∑ fxy=A ∑ fx + B ∑ f x 2
n ∑ fxy−∑ fx ∑ fy
B=
n ∑ f x 2−¿ ¿
A=
∑ fy ∑ f x 2−∑ fx ∑ fxy
n ∑ f x 2−¿ ¿
n ∑ fxy−∑ fx ∑ fy
r= 2
√ n ∑ f x −¿ ¿ ¿
∑ f ( x−x́)( y− ý ) ∑ f (x −x́)2 ∑ f ( y− ý )2
COVxy=
n
σ x=
√ n
σ x=
√ n
∑ f ( ^y − ý )2 = COVxy
r =±
√ Variación explicada
Variación total
=±
√ ∑ f ( y− ý )2 σ x σ y
1
Se =S xy=
√ n(n−2)
¿¿
9
Ing. Mario Marañón Álvarez
FORMULAS COVARIANZAS
DATOS AGRUPADOS
COV XY =
∑ f ( X− X́)(Y −Ý ¿) = ∑ fXY −n X́ Ý = ∑ fXY − X́ Ý =¿ ¿
N N N
VARIANZAS
σ 2X =∑ f ¿ ¿ ¿
DATOS NO AGRUPADOS
COV XY =
∑ (X − X́ )(Y −Ý ¿) =¿ ¿
N
COV XY =¿
∑ XY −n X́ Ý =¿ COV =
∑ XY − X́ Ý =¿
XY
N N
COV XY =
∑ (X − X́ )(Y −Ý ¿) = ∑ XY −n X́ Ý = ∑ XY − X́ Ý =¿ ¿
N N N
DATOS NO AGRUPADOS
σ 2X =∑ ¿¿ ¿ σ 2X =
∑ X 2 −N X́ 2 =¿ σ 2 = ∑ X 2 − X́ 2
X
N N
σ 2X =∑ ¿¿ ¿
COV XY COV XY n ∑ XY −∑ X ∑ Y SY
B= 2
=¿ B= 2 B= 2
B=r =¿
S X σ X n ∑ X −¿ ¿ ¿ SX
σX
r =B
σY
∑ XY − X́ Ý
B=
∑ XY −n X́ Ý =¿ B=
∑ ( X− X́)(Y −Ý ¿) ¿ B=
N
=¿
2 2
∑ X −n X́ ∑ ¿¿¿ ∑ X 2 − X́ 2
N
COV XY n ∑ XY −∑ X ∑ Y
Resumen B= 2
=
SX n ∑ X 2−¿ ¿ ¿
PARAMETRO A
10
Ing. Mario Marañón Álvarez
A=
∑ Y −B ∑ X =¿ A=Ý −B X́=¿ A=
∑ Y −B ∑ X =Ý −B X́ =¿
n n
σY σY COV XY
Y^ =Ý + R X −r X́ Y −Ý = (X − X́ )
σX σX σ2
BONDAD DE AJUSTE
σ X CO V XY ∑ ( Y^ −Ý )2 =
r =B
σY
=
σXσY
=±
Variación explicada
√
VariaciónTotal
=±
√ ∑ ( Y −Ý )2 √ SST
SSR
(Se usan para calcular el grado de variación o dispersión que presentan los datos que no quedaron explicados por
la recta de regresión)
2 ∑ (Y −Y^ )2 2 2 ∑ (Y −Y^ )2
VR=S YX = VR=S =S e yx =
n n−2
2 ∑ Y 2 −A ∑ Y −B ∑ YX
S YX = =¿
n
S2YX =S 2Y ( 1−R 2) =¿
2 ∑ (Y −Y^ )2 ∑ Y 2−A ∑ Y −B ∑ YX
S YX = = =S 2 (1−R2 ) Y
n n
∑ (Y −Y^ )2 =¿ ∑ Y 2− A ∑ Y −B ∑ YX =¿
Se =SYX =
√ n
Se =SYX =
√ n
Se =SYX =√ S 2Y (1−R2)=¿
∑ (Y −Y^ )2 = ∑ Y 2− A ∑ Y −B ∑ YX =
Se =SYX =
√ n √ n √S 2
Y (1−R 2)=¿
Y= f (Xi), i= 1, n
EL COEFICIENTE DE ESTIMACIÓN
Σ( y− ŷ )2
Coeficiente e estimación: SYX =
√ n−2
Σ ( y− ŷ )2
Coeficiente de estimación múltiple poblacional SP yx =
√ N
12
Ing. Mario Marañón Álvarez
(Y −Ý )2
Desviación estándar respecto a y σY =
√ N
2
SPYX ∑ ( ^y − ý )2
r = 1−
√ ( )
σY
r =±
√ Variación explicada
Variación total
=±
√ ∑ ( y− ý )2
COEFICIENTES DE CORRELACIÓN PARCIAL ENTRE VARIABLES
n ∑ yx 1−∑ y ∑ x1
ry x =1 2 2
√ n ∑ x −(∑ x ) √n ∑ y −(∑ y )
2
1 1
2
n ∑ yx 2−∑ y ∑ x2
ry x =2 2 2
√ n ∑ x −(∑ x ) √n ∑ y −(∑ y )
2
2 2
2
n ∑ x1 x 2−∑ x 1 ∑ x 2
rx x =
1 2 2 2
√n ∑ x −(∑ x ) √n ∑ x −(∑ x )
2
1 1
2
2 2
r y x −r y x r x x2
r yx , x = 1
2
2 1
√(1−r )(1−r 2x x )
1 2
y x2 1 2
r y x −r y x r x x2
r yx , x = 2
2
1 1
√(1−r )(1−r 2x x )
2 1
y x1 1 2
r x x −r y x r y x
rx x , y=
1 2
2
1 2
√(1−r )(1−r 2y x )
1 2
y x1 2
14
Ing. Mario Marañón Álvarez
15
Ing. Mario Marañón Álvarez
16
Ing. Mario Marañón Álvarez