Documentos de Académico
Documentos de Profesional
Documentos de Cultura
CORRELACIÓN
Todos los días se toman decisiones personales y profesionales basadas en predicciones
de sucesos futuros. Para hacer estas predicciones, se basan en la relación (intuitiva o
calculada) entre lo que se sabe y lo que se debe estimar. Si se puede determinar como lo
conocido se relaciona con el evento futuro, puede ayudar considerablemente al proceso
de la toma de decisiones (relación entre variables)
Diagramas de Dispersión
Para determinar si existe relación entre dos variables se debe examinar la gráfica de los
datos observados. Esta gráfica o es quema se llama diagrama de dispersión.
Un diagrama de dispersión nos puede dar dos tipos de información. Visualmente
podemos buscar patrones que indiquen que las variables están relacionadas. Entonces, si
esto sucede, podemos ver que tipo de línea o ecuación de estimación, describe esta
relación.
Regresión
Es un método estadístico que investiga y define la relación funcional entre dos más
variables
Y = f (x)
La Regresión y los análisis de correlación se basan en la relación o asociación, entre dos
o más variables. La(s) variable(s) conocida(s) se llaman variables independientes. La
variable que trataremos de predecir es la variable independiente. Solo podemos tener
una variable dependiente en nuestra ecuación de estimación. Sin embargo, podemos
usar más de una variable independiente. A menudo cuando añadimos variables
independientes, mejoramos la exactitud de nuestra predicción
a) Línea recta Y= a + bx
b) Parábola cuadrada Y= a + bx + cx2
c) Parábola cúbica Y= a + bx + cx2 + dx3
d) Curva potencial o geométrica Y= b xa
e) Curva potencial modificada Y= k + b xa
x
f) Curva exponencial Y= ab
g) Curva exponencial modificada Y = k + a bx
h) Hipérbola Y=
1
a bx
i) Hipérbola equilátera Y=
a
x
j) Hipérbola modificada Y=
k
a bx
1
a bc x
k) Curva logística Y =
k
1 10a bx
l) Curva logística modificada Nº 1 Y=
1
m) Curva logística modificada Nº 2 Y= x
k ab
x
n) Curva Gompertz Y= c
ab
Uno de los criterios para lograr esta minimización es el método de los mínimos
cuadrados, que establece “que la mejor curva posible es aquella que minimiza la suma
de los cuadrados de las desviaciones entre los puntos dados Y y los puntos
correspondientes a dicha curva Y*”
d1 = Y1 - Y*
d2 = Y2 - Y*
... ...
dk = Yk - Y*
mín. Σ d = mín. Σ (Yi - Y*)
La mejor curva de ajuste, de todas las curvas es aquella que tiene la propiedad de que:
2 2 2 2 Sea mínimo
d1 d2 d3 ... dk
2
Mín. ∑ d = mín. ∑ (Yi - Y*)2
i
Y
Y*
d1
dk
LA RECTA
Donde:
2
N XY X Y X Y X Y
A
= 2
X
B 2
=
N X
2
2 N X X
A= Y B X
N N
MÉTODO ABREVIADO
B=
xy y=Bx → Y - Y = B (X - X )
x
2
COEFICIENTE DE CORRELACIÓN
2
S * : Varianza explicada (parte de la
2 y
S * varianza total de Y explicada por la
R= y línea de regresión )
2 2
Sy Sy : Varianza total ( corresponde a
los valores observados de Y )
Remplazando:
2
y * y 2 Syx
R2 n R2 = 1-
2
= 2 Desarrollando se obtiene
y-y Sy
n
2
ay bxy n y
R2 = 2
y2 n y
R =
nxy xy
n x 2 x 2 n y2 y 2
Si se utilizan x = X- X ^ y=Y- Y
xy
R= x2 y
2
PROPIEDADES
1.- El rango de variación de r es de –1 a +1
-1≤ R ≤ 1
2.-Si R > 0, existe correlación directa o positiva
3.-Si R < 0, existe correlación inversa o negativa
4.-Si R2 = 0, los datos son incorrelacionables; es decir, que no hay afinidad entre
variables
8.-El signo de “R” es el mismo que el signo de “b” (coeficiente angular) de la ecuación
de regresión y = a + b x
NOTA:
En la interpretación clásica del coeficiente de correlación se sostiene que si:
▪ 0 ≤ R ≤ 0.20 , existe correlación no significativa
▪ 0.20 ≤ R ≤ 0.40 , existe una correlación baja
▪ 0.40 ≤ R ≤ 0.70 , existe una significativa correlación
▪ 0.70 ≤ R ≤ 1.00 , existe alto grado de correlación.
Sin embargo estos valores resultan arbitrarios, puesto que dependerá de la naturaleza del
problema que se investiga.
y y *
2
SYX =
n
Calcular el error estándar S a partir de la definición resulta muy laboriosa, puesto que se
requiere conocer los valores estimados Y*. Existe una fórmula alternativa a partir de la
definición, donde se sustituyen el valor Y* = a + b X
y a bx
2
SYX =
n
Desarrollando:
2
SYX = y a y b xy (1)
n
2
S YX = se denomina varianza residual de Y sobre X
Algunos autores utilizan como denominador: n-1, n-2,…
Z≈ 2 LC = Y* ± 2 SYX
MÉTODO ABREVIADO
x = X- X X = x + X ^ y=Y- Y Y =y + Y
se obtiene:
2
2
S yx = y b xy
n
LA FUNCIÓN POTENCIAL
Y = b Xa
Si utilizamos logaritmos, esta función se asemeja
a la función lineal
Log Y* = Log b + a Log x
a= Log b =
n Logx.Logy Logx. Logy Log.y a Log.x
n
Log.xESTÁNDAR
nERROR Log.x
2
2
DE ESTIMACIÓN
2 = Log.y Log.y * 2
Syx n
2
Syx =
n
Coeficiente de correlación: R
Y= abX
De la misma manera que la función potencial, aplicamos logaritmos para transformar la
función exponencial original en forma logarítmica:
ECUACIONES NORMALES
Log b = Log a =
n xLogy x Logy Logy Logb x
n
x de x
2 2
n 2
Error Estándar Estimación: S yx
Coeficiente de Correlación: r
R2 =
Logb xLogy Loga Logy n Logy 2
Logy n Logy
2
2