Está en la página 1de 20

AJUSTES DE

REGRESIN Y DE
CORRELACIN
Ing. Guido Urbina Maceda
Contenido

Conceptos Generales
Tipos de Regresin
Mnimos cuadrados
Dependencia e interdependencia de variables
Correlacin y coeficiente de determinacin
Conceptos
Generales
EL ANALISIS DE REGRESIN
Busca la forma matemtica de la relacin entre
dos variables, para el caso de las variables ser
de la forma Y= f(X), de manera que se pueda
calcular el valor de una variable de acuerdo al
valor que tome la otra variable.
EL ANALISIS CORRELACION
Busca conocer el grado de relacin entre dos
variables, es decir, se trata de medir cuan
relacionadas estn entre si las variables.
X Y

Cada par de datos se va expresar X1 Y1

como: (Xi,Yj); cada par de datos se X2 Y2


X3 Y3
considera como un punto en el
----- -----
plano. XN YN
Diagrama de Dispersin
Se llama diagrama de dispersin, a los datos de
una tabla, expresados como puntos en el plano
coordenado.Y
160

140

120
Eje de ordenadas

100

80

60
Eje de abscisas X
40

20

0
1 2 3 4 5 6 7 8 9 10 11
La construccin del diagrama de dispersin, es el primer paso
para investigar la relacin existente entre dos variables,
facilitando la eleccin de la correspondiente funcin
matemtica.
Tipos de
Regresin
Regresin Simple
El propsito de la regresin simple es estimar la
relacin que existe entre dos variables X e Y que se
expresa como:
Y f (X )

Esto expresa que Y es un valor estimado a partir de


los valores reales de X, que sera una lnea de
regresin de Y sobre X, donde:

Y = Variable
dependiente
X = Variable
independiente
Ajuste de una funcin de
regresin
Ajustar una funcin de regresin, significa buscar o
definir la funcin que exprese con mayor precisin
la relacin entre variables. Grficamente ser
aquella funcin que mejor se adecue a la nube de
puntos.

Analticamente la funcin Y*
= f(X) permite obtener
valores estimados Y* a partir
de los valores reales de X,
entonces el problema de
ajuste de una funcin es que
la diferencia o sesgo (ei),
entre los valores de Y, y los
estimados Y* sea mnimo,
para cada valor se tendra Y -
Y* = e
Ej. Analizar la relacin entre la edad y el tiempo
efectivo de servicios de los trabajadores.
48 40 30 39 46 42 27 36 34 46 32 42 40 32 27
40 18 9 14 22 22 4 13 10 20 12 18 16 8 6

DIAGRAMA DE DISPERSION
DE
LA EDAD Y TIEMPO DE
SERVICIO
45
Tiempo de servicios

40

35
(aos)

30

25

20

15

10 Edad (aos)

0
25 30 35 40 45 50
Regresin Lineal Simple
Se llama Regresin Lineal Simple, al procedimiento
general de expresar los puntos de un Diagrama de
dispersin, por una Recta.
Y a0 a1 X
Y
160
Eje de abscisas

140

120

100

80

60
Eje de abscisas X
40

20

0
1 2 3 4 5 6 7 8 9 10 11
Calculo de los
Parmetros
Dada a ylab
la ecuacin de
recta:
Y a0 a1 X

Los valores de a0 y a1 se calculan a partir de las


ecuaciones normales
Y a N a X
0 1

XY a 0 X a1 X 2

Resolviendo el sistema normal de ecuaciones, se


obtienen las siguientes soluciones para a0 y a1.

a0
X XY
Y X 2

a1
N XY X Y
N X ( X )
2 2
N X 2 ( X ) 2
Ej. Se ajusta a una recta la siguiente tabla de
datos:
X Y XY X2
1 14 14 1 Y a N a X
0 1

2 33 66 4
160 a0 5 a1 15
3 20 60 9
4
5
41
52
144
260
16
25
XY a 0 X a1 X 2

15 160 564 55 564 a015 a1 55

a0
X XY
Y X 2


160 * 55 15 * 564
6 .8
N X 2 ( X ) 2 5 * 55 (15) 2

N XY X Y 5 * 564 15 *160
a1 8 .4
N X 2 ( X ) 2 5 * 55 (15) 2

La ecuacin de la recta ajustada por el mtodo de mnimos


cuadrados
Y 6.8 8.4 X
Regres
Y, ain
Propiamente se llama regresin al proceso de estimar los valores de
partir de los valores de X, no descritos en la tabla inicial.
Ej. Por regresin lineal a partir de la tabla , calcular los valores
correspondientes a X = 4 ; Y = 12
X Y XY X2
Y a0 N a1 X
1 11 11 1 107 a0 5 a1 25
3 15 45 9
5 23 115 25
XY a 0 X a1 X 2

7 20 140 49 653 a0 25 a1165


9 38 342 81
25 107 653 165 a0
Y X X XY 107 *165 25 * 653 6.65
2

N X ( X )
2 2
5 *165 (25) 2

N XY X Y 5 * 653 25 *107
a1 2.95
N X 2 ( X ) 2 5 *165 (25) 2

Interpolacin por
Si X= 4, Y 6.65 2.95 * 4 18.45 que 4 es un dato
interior a los
Y 6.65 2.95 X entonces: valores de X
extrapolacin por
Si X= 12, Y 6.65 2.95 *12 42.05 que 12 es un dato
entonces: exterior a los
Regresin Lineal Mltiple
Cuando las variables son tres o mas y se trata de
expresarlas por una ecuacin lineal de varias
variables, se llama regresin lineal mltiple.

Para el caso de tres


variables, se trata de
hallar la ecuacin de
un plano, que ser de
la forma:
Y a0 a1 X 1 a2 X 2
Regresin No Lineal
Para el caso de que a los puntos de un diagrama de
dispersin se trata de representarlos por la
ecuacin de una curva, se efecta el anlisis de
Regresin No Lineal.
Si se va ajustar a
una parbola, la
ecuacin debe ser de
la forma
Y a0 a1 X a2 X2
Formas de Regresin
Otras formas de ecuaciones generales con las
cuales se puede procurar el ajuste de curvas de
diagrama de dispersin son:
Lineal (Lnea Recta) Y a0 a1 X
Lineal Mltiple (Plano) Y a0 a1 X 1 a2 X 2
Curva Y a0
cuadrtica a1 X a2 X 2
(Parbola)
Curva cbica Y a0 a1 X a2 X 2 a3 X 3
Curva de grado n Y a0 a1 X a2 X 2 ...... an X n
1
Hiprbola Y
a0 a1 X
Curva Exponencial) Y ae bx
Curva Potencial Y aX b
El Mtodo
de los
mnimos
cuadrados
El mtodo de los mnimos
cuadrados
Metodolgicamente consiste en definir la funcin que tenga
menos sesgo o desviacin respecto a los valores observados
(X,Y), se trata de un problema de minimizacin del error o
desviacin, entre los valores observados o reales Yi con los
valores calculados o estimados Y* a partir de una funcin o
lnea de regresin.
El mtodo de mnimos cuadrados, establece que la mejor
curva posible es aquella que minimiza la suma de los
cuadrados de las desviaciones entre los puntos dados Y i y los
correspondientes a dicha curva Y*.
n
e (Yi Yi* ) 2 Minima
2
i
i 1

Donde Y* = f(X) es la
ecuacin elegida para la
funcin de regresin, cuyos
parmetros o coeficientes
son determinados a partir de
las llamadas ecuaciones
normales obtenidas al
minimizar M.
GRACIAS

También podría gustarte