Está en la página 1de 2

Regresin y correlacin simple

113

ANALISIS DE REGRESION Y CORRELACION


El anlisis de regresin consiste en emplear mtodos que permitan determinar la mejor relacin
funcional entre dos o ms variables concomitantes (o relacionadas), y el anlisis de correlacin,
el grado de asociacin de las mismas. Es decir; no slo se busca una funcin matemtica que
exprese de que manera se realcionan, sino tambin con que presicin se puede predecir el valor
de una de ellas si se conoce los valores de las variables asociadas.

ANALISIS DE REGRESION
Una relacion funcional matemticamente hablando, est dada por:
Y = f(x1,...,xn; 1,...,m)
(1)
donde:
Y : Variable respuesta (o dependiente)
xi : La i-sima variable independiente (i=1,...,n)
j : El j-simo parmetro en la funcin (j=1,...m)
f : La funcin
Para elegir una relacin funcional particular como la representativa de la poblacin bajo
investigacin, usualmente se procede:
1) Una consideracin analtica del fenmeno que nos ocupa, y
2) Un examen de diagramas de dispersin.
Una vez decidido el tipo de funcin matemtica que mejor se ajusta (o representa nuestro
concepto de la relacin exacta que existe entre las variables) se presenta el problema de elegir
un expresin particular de esta familia de funciones; es decir, se ha postulado una cierta funcin
como trmino del verdadero estado en la poblacin y ahora es necesario estimar los parmetros
de esta funcin (ajuste de curvas).
Como los valores de los parmetros no se pueden determinar sin errores por que los valores
observados de la variable dependiente no concuerdan con los valores esperados, entonces la
ecuacin (1) replanteada, estadsticamente, sera:
Y = f(x1,...xn;1,...,m) +
(2)
donde respresenta el error cometido en el intento de observar la caracterstica en estudio, en la
cual muchos factores contribuyen al valor que asume .
REGRESION LINEAL SIMPLE
Cuando la relacin funcional entre las variables dependiente (Y) e independiente (X) es una lnea
recta, se tiene una regresin lineal simple, dada por la ecuacin
Y = o + 1X +
donde:
o : El valor de la ordenada donde la lnea de regresin
Lenin Justiniano Po / Apuntes de clase - uso interno. Grupo G / Martes 2-4, Miercoles 2-3 pm

Regresin y correlacin simple

114

se intersecta al eje Y.

1 : El coeficiente de regresin poblacional (pendiente de la lnea recta)


: El error.
Supocisiones de la regresin lineal
1.
2.
3.
4.
5.
6.

Los valores de la variable independiente X son "fijos".


La variable X se mide sin error (se desprecia el error de medicin en X)
Existen subpoblaciones de valores Y para cada X que estn normalmente distribuidos.
Las variancias de las subpoblaciones de Y son todas iguales.
Todas las medias de las subpoblaciones de Y estn sobre la misma recta.
Los valores de Y estn nomalmente distribuidos y son estadsticamente independientes.

Las suposiciones del 3 al 6 equivalen a decir que los errores son aleatorios, que se distribuyen
normalmente con media cero y variancia .
Estimacin de parmetros
La funcin de regresin lineal simple es expresado como:
Y = o + 1X +
(3)
la estimacin de parmetros consiste en determinar los parmetros o y 1 a partir de los datos
muestrales observados; es decir, deben hallarse valores como bo y b1 de la muestra, que
represente a o y 1, respectivamente.
De la ecuacin (3), para un xi determinado, se tiene el correspondiente Yi, y el valor del error i
sera (Yi-o-1Xi)
Empleando el mtodo de los mnimos cuadrados, es decir minimizando la suma de cuadrados de
los errores, se determinan los valores de bo y b1, as:

Q =

Q
= 2

(y i 0 1 x i )

(y x )(1) = 0
i

(4)

Q
= 2

(y x )( x ) = 0
i

(5)
Al sistema formado por las ecuaciones (4) y (5) se les denomina ecuaciones normales.
Resolviendo las ecuaciones normales, se tiene:

b0 = y b1 x

Lenin Justiniano Po / Apuntes de clase - uso interno. Grupo G / Martes 2-4, Miercoles 2-3 pm

También podría gustarte