Está en la página 1de 5

1

Mat 233 Estadística.


MSc. Ing. Franklin Torres Espada

Regresión y Correlación
Ajuste de Curvas y Método de Mínimos Cuadrados

Para hallar una ecuación que relacione las variables, el primer paso es recoger datos
que muestren valores correspondientes de las variables bajo consideraciones. Así por
ejemplo, supongamos que X e Y denotan, respectivamente, la altura y el peso de
personas; entonces una muestra de N individuos revelaría las alturas X 1, X2...., XN y los
pesos correspondientes Y1, Y2,...., YN.

El próximo paso es marcar los puntos (X1, Y1), (X2, Y2),...., (XN, YN) sobre un sistema
de coordenadas rectangulares. El conjunto de puntos resultante se llama a veces un
diagrama de dispersión.

A partir del diagrama de dispersión es posible, con frecuencia visualizar una curva
suave que aproxima los datos. Tal curva se llama una curva de aproximación. En la
figura 13.1, por ejemplo, los datos parecen aproximarse bien a una línea recta, y y
decimos que hay una relación lineal entre las variables. En la figura 13.2 sin embargo,
aunque exista relación entre las variables, no es lineal y se dice que es una relación no
lineal.

y = b + ax Línea recta.

y = a0 + a1x + a2x^2 + a3x^3 +... + anx^n Curva polinomial de grado n.

y = a xb Curva potencial.

y = abX Curva exponencial.

y = a + b * log x Curva logarítmica.


2
Mat 233 Estadística.
MSc. Ing. Franklin Torres Espada

EL MÉTODO DE LOS MÍNIMOS CUADRADOS

Al construir rectas, parábolas u otras curvas aproximadas de ajustes de datos es


necesario acordar una definición de “rectas de mayor ajuste”, “Parábola de mejor”.

Para ir hacia una tal definición, consideremos que en el cual los puntos, viene n datos
por x1 , y1 , x2 , y 2 ...........xn , y n  . Para un valor dado de X, digamos x1 , habrá una
diferencia entre el valor y1 , y el correspondiente valor deductivo de la curva C. Como
enseñanza la figura, denotamos esta diferencia por D, que se llama a veces desviación
o error residual, y puede ser positivo, negativo o nulo.

xn , yn
Y

y=b+ax

Una medida de la “bondad del ajuste” de la curva C a los datos vienen proporcionada
por la cantidad D12  D22  ......  Dn2 . Por tanto, obtenemos la siguiente definición:
“De todas las curvas que aproximan un conjunto de datos, la que tiene la propiedad de
que D12  D22  ......  Dn2 . , es mínimo y se llama la curva de ajuste óptimo”. La
mencionada curva, se dice que ajusta los datos en el sentido de mínimo cuadrados.
Así pues, una recta con esa propiedad, se llama parábola de mínimos cuadrados, etc.

El procedimiento más objetivo para ajustar una recta a un conjunto de datos


presentados en un diagrama de dispersión se conoce como "el método de los mínimos
cuadrados".

Para poder ajustar a una relación lineal se debe considerar los siguientes aspectos:

La suma de los cuadrados de esas dichas desviaciones también es una cantidad


mínima.
3
Mat 233 Estadística.
MSc. Ing. Franklin Torres Espada

Donde y=b +ax

Reemplazamos e la igualdad tenemos:

Que resulta una ecuación fundamental del método de mínimos cuadrados.

Derivamos parcialmente la ecuación respecto de b.

∑ ( )

∑ ∑ ∑

∑ ∑ ∑

Derivamos parcialmente la ecuación respecto de a.

∑ ( )

∑ ∑ ∑

De esta manera generamos dos ecuaciones con dos incógnitas, que mediante los cuales
encontramos los coeficientes a y b de la relación lineal.

∑ ∑

∑ ∑ ∑

Encontrando los coeficientes b y a.

Determinamos la relación lineal del tipo

y=b +ax
4
Mat 233 Estadística.
MSc. Ing. Franklin Torres Espada

Si generamos una tabla de acuerdo a un diagrama de dispersión podemos expresar a


los valores de la siguiente manera:

Se trata de n datos expresados en una tabla:

xi yi xi*yi xi^2
x1 y1 x1*y1 x1^2
x2 y2 x2*y2 .
x3 y3 x3*y3 .
. . .
. .
. .
xn yn xn*yn xn^2
Σxi Σyi Σxi*yi Σxi^2

Conociendo todos los coeficientes de las ecuaciones fundamentales es posible


determinar los valores de a y b y por ende la ecuación de la recta que se ajusta a los
valores propuestos.

∑ ∑

∑ ∑ ∑

r=

Podemos ajustar también a una relación no lineal

Donde se tiene una relación polinomial de grado n

y = a0 + a1x + a2x^2 + a3x^3 +... + anx^n

r=

Podemos ajustar también a una relación potencial del tipo


5
Mat 233 Estadística.
MSc. Ing. Franklin Torres Espada

r=

Si ajustamos a una relación exponencial del tipo

y = abX

r=

Si ajustamos a una relación logarítmica será:

y = a + b * log x

r=

Coeficiente de Correlación r

Trabajo Práctico

También podría gustarte