Está en la página 1de 13

REGRESIN

Con frecuencia se desea estimar el valor de la variable Y que corresponde a un valor dado de
la variable X, basndose en los datos muestrales.
A la ecuacin con que se describe cmo se relaciona y con x y en la que se da un trmino para
el error, se le llama modelo de regresin. El siguiente es el modelo que se emplea en la
regresin lineal simple.
En el caso de una regresin lineal simple donde hay una sola variable de regresin
independiente x y una sola variable aleatoria dependiente Y, los datos pueden representarse
por los pares de observaciones.
Esto se hace estimando el valor de Ya partir de la curva de mnimos cuadrados ajustada a los
datos muestrales. A la curva de mnimos cuadrados se le llama curva de regresin de Y en X,
debido a que Y se estima a partir de X.

CORRELACIN
Si todos los valores de las variables satisfacen con exactitud una ecuacin, se dice que las
variables estn en perfecta correlacin o que hay una correlacin perfecta entre ellas.
Si X y Y son las dos variables en consideracin, un diagrama de dispersin sirve para mostrar
la localizacin de los puntos (X, Y) en un sistema de coordenadas rectangulares. Si en este
diagrama de dispersin todos los puntos parecen encontrarse cerca de una lnea recta, la
correlacin se le llama lineal.
En pocas palabras:
La correlacin estadstica determina la relacin o dependencia que existe entre las dos
variables que intervienen en una distribucin bidimensional. Es decir, determinar si los
cambios en una de las variables influyen en los cambios de la otra. En caso de que suceda,
diremos que las variables estn correlacionadas o que hay correlacin entre ellas.

RECTA DE MINIMOS CUADRADOS


El mtodo de mnimos cuadrados es un mtodo en el que se usan los datos muestrales para
hallar la ecuacin de regresin estimada.
El mtodo de mnimos cuadrados proporciona una ecuacin de regresin estimada que
minimiza la suma de los cuadrados de las desviaciones entre los valores observados de la
variable dependiente yi y los valores estimados de la variable dependiente yi.
El criterio de mnimos cuadrados permite obtener la y^i ecuacin de mejor ajuste. Si se
empleara otro criterio, como minimizar la suma de las desviaciones absolutas entre yi y se
obtendra una ecuacin diferente. En la prctica el mtodo de mnimos cuadrados es el
mtodo ms usado.
FORMULA:

EJEMPLOS DE APLICACIN DE RECTA DE MINIMOS


CUADRADOS
Ejemplo 1:
Use el mtodo de mnimos cuadrados para determinar la ecuacin de la recta que mejor se
ajusta para los datos. Luego grafique la recta.

Solucin:
Grafique los puntos en un plano coordenado.

Calcule las medias de los valores de x y los valores de y, la suma de los cuadrados de los
valores de x, y la suma de cada valor de x multiplicado por su valor correspondiente y.
Calcule la pendiente.

Calcule la intercepcin en y.
Primero, calcule la media de los valores de x y la media de los valores de y.

Use la frmula para calcular la intercepcin en y.

Use la pendiente y la intercepcin en y para formar la ecuacin de la recta que mejor se


ajusta.
La pendiente de la recta es -1.1 y la intercepcin en y es 14.0.
Por lo tanto, la ecuacin es y = -1.1 x + 14.0.
Dibuje la recta en la grfica de dispersin.

Ejemplo 2:
Use el mtodo de mnimos cuadrados para determinar la ecuacin de la recta que mejor se

ajusta para los datos. Luego grafique la recta.


TIPOS DE CURVAS REDUCIBLES A LA FORMA LINEA
Supngase que al representar grficamente la correspondiente la distribucin bidimensional,
se obtiene una grfica no lineal, es decir una curva. Se observa una clara relacin entre las
dos variables, pero claramente no lineal. Por tanto, deber buscar la funcin que ha de
describir la dependencia entre las dos variables.
Estas notas se limitarn al estudio de las ms utilizadas: las funciones parablica, hiperblica,
logartmica, exponencial y potencial.

Curva Parablica.

En muchos casos, es una funcin de segundo grado la que se ajusta lo suficiente a la situacin
real dada. La expresin general de un polinomio de segundo grado es:

Donde son los parmetros.


El problema consiste, por tanto, en determinar dichos parmetros para una distribucin dada.
Se seguir para ello, un razonamiento similar al que se hace en el caso del modelo de
regresin lineal simple, utilizando el procedimiento de ajuste de los mnimos cuadrados, es
decir, haciendo que la suma de los cuadrados de las desviaciones con respecto a la curva de
regresin sea mnima:
Donde son los valores observados de la variable dependiente, y son los valores
estimados segn el modelo.
Por tanto, D se puede escribir de la forma:

Para encontrar los valores de a, b y c que hacen mnima la expresin anterior, se igualarn las
derivadas parciales de D con respecto a dichos parmetros a cero y se resolver el sistema
resultante. Las ecuaciones que forman dicho sistema se conocen, igual que en el caso de la
regresin lineal simple, como ecuaciones normales de Gauss.

Curva Hiperblica
Cuando la dependencia entre las variables X e Y es de forma hiperblica, interesa ajustar a la
nube de puntos una funcin del tipo:

La funcin a minimizar ser:

Donde: , por lo tanto :

Para minimizar la expresin, se calculan las derivadas parciales respecto a los parmetros a y
b, igualando a cero:

En consecuencia, las ecuaciones normales sern:


Curva Exponencial.

Modelo exponencial En determinados experimentos,


en su mayora biolgicos, la dependencia entre las
variables X e Y es de forma exponencial, en cuyo
caso interesa ajustar a la nube de puntos una funcin
del tipo: Mediante una
transformacin lineal, tomando logaritmos
neperianos, se convierte el problema en una cuestin
de regresin lineal. Es decir, tomando logaritmos
neperianos:

Y llamando a:

Se obtiene:

Para simplificar, descartando multiplicidades y suponiendo que cada par se repite una sola
vez, las ecuaciones normales sern:

Calculando los parmetros a y b se tiene la ecuacin de la funcin exponencial:


Ejemplo de Curva Parablica:

Ejercicio De Aplicacin De Parbola De Mnimos Cuadrados.


PROBLEMA: Ajustar, segn convenga, a una recta o a una parbola de mnimos cuadrados
los datos dados por la siguiente tabla:

El primer paso obligado antes de tratar de ajustar una serie de datos a una frmula consiste en
poner los datos sobre una grfica para intentar descubrir la tendencia mostrada por los datos.
En este caso, la grfica resulta ser:
Aunque a primera vista nuestro primer impulso sea el tratar de llevar a cabo un ajuste
utilizando una recta de mnimos cuadrados, el punto que aparece en la grfica para X0=0 si
realmente representa no una equivocacin en la toma de una lectura sino un dato
genuinamente vlido nos debe llevar a pensar en la posibilidad de que los datos en vez de
estar modelados por una lnea recta tal vez estn modelados por una curva. Y la curva ms
sencilla de todas es la proporcionada por un polinomio de segundo grado, un polinomio
cuadrtico. Utilizando las ecuaciones normales derivadas arriba, la parbola de mnimos
cuadrados resulta ser:
Y = 2.51 - 1.20X + .733X

El graficado de esta curva, sobrepuesta sobre los datos experimentales, presenta el siguiente

aspecto:

Podemos ver que el ajuste de los datos a una frmula cuadrtica es bastante bueno. Y no slo
eso, sino que nos permite detectar la presencia de lo que parece ser un mnimo. Este mnimo
muy bien podra ser un punto ptimo para minimizar las prdidas en un proceso industrial,
obtener el mayor grado de pureza en un proceso qumico, o lograr la mejor calidad en una
aleacin.

Variacin Total, Variacin Explicita Y Variacin No Explicita.


La variacin total de Y se define como es decir, la suma de los cuadrados de
las desviaciones de Y respecto a la media Su expresin es la siguiente:

En la ecuacin anterior, al primer trmino del lado derecho se le llama variacin no


explicada, en tanto que al segundo trmino se le llama variacin explicada; se les llama as
debido a que las desviaciones tienen un patrn definido; en cambio, las
deviaciones son aleatorias o impredecibles. Para la variable X existe una frmula
similar

Coeficiente De Correlacin

El coeficiente de correlacin de Pearson o r es una prueba estadstica que permite analizar la


relacin entre dos variables medidas en un nivel por intervalos o de razn, donde r mide el
grado de asociacin lineal entre dos variables X e Y.
Si hay cero variacin explicada (es decir, si la variacin total es slo variacin no explicada),
este cociente es 0. Si hay 0 variacin no explicada (es decir, si la variacin total es slo
variacin explicada), este cociente es 1. En los dems casos, este cociente se encuentra entre
0 y 1; como siempre es no negativo, se denota r2. A la cantidad r se le llama coeficiente de
correlacin; est dado por:
Y vara entre 1 y +1. Los signos +y se usan para correlacin lineal positiva y correlacin
lineal negativa, respectivamente. Obsrvese que res una cantidad adimensional; es decir, no
depende de las unidades que se empleen.

También podría gustarte