Está en la página 1de 2

INTRODUCCION AL MODELO DE REGRESION

Ajuste de Curva

Los datos que describen el movimiento de una variable a lo largo del tiempo son
llamados datos de series de tiempo y pueden ser diarios, semanales, trimestrales o
anuales. Los daros que describen las personas individuales, empresas u otras
unidades en un punto dado en el tiempo son llamados de corte transversal.

Cuadro 1. Promedio de calificaciones e ingreso familiar

Y X
(Ingreso de los padres en miles de
(Promedio de calificaciones)
dó lares)
4.0 21.0
3.0 15.0
3.5 15.0
2.0 9.0
3.0 12.0
3.5 18.0
2.5 6.0
2.5 12.0

La relació n entre dos variables X y Y. Para describir esta relació n de manera


estadística necesitamos un conjunto de observaciones para cada variable y una
hipó tesis que exponga la forma matemá tica explícita de la relació n. Si se desea
explicar las calificaciones en relació n al ingreso econó mico de sus padres, se
manejaría de la siguiente manera.

Figura 1: Diagrama de dispersió n

Tambien se puede dar una línea punteada que paresca ajustarse a la dispersió n
completa de puntos. Un procedimiento mejor sería legir una línea de modo que la
suma de las distancias verticales (positiva y negativa) de los puntos en la grá fica a la
línea sea cero. Esto aseguraría que las deviasiones son iguales en magnitud e iguales
en signo se les da igual importancia. Sin embargo las desviaciones pueden tener
también signo negativo en tamañ o, cancelandose dando como resultado cero.

Se puede mejorar este método si se minimiza el valor absoluto de las desvaciones de


los puntos muestrales de la línea ajustada, donde la desviació n es proporcional a su
magnitud. Aunque la minimizació n de la suma de las desviaciones absolutas es
atractiva, sufre varias desventajas. La primera es que el procedimiento es difícil desde
el punto de vista del cá lculo. También podría ser que las desviaciones grandes será n
tratadas con una atenció n relativamente mayor que las desviaciones pequeñ as. Por
ejemplo, es probable que una predicció n que implique un error de dos unidades se
consideraría peor que una predicció n que implicara dos errores de una unidad cada
uno.

Figura 2: Desviaciones

Existe un procedimiento cuyo cá lculo es simple y que penaliza relativamente má s los


errores grandes que los errores pequeñ os. É ste es el método de mínimos cuadrados. El
criterio de mínimos cuadrados es el siguiente: Se dice que la “línea de mejor ajuste”
es aquella que minimiza la suma de las desviaciones al cuadrado de los puntos
de la gráfica desde los puntos de la línea recta (con distancias medidas en forma
vertical).

Un problema con los mínimos cuadrados ocurre cuando hay uno o má s desviaciones
grandes. Supó ngase que se cometió un error de reporte con respecto al promedio de
calificaciones del primer estudiante, habiéndose reportado una calificació n de 1.0 en
lugar de la cifra correcta de 4.0.

Figura 3: a) Funció n de pérdida; b) Funció n de pérdida alternativa

Llamamos a puntos atípicos aquellos puntos que está n as má s de una cierta distancia
de la línea de regresió n. La solució n má s simple es volver a calcular la recta de
mínimos cuadrados original como la nueva y las intersecciones, podemos determinar
la sensibilidad de nuestros resultados ante la presencia de puntos atípicos.

También podría gustarte