Está en la página 1de 7

MÉTODO DE LOS MÍNIMOS CUADRADOS

Catedrático: Alberto Tomás Heredia Jiménez


En todas partes, cuando queremos llevar a cabo un negocio, si conocemos la
historia de su funcionamiento, podemos hacer estimaciones de cómo podría seguir
en el futuro, siempre que tengamos la información de otras variables que de alguna
manera se relacionan con la variable que nos interesa.
Si analizamos la variable que nos interesa, y la comparamos con las otras variables
con las que pensamos existe relación, podríamos suponer que cada una de esas
variables con nuestra variable en estudio son complementarias, si son directamente
proporcionales; competitivas, si son inversamente proporcionales, o que no existe
relación entre ellas.
Si tomamos los valores de nuestra variable con una de las variables que vemos,
existe alguna relación, podemos suponer que hay alguna relación de dependencia,
o que algún fenómeno externo con alguna influencia sobre ambas variables,
produce la coincidencia de esta relación entre ellas.
Por tanto, la relación que vemos, está ocurriendo entre las variables con las que
vamos a trabajar, puede ser solamente una relación que se da por el azar, no porque
haya dependencia entre ellas.
En nuestro modelo, podríamos, como resultado de nuestras observaciones,
suponer que la variable que nos interesa es dependiente linealmente de la otra
variable que hemos escogido, principalmente si esta variable la podemos manejar
a voluntad. Esto significa que hemos observado que los resultados gráficos de
relacionar nuestra variable de estudio con la otra variable que hemos escogido,
están distribuidos en el plano cartesiano siguiendo aproximadamente la tendencia
de una línea recta.
Cuando ésto sucede, la relación que observamos nos puede servir para realizar
proyecciones y estimar los posibles valores que pudieran resultar en nuestra
variable, si la variable con la que la estamos relacionando toma ciertos valores
deseados.
Para poder hacer este trabajo, necesitamos recordar cómo se trabaja con una
función lineal.
La función lineal tiene la forma siguiente. y = a + bx
Donde:
y = nuestra variable de estudio, que en una empresa podrían ser nuestras ventas,
y cuyos valores vamos a proyectar, para estimarlas en el futuro, o a interpolar,
si es que nos faltara algún dato intermedio.
a = valor a calcular, que representa el punto donde la recta corta al eje Y.

Pág. 1
b = valor a calcular, que representa la variación de y cuando x aumenta 1 unidad.
x = los valores que vamos a asignar a la variable manejable por nosotros, o variable
independiente, que podría ser los gastos de publicidad.
La información que se toma como base es información histórica, o sea son datos
conocidos.
ECUACIONES NORMALES
para poder trabajar lo que se necesita hacer, debemos recordar cómo se resuelve
los sistemas de ecuaciones lineales; aunque trataré de darles unas fórmulas con las
cuales podrán ustedes, después de un trabajo previo de preparación de una tabla,
encontrar los valores de y para cada valor de x (en este caso, los valores de las
ventas para cada valor del gasto en publicidad).
El sistema de ecuaciones, llamadas ecuaciones normales, para el caso de dos
variables, consta de dos ecuaciones, que son:
1. Σy = na + bΣx
2. Σxy = aΣx + bΣx2

En este sistema de ecuaciones, las incógnitas o valores a calcular, como ya antes


lo dijimos, son a y b.
De las dos ecuaciones se puede despejar estos valores y se tendrá que:

n(Σxy) – (Σx)( Σy)


b=
n(Σx2) – (Σx)2
Σy - b Σx
a=
n

En sistema de ecuaciones normales, nos falta definir el significado de n; por tanto:


n = es el número de datos, (o pares de datos) con los que contamos.
Para poder aplicar estas fórmulas fácilmente, se necesita recordar cómo se resuelve
las ecuaciones simultáneas de primer grado con dos incógnitas; también recordar
lo que se ha trabajado en estadística durante la primera unidad. Usted debe darse
cuenta lo que significa cada término de las ecuaciones, con la finalidad de poder
reemplazarlos en las fórmulas y lograr calcular el valor de los parámetros de la
ecuación lineal o coeficientes de la línea recta.
Debemos darnos cuenta que es necesario encontrar primero el valor del coeficiente
b para poder encontrar el valor del coeficiente a, debido a que b, es un término que
forma parte de la fórmula de a.
Pág. 2
Cuando vamos a hacer la proyección
o interpolación de datos, por
información que quisiéramos
proyectar hacia el futuro, o calcular
aproximadamente cuál seria un valor
que nos falta en una serie, por el
método de los mínimos cuadrados,
utilizamos las ecuaciones normales,
las que nos darán estimaciones de
valores de la función que siguen una
distribución normal; esto significa que
esos valores estimados no
necesariamente son valores exactos,
sino que están afectados por la
probabilidad de ocurrencia o no.
Habíamos dicho anteriormente que para calcular los valores de la ecuación lineal
en base a la cual vamos a hacer las proyecciones y estimaciones por el método de
mínimos cuadrados se utiliza un sistema de ecuaciones normales. Esta
denominación hace recordar que los valores de estos coeficientes o parámetros no
son exactos o puntuales y sus posibles valores siguen una distribución normal.
Siendo así estos valores, también los valores de las estimaciones de y se
distribuyen normalmente.
Si miramos la gráfica, la línea gruesa representa la estimación puntual de y, el cual
es un valor promedio que se espera podría alcanzar nuestra función; pero, como se
trata de una variable aleatoria y no es seguro que este valor sea alcanzado
exactamente, tenemos también otras dos líneas más delgadas, una en la parte
superior y una en la parte inferior de la línea gruesa (promedio), distanciadas de
esta línea por el valor de una desviación estándar (revisar las tareas anteriores que
ya han sido resueltas). La forma como se distribuyen los valores de la función o
variable dependiente es siguiendo una distribución normal.
El punto donde la recta resultante corte al eje vertical, determinará el valor del
coeficiente a, y se denomina la ordenada en el origen; la inclinación que tenga la
recta, o pendiente de la recta, es el valor del coeficiente o parámetro, el cual, si es
un valor positivo significa que la recta es creciente (si la recta está representando la
producción, se espera que su valor crezca cuando crece la variable independiente
o x); y si es negativo, significa que la recta es decreciente, o se espera que su valor
decrezca.

Por ahora, vamos a llevar a cabo un ejemplo de este tipo, vamos a elaborar con los
datos un diagrama de dispersión y, posteriormente, vamos a ajustar una recta
aplicando el método de los mínimos cuadrados.

Pág. 3
Seguidamente, vamos a calcular el COEFICIENTE DE CORRELACIÓN, y el
COEFICIENTE DE DETERMINACIÓN.
El coeficiente de correlación se calcula
en base a esta fórmula, tomándose los
datos de la tabla con que hemos
trabajado nuestros datos para el cálculo de los parámetros de la ecuación.
El coeficiente de correlación nos indica en qué medida están relacionadas las
variables que están participando en nuestro análisis del problema. El valor del
coeficiente de correlación va de -1 a +1. Si el valor está cercano a -1, significa que
si el valor de la variable x aumenta los valores de la variable e irán decreciendo, es
decir, existe una relación inversa.
Si el valor del coeficiente está cercano a +1, significa que al aumentar el valor de la
variable x, el valor de la variable y también irá aumentando, o sea, existe una
relación directa.
Si el valor del coeficiente de correlación es 0, significa que no existe ninguna
relación entre las dos variables.
El COEFICIENTE DE DETERMINACIÓN es un valor que nos indica qué parte del
total de datos que explica nuestro modelo, y es igual al cuadrado del coeficiente de
determinación.
Como ejemplo miremos los siguientes datos, que nos dan información de ventas y
gastos en publicidad de una empresa, durante varios periodos.
Dato Ventas Publicidad
yx xy xy xy22 yx22
1 1000 40 40000 1000000 1600
Gráfico
2 1500 30 45000 2250000 900 70
3 1200 30 36000 1440000 900 60
4 1800 25 45000 3240000 625 50
5 800 50 40000 640000 2500 40
6 1000 60 60000 1000000 3600 30
7 500 65 32500 250000 4225 20
8 3000 10 30000 9000000 100 10
9 2500 15 37500 6250000 225 0
10 2000 20 40000 4000000 400 0 500 1000 1500 2000 2500 3000 3500
11 800 55 44000 640000 3025
12 1500 40 60000 2250000 1600
Ventas
13 2000 35 70000 4000000 1225
14 2000 30 60000 4000000 900
Sumas 21600 505 640000 39960000 21825

Pág. 4
Fórmulas del método de Mínimos Cuadrados
n(Σxy) – (Σx)( Σy)
b=
n(Σx2) – (Σx)2

Σy - b Σx
a=
n
ç

b= [14* (640,000) – ( 21,600 )(505)] / 14*(21825)(39960000) = -38.56


a= (1600-(-38.56*505))/14 = 2,934
ye = 2,934, – 38.56 X

Cálculo del COEFICIENTE DE CORRELACIÓN:


Si aplicamos la fórmula para el coeficiente de correlación, tendremos:
r= [14*640,000 – 505 * 21600] / √[14 * 21825 - 5052] [14 * 399600000 - 216002]
r = – 89.92
Ésto significa que ambas variables están relacionadas fuertemente, y el signo
negativo indica que la relación es inversamente proporcional, o sea que si el valor
de la variable independiente aumenta, el valor de la función va disminuyendo.
Cálculo del COEFICIENTE DE DETERMINACIÓN
Aplicando la fórmula que conocemos, que ya se señaló anteriormente y recordando
que este indicador es el cuadrado del coeficiente de correlación, podemos
calcularlo:
r2 = (– 0.8992)2 = 0.8086
Este valor nos indica que el modelo explica una alta proporción de los datos
originales.

NOTA:
Lea usted el presente documento, y en base al contenido resuelva el cuestionario
que tenemos en la siguiente página.
Toda la información y procedimiento para responderlo se encuentra en el presente
documento; de todas maneras, puede usted consultar con el catedrático algún
concepto que le resulte difícil comprender.
Este trabajo es para entregarlo entre el 22 y 28 de junio y tiene un valor de 50
puntos.

Pág. 5
Pág. 6
CUESTIONARIO DE EVALUACIÓN DE LA LECTURA DEL DOCUMENTO
1 – ¿Cómo nos puede servir el método de mínimos cuadrados si estamos
trabajando en un negocio como propietarios o como empleados? Explíquelo con sus
propias palabras, pero en base a la lectura.
2 - ¿Qué tipo de relación puede haber entre la variable que nos interesa con
aquellas variables que suponemos existe relación?
3 - ¿En qué caso decimos que la relación es directamente proporcional,
inversamente proporcional, que las variables son competitivas o que son
complementarias?
4 – Cuando vemos alguna relación entre dos variables, ¿significa ésto que existe
algún grado de dependencia entre ellas?
5 - ¿Cuándo decimos que podría haber una relación de dependencia lineal entre
dos variables? ¿Qué podríamos estar observando en su comportamiento para
afirmar que podría haber una dependencia de tipo lineal?
6 - ¿Cómo podemos aprovechar en la empresa esta característica? ¿Para qué nos
podría servir?
7 - ¿Qué forma tiene la función lineal y qué significa cada unos de sus elementos?
8 - ¿Qué son la Ecuaciones Normales? ¿Cómo se representan? ¿Por qué tienen
este nombre? ¿Qué representa cada uno de los elementos de las fórmulas
resultantes de despejar los valores de los parámetros en las ecuaciones normales?
¿A qué se llama ordenada en el origen y a qué se llama pendiente? ¿Qué significan
estos términos? ¿Qué es coeficiente de correlación y qué es coeficiente de
determinación y qué explican cada uno de estos indicadores?
9 – A continuación, tiene usted varios pares de datos de ingresos y seguros que se
han adquirido en función de los ingresos anuales, donde usted deberá determinar
cuál considera la variable independiente y cuál la función; elabore una gráfica en un
plano cartesiano con los datos que se le proporciona, determine antes de hacer los
cálculos si las variables tienen entre ellas una relación directamente o inversamente
proporcional, calcule los parámetros de la ecuación lineal e indique cuál es la
ecuación lineal resultante.
Calcule también el coeficiente de correlación y el coeficiente de determinación,
explicando sus resultados. Todo el trabajo práctico puede usted hacerlo siguiendo
los pasos que se muestra en el ejemplo.
No. 1 2 3 4 5 6 7 8 9 10
Ingreso
20 25 26 18 16 17 32 13 38 40
(miles)
Seguro 10 12 15 10 15 20 30 5 40 50

Pág. 7

También podría gustarte