Está en la página 1de 12

36

U.T.N. - F.R.R.-Año 2005

ESTADISTICA DESCRIPTIVA
RELACIONES ENTRE VARIABLES
Unidad 5 - TEORIA DEL AJUSTAMIENTO
Profesor Titular: Eº Mario J. Garber

1 - DEPENDENCIA FUNCIONAL Y DEPENDENCIA ESTADISTICA:


Cuando dos variables cualesquiera Xi e Yi están relacionadas por una expresión
matemática de cualquier tipo (por ejemplo, Yi  a  bX i o Yi  aebx ) se dice que entre ellas
existe una dependencia funcional. Este tipo de dependencia es tal que a determinados valores
de la variable Xi le corresponden determinados y definidos valores de la variable Yi.
En cambio se dice que entre dos variables Xi e Yi existe una dependencia estadística
cuando se presupone que entre ambas hay algún tipo de relación y a determinados valores de la
variable Xi le corresponden indeterminados e indefinidos valores de la variable Yi. Ejemplos de
dependencia estadística son los siguientes:
 la variable Xi es el ingreso y la variable Yi es el ahorro, en cuyo caso, si bien
se sabe por el imperio de las leyes económicas hay una relación directa entre
el ingreso y el ahorro, dos personas con iguales ingresos no ahorrarán lo
mismo.
 la variable Xi es el precio de un bien y la variable Yi es la demanda: entre
ambas variables sólo existe una dependencia estadística.
Por consiguiente, la dependencia estadística entre dos variables presupone la existencia
de una relación entre ellas. Inicialmente, esa relación se descubre fundamentalmente por
medio de mecanismos empíricos, en especial, la observación de los fenómenos que ligan a
ambas variables.
Cuando entre dos variables no existe dependencia estadística se dice que ellas son
estadísticamente independientes. Por ejemplo, no parece que exista dependencia estadística
alguna entre el precio del algodón en bruto y la producción de uva para el consumo, por lo que
estas dos variables serían estadísticamente independientes.

2 - CONCEPTO DE AJUSTAMIENTO - APLICACIONES:


Supongamos la existencia de dos variables Xi e Yi, y se sabe o simplemente se supone
que entre ellas existe algún tipo de relación que insinúe una dependencia estadística. Por
ejemplo, se puede pensar en los siguientes casos: el empleo y la producción; el precio de un
bien y su oferta; el nivel de las tasas de interés y el de los depósitos.
Para cada una de las variables bajo análisis se obtiene n valores empíricos, es decir, n
datos provenientes de la realidad, que se ordenan en una tabla que tiene el siguiente formato:
Xi Yi
X1 Y1
X2 Y2
… …
Xn Yn
La tabla anterior contiene, entonces, n pares de datos empíricos de la forma (Xi;Yi).
Con ese conjunto de valores se construye un gráfico (ver gráfico Nº 1) denominado diagrama de
dispersión, que muestra la disposición de n puntos en el plano.

--------------------------
Probabilidades y Estadística – Año 2005
37

GRAFICO Nº 1: DIAGRAMA DE DISPERSION

La Teoría del Ajustamiento trata sobre los procedimientos destinados a ajustar


linealmente los puntos del diagrama de dispersión, lo cual significa encontrar la ecuación de
la función de primer grado (línea recta) que mejor explique la dependencia estadística
existente, es decir, que mejor explique el comportamiento de los n puntos del diagrama.
Este procedimiento difiere del método de la interpolación que consiste en hallar la
función de grado (n-1) que pase exactamente por todos esos puntos, lo que resulta una tarea
tanto laboriosa como excesiva por varias razones, a saber:
 como puede apreciarse, los puntos señalados en el diagrama de dispersión son
el reflejo de los datos empíricos registrados, y normalmente ese conjunto de
datos proviene de una muestra. Ahora bien, muestras diferentes con toda
seguridad pueden dar lugar a resultados diferentes, lo cual conlleva a que, en
ese caso, los puntos de un diagrama de dispersión no coincidirán con los de
otro diagrama y, por eso mismo, resultará necesario recalcular todo el proceso
de interpolación, repitiendo una tarea sumamente laboriosa.
 asimismo, el trabajo que se propicia con el ajustamiento, tal como se indica
más arriba, es explicar el comportamiento de los puntos del diagrama, lo
que significa encontrar una función que muestre la tendencia general que sigue
el fenómeno bajo estudio. Con la interpolación, en cambio, tal como se señaló,
se estaría encontrando una función que pase por todos los puntos, un
objetivo completamente alejado de las intenciones de la Teoría del
Ajustamiento.
Por otro lado, además de describir linealmente la relación existente entre dos variables,
otro de los objetivos del ajustamiento es la estimación o el pronóstico, es decir que una vez
hallada la expresión de la función matemática de primer grado, ella puede ser utilizada para
estimar valores de la variable dependiente Yi para valores seleccionados de la variable
independiente Xi.

3 - DIAGRAMA DE DISPERSION - SU IMPORTANCIA:


La construcción del diagrama de dispersión es imprescindible y debe ser la primera
acción que realice el investigador cuando tiene los datos empíricos en su poder. Una vez
construido, es sumamente conveniente observar la disposición de los puntos contenidos en
él, lo que permite decidir si un ajuste lineal es procedente o si corresponde un ajuste de otro tipo,
aunque debe aclararse que cualquiera sea la disposición de los puntos todo diagrama de
dispersión admite un ajustamiento de tipo lineal. Si bien una disposición de puntos no lineal no
--------------------------
Probabilidades y Estadística – Año 2005
38

estaría bien representada por una función de primer grado, esa función, se reitera, puede
calcularse perfectamente sin inconvenientes. En todo caso, la decisión de que un ajuste sea lineal
o no depende del investigador del problema, por lo que se insiste en que lo imprescindible es
construir, en primer lugar, el diagrama de dispersión.
Algunos casos de disposición no lineal se muestran en los gráficos siguientes:

Observando ambos diagramas queda perfectamente claro que los puntos no siguen una
disposición lineal y que, por eso mismo, un ajuste de ese tipo no sería apropiado. Con
posterioridad se verá que existen algunas soluciones para aquellos casos de ajustamiento en los
cuales los diagramas de dispersión presentan una disposición no lineal.

4 - METODOS DE AJUSTAMIENTO LINEAL:


Los métodos de ajustamiento lineal se pueden clasificar en métodos subjetivos y
métodos objetivos. Los métodos subjetivos pueden concluir en diferentes soluciones para un
mismo problema según quien sea el investigador, mientras que los objetivos permiten encontrar
la misma solución, independientemente del investigador que la desarrolle.

a) Método subjetivo: Ajustamiento a mano alzada: este método consiste en analizar la


disposición de los puntos del diagrama de dispersión para, posteriormente, trazar aquella recta
que, a juicio del dibujante, cumpla con los requisitos del ajustamiento lineal. Si bien el método es
sumamente simple, su carácter de subjetivo le quita rigurosidad por las posibles diferencias entre
las rectas trazadas por diferentes investigadores. Además, una dificultad adicional del método
subjetivo es que no permite obtener la expresión matemática de la función lineal que se dibuja.

b) Método objetivo: Método de los mínimos cuadrados: este procedimiento es creación


del matemático alemán Gauss quien sugirió un criterio objetivo para determinar cuál es la mejor
recta de ajustamiento. Según él, es aquella que minimiza la sumatoria de los cuadrados de los
desvíos existentes entre los puntos empíricos del diagrama de dispersión y la propia recta
de ajustamiento. Es decir que este procedimiento consiste en encontrar una función lineal del
tipo Yi  a1  b1 X i que cumpla las condiciones sugeridas por Gauss.
Según el criterio de Gauss, un desvío di es la diferencia entre un punto empírico de
ordenada Yi y un punto teórico de ordenada Yi , es decir que di  Yi  Yi . Gráficamente, si

--------------------------
Probabilidades y Estadística – Año 2005
39

ampliamos un sector del diagrama de dispersión y tomamos en él a un punto empírico particular


de coordenadas (Xj;Yj) observaremos que el desvío d j  Yj  Yj (Ver gráfico Nº 2):

GRAFICO Nº 2: DESVIO EN EL PUNTO YJ

Si bien el gráfico precedente es parcial porque presenta la situación referida a un solo


punto siendo que en un diagrama de dispersión hay n puntos, sirve para explicar de una manera
sencilla cómo se debe entender el desvío, y permite verificar con claridad que cualquier desvío di
puede ser positivo (si el punto empírico está por encima de la recta, como en este caso),
negativo (si el punto empírico está por debajo de la recta) o nulo ( si el punto empírico coincide
con la recta).
Considerando ahora todos los posibles desvíos en el diagrama de dispersión, si los
elevamos al cuadrado y los sumamos, obtendremos la siguiente expresión, a la que llamaremos

2
  d 2   Y  Y   Y  a  b X 
  
2
i i i i 1 1 i

Como ya se indicó, Gauss postula que la mejor recta es aquélla que minimiza esos
desvíos al cuadrado. Si bien en el plano existen infinitas rectas, cada una con un par de
parámetros a1 y b1, de todas ellas sólo una cumple con la condición impuesta por Gauss. Se
trata de encontrarla, y eso equivale a encontrar sus parámetros a1 y b1. De acuerdo con los
procedimientos del Análisis Matemático, eso se consigue minimizando la función , es decir
haciendo
   Yi  a1  b1 X i   min.
2

Para eso, en primer lugar, debe calcularse la primera derivada de  con respecto al
parámetro a1, e igualársela a cero.
   Yi  a1  b1 X i 
2

  2 Yi  a1  b1 X i   1  2 Yi  a1  b1 X i   0


a1 a1
Como el factor (-2) es distinto de cero, entonces debe ser  Yi  a1  b1 X i   0 . Aplicando
sumatoria a todo el paréntesis, quedará  Yi  na1  b1 X i  0 , y por pasaje de términos se
obtiene
 Yi  na1  b1 X i
expresión ésta denominada Primera ecuación normal de Gauss.

--------------------------
Probabilidades y Estadística – Año 2005
40

Con idéntico criterio se deriva respecto del parámetro b1:


   Yi  a1  b1 X i 
2

  2 Yi  a1  b1 X i  X i   2 Yi X i  a1 X i  b1 X i2   0


b1 b1
Como (-2) es distinto de cero, debe ser  Yi X i  a1 X i  b1 X i2   0 .A partir de esta
igualdad, se verifica que  Yi X i  a1 X i  b1 X i2  0 , por lo que finalmente, mediante un
pasaje de términos, se obtiene la siguiente expresión
 Yi X i  a1 X i  b1 X i2
que se denomina Segunda ecuación normal de Gauss.
Ambas ecuaciones normales conforman un sistema de dos ecuaciones lineales con dos
incógnitas (a1 y b1), cuya resolución puede efectuarse por medio de alguno de los cuatro métodos
existentes para este tipo de sistemas. Aplicando el Método de los Determinantes, las incógnitas
se calculan del siguiente modo
 Yi  X i
a1 
 Yi X i  X i2  Yi  X i2   X i  Yi X i

 Xi n X i2   X i 
2
n
 X i  X i2
n  Yi
b1 
 Xi  Yi X i 
n Yi X i   X i  Yi
 Xi n X i2   X i 
2
n
 Xi  X i2
Se puede ver fácilmente que ambos parámetros son calculados a partir de expresiones
basadas exclusivamente en los datos empíricos.
Lo que quedaría por analizar es si el punto crítico obtenido corresponde a un máximo o a
un mínimo, para lo cual se debería obtener la segunda derivada y verificar su signo. Sin
embargo, en este caso eso no es necesario porque aquí ocurre algo similar a lo visto en la tercera
propiedad de la media aritmética. En su recorrido a través del diagrama de dispersión, la
recta de ajustamiento se comporta como una medida de posición aunque de carácter
dinámico (no de carácter estático, como sería el caso de una media aritmética) ya que cumple
con esa propiedad (equivalente a la segunda propiedad de la media aritmética) de que
  
 Y  Y   0 , cuya verificación es sencilla: aplicando sumatoria tenemos
i i

 Yi  a1  b1 X i   Yi  na1  b1 X i  0 por la primera ecuación normal de


Gauss.
Si la recta de ajustamiento se comporta como una medida de posición y cumple con todas
sus propiedades, el criterio de los mínimos cuadrados de Gauss nos remite a la tercera propiedad
de la media aritmética, en la cual el único punto crítico obtenido en el proceso del análisis
debe ser mínimo, ya que el máximo no tiene límite. Efectivamente: si una recta particular
minimiza la suma de los desvíos al cuadrado, alejarla de los puntos empíricos (tanto en un
sentido como en el otro) produce un aumento en el valor de los desvíos y, por consiguiente, de su

--------------------------
Probabilidades y Estadística – Año 2005
41

suma al cuadrado, por lo que el máximo no tiene límite y la única cota obtenida mediante
este procedimiento resulta un mínimo.
La interpretación estadística de ambos parámetros es la siguiente:
 el parámetro “a” indica cual es la cantidad promedio de la variable Yi
para un valor igual a cero de la variable Xi, y
 el parámetro “b” indica cuál es la variación promedio de la variable Yi que
corresponde a una unidad de variación para la variable Xi.
El trabajo de cálculo de los parámetros se organiza construyendo la tabla siguiente:
Xi Yi Xi 2 Xi Y i
X1 Y1 X12 Xi Yi
X2 Y2 X22 X2 Y2
… … … …
Xn Yn Xn2 Xn Yn
 Xi Yi  X i2  X i Yi
con la cual se obtienen todos los términos involucrados en el cálculo de los parámetros.

Ejemplo: Sean dos variables Xi e Yi para las cuales se dispone de los siguientes datos
empíricos:

Xi Yi Xi2 Xi Y i El diagrama de dispersión que se construye


1 3 1 3 más abajo, permite verificar que la disposición
2 5 4 10 de los puntos no resulta ser muy lineal. Sin em-
3 1 9 3 bargo podrá ver que no existe ningún impedi-
4 2 16 8 mento teórico para calcular una función de ajusta-
5 4 25 20 miento lineal. En el gráfico Nº 3 también se ha
15 15 55 44 trazado la línea de ajustamiento hallada.

GRAFICO Nº 3: DIAGRAMA Y LINEA DE AJUSTE

Los cálculos para obtener los parámetros se efectúan aplicando las fórmulas, lo cual da

--------------------------
Probabilidades y Estadística – Año 2005
42

a1 
1555  4415  825  660  165  3,3
555  15 275  225 50
2

5 44  1515 220  225  5


b1     0,10
555  15 2 50 50
Por consiguiente, la ecuación de la recta hallada es Yi  3,3  0,10 X i .

Método abreviado: Este método parte del supuesto siguiente: si en las ecuaciones
normales de Gauss se consiguiera que  X i  0 , las fórmulas para calcular los parámetros
podrían reducirse significativamente. Para que se anule la sumatoria de la variable Xi, se la
transforma convenientemente, haciendo xi  X i  X , con lo cual la  xi   X i  X   0 por la
segunda propiedad de la media aritmética. De esa manera, si se efectuara el desarrollo teórico
para encontrar las fórmulas de los parámetros con las variables xi e Yi en lugar de con las
variables Xi e Yi, las ecuaciones normales que se obtendrían tendrían la siguiente forma:
 Y  na1  b1 xi  na1 .
 Yi X i  a1 xi  b1 xi2  b1  xi2 , debido precisamente a que  xi 0 .
Se observará que en las expresiones precedentes aparece la variable xi en lugar de Xi, y
que los parámetros se indican con una simbología modificada, a1 y b1 . Esto se realiza por
precaución, ya que la transformación de la variable Xi en xi podría eventualmente conducir a una
modificación en el valor original de los parámetros y de esa manera se prevé esa alternativa.
De ambas ecuaciones normales así construidas y mediante un simple pasaje de términos,
se obtienen las expresiones para calcular los nuevos parámetros mediante el método abreviado:

a1    Y  xiYi
Yi
b1 
n  xi2
La simple comparación entre éstas y las fórmulas obtenidas originalmente, permite
comprobar que el método abreviado, efectivamente, reduce notoriamente su tamaño y
complejidad.
Utilizando los nuevos parámetros la recta de ajustamiento puede ser escrita del siguiente
modo: Yi  a1  b1xi . Sin embargo, si bien el método abreviado intenta calcular los parámetros
mediante fórmulas más breves, al concluir el cálculo no se obtienen a1 y b1 , los verdaderos
parámetros. Para llegar a esos valores se parte de considerar que existen dos expresiones
posibles para la recta de ajustamiento, es decir, por un lado, Yi  a1  b1 X i y por el otro,
Y  a   bx . Como además, se sabe que x  X  X , en la segunda de esas expresiones se
i 1 1 i i i
reemplaza xi, quedando
Yi  a1  b1 X i  X   a1  b1 X i  b1 X   a1  b1 X   b1 X i . Pero recordando que
   

Yi  a1  b1 X i , se comparan ambas expresiones, y claramente se concluye


que
b1  b1 y que

--------------------------
Probabilidades y Estadística – Año 2005
43

a1  a1  b1 X  Y  b1 X
con lo cual se obtienen los verdaderos parámetros a1 y b1 a partir de los calculados a1 y b1 .

Interpretación gráfica del método abreviado:

La base del método abreviado consiste en transformar la variable Xi en una variable


centrada xi. Ahora bien, desde el punto de vista gráfico, como construir una variable centrada
significa restar X a todos los valores de la variable Xi, esa construcción implica correr todos los
puntos empíricos X unidades hacia la izquierda o, lo que es lo mismo, correr el eje de las
ordenadas X hacia la derecha.
Obsérvese el gráfico siguiente para interpretar lo señalado precedentemente. Así, podrá
verse que en él se han representado los n puntos empíricos y la recta de ajustamiento, y que se
han indicado dos ejes de abscisas que deben utilizarse alternativamente según se trabaje con la
variable Xi o con la xi, con lo que claramente se descubre la correspondencia entre los valores de
ambas variables, de modo que el valor X en el eje Xi corresponde al valor cero en el eje xi.
También puede observarse que el eje Yi se presenta tanto en su posición original como en una
nueva posición, corrido hacia la derecha, y que en este caso su trazado coincide con X . Como
correr los ejes hacia uno u otro lado no modifica la pendiente de la recta, fácilmente se
comprende que b1´ es igual a b1 (ambos valores son la tangente del ángulo  mientras que lo
que sí se modifica con el corrimiento del eje Yi es la ordenada al origen de la recta de
ajustamiento, por lo que a1´ es diferente a a1 (se indican las dos).

GRAFICO Nº 4: METODO ABREVIADO

En otro orden de cosas, si ampliamos un sector del gráfico y lo presentamos en forma


independiente, podemos sacar una conclusión trigonométrica de la fórmula que permite calcular
a1´.

--------------------------
Probabilidades y Estadística – Año 2005
44

GRAFICO Nº 5: ANALISIS DE a1´

sen.  a1  a1
Recordemos que tg.   b1    a1  a1  b1 X  Y  b1 X
cos.  X

5 - CASO INVERSO (CON YI COMO VARIABLE INDEPENDIENTE):


El caso inverso consiste en imaginar una alternativa que resulta sólo posible desde el
punto de vista teórico: que en un problema de ajustamiento la variable independiente sea Yi
en lugar de Xi. Se reitera que esta posibilidad sólo puede presentarse teóricamente porque en la
vida real la solución de cualquier problema de ajustamiento se encara definiendo siempre
anticipadamente cuál es la variable independiente y a ella normalmente se la simboliza con
Xi. Sin embargo, una vez definida esta circunstancia, puede pensarse que el conjunto particular
de datos con el que se está trabajando puede originar otro problema de ajustamiento, que
llamaremos caso inverso, en el que la variable independiente sea la simbolizada
tradicionalmente con Yi. Gráficamente esto da lugar a la aparición de una segunda recta de
ajustamiento simbolizada como X  a 2  b2Yi la cual, en realidad, no es una segunda recta
teóricamente hablando, sino la misma recta Y observada desde un ángulo completamente
i
diferente. Por esa circunstancia puede resultar apropiado denominar “recta reflejo” a la recta de
ajustamiento X  a 2  b2Yi .
En general, ocurre que a  a , que b  b y que el trazado de Y no coincide con el de
1 2 1 2 i

X i .
Pensando en la recta de ajustamiento inversa X i , sus ecuaciones normales son
 X i  na2  b2  Yi
 Yi X i  a2  Yi  b2  Yi2
en las cuales se observa una similitud con las ecuaciones normales para la ecuación Yi , pero con
la variable Yi en lugar de Xi, y viceversa.
Finalmente, las fórmulas de los parámetros a2´ y b2´ del caso inverso, calculadas
mediante el método abreviado, son
a2    X b2  
Xi yi X i
n  yi2

--------------------------
Probabilidades y Estadística – Año 2005
45

GRAFICO Nº 6: RECTAS DE AJUSTE X e Y ESTIMADAS

6 - PUNTO DE CRUCE DE LAS RECTAS DE AJUSTAMIENTO:


El gráfico precedente, en el que se observan las rectas de ajustamiento Yi y X i , permite
la formulación de la pregunta de en qué punto se cruzan ellas. Para contestarla, se parte de la
primera ecuación normal de Gauss aplicada en ambos casos, es decir
 Yi  na1  b1 X i y  X i  na2  b2  Yi y se dividen ambas por n,
resultando
 Yi  na1  b1  X i y  X i  na2  b2  Yi , expresiones éstas que pueden
n n n n n n
también escribirse como Y  a1  b1 X y X  a2  b2 Y
 
con lo cual se demuestra que el punto de coordenadas  X ; Y
 
satisface las dos ecuaciones
correspondientes a las rectas de ajustamiento, por lo que ambas rectas pasan por ese punto y
por consiguiente, se cruzan en él (ver gráfico Nº 6 precedente).

--------------------------
Probabilidades y Estadística – Año 2005
46

CUADRO SINOPTICO SOBRE AJUSTAMIENTO


Colaboración de la Profesora María de los Arcos Martínez
Ajustamiento Lineal

Datos Empíricos

Diagrama de
Dispersión

Ajustamiento Ajustamiento
Lineal No Lineal

Métodos Método

Subjetivos Objetivos Objetivo

Mano Alzada Semipromedios Mínimos Mínimos


Cuadrados Cuadrados

Parabólico Exponencial Potencial Logarítmico

PREGUNTAS TEORICAS SOBRE TEORIA DEL AJUSTAMIENTO

1) ¿Cuál de las siguientes es la condición básica que debe cumplirse en el criterio de los
mínimos cuadrados propuesto por Gauss?
a)   Yi  Y   0
2
  Yi   minimo

b) Yi
 
2


 
c)  Yi  Y   minimo
 
2) En un problema de ajustamiento lineal se obtienen los siguientes datos:
a1  3 X 5 Y 6
¿Cómo es la pendiente de la recta de ajustamiento?
a) positiva
b) negativa
c) nula

BIBLIOGRAFIA CONSULTADA:

 Berenson – Levine
“Estadística básica en Administración”
Editorial Prentice Hall - 6ª Edición
 Kazmier L. – Díaz Matta A.
“Estadística Aplicada a Administración y Economía”
Editorial McGraw Hill - 2ª Edición

--------------------------
Probabilidades y Estadística – Año 2005
47

 Levin – Rubin
“Estadística para Administradores”
Editorial Prentice Hall - 6ª Edición
 Montiel - Ríos - Barón
“Elementos Básicos de Estadística Económica y Empresarial”
Editorial Prentice Hall - Año 1996
 Mendenhall – Reinmuth
“Estadística para Administración y Economía”
Grupo Editorial Iberoamérica – Año 1993
 Johnston
“Métodos de Econometría”
Editorial Vinces-Vives - 3ª Edición - Año 1975
 Gujarati
“Econometría”
Editorial McGraw Hill - 2ª Edición - Año 1993
 Spiegel M. –
“Teoría y Problemas de Estadística” -
Editorial Shaum

--------------------------
Probabilidades y Estadística – Año 2005

También podría gustarte