Está en la página 1de 4

Enfoque sobre modelado

Un modelo es una representacin de un objeto o un proceso. Por ejemplo, un Ferrari de juguete es un modelo del
auto real; un mapa de caminos es un modelo de las calles en una ciudad. Un modelo matemtico es una
representacin matemtica (por lo general una ecuacin) de un objeto o proceso. Una vez hecho un modelo
matemtico, ste se puede usar para obtener informacin til o hacer predicciones acerca de lo que est siendo
modelado.

Regresin de mnimos cuadrados y calculadoras de grficas


La recta que mejor se ajusta a los datos
La recta de mejor ajuste es aquella tan cercana como sea posible a todos
los puntos de datos. sta es la recta para la cual la suma de las distancias
verticales de los puntos de datos a la recta es tan pequea como sea
posible (vea la figura a la derecha). Por razones tcnicas es mejor usar la
recta donde la suma de los cuadrados de estas distancias sea la ms
pequea. sta se denomina recta de regresin.

Para hallar un modelo que calcule los datos con ms precisin, los estadsticos usan una medida llamada suma de
diferencias cuadradas, que es la suma de los cuadrados de las diferencias entre valores reales de datos y valores
del modelo. El modelo lineal de mejor ajuste, llamado recta de regresin de mnimos cuadrados, es el de
mnima suma de diferencias cuadradas.
La frmula para la recta de regresin se encuentra por medio de clculo, pero afortunadamente la frmula est
programada en casi todas las calculadoras graficadoras.
Esta recta se puede calcular visualmente si se determinan los puntos de datos y se traza la recta que parece ajustar
mejor, o se pueden ingresar datos en una calculadora o computadora y usar el comando regression de esos
aparatos. Cuando se usa la funcin regression de una calculadora o programa de computadora, se observa que el
programa tambin puede dar como salida un valor r. Este valor r es el coeficiente de correlacin de los datos y
da una medida de qu tan bien se ajusta el modelo a estos ltimos. Cuanto ms cercano sea el valor de a 1, mejor es
el ajuste.
Qu tan bueno es el ajuste?
Para cualquier conjunto determinado de datos con dos variables siempre es posible hallar una recta de regresin,
incluso si los puntos de datos no tienden a estar en una recta y si las variables parecen no estar relacionadas en
absoluto.
Una calculadora graficadora puede darnos una recta de regresin por cada una de estas grficas de dispersin, pero,
qu tan bien representan o se ajustan estas lneas a los datos? Para contestar esta pregunta, los expertos en
estadstica han inventado el coeficiente de correlacin, por lo general denotado por r. El coeficiente de correlacin
es un nmero entre 1 y 1 que mide qu tan cercanamente los datos siguen a la recta de regresin, o bien, en otras
palabras, qu tan fuertemente estn correlacionadas las variables. Numerosas calculadoras dan el valor de r
cuando calculan la recta de regresin.
El graficador utiliza varias estrategias para ajustar estas curvas a los datos, la mayora de ellas basadas en la combinacin de
funcin composicin con regresin lineal. Dependiendo del tipo de regresin, el graficador puede mostrar un nmero r
denominado coeficiente de correlacin o un nmero r 2 o R 2 , denominado coeficiente de determinacin. En cualquier
caso, una regla emprica til es: entre ms cercano, en valor absoluto, sea este nmero a 1, mejor se ajusta la curva a los
datos.

Veamos tres grficas de dispersin, donde el coeficiente de correlacin de la grfica de dispersin est indicado en
la misma.
En la primera grfica de dispersin, los puntos de datos estn cercanos a una recta.
En la segunda grfica, todava se observa una tendencia lineal pero los puntos estn ms dispersos.
En la tercera grfica no parece haber ninguna tendencia en absoluto, lineal o de otro tipo.

Para la primera grfica, r es cercana a 1 porque los datos estn muy cercanos a ser lineales.
La segunda grfica tambin tiene una r relativamente grande, pero no tan grande como la primera, porque los
datos, si bien son bastante lineales, estn ms difusos.
La tercera grfica tiene una r cercana a 0, ya que prcticamente no hay tendencia lineal en los datos.
Correlacin lineal y modelacin
La figura muestra cinco tipos de diagramas de dispersin.

Cuando los puntos del diagrama estn concentrados a lo largo de una recta, decimos que hay una correlacin
lineal entre las cantidades representadas por los datos.
Cuando se dibuja un valo alrededor de los puntos en el diagrama de dispersin, hablando en trminos generales,
entre ms angosto, mayor es la correlacin lineal.
Cuando el valo est inclinado como una recta con pendiente positiva (como en las figuras a y b), los datos tienen
una correlacin lineal positiva. Por otra parte, cuando se inclina como una recta con pendiente negativa (como en
las figuras d y e), los datos tienen una correlacin lineal negativa. Algunos diagramas de dispersin exhiben poca o
ninguna correlacin lineal (figura c) o no tiene patrones lineales.
Un nmero que mide la fuerza y direccin de la correlacin lineal de un conjunto de datos es el coeficiente de
correlacin (lineal), r.
Propiedades del coeficiente de correlacin, r
1. Su valor se encuentra entre 1 r 1.
2. Cuando r 0, existe una correlacin lineal positiva.
3. Cuando r 0, existe una correlacin lineal negativa.
4. Cuando r 1, existe una fuerte correlacin lineal.
Si r es cercana a 1 o a 1, entonces las variables estn fuertemente correlacionadas, es decir, la grfica de
dispersin sigue muy de cerca a la recta de regresin.
5. Cuando r 0, no hay o es muy dbil la correlacin lineal.
Si r es cercana a 0, entonces las variables estn dbilmente correlacionadas o no estn correlacionadas para
nada. (El signo de r depende de la pendiente de la recta de regresin.)
La correlacin reporta al proceso de modelacin dndonos una medida de la bondad del ajuste. Sin embargo, una
buena prctica de modelacin exige que tengamos una razn terica para seleccionar el modelo. Por ejemplo, en
administracin los costos fijos se modelan por una funcin constante (de otra forma no seran fijos).
No hay reglas rgidas y rpidas para determinar qu valores de r son suficientes para decidir que una correlacin
lineal es significativa. El coeficiente de correlacin es slo una gua aproximada para ayudarnos a decidir cunta
fe poner en una determinada recta de regresin.

Construccin de una funcin con base en datos

Dado un conjunto de puntos de informacin de la forma x; y , para construir una frmula que aproxime y como
funcin de x:
1. Haga un diagrama de dispersin de los puntos. Los puntos no necesitan pasar el criterio de la recta vertical.
2. Con base en la forma del diagrama, determine si los puntos parecen seguir la grfica de un tipo conocido de
funcin (recta, parbola, cbica, curva seno, etctera).
3. Transforme una funcin bsica de ese tipo para ajustar los puntos tanto como sea posible.
Adems de las rectas, podemos modelar diagramas de dispersin con otras curvas elegidas de la opcin apropiada
de regresin en una calculadora o una computadora.

Qu pueden decirnos las grficas


Algunos atributos de la funcin tales como dominio, rango, continuidad, asntotas, mximos y mnimos, creciente,
decreciente y comportamiento en los extremos, son tanto grficos como algebraicos. Adems, las claves visuales
con frecuencia son ms fciles de observar que las algebraicas.