Regresión Parabólica 1.

Definición Dadas dos variables, x e y, se dice que existe:
y

Dependencia funcional: Si y solamente si entre ellas existe una función matemática que las relaciona perfectamente, por ejemplo, entre todas las que se puede expresar su relación mediante una ecuación E = mc o F = ma.
2

y

Dependencia estadística: Cuando entre ellas existe una relación pero que no es expresable mediante un modelo matemático, por ejemplo entre oferta y demanda o peso y altura.

La regresión trata de ajustar a una nube de puntos una función de tipo matemático que se aproxime lo máximo posible a los datos. Dada cualquier nube de puntos, siempre existirá una función que se pueda ajustar sobre esos datos, aunque, evidentemente, en el caso de dependencia estadística, este ajuste no será perfecto. El principal objetivo de la regresión es ajustar una función a los datos con el fin de realizar predicciones, de tal manera que se denomina:
y

Variable dependiente: a la variable que se quiere predecir, también se conoce como variable explicada (y).

y

Variable(s) independiente(s): a la(s) que usaremos para predecir, puede haber una o varias. También son llamadas variables explicativas (x1, . . . , xn).

Se denomina regresión a intentar ajustar una función (f) a unos valores observados. De tal manera que se considerará regresión simple si solo tenemos una variable explicativa Y = f(X) y regresión múltiple si existen varias y = f(x1, x2, . . . ,xn). 2. Aplicación de las Regresiones Entre las diferentes aplicaciones de las regresiones encontramos al estudio de mercado, la cual consiste en la identificación, acopio, análisis y aprovechamiento de información. Es un proceso sistemático y objetivo diseñado para identificar y resolver problemas de marketing. Por lo tanto al hablar de investigación de mercados ésta nos lleva a la obtención de resultados, y uno de los métodos cuantitativos que encontramos dentro de dicha investigación es el análisis de regresión, que es muy usado para explicar la variación en la participación de mercado, ventas, preferencia de marca y otros resultados que nos arroje dicha investigación en términos variables de administración de marketing, como publicidad, precio, distribución y calidad. 3. Fórmulas

Si la serie tiene una curva parabólica cuyo comportamiento se describe matemáticamente por una ecuación de segundo grado (parábola). La regresión se expresa de la siguiente forma:

1

5 277.14 2 . Ejemplo de Regresión Parabólica Dadas dos variables. c:Constantes numéricas x:Valores de la variable independiente En la cual los valores de a.25 20 101.y ! a  bx cx2 Dónde: y:Estimación de la variable dependiente a.5 ± x 2  b x 3  c x 4 ! x 2 y ± 55a  225b  979c ! 1205 À xc x2 ! y Resolviendo este sistema se obtiene: a ! 0.25 320 762. x e y. b y c se encuentran resolviendo un sistema de tres ecuaciones con tres incógnitas por medio de la siguiente relación: na  b§ x  c§ x 2 ! § y a§ x  b§ x 2  c§ x 3 ! § xy a § x 2  b§ x 3  c § x 4 ! § x 2 y 4.5 1205 Aplicando el método de los mínimos cuadrados se obtiene el siguiente sistema de ecuaciones: na  b a a ¾ 5a  15b  55c ! 68 ± ± 2 3 x  b x  c x ! xy ¿   15a  55b  225c ! 277.51 c ! 1. b.75 80 152.47 b ! 0. x 1 2 3 4 5 15 y 1.5 x2y 1.5 68 x2 1 4 9 16 25 55 x3 1 8 27 64 125 225 x4 1 16 81 256 625 979 xy 1. ajustar a los datos una función de tipo parabólico.25 10 33.25 20 30.25 5 11.

47  0. Los gráficos de dispersión suelen utilizarse para comparar valores distintos de las categorías. Los valores se representan mediante la posición de los puntos en el espacio del gráfico. Un gráfico de dispersión típico contiene expresiones que no son de agregado para los valores. la ecuación de la parábola de grado dos que mejor se ajusta a la nube de puntos es: y ! 0. Hay tres tipos de gráficos de dispersión: gráfico XY de dispersión. por su parte.14x 2 5. con la única diferencia de que los puntos de datos están conectados mediante líneas rectas. Aunque los grupos de series y categorías sean opcionales. dispersión con puntos de datos conectados por líneas y dispersión con puntos de datos conectados por líneas suavizadas. mediante diferentes puntos del gráfico. y Dispersión con puntos de datos conectados por líneas Un gráfico de dispersión con puntos de datos conectados por líneas es idéntico a un gráfico XY (dispersión). como mínimo. La expresión para la X del área del gráfico de valores y la expresión para el grupo de categorías suele ser la misma.Por tanto.51x  1. será necesario uno de estos grupos. y Dispersión con puntos de datos conectados por líneas suavizadas 3 . Las categorías. Gráfico de Dispersión Los gráficos XY o de dispersión muestran las series como un conjunto de puntos. para poder mostrar datos significativos en el gráfico. y Gráfico XY (dispersión) Un gráfico XY (dispersión) muestra cada serie de valores como puntos de datos en el espacio del gráfico conforme a los valores X e Y de la serie de valores.

El valor del índice de correlación varía en el intervalo [-1. no existe relación lineal. de tal forma que habrá más relación conforme sea mayor r. Coeficiente de Correlación Lineal de Pearson El coeficiente de correlación de Pearson es un índice que mide la relación lineal entre dos variables aleatorias cuantitativas. verificándose además que si r es positivo la relación será en el mismo sentido (cuando una crece la otra también peso/altura) y si r es negativa lo harán en el sentido contrario (una crece y otra decrece). Este coeficiente se usa para medir el grado de relación o asociación lineal entre ambas variables. La gráfica de dispersión del anterior ejemplo se conforma de la siguiente forma: 6. y y Si 0 < r < 1. existe una correlación positiva. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta. Si r = 0.Un gráfico de dispersión con puntos de datos conectados por líneas es idéntico a un gráfico XY (dispersión). 4 . la otra también lo hace en proporción constante. y xy W xy W xW y y: Son las desviaciones típicas de las distribuciones marginales. Notándose como r. con la única diferencia de que los puntos de datos están conectados mediante líneas curvas. +1]: y Si r = 1. existe una correlación positiva perfecta. al cociente entre la covarianza de las dos variables entre el producto de las desviaciones típicas: r! Dónde: xy: Es la covarianza de x. Pero esto no necesariamente implica que las variables son independientes: pueden existir todavía relaciones no lineales entre las dos variables.

62 ! 10. la otra también lo hace.5 68 xy 1.9834371091 2 *10. Si r = -1.25 20 30. 7. 5 . 5  3 * 13 . El índice indica una dependencia total entre las dos variables llamada relación inversa: cuando una de ellas aumenta.7 ! 0. x 1 2 3 4 5 15 y 1.6 ! 14 .75 80 152.56953168 5 5 y Aplicamos la fórmula del coeficiente de correlación lineal: r! 14.7 5 Calculamos las desviaciones típicas: Wx ! 55 2 1483.56953168 Al ser el coeficiente de correlación positivo.6 5 5 y W xy ! y 277 .25 1483. la otra disminuye en proporción constante. la correlación es directa. Ejemplo delCoeficiente Correlación Lineal Para hallar el coeficiente de correlación de la distribución anterior se siguen los siguientes pasos a partir de la generación de la tabla.5 277.5625 25 126.Esto quiere decir que cuando una de ellas aumenta.y y Si -1 < r < 0.5 x2 1 4 9 16 25 55 y2 1. existe una correlación negativa perfecta.3750 y Hallamos las medias aritméticas: x! Calculamos la covarianza: 15 68 !3 y! ! 13. existe una correlación negativa.25 5 11.25 10 33.375 3 ! 2 Wy !  13.5625 400 930.

Sign up to vote on this title
UsefulNot useful