Regresión Parabólica 1.

Definición Dadas dos variables, x e y, se dice que existe:
y

Dependencia funcional: Si y solamente si entre ellas existe una función matemática que las relaciona perfectamente, por ejemplo, entre todas las que se puede expresar su relación mediante una ecuación E = mc o F = ma.
2

y

Dependencia estadística: Cuando entre ellas existe una relación pero que no es expresable mediante un modelo matemático, por ejemplo entre oferta y demanda o peso y altura.

La regresión trata de ajustar a una nube de puntos una función de tipo matemático que se aproxime lo máximo posible a los datos. Dada cualquier nube de puntos, siempre existirá una función que se pueda ajustar sobre esos datos, aunque, evidentemente, en el caso de dependencia estadística, este ajuste no será perfecto. El principal objetivo de la regresión es ajustar una función a los datos con el fin de realizar predicciones, de tal manera que se denomina:
y

Variable dependiente: a la variable que se quiere predecir, también se conoce como variable explicada (y).

y

Variable(s) independiente(s): a la(s) que usaremos para predecir, puede haber una o varias. También son llamadas variables explicativas (x1, . . . , xn).

Se denomina regresión a intentar ajustar una función (f) a unos valores observados. De tal manera que se considerará regresión simple si solo tenemos una variable explicativa Y = f(X) y regresión múltiple si existen varias y = f(x1, x2, . . . ,xn). 2. Aplicación de las Regresiones Entre las diferentes aplicaciones de las regresiones encontramos al estudio de mercado, la cual consiste en la identificación, acopio, análisis y aprovechamiento de información. Es un proceso sistemático y objetivo diseñado para identificar y resolver problemas de marketing. Por lo tanto al hablar de investigación de mercados ésta nos lleva a la obtención de resultados, y uno de los métodos cuantitativos que encontramos dentro de dicha investigación es el análisis de regresión, que es muy usado para explicar la variación en la participación de mercado, ventas, preferencia de marca y otros resultados que nos arroje dicha investigación en términos variables de administración de marketing, como publicidad, precio, distribución y calidad. 3. Fórmulas

Si la serie tiene una curva parabólica cuyo comportamiento se describe matemáticamente por una ecuación de segundo grado (parábola). La regresión se expresa de la siguiente forma:

1

5 ± x 2  b x 3  c x 4 ! x 2 y ± 55a  225b  979c ! 1205 À xc x2 ! y Resolviendo este sistema se obtiene: a ! 0. b.25 10 33. x 1 2 3 4 5 15 y 1.y ! a  bx cx2 Dónde: y:Estimación de la variable dependiente a.25 20 101.5 68 x2 1 4 9 16 25 55 x3 1 8 27 64 125 225 x4 1 16 81 256 625 979 xy 1.5 1205 Aplicando el método de los mínimos cuadrados se obtiene el siguiente sistema de ecuaciones: na  b a a ¾ 5a  15b  55c ! 68 ± ± 2 3 x  b x  c x ! xy ¿   15a  55b  225c ! 277.5 x2y 1.47 b ! 0. Ejemplo de Regresión Parabólica Dadas dos variables.25 20 30. x e y.51 c ! 1.14 2 . ajustar a los datos una función de tipo parabólico.75 80 152.5 277. c:Constantes numéricas x:Valores de la variable independiente En la cual los valores de a.25 5 11.25 320 762. b y c se encuentran resolviendo un sistema de tres ecuaciones con tres incógnitas por medio de la siguiente relación: na  b§ x  c§ x 2 ! § y a§ x  b§ x 2  c§ x 3 ! § xy a § x 2  b§ x 3  c § x 4 ! § x 2 y 4.

La expresión para la X del área del gráfico de valores y la expresión para el grupo de categorías suele ser la misma. como mínimo. y Dispersión con puntos de datos conectados por líneas suavizadas 3 . Las categorías.14x 2 5.Por tanto. Hay tres tipos de gráficos de dispersión: gráfico XY de dispersión. Los valores se representan mediante la posición de los puntos en el espacio del gráfico. mediante diferentes puntos del gráfico. Gráfico de Dispersión Los gráficos XY o de dispersión muestran las series como un conjunto de puntos. y Dispersión con puntos de datos conectados por líneas Un gráfico de dispersión con puntos de datos conectados por líneas es idéntico a un gráfico XY (dispersión). dispersión con puntos de datos conectados por líneas y dispersión con puntos de datos conectados por líneas suavizadas. para poder mostrar datos significativos en el gráfico.51x  1. con la única diferencia de que los puntos de datos están conectados mediante líneas rectas. Los gráficos de dispersión suelen utilizarse para comparar valores distintos de las categorías. y Gráfico XY (dispersión) Un gráfico XY (dispersión) muestra cada serie de valores como puntos de datos en el espacio del gráfico conforme a los valores X e Y de la serie de valores. por su parte.47  0. Aunque los grupos de series y categorías sean opcionales. será necesario uno de estos grupos. Un gráfico de dispersión típico contiene expresiones que no son de agregado para los valores. la ecuación de la parábola de grado dos que mejor se ajusta a la nube de puntos es: y ! 0.

Si r = 0. y y Si 0 < r < 1.Un gráfico de dispersión con puntos de datos conectados por líneas es idéntico a un gráfico XY (dispersión). de tal forma que habrá más relación conforme sea mayor r. y xy W xy W xW y y: Son las desviaciones típicas de las distribuciones marginales. Este coeficiente se usa para medir el grado de relación o asociación lineal entre ambas variables. la otra también lo hace en proporción constante. Pero esto no necesariamente implica que las variables son independientes: pueden existir todavía relaciones no lineales entre las dos variables. con la única diferencia de que los puntos de datos están conectados mediante líneas curvas. existe una correlación positiva perfecta. La gráfica de dispersión del anterior ejemplo se conforma de la siguiente forma: 6. no existe relación lineal. El valor del índice de correlación varía en el intervalo [-1. Notándose como r. Coeficiente de Correlación Lineal de Pearson El coeficiente de correlación de Pearson es un índice que mide la relación lineal entre dos variables aleatorias cuantitativas. El índice indica una dependencia total entre las dos variables denominada relación directa: cuando una de ellas aumenta. 4 . verificándose además que si r es positivo la relación será en el mismo sentido (cuando una crece la otra también peso/altura) y si r es negativa lo harán en el sentido contrario (una crece y otra decrece). +1]: y Si r = 1. existe una correlación positiva. al cociente entre la covarianza de las dos variables entre el producto de las desviaciones típicas: r! Dónde: xy: Es la covarianza de x.

56953168 Al ser el coeficiente de correlación positivo.56953168 5 5 y Aplicamos la fórmula del coeficiente de correlación lineal: r! 14.6 5 5 y W xy ! y 277 .y y Si -1 < r < 0.5 x2 1 4 9 16 25 55 y2 1. la otra disminuye en proporción constante.62 ! 10. existe una correlación negativa perfecta.25 20 30.Esto quiere decir que cuando una de ellas aumenta.375 3 ! 2 Wy !  13.3750 y Hallamos las medias aritméticas: x! Calculamos la covarianza: 15 68 !3 y! ! 13. existe una correlación negativa.9834371091 2 *10.7 ! 0. la otra también lo hace. El índice indica una dependencia total entre las dos variables llamada relación inversa: cuando una de ellas aumenta. Si r = -1. Ejemplo delCoeficiente Correlación Lineal Para hallar el coeficiente de correlación de la distribución anterior se siguen los siguientes pasos a partir de la generación de la tabla.7 5 Calculamos las desviaciones típicas: Wx ! 55 2 1483. la correlación es directa. 5 . 7.25 10 33.5 277.5 68 xy 1.25 5 11.75 80 152. 5  3 * 13 .25 1483.5625 25 126.6 ! 14 .5625 400 930. x 1 2 3 4 5 15 y 1.

Sign up to vote on this title
UsefulNot useful