Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Regresion Parabolica
Regresion Parabolica
1. Definición
Dependencia funcional: Si y solamente si entre ellas existe una función matemática que las relaciona
perfectamente, por ejemplo, entre todas las que se puede expresar su relación mediante una
ecuación E = mc2 o F = ma.
Dependencia estadística: Cuando entre ellas existe una relación pero que no es expresable mediante
un modelo matemático, por ejemplo entre oferta y demanda o peso y altura.
La regresión trata de ajustar a una nube de puntos una función de tipo matemático que se aproxime lo
máximo posible a los datos. Dada cualquier nube de puntos, siempre existirá una función que se pueda ajustar sobre
esos datos, aunque, evidentemente, en el caso de dependencia estadística, este ajuste no será perfecto.
El principal objetivo de la regresión es ajustar una función a los datos con el fin de realizar predicciones, de
tal manera que se denomina:
Variable dependiente: a la variable que se quiere predecir, también se conoce como variable
explicada (y).
Variable(s) independiente(s): a la(s) que usaremos para predecir, puede haber una o varias. También
son llamadas variables explicativas (x1 , . . . , xn).
Se denomina regresión a intentar ajustar una función (f) a unos valores observados. De tal manera que se
considerará regresión simple si solo tenemos una variable explicativa Y = f(X) y regresión múltiple si existen varias y =
f(x1, x2, . . . , xn).
Entre las diferentes aplicaciones de las regresiones encontramos al estudio de mercado, la cual consiste en la
identificación, acopio, análisis y aprovechamiento de información. Es un proceso sistemático y objetivo diseñado para
identificar y resolver problemas de marketing.
Por lo tanto al hablar de investigación de mercados ésta nos lleva a la obtención de resultados, y uno de los
métodos cuantitativos que encontramos dentro de dicha investigación es el análisis de regresión, que es muy usado
para explicar la variación en la participación de mercado, ventas, preferencia de marca y otros resultados que nos
arroje dicha investigación en términos variables de administración de marketing, como publicidad, precio, distribución
y calidad.
3. Fórmulas
Si la serie tiene una curva parabólica cuyo comportamiento se describe matemáticamente por una ecuación
de segundo grado (parábola). La regresión se expresa de la siguiente forma:
1
y a bx cx2
Dónde:
y: Estimación de la variable dependiente
a, b, c: Constantes numéricas
x: Valores de la variable independiente
En la cual los valores de a, b y c se encuentran resolviendo un sistema de tres ecuaciones con tres incógnitas
por medio de la siguiente relación:
na b x c x 2 y
a x b x 2 c x 3 xy
a x 2 b x 3 c x 4 x 2 y
Dadas dos variables, x e y, ajustar a los datos una función de tipo parabólico.
x y x2 x3 x4 xy x2y
1 1.25 1 1 1 1.25 1.25
2 5 4 8 16 10 20
4 20 16 64 256 80 320
na b x c x 2 y 5a 15b 55c 68
a x b x 2 c x 3 xy 15a 55b 225c 277.5
a x 2 b x 3 c x 4 x 2 y 55a 225b 979c 1205
a 0.47
b 0.51
c 1.14
2
Por tanto, la ecuación de la parábola de grado dos que mejor se ajusta a la nube de puntos es:
5. Gráfico de Dispersión
Los gráficos XY o de dispersión muestran las series como un conjunto de puntos. Los valores se representan
mediante la posición de los puntos en el espacio del gráfico. Las categorías, por su parte, mediante diferentes puntos
del gráfico. Los gráficos de dispersión suelen utilizarse para comparar valores distintos de las categorías.
Hay tres tipos de gráficos de dispersión: gráfico XY de dispersión, dispersión con puntos de datos conectados
por líneas y dispersión con puntos de datos conectados por líneas suavizadas.
Gráfico XY (dispersión)
Un gráfico XY (dispersión) muestra cada serie de valores como puntos de datos en el espacio del gráfico
conforme a los valores X e Y de la serie de valores. Un gráfico de dispersión típico contiene expresiones que no son de
agregado para los valores. La expresión para la X del área del gráfico de valores y la expresión para el grupo de
categorías suele ser la misma. Aunque los grupos de series y categorías sean opcionales, será necesario uno de estos
grupos, como mínimo, para poder mostrar datos significativos en el gráfico.
Un gráfico de dispersión con puntos de datos conectados por líneas es idéntico a un gráfico XY (dispersión),
con la única diferencia de que los puntos de datos están conectados mediante líneas rectas.
3
Un gráfico de dispersión con puntos de datos conectados por líneas es idéntico a un gráfico XY (dispersión),
con la única diferencia de que los puntos de datos están conectados mediante líneas curvas.
El coeficiente de correlación de Pearson es un índice que mide la relación lineal entre dos variables aleatorias
cuantitativas. Notándose como r, al cociente entre la covarianza de las dos variables entre el producto de las
desviaciones típicas:
xy
r
x y
Dónde:
σxy: Es la covarianza de x, y
σx y σy: Son las desviaciones típicas de las distribuciones marginales.
Este coeficiente se usa para medir el grado de relación o asociación lineal entre ambas variables, de tal forma
que habrá más relación conforme sea mayor r, verificándose además que si r es positivo la relación será en el mismo
sentido (cuando una crece la otra también peso/altura) y si r es negativa lo harán en el sentido contrario (una crece y
otra decrece).
Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos
variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en
proporción constante.
Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables son
independientes: pueden existir todavía relaciones no lineales entre las dos variables.
4
Si -1 < r < 0, existe una correlación negativa.
Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las
dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en
proporción constante.
Para hallar el coeficiente de correlación de la distribución anterior se siguen los siguientes pasos a partir de la
generación de la tabla.
x y xy x2 y2
1 1.25 1.25 1 1.5625
2 5 10 4 25
4 20 80 16 400
15 68 277.5 55 1483.3750
15 68
x 3 y 13.6
5 5
Calculamos la covarianza:
277.5
xy 3 *13.6 14.7
5
55 2 1483.375
x 3 2 y 13.6 2 10.56953168
5 5
14.7
r 0.9834371091
2 *10.56953168
Al ser el coeficiente de correlación positivo, la correlación es directa. Esto quiere decir que cuando una de
ellas aumenta, la otra también lo hace.