Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Regresion Parabolica
Regresion Parabolica
1.
Definicin
Dadas dos variables, x e y, se dice que existe:
Dependencia funcional: Si y solamente si entre ellas existe una funcin matemtica que
las relaciona perfectamente, por ejemplo, entre todas las que se puede expresar su
relacin mediante una ecuacin E = mc2 o F = ma.
Dependencia estadstica: Cuando entre ellas existe una relacin pero que no es
expresable mediante un modelo matemtico, por ejemplo entre oferta y demanda o
peso y altura.
La regresin trata de ajustar a una nube de puntos una funcin de tipo matemtico que se
aproxime lo mximo posible a los datos. Dada cualquier nube de puntos, siempre existir una funcin
que se pueda ajustar sobre esos datos, aunque, evidentemente, en el caso de dependencia estadstica,
este ajuste no ser perfecto.
El principal objetivo de la regresin es ajustar una funcin a los datos con el fin de realizar
predicciones, de tal manera que se denomina:
Variable(s) independiente(s): a la(s) que usaremos para predecir, puede haber una o
varias. Tambin son llamadas variables explicativas (x1 , . . . , xn).
Se denomina regresin a intentar ajustar una funcin (f) a unos valores observados. De tal
manera que se considerar regresin simple si solo tenemos una variable explicativa Y = f(X) y
regresin mltiple si existen varias y = f(x1, x2, . . . , xn).
2.
Entre las diferentes aplicaciones de las regresiones encontramos al estudio de mercado, la cual
consiste en la identificacin, acopio, anlisis y aprovechamiento de informacin. Es un proceso
sistemtico y objetivo diseado para identificar y resolver problemas de marketing.
Por lo tanto al hablar de investigacin de mercados sta nos lleva a la obtencin de resultados,
y uno de los mtodos cuantitativos que encontramos dentro de dicha investigacin es el anlisis de
regresin, que es muy usado para explicar la variacin en la participacin de mercado, ventas,
preferencia de marca y otros resultados que nos arroje dicha investigacin en trminos variables de
administracin de marketing, como publicidad, precio, distribucin y calidad.
3.
Frmulas
Si la serie tiene una curva parablica cuyo comportamiento se describe matemticamente por
una ecuacin de segundo grado (parbola). La regresin se expresa de la siguiente forma:
y a bx cx 2
Dnde:
y: Estimacin de la variable dependiente
a, b, c: Constantes numricas
x: Valores de la variable independiente
En la cual los valores de a, b y c se encuentran resolviendo un sistema de tres ecuaciones con
tres incgnitas por medio de la siguiente relacin:
na b x c x 2 y
a x b x 2 c x 3 xy
a x 2 b x 3 c x 4 x 2 y
4.
x2
x3
x4
xy
x2y
1.25
1.25
1.25
16
10
20
11.25
27
81
33.75
101.25
20
16
64
256
80
320
30.5
25
125
625
152.5
762.5
15
68
55
225
979
277.5
1205
na b x c x 2 y
a x b x 2 c x 3 xy
a x 2 b x 3 c x 4 x 2 y
5a 15b 55c 68
15a 55b 225c 277.5
55a 225b 979c 1205
a 0.47
b 0.51
c 1.14
Por tanto, la ecuacin de la parbola de grado dos que mejor se ajusta a la nube de puntos es:
5.
Grfico de Dispersin
Los grficos XY o de dispersin muestran las series como un conjunto de puntos. Los valores se
representan mediante la posicin de los puntos en el espacio del grfico. Las categoras, por su parte,
mediante diferentes puntos del grfico. Los grficos de dispersin suelen utilizarse para comparar
valores distintos de las categoras.
Hay tres tipos de grficos de dispersin: grfico XY de dispersin, dispersin con puntos de
datos conectados por lneas y dispersin con puntos de datos conectados por lneas suavizadas.
Grfico XY (dispersin)
Un grfico XY (dispersin) muestra cada serie de valores como puntos de datos en el espacio
del grfico conforme a los valores X e Y de la serie de valores. Un grfico de dispersin tpico contiene
expresiones que no son de agregado para los valores. La expresin para la X del rea del grfico de
valores y la expresin para el grupo de categoras suele ser la misma. Aunque los grupos de series y
categoras sean opcionales, ser necesario uno de estos grupos, como mnimo, para poder mostrar
datos significativos en el grfico.
Un grfico de dispersin con puntos de datos conectados por lneas es idntico a un grfico XY
(dispersin), con la nica diferencia de que los puntos de datos estn conectados mediante lneas
rectas.
Un grfico de dispersin con puntos de datos conectados por lneas es idntico a un grfico XY
(dispersin), con la nica diferencia de que los puntos de datos estn conectados mediante lneas
curvas.
La grfica de dispersin del anterior ejemplo se conforma de la siguiente forma:
6.
El coeficiente de correlacin de Pearson es un ndice que mide la relacin lineal entre dos
variables aleatorias cuantitativas. Notndose como r, al cociente entre la covarianza de las dos
variables entre el producto de las desviaciones tpicas:
xy
x y
Dnde:
xy: Es la covarianza de x, y
x y y: Son las desviaciones tpicas de las distribuciones marginales.
Este coeficiente se usa para medir el grado de relacin o asociacin lineal entre ambas
variables, de tal forma que habr ms relacin conforme sea mayor r, verificndose adems que si r es
positivo la relacin ser en el mismo sentido (cuando una crece la otra tambin peso/altura) y si r es
negativa lo harn en el sentido contrario (una crece y otra decrece).
El valor del ndice de correlacin vara en el intervalo [-1, +1]:
7.
Si r = 1, existe una correlacin positiva perfecta. El ndice indica una dependencia total
entre las dos variables denominada relacin directa: cuando una de ellas aumenta, la
otra tambin lo hace en proporcin constante.
Si r = 0, no existe relacin lineal. Pero esto no necesariamente implica que las variables
son independientes: pueden existir todava relaciones no lineales entre las dos
variables.
Si r = -1, existe una correlacin negativa perfecta. El ndice indica una dependencia
total entre las dos variables llamada relacin inversa: cuando una de ellas aumenta, la
otra disminuye en proporcin constante.
xy
x2
y2
1.25
1.25
1.5625
10
25
11.25
33.75
126.5625
20
80
16
400
30.5
152.5
25
930.25
55
1483.375
0
15
15
3
5
277.5
3 *13.6 14.7
5
68
13.6
5
Calculamos la covarianza:
xy
277.5
68
55 2
3 2
5
1483.375
13.6 2 10.56953168
5
14.7
0.9834371091
2 *10.56953168
Al ser el coeficiente de correlacin positivo, la correlacin es directa. Esto quiere decir que
cuando una de ellas aumenta, la otra tambin lo hace.