Está en la página 1de 5

Regresin Parablica

1.

Definicin
Dadas dos variables, x e y, se dice que existe:

Dependencia funcional: Si y solamente si entre ellas existe una funcin matemtica que
las relaciona perfectamente, por ejemplo, entre todas las que se puede expresar su
relacin mediante una ecuacin E = mc2 o F = ma.

Dependencia estadstica: Cuando entre ellas existe una relacin pero que no es
expresable mediante un modelo matemtico, por ejemplo entre oferta y demanda o
peso y altura.

La regresin trata de ajustar a una nube de puntos una funcin de tipo matemtico que se
aproxime lo mximo posible a los datos. Dada cualquier nube de puntos, siempre existir una funcin
que se pueda ajustar sobre esos datos, aunque, evidentemente, en el caso de dependencia estadstica,
este ajuste no ser perfecto.
El principal objetivo de la regresin es ajustar una funcin a los datos con el fin de realizar
predicciones, de tal manera que se denomina:

Variable dependiente: a la variable que se quiere predecir, tambin se conoce como


variable explicada (y).

Variable(s) independiente(s): a la(s) que usaremos para predecir, puede haber una o
varias. Tambin son llamadas variables explicativas (x1 , . . . , xn).

Se denomina regresin a intentar ajustar una funcin (f) a unos valores observados. De tal
manera que se considerar regresin simple si solo tenemos una variable explicativa Y = f(X) y
regresin mltiple si existen varias y = f(x1, x2, . . . , xn).
2.

Aplicacin de las Regresiones

Entre las diferentes aplicaciones de las regresiones encontramos al estudio de mercado, la cual
consiste en la identificacin, acopio, anlisis y aprovechamiento de informacin. Es un proceso
sistemtico y objetivo diseado para identificar y resolver problemas de marketing.
Por lo tanto al hablar de investigacin de mercados sta nos lleva a la obtencin de resultados,
y uno de los mtodos cuantitativos que encontramos dentro de dicha investigacin es el anlisis de
regresin, que es muy usado para explicar la variacin en la participacin de mercado, ventas,
preferencia de marca y otros resultados que nos arroje dicha investigacin en trminos variables de
administracin de marketing, como publicidad, precio, distribucin y calidad.
3.

Frmulas

Si la serie tiene una curva parablica cuyo comportamiento se describe matemticamente por
una ecuacin de segundo grado (parbola). La regresin se expresa de la siguiente forma:

y a bx cx 2
Dnde:
y: Estimacin de la variable dependiente

a, b, c: Constantes numricas
x: Valores de la variable independiente
En la cual los valores de a, b y c se encuentran resolviendo un sistema de tres ecuaciones con
tres incgnitas por medio de la siguiente relacin:

na b x c x 2 y

a x b x 2 c x 3 xy

a x 2 b x 3 c x 4 x 2 y
4.

Ejemplo de Regresin Parablica


Dadas dos variables, x e y, ajustar a los datos una funcin de tipo parablico.

x2

x3

x4

xy

x2y

1.25

1.25

1.25

16

10

20

11.25

27

81

33.75

101.25

20

16

64

256

80

320

30.5

25

125

625

152.5

762.5

15

68

55

225

979

277.5

1205

Aplicando el mtodo de los mnimos cuadrados se obtiene el siguiente sistema de ecuaciones:

na b x c x 2 y

a x b x 2 c x 3 xy

a x 2 b x 3 c x 4 x 2 y

Resolviendo este sistema se obtiene:

5a 15b 55c 68
15a 55b 225c 277.5
55a 225b 979c 1205

a 0.47
b 0.51
c 1.14

Por tanto, la ecuacin de la parbola de grado dos que mejor se ajusta a la nube de puntos es:

y 0.47 0.51x 1.14 x 2

5.

Grfico de Dispersin

Los grficos XY o de dispersin muestran las series como un conjunto de puntos. Los valores se
representan mediante la posicin de los puntos en el espacio del grfico. Las categoras, por su parte,
mediante diferentes puntos del grfico. Los grficos de dispersin suelen utilizarse para comparar
valores distintos de las categoras.
Hay tres tipos de grficos de dispersin: grfico XY de dispersin, dispersin con puntos de
datos conectados por lneas y dispersin con puntos de datos conectados por lneas suavizadas.

Grfico XY (dispersin)

Un grfico XY (dispersin) muestra cada serie de valores como puntos de datos en el espacio
del grfico conforme a los valores X e Y de la serie de valores. Un grfico de dispersin tpico contiene
expresiones que no son de agregado para los valores. La expresin para la X del rea del grfico de
valores y la expresin para el grupo de categoras suele ser la misma. Aunque los grupos de series y
categoras sean opcionales, ser necesario uno de estos grupos, como mnimo, para poder mostrar
datos significativos en el grfico.

Dispersin con puntos de datos conectados por lneas

Un grfico de dispersin con puntos de datos conectados por lneas es idntico a un grfico XY
(dispersin), con la nica diferencia de que los puntos de datos estn conectados mediante lneas
rectas.

Dispersin con puntos de datos conectados por lneas suavizadas

Un grfico de dispersin con puntos de datos conectados por lneas es idntico a un grfico XY
(dispersin), con la nica diferencia de que los puntos de datos estn conectados mediante lneas
curvas.
La grfica de dispersin del anterior ejemplo se conforma de la siguiente forma:

6.

Coeficiente de Correlacin Lineal de Pearson

El coeficiente de correlacin de Pearson es un ndice que mide la relacin lineal entre dos
variables aleatorias cuantitativas. Notndose como r, al cociente entre la covarianza de las dos
variables entre el producto de las desviaciones tpicas:

xy
x y

Dnde:

xy: Es la covarianza de x, y
x y y: Son las desviaciones tpicas de las distribuciones marginales.
Este coeficiente se usa para medir el grado de relacin o asociacin lineal entre ambas
variables, de tal forma que habr ms relacin conforme sea mayor r, verificndose adems que si r es
positivo la relacin ser en el mismo sentido (cuando una crece la otra tambin peso/altura) y si r es
negativa lo harn en el sentido contrario (una crece y otra decrece).
El valor del ndice de correlacin vara en el intervalo [-1, +1]:

7.

Si r = 1, existe una correlacin positiva perfecta. El ndice indica una dependencia total
entre las dos variables denominada relacin directa: cuando una de ellas aumenta, la
otra tambin lo hace en proporcin constante.

Si 0 < r < 1, existe una correlacin positiva.

Si r = 0, no existe relacin lineal. Pero esto no necesariamente implica que las variables
son independientes: pueden existir todava relaciones no lineales entre las dos
variables.

Si -1 < r < 0, existe una correlacin negativa.

Si r = -1, existe una correlacin negativa perfecta. El ndice indica una dependencia
total entre las dos variables llamada relacin inversa: cuando una de ellas aumenta, la
otra disminuye en proporcin constante.

Ejemplo del Coeficiente Correlacin Lineal

Para hallar el coeficiente de correlacin de la distribucin anterior se siguen los siguientes


pasos a partir de la generacin de la tabla.

xy

x2

y2

1.25

1.25

1.5625

10

25

11.25

33.75

126.5625

20

80

16

400

30.5

152.5

25

930.25

55

1483.375
0

15

15
3
5

277.5
3 *13.6 14.7
5

Calculamos las desviaciones tpicas:

68
13.6
5

Calculamos la covarianza:

xy

277.5

Hallamos las medias aritmticas:

68

55 2
3 2
5

1483.375
13.6 2 10.56953168
5

Aplicamos la frmula del coeficiente de correlacin lineal:

14.7
0.9834371091
2 *10.56953168

Al ser el coeficiente de correlacin positivo, la correlacin es directa. Esto quiere decir que
cuando una de ellas aumenta, la otra tambin lo hace.

También podría gustarte