Está en la página 1de 5

Regresin Parablica

1. Definicin

Dadas dos variables, x e y, se dice que existe:

Dependencia funcional: Si y solamente si entre ellas existe una funcin matemtica que
las relaciona perfectamente, por ejemplo, entre todas las que se puede expresar su
relacin mediante una ecuacin E = mc2 o F = ma.

Dependencia estadstica: Cuando entre ellas existe una relacin pero que no es
expresable mediante un modelo matemtico, por ejemplo entre oferta y demanda o
peso y altura.

La regresin trata de ajustar a una nube de puntos una funcin de tipo matemtico que se
aproxime lo mximo posible a los datos. Dada cualquier nube de puntos, siempre existir una funcin
que se pueda ajustar sobre esos datos, aunque, evidentemente, en el caso de dependencia estadstica,
este ajuste no ser perfecto.

El principal objetivo de la regresin es ajustar una funcin a los datos con el fin de realizar
predicciones, de tal manera que se denomina:

Variable dependiente: a la variable que se quiere predecir, tambin se conoce como


variable explicada (y).

Variable(s) independiente(s): a la(s) que usaremos para predecir, puede haber una o
varias. Tambin son llamadas variables explicativas (x1 , . . . , xn).

Se denomina regresin a intentar ajustar una funcin (f) a unos valores observados. De tal
manera que se considerar regresin simple si solo tenemos una variable explicativa Y = f(X) y
regresin mltiple si existen varias y = f(x1, x2, . . . , xn).

2. Aplicacin de las Regresiones

Entre las diferentes aplicaciones de las regresiones encontramos al estudio de mercado, la cual
consiste en la identificacin, acopio, anlisis y aprovechamiento de informacin. Es un proceso
sistemtico y objetivo diseado para identificar y resolver problemas de marketing.

Por lo tanto al hablar de investigacin de mercados sta nos lleva a la obtencin de resultados,
y uno de los mtodos cuantitativos que encontramos dentro de dicha investigacin es el anlisis de
regresin, que es muy usado para explicar la variacin en la participacin de mercado, ventas,
preferencia de marca y otros resultados que nos arroje dicha investigacin en trminos variables de
administracin de marketing, como publicidad, precio, distribucin y calidad.

3. Frmulas

Si la serie tiene una curva parablica cuyo comportamiento se describe matemticamente por
una ecuacin de segundo grado (parbola). La regresin se expresa de la siguiente forma:

y a bx cx 2
Dnde:
y: Estimacin de la variable dependiente

1
a, b, c: Constantes numricas
x: Valores de la variable independiente

En la cual los valores de a, b y c se encuentran resolviendo un sistema de tres ecuaciones con


tres incgnitas por medio de la siguiente relacin:

na b x c x 2 y
a x b x 2 c x 3 xy
a x 2 b x 3 c x 4 x 2 y

4. Ejemplo de Regresin Parablica

Dadas dos variables, x e y, ajustar a los datos una funcin de tipo parablico.

x y x2 x3 x4 xy x2y
1 1.25 1 1 1 1.25 1.25

2 5 4 8 16 10 20

3 11.25 9 27 81 33.75 101.25

4 20 16 64 256 80 320

5 30.5 25 125 625 152.5 762.5

15 68 55 225 979 277.5 1205

Aplicando el mtodo de los mnimos cuadrados se obtiene el siguiente sistema de ecuaciones:

na b x c x 2 y
5a 15b 55c 68
a x b x 2 c x 3 xy
15a 55b 225c 277.5
a x 2 b x 3 c x 4 x 2 y 55a 225b 979c 1205
Resolviendo este sistema se obtiene:

a 0.47
b 0.51
c 1.14
Por tanto, la ecuacin de la parbola de grado dos que mejor se ajusta a la nube de puntos es:
y 0.47 0.51x 1.14 x 2

2
5. Grfico de Dispersin

Los grficos XY o de dispersin muestran las series como un conjunto de puntos. Los valores se
representan mediante la posicin de los puntos en el espacio del grfico. Las categoras, por su parte,
mediante diferentes puntos del grfico. Los grficos de dispersin suelen utilizarse para comparar
valores distintos de las categoras.

Hay tres tipos de grficos de dispersin: grfico XY de dispersin, dispersin con puntos de
datos conectados por lneas y dispersin con puntos de datos conectados por lneas suavizadas.

Grfico XY (dispersin)

Un grfico XY (dispersin) muestra cada serie de valores como puntos de datos en el espacio
del grfico conforme a los valores X e Y de la serie de valores. Un grfico de dispersin tpico contiene
expresiones que no son de agregado para los valores. La expresin para la X del rea del grfico de
valores y la expresin para el grupo de categoras suele ser la misma. Aunque los grupos de series y
categoras sean opcionales, ser necesario uno de estos grupos, como mnimo, para poder mostrar
datos significativos en el grfico.

Dispersin con puntos de datos conectados por lneas

Un grfico de dispersin con puntos de datos conectados por lneas es idntico a un grfico XY
(dispersin), con la nica diferencia de que los puntos de datos estn conectados mediante lneas
rectas.

Dispersin con puntos de datos conectados por lneas suavizadas

Un grfico de dispersin con puntos de datos conectados por lneas es idntico a un grfico XY
(dispersin), con la nica diferencia de que los puntos de datos estn conectados mediante lneas
curvas.

La grfica de dispersin del anterior ejemplo se conforma de la siguiente forma:

3
6. Coeficiente de Correlacin Lineal de Pearson

El coeficiente de correlacin de Pearson es un ndice que mide la relacin lineal entre dos
variables aleatorias cuantitativas. Notndose como r, al cociente entre la covarianza de las dos
variables entre el producto de las desviaciones tpicas:
xy
r
x y
Dnde:

xy: Es la covarianza de x, y
x y y: Son las desviaciones tpicas de las distribuciones marginales.
Este coeficiente se usa para medir el grado de relacin o asociacin lineal entre ambas
variables, de tal forma que habr ms relacin conforme sea mayor r, verificndose adems que si r es
positivo la relacin ser en el mismo sentido (cuando una crece la otra tambin peso/altura) y si r es
negativa lo harn en el sentido contrario (una crece y otra decrece).

El valor del ndice de correlacin vara en el intervalo [-1, +1]:

Si r = 1, existe una correlacin positiva perfecta. El ndice indica una dependencia total
entre las dos variables denominada relacin directa: cuando una de ellas aumenta, la
otra tambin lo hace en proporcin constante.

Si 0 < r < 1, existe una correlacin positiva.

Si r = 0, no existe relacin lineal. Pero esto no necesariamente implica que las variables
son independientes: pueden existir todava relaciones no lineales entre las dos
variables.

Si -1 < r < 0, existe una correlacin negativa.

Si r = -1, existe una correlacin negativa perfecta. El ndice indica una dependencia
total entre las dos variables llamada relacin inversa: cuando una de ellas aumenta, la
otra disminuye en proporcin constante.

7. Ejemplo del Coeficiente Correlacin Lineal

Para hallar el coeficiente de correlacin de la distribucin anterior se siguen los siguientes


pasos a partir de la generacin de la tabla.

4
x y xy x2 y2
1 1.25 1.25 1 1.5625

2 5 10 4 25

3 11.25 33.75 9 126.5625

4 20 80 16 400

5 30.5 152.5 25 930.25


1483.375
15 68 277.5 55
0

Hallamos las medias aritmticas:

15 68
x 3 y 13.6
5 5

Calculamos la covarianza:

277.5
xy 3 *13.6 14.7
5

Calculamos las desviaciones tpicas:

55 2 1483.375
x 3 2 y 13.6 2 10.56953168
5 5
Aplicamos la frmula del coeficiente de correlacin lineal:

14.7
r 0.9834371091
2 *10.56953168

Al ser el coeficiente de correlacin positivo, la correlacin es directa. Esto quiere decir que
cuando una de ellas aumenta, la otra tambin lo hace.

También podría gustarte