Está en la página 1de 5

Regresión Parabólica

1. Definición

Dadas dos variables, x e y, se dice que existe:

 Dependencia funcional: Si y solamente si entre ellas existe una función matemática que las relaciona
perfectamente, por ejemplo, entre todas las que se puede expresar su relación mediante una
ecuación E = mc2 o F = ma.

 Dependencia estadística: Cuando entre ellas existe una relación pero que no es expresable mediante
un modelo matemático, por ejemplo entre oferta y demanda o peso y altura.

La regresión trata de ajustar a una nube de puntos una función de tipo matemático que se aproxime lo
máximo posible a los datos. Dada cualquier nube de puntos, siempre existirá una función que se pueda ajustar sobre
esos datos, aunque, evidentemente, en el caso de dependencia estadística, este ajuste no será perfecto.

El principal objetivo de la regresión es ajustar una función a los datos con el fin de realizar predicciones, de
tal manera que se denomina:

 Variable dependiente: a la variable que se quiere predecir, también se conoce como variable
explicada (y).

 Variable(s) independiente(s): a la(s) que usaremos para predecir, puede haber una o varias. También
son llamadas variables explicativas (x1 , . . . , xn).

Se denomina regresión a intentar ajustar una función (f) a unos valores observados. De tal manera que se
considerará regresión simple si solo tenemos una variable explicativa Y = f(X) y regresión múltiple si existen varias y =
f(x1, x2, . . . , xn).

2. Aplicación de las Regresiones

Entre las diferentes aplicaciones de las regresiones encontramos al estudio de mercado, la cual consiste en la
identificación, acopio, análisis y aprovechamiento de información. Es un proceso sistemático y objetivo diseñado para
identificar y resolver problemas de marketing.

Por lo tanto al hablar de investigación de mercados ésta nos lleva a la obtención de resultados, y uno de los
métodos cuantitativos que encontramos dentro de dicha investigación es el análisis de regresión, que es muy usado
para explicar la variación en la participación de mercado, ventas, preferencia de marca y otros resultados que nos
arroje dicha investigación en términos variables de administración de marketing, como publicidad, precio, distribución
y calidad.

3. Fórmulas

Si la serie tiene una curva parabólica cuyo comportamiento se describe matemáticamente por una ecuación
de segundo grado (parábola). La regresión se expresa de la siguiente forma:

1
y  a  bx  cx2

Dónde:
y: Estimación de la variable dependiente
a, b, c: Constantes numéricas
x: Valores de la variable independiente

En la cual los valores de a, b y c se encuentran resolviendo un sistema de tres ecuaciones con tres incógnitas
por medio de la siguiente relación:

na  b x  c x 2   y
a  x  b x 2  c x 3   xy
a  x 2  b x 3  c  x 4   x 2 y

4. Ejemplo de Regresión Parabólica

Dadas dos variables, x e y, ajustar a los datos una función de tipo parabólico.

x y x2 x3 x4 xy x2y
1 1.25 1 1 1 1.25 1.25

2 5 4 8 16 10 20

3 11.25 9 27 81 33.75 101.25

4 20 16 64 256 80 320

5 30.5 25 125 625 152.5 762.5

15 68 55 225 979 277.5 1205

Aplicando el método de los mínimos cuadrados se obtiene el siguiente sistema de ecuaciones:

na  b x  c  x 2   y  5a  15b  55c  68

a  x  b x 2  c  x 3   xy   15a  55b  225c  277.5

a  x 2  b x 3  c  x 4   x 2 y  55a  225b  979c  1205

Resolviendo este sistema se obtiene:

a  0.47
b  0.51
c  1.14

2
Por tanto, la ecuación de la parábola de grado dos que mejor se ajusta a la nube de puntos es:

y  0.47  0.51x  1.14 x 2

5. Gráfico de Dispersión

Los gráficos XY o de dispersión muestran las series como un conjunto de puntos. Los valores se representan
mediante la posición de los puntos en el espacio del gráfico. Las categorías, por su parte, mediante diferentes puntos
del gráfico. Los gráficos de dispersión suelen utilizarse para comparar valores distintos de las categorías.

Hay tres tipos de gráficos de dispersión: gráfico XY de dispersión, dispersión con puntos de datos conectados
por líneas y dispersión con puntos de datos conectados por líneas suavizadas.

 Gráfico XY (dispersión)

Un gráfico XY (dispersión) muestra cada serie de valores como puntos de datos en el espacio del gráfico
conforme a los valores X e Y de la serie de valores. Un gráfico de dispersión típico contiene expresiones que no son de
agregado para los valores. La expresión para la X del área del gráfico de valores y la expresión para el grupo de
categorías suele ser la misma. Aunque los grupos de series y categorías sean opcionales, será necesario uno de estos
grupos, como mínimo, para poder mostrar datos significativos en el gráfico.

 Dispersión con puntos de datos conectados por líneas

Un gráfico de dispersión con puntos de datos conectados por líneas es idéntico a un gráfico XY (dispersión),
con la única diferencia de que los puntos de datos están conectados mediante líneas rectas.

 Dispersión con puntos de datos conectados por líneas suavizadas

3
Un gráfico de dispersión con puntos de datos conectados por líneas es idéntico a un gráfico XY (dispersión),
con la única diferencia de que los puntos de datos están conectados mediante líneas curvas.

La gráfica de dispersión del anterior ejemplo se conforma de la siguiente forma:

6. Coeficiente de Correlación Lineal de Pearson

El coeficiente de correlación de Pearson es un índice que mide la relación lineal entre dos variables aleatorias
cuantitativas. Notándose como r, al cociente entre la covarianza de las dos variables entre el producto de las
desviaciones típicas:
 xy
r
 x y
Dónde:

σxy: Es la covarianza de x, y
σx y σy: Son las desviaciones típicas de las distribuciones marginales.

Este coeficiente se usa para medir el grado de relación o asociación lineal entre ambas variables, de tal forma
que habrá más relación conforme sea mayor r, verificándose además que si r es positivo la relación será en el mismo
sentido (cuando una crece la otra también peso/altura) y si r es negativa lo harán en el sentido contrario (una crece y
otra decrece).

El valor del índice de correlación varía en el intervalo [-1, +1]:

 Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos
variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en
proporción constante.

 Si 0 < r < 1, existe una correlación positiva.

 Si r = 0, no existe relación lineal. Pero esto no necesariamente implica que las variables son
independientes: pueden existir todavía relaciones no lineales entre las dos variables.

4
 Si -1 < r < 0, existe una correlación negativa.

 Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las
dos variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en
proporción constante.

7. Ejemplo del Coeficiente Correlación Lineal

Para hallar el coeficiente de correlación de la distribución anterior se siguen los siguientes pasos a partir de la
generación de la tabla.

x y xy x2 y2
1 1.25 1.25 1 1.5625

2 5 10 4 25

3 11.25 33.75 9 126.5625

4 20 80 16 400

5 30.5 152.5 25 930.25

15 68 277.5 55 1483.3750

 Hallamos las medias aritméticas:

15 68
x 3 y  13.6
5 5

 Calculamos la covarianza:

277.5
 xy   3 *13.6  14.7
5

 Calculamos las desviaciones típicas:

55 2 1483.375
x  3  2 y   13.6 2  10.56953168
5 5

 Aplicamos la fórmula del coeficiente de correlación lineal:

14.7
r  0.9834371091
2 *10.56953168

Al ser el coeficiente de correlación positivo, la correlación es directa. Esto quiere decir que cuando una de
ellas aumenta, la otra también lo hace.

También podría gustarte