Está en la página 1de 42

UNIDAD 3

La estadstica aplicada a las variables del marketing

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

Coordinacin: Juan Ramn Girldez Alonso Autora: Yolanda Arranz Sebastin Comisin de Seguimiento Tcnico del CIDEAD: Isabel Lpez Aranguren (Directora). Juana M Fernndez-Villamil y Luis A. Salcedo Sigenza (Coordinadores). Jos M Benavente Barreda. Flix Garca Zarcero. Diseo y Maquetacin: Jess Arroyo Bueno. Cubiertas: Jess Arroyo Bueno.

Ministerio de Educacin, Cultura y Deporte Secretara General de Educacin y Formacin Profesional. Direccin General de Educacin, Formacin Profesional e Innovacin Educativa. Centro Nacional de Informacin y Comunicacin Educativa. Centro para la Innovacin y el Desarrollo de la Educacin a Distancia. NIPO: 176-03-164-4 I.S.B.N.: 84-369-3725-2 Material actualizado en el 2003

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

La estadstica aplicada a las variables del marketing

U N I D A D 3

NDICE
PRESENTACIN. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 1. REGRESIN Y CORRELACIN SIMPLE . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.1. Ajuste de curvas y regresin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 1.2. El mtodo de los mnimos cuadrados . . . . . . . . . . . . . . . . . . . . . . . . . 10 1.3. Varianza residual y coeficiente de determinacin . . . . . . . . . . . . . . . . 16 1.4. Coeficiente de correlacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 2. REGRESIN Y CORRELACIN MLTIPLE . . . . . . . . . . . . . . . . . . . . . . 23 3. LAS SERIES TEMPORALES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 3.1. Concepto y movimientos caractersticos de las series temporales . . . 25 3.2. Clasificacin de los movimientos de las series temporales . . . . . . . . . 26 3.3. Mtodos de estimacin de la tendencia. . . . . . . . . . . . . . . . . . . . . . . . 28 4. LOS NMEROS NDICES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 4.1. Definicin y aplicaciones de los nmeros ndices . . . . . . . . . . . . . . . . 31 4.2. Clasificacin y clculo de los nmeros ndices . . . . . . . . . . . . . . . . . . 32 4.3. Los ndices de precios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 4.4. El ndice de Precios al Consumo (IPC) . . . . . . . . . . . . . . . . . . . . . . . . 38 4.5. Procedimientos aplicados a la utilizacin de nmeros ndices . . . . . . 39

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

Polticas de marketing

TCNICAS ESTADSTICAS
se aplican al

ESTUDIO DE LAS VARIABLES DEL MARKETING


Para el estudio de la Dependencia /Relacin Para el estudio de la variacin en el tiempo

SERIES TEMPORALES CORRELACIN


Movimientos ccilicos Movimientos estacionales Movimientos irregulares Tendencias
aplican procedimientos se clasifican

se calcula mediante

NMEROS NDICES

Coeficiente de correlacin

REGRESIN
se calculan mediante

Deflacin de series temporales


otros mtodos de clculo

Cambio de perodo base Ms de dos variables Complejas Dos variables Simples

cuando intervienen

se utiliza para el clculo de

Ms de dos variables

Dos variables

MTODO DE LOS MNIMOS CUADRADOS


se comprueba su fiabilidad con el

Mtodo de las semimedias Mtodo del movimiento medio

Mltiple

Simple

Sin ponderar

Ponderadas

Coeficiente de determinacin

ndices de precios

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

La estadstica aplicada a las variables del marketing

U N I D A D 3

Al finalizar el estudio de esta unidad sers capaz de...

Identificar la tcnica estadstica que se debe aplicar en funcin del objeto de estudio. Aplicar el mtodo de los mnimos cuadrados para el clculo de la curva de ajuste. Analizar la relacin y grado de dependencia entre las variables que intervienen en un determinado estudio comercial o de marketing. Realizar previsiones sobre el comportamiento de una variable. Operar con ndices de precios. Interpretar los resultados obtenidos en la aplicacin de las tcnicas estadsticas. Valorar la utilidad de la estadstica en el marketing.

a estadstica entendida como una ciencia matemtica que estudia la interpretacin de datos numricos se aplica en innumerables mbitos. En concreto, en el mbito del marketing, la estadstica nos va a ayudar en el anlisis de los datos que se manejan acerca de las variables que intervienen en la definicin de las polticas de marketing, constituyendo un instrumento muy til para la toma de decisiones. Se dar respuesta a cuestiones del tipo Cmo puede repercutir (cuantitativamente) en las ventas de un producto el aumento de su precio?. Por otra parte, en el desarrollo de nuestro trabajo como profesional del marketing, vamos a tener que acudir a innumerables fuentes estadsticas (publicaciones del Instituto Nacional de Estadstica -INE-, Anuario estadstico de economa,...) que, a escala nacional e internacional, renen una informacin muchas veces imprescindible para realizar cualquier estudio comercial. Por todo lo anteriormente expresado, interesa conocer y operar con los principales estadsticos que nos pueden ser tiles en el anlisis de la informacin, as como para poder interpretar los resultados que nos proporcionan.

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

La estadstica aplicada a las variables del marketing

1. REGRESIN Y CORRELACIN SIMPLE


Una de las cuestiones que ms a menudo se nos va a presentar en un estudio comercial y/o de polticas de marketing, es la de determinar qu relacin o dependencia existe entre las variables que se estn analizando. Ejemplo: Qu relacin existe entre el aumento del precio del aceite de oliva y la disminucin de las ventas del mismo? y entre el aumento de precio del aceite de oliva y el de girasol? y entre el lanzamiento de un nuevo producto, el precio de salida y la demanda prevista?... Para estudiar la relacin o dependencia entre variables se utilizan dos tcnicas estadsticas: la regresin y la correlacin. La regresin analiza la relacin existente entre variables, donde una de las variables se supone condicionada o influida por el comportamiento de la otra u otras. Mediante esta tcnica se trata de determinar la funcin matemtica que mejor represente esa relacin. La correlacin estudia el grado de asociacin que existe entre las variables, es decir, el grado de causas comunes o dependencia entre ellas. En ocasiones, estas tcnicas se aplican a estudios en los que nicamente intervienen dos variables. Ejemplo: El gasto de una familia en la compra de un coche viene influido por la renta disponible. En este tipo de relaciones una variable independiente (en el ejemplo la renta disponible) determina el comportamiento de una variable dependiente (la compra de un coche). Sin embargo en muchos casos, el comportamiento de una variable (la dependiente) no va a ser en general explicada por una nica variable, sino que habr que considerar ms de una variable independiente. Ejemplo: Las ventas de una empresa pueden depender de los gastos de publicidad, del precio del producto que se venda y del precio de los productos sustitutivos. En funcin del nmero de variables que intervienen en el estudio estadstico se aplicar la tcnica estadstica de regresin/correlacin simple o mltiple.
Tcnicas estadsticas N de variables que intervienen

U N I D A D 3

La regresin estudia la relacin entre variables

La correlacin estudia el grado de dependencia entre variables

Correlacin / Regresin SIMPLE MULTIPLE

Slo dos variables de dos variables

Ms

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

Polticas de marketing

A continuacin vamos a trabajar con estudios que dependen de dos variables. 1.1. AJUSTE DE CURVAS Y REGRESIN
La regresin simple estudia el comportamiento de una variable dependiente en funcin de los valores de una variable independiente

Cuando entre dos variables estadsticas existe algn tipo de vinculacin, podemos estudiar el comportamiento de una de ellas en funcin de unos valores prefijados de otra. Esta cuestin como ya dijimos antes se aborda bajo el nombre de regresin. Por lo tanto, cuando hablamos de regresin de y sobre x entendemos que la variable condicionante o independiente es x y se usa para estimar y a partir de valores tomados de x. Cuando hablamos de la regresin de x sobre y es la y la variable condicionante o independiente y se usa para estimar x a partir de valores dados de y. El anlisis de la regresin es slo un instrumento para describir la dependencia o relacin entre variables? No, tambin sirve para predecir o estimar el comportamiento futuro de la variable dependiente en funcin de los nuevos valores de la variable independiente.

Cmo calcularemos la relacin entre variables?


Para estudiar la relacin entre variables se utilizan mtodos matemticos

Para calcular la relacin entre dos o ms variables, utilizamos mtodos matemticos a travs de los cuales obtenemos una ecuacin que las conecta. Los pasos que seguiremos para hallar la ecuacin que relacione las variables son: 1. Recoger valores de las variables. Ejemplo: Variable Y Gasto en la compra de un coche Variable X Renta disponible Una muestra de n individuos, nos dara lo que se gastan en la adquisicin de un coche Y1, Y2 , Y3 ,.......Yn, y los niveles de renta X1, X2 , X3 ,........Xn correspondientes. 2. Sobre un sistema de coordenadas rectangulares, marcamos los puntos (X1 ; Y1) , (X2 ; Y2) , (X3 ; Y3) , ......... (Xn ; Yn). El conjunto de puntos resultante se denomina diagrama de dispersin o nube de puntos. En el grfico apreciaremos el grado de concentracin de los puntos.
DIAGRAMA DE DISPERSIN

x
8

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

La estadstica aplicada a las variables del marketing

3. A partir del diagrama de dispersin normalmente se puede visualizar una curva suave que se aproxima a los datos, denominada curva aproximante. En funcin de la aproximacin de los datos tendremos:
Relacin lineal entre las variables. Cuando los datos parecen aproximarse a una lnea recta. Relacin no lineal entre las variables. Cuando los datos no se aproximan a una lnea recta.

RELACIN LINEAL

RELACIN NO LINEAL

U N I D A D 3

x
Mediante el ajuste de curvas se determina la funcin matemtica que ms se adapta a la nube de puntos de las variables

Para hallar las ecuaciones de curvas aproximantes a un conjunto de datos se utiliza el llamado ajuste de curvas, que pretende encontrar una funcin que se ajuste lo ms posible a la nube de puntos. Es decir, se debe determinar el tipo de funcin matemtica que resuma la informacin contenida en la nube de puntos de las variables independientes con la variable dependiente. Las funciones de ajuste ms utilizadas son:

y = a + bx y = a + bx + cx2 Curva o funcin exponencial y=abx Curva geomtrica o funcin potencial y = a x b


Lnea

recta o funcin lineal

Parbola

Todas las letras excepto x e y representan constantes. x - variable independiente y - variable dependiente Aunque los papeles de x e y se pueden cambiar.
En muchas ocasiones se eligen funciones lineales, porque son muy fciles de manejar y adems se ajustan frecuentemente a la realidad. Por lo tanto Cul ser el objeto de la regresin una vez que tenemos la funcin de ajuste? El objeto de la regresin es precisamente la determinacin numrica de los parmetros (a, b, c) de la funciones a partir de un conjunto de observaciones sobre las variables x e y. A pesar de la aproximacin a la que podamos llegar con estos mtodos matemticos, debemos tener en cuenta que las relaciones causales entre las variables que se establecen en marketing no son exactas, como puede ocurrir por ejemplo en el mundo fsico. Ejemplo: En el epgrafe anterior hemos puesto el ejemplo de que el gasto que realiza una familia en la compra
9

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

Polticas de marketing

de un coche est influenciado por la renta disponible, pero en ningn caso se puede esperar que esta variable explique completamente el gasto en un coche determinado. Existen otros factores como composicin de la familia, hbitat, marca, etc., que tambin ejercern su influencia en mayor o menor grado. Sin embargo, como el nmero de estos factores puede ser prcticamente infinito, no es posible lograr una funcin matemtica que nos explique completamente el fenmeno. 1.2. EL MTODO DE LOS MNIMOS CUADRADOS
Se utiliza para hallar la ecuacin que relaciona las variables

Cuando se realiza el ajuste de una nube de puntos, no siempre se obtienen funciones lineales, pueden obtenerse curvas u otras lneas distintas como parbolas, hiprbolas o curvas de fcil estudio. Entonces el problema consiste en encontrar la ecuacin que mejor se ajuste a la nube de puntos. Para ello el mtodo ms utilizado es el de los mnimos cuadrados.

En qu consiste este mtodo?


Este mtodo consiste en hacer mnima la suma de los cuadrados de las diferencias entre los valores observados (yi) y los tericos (y) que se obtengan mediante la ecuacin.
Se denomina recta de mnimos cuadrados cuando la funcin que se ajusta es una recta

En el supuesto de que se utilice una recta, este mtodo nos proporcionar la recta de ajuste en la que la suma de los cuadrados de las distancias de los puntos a la recta sea mnima. La recta con esta propiedad se denominar recta de mnimos cuadrados. Cuando la curva de ajuste sea una parbola, se denominar parbola de mnimos cuadrados. Lo mismo con el resto de curvas de ajuste. FUNCIONES LINEALES Vamos a demostrarlo para el supuesto del ajuste de una recta, considerando x variable independiente e y variable dependiente.
FUNCIONES LINEALES

y
(x1y1)

(x4y4)

y
d5

d4 d3

(x5y5)

d1

d2 (x y ) 3 3

(x2y2)

x
La El

funcin de ajuste ser

y = a + bx

mtodo de los mnimos cuadrados dice: Mn d12 + d22 +................+ dn2 di = yi - (a + bxi)

10

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

La estadstica aplicada a las variables del marketing

d12 + d22 + ........+ dn2 = M M = (yi - yi)2 = (yi - a - bxi)2


i=1 i=1

Para que esta expresin sea mnima se debe cumplir que las primeras derivadas parciales respecto a cada uno de los parmetros sea igual a cero.

M N = 2 (Yi - a - bxi) (-1) = 0 a i=1


N M = 2 (Yi - a - bxi) (-xi) = 0 b i=1

U N I D A D 3

que se puede expresar como:

(yi - a - bxi) = 0 i=1 (yi - a - bxi) (xi) = 0 i=1


de forma desarrollada queda: yi = N a + b xi yi xi = axi + bxi 2 que son las ecuaciones normales de la recta de ajuste que permiten calcular, mediante cualquiera de los procedimientos de resolucin de sistemas (Cramer, igualacin, sustitucin, etc.), los valores de a y b. Cuando la variable independiente x es el tiempo, la recta o curva de regresin se llama curva de tendencia (este concepto se desarrollar en el epgrafe 3). Si se considera x como variable dependiente e y como independiente, la ecuacin de la recta de mnimos cuadrados es: x = c + dy y las ecuaciones normales son: x = c N + dy xy= cy + dy 2 En este supuesto sern los valores de c y d los que se tendrn que calcular. Si adems de los datos de las variables, tenemos la frecuencia con la que se presentan las mismas, las ecuaciones normales de la regresin lineal se obtendrn: yi ni = a ni + bxi ni xi yi ni = axi ni +bxi 2ni El parmetro b representa la pendiente de la recta de regresin de y sobre x, que generalmente es conocida con el nombre de coeficiente de regresin. Si b es positivo la dependencia es directa; e inversa si toma valores negativos. Si es igual a cero no hay dependencia entre las dos variables. Del mismo modo se podra actuar con el parmetro d que representa la pendiente de la recta de regresin de x sobre y.
El parmetro b informa de la dependencia directa e inversa entre variables Las ecuaciones normales de la recta de ajuste permiten calcular los valores de a y b
N

11

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

Polticas de marketing

La regresin simple es una tcnica estadstica que trata de determinar la funcin matemtica que mejor represente la relacin existente entre dos variables, una de las cuales se supone influida por el comportamiento de la otra. La regresin lineal se puede entender tambin como la tcnica por medio de la cual se resume la informacin contenida en la nube de puntos en una simple recta. Para determinar los parmetros de la recta, el mtodo ms utilizado es el de los mnimos cuadrados.

RECUERDA
Se2 0,052 = 1 = 0,994 R2 = 1 9,940 Sy2 Yi2 ni ayini bxiyini Se2 = ni

Si se considera x como variable independiente e y como dependiente, las ecuaciones normales son : y = a N + bx yx= ax + bx2 Si se considera x como variable dependiente e y como independiente, las ecuaciones normales son: x = c N + dy xy= cy + dy2

ACTIVIDADES
y2n 6 32 108 81 490 729 648 200 xy 1 8 30 18 63 90 99 120 429 xyni xyni 6 64 90 167 630 810 792 240 2799

Yi2 ni yini Sy2 = ni ni

( )

(2294) + (0,302 ! 310) (0,852 ! 2799) Se2 = = 0,052 55

2294 310 Sy2 = 55 55

( )
n 6 8 3 9 10 9 8 2 55

= 9,940

y 1 2 6 3 7 9 9 10 47

y2 1 4 36 9 49 81 81 100 361

yn 6 16 18 27 70 81 72 20 310

2294

El valor de la varianza Se2 es muy pequeo por tanto podemos decir que la recta de regresin ajustada es muy representativa de la nube de puntos. El coeficiente de determinacin R2 es muy prximo a 1, lo que quiere decir que hay muy pocos errores o residuos y que casi todas las variaciones de y vienen explicadas por x y existe por tanto una gran dependencia.

1 Te han encargado la realizacin de un estudio acerca de cmo influye el aumento de precio de una marca de zapatillas deportivas en la demanda de las mismas. Indica el proceso que debes seguir para calcular la relacin entre las dos variables (ventas-precio).

FUNCIONES NO LINEALES Aunque a continuacin exponemos las principales funciones de ajuste no lineales, en nuestro caso nicamente vamos a trabajar con la parbola de segundo grado. a) Parbola de segundo grado: La funcin de ajuste ser de la forma: y = a + bx + cx2 Aplicando el criterio de los mnimos cuadrados:

D = [ yi - (a + bxi + cxi 2)]2


i=1

y realizando las derivadas parciales respecto a cada uno de los parmetros e igualando a cero, obtenemos el siguiente sistema de ecuaciones: y = a N + bx + cx2 xy = ax + bx2+ cx3 x2y= ax2+ bx3+ cx4 Resolviendo obtenemos los valores de a, b y c. En el supuesto de que junto con los datos de las variables, se d la frecuencia con la que se presentan las mismas, las ecuaciones sern para la regresin parablica: yi ni = a ni + bxi ni + cxi 2ni xi yi ni = axi ni + bxi 2ni + cxi 2ni xi 2yi ni = axi 2ni + bxi 3ni + cxi 4ni
12

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

La estadstica aplicada a las variables del marketing

b) Funcin exponencial: La funcin de ajuste es: y = a bx Para trabajar con este tipo de funciones podemos convertir en lineal la relacin tomando logaritmos y realizando el oportuno cambio de variable logy = loga + x logb haciendo el cambio Y = a+ bx a) Funcin potencial: La funcin de ajuste es y = axb logy = loga + b logx efectuando el cambio log y = Y Y = a+ bX logy = Y

U N I D A D 3

log x = X

Te exponemos el siguiente ejemplo para que entiendas mejor los conceptos desarrollados. Ejemplo: Una pizzera ha realizado una promocin de ventas, repartiendo cupones o vales de descuento. La tabla que se presenta a continuacin recoge el nmero de vales de descuento repartidos (expresados en miles) y, el nmero de pedidos realizados (expresados en cientos). x y 1 1 4 2 5 6 6 3 9 7 10 9 11 9 12 10

x - Cupones o vales de descuento. y - Nmero de pedidos. Queremos estudiar la relacin o dependencia que existe entre el n de vales de descuento repartidos y el n de pedidos obtenidos. Para ello realizaremos el ajuste de una recta de mnimos cuadrados tomando: - x como variable independiente e y como variable dependiente. Tambin ajustaremos una parbola a la nube de puntos Una vez que tengamos las ecuaciones de ajuste, podremos hacer previsiones acerca de los pedidos que por trmino medio se obtendran, por ejemplo, repartiendo 8.000 cupones.
13

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

Polticas de marketing

Primero representamos la nube de puntos


NUBE DE PUNTOS

y
12 11 10 9 8 7 6 5 4 3 2 1

9 10 11 12

Para que la ecuacin de la recta represente los valores de los 8 puntos, se calcula dicha ecuacin a partir de las ecuaciones normales a N + bx = y a x + bx2= xy Puesto que estas ecuaciones nos darn una recta en la que la suma de los cuadrados de las distancias de los puntos a la recta sea mnima. x 1 4 5 6 9 10 11 12 x=58 y 1 2 6 3 7 9 9 10 y=47 x2 1 16 25 36 81 100 121 144 x2=524 xy 1 8 30 18 63 90 99 120 xy=429 y2 1 4 36 9 49 81 81 100 y2=361

La ecuacin de regresin vendr dada por: a 8 + b 58 = 47 a 58+ b 524 = 429 Resolviendo: b= 0,852

a=-0,302 y = -0,302 + 0,852 x

14

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

La estadstica aplicada a las variables del marketing

El hecho de ser positivo el coeficiente de regresin (el coef. de x), indica que a medida que aumenta el nmero de vales repartidos aumentan los pedidos o ventas. Ms concretamente cuando se aumenta una unidad de vales repartidos, aumenta 0,852 la cantidad de pedidos. Siguiendo con el ejemplo ajustamos una parbola a 8 + b 58 + c 524 = 47 a 58+ b 524+ c 5194 =429 a 524+ b 5194+ c 54116=4287

U N I D A D 3

x3 1 64 125 216 729 1000 1331 1728 x3 = 5194

x4 1 256 625 1296 6561 10000 14641 20736 x4= 54116

x2y 1 32 150 108 567 900 1089 1440 x2y=4287

47 58 524 429 524 5194 4287 5194 54116 a = = 0,311824 8 58 524 58 524 5194 524 5194 54116 8 47 524 58 429 5194 524 4287 54116 b = = 0,5938 8 58 524 58 524 5194 524 5194 54116 8 58 47 58 524 429 524 5194 4287 c = = 0,0192 8 58 524 58 524 5194 524 5194 54116 Por lo tanto la parbola de ajuste ser: y = 0,311 + 0,593 x + 0,019 x2

15

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

Polticas de marketing

Como podramos estimar los pedidos que se van a realizar si se han repartido 8.000 vales?
Simplemente sustituyendo en las ecuaciones que hemos hallado. (Recuerda que el n de vales se expresa en miles). Recta Parbola y = -0,302 + 0,852 x 8 = 6,514 pedidos (expr. en cientos) y = 0,311 + 0,593 x 8 + 0,019 (8)2 = 6,271 pedidos (expr. en cientos)

La previsiones que hemos obtenido en los dos supuestos se aproximan bastante. La previsin ms acertada ser la de aquel modelo (parbola, recta) que sea ms representativo. Aspecto ste, que abordaremos en el siguiente apartado. 1.3. VARIANZA RESIDUAL Y COEFICIENTE DE DETERMINACIN Se puede decir que la lnea de regresin obtenida por el mtodo de los mnimos cuadrados es una lnea media que trata de sintetizar o resumir la informacin contenida en la nube de puntos. Una cuestin que nos tendremos que plantear es Cmo se puede medir la representatividad o fiabilidad de la ecuacin de regresin calculada? Esta medida se podra obtener estudiando simplemente la dispersin entre las ordenadas medias estimadas yi y las ordenadas yi. De tal forma que: Si entre unas y otras las diferencias son pequeas, la representatividad de la regresin ser grande. Si por el contrario las diferencias son grandes, la representatividad ser deficiente. En el caso extremo de que exista siempre una perfecta coincidencia entre ambas coordenadas, entonces habr una dependencia exacta entre las variables X e Y y el modelo (recta, parbola) utilizado para obtener las yi ser perfecto. Sin embargo, la medida de dispersin ms utilizada, cuando la regresin se ajusta por mnimos cuadrados, es la varianza (S2). La varianza es un estadstico que mide la dispersin de los datos con respecto a la media aritmtica. Se define como la suma de los cuadrados de las diferencias entre los valores de la variable y la media aritmtica, (ponderados en su caso, por sus respectivas frecuencias). En adelante llamaremos ei al error de sustituir yi por yi , es decir, la diferencia yi - yi . As denominaremos Se2 a la varianza la, pudiendo expresarla de la siguiente forma: (yi yi ) 2 ei 2 Se2 = = N N Esta varianza recibe el nombre especfico de varianza residual, porque los errores ei obtenidos se denominan residuos. Por tanto:

La varianza residual mide la representatividad de la lnea de regresin calculada

16

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

La estadstica aplicada a las variables del marketing

Si

la varianza residual es grande, la lnea de regresin es poco representativa de la nube de puntos. Si es pequea dicha representatividad es grande. Una vez ajustada la funcin de regresin, la frmula de la varianza residual que se utiliza ser la siguiente Para la recta

yi 2 ayi bxiyi Se2 = N


Para la parbola

U N I D A D 3

yi 2 ayi bxi yi cxi 2yi Se2 = N


La raz cuadrada de las frmulas anteriores nos da una desviacin estndar, que recibe el nombre de error estndar del ajuste, ya que se obtiene de las desviaciones a la lnea de regresin. El error estndar da un promedio de los errores o residuos y viene expresado en la misma unidad de medida que la variable dependiente.
La desviacin estndar informa de un promedio de los errores o desviaciones a la lnea de regresin

Qu ocurre cuando se trabaja con distintas variables dependientes?


El nico inconveniente que presenta es que no se pueden realizar comparaciones cuando se trabaja con distintas variables dependientes. Para solucionar este problema se utiliza el denominado coeficiente de determinacin, que estudia la representatividad de la regresin o el poder explicativo del modelo ajustado. El coeficiente de determinacin es el indicador utilizado para medir el grado de dependencia de dos variables, y nos mide el porcentaje en que las variaciones de una variable son explicadas por las de otra variable en el supuesto de dos variables. Debemos de tener presente que nuestro objetivo bsico es explicar las variaciones de la variable dependiente Y mediante las variaciones de la variable explicativa X. Ordinariamente, la variable X no explica todas las variaciones de Y, sino solamente una parte; la parte restante es el error o residuo. yi = yi+ ei Teniendo en cuenta que las variaciones de una variable se miden por su varianza Sy2 = Sy 2 + Se2 ; Sy2 Se2 = Sy 2 es decir, la variacin total de la variable dependiente es igual a la variacin debida a la variable explicativa, segn cierto modelo, ms la variacin de los errores aleatorios. Por tanto, si Sy 2 se divide por Sy2, se tendr la parte relativa de la variacin total que viene explicada por el modelo. Este cociente es el denominado coeficiente de determinacin y se representa genricamente por R2. Su frmula de definicin es, por tanto,
El coeficiente de determinacin se utiliza tambin para medir la representatividad de la lnea de regresin

Sy 2 Se2 R2 = = 1 2 Sy Sy2
17

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

Polticas de marketing

2 donde Se2 se calcular segn hemos sealado anteriormente, y Sy

yi 2 yi 2 Sy2 = - N N

( )

Cmo deben interpretarse los valores obtenidos con el coeficiente de determinacin?


El coeficiente de determinacin slo toma valores comprendidos entre 0 y 1. Cuando R2 = 1, entonces no hay errores o residuos y absolutamente todas las variaciones de Y vienen explicadas por X, con lo cual la dependencia estadstica se ha convertido en dependencia exacta. Cuando R2 = 0, entonces X no explica absolutamente ninguna variacin de Y, lo que permite concluir que el modelo es totalmente inadecuado, o bien que, posiblemente, las variables X e Y son independientes.

El coeficiente de determinacin informa de la fiabilidad de la lnea de regresin ajustada

Del valor del coeficiente de determinacin se deduce la mayor o menor confianza que hay que depositar en el modelo utilizado para explicar la dependencia causal entre las variables X e Y, o para formular predicciones.

Cmo se calcular la varianza residual y el coeficiente de determinacin para la funcin lineal y parablica, cuando el valor de las variables venga acompaado por la frecuencia?
Cuando el valor de las variables viene acompaado por la frecuencia, la varianza residual para la funcin lineal se calcula:

ni = N yi 2ni ayi ni bxi yi ni Se2 = ni


y para una funcin parablica:

yi 2ni ayi ni bxi yi ni cxi 2yi ni Se2 = ni


La varianza de la variable dependiente:

yi 2ni yi ni 2 Sy2 = ni ni
y el coeficiente de determinacin:

( )

Se2 R2 = 1 Sy2

18

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

La estadstica aplicada a las variables del marketing

RECUERDA

La varianza residual mide la representatividad de la recta de regresin. Si esta es grande, la lnea de regresin es poco representativa; si es pequea la representatividad es grande. Todo ajuste minimocuadrtico debe venir acompaado de su respectivo coeficiente de determinacin, para poder conocer el poder representativo de la lnea de regresin, o bien el poder explicativo del modelo.

Ejemplo: Siguiendo con el ejemplo que hemos planteado en el apartado anterior, podemos calcular la varianza residual y el error estndar, para el ajuste de la recta y el de la parbola. Para la recta

U N I D A D 3

361 + ( 0,302 47 ) ( 0,852 429 ) Se2 = = 1,210 8


Para la parbola

361 ( 0,311 47 ) ( 0,593 429 ) ( 0,019 4287 ) Se2 = = 1,316 8


El correspondiente error estndar del ajuste vale Se = 1,10 para la recta, y Se = 1,14 para la parbola. Lo que significa que es mejor ajuste la recta porque el error estndar es menor. Aunque en este caso como la diferencia es mnima se podra aceptar tambin la parbola como un buen ajuste. Si calculamos el coeficiente de determinacin para la recta y para la parbola tendremos que:

yi yi 2 Sy2 = N N
Para la recta;

( )

361 = 8

( )

47 2 = 10,609 8

1,21 R2 = 1 - = 0,885 10,609 1,316 R2 = 1 - = 0,875 10,609

Para la parbola;

Como toman valores prximos a 1, significa que hay pocos errores o residuos en el ajuste tanto de la recta como de la parbola, y por lo tanto la dependencia entre x e y es fuerte. En conclusin, el nmero de pedidos recibidos depende mucho del nmero de vales enviados. La recta explica el 88% de las variaciones en el nmero de pedidos obtenidos, mientras que la parbola explica el 87% de los mismos.
19

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

Polticas de marketing

ACTIVIDADES
Se2 0,052 = 1 = 0,994 R2 = 1 9,940 Sy2 Yi2 ni ayini bxiyini Se2 = ni

Yi2 ni yini Sy2 = ni ni

( )

(2294) + (0,302 ! 310) (0,852 ! 2799) Se2 = = 0,052 55

2294 310 Sy2 = 55 55

( )
n 6 8 3 9 10 9 8 2 55

= 9,940

y 1 2 6 3 7 9 9 10 47

y2 1 4 36 9 49 81 81 100 361

yn 6 16 18 27 70 81 72 20 310

y2n 6 32 108 81 490 729 648 200 2294

xy 1 8 30 18 63 90 99 120 429

xyni xyni 6 64 90 167 630 810 792 240 2799

El valor de la varianza Se2 es muy pequeo por tanto podemos decir que la recta de regresin ajustada es muy representativa de la nube de puntos. El coeficiente de determinacin R2 es muy prximo a 1, lo que quiere decir que hay muy pocos errores o residuos y que casi todas las variaciones de y vienen explicadas por x y existe por tanto una gran dependencia.

2 A partir de los valores de x e y que se dan en la tabla del ejemplo que estamos analizando (cupones o vales descuento/nmero de pedidos), y sabiendo que la frecuencia con la que se presenta los mismos es: ni 6 8 3 9 10 9 8 2 Calcula la varianza residual y el coeficiente de determinacin para el ajuste de la recta, incorporando el valor de la frecuencia. Interpreta los resultados obtenidos. 3 En el estudio de la regresin se considera muy importante calcular el coeficiente de determinacin Qu informacin nos suministra su clculo?

1.4. COEFICIENTE DE CORRELACIN


El coeficiente de correlacin mide el grado de dependencia entre variables

El denominado coeficiente de correlacin trata de medir objetivamente el grado de variacin conjunta que tienen las variables o lo que es lo mismo, el grado de dependencia entre las mismas. Es decir, es otro indicador de la dependencia. El coeficiente de correlacin lineal para el caso de dos variables X e Y, que se representa por r, se define como:

Sxy r = Sx Sy
en donde: - Sxy es la covarianza - Sx es la desviacin estndar de la variable X - Sy la desviacin estndar de la variable Y. La desviacin estndar es la raz cuadrada de la varianza. Antes ya hemos visto cmo se calculaba la varianza, pero no la covarianza. La covarianza es la media aritmtica de los productos de las desviaciones de cada una de las variables respecto a sus medias respectivas.

(xi x) ( yi y) xiyi Sxy = = xy N N


Para calcular la covarianza se utiliza la siguiente frmula:

xi yi xi yi Sxy = N N N
Las varianzas son siempre positivas, sin embargo la covarianza puede ser positiva o negativa. La covarianza ser positiva cuando las dos variables se mueven en el mismo sentido, es decir, cuando al aumentar una aumenta la otra, y es negativa si se mueven en sentido contrario. Cuando los valores de las variables vienen acompaadas de las frecuencias correspondientes, la covarianza ser:
20

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

La estadstica aplicada a las variables del marketing

xi yi ni xi ni Sxy = N N

yi ni N

Cmo deben interpretarse los valores obtenidos por el coeficiente de correlacin?


Si

r = 1, la correlacin lineal es perfecta y directa, o sea la nube de puntos est toda sobre una recta creciente. Si r = -1, la correlacin lineal es perfecta e inversa, o sea la nube de puntos est toda sobre una recta decreciente. Si r = 0, no existe en absoluto correlacin lineal, en cuyo caso puede ocurrir que no exista relacin entre las dos variables, o que esa relacin no sea lineal. Si r es prximo a 0, entonces no existe correlacin lineal, pero puede haberla de otro tipo. En los casos intermedios, se puede hablar de una correlacin lineal dbil o fuerte segn que el valor de r se aproxime a 0 o a 1. Cuando se utiliza como modelo una recta, el cuadrado del coeficiente de correlacin es igual al coeficiente de determinacin. Por lo tanto, como el coeficiente de determinacin toma valores comprendidos entre 0 y 1, el coeficiente de correlacin tomar valores comprendidos entre -1 y +1.

U N I D A D 3

R ECUERDA

El coeficiente de correlacin lineal es una medida de la intensidad de la relacin lineal entre las variables. Cuanto ms asociacin lineal existe entre las variables, mejor resumir la funcin (recta, parbola) a la nube de puntos, y, por tanto, ms fiables sern nuestras predicciones.

A travs de un caso prctico vamos a ver cmo se opera cuando una variable toma muchos valores distintos y la reduccin estadstica exige utilizar intervalos. Ejemplo: En este ejemplo los valores de las variables vienen agrupados en intervalos y adems con sus frecuencias. Se va a determinar la correlacin existente entre la demanda de chaquetas (1 chaqueta) en unos determinados intervalos de precio y la de pantalones (1 pantaln) en otros intervalos de precio de un colectivo concreto, a partir de la frecuencia de los mismos. x - Precios de chaqueta
Y X 60-69,9 70-79,9 nxdx2

y - Precios de pantaln
80-89,9 90-99,9 100-109,9 3 5 4 ny 3 5 32 11 7 58 -15 135 dy 2 1 0 -1 -2 nydy 6 5 0 -11 -14 -14 nydy2 12 5 0 11 28 56

150-159,9 160-169,9 170-179,9 180-189,9 190-199,9 nx dx nxdx

4 5 7 16 -2 -32 64

9 6 15 -1 -15 15

7 0 0 0

8 1 8 8

12 2 24 48

21

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

Polticas de marketing

Para facilitar el clculo utilizamos el mtodo denominado clave de las desviaciones dx, dy. n dx dy es la frecuencia de cada una de las casillas multiplicadas por dx y dy correspondiente.

n dx dy = 7[(-2)(-2)] + [5(-2)(-1)] + [6(-1)(-1)] + +[4(-2) 0] + [9(-1) 0] + [7(0)(0)] + [8(1)(0)] + [4(2)(0)]+ + [5(2)(1)] + [3(2)(2)] = 28 +10 +6 + 10 + 12 = 66 nx d 15 = = 0,258 dx = N 58 ny dx 14 = = 0,241 dy = N 58 n dx dy dx Sxy = N Sx = d 2x (dx ) 2 = = 135 15 58 58

66 dy = ( 0,258) ( 0,241) =1,075 58

nx dx 2 nx d 2x = N N

( )= (

2,327 (0,258) 2 = 1,503

Sy = =

ny dy2 ny dy 2 = N N

56 14 2 = 58 58

( )

0,965 0,058 = 0,952

1,075 Sxy r = = = 0,751 1,503 0,952 Sx Sy

ACTIVIDADES
4 A partir de los valores obtenidos en el coeficiente de correlacin lineal de las siguientes variables, interpreta los resultados. Variables Personas que leen libros / Nivel acadmico Venta de pan / Nivel de renta Demanda de joyas / Nivel de renta Precio de la fruta / Demanda de fruta
xi yi xi yi 429 58 47 Sxy = ! = ! = 11,031 N N N 8 8 8 xi2 xi 2 524 58 2 Sx2 = = = 3,596 N N 8 8 yi2 yi 2 361 47 2 Sy2 = = = 3,257 N N 8 8
Sxy 11,031 r = = = 0,9418 SxSy 3,596 ! 3,257

Valores r = 0,91 r = 0,001 r = 0,98 r = -0,98

( ) ( )

( ) ( )

Al aproximarse r a 1 se puede decir que existe un alto grado de dependencia entre el nmero de pedidos recibidos y los vales de descuento repartidos, y este grado de dependencia o correlacin es directa. Cuantos ms vales se enven, ms pedidos se recibirn.

5 Calcula el coeficiente de correlacin lineal para el ejemplo que se ha trabajado en regresin lineal de vales de descuento/ pedidos recibidos. Explica los resultados obtenidos. 6 Explica la diferencia que existe entre estudiar la regresin de dos variables y la correlacin de las mismas.

22

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

La estadstica aplicada a las variables del marketing

2. REGRESIN Y CORRELACIN MLTIPLE


En este caso seguimos analizando la regresin en el supuesto de dependencia causal. Se estudia la correlacin en tres o ms variables, tomando una de ellas como dependiente o variable efecto y el resto como independientes o variables causa (explicativas). Como vamos a ver, todo lo que se ha analizado para la regresin y correlacin simple es de aplicacin a la mltiple. Consideremos el caso de tres variables x, y, z; si tomamos y como dependiente, la ecuacin de regresin vendr dada por la expresin: y = a + bx + cz y= variable dependiente x, z = variables independientes a, b, c = constantes La ecuacin de regresin viene dada por un plano y nos dar la relacin de y con las dos variables x y z que son independientes. Para obtener la ecuacin de regresin que proporcione un buen ajuste, aplicamos el mtodo de los mnimos cuadrados para tres variables. Suponemos una funcin de ajuste lineal: y = a + b x + c z El criterio mnimo cuadrtico exige estimar los parmetros de tal forma que la siguiente expresin sea mnima:

La regresin y correlacin mltiple estudia la relacin/dependencia entre ms de dos variables

U N I D A D 3

M = (yi - yi)2 = (yi - a - b xi - c zi)2


i=1 i=1

Para que esta expresin sea mnima se debe cumplir, como ya hemos visto para la regresin simple, que las primeras derivadas parciales respecto a los diferentes parmetros sean iguales a cero. Al operar obtenemos el sistema de ecuaciones normales

M = 2 (yi - a - b xi - c zi ) (-1) = 0 a M = 2 (yi - a - b xi - c zi ) (-xi) = 0 b M = 2 (yi - a - b xi - c zi ) (-zi) = 0 c yi = N x a + bxi + czi yi xi = axi + bxi2 + czi xi yizi = azi + bxizi + czi2
Este sistema de ecuaciones nos permite calcular las tres incgnitas a, b y c, y de esta forma obtener la ecuacin de regresin ajustada, que nos permitir predecir el valor de y en funcin de las otras variables y explicar la dependencia causal entre y, x y z.

23

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

Polticas de marketing

La representatividad o bondad del modelo para explicar las variaciones de la variable dependiente se mide mediante la varianza residual cuya frmula es:

y2 ay bxy czy Se2 = N


La raz cuadrada de esta varianza nos da el error estndar del ajuste, que viene expresado en la misma unidad de medida que la variable dependiente. Aunque tal y como hemos sealado para el caso de la regresin simple, para medir la representatividad o bondad del ajuste, es ms conveniente emplear el coeficiente de determinacin. ste viene dado por:

Se2 R2 = 1 Sy2
siendo Sy2 la varianza de la variable dependiente. La raz cuadrada del coeficiente de determinacin se denomina coeficiente de correlacin mltiple, y expresa el grado de dependencia de la variable y con respecto a x y z.

Las ideas bsicas de la correlacin simple y la mltiple son las mismas. En el estudio de la regresin/correlacin simple intervienen dos variables, una dependiente y otra independiente. En el estudio de la regresin/correlacin mltiple intervienen 3 o ms variables, una de ellas como dependiente y el resto como independientes. La ecuacin de regresin ajustada, por ejemplo a tres variables, servir para la doble finalidad de explicar la dependencia causal entre y, x y z, y predecir la primera variable en funcin de las ltimas.

RECUERDA
24

ACTIVIDADES
7 A partir de los siguientes estudios, identifica la tcnica estadstica que se debe aplicar, la regresin o la correlacin simple/mltiple:

Estudio de la influencia del gasto en publicidad en las ventas de un determinado producto. Estudio de la previsin del nmero de diputados que puede obtener un partido poltico en funcin del gasto en propaganda, a partir de los datos de campaas electorales anteriores. Anlisis del grado de asociacin entre las ventas de unos grandes almacenes y el nmero de vendedores. Estudio para una compaa discogrfica, del grado de dependencia entre las ventas de discos de un grupo musical, el nmero de conciertos dados en el verano y el precio de los eleps.

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

La estadstica aplicada a las variables del marketing

3. LAS SERIES TEMPORALES


En trminos estadsticos qu se entiende por serie? Una serie es un conjunto de observaciones o medidas realizadas en una poblacin, atendiendo a una o varias caractersticas determinadas. Normalmente, vamos a encontrar las series estadsticas en tablas, que llamaremos tablas estadsticas, y que sirven para contener los datos de la serie de una forma ordenada y fcil de consultar. Ejemplo: Las ventas de libros de un establecimiento comercial a lo largo de un ao se pueden distribuir por meses
Meses Enero Febrero Marzo Abril Mayo Junio Julio Agosto Septiembre Octubre Noviembre Diciembre Libros vendidos 4.000 4.100 3.900 4.500 5.000 3.670 3.200 3.000 7.000 6.500 4.000 4.300

U N I D A D 3

En la tabla se relacionan los meses del ao con la venta de libros. Analizando la tabla observamos por un lado la actividad de cada mes comparando con el resto de meses o la del ao comparando con otros aos anteriores. Sin embargo, si tomamos un slo mes del ao, la informacin de este caso sera de poca utilidad, por referirse a un hecho aislado. Existen distintos tipos de series estadsticas en funcin de las caractersticas que estudian. Las series objeto de nuestro estudio son las cronolgicas o temporales que se ocupan del comportamiento de los hechos a lo largo del tiempo. La utilidad de este tipo de series la vamos a ver en aquellos estudios de marketing en los que la variable tiempo juegue un papel importante. 3.1. CONCEPTO Y MOVIMIENTOS CARACTERSTICOS DE LAS SERIES TEMPORALES Se denomina serie cronolgica o temporal a aqulla en la que alguno de sus caracteres se mide en unidades de tiempo. Estas series se expresan matemticamente como una funcin del tiempo Y = F (t), y estudian el comportamiento de una variable Y a lo largo del tiempo t.
25
Las series temporales estudian el comportamiento de una o ms variables a lo largo del tiempo

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

Polticas de marketing

La unidad de tiempo se elige en funcin del estudio que se vaya a realizar

En funcin del tipo de estudio que se vaya a realizar, se elegir la unidad de tiempo. As se pueden utilizar unidades de tipo anual o mayores (trienios, lustros, etc.) y menores que un ao (horas, das, meses, etc.). Dentro de las unidades de tiempo elegidas, stas pueden tener duracin constante (horas, das, etc.) o duracin variable (meses, aos, etc.). Ejemplo: La evolucin de la produccin anual total de coches de una determinada marca durante un cierto nmero de aos es una serie temporal. La experiencia con muchos ejemplos de series en el tiempo ha revelado ciertos movimientos o variaciones caractersticas que aparecen a menudo y, pudiendo realizarse una prediccin de futuros movimientos a partir del anlisis de las mismas. 3.2. CLASIFICACIN DE LOS MOVIMIENTOS DE LAS SERIES TEMPORALES Los movimientos de las series en el tiempo se pueden clasificar en cuatro tipos principales llamados componentes de una serie en el tiempo:

Los movimientos de tendencia se refieren a unidades grandes de tiempo

a) Movimientos de larga duracin o tendencia. Mediante este movimiento se intenta encontrar la direccin general o tendencia del grfico de la serie en el tiempo. Para ello se consideran unidades grandes de tiempo. En general, este movimiento vendr representado por una recta o curva de tendencia. La determinacin de tales curvas o rectas de tendencia puede realiRECTA DE TENDENCIA CURVA DE TENDENCIA

x zarse por varios mtodos: - El mtodo de los mnimos cuadrados. - El mtodo de la semimedia. - El mtodo del movimiento medio. Estos mtodos los estudiaremos ms tarde.
Los movimientos cclicos se refieren a las oscilaciones en torno a la curva de tendencia

b) Movimientos cclicos. Se refieren a las oscilaciones, en movimientos de larga duracin, en torno a una recta o curva de tendencia. Estos ciclos, como se les llama, pueden ser peridicos o no, es decir, pueden seguir o no esquemas repetidos en intervalos iguales de tiempo. Ejemplo: Los ciclos econmicos (prosperidad, recesin, depresin y recuperacin). En la actividad empresarial, los movimientos se consideran cclicos si su perodo tiene un intervalo de tiempo no inferior a un ao.

26

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

La estadstica aplicada a las variables del marketing

MOVIMIENTOS CCLICOS

x c) Movimientos estacionales. Se refieren a los esquemas idnticos que parece seguir una serie en el tiempo durante los meses correspondientes en aos sucesivos. Estos movimientos anuales de la serie son debidos a sucesos recurrentes que tienen lugar anualmente, y aunque los valores dentro de cada ao no sean los mismos, las grficas evolucionan casi idnticamente. Ejemplo: La venta de juguetes en Navidad.
MOVIMIENTOS ESTACIONALES
Los movimientos estacionales se refieren a movimientos anuales

U N I D A D 3

x d) Movimientos al azar o irregulares. Se refieren a los movimientos espordicos de las series en el tiempo debidos a sucesos al azar que alteran la serie de un modo apreciable. Ejemplo: Inundaciones, huelgas,... Aunque tales sucesos producen variaciones en la serie que pierden su influencia tras poco tiempo, las consecuencias pueden ser tan intensas que sean capaces de alterar otros movimientos de la serie. Podran dar lugar a nuevos movimientos cclicos o de otro tipo. Su representacin grfica es variable y depende estrictamente del hecho espordico acontecido.
Los movimientos irregulares se refieren a movimientos espordicos

ACTIVIDADES
8 De las ventas de productos que pueden ser objeto de estudio por el marketing y que a continuacin se citan, seala las que pueden dar lugar a movimientos estacionales. Razona tu respuesta. - Baadores. - Turrones. - Detergente. - Helados. - Leche.

27

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

Polticas de marketing

3.3. MTODOS DE ESTIMACIN DE LA TENDENCIA


El mtodo de los mnimos cuadrados es uno de los mtodos de estimacin de la tendencia

Tal y como se ha expresado anteriormente, existen varios mtodos para estimar la tendencia. Uno de ellos, el de los mnimos cuadrados, ya se ha explicado en esta Unidad, por lo que ahora vemos los otros dos.
Mtodo de las semimedias. Consiste en separar los datos en dos partes (preferiblemente que sean iguales) y promediar los datos de cada parte, obteniendo con ello dos puntos en el grfico de la serie del tiempo. Entonces se traza una recta de tendencia entre esos dos puntos, y los valores de tendencia se determinan de esa recta.

El mtodo de las semimedias se utiliza para estudiar la tendencia cuando sta es lineal

El mtodo es aplicable a series en las que la tendencia es lineal o aproximadamente lineal, porque si no nos podra conducir a una interpretacin errnea. Puede aplicarse a casos en que los datos pueden agruparse en varias partes, en cada una de las cuales la tendencia es lineal, aunque la serie no tenga esa tendencia. En este caso aparecer una lnea de tendencia quebrada que aproximar convenientemente la tendencia global de la serie. Ejemplo: Sabemos que el nmero de pedidos (expresados en miles) que ha recibido un mayorista de plantas durante los 7 ltimos aos, se desglosa de la siguiente forma:
AOS N DE PEDIDOS 1996 20 1997 24 1998 15 1999 16 2000 17 2001 18 2002 19

La estimacin de la tendencia aplicando el mtodo de las semimedias ser: Sin agrupar los valores: 20+24+15+16 = 18,75 4 16+17+18+19 4 = 17,50

La recta de la tendencia vendra dada por el segmento de la recta que contiene estos dos puntos : N pedidos
25 20 15 10 5 96 97

98

99

00

01

02

Aos

28

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

La estadstica aplicada a las variables del marketing

Agrupando los valores: [20] [24;15] [16;17] [18;19] Las medias de cada grupo son: 20; 19,5; 16,5 y 18,5 En este caso la tendencia sera: N pedidos
25 20 15 10 5

U N I D A D 3

96

97

98

99

00

01

02

Aos

Mtodo del movimiento medio. Hemos visto que para representar la grfica de una serie temporal, se unen los puntos cuya abcisa es la unidad de tiempo y cuya ordenada es el valor de la serie para esa unidad.

El mtodo del movimiento medio toma como ordenada la media de un subconjunto de valores de la serie y va determinando por este procedimiento las sucesivas ordenadas de los puntos de la grfica. Los subconjuntos de valores tomados pueden tener distintos cardinales, normalmente se toman de tres, cuatro, o cinco elementos. Segn el nmero de elementos que tenga cada uno de esos subconjuntos, diremos que el movimiento medio es de orden tres, cuatro o cinco respectivamente. Usando movimientos medios de rdenes apropiados, podemos eliminar esquemas cclicos, estacionales o irregulares, dejando as tan slo el movimiento de tendencia. Una de las desventajas de este mtodo es que los datos al comienzo y al final de una serie se pierden. Ejemplo: Continuando con el supuesto del ejemplo anterior
AOS N DE PEDIDOS 1996 20 1997 24 1998 15 1999 16 2000 17 2001 18 2002 19 El mtodo del movimiento medio calcula la tendencia eliminando los esquemas cclicos estacionales e irregulares

Representacin grfica de la serie: N pedidos


25 20 15 10 5

... Mov. orden 3 - - - Mov. medio ponderado orden 3

96

97

98

99

00

01

02

Aos
29

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

Polticas de marketing

Aplicando el mtodo de Movimiento Medio, tenemos grupos de tres elementos (1, 2, 3) y hallamos la media: 20+24+15 = 19,6 3 24+15+16 = 18,3 3 15+16+17 = 16 3 16+17+18 = 17 3 17+18+19 = 18 3 Estos valores nos daran el movimiento de orden 3. Este mtodo puede utilizarse estableciendo ponderaciones para los elementos que componen cada grupo, entonces estaramos en el Mtodo del movimiento medio ponderado. Ejemplo: Empleamos en el ejemplo anterior ponderaciones (1, 3, 1), por lo que las medias ponderadas seran: (20 1) + (24 3) + (15 1) = 21,4 1+3+1 (24 1) + (15 3) + (16 1) = 17 1+3+1 (15 1) + (16 3) + (17 1) = 16 1+3+1 (16 1) + (17 3) + (18 1) = 17 1+3+1 (17 1) + (18 3) + (19 1) = 18 1+3+1 La representacin de estos puntos, nos da los movimientos medios de orden 3 ponderados. Las series temporales estudian el comportamiento de una variable a lo largo del tiempo. Los movimientos de las series en el tiempo pueden ser: de larga duracin o tendencia, cclicos, estacionales e irregulares. Los mtodos para estudiar la tendencia son: - El mtodo de los mnimos cuadrados. - El mtodo de las semimedias. - El mtodo del movimiento medio.

RECUERDA
30

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

La estadstica aplicada a las variables del marketing

ACTIVIDADES
9 Responde si son verdaderas o falsas las siguientes afirmaciones, y razona tu respuesta:
- Cuando se calcula la tendencia por el mtodo de los mnimos cuadrados, la variable independiente x siempre es el tiempo. - Cuando se utiliza el mtodo del movimiento medio para calcular la tendencia, aparecen los denominados esquemas cclicos y los estacionales. - Cuando la tendencia de una serie es lineal, se suele aplicar el mtodo de las semimedias

4. LOS NMEROS NDICES


Anteriormente hemos estudiado las distribuciones atendiendo a sus caractersticas de dispersin o desviacin y de tendencia. Ahora vamos a ver cules son las variaciones relativas dentro de los datos de la serie, a travs de los nmeros ndices. 4.1. DEFINICIN Y APLICACIONES DE LOS NMEROS NDICES Un nmero ndice es una medida estadstica que tiene como finalidad comparar una variable o magnitud econmica a lo largo del tiempo. Ejemplo: Queremos estudiar la evolucin del precio de la patata entre dos aos consecutivos 2001 y 2002. En 2001 el precio del Kg. de patata fue de 0,54 y en el ao siguiente 2002 de 0,57 . Si nicamente dijsemos que la variacin del precio es de 0.03 /Kg. (0,57-0,54) este dato nos proporcionara muy poca informacin, ya que no sera lo mismo que el precio pase de 0,54 a 0,57, que de 0,30 a 0,33 , puesto que se parte de un valor inicial ms bajo. Por lo tanto se debe estudiar la variacin en proporcin al valor inicial. Para ello se elabora el nmero ndice, asignando al valor de la magnitud inicial un valor ficticio de 100, y se hallan los correspondientes a cada perodo sucesivo, mediante una regla de tres. En el ejemplo 0,54 100 0,57 x 0,57 ! 100 x = I = -- = 105,5 0,54 Es decir, que lo que vala 100 en 2001, vale 105,5 en 2002. Si el precio hubiera pasado de 0,30 a 0,33 el ndice sera 0,33 ! 100 x = I = --- = 110 0,30
31

U N I D A D 3

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

Polticas de marketing

Es decir lo que costaba 100 en 2001, cuesta en 2002 110 . Por lo tanto vemos que la variacin ha sido ms importante en el segundo caso.
Los nmeros ndices son los porcentajes de cada valor de la variable, con respecto al valor de referencia, denominado base

Los nmeros ndices son porcentajes de cada uno de los valores de la variable con respecto al valor base que se toma como referencia. Normalmente el valor base se hace igual a 100, para simplificar los clculos. Los nmeros ndices tambin se utilizan para hacer comparaciones. Ejemplo: Con nmeros ndices podemos comparar los costes de alimentacin, del transporte o de otros servicios en una ciudad durante un ao con los de los aos anteriores, o las ventas de un determinado artculo en una autonoma con otra autonoma. Las mayores aplicaciones de los nmeros ndices tienen lugar en el campo de la economa. A travs de los mismos se obtienen predicciones acerca del ndice de paro, de produccin, salariales y otros. Entre los ndices ms conocidos est el ndice de los Precios al Consumo (I.P.C.) o ndice del coste de la vida. Este ndice se utiliza por ejemplo para las revisiones anuales de los salarios como veremos ms tarde. Otros nmeros ndices son el de produccin, el de coste de la vivienda, natalidad, etc. 4.2. CLASIFICACIN Y CLCULO DE LOS NMEROS NDICES
N de variables que varan

ndices SIMPLES COMPLEJOS

Una variable de una variables

Ms

NDICES SIMPLES
Los ndices simples son los ndices de una sola variable en funcin del tiempo

Los ndices simples miden la movilidad de una serie temporal a lo largo del tiempo en la que X son los valores observados y T los distintos perodos de tiempo en los que se han hecho las observaciones, siendo la referencia el perodo de tiempo que se tome como base. Se calculan de la siguiente manera:
T 0 1 2 3 . . . . X X0 X1 X2 X3 . . ndice simples X0 ----- ! 100 = 100 X0 X1 ----- ! 100 = 100 X0 X2 ----- ! 100 = 100 X0 X3 ----- ! 100 = 100 X0

32

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

La estadstica aplicada a las variables del marketing

Ejemplo: Los beneficios de una pequea empresa a lo largo de los 5 ltimos aos han sido los que se muestran en la tabla:
Aos (T) 1998 1999 2000 2001 2002 Beneficios (*) 32 45 50 52 66 ndices 100 141 156 163 206

U N I D A D 3

* Cantidades expresadas en miles.

Para calcular el grado de aumento o disminucin con respecto al perodo base, se determina qu porcentaje representa la variacin restando 100 al ndice porcentual. A la vista de los resultados, podemos decir por ejemplo que en 2001 los beneficios aumentaron un 63% con respecto a 1998. NDICES COMPLEJOS Los ndices complejos o compuestos se refieren a la variacin de ms de una serie de valores. Como cada una de las variables est expresada en unidades normalmente distintas a las dems, se toman los nmeros ndices simples de cada variable para evitar tener un conjunto de cantidades heterogneas. De esta forma tenemos unos nmeros abstractos que nos dan los valores relativos de las magnitudes, sin que influya el hecho de que stas vengan expresadas en unidades diferentes. Por todo lo anteriormente expresado, podemos decir que un ndice complejo no es ms que una combinacin de ndices simples, referidos cada uno de ellos, a una variable. Ejemplo: Queremos medir en el tiempo la evolucin del precio de las frutas, y tenemos diferentes precios para cada variedad (peras, naranjas, etc.)
ndices complejos NDICES COMPLEJOS SIN PONDERAR PONDERADOS Los ndices compuestos son los ndices de ms de una variable en funcin del tiempo

ndices complejos sin ponderar. En este tipo de ndices, las variables que intervienen en su determinacin tienen la misma importancia. Para la obtencin de stos, se utilizan dos mtodos :

Mtodo de la media aritmtica simple: se calcula la media aritmtica de los nmeros ndices simples. Suponiendo que sean n las variables que influyan en el fenmeno que se est analizando:
33

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

Polticas de marketing

I1 + I2 + I3 + ...... + In Ic = n Siendo Ii los ndices simples de cada variable.

Mtodo de la media agregativa simple: se suman las cantidades de las distintas variables dentro de cada ao, y luego se calcula el ndice complejo sin ponderar como ndice simple referido al resultado de la suma xt Ic = = 100 x0
xt = suma por filas dentro de cada ao t. x0 = suma por filas de las cantidades de cada ao base. Lo entenderemos mejor con un ejemplo. Ejemplo: Un establecimiento hotelero da tres tipos de servicios a sus clientes, por los que ha obtenido durante los 4 ltimos aos los siguientes beneficios:
Aos 1999 2000 2001 2002 S1 20 30 70 80 S2 15 25 30 40 S3 12 20 24 35

La tabla de ndices simples para cada servicio sin ponderar, con base t0 = ao 1999 es:
Aos 1999 to 2000 2001 2002 S1 100 150 350 400 S2 100 166 200 266 S3 100 166 200 291

Los ndices complejos sin ponderar por el mtodo de la media aritmtica simple son :
Aos 1999 to 2000 2001 2002 Suma de ndices simples (100+100+100)=300 (150+166+166)=482 (350+200+200)=750 (400+266+291)=957 ndices Complejos 300 = 100 3 482 = 160,6 3 750 = 250 3 957 = 319 3

34

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

La estadstica aplicada a las variables del marketing

Utilizando el mtodo de la media agregativa simple:


Aos 1999 2000 2001 2002 S1 20 30 70 80 S2 15 25 30 40 S3 12 20 24 35 Xt 47 75 124 155 Ic 100 159,5 263,8 329,7

Al aplicar cada uno de los mtodos, normalmente, se obtienen unos ndices complejos distintos. Por lo que es recomendable que junto al valor de los nmeros ndices se informe del mtodo utilizado.

U N I D A D 3

ndices complejos ponderados: en este tipo de ndices, las variables que intervienen en su determinacin no tienen la misma importancia.
Para la obtencin de stos, se asigna un nmero o coeficiente de peso o ponderacin, a cada una de las variables que se estudian, reflejando en los nmeros ndices su influencia relativa. Ejemplo: El balance de la Guardia Civil de Trfico de una ciudad en cuanto a multas y sanciones impuestas por infracciones de circulacin han sido las siguientes, clasificadas en funcin de la sancin aplicable:
Total Sanciones 4.400 4.077 4.812 5.040 SANCIONES Graves 320 380 410 430

Ao 1999 2000 2001 2002

Leves 4.000 3.600 4.300 4.500

Muy Graves 80 97 102 110

Las ponderaciones asignadas han sido: Sancin leve. . . . . . . . . . . . . . . . . . . . . . . . peso 1 Sancin grave . . . . . . . . . . . . . . . . . . . . . . peso 20 Sancin muy grave (retirada de carnet). . . peso 40 Los ndices ponderados tomando como base el ao 1999 son: 1999: (100 1) + (100 20) + (100 40) = 100 61 380 97 100= 118,75 100= 121,25 320 80

2000: 3600 100= 90 4000

(90 1)+(118,75 20)+(121,25 40) = 119,91 61


35

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

Polticas de marketing

2001: 4300 410 102 100=107,5 100=128,12 100=127,50 4000 320 80 (107,5 1)+(128,12 20)+(127,50 40) = 127,37 61 2002: 4500 430 110 100=112,5 100=134,37 100=137,5 4000 320 80 (112,5 1)+(134,37 20)+(137,5 40) = 136,06 61

RECUERDA

Los nmeros ndices tienen como finalidad la comparacin de una o ms variables en el tiempo. Los ndices simples miden la variacin de una serie temporal a lo largo del tiempo. Los ndices complejos miden la variacin de ms de una serie temporal a lo largo del tiempo, y pueden ser: Sin ponderar: las variables que intervienen en su determinacin tienen la misma importancia. Ponderados: las variables que intervienen en su determinacin no tienen la misma importancia.

ACTIVIDADES
10 Cul/es de las siguientes afirmaciones describe/n la utilidad de los nmeros ndices: Los nmeros ndices permiten establecer comparaciones entre las variaciones que experimentan una o ms variables a lo largo del tiempo. Los nmeros ndices sirven para medir el grado de asociacin entre variables. Con los nmeros ndices podemos saber la variacin en trminos proporcionales de una variable.

11 Explica la diferencia entre ndice simple e ndice complejo.

4.3. LOS NDICES DE PRECIOS Son los ms destacados dentro de los ndices complejos ponderados y son los que se refieren a las variaciones de los precios. Los precios de los diferentes productos o servicios cambian de un ao para otro (unos suben, otros bajan y otros permanecen constantes). Dado que existen millones de bienes y servicios, para analizar la evolucin de los precios de la economa se recurre a una medida del nivel medio de los precios. Un ndice de precios proporciona una medida adecuada del nivel medio de precios de los diferentes productos o servicios. La caracterstica comn de estos ndices es que utilizan valores como coeficientes de ponderacin, es decir, datos que se pueden expresar como producto de un precio por una cantidad. Los ms importantes son los siguientes:
36

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

La estadstica aplicada a las variables del marketing

ndices de precios ms importantes


ndice de Laspeyres o mtodo del ao base Tipos de ndices de precios ndice de Paasche o mtodo del ao dado ndice de Fisher

de Laspeyres o mtodo del ao base. Su clculo se realiza utilizando al siguiente frmula:

ndice

Pt q0 IcL = x 100 P0 q0
P0 = precios del ao base. Pt = precios del ao dado t. q0 = cantidades consumidas en el ao base. qt = cantidades consumidas en el ao dado. Pt x q0 = valor total de las cantidades consumidas en el ao base, segn los precios del ao considerado. P0 x q0 = valor de las cantidades consumidas en el ao base segn los precios del ao base.
ndice de Paasche o mtodo del ao dado. Su clculo se realiza con la siguiente frmula:

U N I D A D 3

Pt qt IcP = x 100 P0 qt
Pt qt = suma de las cantidades consumidas en el ao considerado segn los precios de dicho ao. P0 qt = suma de las cantidades consumidas en el ao considerado segn los precios del ao base.
ndice de Fisher. Se define como la media geomtrica de los dos nmeros ndices anteriores, el de Lapeyres y el de Paasche.

IcF =

IcL IcP

Ejemplo: Vamos a calcular los tres ndices de precios anteriormente expuestos, para estudiar la variacin de los precios de tres marcas de detergentes (L1, L2, L3), como informacin tenemos las cantidades consumidas expresadas en miles durante 3 aos con sus precios correspondientes.
L1 Cantidad 40 25 35 L2 Cantidad 45 40 30 L3 Cantidad 25 30 37

Aos 2000 2001 2002

Precio 80 85 90

Precio 72 75 78

Precio 87 95 105

37

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

Polticas de marketing

Aos 2000 2001 2002

ndices de Laspeyres (80 40) + (72 45) + (87 25) (80 40) + (72 45) + (87 25) (85 40) + (75 45) + (95 25) (80 40) + (72 45) + (87 25)

IcL 100 100 8615 100 = 100 8615 9150 100 = 106,21 8615 9735 100 = 113 8615

(90 40) + (78 45) + (105 25) 100 (80 40) + (72 45) + (87 25)

Aos 2000 2001 2002

ndices de Paasche (80 40) + (72 45) + (87 25) (80 40) + (72 45) + (87 25) (85 25) + (75 40) + (95 30) (80 25) + (72 40) + (87 30)

IcP 100 100 8615 100 = 100 8615 7975 100 = 106,47 7490 9375 100 = 114,2 8179

(90 35) + (78 30) + (105 37) 100 (80 35) + (72 30) + (87 37)

Aos 2000 2001 2002

ndices de Fisher 100 100 106,21 106,47 113 114,62

IcF 100 106,33 113,80

4.4. EL NDICE DE PRECIOS AL CONSUMO


El IPC es un ndice complejo que estudia la evolucin y los cambios mensuales de los precios de los bienes

Es el ndice de precios ms utilizado. El ndice de Precios al Consumo (IPC) lo publica mensualmente el Instituto Nacional de Estadstica (INE) y se elabora a partir de un conjunto de bienes y servicios que se considera representativo de las compras de una familia media espaola. La finalidad del IPC es medir la evolucin de los precios de los diferentes bienes y servicios que configuran la estructura bsica del gasto de esa familia. En la elaboracin del IPC, los precios de los diferentes artculos no tienen todos la misma ponderacin, sino que a cada uno se le asigna un peso en funcin de la importancia que el consumo del artculo tiene en el gasto total de la familia. Este conjunto de bienes y servicios constituye los que se denomina cesta de la compra.

38

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

La estadstica aplicada a las variables del marketing

Con los precios de los diferentes bienes y servicios que pertenecen a la cesta de la compra y que se recogen mensualmente, se elabora el IPC, utilizando la frmula de Laspeyres. Puesto que el IPC mide el coste de una cesta tpica de bienes comprados por los consumidores (coste de la vida) nos da una buena idea de cmo varan los precios de los bienes en general. Por ello el IPC es uno de los ndices bsicos utilizados para medir la tasa de variacin del nivel general de precios (inflacin). 4.5. PROCEDIMIENTOS APLICADOS A LA UTILIZACIN DE NMEROS NDICES Deflacin de series temporales. No se puede comparar el valor de una variable en dos perodos distintos sin considerar la evolucin de los precios que haya podido producirse.

U N I D A D 3

Las variables se pueden medir en unidades monetarias corrientes y en unidades monetarias constantes, o lo que es lo mismo, con precios corrientes o con precios constantes: - Si valoramos las variables en unidades monetarias corrientes, las medimos en unidades del ao en que se aplican. - Si valoramos las variables en unidades monetarias constantes, ajustamos las u. m. corrientes teniendo en cuenta las variaciones del nivel general de precios. Los precios aparecen como variable puente entre las variables reales (u.m. constantes) y las nominales (u.m. corrientes), siendo los ndices de precios los que se utilizan para realizar la deflacin. La deflacin o deflactacin de series temporales consiste en corregir la variacin del poder adquisitivo del dinero como consecuencia de las variaciones de los precios. Ejemplo: El ms tpico ejemplo de deflacin es el del dinero a lo largo del tiempo. Por lo que el hecho de que el salario de una persona crezca de un ao a otro, sin embargo, puede significar que el salario real sea inferior, si el coste de la vida se ha incrementado y por consiguiente ha decrecido la capacidad de adquisicin. La deflacin de valores en general, se calcula mediante una regla de tres: It > Vt 100 > X Siendo: It (ndice del coste de la vida en el ao estudiado t) Vt (valor en el ao) 100 (ndice del coste de la vida en el ao base) X (valor en el ao actual t, en pesetas del ao base) Por lo que, Vt pesetas del ao t equivalen a X pts. del ao base.
39
Mediante la deflacin, se obtiene el valor real de las variables utilizando los ndices de precios

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

Polticas de marketing

Ejemplo: Un trabajador cobra en trminos nominales por da de trabajo 30 en 2001 y el IPC correspondiente a 2001 (base 1994) es 143,32, el ingreso real (en euros del ao base 1994) ser: 143,32 > 30 (t nominales) 100 > X (t reales) 30 ! 100 = 21,08 . 143,32
q Cambio del perodo base. Se procede a un cambio del perodo de base cuando ste pierde representatividad con el tiempo, ya que se debe procurar que el perodo base sea lo ms significativo posible.

Se cambia el perodo base cuando pierde representatividad

Los nuevos nmeros ndices con el perodo base se obtienen a travs de un mtodo de aproximacin que se llama mtodo de la regla proporcional. Este mtodo consiste en dividir cada uno de los ndices viejos por el ndice correspondiente al nuevo perodo base, y multiplicarlos por 100 para expresar los resultados en porcentajes. Ejemplo: Partimos de una tabla de las ventas de una empresa en unidades de un artculo durante los aos 1998 a 2001, y de los nmeros ndices simples, tomando como base el ao 1998. Procedemos a calcular los nmeros ndices cambiando el perodo base al ao 2001.

Aos 1998 1999 2000 2001

Ventas 3.900 5.790 10.420 15.670

I (base 1998) 100 148,46 267,17 401,79

I (base 2000) 100 ----- ! 100 = 37,42 267,17 148,46 ----- ! 100 = 55,56 267,17 100 401,79 ----- ! 100 = 150,03 267,17

Los ndices de precios se refieren a las variaciones de los precios en el tiempo. Los ms importantes son: ndice de Laspeyres ndice de Paasche ndice de Fisher.

El IPC es el ndice de precios ms utilizado y su finalidad es medir la evolucin de los precios de los diferentes bienes y servicios que constituyen la cesta de la compra.

ACTIVIDADES
12 Explica en qu consiste la deflacin de series temporales y su utilidad.

40

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

ndice General

ndice Unidad

Primera

Anterior Siguiente

ltima

También podría gustarte