Está en la página 1de 9

estándar de la media.

Esta variable será de bastante ayuda en las secciones


posteriores.

En este punto es importante notar dos características de esta variable:

a. La media de z será siempre igual a 0. capítulo 1    Estadística descriptiva


b. La varianza, que será igual a la desviación estándar, será siempre igual a 1.

Se puede
Tablaver
8 si esto es cierto usando los valores de la Tabla 7:

Gastos en publicidad Tabla 8


Desviación de la media Variable estandarizada (z)
(miles de USD)
Año Gastos en Variable
Desviación de ( xi − x )
xi publicidad ( xi − estandarizada (z)
Año laxmedia
)
(miles de USD) ( xis  x )
( xi  x )
20X0 110,00
xi -37,2 s
-1,51
20X0 110,00 -37,2 -1,51
20X1 115,00 -32,2 -1,31
20X1 115,00 -32,2 -1,31
20X220X2 127,00 127,00 -20,2-20,2 -0,82
-0,82

20X320X3 138,00 138,00 -9,2 -9,2 -0,37


-0,37
20X4 147,00 -0,2 -0,01
20X4 147,00 -0,2 -0,01
20X5 150,00 2,8 0,11
20X520X6 150,00 175,00 2,8 27,8 1,13
0,11

20X6
20X7 175,00
160,00 27,8
12,8 0,52
1,13
20X8 170,00 22,8 0,93
20X720X9 160,00 180,00 12,8 32,8 0,52
1,33
Media
20X8 170,00 147,20 22,8 0,00
0,93
Desv.
20X9
Std (s) 180,00
24,62
32,8
1,00
1,33

Como se Media
ha demostrado 147,20 0,00
en la Tabla 8, la media y la varianza (que es igual en este
caso a Desv.
la desviación
Std (s) estándar)
24,62 es 0 y 1, respectivamente. 1,00

Como se ha demostrado en la Tabla 8, la media y la varianza (que es igual en este caso a la des-
5.6. estándar)
viación Coeficiente
es 0 yde variación
1, respectivamente.

Cuando un analista trata de comparar la media y desviación estándar de dos


5.6. Coeficiente
muestras de variación
distintas puede enfrentar el siguiente problema: si se tiene la siguiente
información:
Cuando un analista1,
muestra media
trata = 750laymedia
de comparar desviación estándar
y desviación 25;
estándar de muestra 2, distintas
dos muestras media =
21 y desviación
puede enfrentar elestándar 3. Basados
siguiente problema: en esta
si se tiene información,
la siguiente aparentemente
información: la muestra
muestra 1, media = 750 y
1 desviación
es la queestándar
tiene mayor dispersión. Sin embargo, al observar las medias uno
25; muestra 2, media = 21 y desviación estándar 3. Basados en esta información,puede
deducir que los
aparentemente valores1 esdela que
la muestra ambas
tiene muestras son radicalmente
mayor dispersión. Sin embargo, al diferentes. Por lo
observar las medias
tanto, el concluir que la muestra 1 presenta más dispersión que la muestra
uno puede deducir que los valores de ambas muestras son radicalmente diferentes. Por lo tanto, 2 puede
el
ser una conclusión errónea. En esas circunstancias lo mejor es usar el coeficiente
concluir que la muestra 1 presenta más dispersión que la muestra 2 puede ser una conclusión errónea. de
variación para la población es definido como:
En esas circunstancias lo mejor es usar el coeficiente de variación para la población es definido como:

CV  (14)
(14)

21
y ypara
para el
elcaso
casomuestral:
muestral:

s (15)
CV  (15)
x

Ejemplo 8:
21
En el caso anterior donde la muestra 1 tiene media = 750 y desviación estándar 25 y
la muestra 2, media = 21 y desviación estándar 3, los coeficientes de dispersión
serán:
Estadísticas y Econometría Financiera

  Ejemplo 8:
En el caso anterior donde la muestra 1 tiene media = 750 y desviación estándar 25 y la muestra
2, media = 21 y desviación estándar 3, los coeficientes de dispersión serán:

25
CV
= 1 = 0, 033
750

3
CV=
2 = 0,143
21

Como se puede observar, la dispersión de la muestra 1 es mucho menor que la dispersión de la


muestra 2.

6. Medidas de asociación
Cuando se tiene más de una variable, no solo será necesario comprender las características indi-
viduales de cada serie, sino que será importante además, entender la forma en que estas variables están
relacionadas. Será importante determinar qué variable causa a otra(s), el tipo de relación lineal que
puede existir entre ellas y, en general, si existe algún tipo de dependencia entre las variables a estudiar.
Esta sección presenta una breve introducción de las medidas de asociación básicas que se pre-
sentarán en más detalle en el capítulo 9 correspondiente a econometría financiera.
Para dar una visión general de las medidas de asociación, se introducirá el diagrama de series
de tiempo y el diagrama de dispersión. Posteriormente, se presentarán las siguientes medidas de
asociación: el coeficiente de correlación (R) y el coeficiente de variación (R 2).

6.1. El diagrama de series de tiempo


El diagrama de series de tiempo presenta la evolución de una variable en el tiempo. En el análisis
de asociación se usa este diagrama para ver cómo es que dos o más variables (co)varían en el tiempo,
permitiendo de esta manera detectar algunos patrones de asociación. En la siguiente sección se
presentara la forma de crear este diagrama con el uso de Excel.

6.2. El diagrama de dispersión


El diagrama de dispersión presenta los valores observados de dos variables, “x” e “y”. La variable
“x” es conocida como la variable independiente o variable explicativa, mientras que la variable “y”
es conocida como la variable dependiente o endógena.
El diagrama de dispersión permite determinar si existe algún tipo de relación (lineal o no) entre
las variables. Los tipos de relaciones que se pueden encontrar son:

22
capítulo 1    Estadística descriptiva

a. No relación.
b. Relación lineal positiva o directamente proporcional.
c. Relación lineal negativa o indirectamente proporcional.
d. Relación no lineal positiva, y
e. Relación no lineal negativa.

A continuación se muestra un ejemplo que permitirá entender el diagrama de series de tiempo


y el diagrama de dispersión. La Tabla 9 presenta datos que corresponden a los gastos en promociones
y las ventas en unidades de un determinado producto, para un determinado canal de venta y para
las últimas 10 semanas.

Tabla 9

Gastos promocionales (Miles de U.M.) Ventas (en miles de unidades)


Semana
(x) (y)

1 25 126

2 21 110

3 15 87

4 22 97

5 15 80

6 16 84

7 28 129

8 30 126

9 23 115

10 15 91

La siguiente aplicación de Excel presenta el diagrama de series de tiempo y el diagrama de


dispersión de los datos presentados en la Tabla 9.

23
Estadísticas y Econometría Financiera

Aplicación en Excel 4: Diagrama de dispersión

Como se puede observar en el diagrama de series de tiempo, existe una relación positiva entre las
dos variables, es decir, que cuando una crece la otra variable también crece, y viceversa. El diagrama
de dispersión ayuda a clarificar lo descubierto anteriormente al brindar mayor información respecto
al tipo de relación que puede estar presente entre las dos variables. Observando este último diagrama
es obvio que existe una relación positiva entre los gastos en promociones y las ventas en unidades.
En este punto, es importante mencionar que el diagrama de dispersión es la base sobre la cual
se desarrollará posteriormente el método econométrico conocido como el método de mínimos
cuadrados ordinarios (MCO). A manera de introducción, se utilizará Excel para generar una línea
que permita resumir la relación que existe entre las dos variables. La siguiente aplicación de Excel
presenta el procedimiento para obtener la línea que minimiza la suma de los errores al cuadrado,
sobre que el cual se desarrolla este método.

24
capítulo 1    Estadística descriptiva

Aplicación en Excel 5: Mínimos cuadrados ordinarios

Nuevamente y, a modo de introducción de un tópico que será tratado exhaustivamente en el


capítulo correspondiente a econometría financiera, en la aplicación anterior se puede observar que
los datos pueden ser representados por una línea obtenida por el método de MCO.
La ecuación de esta línea recta es y = 37,952 + 3,169 x. Como toda línea recta, esta ecuación
tiene dos elementos:
a. El intercepto u ordenada al origen (37,952), representa el valor esperado en la ausencia
de las actividades promocionales.
b. La pendiente (3,169), que indica el cambio esperado en y (ventas en unidades) dado un
cambio unitario en x (gastos promocionales). Este número provee a su vez dos informa-
ciones:
• El signo de la pendiente indica el tipo de relación entre x e y. En este caso en particular,
una relación directa o positiva, es decir, que si x se incrementa (decrece), y se incrementará
(decrecerá).
• El número propiamente dicho, indica la magnitud o fuerza de esta relación. Normal-
mente, se usa para realizar comparaciones. Por ejemplo, si se supone que la pendiente de
la ecuación de la marca de la competencia es igual a 4,501. En este caso la relación entre
los gastos promocionales y la venta de unidades es mayor en el producto de la competen-

25
Estadísticas y Econometría Financiera

cia que en nuestro producto, lo que implica que un incremento en una unidad de gasto
promocional generará un mayor incremento en las ventas en unidades de la competencia.
Una posible interpretación de este resultado puede ser que la competencia es más efectiva
en el uso de sus gastos promocionales. En base a esto, el analista podrá averiguar las
posibles causas que pueden influir: visibilidad de las promociones, uso de otros medios
promocionales como cupones, afiches, etc.

6.3. El coeficiente de correlación


El coeficiente de correlación es una medida de dependencia lineal entre dos variables. Este
coeficiente es de bastante uso en la teoría del portafolio y está fundamentalmente ligado al concepto
de diversificación. El coeficiente de correlación entre dos variables (x e y) es una función de la cova-
rianza, la cual se calcula de la siguiente manera:

1
Cov ( x , y ) = σ y , x = × E[( x − x ) × (y − y )] (16)
N
Donde σy,x representa la covarianza entre x e y, N es el tamaño de la población, E es el operador
de esperanza matemática, x e y las medias de x e y, respectivamente. Asimismo, la covarianza
muestral se calcula de la siguiente manera:

1 n
1 n
Cov( x, y )  s y , x    ( yi  y )  ( xi  x )    yi .xi  n  y  x (17)
n  1 i 1 n  1 i 1

Se advierte que se utiliza sy,x


y para referirse a la covarianza muestral. En base a esto, la correlación
muestral se define como:
sy , x
R= (18)
sy × sx

Donde R simboliza el coeficiente de correlación, sx y s y representan las desviaciones estándar


de x e y, respectivamente. El coeficiente de correlación es un número definido entre:
 1  R + 1 (19)
El coeficiente de correlación, al igual que la pendiente de la línea presentada en la sección an-
terior, muestra dos tipos de información:
a. El signo del coeficiente de correlación indica el tipo de relación entre x e y. Si R < 0
existe una relación indirecta entre las variables, R > 0 indica que existe una relación
directa o positiva y R = 0, indica que x e y son variables no correlacionadas.
b. El número propiamente dicho, indica la magnitud o fuerza de esta relación. Al igual
que en el caso de la pendiente de la recta tratada anteriormente, la magnitud del coefi-
ciente de correlación se usa para realizar comparaciones.

26
capítulo 1    Estadística descriptiva

En este punto es importante señalar algo que se analizará en detalle en el capítulo 10: no co-
rrelación no necesariamente implica independencia estadística. Independencia estadística es
un término general que se refiere al hecho que la probabilidad de ocurrencia de un evento no ejerce
ningún efecto en la probabilidad de ocurrencia de otro evento. No correlación es sinónimo de
independencia estadística si y solo si cada una de las variables sigue una distribución normal.
Pero este no será un resultado general sino particular.
A continuación se presenta un ejemplo de cómo interpretar el coeficiente de correlación y luego
se mostrará la forma de usar Excel para obtener este coeficiente.

  Ejemplo 9:
Si se tienen los precios de dos acciones de dos diferentes empresas y se calculan sus respecti-
vas correlaciones con el índice del mercado. Si, por ejemplo, se obtienen los siguientes resultados:
R1 = 0,30 y R 2 = 0,8.
Dada esta información se puede advertir que la segunda acción tiene una dependencia lineal
con el mercado más fuerte que la primera acción. Es decir, si por ejemplo el índice de mercado se
incrementa en 2%, la acción 1 se incrementará solo 0,6% (0,30 x 2%), mientras que la acción 2 se
incrementará en 1,6% (0,8 x 2%).
Asimismo, es importante notar que como el signo de la correlación es positivo en ambos casos,
la dependencia lineal es directa; lo que implica que si el índice cae, el precio de las acciones también
lo harán. En este caso hipotético, la acción cuyo precio caerá más será la de la acción 2, ya que tiene
un coeficiente de correlación más grande.
A continuación se muestra una aplicación de Excel para calcular el coeficiente de correlación
usando los datos presentados en la Tabla 9.

Aplicación en Excel 6: Correlación

27
Estadísticas y Econometría Financiera

En esta aplicación se puede apreciar que los gastos promocionales y las ventas están directamente
correlacionados (el signo de la correlación es positivo). Asimismo, dado a que el valor es bastante
cercano a la unidad, se puede afirmar que la relación lineal de ambas variables es bastante fuerte.

6.4. El coeficiente de variación


El coeficiente de variación mide la variación de la variable dependiente (y) que es explicada por
la variación de la variable independiente (x). A esta variable se le conoce como R 2.
Formalmente, este coeficiente se puede calcular como el cuadrado del coeficiente de correlación.
Por lo tanto, el rango de posibles valores de este coeficiente se encuentra entre:
0 ≤ R 2 ≤ 1 (20)
En general, si la variabilidad de la variable independiente explica bien la variabilidad de la variable
dependiente este coeficiente tenderá a acercarse a la unidad. En la aplicación de Excel número 5, se
puede observar que el R 2 es igual a 0,8829.2 Esto significa que el 88,29% de la variabilidad total de
las ventas pueden ser explicados por la variabilidad de los gastos promocionales.
Se debe advertir que el coeficiente de variación solo provee información acerca de la fuerza de
la relación mas no de la dirección de la misma. Es decir que solo observando este coeficiente, no se
puede determinar si la relación es directa o indirecta. Para ello se necesitará conocer la pendiente de
la línea obtenida por el método de mínimos cuadrados ordinarios o del coeficiente de correlación.
En el capítulo 9 se retomará este concepto y se presentará otra forma en la que este coeficiente
es calculado.

7. Problemas propuestos
1) ¿Cuál es la diferencia entre un parámetro y un estadístico?
2) ¿Por qué una muestra tiene que ser representativa de la población de la cual ha sido to-
mada?
3) ¿El error muestral puede siempre disminuirse aumentando el tamaño de la muestra?
4) ¿El muestreo probabilístico es usado comúnmente para realizar estudios exploratorios?
Comente.
5) El muestreo aleatorio simple, el muestreo sistemático y el muestreo basado en el juicio
del analista, son todos muestreos probabilísticos. Comente.
6) Explique cuál es el principal problema del muestreo sistemático.

2 Este número puede ser obtenido elevando al cuadrado el coeficiente de correlación. De la aplicación de Excel 6, el coeficiente de
correlación (R) entre las ventas y los gastos en promociones es igual a 0,94, por lo que el coeficiente de variabilidad será igual a R 2, es
decir, a (0,94)2 que da 0,8836. La pequeña diferencia entre este número y el hallado en la aplicación 5 se debe al redondeo del coeficiente
de correlación.

28
capítulo 1    Estadística descriptiva

7) Explique las características de una tabla de frecuencias adecuadamente estructurada


(mutuamente excluyente y exhaustivas).
8) Si se tienen los siguientes datos que corresponden al número de horas por día, pasadas
frente al televisor, por un grupo de 20 niños: 2,0; 2,5; 3,0; 1,2; 2,9; 3,2; 2,5; 1,7; 2,3;
1,5; 4,1; 2,9; 3,1; 3,2; 4,4; 3,2; 4,1; 3,5; 2,8; 3,6. Con estos datos construya la tabla de
distribución de frecuencias que incluya frecuencias, frecuencias acumuladas, frecuen-
cias relativas y frecuencias relativas acumuladas. Para la construcción de las clases em-
piece en 1 y que el rango de las clases sea también 1, es decir, la primera clase será [1,2).
9) Basados en la pregunta 8, grafique el histograma, el polígono de frecuencias, y el grá-
fico de las frecuencias relativas acumuladas.
10) Basados en la pregunta 8 responda las siguientes preguntas:
a) ¿Cuál es el porcentaje de niños que ven televisión menos de 3 horas?
b) ¿Cuántos niños ven televisión entre 2 y 3 horas?
c) ¿Cuántos niños ven televisión entre 2 y 4 horas?
d) ¿Cuál es el porcentaje de niños que ven televisión tres horas o más?
11) Desarrolle el ejercicio 8 usando Excel.
12) Basados en los datos del ejercicio 8 calcule las siguientes medidas de tendencia central:
a) La media.
b) La mediana.
c) La moda.
13) Basados en los datos del ejercicio 8 calcule las siguientes medidas de dispersión:
a) El rango.
b) Los cuartiles.
c) El rango inter-cuartil.
d) La desviación del cuartil.
e) La desviación media absoluta.
f) La varianza muestral.
g) La desviación estándar muestral.
14) Basados en los datos del ejercicio 8 calcule la variable estandarizada (z) y demuestre que
su media es 0 y su varianza 1.
15) Basados en los datos del ejercicio 8 calcule el coeficiente de variación.
16) Se tiene dos muestras. La media y desviación estándar de la primera es igual a 0,25 y
0,1, respectivamente. La media y desviación estándar de la segunda es igual a 210 y 5,
respectivamente. Comparando la desviación estándar de ambas se puede concluir que
la primera muestra es menos dispersa que la segunda. ¿Es esta conclusión válida? ¿Por
qué? ¿Cuál sería la manera correcta de determinar cuál de las muestras posee más dis-
persión?

29

También podría gustarte