Está en la página 1de 24

Universidad Nacional de Salta

Facultad de Ciencias Econmicas, Jurdicas y Sociales


Ctedra de Estadstica

INDICADORES DESCRIPTIVOS
NOTAS COMPLEMENTARIAS

ESTADSTICA I

Hugo Miguel Rodrguez, Mara Esther Capilla


Ao 2010

Universidad Nacional de Salta


Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica

Indicadores Descriptivos
Notas Complementarias

Introduccin
Estas notas complementarias estn destinadas a nuestros alumnos de Estadstica I
de la Facultad de Ciencias Econmicas, Jurdicas y Sociales de la UNSa. Tienen por
objeto brindarles informacin adicional sobre temas abordados en clase y estimular su
creatividad de modo que, a partir de la lectura e interpretacin de ellas, elaboren sus
propios ejemplos de aplicacin. Esta ltima actividad es de gran ayuda para la
compresin de los temas.
Se incluyen demostraciones de propiedades de los indicadores ms frecuentemente
utilizados. En todos los casos, sin que ello le quite generalidad a los conceptos, en la
notacin utilizada se ha considerado que los datos corresponden a una poblacin.

Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010.

Universidad Nacional de Salta


Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica

Indicadores Descriptivos
Notas Complementarias

Propiedades de la media aritmtica


1.

Si a una variable se le suma o resta una constante positiva, la media aritmtica se


incrementa o disminuye en dicha constante.
Demostracin: Sean x1 , x2 ,..., xN los valores que toma la variable X en una
poblacin de N elementos y sea Z X c , donde c es una constante positiva.
1
Z
N

2.

1
zi

N
i 1
N

N
1 N
xi c xi c

N i 1
i 1
i 1
N

1 N
1
xi Nc
N i 1
N

i 1

1
Nc X c
N

(1)

Si a una variable se la multiplica por una constante, la media aritmtica queda


multiplicada por dicha constante.
Demostracin: Sean x1 , x2 ,..., xN los valores que toma la variable X en una
poblacin de N elementos y sea Z dX , donde d es una constante.

3.

1
N

i 1

1
N

dx
i 1

d
N

d X

(2)

i 1

La media aritmtica de la suma de k variables es igual a la suma de las medias


aritmticas de cada una de las k variables.
Demostracin para k 2 : Sean x1 , y1 , x2 , y2 ,..., xN , y N los valores que toma la
variable bidimensional X , Y en una poblacin de N elementos y sea Z X Y .

4.

1
N
1
N

zi
i 1
N

xi
i 1

1
N
1
N

xi yi
i 1

N
1 N

xi yi
N i 1
i 1

X Y

(3)

i 1

La suma de los desvos de las observaciones respecto a su media aritmtica es


siempre igual a cero.
Demostracin: Sean x1 , x2 ,..., xN los valores que toma la variable X en una
poblacin de N elementos; sean adems , la media aritmtica de los N
elementos y xi el desvo de la i-sima observacin respecto a la media.

Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010.

Universidad Nacional de Salta


Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica

Indicadores Descriptivos
Notas Complementarias

(4)

x i x i x i N
i 1

i 1

i 1

i 1

Considerando que por definicin

1
N

xi xi N , reemplazando en (4)
i 1

i 1

resulta:
N

(5)

N N 0

i 1

5.

La suma de los desvos cuadrticos de las observaciones respecto a su media


aritmtica es menor que la suma de los desvos cuadrticos de las observaciones
respecto a cualquier otro valor.
Demostracin: Sean x1 , x2 ,..., xN los valores que toma la variable X en una
poblacin de N elementos; sea adems , la media aritmtica de los N elementos
y A una constante distinta de . Es posible expresar A de la siguiente manera:
con 0

(7)

Si consideramos ahora la suma de los desvos cuadrticos de las observaciones


respecto a la constante A , vemos que podemos expresarla en funcin de la media
aritmtica de X . En efecto,
N

A x i xi

i 1

i 1

(8)

i 1

Agrupando convenientemente y desarrollando el cuadrado resulta:


N

i 1

i 1

i 1

2
2
2
xi A xi xi 2 2 xi
N

xi N 2 2 xi
i 1

(9)

i 1

Como por (5) se verifica que

0 , resulta que

i 1

A xi N 2

i 1

(10)

i 1

Como se cumple que N 2 0 , se verifica siempre que,


N

x
i 1

A xi

(11)

i 1

Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010.

Universidad Nacional de Salta


Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica

6.

Indicadores Descriptivos
Notas Complementarias

Media combinada. La media aritmtica de un grupo de observaciones puede ser


expresada en funcin de las medias de los subgrupos que lo componen, ponderadas
por el tamao de stos.
Sea una poblacin de N elementos en la que se distinguen dos grupos de tamao
N 1 y N 2 de manera que N N 1 N 2 . Adems indicamos con x11 , x12 ,..., x1N1 a los

valores que toma la variable X en la primer grupo y con x21 , x22 ,..., x2 N 2 a los
valores que toma la variable X en el segundo grupo. Por ltimo, sean 1 y 2 las
medias del primer y segundo grupo respectivamente. Por definicin, la media
aritmtica de los N elementos de la poblacin es:
N1

x11 x12 ... x1 N1 x21 x22 ... x2 N 2


N1 N 2

N2

x x
1i

i 1

2i

i 1

(12)

N1 N 2

Como por definicin de 1 y 2 se verifican las siguientes igualdades,


N1

N11

1i

i 1
N2

N 2 2

2i

(13)

i 1

la media aritmtica de la poblacin de N elementos puede expresarse en funcin


las medias de los subgrupos. En efecto,

N11 N 2 2
N1 N 2

(14)

Adems como se evidencia en (15), la ponderacin o peso de cada promedio es


proporcional al tamao del grupo a partir del que fue calculado.

N1
N
1 2 2
N
N

(15)

Una propiedad de la mediana


La suma de los valores absolutos de las observaciones respecto a su mediana es
menor que la suma de los desvos absolutos de las observaciones respecto a cualquier
otro valor.

Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010.

Universidad Nacional de Salta


Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica

Indicadores Descriptivos
Notas Complementarias

Demostracin: Sean x1 , x2 ,..., xN los valores que toma la variable X en una


poblacin de N elementos; sea adems Me , la mediana de los N elementos y A una
constante distinta de Me .
Consideremos ahora a los valores de

ordenados en forma creciente,

x1 , x2 ,..., x N , y supongamos que la constante A se encuentra en el intervalo

x , x , de tal manera que se verifica la siguiente expresin:


p 1

x1 x2 ... x p A x p1 x p 2 ... x N

(16)

Analizaremos a continuacin la suma de los valores absolutos de los desvos de las


observaciones respecto a A considerando, sin perder generalidad, los valores ordenados
de menor a mayor. Vemos que esta suma puede descomponerse como se expresa a
continuacin.
N

xi A xi A

i 1

i 1

(17)

x A
i

i p 1

Si p N 2 , como la mediana est ubicada en el centro de los datos de la serie


ordenada, para toda constante 0 se cumple que A Me y reemplazando en
(17) resulta,
p

i 1

xi A Me xi
i 1

x Me
i

(18)

i p 1

Podemos desarrollar algebraicamente la expresin en (18) de la siguiente manera:


p

x A Me x p x Me N p
i

i 1

i 1
p

Me xi
i 1

i p 1

x Me 2 p N
i

i p 1

xi Me 2 p N

(19)

i 1

Como p N 2 se verifica que 2 p N 0 . Por lo tanto resulta que


N

xi A xi Me

i 1

(20)

i 1

Si p N 2 , siendo la constante 0 , podemos expresar como A Me .


Luego reemplazando en (17) y desarrollando algebraicamente la expresin
resultante podemos escribir:

Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010.

Universidad Nacional de Salta


Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica

i 1

Indicadores Descriptivos
Notas Complementarias

xi A Me xi
i 1

x Me
i

(21)

i p 1

x A Me x p x Me N p
i

i 1

i 1

i p 1

Me xi
i 1

x Me N 2 p
i

i p 1

xi Me N 2 p

(22)

i 1

Como p N 2 , entonces N 2 p 0 y tambin en este caso se cumple que


N

xi A xi Me

i 1

(23)

i 1

Como adems el resultado de una suma no depende del orden de los sumandos, las
expresiones en (20) y (23) se verifican sin considerar la serie ordenada de los datos y
puede generalizarse de la siguiente manera:
N

(24)

x A x Me
i

i 1

i 1

Del anlisis efectuado para los posibles valor de p se deduce que la suma de los
desvos absolutos de las observaciones respecto a A es mnima solo cuando p N 2 ,
es decir cuando A est posicionada en el centro de las observaciones y por lo tanto
coincide con M e .
El Diagrama 1 muestra una forma de corroborar grficamente esta propiedad para
un conjunto pequeo de observaciones. Sobre una recta se representan las
observaciones, la mediana y al valor arbitrario A . Luego, se grafican los segmentos que
corresponden a las distancias de cada observacin respecto a A y respecto a la M e . La

Diagrama 1. Distancias entre 5 observaciones respecto a


su M e y respecto a un valor arbitrario A .

Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010.

Universidad Nacional de Salta


Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica

Indicadores Descriptivos
Notas Complementarias

comparacin de ambos grupos a simple vista conduce al resultado de la propiedad


demostrada algebraicamente.
En lugar de tomar un nmero impar de observaciones para el que el valor de la
mediana es nico, se sugiere ahora construir el Diagrama 1 para un nmero par de
observaciones, por ejemplo seis. Se ver que en ese caso cualquier valor comprendido
en el intervalo

x , x
3

minimiza la suma de los desvos absolutos de las

observaciones respecto a l. Esto es consistente con una definicin ms rigurosa de la


mediana segn la que la mediana es un nmero que no supera ni es superado por ms
del 50% de las observaciones. Por convencin, cuando la cantidad de observaciones es
par, se toma la mediana igual al promedio aritmtico de los dos valores centrales.
Considerando esta propiedad se puede responder a la siguiente pregunta dnde
ubicara una empresa su centro de distribucin si posee varias sucursales sobre la misma
ruta y desea minimizar el costo del transporte de la mercadera?

Media geomtrica
Sea x1 , x 2 ,..., x N

los valores que toma una variable X en una poblacin de N

elementos. La media geomtrica G se define como la raz ensima del producto de los
dichos valores.
G N x1 x 2 ... x N

(25)

Si las observaciones estn agrupadas en una distribucin de frecuencias, indicando


con f i a la frecuencia absoluta del valor xi , para i 1,2,..., N , podemos expresar a la
media geomtrica como
G

x1f1 x 2f 2 ... x Nf N

(26)
Se utiliza principalmente para promediar porcentajes, cifras relativas y tasas de
variacin. Las principales limitaciones para su empleo surgen cuando:

Alguna observacin toma el valor cero, ya que en ese caso G = 0.

N es par y existen un nmero impar de valores negativos, con lo cual G sera un


nmero imaginario.
Para su clculo pueden tomarse los logaritmos de las observaciones, como muestran

las expresiones que figuran a continuacin, y luego determinar G calculando el


antilogaritmo del valor encontrado.
Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010.

Universidad Nacional de Salta


Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica

log G

1
N

Indicadores Descriptivos
Notas Complementarias

(27)

log x

i 1

Si las observaciones estn agrupadas en una distribucin de frecuencias,


log G

1
N

(28)

f log x
i

i 1

Caractersticas de la media geomtrica


1.

Est menos afectada por valores extremos que la media aritmtica. Para
ejemplificarlo

consideremos

que

la

variable

toma

los

valores

x1 12, x2 15, x3 33 . El valor x3 es mayor al doble de las observaciones


restantes y su influencia es menor sobre la media geomtrica.

12 15 33 60

20
3
3

G 3 12 15 33 3 5940 18.11

2.

La media geomtrica es menor o igual a la media aritmtica. Podemos justificar


esta afirmacin en forma sencilla para dos valores x1 y x2 , resolviendo la siguiente
expresin que siempre es mayor o igual a cero:

x1 x2

x1 x2 2 x1 x2 0

(29)

Luego,
x1 x 2 2 x1 x 2

x1 x 2

x1 x 2

(30)

Es decir que la media geomtrica de x1 y x2 es siempre menor o igual a su media


aritmtica.

3.

El producto de las razones respecto a la media geomtrica de los valores menores


que ella es igual al producto de las razones de la media geomtrica respecto a los
valores que la superan. Es decir, si la media geomtrica G es tal que
x1 x2 ... x p G x p1 ... x N , entonces se verifica:

x
x1 x2
G
G
G
.... p

...
G G
G x p1 x p 2
xN
Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010.

(31)

Universidad Nacional de Salta


Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica

Indicadores Descriptivos
Notas Complementarias

Para ejemplificarlo consideremos que la variable

toma los valores

x1 3, x2 8, x3 27, x4 32 , cuya media geomtrica es G 12 . En efecto,


3 8 12 12 1

12 12 27 32 6

4.

Si para una serie de valores se calcula la razn entre cada valor y el que le antecede,
la media geomtrica es el indicador adecuado para ser utilizado como promedio de
dichas razones.
Para ejemplificar este resultado, empleamos los datos de la Tabla 1 donde se
muestran las razones de cambio de las ventas anuales de una empresa durante 5
aos consecutivos.
Tabla 1
Ao

Ventas
Miles de $

1999
2000
2001
2002
2003
2004

300
300
434
535
672
746,5

Razn

Ventas j1
Ventas j

log Razn

--1
1,447
1,233
1,256
1,110

--0
0,1605
0,0910
0,0990
0,0453

Como puede comprobarse las medias aritmtica y geomtrica de las razones en la


tabla anterior son respectivamente 1,2092 y G 1,20
El considerar la media aritmtica nos llevara a establecer una razn anual
promedio de crecimiento de las ventas igual a 20,92%, resultado que no concuerda
con la realidad observada ya que, a una tasa anual promedio de crecimiento de
20,92%, a partir del ao 2000, las ventas del ao 2004 hubieran resultado iguales a
775,55 miles de $ y no iguales a 746,50 miles de $ como muestra la Tabla 1. Por el
contrario, si determinamos la razn anual promedio de crecimiento de las ventas en
base a la media geomtrica, es decir igual al 20%, aplicada a partir del ao 2000,
determina para el ao 2004 ventas por un importe de 746,5 miles de pesos, valor
que coincide con el observado. En efecto:
300 x 1.20 = 360
360 x 1.20 = 432
432 x 1.20 = 518,4
Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010.

10

Universidad Nacional de Salta


Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica

Indicadores Descriptivos
Notas Complementarias

518.4 x 1.20 = 622,08


622.08 x 1.20 = 746,5

Estamos en condiciones ahora de responder a la siguiente pregunta: Si en cierto


ao, la poblacin de nuestro pas era igual a P habitantes y n aos despus es de Q
habitantes, cual ha sido la tasa de crecimiento poblacional anual de nuestro pas en
dicho perodo?

Media armnica
Sea x1 , x 2 ,..., x N

los valores que toma una variable X en una poblacin de N

elementos. La media armnica H se define como la inversa de la media aritmtica de las


inversas de estos valores.
H

N
1

i 1 x i
N

(32)

Si las observaciones estn agrupadas en una distribucin de frecuencias, indicando


con f i a la frecuencia absoluta del valor xi , para i 1,2,..., N , podemos expresar a la
media armnica como
H

N
N

(33)

fi

i 1 x i

Podemos observar que la media armnica no puede calcularse si algn valor de X es


igual a cero.

Caractersticas de la media armnica


1.

La media armnica est menos influenciada por valores extremos que la media
geomtrica y por ende est menos influencia que la media aritmtica. Para
ejemplificarlo consideremos los valores de X empleados al analizar la influencia
de valores extremos en la media geomtrica, es decir x1 12, x2 15, x3 33 ,
donde el valor de x3 es mayor al doble de las observaciones restantes. Como puede
comprobarse la media geomtrica es G 18,11 y la media armnica es H 16,64 .

Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010.

11

Universidad Nacional de Salta


Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica

Indicadores Descriptivos
Notas Complementarias

Estos resultados muestran la menor influencia del valor extremo x3 sobre la media
armnica.

2.

La media armnica es menor o igual a la media geomtrica. Podemos justificar esta


afirmacin fcilmente para dos valores x1 y x2 , resolviendo la siguiente expresin
que siempre es mayor o igual a cero:
2

1
1
1 1
2


0
x

x1 x2
x2
x1 x2
1

(34)

Luego,
1 1

x1 x2

2
1

1
1
x1 x2

x1 x2

x1 x2
2

x1 x2
1
1
2

x1 x2

(35)

Es decir que la media armnica de x1 y x2 es siempre menor o igual a su media


geomtrica.

3.

Su uso es poco frecuente pero resulta de utilidad para situaciones en que se deben
promediar razones entre dos tipos diferentes de unidades de medida que pueden ser
expresadas de manera recproca.
Para aclarar este concepto, consideremos un atleta que corre 1250 metros en 5
minutos. La razn de velocidad por minuto es

1250 metros
250 metros x minuto.
5 minutos

En este caso las unidades del numerador son metros y las del denominador son
minutos.
Recprocamente, la razn de tiempo por metro es

5 minutos
0,004 minutos
1250 metros

por metro y las unidades del numerador y denominador son minutos y metros
respectivamente.

En ciertos problemas el decidir si el promedio a emplear es la media aritmtica o la


media armnica puede ocasionar confusin. La siguiente regla ayuda para adoptar la
decisin correcta:

La media aritmtica se utiliza cuando cada dato que interviene en el promedio se


calcula en relacin a un valor constante con la misma unidad que el denominador

Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010.

12

Universidad Nacional de Salta


Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica

Indicadores Descriptivos
Notas Complementarias

La media armnica se utiliza cuando cada dato que interviene en el promedio se


calcula en relacin a un valor constante con la misma unidad que el numerador
Ejemplo: Cul es la velocidad promedio, en Km/hora, de un vehculo que sale de

Salta hacia Tucumn y recorre los primeros 100 Km a una velocidad de 80 Km/hora, los
siguientes 100 km a 100 Km/hora y los ltimos 100 Km los hace a 120 Km/hora?
Solucin: Empleando la media aritmtica la respuesta sera:

80 100 120
100 km/hora
3

Si consideramos el tiempo en horas insumido por cada tramo observamos que el tiempo
total insumido para recorrer la distancia de 300 Km es igual a 3,0833. Este valor
multiplicado por la velocidad promedio , calculada empleando la media aritmtica,
nos llevara a concluir que la distancia recorrida es 308,3 Km., valor inconsistente con
la realidad.
Tramo

Tiempo

100 Km
1,25 hora
80 Km/hora

100 Km
1,00 hora
100 Km/hora

100 Km
0,833 hora
120 Km/hora

Tiempo total

3,083 horas

Por el contrario, analizando el planteo del problema, observamos que los datos
expresados en Km/hora se calculan en relacin a un valor constante, que es la distancia
recorrida, expresada en Km. Corresponde entonces aplicar la media armnica,
resultando la velocidad promedio
H

3
3

97,3078 Km/hora
1
1
1
0
,
0125
0
,
01
0
,
00833

80 100 120

Si multiplicamos H por el tiempo insumido para todo el trayecto, obtenemos la


distancia total recorrida. En efecto,
3,083 hora 97,3078 Km/hora 300 Km
Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010.

13

Universidad Nacional de Salta


Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica

Indicadores Descriptivos
Notas Complementarias

Notemos que antes de proceder al clculo debemos expresar loa valores que
intervienen en las mismas unidades que el promedio solicitado y luego calcular su
inversa.

Ahora estamos en condiciones de resolver el siguiente problema: Si tres obreros A,


B, y C pueden producir, respectivamente, 10, 12 y 15 unidades por hora cul es el
tiempo medio requerido por unidad? (Comprobar que la respuesta correcta es 0.08108
horas/unidad)

Propiedades de la varianza
1.

Si a una variable se le suma o resta una constante positiva, la varianza no se altera.


Demostracin: Sean x1 , x2 ,..., xN los valores que toma la variable X en una
poblacin de N elementos y sea Z X c , donde c es una constante positiva.

Z2

2.

1
N
1
N

i Z

i 1
N

x
i

1
N

x c
i

i 1

X2

(35)

i 1

Si a una variable se la multiplica por una constante, la varianza queda multiplicada


por el cuadrado de dicha constante.
Demostracin: Sean x1 , x2 ,..., xN los valores que toma la variable X en una
poblacin de N elementos y sea Z dX , donde d es una constante.

Z2

1
N
1
N

d2

3.

2
zi Z
i 1
N

1
N

2
d xi X
i 1

dx d
i

i 1

1
N

i 1

d x

X d 2 X2

(36)

i 1

Varianza combinada. La varianza de un grupo de observaciones puede ser


expresada en funcin de las medias y varianzas de los subgrupos que lo componen.

Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010.

14

Universidad Nacional de Salta


Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica

Indicadores Descriptivos
Notas Complementarias

Sea una poblacin de N elementos en la que se distinguen dos grupos de tamao


N 1 y N 2 de manera que N N 1 N 2 . Adems indicamos con x11 , x12 ,..., x1N1 a los

valores que toma la variable X en la primer grupo y con x21 , x22 ,..., x2 N 2 a los
valores que toma la variable X en el segundo grupo. Por ltimo, sean 1 y 12 la
media y varianza de X en el primer grupo y 2 y 22 , la media y varianza de X
en el

segundo grupo. Por definicin, la varianza de los N elementos de la

poblacin es:

x11 2 x12 2 ... x1N

x21 x212 ... x2 N 2

N1 N 2
N1

N2

2
2
x1i x2i
i 1

(37)

i 1

N1 N 2

Sumando y restando la media de cada grupo en las sumas de desvos cuadrticos de


los subgrupos en (37) resulta que,
N1

1i

i 1

N1

x1i 1 1
i 1
N1

x1i 1 1 2 x1i 1 1
i 1

N1

N1

x1i 1 N1 1 21 x1i 1
i 1

(38)

i 1

N1

Como

1i

1 =0, resulta que la suma de los desvos cuadrticos de las

i 1

observaciones del primer grupo respecto a la media combinada puede expresarse de


la siguiente manera:
N1

N1

i 1

i 1

2
2
2
x1i x1i 1 N1 1

N1

(39)
2

Adems, teniendo en cuenta que 12 x1i 1

N , la expresin en (39) puede

i 1

escribirse como:
N1

1i

N1 12 N1 1

(40)

i 1

Anlogamente, para el segundo grupo,

Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010.

15

Universidad Nacional de Salta


Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica

N2

2i

Indicadores Descriptivos
Notas Complementarias

N 2 22 N 2 2

(41)

i 1

Reemplazando los resultados (40) y (41) en (37), distribuyendo el denominador


N N1 N 2 y agrupando convenientemente resulta

N1 2 N 2 2 N1
N
2
2
1
2 1 2 2
N
N
N
N

(42)

Generalizando (42) para el caso de k grupos obtenemos la siguiente expresin:

1
N

N
i

i 1

2
i

1
N

N
i

(43)

i 1

donde el primer sumando se denomina intravarianza y mide la varianza dentro de


los grupos y el segundo sumando, llamado intervarianza, mide la varianza entre los
grupos.

Hemos demostrado que la varianza de un grupo de observaciones puede calcularse


en funcin de los indicadores de los subgrupos que lo componen. Es importante
comprender esta propiedad desde el punto de vista de la particin de la varianza
total y del anlisis de sus componentes expresadas en (43).
Ejemplo: Un curso est dividido en dos comisiones. En la comisin 1 estn
inscriptos 24 alumnos cuyo promedio de edad es 24 aos con un desvo de 1,2 aos.
Estos indicadores para los 30 alumnos de la comisin 2 son iguales a 25 y 1,3
respectivamente. Tres alumnos de la comisin 2, dos de ellos de 25 aos y el
restante de 26 deciden abandonar sus estudios. Por otra parte dos alumnos de 23
aos de la comisin 1 se cambian a la comisin 2 y un alumno de 27 aos de la
comisin 2 lo hace a la comisin 1. Estos cambios, han modificado el coeficiente
de variacin de la edad de los estudiantes?
Lo primero que haremos es resumir la informacin relativa a la situacin inicial,
previa a los abandonos y cambios de comisin, en la siguiente tabla.
Comisin N i
1
24
2
30

Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010.

i i2
24 1,44
25 1,69

16

Universidad Nacional de Salta


Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica

Indicadores Descriptivos
Notas Complementarias

Los valores de los indicadores para el grupo completo en la situacin inicial son los
siguientes:

24 24 30 25
24,556
54
2

24 1,44 30 1,69 2424 24,556 3025 24,556



1,826
54
2

CV

1,826
0,055
24,556

El Diagrama 2 es til para analizar los movimientos de los estudiantes en el


problema. Por ejemplo, el arco S12 indica elementos que salen de 1 para ingresar
a 2 y el arco S2 elementos de 2 que salen del sistema.

Diagrama 2

A continuacin describiremos las edades de los alumnos de las comisiones a travs


de tablas intermedias, a medida incorporamos sucesivamente los movimientos de
los estudiantes, hasta llegar a la situacin final.
El primer movimiento est vinculado al arco S2 ya que tres alumnos de la comisin
2 salen del sistema. La comisin 1 no sufre modificaciones, pero s la comisin 2.
Puede considerarse que dicha comisin estaba conformada por dos grupos: los 27
alumnos que quedan y los 3 que se van, cuya media = 25,333 y varianza = 0,222.
La incgnita es la media aritmtica y la varianza de las edades de los 27 alumnos
que continan en la comisin 1. Dado que la media de los 30 alumnos, que es igual
a 25 aos, es funcin de las medias de los 27 alumnos que quedan y de los 3 que se
van, podemos obtener el valor de la media desconocida de la siguiente manera:
25 =

27 21 3 25.333
30 25 3 25.333
21
24.963
30
27

Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010.

17

Universidad Nacional de Salta


Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica

Indicadores Descriptivos
Notas Complementarias

Idntico razonamiento seguimos para obtener la varianza de las edades de los 27


alumnos de la comisin 1.
2

27 21 3 0.222 27 24.963 25 3 25.333 25


1.69

30
2

30 1.69 3 0.222 27 24.963 25 3 25.333 25

21

27

1.839

En este punto los indicadores descriptivos de la edad de los estudiantes son los
siguientes:
Comisin N i
1
24
2
27

i2
24
1,44
24,963 1,839

La media y varianza del curso completo son las siguientes:

24 24 27 24.963
24.510
51
2

24 1.44 27 1.839 24 24 24.510 27 24.963 24.510



1.882
51
2
T

El prximo paso est vinculado al arco S12, dado que 2 alumnos de 23 aos de la
comisin 1 pasan a la comisin 2. La media de la edad de estos alumnos es igual a 23
y su varianza es igual a cero. En este caso el movimiento va a incidir en ambas
comisiones.
Para la comisin 1 el procedimiento es anlogo al realizado en el paso anterior.
Podemos comprobar que la media y la varianza de la edad de los 22 alumnos que
quedan en la comisin 1 son 24,091 y 1,472 respectivamente.
Para determinar los nuevos indicadores de la comisin 2, consideramos que el nuevo
grupo estar conformado por los 27 alumnos que estaban en la comisin ms los 2
que se incorporan. Por lo tanto,

21

27 24.963 2 33
24.828
29
2

27 1.839 2 0 27 24.963 24.828 2 23 24.828



1.96
29
2
21

Ahora estamos en condiciones de elaborar una nueva tabla intermedia y calcular los
indicadores para el curso completo. Posteriormente, si consideramos el ltimo
movimiento, vinculado al arco S21, segn el cual un alumno de 27 aos de la
Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010.

18

Universidad Nacional de Salta


Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica

Indicadores Descriptivos
Notas Complementarias

comisin 2 pasa a la comisin 1, obtenemos la tabla correspondiente a la situacin


final que figura a continuacin.

Comisin N i
1
23
2
28

i
i2
24,317 1,760
23,786 0,776

Empleando los resultados de la tabla anterior calculamos los indicadores para el


curso completo. Vemos que el coeficiente de variacin resulta igual a 0,047 (4,7%).
Comparando este valor con el correspondiente a la situacin inicial igual a 0,055
(5,5%) podemos decir que la variacin relativa de la edad del curso completo ha
disminuido.

23 24.317 28 23.786
23.980
51
2

23 1.760 28 0.776 23 24.317 23.980 28 23.786 23.980



1.266
51
1.266
CV
0.047
23.980
2
T

4.

Varianza de la suma de k variables.


Demostracin para k 2 : Sean x1 , y1 , x2 , y2 ,..., xN , y N los valores que toma la
variable bidimensional X , Y en una poblacin de N elementos y sea Z X Y .

Z2

1
N

2
zi Z
i 1

1
N

1
N

x y

1
N

x y

x y
i

i 1

N
i

i 1
N

Y 2 xi X yi Y

i 1

N
N
1N
2
2

2
xi X yi Y

i
X
i
Y

N i 1
i 1
i 1

(44)

Por ltimo, distribuimos el factor 1 N :


1

N
2
Z

2
xi X
i 1

1
N

2
yi Y
i 1

Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010.

2
N

X y i Y

(45)

i 1

19

Universidad Nacional de Salta


Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica

Indicadores Descriptivos
Notas Complementarias

Vemos que el primer y segundo sumando en (45) son las varianzas de X e Y .


Adems, definimos a la covarianza de X e Y como el promedio del producto de
los desvos de X e Y respecto a sus correspondientes medias aritmticas X y

Y , es decir,
Cov X , Y

1
N

x y
i

(46)

i 1

Luego, reemplazando en (45) resulta:

Z2 X2 Y2 2Cov X , Y

(47)

Realizando las operaciones algebraicas apropiadas en (46) puede demostrarse la


siguiente frmula alternativa para el clculo de la covarianza.
Cov ( X , Y )

1
N

x y
i

(48)

X Y

i 1

Interpretacin de la covarianza
Analizaremos a continuacin los valores que puede tomar la covarianza de acuerdo
a la relacin existente entre las variables X e Y .
1.

X e Y estn relacionadas linealmente de manera que al aumentar X tambin

aumenta el valor de Y .
Sean los siguientes 4 pares de observaciones de la variable bidimensional X , Y :
(1,2), (2,1), (5,4), (6, 3.5). En la Figura 1 se muestra el diagrama de dispersin y
puede comprobarse que x 3.5 y y 2.625

Figura 1
Calculamos a continuacin la covarianza entre las variables de acuerdo a (46):

Cov X , Y 1 3.52 2.625 2 3.51 2.625


5 3.54 2.625 6 3.53.5 2.625
8.25
La covarianza resulta ser positiva.

Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010.

20

Universidad Nacional de Salta


Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica

2.

Indicadores Descriptivos
Notas Complementarias

X e Y estn relacionadas linealmente de manera que al aumentar X disminuye el

valor de Y . Consideramos los siguientes 4 pares de observaciones de la variable


bidimensional X , Y : (1,4), (2,3), (4,1), (5,2) donde X 3 y Y 2.5 . La Figura
2 muestra el diagrama de dispersin.

Figura 2

Cov X , Y 1 34 2.5 2 33 2.5


4 31 2.5 5 32 2.5
6
En este caso la covarianza es negativa.

3.

X e Y son independientes.

Sean los siguientes 4 pares de observaciones de X , Y : (1,2), (1,4), (5,2), (5,4)


donde X 3 y Y 3

Figura 3

Cov X , Y 5 34 3 1 34 3
1 32 3 5 32 3
2222 0
Si X e Y son independientes la covarianza es cero.
4.

X e Y no son independientes pero su relacin no es lineal.

Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010.

21

Universidad Nacional de Salta


Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica

Indicadores Descriptivos
Notas Complementarias

Consideramos ahora los siguientes 3 pares de observaciones X , Y : (1,2), (3,4),


(5,2) donde X 3 y Y 8 3

Figura 4

8
8
8

Cov X , Y 1 3 4 3 3 4 5 3 2
3
3
3

2222
0

En este caso la relacin entre X e Y no es lineal y la covarianza resulta igual a


cero.

Podemos

puntualizar

las

conclusiones

que

pueden

derivarse

de

las

ejemplificaciones anteriores de la siguiente manera:


La covarianza puede ser positiva, cero o negativa.
Si la covarianza no es igual a cero implica que existe una relacin entre X e Y
y por lo tanto son dependientes.
Cuando las variables X e Y son independientes la covarianza es igual a cero.
Si la covarianza es cero no implica necesariamente que X

e Y sean

independientes.

Momentos
Los momentos son indicadores caractersticos de la distribucin de una variable.
Sean x1 , x2 ,..., xN los valores que toma la variable X en una poblacin de N
elementos.
Definimos al momento natural de orden r de la siguiente manera:

1
N

N
r
i

(48)

i 1

Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010.

22

Universidad Nacional de Salta


Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica

Indicadores Descriptivos
Notas Complementarias

Vemos que siempre el momento natural de orden 0 resulta igual a 1 y el momento


natural de primer orden coincide con la media aritmtica. Es decir que 0 1 y 1 .
Adems, definimos al momento centrado de orden r empleando la siguiente
expresin:

1
N

N
r

(49)

x
i

i 1

De acuerdo a esta definicin, siempre se verifica que el momento centrado de orden 0 es


igual a 1, el momento centrado de primer orden es cero y el momento centrado de
segundo orden coincide con la varianza, es decir: 0 1 , 1 0 y 2 2 .
Adems, los momentos centrados pueden expresarse en funcin de los momentos
naturales a travs de la relacin que obtenemos a continuacin:

1
N
1
N

N
r

x
i

i 1
N

r r j
r j
xi

i 1 j 0 j

r
r
r j 1

j 0 j
N

i 1

r
r
r j
j
j 0 j

(50)

Aplicando (50) al clculo de los momentos centrados de orden 3 y 4 resulta:

3 3 0 3 2 1 3 2 3

(51)

4 4 0 4 3 1 6 2 2 4 3 4

(52)

Los momentos centrados de orden 3 y 4 intervienen en el clculo de los siguientes


coeficientes de asimetra y curtosis.

Coeficiente de asimetra de Fisher. Se define de acuerdo al siguiente cociente:


a3

3
3

(53)

Si a3 = 0, la distribucin es simtrica. Valores positivos de a3 indican asimetra


positiva, o como tambin suele expresarse, la distribucin analizada es asimtrica a
la derecha. Por el contario, valores negativos de a3 caracterizan a distribuciones
con asimetra negativa o asimtricas a la izquierda.

Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010.

23

Universidad Nacional de Salta


Facultad de Ciencias Econmicas, Jurdicas y Sociales
Ctedra de Estadstica

Indicadores Descriptivos
Notas Complementarias

Coeficiente de curtosis. Mide el grado de apuntalamiento de una distribucin en


relacin a la distribucin normal (modelo terico que se describe empleando una
curva simtrica en forma de campana)a4

4
4

(54)

Si a4 3 el grado de apuntalamiento de la distribucin coincide con el de la normal


y se dice que la distribucin es mesocrtica. Si a4 es menor que 3 la distribucin se
denomina platicrtica y es ms achatada que la normal. Por el contrario, valores de
a4 mayores que 3 caracterizan a distribuciones, ms apuntaladas que la normal, que

se denominan leptocrticas.

Bibliografa
Anlisis Estadstico. Ya Lun Chou. Nueva Editorial Interamericana. Mxico 1977.
2da. Ed.
ESPA. Sistema informtico interactivo para la enseanza de la Estadstica. Hugo M.
Rodrguez, Mara Esther Capilla. Ao 2003.

Hugo Miguel Rodrguez, Mara Esther Capilla. Ao 2010.

24

También podría gustarte