Está en la página 1de 19

UNIDAD 3 Segunda parte

Medidas de resumen o de tendencia central y de


tendencia no central.

Universidad Autônoma de Santo Domingo, UASD


Agosto, 2011
Contenidista: Francisco Roa Familia

Nombre del Curso


Estadística General
Clave del Curso Est-111
Número de la Unidad
III Segunda parte

Autor de la Unidad Francisco Roa Familia

Índice

I. Introducción/Explicación de la unidad
II. Objetivo General
III. Objetivos específicos
Medidas de tendencia central:
La media geométrica
 Media geométrica para datos individuales
 Media geométrica para datos agrupados
 Características y aplicaciones de la media
geométrica
Medidas de tendencia no central o de posición:
 Cuartiles,
 deciles
 percentiles
IV. Bibliografía

I. INTRODUCCION/EXPLICACION DE LA UNIDAD

2
Contenidista: Francisco Roa Familia

En esta parte de la unidad estudiaremos la medida de tendencia


central conocida con el nombre media geométrica y las medidas
estadísticas de resumen (de conjuntos de datos) de tendencia no
central. Se trata de medidas que facilitan la descripción, análisis y
comparación de conjuntos, conglomerados, poblaciones o
universos.

II. OBJETIVO GENERAL

Al finalizar esta unidad el estudiante conocerá y podrá aplicar, de


acuerdo a las circunstancias, la media geométrica y las medidas
estadísticas de tendencia no central; los procedimientos para sus
cálculos con datos no agrupados y para datos agrupados en arreglos
de frecuencias y en distribuciones de frecuencias.

III. OBJETIVOS ESPECÍFICOS

1. Conocer la media geométrica y su aplicación en el cálculo


de tasas de crecimiento y promedio de estas.
2. Conocer y aplicar los conceptos de cuartil, decir, percentil
y desviación intercuartílica.
3. Dominar los procedimientos de cálculos de estas medidas,
con datos no agrupados y con datos agrupados.

4. DESARROLLO DEL CONTENIDO:

Como podrá observarse, la operacionalización del concepto de media


geométrica se facilita mucho si se entienden los fundamentos de la
notación sumatoria (∑), repasada en la clase anterior.

3
Contenidista: Francisco Roa Familia

LA MEDIA GEOMÉTRICA (G).

La media geométrica es la raíz en-ésima del producto de los n valores de


un conjunto determinado. Esta medida, por lo regular, se utiliza para el
cálculo de tasas de crecimientos y, además, para promediarlas.

La G para datos individuales u originales

Si X1, X2, X3,. . ., Xn, son los n valores de una variable (X), la media
geométrica viene dada por:

G= n ( X1 * X 2 *... X n = (X1*X2* X3* . . . *Xn.)1/n (expresión a)

Pero si se fuera a procesar una cantidad considerablemente grande de


valores, y, además, valores de magnitudes relativamente mayores,
entonces podríamos transformar esta expresión como sigue a
continuación:

A ambos miembros de la expresión anterior, aplicamos logaritmo (log),


como sigue:
X g  n X 1  X 2  ....  X n
LogG=1/n (log(X1* X2* X3* X4*. . . X5))

La parte derecha de la expresión resulta de que “el log de una potencia


es el producto del exponente por el log de la base”.

2. Luego, aplicamos log del producto de los n factores de la expresión.

LogG= 1/2(logX1+ logX2+logX3+log X4+. . . +logX5)

El log del producto de n factores es la suma de los logaritmos de dichos


factores.
4
Contenidista: Francisco Roa Familia

3. Tomamos antilogaritmo a ambos miembros de la ecuación:

Antilogaritmo (LogG) = Antilogaritmo(½(logX1+logX2+logX3+logX4+. .


.+logX5)), de donde llegamos a la expresión:

G = Antilogaritmo (1/n(logX1+logX2+logX3+logX4+ . . .+logX5))= 1/n∑in Xi


(expresión b)

Es decir que tenemos dos expresiones validas para calcular la media


geométrica (G) para datos originales o individuales.

Ejemplo:
Suponga que el Producto Bruto del Sector Agrícola (PBSA), por año, en
el período comprendido entre el año 2003 y el 2010 fue como sigue:
Año 2003 2004 2005 2006 2007 2008 2009 2010
PBSA (mil RD$) 11000 20020 32032 62462,4 81201,12 125861,73 182499,5 259149.29

Tasa crecimiento - 0.82 0.60 0.95 0.30 0.55 0.45 0.42

Estas tasas de crecimiento fueron calculadas haciendo una simple


división del Producto Bruto obtenido en cada año sobre el producto
obtenido en el año anterior. Al resultado en cada caso se resta uno (1) y
el resto constituye la tasa de crecimiento. Ejemplo: Veamos el producto
en el año 2004 (20020) respecto al producto en el año 2003 (11000)
20020/11000 = 1.82. El uno representa al valor del producto en el año
2003 y el 0.82 constituye el valor del cambio o tasa de crecimiento del
producto en el año 2004 con respecto al año 2003. Observe que se

5
Contenidista: Francisco Roa Familia

dispone de solo siete tasas de crecimiento correspondientes al período


de los ocho (8) años.

n = 7 (tasas de crecimiento).

Utilicemos la expresión a: G=(X1*X2* X3*. . .*Xn) 1/n

G = (0.82*0.60*0.95*0.30*0.55*0.45*0.42)1/7 = 0.546590

G = 0.546590

Ahora utilicemos la expresión b:

G = Antilogaritmo (1/n(logX1+logX2+logX3+logX4+ . . .+logX5))= 1/n∑in Xi

n=7

Primero, calculamos los logaritmos a las tasas de crecimiento, tomamos


su sumatoria y luego dividimos por n (7):
Xi LogXi
0.82 -0.086186148

0.60 -0.221848750
0.95 -0.022276395
0.30 -0.522878745
0.55 -0.259637311
0.45 -0.346787486
0.42 -0.376750710
-1,836365544
Total

G = antilogaritmo (1/7(log 0.82+log 0.60 +


log 0.95 +. . . + log 0.42)) = antilogaritmo
6
Contenidista: Francisco Roa Familia

(1/7(0.08618614762 + 0.22184874962 + . .
. 0.42000000000) = (1/7(-1.836365544))=

G=antilogaritmo (-0.262337935)=0.54659

G= r =0.54659 = 55% (tasa de crecimiento


promedio en el periodo)

El resultado de esta operación (la del


antilogaritmo) es la Media Geométrica (G),
que en este caso es el valor de la tasa de
crecimiento promedio (r) en el periodo.

Ambas formulas de la G para los mismos datos originales o individuales


generan el mismo resultado, y cuando no, las diferencias son
despreciables, por lo que cada quien escoge usar de estas la expresión a
o la expresión b para el cálculo de la media geométrica G con datos
originales o individuales.
El valor (0.546590) de la G nos indica que el sector agrícola creció, en el
período considerado, con una tasa media de alrededor del 55 % por año.

Tasa de crecimiento entre dos momentos:

Con los datos de una variable en dos momentos, la tasa de


crecimiento (r) puede obtenerse en base a la formula siguiente:
r= n
N t
1 , donde:
N 0

r es la tasa de crecimiento de los valores de la variable considerada.


Nt es el valor de la variable en el periodo actual o dado t.
7
Contenidista: Francisco Roa Familia

N0 es el valor de la variable en el periodo base.


n es el número de periodos transcurrido entre Nt y N0

Ejemplo

Suponga que en el año 2006, la zona franca del país contaba


conto con 170,000 empleos y en al año 2011 con 195,000.
Se desea calcular la tasa de crecimiento de la cantidad de
empleos de zona franca del país, para el periodo considerado.

Nt = 195,000 empleos en zona franca en el año 2011.


N0 = 170,000 empleos en zona franca en el año 2006.
n = 5 años transcurridos en el periodo 2006 a 2011.

r= 5
195,000 1 = 5
1.147050882  1 = 1.0278202-1= 0.0278202
170,000
r = 0.0278202 = 2.78%; r = 2.78%
r≈3%

Esto nos indica que la cantidad de empleados, en el periodo


2007 a 2011, en el sector de zona franca del país, creció en
alrededor del 3 %.

Hagamos ahora la proyección a cinco (5) años, de la población


o cantidad de empleados de zona franca para el país. En este
caso la cantidad esperada de empleado al año 2016 (N t) vendría
dada por:
r n
Nt = N 0 x (1  )
100
8
Contenidista: Francisco Roa Familia

Donde:
N2011 = 195,000 empleos en zona franca en el año 2011.
n = 5 años en el periodo a transcurrir entre el año 2011 y el 2016.
r = 2.78%, es la tasa de crecimiento…
5

= 195,000 x 1 
2.78 
N2016  = 195,000 x 1.14694625 = 223,655
 100 
N2016 = 223,655 empleados

Medidas de tendencia no central o de posición no


central.

“Las medidas de posición se usan para describir la posición que tiene un


valor de datos específicos en relación con el resto de los datos.”, según
indican Robert Johnson y Patricia Kuby, Párrafo segundo, Pág. 72 de su
obra titulada Estadística Elemental, 2da. Edición; Serie Matemáticas de
la Editora Thompson, a partir de lo que se puede afirmar que: Las
medidas de posición, también llamadas de tendencia no central, tienen
el objetivo de describir el valor relativo que tienen determinados datos
en relación al resto del conjunto considerado.

De estas medidas son muy conocidas y de uso común en el ámbito de las


ciencias económicas y sociales, los Cuartiles, deciles y percentiles.

Estas medidas tienen nombres asociados directamente a sus objetivos. En


cada caso se calcula el “valor del lugar” o valor del punto que constituye
a cada medida, y para sus cálculos se sigue idéntico procedimiento y
criterios.

Cuartiles (Qi)

9
Contenidista: Francisco Roa Familia

Los Cuartiles son los tres puntos (Qi) que dividen a un conjunto de datos
en cuatro partes iguales.

El primer cuartil (Q1) coloca por debajo de sí, a lo sumo, a la primera


cuarta parte ó primer 25 % de los datos, y, por encima de sí, por lo
menos, a las tres cuartas partes ó 75 % de los datos del conjunto
considerado.

El segundo cuartil (Q2), equivalente a la mediana, conocida


anteriormente, coloca por debajo y por encima de sí a la mitad (50%) de
los valores del conjunto.

El tercer cuartil (Q3) es un punto que coloca por debajo de sí, a lo sumo,
a la primera tres cuartas partes ó primer 75% de los valores, y por encima
de sí, a lo menos, la última cuarta parte ó 25% de los datos del
conjunto en cuestión.

La expresión Qi = (i(n+1))/4, nos identifica el cuartil en cuestión.

Los Cuartiles (Qi) para datos individuales:

Ejemplo

A continuación los gastos en alimentos, por día, fuera de su hogar, de


una muestra al de los servidores de la universidad

Paso 1: Ordenar los valores ascendente o descendentemente.

70, 78, 150, 155, 167, 176, 181, 193, 193, 198, 201,229, 250.

N =13

1. Primer cuartil:Q1 = (1(13+1))/4 = 14/4 = 3.50


10
Contenidista: Francisco Roa Familia

Como señalaba anteriormente, en cada caso se calcula el valor del lugar


que ocupa la medida en cuestión. En este caso el resultado fraccionado
nos indica que el cuartil es el valor del lugar 3.5 en la secuencia de
valores. Pero ese lugar no existe, en realidad. Existe la el lugar o
posición 3 o la posición 4. Esto obliga a tomar una decisión: o
redondeamos al valor inmediato mayor, que es lo que aplican algunos
autores, entre los que se incluyen Anderson Sweeney y Williams1, ó
interpolamos el valor de la medida a determinar.

Preferimos esto último, es decir, interpolamos, así mantenemos la


coherencia con criterios aplicados al calcular la mediana,
anteriormente. (De igual modo procedemos en los casos de los deciles y
percentiles):

El valor de Q1 = 3.5 nos indica que el primer cuartil es un valor centrado,


en la secuencia, inmediatamente después del tercer valor (a la mitad
de la distancia entre este y el cuarto valor). Por eso la interpolación
apropiada sería:

Q1 = 150 + 0.5 (155-150) = 152.50

Q1 = 152.50

El valor (152.50) del primer cuartil (Q1) significa que la primera


cuartaparte la comunidad de servidores considerada consume

2. Segundo cuartil (Q2)

Q2 = (2(13+1))/4 = 28/4 = 7

El Q2 es el valor del dato que ocupa la posición No. 7 en la secuencia, en


este caso:
11
Contenidista: Francisco Roa Familia

Q2= 181

3. Tercer cuartil (Q3)

Q3= (3(13+1))/4 = 10.5 + 0.5*(229-201) = 212.

Q3 = 212.

Deciles (Di)

Los deciles (Di) son nueve puntos que dividen en diez partes iguales o
diez decimas partes, a los valores de un conjunto.

La expresión Di = (i(n+1))/4, representa a un decil cualquiera.

Ejemplo

A continuación los gastos en alimentos, por día, del ejemplo pasado…

Mantenemos los datos ordenados ascendentemente.

70, 78, 150, 155, 167, 176, 181, 193, 193, 198, 201,229, 250.

Primer decil (D1)

D1 = (1(n+1))/10

n = 13

12
Contenidista: Francisco Roa Familia

D1 = (1(13+1))/10 = 1.4, lo que nos dice que el primer decir es el valor


del primer dato en la secuencia (70) más 0.4 de la distancia ó
diferencia entre los valores de los dos datos subsiguientes, es decir que:

D1 = 70+0.4*(78-70) = 73.2

D1 = 73.2

Segundo decil (D2)

D2 = (2(13+1))/10

D2 =78 + 0.8*(150-78)

D2 = 135.6

Para los demás deciles, repetir la rutina…

Percentiles (Pi)

Son 99 percentiles o puntos que dividen en las cien centésimas partes al


conjunto de datos en cuestión.

La expresión Pi = (i(n+1))/4, representa a cualquiera de los cien


percentiles.

Ejemplo

Volvamos al ejemplo anterior. . .

70, 78, 150, 155, 167, 176, 181, 193, 193, 198, 201,229, 250.

13
Contenidista: Francisco Roa Familia

Primer percentil (P1)

Pi = (1 (n + 1) /100 = 0.14

Pi = 0 + 0.14*(70-0) = 9.8

Pi = 9.8

percentil (P60)

P60 = (60 (13 + 1) /100 = 8.4, significa que el percentil 60 es el valor del
elemento o dato en la posición 8 mas la fracción 0.4 de la diferencia
entre el elemento 8 y el subsiguiente. Así tenemos que:

Pi = (1 (n + 1) /100 = 0.14

P60 = 193+0.4*(193-193) = 193

P60 = 193

Para los demás percentiles, repetir la rutina…

Cuartiles, deciles y percentiles para datos agrupados

Para los cálculos de estas medidas sobre datos agrupados, se procede de


igual modo que con la mediana. Son, exactamente, los mismos criterios.

En el caso de los Cuartiles, tenemos que:

Qi = Li + [(in/4)-F)/fi]*ci =

14
Contenidista: Francisco Roa Familia

Introducimos aquí algunas modificaciones a la simbología utilizada


anteriormente con la formula de la mediana:

Li es el “límite inferior real” del intervalo o clase que aplica o contiene


al cuartil considerado.

La clase que aplica o contiene al cuartil considerado, que es


aquel que incluye o contiene el valor del elemento in/4.

ci amplitud de la clase que contiene al cuartil considerado.

i en este caso es el orden del cuartil considerado en la


distribución de frecuencias, no la amplitud de los intervalos o
clases, como en la mediana (Md).

n es el numero de datos en el conjunto considerado.

Fi es la frecuencia acumulada hasta la clase anterior a la clase que


aplica o contiene al cuartil considerado.

fi es la frecuencia correspondiente a la clase que contiene al cuartil


considerado.

Di = Li + [(in/10)-F)/fi]*ci =

Pi = Li + [(in/100)-F)/fi]*ci =

Ejemplo

Volvamos a la distribución de frecuencias del ejemplo con el que


calculamos a la mediana.
15
Contenidista: Francisco Roa Familia

Gastos (RD$)(yi) Frecs.(fi) Fi


De 17.00 a 19.48 3 3 Clase P1
De 19.48 a 21.96 15 18 Clase D1
De 21.96 a 24.43 13 31 Clase Q1
De 24.43 a 26.91 32 63 Clase Md,Q2,D5 ,P50
De 26.91 a 29.39 23 86 ClaseQ3, P60
De 29.39 a 31.87 22 108 Clase D8,
De 31.87 a 34.34 1 109
De 34.34 a 36.82 2 111
Total 111

Cuartiles

Qi =in/4 (este valor nos da el intervalo o clase que contiene al

n = 111

Cuartiles (Qi)

Primer cuartil (Q1)

Q1 = 1*(111)/4= 27.75
Q1 = L1 + [(1*(111)/4)-F)/f1]*ci =
Q1 = 23.82

Segundo cuartil (Q2)

16
Contenidista: Francisco Roa Familia

Q2 = 2*(111)/4= 55.5
Q2 = L2 + [(1*(111)/4)-F)/f2]*ci =
Q2 = 26.33 = Md

Tercer cuartil (Q3)

Q3 = 3*(111)/4= 83.25
Q3 = L3 + [(1*(111)/4)-F)/f3]*ci =
Q3 = 29.09

Deciles (Di)

Primer decil (D1)

D1 = 1*(111)/10= 11.1
D1 = L1 + [(1*(111)/10)-F)/f1]*ci =
D1 = 18.87

Quinto Decil (D5)

D5 = 5*(111)/10 = 55.5
D5 = L5 + [(1*(111)/10)-F)/f2]*ci =
D5 = 26.33 = Md

Octavo decil (D8)

D8 = 8*(111)/10= 88.8
D8 = L8 + [(1*(111)/10)-F)/f8]*ci =
D8 = 33.67
17
Contenidista: Francisco Roa Familia

Percentiles (Pi)

Primer percentil (P1)

P1 = 1*(111)/100= 1.11
P1 = L1 + [(1*(111)/100)-F)/f1]*ci =
P1 = 17.92

Percentil cincuenta (P50)

P50 = 2*(111)/100=55.5
P50 = L2 + [(1*(111)/100)-F)/f2]*ci =

P50 =26.33= Md

Percentil sesenta (P60)

P60 = 1*(111)/100=

P60 = L60 + [(1*(111)/100)-F)/f60]*ci =

P60 =27.30

BIBLIOGRAFIA CONSULTADA:
1. http://estadistica-uasd.blogspot.com/, sitio Web del que somos co-
propietarios.

18
Contenidista: Francisco Roa Familia

2. Enciclopedia virtual Wikipedia, 30 de nov. 2010


http://es.wikipedia.org/wiki/Estad%C3%ADstica.
3. BIBLIOTECA VIRTUAL de Derecho, Economía y Ciencias
Sociales http://www.eumed.net/libros/2006a/rmss/00.htm (30 de
nov. 2010)
4. David R. Anderson. Denny J. Sweeney. Thomas A. Williams, en
Estadística para Administración y Economía. D.R. 2008 por
Editorial CENGAGE Learning Editores S.A., México, DF, 10ª.
Edición.
5. Richard I. Levin y Bubin, David S, en Estadística para
Administración y Economía; 7ma. Edición; Editorial Pearson
Educación, México, 2004.
6. Allen L. Webster, en Estadística Aplicada a los negocios y a la
Economía. Editora IrWin-McGraw-Hill. Tercera edición; abril del
año 2004.
7. Carlos Custodio Guerrero, en Estadística Básica, Editorial
Surco, 4ta.edición, año 2008.
8. Alfonso García Barbancho, en Estadística Elemental Moderna.
9na. Edición, noviembre 1993.Editorial Ariel, S.A, Córcega, 270,
Barcelona-8. ISBN:84 344 01401. Impreso en España.

19

También podría gustarte