Está en la página 1de 23

DRIAGRAMA DE CAJA O BIGOTE

Los diagramas de Caja-Bigotes (box - plots) son una presentacin visual que
describe varias caractersticas importantes, al mismo tiempo, tales como la
dispersin y simetra.
Construccin:
Comparar distribuciones
Construccin:
Una grfica de este tipo consiste en una caja rectangular, donde los lados ms
largos muestran el recorrido intercuartlico. Este rectngulo est dividido por un
segmento vertical que indica donde se posiciona la mediana y por lo tanto su
relacin con los cuartiles primero y tercero (recordemos que el segundo cuartil
coincide con la mediana).
Esta caja se ubica a escala sobre un segmento que tiene como extremos los
valores mnimo y mximo de la variable. Las lneas que sobresalen de la caja se
llaman bigotes. Estos bigotes tienen un lmite de prolongacin, de modo que
cualquier dato o caso que no se encuentre dentro de este rango es marcado e
identificado individualmente
EJEMPLO DISTRIBUCIN DE EDADES
Utilizamos la ya usada distribucin de frecuencias (en tallos y hojas), que
representan la edad de un colectivo de 20 personas.
36 25 37 24 39 20 36 45 31 31

39 24 29 23 41 40 33 24 34 40


ORDENAR LOS DATOS
Para calcular los parmetros estadstico, lo primero es ordenar la distribucin
20 23 24 24 24 25 29 31 31 33 34 36 36 37 39 39 40 40 41 45

CALCULO DE CUARTILES
Q
1
: el cuartil Primero es el valor mayor que el 25% de los valores de la
distribucin. Como N = 20 resulta que N/4 = 5; el primer cuartil es la media
aritmtica de dicho valor y el siguiente:
Q
1
= (24 + 25) / 2 = 24,5
Q
2
: el Segundo Cuartil es, evidentemente, la mediana de la distribucin, es el valor
de la variable que ocupa el lugar central en un conjunto de datos ordenados.
Como N/2 =10; la mediana es la media aritmtica de dicho valor y el siguiente:
m
e
= Q
2
= (33 + 34)/ 2 =33,51111111111110
Q
3
: el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la
distribucin. En nuestro caso, como 3N / 4 = 15, resulta
Q
2
= (39 + 39) / 2 = 39
DIBUJAR LA CAJA Y LOS BIGOTES


El bigote de la izquierda representa al colectivo de edades ( X
mn
, Q
1
)
La primera parte de la caja a (Q
1
, Q
2
),
La segunda parte de la caja a (Q
2
, Q
3
)
El bigote de la derecha viene dado por (Q
3
, X
mx
).

INFORMACIN DEL DIAGRAMA
0Podemos obtener abundante informacin de una distribucin a partir de estas
representaciones. Veamos alguna:
La parte izquierda de la caja es mayor que la de la derecha; ello quiere
decir que las edades comprendidas entre el 25% y el 50% de la poblacin
est ms dispersa que entre el 50% y el 75%.
El bigote de la izquierda (Xmm, Q
1
) es ms corto que el de la derecha; por
ello el 25% de los ms jvenes estn ms concentrados que el 25% de los
mayores.
El rango intercuartlico = Q
3
- Q
1
= 14,5; es decir, el 50% de la poblacin
est comprendido en 14,5 aos.
MEDIDAS DE TENDENCIA CENTRAL

Las medidas de tendencia central son valores que se ubican al centro de un
conjunto de datos ordenados segn su magnitud. Generalmente se utilizan 4 de
estos valores tambin conocidos como estadgrafos, la media aritmtica, la
mediana, la moda y al rango medio.
La media aritmtica es la medida de posicin utilizada con ms frecuencia. Si se
tienen n valores de observaciones, la media aritmtica es la suma de todos y cada
uno de los valores dividida entre el total de valores: Lo que indica que puede ser
afectada por los valores extremos, por lo que puede dar una imagen distorsionada
de la informacin de los datos.
La Mediana, es el valor que ocupa la posicin central en un conjunto de datos, que
deben estar ordenados, de esta manera la mitad de las observaciones es menor
que la mediana y la otra mitad es mayor que la mediana, resulta muy apropiada
cuando se poseen observaciones extremas.
La Moda es el valor de un conjunto de datos que aparece con mayor frecuencia.
No depende de valores extremos, pero es ms variables que la media y la
mediana.
Rango Medio es la media de las observaciones menor y mayor. Como intervienen
solamente estas observaciones, si hay valores extremos, se distorsiona como
medida de posicin, pero Ofrece un valor adecuado, rpido y sencillo para resumir
al conjunto de datos.








Datos Discretos

No Agrupados

Analicemos para ello las edades que utilizamos cuando se vio la organizacin y
presentacin de datos discretos:

12 15 14 15 16
18 19 14 15 17
15 17 18 16 19
16 17 15 15 17
16 18 17 19 17
23 16 17 18 19

Estos fueron los datos mostrados originalmente, no se han ordenado ni agrupado,
determinemos ahora los valores de la Media, la Mediana y la moda, para ello
recurramos a las frmulas de estas medidas que resumimos en la siguiente tabla:
Medida Formula Observaciones
Media


Donde x
i
se refiere a todo y
cada uno de los elementos de
la muestra y n es el nmero
total de elementos en la
muestra.
Mediana a) p = (n/2) Es la posicin en donde se
encuentra la mediana.
Si n es impar, entonces es la
opcin a, en caso contrario, la
b.
El valor de la mediana se
obtiene por observacin
b) p = (n/2) + 1
Moda Se obtiene el valor por
observacin
Rango Medio (Valor mximo + Valor Mnimo) /
2


Aplicando, se obtienen los siguientes valores:
Para la media:
_
X =12 + 15 + 14 + 15 + 16 + 18 + 19 + 14 + 15 + 17 + 15 + 17 + 18 + 16 + 19 + 16
+ 17 + 15 + 15 + 17 + 16 + 18 + 17 + 19 + 17 + 23 + 16 + 17 + 18 + 19 / 30


_ 500
X = ------------ = 16.6667
30

Para la mediana deber ordenarse el grupo de datos, como n = 30, utilizaremos la
posicin p = (30/2) = 15, el primer valor mayor a 15 corresponde a la clase 17.

La moda estara determinada por observacin directa, y correspondera al valor
17, que se presenta hasta 7 veces en la muestra.
El rango medio se determina por la suma entre 23 y 12 dividido entre 2 (23 + 12)/2
= 35/2 = 17.5
Si observamos los valores obtenidos veremos que solo para el clculo de la
mediana se obtiene tuvo que ordenar la informacin (as lo especfica la
definicin), sin embargo podemos tambin observar que este ordenamiento no
afecta de manera directa ninguno de los clculos, de esta manera se puede
construir la siguiente tabla:
Medida Valor Calculado Observaciones
Media 16.6667
Mediana 17 Se requiri el clculo de la frecuencia
acumulada
Moda 17
Rango
Medio
17.5
Es de notar lo cercano de todos los valores que se han calculado, que circundan el
valor de 17, no se notan cambios en los resultados comparados con los datos
originales, sin embargo las formulas si se ven modificadas.


Agrupados
Recurramos ahora al agrupamiento de los datos discretos del ejercicio que hemos
estado utilizando:
Clase Repeticiones Total de Aos de la
clase
12 1 12
14 2 28
15 6 90
16 5 80
17 7 119
18 4 72
19 4 76
23 1 23
Total 30 500
En donde podemos observar la suma de las frecuencias y de los aos
multiplicados por la clase que agrupa a los datos coinciden con los datos utilizados
cuando no se agruparon en la seccin anterior, utiliza
Medida Formula Observaciones
Media

Donde x
i
se refiere a todo y cada
uno de los elementos de la
muestra y n es el nmero total de
elementos en la muestra y f
i
se
refiere a la frecuencia de la clase.



Mediana



p = (n/2)


Es la posicin en donde se
encuentra la mediana.
Se ubica en la tabla el primer valor
de frecuencia acumulada mayor a
la posicin calculada, si ese valor
es mayor, entonces la mediana es
la clase correspondiente al mismo.
Si el valor es igual a la posicin,
entonces se suman el valor
anterior ms el valor obtenido y se
divide entre 2.
Moda Se obtiene el valor por
observacin
Rango
Medio
(Valor mximo + Valor Mnimo)
/ 2

Aplicando, se obtienen los siguientes valores:
Para la media:
_
X= 12 * 1 + 14 * 2 + 15 * 6 + 16 * 5 + 17 * 7 + 18 * 4 + 19 * 4 + 23 * 1 / 30

_
X= 12 + 28 + 90 + 80 + 119 + 72 + 76 + 23 / 30

_ 500
X = ------------ = 16.6667
30

Para la Mediana, utilizaremos la frecuencia acumulada:

Clase Frecuencia Frecuencia
Acumulada
12 1 1
14 2 3
15 6 9
16 5 14
17 7 21
18 4 27
19 4 29
23 1 30
Total 30

Como n = 30, utilizaremos la posicin p = (30/2) = 15, el primer valor mayor a 15
corresponde a la clase 17.

La moda estara determinada por observacin directa, y correspondera al valor
17, que se presenta hasta 7 veces en la muestra.
El rango medio se determina por la suma entre 23 y 12 dividido entre 2 (23 + 12)/2
= 35/2 = 17.5
Si observamos los valores obtenidos veremos que solo para el clculo de la
mediana se obtiene tuvo que ordenar la informacin (as lo especfica la
definicin), sin embargo podemos tambin observar que este ordenamiento no
afecta de manera directa ninguno de los clculos, de esta manera se puede
construir la siguiente tabla:


Medida Valor Calculado Observaciones
Media 16.6667
Mediana 17 Se requiri el clculo de la frecuencia
acumulada
Moda 17
Rango
Medio
17.5
Es de notar lo cercano de todos los valores que se han calculado, que circundan el
valor de 17, no se notan cambios en los resultados comparados con los datos
originales, sin embargo las formulas si se ven modificadas.













MEDIDAS DE DISPERSION
Las medi das de di spersi n nos i nforman sobre cunto se al ej an del
centro l os val ores de l a di stri buci n.
Las medi das de di spersi n son:
Rango o recorrido
El rango es l a di ferenci a entre el mayor y el menor de l os datos de
una di stri buci n estadsti ca.
Desviacin media
La desvi aci n respecto a l a medi a es l a di ferenci a entre cada val or de
l a vari abl e estadsti ca y l a medi a ari tmti ca.
D
i
= x - x
La desvi aci n medi a es l a medi a ari tmti ca de l os val ores absol utos
de l as desvi aci ones respecto a l a medi a.
La desviacin media se representa por




Ejemplo
Cal cul ar l a desvi aci n medi a de l a di stri buci n:
9, 3, 8, 8, 9, 8, 9, 18



Desviacin media para datos agrupados: Si l os datos vi enen
agrupados en una tabl a de f recuenci as, l a expresi n de l a desvi aci n
medi a es:

Ejemplo: Cal cul ar l a desvi aci n medi a de l a di stri buci n:
x
i
f
i
x
i
f
i
|x - x| |x - x| f
i

[10, 15) 12.5 3 37.5 9.286 27.858
[15, 20) 17.5 5 87.5 4.286 21.43
[20, 25) 22.5 7 157.5 0.714 4.998
[25, 30) 27.5 4 110 5.714 22.856
[30, 35) 32.5 2 65 10.174 21.428
21 457.5 98.57



Varianza
La vari anza es l a medi a ari tmti ca del cuadrado de l as desvi aci ones
respecto a l a medi a de una di stri buci n estadsti ca.
La vari anza se representa por .

Varianza para datos agrupados

Para si mpl i f i car el cl cul o de l a vari anza vamos o uti l i zar l as
si gui entes expresi ones que son equi val entes a l as anteri ores.

Varianza para datos agrupados


Ejercicios de varianza
Calcular la varianza de l a di stri buci n:
9, 3, 8, 8, 9, 8, 9, 18



Calcular la varianza de l a di stri buci n de l a tabl a:
x
i
f
i
x
i
f
i
x
i
2
f
i

[10, 20) 15 1 15 225
[20, 30) 25 8 200 5000
[30,40) 35 10 350 12 250
[40, 50) 45 9 405 18 225
[50, 60 55 8 440 24 200
[60,70) 65 4 260 16 900
[70, 80) 75 2 150 11 250
42 1 820 88 050




Propiedades de la varianza
1 La vari anza ser si empre un val or posi ti vo o cero, en el caso de
que l as puntuaci ones sean i gual es.
2 Si a todos l os val ores de l a vari abl e se
l es suma un nmero l a vari anza no vara.
3 Si todos l os val ores de l a vari abl e se mul ti pl i can por
un nmero l a vari anza queda mul ti pl i cada por el cuadrado de
di cho nmero.
4 Si tenemos vari as di stri buci ones con l a mi sma medi a y
conocemos sus respecti vas vari anzas se puede cal cul ar l a vari anza
total .
Si todas l as muestras ti enen el mi smo tamao:

Si l as muestras ti enen di sti nto tamao:












Desviacin tpica
La desvi aci n tpi ca es l a raz cuadrada de l a vari anza.Es deci r, l a
raz cuadrada de l a medi a de l os cuadrados de l as puntuaci ones de
desvi aci n.

Desviacin tpica para datos agrupados

Para si mpl i f i car el cl cul o vamos o uti l i zar l as si gui entes
expresi ones que son equi val entes a l as anteri ores.

Desviacin tpica para datos agrupados




Ejercicios de desviacin tpica
Cal cul ar l a desvi aci n tpi ca de l a di stri buci n:
9, 3, 8, 8, 9, 8, 9, 18

Cal cul ar l a desvi aci n tpi ca de l a di stri buci n de l a tabl a:
x
i
f
i
x
i
f
i
x
i
2
f
i

[10, 20) 15 1 15 225
[20, 30) 25 8 200 5000
[30,40) 35 10 350 12 250
[40, 50) 45 9 405 18 225
[50, 60) 55 8 440 24 200
[60,70) 65 4 260 16 900
[70, 80) 75 2 150 11 250
42 1 820 88 050


LA PIRMIDE DE POBLACIN O PIRMIDE DEMOGRFICA

Es un histograma que est hecho a base de barras cuya altura es proporcional a
la cantidad que representa la estructura de la poblacin por sexo y edad que se
llaman cohortes.


Grficamente se trata de un doble histograma de frecuencias. Las barras del doble
histograma se disponen en forma horizontal, es decir, sobre la lnea de
las abscisas, y convencionalmente se indican los grupos de edad de la poblacin
masculina a la izquierda y los que representan la poblacin femenina a la derecha.
Existen tres tipos bsicos de pirmides de poblacin por edad y sexo. Saber qu
pirmide de poblacin tiene un territorio nos permite saber ms acerca de lo joven
o envejecida que tiene su poblacin, el grado de desarrollo que posee, el
porcentaje de mujeres que hay respecto a los hombres, elaborar estadsticas
sobre la poblacin, etc.
Pirmide progresiva: presenta una base ancha frente a unos grupos superiores
que se van reduciendo, consecuencia de una natalidad alta y de una mortalidad
progresiva segn la edad; indica una estructura de poblacin eminente joven y con
perspectivas de crecimiento. Esta pirmide corresponde normalmente a pases
subdesarrollados debido a las altas tasas de mortalidad y a una natalidad alta y
descontrolada.
Pirmide estacionaria o estancada: se aprecia un equilibrio entre todos los
grupos de edad, consecuencia de una natalidad y mortalidad que se mantienen sin
variaciones significativas durante un periodo de tiempo largo. Esta pirmide
es propia de pases en vas de desarrollo, donde se ha empezado a controlar la
mortalidad pero la natalidad sigue siendo bastante alta. Esta pirmide se
considera el paso intermedio entre la pirmide progresiva y la regresiva.
Pirmide regresiva: es ms ancha en los grupos superiores que en la base,
debido al descenso en la natalidad y al envejecimiento continuo de su poblacin;
por tanto, su perspectiva de futuro es de descenso. Esta pirmide corresponde
a pases desarrollados.



Cul es la utilidad de analizar pirmides?
Analizando las pirmides de poblacin de diferentes lugares podemos comparar
su comportamiento demogrfico. Por ejemplo, se puede conocer si la mortalidad y
la natalidad han variado en los ltimos aos.
Por otra parte, analizando varias pirmides de un mismo lugar correspondientes a
diferentes momentos histricos, pueden reconstruir su historia demogrfica,
observando la evolucin de los diferentes grupos etarios. Pueden analizar, entre
otras cosas, un fenmeno de migracin relacionando las pirmides que
corresponden al lugar desde donde emigr un grupo de poblacin y al lugar
adonde dicha poblacin arrib.

Cmo se construye una pirmide de poblacin?
Para construir una pirmide de poblacin es necesario contar con los datos de la
poblacin de una jurisdiccin, discriminados por edad y por sexo. Esta informacin
puede ser obtenida a partir de los censos de poblacin.
Edad Varones Mujeres Edad Varones Mujeres
0-4 79.018 76.617 55-59 27.445 29.906
5-9 74.573 72.275 60-64 25.346 29.031
10-14 75.278 73.378 65-69 19.971 22.819
15-19 64.522 64.960 70-74 13.074 16.666
20-24 52.265 54.409 75-79 8.646 11.359
25-29 46.822 49.183 80-84 3.982 6.191
30-34 45.428 47.712 85-89 1.502 2.642
35-39 45.113 47.902 90-94 401 862
40-44 41.490 44.581 95 y
ms
84 215
45-49 35.893 38.125 99 y
ms
19 52
50-54 30.029 32.776

El grfico de una pirmide de poblacin se estructura a partir de un eje vertical y
otro horizontal.
EJ: En el eje vertical de la pirmide se representan los grupos de edades. En
general, para la construccin de una pirmide de poblacin se establecen grupos
con intervalos de 5 aos, de manera que resultan rangos tales como los
siguientes: de 0 a 4 aos, de 5 a 9 aos, de 10 a 14 aos, etc. Las edades
menores se ubican en la base del grfico y las mayores, en la cima.
Sobre e11111111111l eje horizontal se representa la cantidad de poblacin
segn ambos sexos: hacia la izquierda del eje se ubican los datos
correspondientes a los varones y hacia la derecha, la informacin correspondiente
a las mujeres. El eje horizontal puede contener valores absolutos o relativos. La
ventaja del uso de valores relativos es que permite realizar comparaciones entre
pirmides.
Sobre esta estructura y con los datos de poblacin de un lugar determinado en un
momento dado (clasificados segn edad y sexo), se construyen las barras
horizontales, dispuestas una encima de la otra para cada grupo de edad y sexo.
Las barras horizontales, entonces, indican la cantidad o porcentaje de poblacin
por grupo etario. Para construirlas es necesario establecer qu cantidad de
poblacin le corresponde a cada grupo etario segn el sexo al que pertenece y
dibujar la barra desde el eje vertical hacia afuera segn los valores del eje
horizontal. De esta manera se procede con cada grupo etario, y para ambos
sexos, hasta completar la serie de edades y, as, terminar la pirmide. Para
construir la pirmide con valores relativos, se requiere calcular previamente el
porcentaje que cada grupo etario por sexo representa sobre el total de poblacin.



















DIAGRAMA DE CAJA Y BIGOTE
MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE DISPERSION
PPIRAMIDE POBLACIONAL



Dewin Guillermo Peata Galaraga
Luis Gabriel Angulo Petro
Gilberto Villadiego Cantero
Jorge Ivn Daz Isaza




Dr. Daniel Martnez



MEDICINA
UNIVERSIDAD DEL SINU
FACULTAD DE MEDICINA
2014

CONTENIDO:
- Diagrama de cajas
Descripcin
Ejemplo de operaciones

- Medidas de tendencia central
Media
Mediana
Moda

- Medidas de dispersin
Vari anza
Desvi aci n tpi ca
Rango o recorri do
Desvi aci n medi a

- Pi rmi de pobl aci onal
Descri pci n
Ti pos de pi rmi des pobl aci onal es












INTRODUCION
El conoci mi ento de estos temas resul ta fundamental para conocer el
comportami ento de ci ertos eventos adqui ri endo un papel cl ave en l a
i nvesti gaci n. Se usa como un val i oso auxi l i ar y en l os di ferentes
campos del conoci mi ento y en l as vari adas ci enci as. Es tan i mportante
que casi no exi ste acti vi dad humana en que no est i nvol ucrada l a
Estadsti ca. Las deci si ones ms i mportantes de nuestra vi da se toman
con base en l a apl i caci n de l a Estadsti ca.




















BIBLIOGRAFI A:
CANAVOS, G. (1988) Probabi l i dad y Estadsti ca. Apl i caci ones y
Mtodos. Mxi co: McGraw-Hi l l . (PDF)
Armi tage, G. Berry, Estadsti ca para l a Investi gaci n Bi omdi ca.
Doyma, Barcel ona, 1992.
J.L. Carrasco de l a Pea, El Mtodo Estadsti co en l a Investi gi s
Medi ca. Karpus, Madri d, 1982.

También podría gustarte