Está en la página 1de 34

DIAGRAMAS DE BLOQUES O DE LÍNEAS

DIAGRAMAS DE CAJA O BLOQUES Y LINEAS

Es una representación gráfica basada en cuartiles, que

ayuda a ilustrar un conjunto de datos. Para elaborar tal

diagrama solamente se necesitan 5 valores estadísticos:

valor mínimo, Q1, la mediana, Q3 y el valor máximo.


EJEMPLO: Una muestra de familias que
están suscritas a la compañía Telefónica
registró los siguientes números de llamadas
recibidas la semana pasada:

52 44 30 38 31 42 12 46 39 37 34 46 32 18 41 5
Entonces ordenamos:

5 12 18 30 31 32 34 37 38 39 41 42 44 46 46 52
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Primer Cuartil La Mediana Tercer Cuartil
25 75
L25  16  1* L75  16  1*
50
 4.25 L 50  16  1 *  8.5  12.75
100 100 100
Para el primer cuartil, este se encuentra en 4.25, es decir
entre 30 y 31. Entonces:
Q1  30 31 30

4.25  4 54
Esto nos da Q1 = 30.25. Esto hubiera sido más rápido si lo
halláramos así:
Q1  30  31  30 * 0.25  30.25
Ahora para la mediana, esta se encuentra en 8.5, es decir
entre 37 y 38. Entonces:
Mediana 37  38  37* 0.5  37.5

Ahora para el tercer cuartil, esta se encuentra en 12.75, es decir


entre 42 y 44. Entonces:
Q3  42  44  42 * 0.75  43.5
Obtenemos:

Valor mínimo Q1 Mediana Q3 Valor máximo


5 30.25 37.5 43.5 52

Entonces el diagrama de
caja es el siguiente:
5 12 18 30 31 32 34 37 38 39 41 42 44 46 46 52
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
MEDIA ARITMÉTICA: 34.1875

Valor mínimo Q1 Mediana Q3 Valor máximo


5 30.25 37.5 43.5 52

Q1 Q3

5 52

Q2

10 20 30 40 50
Valor mínimo Q1 Mediana Q3 Valor máximo
5 30.25 37.5 43.5 52

Q1 Q3

5 52

Q2

10 20 30 40 50
datos
Este diagrama nos muestra que el 50% central de las
familias recibe llamadas entre 30.25 y 43.5 llamadas. La
distancia entre los extremos de la caja, que es 13.25 (43.5 -
30.25 = 13.25), a esto se le denomina amplitud cuartílica (o
intercuartílica).
Otra observación que debemos tener en cuenta es que la

distribución de llamadas recibidas por una familia tiene

asimetría negativa. Esto es porque:

La línea a la izquierda que va desde el primer cuartil hacia

el mínimo valor es más grande que la línea que va del

tercer cuartil hacia el valor máximo. Es decir que el 25%

de los datos menores que el primer cuartil se encuentran

más disperso que el 25% de los mayores que el tercer

cuartil.
La mediana no se encuentra en el centro de la caja.
La distancia del primer cuartíl a la mediana es mayor
que la distancia de dicha mediana al tercer cuartíl.

EJEMPLO: Supongamos que el ejemplo


anterior cambiara sus frecuencias es decir:

10 12 15 18 19 22 25 26 27 30 31 39 44 46 49 53
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Hallando la posición de los cuartiles:
Primer cuartil La mediana Tercer cuartil
25 75
L25  16  1*  8.5 L75  16  1*
50
 4.25 L50  16  1 *  12.75
100 100 100
Para el primer cuartil:

Q1  18  19  18 * 0.25  18.25


Ahora para la mediana:
EVOLUCIÓN HISTÓRICA DE LOS SISTEMAS
PRODUCTIVOS

Mediana 26  27  26* 0.5  26.5


Ahora para el tercer cuartil:

Q3  39  44  39 * 0.75  42.75

Valor Valor
Q1 Mediana Q3
mínimo máximo
10 18.25 26.5 42.75 53
Q1 Q3

Q2

10 20 30 40 50
C1
Se trataría de una distribución con asimetría positiva, porque la
mediana no se encuentra en el centro de la caja y la distancia
del primer cuartil a la mediana es menor que la distancia del
tercer cuartil a la mediana. Además la línea que sale del tercer
cuartil al valor máximo es más grande que la línea que sale del
Valor Valor
primer cuartil al valor mínimo. Q1 Mediana Q3
mínimo máximo
10 18.25 26.5 42.75 53
Para DATOS AGRUPADOS la fórmula sería:

P  Fa
li  *A
fp
li = Limite inferior de la posición deseada (primer cuartil,
tercer cuartil …)

P = Posición deseada.

Fa = Frecuencia acumulada de la clase anterior a la


posición deseada.

fp = frecuencia de la posición deseada.


A = Amplitud de la clase.
EJEMPLO:

Los gastos de publicidad son un componente

importante en el costo de mercancías vendidas. A

continuación se presenta una distribución de

frecuencias que muestran los gastos de publicidad de

120 compañías de computadoras. Calcular el quinto

decíl, el centíl 20, el tercer cuartíl.


Gasto de Número de Frecuencia Punto
publicidad compañías acumulativa Medio
(millones de $) (n) (F) (X)

25 – 35 10 10 30

35 – 45 20 30 40

45 – 55 42 72 50

55 – 65 32 104 60

65 – 75 16 120 70

Total 120
Entonces el quinto decíl, significa que el 50% de
los datos son menores que el quinto decíl y el 50%
son mayores.
Gasto de Número de Frecuencia Punto
publicidad compañías acumulativa Medio
P  Fa (millones de $) (n) (F) (X)
li  *A
fp 25 – 35 10 10 30
35 – 45 20 30 40
La posición del quinto 45 – 55 42 72 50
decíl es: 55 – 65 32 104 60
65 – 75 16 120 70
P  50%(120)  60 Total 120

P  Fa 60  30
D5  li  * A  45  *10  52.14
fp 42
Entonces el centíl 20, significa que el 20% de los
datos son menores y el 80% son mayores.

Gasto de
Número de Frecuencia Punto
publicidad
P  Fa
compañías acumulativa Medio
(millones de
li  *A $)
(n) (F) (X)
fp
25 – 35 10 10 30
35 – 45 20 30 40
La posición del centíl 20 es:
45 – 55 42 72 50
55 – 65 32 104 60
P  20%(120)  24 65 – 75 16 120 70
Total 120
P  Fa 24  10
C20  li  * A  35 *10  42
fp 20
Entonces el tercer cuartil, significa que el 75% de
los datos son menores y el 25% son mayores.
Gasto de
Número de Frecuencia Punto
publicidad
compañías acumulativa Medio
(millones de
La posición del $)
(n) (F) (X)
tercer cuartil es:
25 – 35 10 10 30
35 – 45 20 30 40
45 – 55 42 72 50
P  75%(120)  90 55 – 65 32 104 60
65 – 75 16 120 70
Total 120

P  Fa 90  72
Q3  li  * A  55 *10  60.63
fp 32
APLICACIONES
EJEMPLO: Se hace una muestra de los valores de renta
mensuales en soles, para un departamento de 3 dormitorios. Los
datos son una muestra de 71 apartamentos en la ciudad de Lima.
Los datos se presentan en orden ascendente.

425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
615
Resumen de cinco datos: VALOR MÍNIMO = 425
PRIMER CUARTIL (Q1) = 445
MEDIANA (Q2) = 475
TERCER CUARTIL (Q3) =525
VALOR MÁXIMO = 615

425 430 430 435 435 435 435 435 440 440
440 440 440 445 445 445 445 445 450 450
450 450 450 450 450 460 460 460 465 465
465 470 470 472 475 475 475 480 480 480
480 485 490 490 490 500 500 500 500 510
510 515 525 525 525 535 549 550 570 570
575 575 580 590 600 600 600 600 615 615
615
DIAGRAMA DE CAJA:
VALOR MÍNIMO = 425
PRIMER CUARTIL (Q1) = 445
MEDIANA (Q2) = 475
TERCER CUARTIL (Q3) = 525
VALOR MÁXIMO = 615
No hay valores atípicos.

375 400 425 450 475 500 525 550 575 600 625
ASIMETRÍA

Asimetría positiva

Moda Media
Mediana

Asimetría negativa

Media Moda
Mediana
EJEMPLO: Las duraciones de estándar en el piso de

cancerología de un hospital, se organizaron en una

distribución de frecuencias. La duración media fue

de 28 días, la mediana 25 días, y la duración modal

23 días. Se calculó una desviación estándar de 4.2

días.

1. ¿Es la distribución simétrica con sesgo positivo o

sesgo negativo?

2. ¿Cuál es el coeficiente de asimetría? Interprételo.


Calculando Coeficiente de Asimetría:

Interpretando esto, el coeficiente de asimetría por lo


general se encuentra entre –3 y +3. En tal caso + 2.14
indica un grado importante de asimetría con sesgo
positivo. En apariencia unos cuantos pacientes
cancerosos permanecen en el hospital durante largo
tiempo, provocando que la media sea mayor que la
mediana o la moda.
CURTOSIS O APUNTAMIENTO
Hace referencia al apuntamiento de la distribución en
relación a un estándar, que es la distribución normal.

Este estándar es la distribución normal: distribución


mesocúrtica.

Si la distribución es más apuntada que la distribución


normal tenemos una distribución leptocúrtica.

Si la distribución es más achatada que la distribución


normal tenemos una distribución platicúrtica.
IMPORTANTE: Curtosis es independiente de la
variabilidad (en el sentido de “varianza”). Es decir, no es
que una distribución leptocúrtica tenga menos varianza
y por eso es más apuntada.

Una distribución leptocúrtica es muy apuntada en el


centro (más que la normal), decae muy rápidamente en
un primer momento, pero en los extremos es algo más
alta que la distribución normal.

Eso quiere decir que una distribución leptocúrtica es


más probable que ofrezca más valores extremos que la
distribución normal.
Índice de Curtosis:
Para una distribución normal (mesocúrtica) sabemos que:
n

 i
( X  X ) 4
n
i 1
4
3
s x

Y esta va a ser la referencia para el índice de Curtosis que


vamos a emplear:

( X i  X) 4
n
C r i 1
4
3
s x
Índice de Curtosis:

( X i  X) 4
n
C r i 1
4
3
s x

Si la distribución es normal (mesocúrtica), el índice vale 0


Si la distribución es leptocúrtica, el índice es superior a 0
Si la distribución es platicúrtica, el índice es inferior a 0
EJEMPLO: Se toma los pesos (Kg) de los 50 primeros
cachimbos del 2009:

PERSONAL

Linf Lsup fi xi fi * xi xi-X fi * (xi-X)^4


45 55 6 50 300 -19.4 849881.10
55 65 10 60 600 -9.4 78074.90
65 75 19 70 1330 0.6 2.46
75 85 11 80 880 10.6 138872.47
85 95 4 90 360 20.6 720325.64
TOTAL 50 3470 1787156.56
Hallando el coeficiente de CURTOSIS de los pesos de los
cachimbos:

X  69 .4  x  11.029

( X i  X ) 4
n
C r i 1
4
3
s x
Diagrama
c de Caja

“Una visión sin acción


es un sueño.
Una acción sin visión
es perdida de tiempo.
Una visión con acción
puede cambiar al
mundo”.

Joel Baker
Diagrama
c de Caja

“Una visión sin acción


es un sueño.
Una acción sin visión
es perdida de tiempo.
Una visión con acción
puede cambiar al
mundo”.

Joel Baker

También podría gustarte