Está en la página 1de 50

Formas de presentar la informacion

Carlos Javier Barrera Causil.


1 Profesor

asociado, Instituto Tecnol


ogico Metropolitano (ITM)

12 de agosto de 2014

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

1 / 47

Formas de presentacion de la informacion

La informacion que proporcionan las variables debe presentarse de una manera adecuada. En el campo estadstico existen dos formas basicas de presentacion de la informacion siendo la primera las tablas o cuadros estadsticos y la segunda, la representaci
on grafica del fen
omeno.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

2 / 47

Formas de presentacion de la informacion

La informacion que proporcionan las variables debe presentarse de una manera adecuada. En el campo estadstico existen dos formas basicas de presentacion de la informacion siendo la primera las tablas o cuadros estadsticos y la segunda, la representaci
on grafica del fen
omeno.
la representacion mas usual del conjunto de datos que constituyen la muestra es la tabla de frecuencias; esta es un cuadro con ttulos y leyendas
explicativas, el cual simplifica la informaci
on.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

2 / 47

Formas de presentar la informacion para variables


cuantitativas y cualitativas usando tablas

Caso 1: Una sola variable cuantitativa: Una forma de resumir la informacion es agrupandola en intervalos de clase por medio de tablas de
frecuencias.
La frecuencia de una medida o de una categora es el n
umero de veces que
esta aparece en una colecci
on de datos. Usualmente denotada por la letra
n.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

3 / 47

Formas de presentar la informacion para variables


cuantitativas y cualitativas usando tablas

Caso 1: Una sola variable cuantitativa: Una forma de resumir la informacion es agrupandola en intervalos de clase por medio de tablas de
frecuencias.
La frecuencia de una medida o de una categora es el n
umero de veces que
esta aparece en una colecci
on de datos. Usualmente denotada por la letra
n.
La regla de Sturges es un metodo muy utilizado para agrupar los datos.
Para agrupar los datos por medio de esta regla, se deben realizar los siguientes calculos.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

3 / 47

Regla de Sturges

k = 1 + 3, 322 log(n) N
umero de clases o intervalos
A=

R
k

Xmax Xmn
k

Longitud del intervalo

Para completar la tabla de frecuencias calculamos:


ni = Frecuencias absolutas
Ni = Frecuencias absolutas acumuladas
fi = Frecuencias relativas
Fi = Frecuencias relativas acumuladas
mi = Marca de clase

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

4 / 47

Ejemplo

Consideremos los siguientes datos que corresponden a registros de edades


de 63 personas que fallecieron en la ciudad de Medelln por ataques con
armas de fuego y explosivos a principios del a
no 1987.
12
20
23
27
31
43
57

12
21
24
27
32
43
63

12
21
24
27
32
44
63

14
21
25
28
33
46
68

14
22
25
28
38
47
69

15
22
25
28
38
49
69

18
22
25
30
42
50
72

19
23
27
30
42
51
72

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

19
23
27
31
43
51
72

12 de agosto de 2014

5 / 47

z
R = Xmax Xmn = 72 12 = 60
k = 1 + 3,322 log(63) = 6,977 7
R
= 8,57 9
k
Rango ampliado = k A = 63
A=

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

6 / 47

Clase
[12 - 21)
[21 - 30)
[30 - 39)
[39 - 48)
[48 - 57)
[57 - 66)
[66 - 75]
Total

mi
16,5
25,5
34,5
43,5
52,5
61,5
70,5

ni
10
23
9
8
4
3
6
63

Ni
10
33
42
50
54
57
63

fi
15.87
36.51
14.29
12.70
6.35
4.76
9,52
100

Fi
15.87
52.38
66.67
79.37
85.72
90.48
100,00

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

7 / 47

Caso 2: Una sola variable cualitativa: Una forma de presentar la distribuci


on de frecuencias para este tipo de variable la podemos ver en el siguiente
ejemplo.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

8 / 47

Caso 2: Una sola variable cualitativa: Una forma de presentar la distribuci


on de frecuencias para este tipo de variable la podemos ver en el siguiente
ejemplo.
En el estudio realizado por Grisales y Agudelo, 1998, sobre la mortalidad
en Medelln entre 1987 y 1996, uno de los objetivos consista en mostrar la
distribucion porcentual por sexo de estas diferencias.
En la tabla 1, se muestra dicha distribuci
on.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

8 / 47

Tabla 1: Distribuci
on absoluta y porcentual de las defunciones ocurridas en la
ciudad de Medelln por sexo, 1987-1996.

Sexo
Hombre
Mujer
Total

Casos
101600
54080
155740

%
65,3
34,7
100,0

En el mismo estudio se mostr


o la distribuci
on de las cinco primeras causas
de muerte en el decenio. Esta informaci
on se muestra en la siguiente tabla.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

9 / 47

Tabla 2: Distribuci
on absoluta y porcentual de las cinco primeras causas de
muerte. Medelln, 1987-1996
Causa
Ataques con armas de fuego y explosivos
Ataques con instrumentos cortante y punzante
Obstrucci
on cr
onica de vas respiratorias no clasificadas
Infarto agudo del miocardio
Accidente de tr
afico por vehculo automotor no especfico
Total

Casos
42792
5573
4625
13964
3206
70160

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

%
61,0
7,9
6,6
19,9
4,6
100,0

12 de agosto de 2014

10 / 47

Caso 3: dos variables cualitativas:

Caso 4: Una o m
as variables cualitativas y otra cuantitativa: Si se desea
mostrar el comportamiento de las variables lesiones musculares graves y no
graves por sexo en categoras de la edad, < 30 a
nos, entre 30 y 50 a
nos y
> 50 a
nos, una forma de representarlo es la siguiente.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

11 / 47

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

12 / 47

Ejercicio: Para los datos correspondientes al tiempo de vida de 40 bateras


para automovil en a
nos, construir una tabla de frecuencias para datos agrupados e interpretar.
Tabla 3: Tiempo de vida de 40 bateras para automovil en a
nos

1,6
3,1
3,4
3,9

1,9
3,1
3,4
3,9

2,2
3,1
3,5
4,1

2,5
3,2
3,5
4,1

2,6
3,2
3,6
4,2

2,6
3,2
3,7
4,3

2,9
3,3
3,7
4,4

3,0
3,3
3,7
4,5

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

3,0
3,3
3,8
4,7

3,1
3,4
3,8
4,7

12 de agosto de 2014

13 / 47

Medidas de resumen

Medidas de resumen

Estas medidas permiten obtener valores que recojan la informacion de todos


los datos y permiten tener un panorama general de las caractersticas de
interes en una poblacion.
las medidas de resumen se clasifican en:
Tendencia central.
Posicion.
Dispersion
Forma.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

14 / 47

Medidas de resumen

Medidas de tendencia central

Medidas de tendencia central

Son aquellas que dan una informaci


on acerca del comportamiento de los
valores medios o centrales de la serie de datos.
Suponga que se tiene un conjunto de datos numericos de la forma x1 , x2 , . . . , xn ,
donde cada xi corresponde al i-esimo valor de la variable de interes.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

15 / 47

Medidas de resumen

Medidas de tendencia central

1) Media muestral o media aritm


etica (
x ): La media muestral de un
conjunto de observaciones x1 , x2 , . . . , xn esta dada por:
No agrupados
Agrupados
Pn
Pk
xi
m i ni
x = i=1
x = i=1
n
n
Ejemplo: Para ambos casos, realizaremos el ejemplo con los
siguientes datos.
Tabla 4: Tiempo de vida de 40 bateras para automovil en a
nos

1,6
3,1
3,4
3,9

1,9
3,1
3,4
3,9

2,2
3,1
3,5
4,1

2,5
3,2
3,5
4,1

2,6
3,2
3,6
4,2

2,6
3,2
3,7
4,3

2,9
3,3
3,7
4,4

3,0
3,3
3,7
4,5

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

3,0
3,3
3,8
4,7

3,1
3,4
3,8
4,7

12 de agosto de 2014

16 / 47

Medidas de resumen

Medidas de tendencia central

Tabla 5: Distribuci
on de frecuencias de la vida de 40 bateras de automovil, en
a
nos.

Clase
[1,60-2,12)
[2,12-2,64)
[2,64-3,16)
[3,16-3,68)
[3,68-4,20)
[4,20-4,72]
Total

mi
1,86
2,38
2,90
3,42
3,94
4,46

ni
2
4
7
12
9
6
40

Ni
2
6
13
25
34
40

fi %
5
10
17.5
30
22.5
15
100

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

Fi
5
15
32.5
62.5
85
100

12 de agosto de 2014

17 / 47

Medidas de resumen

Medidas de tendencia central

para los datos no agrupados tenemos que:


P40
xi
1,6 + 1,9 + 2,2 + + 4,7
x = i=1 =
= 3,413
n
40
para los datos agrupados tenemos lo siguiente:
P6
mi ni
1,86(2) + 2,38(4) + + 4,46(6)
x = i=1
=
= 3,42
n
40

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

18 / 47

Medidas de resumen

Medidas de tendencia central

2) Promedio ponderado (
xpo ): se utiliza cuando se expresa en una sola
cifra los resultados de varios grupos de individuos
No agrupados
Agrupados
Pc
Pk
ni x i
i=1 mi ni
xpo = Pi=1
xpo = P
c
k
i=1 ni
i=1 ni
donde c es el n
umero de categoras de la variable.
Existen otras medidas de tendencia central como la media armonica,
media geometrica, promedio recortado, trimedia.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

19 / 47

Medidas de resumen

Medidas de posici
on

Medidas de posicion

Estas medidas permiten determinar la posici


on que ocupa un determinado
valor de la variable de interes con respecto a los valores menores o iguales
a este.
1) Percentiles: Son valores que dividen la serie de datos en 100 partes
porcentualmente iguales.
2) Deciles: Son valores que dividen la serie de datos en 10 partes
porcentualmente iguales.
3) Cuartiles: Dividen la serie de datos en 4 partes porcentualmente
iguales.
i) Primer Cuartil (Q1 ): Es aquel valor que deja al menos el 25 % de la
informaci
on inferior o igual a el.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

20 / 47

Medidas de resumen

Medidas de posici
on

No agrupados
(
Q1 =

x( n+1 )
4
x(Entero mas cercano a

, si
n+1
4

) , si

n+1
4
n+1
4

es entero,
no es entero.

Agrupados
Q1 = x0,25 = Li +

Ai ( n4 N(i1) )
,
ni

donde, Li = Lmite inferior del intervalo donde se encuentra el percentil buscado, Ai = Amplitud del intervalo donde se encuentra el percentil, N(i1) =
Frecuencia absoluta acumulada anterior a la del intervalo que contiene el
percentil buscado, y ni = Frecuencia absoluta del intervalo donde se encuentra el percentil.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

21 / 47

Medidas de resumen

Medidas de posici
on

Retomando el ejemplo anterior, tenemos que:


Para datos no agrupados
Q1 lo podemos obtener como sigue:
40 + 1
Como
= 10,25 no es entero, entonces Q1 = X10 = 3,1
4
Para datos agrupados
Ai ( n4 N(i1) )
Q1 = x0,25 = Li +
= 2,64 +
ni

6)
0,52( 40
4
7

= 2,94

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

22 / 47

Medidas de resumen

Medidas de posici
on

ii) Tercer cuartil (Q3 ): Es aquel valor que deja al menos el 75 % de la


informacion inferior o igual a el.
No agrupados
(
Q3 =

x(3( n+1 ))
, si 3
4
x(Entero mas cercano a 3( n+1 )) , si 3
4

n+1
4

n+1
4

es entero,
no es entero.

Agrupados
Q3 = x0,75 = Li +

Ai (3( n4 )N(i1) )
ni

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

23 / 47

Medidas de resumen

Medidas de posici
on

Ahora, calculando el cuartil 3 para el ejemplo anterior, tenemos:


Para datos
 no agrupados

40 + 1
Como 3
= 30,75 no es entero, entonces Q3 = X31 = 3,9
4
Para datos agrupados
Ai (3( n4 )N(i1) )
Q3 = x0,75 = Li +
= 3,68 +
ni

0,52(3( 40
25)
4 )
9

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

= 3,97

12 de agosto de 2014

24 / 47

Medidas de resumen

Medidas de posici
on

iii) Segundo cuartil (Q2 ) o mediana: Es aquel valor que deja al menos el
50 % de la informacion inferior o igual a el.
No agrupados
(
Q2 =

X( n ) +X( n +1)
2

X( n+1 )
2

, si n es par,
, si n es impar.

Agrupados
Q2 = x0,5 = Li +

Ai ( n2 N(i1) )
ni

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

25 / 47

Medidas de resumen

Medidas de posici
on

El calculo de la mediana para nuestros datos lo tenemos como sigue:


Para datos no agrupados
X

Como n es par, entonces,

( 402 ) +X( 402 +1)


2

Para datos agrupados


Ai ( n2 N(i1) )
Q2 = x0,5 = Li +
= 3,16 +
ni

X(21) = 3,4

0,52( 40
13)
2
12

= 3,46

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

26 / 47

Medidas de resumen

Medidas de posici
on

1) Moda (Mo ): Para datos no agrupados, la moda es el valor que mas


se repite en un conjunto de datos.
Para nuestros datos, Mo = 3,1.
Una serie de datos puede ser unimodal, bimodal, trimodal, etc.
Para datos agrupados, la moda es la marca de clase correspondiente
al intervalo de mayor frecuencia o

Ai ni n(i1)
,
Mo = Li +
2ni n(i1) n(i+1)

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

27 / 47

Medidas de resumen

Medidas de posici
on

donde, li = Lmite inferior del intervalo que contiene a la moda o a la


frecuencia mas alta, Ai = Amplitud de dicho intervalo, ni = Frecuencia
absoluta del intervalo donde se encuentra la moda, n(i1) = Frecuencia
absoluta anterior a la del intervalo donde se encuentra la moda, y n(i+1) =
Frecuencia absoluta posterior a la del intervalo donde se encuentra la moda.
Para nuestro ejemplo,
Mo = 3,16 +

0,52(12 7)
= 3,485
(2(12) 7 9)

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

28 / 47

Medidas de resumen

Medidas de dispersi
on

Medidas de dispersion

Estas medidas permiten determinar que tan alejados estan los valores de la
variable de interes, con respecto a una medida de tendencia central.
Mostraremos alguna de estas medidas.
1) Rango (R): Es una medida de dispersi
on muy poco u
til, puesto que
solo depende de los valores extremos de la serie de datos y se deja
influenciar por estos.
R = Xmax Xmn ,
Para datos agrupados el rango se calcula como la diferencia entre el
lmite superior del u
ltimo intervalo y el lmite inferior del primer
intervalo.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

29 / 47

Medidas de resumen

Medidas de dispersi
on

2) Rango intercuartil (IQR): El rango intercuartil permite determinar


que tan disperso se encuentra el cincuenta por ciento de la
informacion mas central.
IQR = Q3 Q1
3) Varianza (s 2 ): Numericamente, la varianza es la desviacion
cuadratica media de los datos con respecto a la media aritmetica.
No agrupados
s2 =

Pn

x )2
i=1 (xi
n1

Agrupados
s2 =

Pk

x )2 ni
i=1 (mi
n1

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

30 / 47

Medidas de resumen

Medidas de dispersi
on

Para nuestro ejemplo, para datos no agrupados


S 2 = 0,4939 y S = 0,7028
para datos agrupados
S 2 = 0,5131 y S = 0,7163

4) Coeficiente de variaci
on (CV ): es una medida de dispersion u
til
para comparar dispersiones a escalas distintas
para datos no agrupados
Cv =

s
0,7028
=
100 % = 20,59 %
x
3,413

Tarea
Investigar todo lo relacionado con las medidas de forma.
Carlos Javier Barrera Causil. (Profesor asociado, Instituto
Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

31 / 47

Medidas de resumen

Medidas de dispersi
on

Formas de presentar la informacion por medio de graficos

Metodos graficos
Los metodos graficos comprenden una herramienta importante para la
presentacion de la informaci
on y el analisis de datos.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

32 / 47

Medidas de resumen

Medidas de dispersi
on

Caso 1: Una variable cuantitativa: Los graficos de mayor uso son Histograma de frecuencias: Es un conjunto de rectangulos unidos de igual amplitud que se construyen tomando como bases, en el eje X los intervalos de
clase y como alturas, en el eje Y , las frecuencias absolutas o relativas de
cada uno de los intervalos. Los siguientes graficos son realizados haciendo
uso del siguiente ejemplo:

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

33 / 47

Medidas de resumen

Medidas de dispersi
on

El Registro de Cancer de Bombay obtiene datos de todos los pacientes


con cancer registrados en los 168 hospitales gubernamentales, privados y
residencias de ancianos en Bombay, ademas, tiene los registros de muerte
de la Corporacion Municipal de Bombay.
Los tiempos de supervivencia de cada sujeto con cancer de pulmon desde
la primera vez que se dio el diagn
ostico hasta la muerte (o censura) se
registraron durante el perodo comprendido entre el 1 de enero de 1989 a
diciembre de 1991.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

34 / 47

Medidas de resumen

Figura 1:

Medidas de dispersi
on

Distribuci
on de frecuencias de la edad de los 682 pacientes en estudio.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

35 / 47

Medidas de resumen

Medidas de dispersi
on

Polgono de frecuencias: Se utiliza cuando la variable objeto de estudio es


de naturaleza cuantitativa y esta dada en intervalos de clase. Se construye
tomando sobre el eje X las marcas de clase y sobre el eje Y las frecuencias
absolutas o relativas y luego uniendo cada punto (mi , ni ) con una lnea
poligonal continua.

Figura 2:

Distribuci
on de frecuencias de la edad de los 682 pacientes en estudio.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

36 / 47

Medidas de resumen

Medidas de dispersi
on

Polgono de frecuencias agrupado u ojiva: Es una representacion para variables cuantitativas que se construye teniendo en cuenta las frecuencias acumuladas. Esta se construye tomando sobre el eje X los lmites de los intervalos de clase y en el eje Y alturas iguales a las frecuencias absolutas
o relativas acumuladas, uniendo, luego, los puntos son una lnea poligonal
continua. Cuando los datos son discretos, la grafica debe ser escalonada y los
saltos ocurriran en los puntos donde la caracterstica asume sus respectivos
valores.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

37 / 47

Medidas de resumen

Figura 3:

Medidas de dispersi
on

Distribuci
on de frecuencias acumuladas de la edad de los 682 pacientes en estudio.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

38 / 47

Medidas de resumen

Medidas de dispersi
on

Caso 2: una sola variable cualitativa: Los graficos mas usados son los de
barras los cuales representan las frecuencias de clases nominales mediante
bandas proporcionales a dichas frecuencias. Se utiliza cuando la variable en
estudio es cualitativa.
Barras simples: Muestran el comportamiento de los valores de una sola
variable. Se representan mediante barras verticales u horizontales de igual
amplitud para cada categora y con alturas equivalentes a las frecuencias
absolutas o al porcentaje en cada categora. Formas

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

39 / 47

Medidas de resumen

Figura 4:

Medidas de dispersi
on

Distribuci
on porcentual de los 682 pacientes con tumor, por tipo de tumor.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

40 / 47

Medidas de resumen

Medidas de dispersi
on

Grafico circular, de sectores o de pastel: Este grafico esta conformado por los
sectores de un crculo, con areas proporcionales a las frecuencias de clase.
Si f1 , f2 , . . . , fk son las frecuencias relativas para cada una de las categoras,
los grados que representan la porci
on del sector para la categora se calculan
o
como fi 360 .

Figura 5:

Distribuci
on porcentual de los tipos de tumor para los pacientes en estudio.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

41 / 47

Medidas de resumen

Medidas de dispersi
on

Caso 3: dos variables cualitativas:


Barras compuestas: Muestran el comportamiento de dos o mas variables de
naturaleza cualitativa. tambien se les llama grafico de barras cruzadas.

Figura 6:

Distribuci
on porcentual de los tipos de tumor para los pacientes en estudio, por sexo.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

42 / 47

Medidas de resumen

Medidas de dispersi
on

Barras apiladas: Sirven para mostrar el comportamiento de dos o mas variables cualitativas tomando como patr
on que los segmentos de las barras se
apilan unos sobre otros. Para cada categora de la variable existe una barra
apilada. Los segmentos al interior de cada barra representan frecuencias o
porcentajes de las categoras de las otras variables incluidas en el grafico.

Figura 7:

Distribuci
on porcentual de los tipos de tumor para los pacientes en estudio, por sexo.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

43 / 47

Medidas de resumen

Medidas de dispersi
on

Caso 4: una variable cualitativa con una cuantitativa categorizada:La


representacion grafica, en esta situaci
on, es similar a la expuesta en el caso
anterior.

Figura 8:

Distribuci
on porcentual de los casos de muerte por grupos de edad y sexo para el estudio en cuesti
on.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

44 / 47

Medidas de resumen

Medidas de dispersi
on

Diagrama de caja o boxplot

El boxplot es un grafico en forma de rectangulo, basado en los cuartiles,


mediante el cual se visualiza un conjunto de datos y proporciona informacion
sobre los valores mnimo y maximo, los cuartiles Q1 , Q2 y Q3 , y sobre la
existencia de valores atpicos y la simetra de la distribucion.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

45 / 47

Medidas de resumen

Medidas de dispersi
on

Pasos para su construcci


on:
ordenar los datos y obtener el valor mnimo, el maximo, los cuartiles
Q1 , Q2 y Q3 y el rango intercuartil (IQR)
dibujar los bigotes, las lneas que se extienden desde la caja, para esto
hay que calcular los lmites superior e inferior, Li y Ls , con el fin de
identificar los valores atpicos.
Li = Q1 1,5(IQR)
Ls = Q3 + 1,5(IQR)
los valores que se encuentren por fuera de estos lmites seran
marcados como atpicos.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

46 / 47

Medidas de resumen

Figura 9:

Medidas de dispersi
on

boxplot del tiempo de supervivencia versus tipo de tumor por sexo.

Carlos Javier Barrera Causil. (Profesor asociado, Instituto


Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))

12 de agosto de 2014

47 / 47

También podría gustarte