Documentos de Académico
Documentos de Profesional
Documentos de Cultura
12 de agosto de 2014
12 de agosto de 2014
1 / 47
La informacion que proporcionan las variables debe presentarse de una manera adecuada. En el campo estadstico existen dos formas basicas de presentacion de la informacion siendo la primera las tablas o cuadros estadsticos y la segunda, la representaci
on grafica del fen
omeno.
12 de agosto de 2014
2 / 47
La informacion que proporcionan las variables debe presentarse de una manera adecuada. En el campo estadstico existen dos formas basicas de presentacion de la informacion siendo la primera las tablas o cuadros estadsticos y la segunda, la representaci
on grafica del fen
omeno.
la representacion mas usual del conjunto de datos que constituyen la muestra es la tabla de frecuencias; esta es un cuadro con ttulos y leyendas
explicativas, el cual simplifica la informaci
on.
12 de agosto de 2014
2 / 47
Caso 1: Una sola variable cuantitativa: Una forma de resumir la informacion es agrupandola en intervalos de clase por medio de tablas de
frecuencias.
La frecuencia de una medida o de una categora es el n
umero de veces que
esta aparece en una colecci
on de datos. Usualmente denotada por la letra
n.
12 de agosto de 2014
3 / 47
Caso 1: Una sola variable cuantitativa: Una forma de resumir la informacion es agrupandola en intervalos de clase por medio de tablas de
frecuencias.
La frecuencia de una medida o de una categora es el n
umero de veces que
esta aparece en una colecci
on de datos. Usualmente denotada por la letra
n.
La regla de Sturges es un metodo muy utilizado para agrupar los datos.
Para agrupar los datos por medio de esta regla, se deben realizar los siguientes calculos.
12 de agosto de 2014
3 / 47
Regla de Sturges
k = 1 + 3, 322 log(n) N
umero de clases o intervalos
A=
R
k
Xmax Xmn
k
12 de agosto de 2014
4 / 47
Ejemplo
12
21
24
27
32
43
63
12
21
24
27
32
44
63
14
21
25
28
33
46
68
14
22
25
28
38
47
69
15
22
25
28
38
49
69
18
22
25
30
42
50
72
19
23
27
30
42
51
72
19
23
27
31
43
51
72
12 de agosto de 2014
5 / 47
z
R = Xmax Xmn = 72 12 = 60
k = 1 + 3,322 log(63) = 6,977 7
R
= 8,57 9
k
Rango ampliado = k A = 63
A=
12 de agosto de 2014
6 / 47
Clase
[12 - 21)
[21 - 30)
[30 - 39)
[39 - 48)
[48 - 57)
[57 - 66)
[66 - 75]
Total
mi
16,5
25,5
34,5
43,5
52,5
61,5
70,5
ni
10
23
9
8
4
3
6
63
Ni
10
33
42
50
54
57
63
fi
15.87
36.51
14.29
12.70
6.35
4.76
9,52
100
Fi
15.87
52.38
66.67
79.37
85.72
90.48
100,00
12 de agosto de 2014
7 / 47
12 de agosto de 2014
8 / 47
12 de agosto de 2014
8 / 47
Tabla 1: Distribuci
on absoluta y porcentual de las defunciones ocurridas en la
ciudad de Medelln por sexo, 1987-1996.
Sexo
Hombre
Mujer
Total
Casos
101600
54080
155740
%
65,3
34,7
100,0
12 de agosto de 2014
9 / 47
Tabla 2: Distribuci
on absoluta y porcentual de las cinco primeras causas de
muerte. Medelln, 1987-1996
Causa
Ataques con armas de fuego y explosivos
Ataques con instrumentos cortante y punzante
Obstrucci
on cr
onica de vas respiratorias no clasificadas
Infarto agudo del miocardio
Accidente de tr
afico por vehculo automotor no especfico
Total
Casos
42792
5573
4625
13964
3206
70160
%
61,0
7,9
6,6
19,9
4,6
100,0
12 de agosto de 2014
10 / 47
Caso 4: Una o m
as variables cualitativas y otra cuantitativa: Si se desea
mostrar el comportamiento de las variables lesiones musculares graves y no
graves por sexo en categoras de la edad, < 30 a
nos, entre 30 y 50 a
nos y
> 50 a
nos, una forma de representarlo es la siguiente.
12 de agosto de 2014
11 / 47
12 de agosto de 2014
12 / 47
1,6
3,1
3,4
3,9
1,9
3,1
3,4
3,9
2,2
3,1
3,5
4,1
2,5
3,2
3,5
4,1
2,6
3,2
3,6
4,2
2,6
3,2
3,7
4,3
2,9
3,3
3,7
4,4
3,0
3,3
3,7
4,5
3,0
3,3
3,8
4,7
3,1
3,4
3,8
4,7
12 de agosto de 2014
13 / 47
Medidas de resumen
Medidas de resumen
12 de agosto de 2014
14 / 47
Medidas de resumen
12 de agosto de 2014
15 / 47
Medidas de resumen
1,6
3,1
3,4
3,9
1,9
3,1
3,4
3,9
2,2
3,1
3,5
4,1
2,5
3,2
3,5
4,1
2,6
3,2
3,6
4,2
2,6
3,2
3,7
4,3
2,9
3,3
3,7
4,4
3,0
3,3
3,7
4,5
3,0
3,3
3,8
4,7
3,1
3,4
3,8
4,7
12 de agosto de 2014
16 / 47
Medidas de resumen
Tabla 5: Distribuci
on de frecuencias de la vida de 40 bateras de automovil, en
a
nos.
Clase
[1,60-2,12)
[2,12-2,64)
[2,64-3,16)
[3,16-3,68)
[3,68-4,20)
[4,20-4,72]
Total
mi
1,86
2,38
2,90
3,42
3,94
4,46
ni
2
4
7
12
9
6
40
Ni
2
6
13
25
34
40
fi %
5
10
17.5
30
22.5
15
100
Fi
5
15
32.5
62.5
85
100
12 de agosto de 2014
17 / 47
Medidas de resumen
12 de agosto de 2014
18 / 47
Medidas de resumen
2) Promedio ponderado (
xpo ): se utiliza cuando se expresa en una sola
cifra los resultados de varios grupos de individuos
No agrupados
Agrupados
Pc
Pk
ni x i
i=1 mi ni
xpo = Pi=1
xpo = P
c
k
i=1 ni
i=1 ni
donde c es el n
umero de categoras de la variable.
Existen otras medidas de tendencia central como la media armonica,
media geometrica, promedio recortado, trimedia.
12 de agosto de 2014
19 / 47
Medidas de resumen
Medidas de posici
on
Medidas de posicion
12 de agosto de 2014
20 / 47
Medidas de resumen
Medidas de posici
on
No agrupados
(
Q1 =
x( n+1 )
4
x(Entero mas cercano a
, si
n+1
4
) , si
n+1
4
n+1
4
es entero,
no es entero.
Agrupados
Q1 = x0,25 = Li +
Ai ( n4 N(i1) )
,
ni
donde, Li = Lmite inferior del intervalo donde se encuentra el percentil buscado, Ai = Amplitud del intervalo donde se encuentra el percentil, N(i1) =
Frecuencia absoluta acumulada anterior a la del intervalo que contiene el
percentil buscado, y ni = Frecuencia absoluta del intervalo donde se encuentra el percentil.
12 de agosto de 2014
21 / 47
Medidas de resumen
Medidas de posici
on
6)
0,52( 40
4
7
= 2,94
12 de agosto de 2014
22 / 47
Medidas de resumen
Medidas de posici
on
x(3( n+1 ))
, si 3
4
x(Entero mas cercano a 3( n+1 )) , si 3
4
n+1
4
n+1
4
es entero,
no es entero.
Agrupados
Q3 = x0,75 = Li +
Ai (3( n4 )N(i1) )
ni
12 de agosto de 2014
23 / 47
Medidas de resumen
Medidas de posici
on
0,52(3( 40
25)
4 )
9
= 3,97
12 de agosto de 2014
24 / 47
Medidas de resumen
Medidas de posici
on
iii) Segundo cuartil (Q2 ) o mediana: Es aquel valor que deja al menos el
50 % de la informacion inferior o igual a el.
No agrupados
(
Q2 =
X( n ) +X( n +1)
2
X( n+1 )
2
, si n es par,
, si n es impar.
Agrupados
Q2 = x0,5 = Li +
Ai ( n2 N(i1) )
ni
12 de agosto de 2014
25 / 47
Medidas de resumen
Medidas de posici
on
X(21) = 3,4
0,52( 40
13)
2
12
= 3,46
12 de agosto de 2014
26 / 47
Medidas de resumen
Medidas de posici
on
12 de agosto de 2014
27 / 47
Medidas de resumen
Medidas de posici
on
0,52(12 7)
= 3,485
(2(12) 7 9)
12 de agosto de 2014
28 / 47
Medidas de resumen
Medidas de dispersi
on
Medidas de dispersion
Estas medidas permiten determinar que tan alejados estan los valores de la
variable de interes, con respecto a una medida de tendencia central.
Mostraremos alguna de estas medidas.
1) Rango (R): Es una medida de dispersi
on muy poco u
til, puesto que
solo depende de los valores extremos de la serie de datos y se deja
influenciar por estos.
R = Xmax Xmn ,
Para datos agrupados el rango se calcula como la diferencia entre el
lmite superior del u
ltimo intervalo y el lmite inferior del primer
intervalo.
12 de agosto de 2014
29 / 47
Medidas de resumen
Medidas de dispersi
on
Pn
x )2
i=1 (xi
n1
Agrupados
s2 =
Pk
x )2 ni
i=1 (mi
n1
12 de agosto de 2014
30 / 47
Medidas de resumen
Medidas de dispersi
on
4) Coeficiente de variaci
on (CV ): es una medida de dispersion u
til
para comparar dispersiones a escalas distintas
para datos no agrupados
Cv =
s
0,7028
=
100 % = 20,59 %
x
3,413
Tarea
Investigar todo lo relacionado con las medidas de forma.
Carlos Javier Barrera Causil. (Profesor asociado, Instituto
Formas de
Tecnol
presentar
ogico la
Metropolitano
informaci
on (ITM))
12 de agosto de 2014
31 / 47
Medidas de resumen
Medidas de dispersi
on
Metodos graficos
Los metodos graficos comprenden una herramienta importante para la
presentacion de la informaci
on y el analisis de datos.
12 de agosto de 2014
32 / 47
Medidas de resumen
Medidas de dispersi
on
Caso 1: Una variable cuantitativa: Los graficos de mayor uso son Histograma de frecuencias: Es un conjunto de rectangulos unidos de igual amplitud que se construyen tomando como bases, en el eje X los intervalos de
clase y como alturas, en el eje Y , las frecuencias absolutas o relativas de
cada uno de los intervalos. Los siguientes graficos son realizados haciendo
uso del siguiente ejemplo:
12 de agosto de 2014
33 / 47
Medidas de resumen
Medidas de dispersi
on
12 de agosto de 2014
34 / 47
Medidas de resumen
Figura 1:
Medidas de dispersi
on
Distribuci
on de frecuencias de la edad de los 682 pacientes en estudio.
12 de agosto de 2014
35 / 47
Medidas de resumen
Medidas de dispersi
on
Figura 2:
Distribuci
on de frecuencias de la edad de los 682 pacientes en estudio.
12 de agosto de 2014
36 / 47
Medidas de resumen
Medidas de dispersi
on
Polgono de frecuencias agrupado u ojiva: Es una representacion para variables cuantitativas que se construye teniendo en cuenta las frecuencias acumuladas. Esta se construye tomando sobre el eje X los lmites de los intervalos de clase y en el eje Y alturas iguales a las frecuencias absolutas
o relativas acumuladas, uniendo, luego, los puntos son una lnea poligonal
continua. Cuando los datos son discretos, la grafica debe ser escalonada y los
saltos ocurriran en los puntos donde la caracterstica asume sus respectivos
valores.
12 de agosto de 2014
37 / 47
Medidas de resumen
Figura 3:
Medidas de dispersi
on
Distribuci
on de frecuencias acumuladas de la edad de los 682 pacientes en estudio.
12 de agosto de 2014
38 / 47
Medidas de resumen
Medidas de dispersi
on
Caso 2: una sola variable cualitativa: Los graficos mas usados son los de
barras los cuales representan las frecuencias de clases nominales mediante
bandas proporcionales a dichas frecuencias. Se utiliza cuando la variable en
estudio es cualitativa.
Barras simples: Muestran el comportamiento de los valores de una sola
variable. Se representan mediante barras verticales u horizontales de igual
amplitud para cada categora y con alturas equivalentes a las frecuencias
absolutas o al porcentaje en cada categora. Formas
12 de agosto de 2014
39 / 47
Medidas de resumen
Figura 4:
Medidas de dispersi
on
Distribuci
on porcentual de los 682 pacientes con tumor, por tipo de tumor.
12 de agosto de 2014
40 / 47
Medidas de resumen
Medidas de dispersi
on
Grafico circular, de sectores o de pastel: Este grafico esta conformado por los
sectores de un crculo, con areas proporcionales a las frecuencias de clase.
Si f1 , f2 , . . . , fk son las frecuencias relativas para cada una de las categoras,
los grados que representan la porci
on del sector para la categora se calculan
o
como fi 360 .
Figura 5:
Distribuci
on porcentual de los tipos de tumor para los pacientes en estudio.
12 de agosto de 2014
41 / 47
Medidas de resumen
Medidas de dispersi
on
Figura 6:
Distribuci
on porcentual de los tipos de tumor para los pacientes en estudio, por sexo.
12 de agosto de 2014
42 / 47
Medidas de resumen
Medidas de dispersi
on
Barras apiladas: Sirven para mostrar el comportamiento de dos o mas variables cualitativas tomando como patr
on que los segmentos de las barras se
apilan unos sobre otros. Para cada categora de la variable existe una barra
apilada. Los segmentos al interior de cada barra representan frecuencias o
porcentajes de las categoras de las otras variables incluidas en el grafico.
Figura 7:
Distribuci
on porcentual de los tipos de tumor para los pacientes en estudio, por sexo.
12 de agosto de 2014
43 / 47
Medidas de resumen
Medidas de dispersi
on
Figura 8:
Distribuci
on porcentual de los casos de muerte por grupos de edad y sexo para el estudio en cuesti
on.
12 de agosto de 2014
44 / 47
Medidas de resumen
Medidas de dispersi
on
12 de agosto de 2014
45 / 47
Medidas de resumen
Medidas de dispersi
on
12 de agosto de 2014
46 / 47
Medidas de resumen
Figura 9:
Medidas de dispersi
on
12 de agosto de 2014
47 / 47