Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ORGANIZACIN Y
PRESENTACIN DE DATOS
Contenido
II. ORGANIZACIN Y PRESENTACIN DE DATOS
II.1 Tablas de frecuencia
II.2 Grficos: histograma, ojiva, columna, barra, dispersin, etc.
II.3 Medidas de tendencia central
II.4 Medidas de dispersin
II.5 Medidas de posicin
Tablas de Frecuencia
Tablas de Frecuencia: Son tablas estadsticas que agrupan diversos valores de una
variable, simplificando los datos. Las tablas de frecuencias sirven para ordenar y
organizar los datos estadsticos.
Una tabla de frecuencias es una tabla en la que se organizan los datos en clases, es
decir, en grupos de valores que escriben una caracterstica de los datos y muestra el
nmero de observaciones del conjunto de datos que caen en cada una de las clases.
Exponen la informacin recogida en la muestra, de forma que no se pierda nada de
informacin (o poca).
Tablas Estadsticas:
Tablas tipo I:
Cuando el tamao de la muestra y el recorrido de la variable son pequeos, por
ejemplo si tenemos una muestra de las edades de 5 personas, por lo que no hay que
hacer nada especial simplemente anotarlas de manera ordenada en filas o columnas.
Edad de los 5 miembros de una familia:
5, 8, 16, 38, 45
Datos no agrupados
Elabor: M.T Csar Ojeda Betancourt
Introduccin : Presentaci
Presentacin ordenada de datos
Datos desordenados y ordenados en tablas
Variable: Gnero
Modalidades:
H = Hombre
M = Mujer
Gnero
Frec.
Frec. relat.
porcentaje
Hombre
4/10=0,4=40%
Mujer
6/10=0,6=60%
10=tamao
muestral
Muestra:
MHHMMHMMMH
equivale a
HHHH MMMMMM
Introduccin : Presentaci
Presentacin ordenada de datos
Gnero
Frec.
Hombre
Mujer
5
4
3
2
1
0
Hombre
Mujer
Tablas de Frecuencia
Tablas tipo II:
Cuando el tamao de la muestra es grande y el recorrido de la variable es pequeo, por
lo que hay valores de la variable que se repiten. Por ejemplo, si preguntamos el nmero
de personas activas que hay en 50 familias obtenemos la siguiente tabla:
Tablas de Frecuencia
Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo que
precisaremos una tabla en la que resumamos estos datos quedando la siguiente tabla:
Personas
Activas
Nmero de
Familias
16
20
Total
50
Datos agrupados
Tablas de Frecuencia
Tablas tipo III:
Cuando el tamao de la muestra y el recorrido de la variable son grandes, por lo que
ser necesario agrupar en intervalos los valores de la variable. Por ejemplo si a un grupo
de 30 alumnos les preguntamos el dinero que en ese momento llevan encima, nos
encontramos con los siguientes datos:
450
1152
250
300
175
80
25
2680
605
785
1595
2300
5000
1200
100
180
200
675
500
375
1500
205
985
185
125
315
425
560
1100
Tablas de Frecuencia
Nmero de intervalos (Nc): Cantidad de intervalos con los cuales se compone
una tabla de frecuencia.
[ Li-1 , Li )
Frecuencia
[ 5,505)
17
[ 505, 1005)
[ 1005,1505)
[ 1505, 2005)
[ 2005, 2505)
[ 2505, 3005)
[ 3005, 3505)
[ 3505, 4005)
[ 4005, 4505)
[ 4505, 5005)
Tablas de Frecuencia
Distintos Tipos de Frecuencia:
Uno de los primeros pasos que se realizan en cualquier estudio estadstico es la
tabulacin de resultados, es decir, recoger la informacin de la muestra resumida en una
tabla en la que a cada valor de la variable se le asocian determinados nmeros que
representan el nmero de veces que ha aparecido, su proporcin con respecto a otros
valores de la variable, etc.
Estos nmeros se denominan frecuencias: As tenemos los siguientes tipos de
frecuencia:
Frecuencia absoluta
Frecuencia relativa
Porcentaje
Frecuencia absoluta acumulada
Frecuencia relativa acumulada
Porcentaje acumulado
Tablas de Frecuencia
Frecuencia absoluta:
La frecuencia absoluta de una variable estadstica es el nmero de veces que aparece
en la muestra dicho valor de la variable, la representaremos por fi
Frecuencias absolutas: Contabilizan el nmero de individuos de cada modalidad
Frecuencia relativa:
La frecuencia absoluta, es una medida que est influida por el tamao de la muestra, al
aumentar el tamao de la muestra aumentar tambin el tamao de la frecuencia
absoluta. Esto hace que no sea una medida til para poder comparar. Para esto es
necesario introducir el concepto de frecuencia relativa, que es el cociente entre la
frecuencia absoluta y el tamao de la muestra. La denotaremos por hi
h = fi
i
N
Donde N = Tamao de la muestra
Tablas de Frecuencia
Porcentaje:
La frecuencia relativa es un tanto por uno, sin embargo, hoy da es bastante frecuente
hablar siempre en trminos de tantos por ciento o porcentajes, por lo que esta medida
resulta de multiplicar la frecuencia relativa por 100. La denotaremos por pi.
p = h 100%
i
i
Frecuencia Absoluta Acumulada:
Para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable
estadstica ha de ser cuantitativa o cualitativa ordenable. En otro caso no tiene mucho
sentido el clculo de esta frecuencia. La frecuencia absoluta acumulada de un valor de
la variable, es el nmero de veces que ha aparecido en la muestra un valor menor o
igual que el de la variable y lo representaremos por Fi.
Tablas de Frecuencia
Frecuencia Relativa Acumulada:
Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia
absoluta acumulada dividido por el tamao de la muestra, y la denotaremos por Hi
Hi = F i
N
Porcentaje Acumulado:
Anlogamente se define el Porcentaje Acumulado y lo vamos a denotar por Pi como
la frecuencia relativa acumulada por 100.
P = H i 100%
i
Tablas de Frecuencia
La distribucin de frecuencia es la representacin estructurada, en forma de
tabla, de toda la informacin que se ha recogido sobre la variable que se estudia.
Veamos esto con un ejemplo: Tomamos para ello los datos relativos a las
personas activas.
Personas
Activas
Nmero
Familias
Xi
fi
hi
pi
Fi
Hi
Pi
16
16/50
32%
16
16/50
32%
72%
20
20/50
40%
36
36/50
9/50
18%
45
45/50
90%
5/50
10%
50
50/50
100%
Total
50
Tablas de Frecuencia
Ejemplo
Nmero de hijos
Qu porcentaje de individuos
tiene 6 hijos o menos?
97,3%
0
1
2
3
4
5
6
7
Ocho+
Total
Frec.
419
255
375
215
127
54
24
23
17
1509
Porcent.
(vlido)
27,8
16,9
24,9
14,2
8,4
3,6
1,6
1,5
1,1
100,0
Porcent.
acum.
27,8
44,7
69,5
83,8
92,2
95,8
97,3
98,9
100,0
Grficos
Grficos Estadsticos: Son representaciones visuales que emplean smbolos,
barras, polgonos y sectores, de los datos contenidos en tablas de frecuencias.
Las representaciones grficas deben conseguir que un simple anlisis visual ofrezca
la mayor informacin posible. Segn el tipo del carcter que estemos estudiando,
usaremos una representacin grfica u otra.
Histograma: Grfica de barras que representa una distribucin de frecuencias de una
variable cuantitativa; y est integrado por lo siguientes componentes. En general se
requiere previamente el clculo de una tabla de frecuencia, y su posterior
representacin.
Un ttulo, que identifica la poblacin o la muestra de inters.
Una escala vertical, que identifica las frecuencias que hay en las diversas clases
Una escala horizontal, que identifica la variable x.
Grficos
Gr
Grfico de Sectores o Circulares
Este tipo de diagramas consideran una figura geomtrica en que la distribucin de
frecuencias se reparte dentro de la figura como puede ser una dona, pastel, crculo o
anillo, en el que cada porcin dentro de la figura representa la informacin porcentual
del total de datos.
Alumnos de Maestra
UNID
Maestra
Educacin
Informtica
Alumnos
Educacin
45
Informtica
12
Administracin
25
TOTAL
82
Administracin
Administracin, 25, 30%
Medidas Estadsticas
Posicin
Dispersin
Poblacin
Xi
Muestra
i =1
X=
X
i =1
n
Elabor: M.T Csar Ojeda Betancourt
9.3
8.8
9.0
10
8.5
9.2
8.9
9.1
9.4
8.2
8.7
10
Poblacin N
X
i =1
i
=
N
117.1
13
= 9.0076
Datos no agrupados
Elabor: M.T Csar Ojeda Betancourt
1110
1010
1070
1030
1000
1150
990
1090
1080
1150
1200
1050
1030
1120
1050
1030
1150
1230
1170
1180
1110
1160
1100
1100
1060
1130
1105
935
1210
30
X=
Xi
i= 1
30
32800
30
1093.33
Datos no agrupados
Elabor: M.T Csar Ojeda Betancourt
x=
x
i
= i
xi i
Mc
i i i
i= 1
Variable
Nc
fr. ac.
L0 L1
x1
n1
N1
L1 L2
x2
n2
N2
ni
Ni
...
Mci i
i= 1
fr.
Li-1 Li
Xi
n
Personas
Activas
Nmero de
Familias
16
20
Total
50
x=
x=
x=
i
103
50
= 2.06
FRECUENCIA
ABSOLUTA
FRECUENCIA
ABSOLUTA
ACUMULADA
Fi
FRECUENCIA
RELATIVA
Fi /n
FRECUENCIA
RELATIVA
ACUMULADA
FI /n
Mc
fi
(930-980]
955
1/30
1/30
(980-1030]
1005
7/30
8/30
(1030-1080]
1055
13
5/30
13/30
(1080-1130]
1105
21
8/30
21/30
(1130-1180]
1155
27
6/30
27/30
(1180-1230]
1205
30
3/30
30/30=1
INTERVALO
DE CLASE
30
30/30=1
Mc
i i i
= 1088.333
i= 1
32650
30
23.1
12.4
35.4
44
26.2
18.6
11
32
12.4
49.4
41.4
18.6
21
26.3
11.1
21.4
30.6
12.8
43.1
18.1
38.1
16.8
12.4
33.6
40.9
15.2
33.2
48.2
37
Media Aritmtica
Valor Mximo
Valor Mnimo
Nmero de Intervalos
Rango
Lm - Ls
Mc
Frecuencia Absoluta
Resultado 2:
Podemos ver claramente una diferencia entre ambas medias: 27,73 para los datos no
agrupados y 28,28 para los datos agrupados.
Esta diferencia radica que en la tabla tipo 3 existe una perdida de informacin, al
agrupar los datos en los intervalos de clase. El valor de la media exacta es el calculado
para los datos no agrupados, pero dada la proximidad de la media para los datos
agrupados, se tomar esta ltima como cierta.
Paso 1.- Ordenar de menor a mayor los valores xi del conjunto de datos
individuales, i = 1,2,,n
Paso 2.- Identificar si n es impar o par
x([ n +1]) / 2)
x% =
x( n / 2) + x( n / 2 +1)
2
x([ n +1]) / 2)
Me =
n = Impar
x( n / 2) + x( n / 2 +1)
n = Par
2
Donde X es la posicin de los nmeros y n es el nmero de elementos.
Datos no agrupados
Elabor: M.T Csar Ojeda Betancourt
Paso 1
Paso 2
X1
X2
X3
X4
X5
Paso 3
Me =
X6
X7
X8
X9
X10
X11
n = Impar
x([ n +1]) / 2)
Me = X ([11+1]/2) = X 6
Me = 3
Datos no agrupados
Elabor: M.T Csar Ojeda Betancourt
Paso 1
Paso 2
X1
X2
X3
X4
X5
X6
X7
Paso 3
X8
X9
X10
n = PAR
Me = X(n/2) + X ([n/2]+1)
2
Me = X(10/2) + X ([10/2]+1)
2
Me =
2+3 =
2
X5 + X6
5
2
Me = 2.5
Datos no agrupados
Elabor: M.T Csar Ojeda Betancourt
X2
X3
X4
X5
X6
X7
Mediana = X [(7+1)/2]
X4
fi
Fi
hi
pi
Hi
Pi
10
0.10417
10.4%
0.104167
10.4%
20
12
0.14583
14.6%
0.25
25.0%
30
10
22
0.20833
20.8%
0.458333
45.8%
40
13
35
0.27083
27.1%
0.729167
72.9%
50
10
45
0.20833
20.8%
0.9375
93.8%
60
47
0.04167
4.2%
0.979167
97.9%
70
48
0.02083
2.1%
100.0%
TOTAL
48
50%
100.0%
fi
Fi
Hi
pi
Hi
Pi
30
10
22
0.2083
20.8%
0.45833
45.8%
40
13
35
0.2708
27.1%
0.72916
72.9%
27.1% de
Diferencia
Entre el 30 y 40 hay una diferencia de 10, as como del 27.1% de los datos entre las
frecuencias relativas acumuladas.
Para llegar al 50% de los datos, debemos incrementar en 4,2% los datos partiendo
desde la clase 30.
50% - 45.8% = 4.2%
Qu valor entre el 30 y 40 representa el 50%? Si sabemos que en un rango de 10
existe 27.1%, cuanto representa 4.2% de esos 10?
Correcto!! = 1.55
Para llegar al 50% de los datos, necesitamos incrementar 1.55 a la clase 30 y as
obtener la mediana
Me = 31.55
Elabor: M.T Csar Ojeda Betancourt
Ls
Mc
fi
Fi
hi
pi
Hi
Pi
21.2
29.21
25.21
0.125
12.50%
0.125
12.50%
29.21
37.21
33.21
0.050
5.00%
0.175
17.50%
37.21
45.21
41.21
10
17
0.250
25.00%
0.425
42.50%
45.21
53.21
49.21
24
0.175
17.50%
0.600
60.00%
53.21
61.21
57.21
12
36
0.300
30.00%
0.900
90.00%
61.21
69.21
65.21
39
0.075
7.50%
0.975
97.50%
69.21
77.2
73.21
40
0.025
2.50%
1.000
100.00%
40
50%
100.00%
Entre 45.21 y 53.21 hay una diferencia de 8, as como del 17.5% de los datos entre
las frecuencias relativas acumuladas.
Para llegar al 50% de los datos, debemos incrementar en 7,5% los datos desde lmite
superior del tercer intervalo de clase.
50% - 42.5% = 7.5%
Elabor: M.T Csar Ojeda Betancourt
Para llegar al 50% de los datos, necesitamos incrementar 3.43 unidades a 45.21 y
as obtener la mediana
Me = 48.64
Calcular la mediana mediante frmula:
Me = L S-1 + A
Me = 45.21 + 8
50% Pi-1
(Pi Pi-1)
50% - 42.5%
(60% 42.5%)
Me = ?
L S-1 = 45.21
A =8
Pi = 60%
Pi-1 = 42.5
Me = 48.64
Para llegar al 50% de los datos, necesitamos incrementar 3.43 unidades a 45.21 y
as obtener la mediana
Me = 48.64
Calcular la mediana mediante frmula:
Me = L S-1 + A
50% Pi
(Pi Pi-1)
Ls
Mc
fi
10
10
12
11
12
14
13
5
20
Las marcas de clase que ms frecuencias tienen son 11 y 13, por tanto decimos que
es un caso donde aparecen dos modas (bimodal).
Mo1 = 11
Mo2 = 13
fi fi-1
(fi fi-1) + (fi fi+1)
Lm
Ls
Mc
fi
60
63
61.5
63
66
64.5
18
66
69
67.5
42
69
72
70.5
27
72
75
73.5
(42 18)
Mo = 66 + 3
(42 18)+(42+18)
27
Mo = 66 + 3
(42 18)+(42+18)
8
100
Mo = 67.846
fi fi-1
(fi fi-1) + (fi fi+1)
Lm
Ls
Mc
fi
60
63
61.5
63
66
64.5
18
66
69
67.5
42
69
72
70.5
27
72
75
73.5
(42 18)
Mo = 66 + 3
(42 18)+(42+18)
27
Mo = 66 + 3
(42 18)+(42+18)
8
100
Mo = 67.846