Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tabulaci
on y representaci
on
gr
afica de los datos
Resumen del tema
1.1. Introducci
on a la Estadstica
Estadstica: ciencia que se ocupa de recoger, clasificar, representar y resumir los datos de muestras, y de hacer inferencias (extraer conclusiones) acerca de las poblaciones de las que estas proceden.
1. Estadstica descriptiva: parte de la estadstica que se ocupa de recoger, clasificar, representar
y resumir los datos de las muestras.
2. Estadstica inferencial : parte de la estadstica que se ocupa de llegar a conclusiones (inferencias)
acerca de las poblaciones a partir de los datos de las muestras extradas de ellas.
CONCEPTOS GENERALES:
Poblaci
on: conjunto de individuos con propiedades comunes sobre los que se realiza una investigaci
on de tipo estadstico.
Muestra: subconjunto de la poblacion.
Tama
no muestral : n
umero de individuos que forman la muestra.
Muestreo: proceso de obtenci
on de muestras representativas de la poblacion.
Variable: propiedad o cualidad que puede manifestarse bajo dos o mas formas distintas en un
individuo de una poblaci
on.
Modalidades, categoras o clases: distintas formas en que se manifiesta una variable.
Las variables se clasifican en:
1. Cuantitativas: se expresan numericamente. Se clasifican en:
a) Discretas: toman valores numericos aislados, por lo que, fijados dos consecutivos, no
pueden tomar ning
un valor intermedio.
b) Continuas: pueden tomar cualquier valor dentro de unos lmites, por lo que entre
dos valores cualesquiera, por proximos que sean, siempre pueden encontrarse valores
intermedios.
2. Cualitativas: no se expresan numericamente. Se clasifican en:
a) Ordinales: admiten una ordenacion de menor a mayor aunque sus resultados no son
numericos.
b) Nominales: no admiten una ordenacion de menor a mayor.
1.2. Tabulaci
on de los datos
Los datos se agrupan en clases si son cualitativos o discretos, o en intervalos de clase (de igual
longitud, generalmente) si son continuos (o discretos con muchos valores distintos).
N
umero adecuado de intervalos: k = 1 + 30 322 log n, siendo n el n
umero total de datos. Si los
datos no est
an agrupados en intervalos, tambien denotaremos por k al n
umero de datos (o de
categoras) diferentes.
Amplitud del intervalo de clase (`i , `i+1 ]: di = `i+1 `i .
Marca de clase del intervalo (`i , `i+1 ]: xi =
`i + `i+1
.
2
fi
.
n
Fi
.
n
Distribuci
on de frecuencias: tabla conteniendo las distintas clases y las frecuencias correspondientes a cada una de ellas.
1.3. Representaciones gr
aficas
1. Variables cualitativas
a) Diagrama de barras: se sit
uan en el eje horizontal las clases y sobre cada una de ellas se
levanta un segmento rectilneo (o un rectangulo) de altura igual a la frecuencia (absoluta
o relativa) o al porcentaje de cada clase.
b) Gr
afico de sectores: se divide el area de un crculo en sectores circulares de angulos
proporcionales a las frecuencias absolutas de las clases.
2. Variables cuantitativas con datos no agrupados en intervalos
a) Diagrama de barras: se sit
uan en el eje horizontal los diferentes resultados de la variable
y sobre cada uno de ellos se levanta un segmento rectilneo de altura igual a la frecuencia
(absoluta o relativa) o al porcentaje de cada resultado.
b) Polgono de frecuencias: se sit
uan los puntos que resultan de tomar en el eje horizontal
los distintos valores de la variable y en el eje vertical sus correspondientes frecuencias (no
acumuladas), uniendo despues los puntos mediante segmentos rectilneos.
c) Gr
afico de frecuencias acumuladas: es la representacion grafica de las frecuencias acumuladas, para todo valor numerico. Siempre es una grafica en forma de escalera.
3. Variables cuantitativas con datos agrupados en intervalos
a) Histograma: se sit
uan en el eje horizontal los intervalos de clase y sobre cada uno se
levanta un rect
angulo de
area igual o proporcional a la frecuencia absoluta.
b) Polgono de frecuencias: se sit
uan los puntos que resultan de tomar en el eje horizontal
las marcas de clase de los intervalos y en el eje vertical sus correspondientes frecuencias
(no acumuladas), uniendo despues los puntos mediante segmentos rectilneos.
c) Gr
afico de frecuencias acumuladas: es la representacion grafica de las frecuencias acumuladas para todo valor numerico, teniendo en cuenta que dentro de cada intervalo de clase
se supone que el n
umero de observaciones se distribuye uniformemente. Siempre es un
polgono.
frances
frances
ingles
aleman
ingles
ingles
espa
nol
ingles
frances
espa
nol
ingles
espa
nol
ingles
frances
frances
frances
frances
espa
nol
espa
nol
alem
an
alem
an
frances
ruso
ingles
ruso
alem
an
alem
an
ingles
espa
nol
ingles
frances
ingles
frances
espa
nol
ingles
espa
nol
ingles
ingles
espa
nol
frances
a) Determinar la distribuci
on de frecuencias absolutas.
b) Determinar la distribuci
on de frecuencias relativas.
c) Determinar la distribuci
on de porcentajes.
Ejemplo 1.2. La tabla siguiente muestra el n
umero de palabras por lnea de 48 lneas escogidas al
azar entre todas las de un libro.
Tabla 1.2
14
7
9
12
13
10
12
11
3
12
13
13
13
13
11
10
7
14
13
13
12
11
14
11
13
13
10
12
11
12
12
5
13
4
11
9
12
12
13
12
11
10
15
13
13
13
9
15
a) Determinar la distribuci
on de frecuencias absolutas, frecuencias relativas y porcentajes.
b) Determinar la distribuci
on de frecuencias acumuladas absolutas.
c) Determinar la distribuci
on de frecuencias acumuladas relativas.
d) Determinar la distribuci
on de porcentajes acumulados.
Ejemplo 1.3. La tabla siguiente recoge los datos correspondientes a la puntuacion (de 0 a 10) de
una muestra de 25 alumnos en un test de catalogacion.
Tabla 1.3
30 9
40 1
20 5
10 1
10 9
50 0
60 3
70 3
20 5
10 2
40 2
80 1
20 4
60 5
30 3
30 2
50 1
40 9
10 9
10 8
10 6
20 7
10 6
50 2
40 4
Tabla 1.4
pas de
procedencia
Pases Bajos
Francia
Alemania
Gran Breta
na
EEUU
Rusia
Otros
suma
Computer
Abstracts
42
55
162
310
966
191
265
1.991
Lead
Abstracts
34
7
37
147
265
37
79
606
Sociological
Abstracts
22
76
14
24
552
42
239
969
Problemas propuestos
Problema 1.1. El gasto de una biblioteca, en euros, durante un a
no determinado, es:
Gasto en personal
Gasto en libros
Otros gastos
6.570
3.450
2.380
No de estantes
78
47
20
30
Determinar la distribuci
on de frecuencias relativas. Hacer un diagrama de barras de frecuencias
relativas y un gr
afico de sectores.
Problema 1.3. La estadstica de fotocopias de una biblioteca, durante un a
no determinado, es la
siguiente:
Reproducci
on de catalogos
Trabajo del personal de la biblioteca
Prestamo interbibliotecario
Copias para usuarios de la biblioteca
16.110
63.350
2.600
43.540
Determinar la distribuci
on de porcentajes. Hacer un diagrama de barras de porcentajes y un
grafico de sectores.
Problema 1.4. La estadstica de fotocopias de 4 bibliotecas (A, B, C y D), durante un a
no, est
a recogida en la siguiente tabla:
Reproducci
on de cat
alogos
Trabajo del personal de la biblioteca
Prestamo interbibliotecario
Copias para usuarios de la biblioteca
A
16.110
63.350
2.600
43.540
B
3.640
11.360
1.090
58.040
C
0
3.080
560
1.980
D
3.400
5.500
250
0
Sociologa
Economa
Poltica
Psicologa
1970
330
299
115
329
1980
414
393
357
452
1990
547
295
137
258
Problema 1.6. El n
umero de descriptores (keywords) de 72 artculos de investigacion viene dado
por:
No de descriptores
No de artculos
3
5
4
8
5
12
6
7
7
9
8
9
9
10
10
5
11
3
12
2
13
1
14
1
15
1
16
0
17
3
18
4
19
4
20
2
21
4
22
5
23
2
24
2
25
2
26
1
27
1
Determinar la distribuci
on de frecuencias relativas y hacer un polgono de frecuencias relativas.
Problema 1.8. El n
umero de palabras por lnea de una pagina de un libro viene dado por:
No de palabras
No de lneas
4
1
5
1
8
2
9
3
10
2
11
7
12
11
13
14
14
3
15
2
16
1
17
1
Determinar la distribuci
on de frecuencias acumuladas absolutas y hacer el grafico de frecuencias
acumuladas absolutas.
Problema 1.9. Los siguientes datos corresponden al n
umero de palabras por resumen de los artculos cientficos de autores espa
noles que han publicado en una determinada revista de investigacion durante un a
no concreto:
10
11
12
15
15
14
15
18
16
17
17
16
20
19
19
18
17
20
18
12
19
20
23
17
21
22
22
14
14
15
17
15
13
13
21
17
19
12
20
15
Determinar la distribuci
on de frecuencias absolutas, relativas, acumuladas absolutas y acumuladas relativas. Hacer un diagrama de barras de frecuencias absolutas, un polgono de
frecuencias relativas y un gr
afico de frecuencias acumuladas relativas.
Problema 1.10. Los siguientes datos agrupados en intervalos se refieren al n
umero de llamadas
telefonicas recibidas en el servicio de informacion de una biblioteca p
ublica durante 45 das
elegidos al azar:
No de llamadas
No de das
(9,15]
2
(15,21]
4
(21,27]
8
(27,33]
14
(33,39]
10
(39,45]
6
(45,51]
1
1.995
995
2.750
1.250
2.100
3.500
1.500
1.750
1.500
1.200
800
995
1.050
995
3.000
3.250
995
3.250
3.500
2.000
3.500
2.400
2.750
3.750
2.500
3.000
1.600
1.800
3.500
1.200
1.500
2.200
4.500
750
4.000
1.500
3.000
3.000
3.000
1.750
2.500
950
995
1.750
1.950
1.850
2.050
1.800
3.000
1.200
2.250
3.250
1.700
3.250
2.750
2.800
3.000
2.400
5.500
1.200
1.500
1.450
2.750
2.100
2.100
1.700
3.500
750
2.200
1.250
3.750
2.500
2.500
2.500
1.800
4.500
1.250
3.000
2.150
2.000
1.600
3.000
950
1.250
Aunque la variable es cuantitativa discreta, se desea agrupar los datos en intervalos de la misma
amplitud. A partir de esta agrupacion, determinar la distribucion de frecuencias y dibujar el
histograma, el polgono de frecuencias y el grafico de frecuencias acumuladas relativas.
fi
6570
3450
2380
12400
angulos
1900 74o
1000 16o
690 10o
3600 00o
fi
78
47
20
30
175
hi
0
0 4457
00 2686
00 1143
00 1714
10 0000
angulos
1600 452o
960 696o
410 148o
610 704o
3600 000o
fi
16110
63350
2600
43540
125600
%i
0
12 83
500 44
20 07
340 67
1000 00
angulos
460 188o
1810 584o
70 452o
1240 812o
3600 000o
10
Gr
afico de sectores: se divide el area de un crculo en sectores circulares de angulos iguales
a los que aparecen en la u
ltima columna de la tabla anterior.
Soluci
on del problema 1.4. Tenemos 4 variables estadsticas cualitativas nominales cuyas categoras son las mismas (Reproduccion de catalogos, Trabajo del personal de la biblioteca,
Prestamo interbibliotecario y Copias para usuarios de la biblioteca). Cada una de estas cuatro
variables es totalmente an
aloga a la variable definida en el problema anterior.
Categoras (Tipos de fotocopia)
Reproducci
on de cat
alogos
Trabajo del personal de la biblioteca
Prestamo interbibliotecario
Copias para usuarios de la biblioteca
A
fi
16 110
63 350
2 600
43 540
B
fi
3 640
11 360
1 090
58 040
C
fi
0
3 080
560
1 980
D
fi
3 400
5 500
250
0
Categoras (Areas
de investigacion)
Sociologa
Economa
Poltica
Psicologa
suma
1980
fi
hi
0
414 0 2562
393 00 2432
357 00 2209
452 00 2797
1 616 10 0000
1990
fi
hi
0
547 0 4422
295 00 2385
137 00 1108
258 00 2086
1 237 10 0000
3
5
4
8
5
12
6
7
7
9
8
9
9
10
10
5
11
3
12
2
13
1
14
1
11
xi
fi
hi
15
1
00 032
16
0
00 000
17
3
00 097
18
4
00 129
19
4
00 129
20
2
00 065
21
4
00 129
22
5
00 161
23
2
00 065
24
2
00 065
25
2
00 065
26
1
00 032
27
1
00 032
4
1
1
5
1
2
8
2
4
9
3
7
10
2
9
11
7
16
12
11
27
13
14
41
14
3
44
15
2
46
16
1
47
17
1
48
Gr
afico de frecuencias acumuladas absolutas: es la representacion grafica de las frecuencias
acumuladas absolutas, F , para todo valor numerico, x. Es una grafica en forma de escalera.
Soluci
on del problema 1.9. La variable estadstica es el n
umero de palabras por resumen. Es
cuantitativa discreta. Los individuos a los que se les observa la variable son los artculos
cientficos de autores espa
noles que han publicado en la determinada revista de investigaci
on
durante el determinado a
no.
xi
10
11
12
13
14
15
16
17
18
19
20
21
22
23
fi
1
1
3
2
3
6
2
6
3
4
4
2
2
1
hi
00 025
00 025
00 075
00 050
00 075
00 150
00 050
00 150
00 075
00 100
00 100
00 050
00 050
00 025
Fi
1
2
5
7
10
16
18
24
27
31
35
37
39
40
Hi
00 025
00 050
00 125
00 175
00 250
00 400
00 450
00 600
00 675
00 775
00 875
00 925
00 975
10 000
12
(`i , `i+1 ]
fi
xi
Fi
(9,15]
2
12
2
(15,21]
4
18
6
(21,27]
8
24
14
(27,33]
14
30
28
(33,39]
10
36
38
(39,45]
6
42
44
(45,51]
1
48
45
Histograma: se sit
uan en el eje horizontal los intervalos de clase, (`i , `i+1 ], y sobre cada
uno se levanta un rect
angulo de area proporcional a la frecuencia absoluta. Como los
intervalos tienen la misma amplitud, basta con hacer las alturas de los rectangulos iguales
a las frecuencias absolutas, fi .
Polgono de frecuencias: se sit
uan los puntos que resultan de tomar en el eje horizontal
las marcas de clase, xi , y en el eje vertical sus correspondientes frecuencias absolutas, fi ,
uniendo despues los puntos mediante segmentos rectilneos.
Gr
afico de frecuencias acumuladas absolutas: se sit
uan los puntos que resultan de tomar
en el eje horizontal los extremos superiores de los intervalos de clase, `i+1 , y en el eje vertical sus correspondientes frecuencias acumuladas absolutas, Fi , uniendo despues dichos
puntos mediante segmentos rectilneos.
Soluci
on del problema 1.11. La variable estadstica es el n
umero de socios de la biblioteca. Es
cuantitativa discreta. Los individuos a los que se les observa la variable son las bibliotecas
p
ublicas.
(`i , `i+1 ]
(675,1 375]
(1 375,2 075]
(2 075,2 775]
(2 775,3 475]
(3 475,4 175]
(4 175,4 875]
(4 875,5 575]
fi
19
22
18
14
8
2
1
xi
1 025
1 725
2 425
3 125
3 825
4 525
5 225
Hi
00 2262
00 4881
00 7024
00 8690
00 9643
00 9881
10 0000
Histograma: se sit
uan en el eje horizontal los intervalos de clase, (`i , `i+1 ], y sobre cada
uno se levanta un rect
angulo de area proporcional a la frecuencia absoluta. Como los
intervalos tienen la misma amplitud, basta con hacer las alturas de los rectangulos iguales
a las frecuencias absolutas, fi .
Polgono de frecuencias: se sit
uan los puntos que resultan de tomar en el eje horizontal
las marcas de clase, xi , y en el eje vertical sus correspondientes frecuencias absolutas, fi ,
uniendo despues los puntos mediante segmentos rectilneos.
Gr
afico de frecuencias acumuladas relativas: se sit
uan los puntos que resultan de tomar en
el eje horizontal los extremos superiores de los intervalos de clase, `i+1 , y en el eje vertical
sus correspondientes frecuencias acumuladas relativas, Hi , uniendo despues dichos puntos
mediante segmentos rectilneos.