Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Tabla de Sitribucion de Frecuencias
Tabla de Sitribucion de Frecuencias
Introduccin
Hoy en da, la interpretacin de las investigaciones cientficas en
las diversas disciplinas del quehacer humano depende en gran
parte de los mtodos estadsticos. As, la Estadstica nos proporciona mtodos grficos y tabulares para organizar y resumir datos,
para luego usar dicha informacin y sacar conclusiones.
La importancia de tratar estos temas radica en que siempre
que se aborde un problema desde el punto de vista de la Estadstica, con el fin de hacer generalizaciones e inferencias sobre la poblacin, ser necesario tomar como base muestras de la poblacin
en estudio y describirlas. Los primeros pasos del proceso son la
organizacin y el resumen de los datos. El resumen de los datos
puede hacerse numrica y grficamente.
En el enfoque clsico, tanto la representacin tabular y grfica
de los datos asociados a las diferentes variables nos son familiares
las tablas de frecuencias: absolutas, relativas y acumuladas; y los
grficos: histograma, polgono de frecuencia, barras, sectores, de
lnea, etc., que lo encontramos cotidianamente en los libros, revistas y peridicos. Mientras que, segn el enfoque del anlisis
exploratorio de datos, se tienen los diagramas de tallo y hojas,
grficos de cajas, de resumen, etc.
En el presente captulo se examinarn mtodos descriptivos
grficos y tabulares bajo los dos enfoques mencionados.
[63]
02_cap2.p65
63
63
Conceptos fundamentales
Frecuencia absoluta ( f i ) . Es el nmero de veces que se repite un
valor ( xi ) o una modalidad de una variable X .
La suma de todas las frecuencias absolutas es igual al nmero
de observaciones o al tamao de la muestra, es decir:
k
f
i =1
= n, i = 1,..., k
hi =
fi
.
n
h =1,
i =1
( f + f + ... + f k ) = n = 1.
f1 f 2
f
+ + ... + k = 1 2
n n
n
n
n
64
02_cap2.p65
64
F1 = f1
F2 = f1 + f 2
.
.
.
Fk = f1 + f 2 + ... + f k
La ltima frecuencia acumulada es igual al nmero total de
observaciones o tamao de la muestra:
Fk = n.
Frecuencia relativa acumulada. Es el resultado de cada frecuencia
absoluta acumulada dividida entre el nmero total de observaciones, o la suma de las frecuencias relativas menor o igual al valor
considerado de la variable:
Hi =
i
Fi
= h j i = 1,..., k .
n j =1
65
02_cap2.p65
65
66
02_cap2.p65
66
X
x1 , x2 ,..., xn
n
R
k
Variable
Valores observados de la variable
Tamao de la muestra
Rango
k [5, 20]
a=
R
k
i = 1, 2,..., k
I1 = [ xmin , x min + a ) = [L0 , L1 )
I 2 = [ xmin + a , xmin + 2 a ) = [ L1 , L2 )
Ii
I k = [ xmin + ( k 1) a , xmin + ka ) = [ Lk 1 , Lk )
'
xi
xi' =
( Li1 + Li )
2
67
02_cap2.p65
67
Ejemplo 1
Se seleccion una muestra de 30 alumnos del doctorado de la Facultad de Educacin de la Universidad Nacional Mayor de San
Marcos y se registr el nmero de hijos de cada alumno, como se
muestra a continuacin:
N
1
2
3
4
5
6
N de
hijos
1
1
0
2
2
2
N de
hijos
1
0
5
2
1
2
7
8
9
10
11
12
N
13
14
15
16
17
18
N de
hijos
2
1
5
4
5
2
N
19
20
21
22
23
24
N de
hijos
1
4
1
2
1
4
N
25
26
27
28
29
30
N de
hijos
2
2
1
1
2
1
Solucin
Variable de inters X : nmero de hijos
Tipo de variable: cuantitativa discreta
Mximo valor = 5 y mnimo valor =0
Rango R = 5 0 = 5
Como el rango es pequeo, se trabaja con los valores originales
de la variable: 0, 1, 2, 4, 5; no necesitamos usar intervalos de clase.
Procedemos a la tabulacin, considerando la primera columna para los posibles valores de la variable, la segunda columna
para las frecuencias absolutas f i obtenidas mediante el conteo del
nmero de veces que se repite cada valor de la variable y las otras
columnas para los diferentes tipos de frecuencias: hi , Fi , H i , hi %
y H i % definidas y estudiadas en la seccin: conceptos fundamentales.
68
02_cap2.p65
68
fi
hi
Fi
Hi
hi %
0
1
2
4
5
Total
2
11
11
3
3
30
0,06
0,37
0,37
0,10
0,10
1,00
2
13
24
27
30
0,06
0,43
0,80
0,90
1,00
6
37
37
10
10
100
Hi %
6
43
80
90
100
Procedemos a interpretar algunas de las frecuencias. Observando las columnas de las frecuencias absolutas ( f i ), vemos que
ningn estudiante de doctorado tiene 3 hijos y que el nmero de
hijos se concentra alrededor de 1 y 2 hijos debido a que, de los 30
estudiantes de doctorado, 11 tienen 1 hijo y otros 11 tienen 2 hijos,
as como que dos estudiantes considerados en la muestra no tienen ningn hijo.
Observando la columna de las frecuencias relativas expresadas en porcentaje ( hi % ), el 10% de los estudiantes considerados
en la muestra tiene 4 hijos y el 37 % tiene 2 hijos.
Observando la columna de la frecuencia absoluta acumulada
( Fi ), vemos que 27 de los 30 estudiantes tiene, como mximo, 4
hijos, que es lo mismo que decir que 27 estudiantes tienen 4 hijos o
menos.
Observando la columna de la frecuencia relativa acumulada
expresada en porcentaje ( H i % ) vemos que el 80% de los estudiantes considerados en la muestra tiene, como mximo 2 hijos, es decir
que el 80% de los estudiantes tienen 2 hijos o menos.
El hecho de tener los datos organizados en una tabla de distribucin de frecuencias nos da una idea del comportamiento de los
datos y adems nos permite responder rpidamente a cualquier
pregunta respecto al conteo de los diferentes valores que asume la
variable, como por ejemplo:
Cuntos estudiantes de doctorado tienen 5 hijos?. Mirando la columna de las fi inmediatamente contestamos 3.
69
02_cap2.p65
69
Ejemplo 2
De la base DATOS4-ciudadana, elijamos la variable X 5 : nmero
de organizaciones sociales cercanas al domicilio de los representantes, para presentar su distribucin de frecuencias usando el
software SPSS.
Usando los comandos del SPSS presentados en el captulo VII
(procedimientos estadsticos) se lee en el output del SPSS la siguiente distribucin de frecuencias del nmero de organizaciones
sociales cercanas al domicilio del representante de la comunidad.
NMERO DE ORGANIZACIONES SOCIALES
CERCANAS AL DOMICILIO
Valid Percent
Cumulative Percent
Valid 1
Frequency
10
10,0
10,0
10,0
27
27,0
27,0
37,0
37
37,0
37,0
74,0
21
21,0
21,0
95,0
5,0
5,0
100,0
100
100,0
100,0
Total
Percent
70
02_cap2.p65
70
cercanas a su domicilio. Pero en algunos casos las frecuencias absolutas por s solas no nos dan una informacin clara, pudiendo
causar confusin, sobre todo cuando se desea hacer comparaciones. Por el ejemplo anterior sabemos que hay 21 representantes
distritales de la sierra sur-centro que tienen 4 organizaciones sociales cercanas a su domicilio. Pero si nos dicen que en la sierra
norte tambin hay 21 representantes distritales que tienen 4 organizaciones sociales cercanas a su domicilio, pensaremos que el
fenmeno se repite en los dos grupos de los distritos rurales de la
sierra sur-centro y norte del Per?
Lgicamente, depender del nmero de representantes de cada
distrito; por poner un ejemplo, 21 casos en 100 describe un comportamiento diferente a 21 casos en 200. En este caso necesitaremos de una frecuencia relativa para hacer comparaciones.
Observamos que h2 = 0, 27 es la frecuencia relativa que corresponde a x2 , expresado en porcentaje quiere decir que el 27 %
de los representantes distritales de la sierra sur-centro del Per
tiene 2 organizaciones sociales cercanas a su domicilio.
As, F4 = 95 se obtiene sumando
f1 + f 2 + f 3 + f 4 = 10 + 27 + 37 + 21 = 95
y se interpreta como 95 representantes distritales tienen 4 o
menos organizaciones sociales cercanas a su domicilio y
H 3 % = 74% se obtiene sumando H 3 % = h1 % + h2 % + h3 % y
se interpreta que el 74% de los representantes distritales tienen 3 o
menos organizaciones cercanas a su domicilio. Tambin se puede
obtener de la siguiente manera:
F
74
H 3 % = 3 100% =
100% = 74%
100
n
La salida del SPSS mostrndonos la distribucin de las diferentes frecuencias puede ser presentada en un cuadro estadstico.
71
02_cap2.p65
71
Nmero de
representantes
distritales
10
27
37
21
5
100
Porcentaje de
representantes
distritales (%)
10
27
37
21
5
100
Ejemplo 3
Los siguientes datos corresponden a las aportaciones que hicieron
al Sistema Nacional de Pensiones 100 docentes universitarios pertenecientes a la Ley 20530, en el mes de enero del presente ao. Los
datos estn expresados en nuevos soles.
265 197 349 280 265 200 221 265 261 278 205 286 317 242 254 235 174
262 248 250 263 274 242 260 281 246 248 271 260 265 307 243 258 321
294 328 263 245 274 270 220 231 276 228 223 296 231 301 337 298 268
267 300 250 260 276 334 280 250 257 260 281 208 299 308 264 280 274
278 210 234 265 187 258 235 269 265 253 254 280 299 214 264 267 283
235 272 287 274 269 215 318 271 293 277 290 283 258 275 251
Solucin
Variable X
: Aportaciones en nuevos soles
Tipo de variable: Cuantitativa continua
72
02_cap2.p65
72
k = 1 + 3,3log10(100) = 7,6
k =8
Amplitud de cada intervalo: a = 175 / 8 = 21,875
a = 22
Lmites de los intervalos de clase:
I 1 = [174, 174 + 22) = [174,196)
I 2 = [196, 196+ 22) = [196, 218)
I 3 = [218, 218 + 22) = [218, 240)
M
I 8 =[328, 328 + 22) = [ 328, 350)
Marca de clase o punto medio de cada intervalo:
174 + 196
= 185
2
196 + 218
x2' =
= 207
2
218 + 240
x3' =
= 229
2
.
.
.
328 + 350
x8' =
= 339
2
x1' =
73
02_cap2.p65
73
fi
hi
Fi
Hi
hi %
185
207
229
251
273
295
317
339
2
7
10
23
38
11
5
4
100
0,02
0,07
0,10
0,23
0,38
0,11
0,05
0,04
1,00
2
9
19
42
80
91
96
100
0,02
0,09
0,19
0,42
0,80
0,91
0,96
1,00
2
7
10
23
38
11
5
4
100
xi
[174 196)
[196- 218)
[218 240)
[240 262)
[262 284)
[284 306)
[306 328)
[328 350)
Total
Hi %
2
9
19
42
80
91
96
100
74
02_cap2.p65
74
a = 22 f3 = 10 docentes
a = 10 x docentes
x=
10(10)
= 4,545 5 docentes.
22
a = 22 f 6 = 11 docentes
a = 6 x docentes
x=
11(6)
= 3 docentes.
22
Luego, el nmero de docentes que aportaron al sistema nacional de pensiones entre 230 y 290 soles es: 5+23+38+3=69 docentes.
Ejemplo 4
Tomando la base DATOS1-maestra, presentaremos la distribucin de frecuencias para la variable cuantitativa continua X 2 :
coeficiente de inteligencia, haciendo uso del software SPSS.
Solucin
Usando los comandos del SPSS dados en el captulo VII (procedimientos estadsticos), se recodifica la variable coeficiente de inteligencia en la variable INTELI1, de la siguiente manera:
[92- 96) "1"
[96-100) "2"
[100-104) "3"
[104-108) "4"
[108-112) "5"
[112-116) "6"
[116-120) "7"
75
02_cap2.p65
75
Valid
1
2
3
4
5
6
7
Total
Frequency
9
28
13
12
2
2
4
70
Percent
12,9
40,0
18,6
17,1
2,9
2,9
5,7
100,0
INTELI 1
Valid Percent
12,9
40,0
18,6
17,1
2,9
2,9
5,7
100,0
Cumulative Percent
12,9
52,9
71,4
88,6
91,4
94,3
100,0
A partir de la salida del SPSS se construye la tabla de distribucin de frecuencias absolutas, relativas y acumuladas para la variable X 2 coeficiente de inteligencia.
Coeficiente de Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia
Inteligencia
absoluta
relativa
absoluta
relativa
relativa
relativa
Intervalos
acumulada acumulada
en
acumulada
de clase
porcentaje porcentaje
fi
[92 - 96)
[96 - 100)
[100-104)
[104-108)
[108-112)
[112-116)
[116-120]
Total
i
0,129
0,400
0,186
0,171
0,029
0,029
0,057
100,0
9
28
13
12
2
2
4
70
Fi
9
37
50
62
64
66
70
i
0,129
0,529
0,714
0,886
0,914
0,943
1,000
i%
12,9
40,0
18,6
17,1
2,9
2,9
5,7
100,0
H i%
12,9
52,9
71,4
88,6
91,4
94,3
100,0
Interpretaremos algunas frecuencias: as, observando la columna de las frecuencias absolutas diremos que 28 estudiantes de
la maestra de Gestin Educativa obtuvieron coeficientes de inteligencia desde 96 a menos de 100 puntos, que es equivalente a decir
que el 40% de los estudiantes de maestra obtuvieron puntajes desde 96 a menos de 100 puntos, como se observa en la columna de las
frecuencias relativas expresadas en porcentajes ( h3 % = 40% ).
Observando la columna de las frecuencias absolutas acumuladas diremos que 64 estudiantes de maestra obtuvieron coeficientes de inteligencia menores de 112 puntos; que es lo mismo
decir que el 91,4% de los estudiantes obtuvieron menos de 112
puntos, como se observa en la columna de frecuencias relativas
acumuladas expresadas en porcentajes ( H 5 % = 91, 4% ).
76
02_cap2.p65
76
Porcentaje de alumnos
inteligencia
Porcentaje acumulado de
alumnos
[92 - 96)
12,9
12,9
[96 - 100)
40,0
52,9
[100-104)
18,6
71,4
[104-108)
17,1
88,6
[108-112)
2,9
91,4
[112-116)
2,9
94,3
[116-120]
5,7
100,0
Total
100,0
Ejemplo 5
Volviendo a tomar el ejemplo 1, a los 30 estudiantes del doctorado
de Educacin de la UNMSM, adems del nmero de hijos se les
pidi la informacin sobre el conocimiento de otro idioma (conoce
y no conoce), como se muestra a continuacin. Se desea presentar
los datos en una tabla de distribucin de frecuencias.
77
02_cap2.p65
77
Estudiante Conocimiento
de otro idioma
1
2
3
4
5
6
7
8
9
10
Conoce
No conoce
Conoce
No conoce
No conoce
No conoce
No conoce
Conoce
No conoce
No conoce
Estudiante
Conocimiento
de otro idioma
11
12
13
14
15
16
17
18
19
20
No conoce
Conoce
Conoce
No conoce
No conoce
No conoce
Conoce
No conoce
No conoce
No conoce
Estudiante Conocimiento
de otro idioma
21
22
23
24
25
26
27
28
29
30
No conoce
No conoce
No conoce
No conoce
Conoce
Conoce
No conoce
No conoce
No conoce
No conoce
Solucin
Aplicando lo descrito en la presente seccin, directamente mostramos la tabla solicitada.
Tabla 3. Distribucin de frecuencias para la variable
conocimiento de otro idioma de estudiantes de doctorado
Conocimiento
Frecuencia absoluta
fi
de otro idioma
Conoce
No conoce
Total
8
22
30
Frecuencia relativa
Porcentaje
hi
hi %
0,27
0,73
1,00
27
73
100
Ejemplo 6
Consideremos la base DATOS2-matemticas y la variable X 7 medio de transporte usado para ir a la UNMSM, clasificada como
variable cualitativa nominal, la cual posee 4 categoras: movilidad
propia, movilidad de familiar, transporte pblico, transporte de la
universidad. El objetivo es realizar una presentacin tabular de
X 7 para analizar su comportamiento, utilizando el software SPSS.
Solucin
A continuacin se presenta la salida del SPSS obtenida usando los
comandos descritos en el captulo VII (procedimentos estadsticos).
78
02_cap2.p65
78
Frecuencia
absoluta
Movilidad propia
Movilidad de familiar
Transporte pblico
Transporte UNMSM
Total
Frecuencia
relativa
fi
hi
5
13
110
72
200
0,025
0,065
0,55
0,36
1,00
Porcentaje
hi %
2,5
9,0
64,0
100,0
Nmero de alumnos
Movilidad propia
Movilidad de familiares
Transporte pblico
Transporte UNMSM
Total
5
13
110
72
200
Porcentaje de
alumnos
2,5
6,5
55,0
36,0
100,0
79
02_cap2.p65
79
Tipo de variable
Continua
Tipo de grfico
Histograma o polgono de frecuencias
para las
f i , hi , hi %
Ojiva para las
Cuantitativa
Discreta
Fi , H i , H i %
f i , hi , hi %
Escalera para las
Cualitativa
Nominal u
Ordinal
Fi , H i , H i %
Barras simples
Sectores, pastel o circular
80
02_cap2.p65
80
Ejemplo 7
Para la Tabla 1, correspondiente a la distribucin de frecuencias
absolutas y relativas de la variable nmero de hijos, cuantitativa
discreta, del ejemplo 1, presentemos su grfico correspondiente:
barras o bastones.
Solucin
Resulta fcil hacer el grfico descrito en forma manual, pero para
su mejor presentacin se ha realizado con el software SPSS, cuyos comandos se encuentran en el captulo VII (procedimientos
estadsticos).
81
02_cap2.p65
81
Observando ambas figuras, vemos que los grficos son similares y slo vara la escala en los ejes Y. En la Figura 1 se ubican las
fi correspondientes al nmero de estudiantes de doctorado y en la
Figura 2 se ubican las hi % correspondientes al porcentaje de los
estudiantes de doctorado. La barra o bastn de mayor altura corresponde a los valores 1 y 2, indicndonos que 11 estudiantes de doctorado tienen 1 hijo y otros 11 estudiantes tienen 2 hijos, que es lo
mismo que decir que el 37% de los estudiantes de la muestra considerada tiene 1 hijo y otro 37% de los estudiantes tienen 2 hijos.
Y as podemos continuar con la interpretacin del grfico, resultando ser la misma que se dio en la interpretacin de la tabla 1
de distribucin de frecuencias, debido a que la representacin de
datos en forma tabular o grfica de un mismo conjunto de datos
nos debe llevar a la misma interpretacin de los datos.
La representacin grfica de la distribucin de frecuencias absolutas acumuladas Fi y relativas acumuladas H i de una variable
cuantitativa discreta se hace mediante los grficos de escalera.
En el eje de la abscisa se colocan los valores de la variable y en
el eje de la ordenada las frecuencias absolutas acumuladas Fi o
las frecuencias relativas acumuladas H i %, dependiendo del tipo
de frecuencia que se desee representar, y luego para cada valor de
la variable se construyen los escalones de la escalera de acuerdo a
la frecuencia correspondiente.
82
02_cap2.p65
82
Ejemplo 8
Para la tabla 1, correspondiente a las frecuencias acumuladas Fi y
H i % de la variable nmero de hijos del ejemplo 1, presentar sus
grficos correspondientes: grfico de escalera.
Solucin
Luego de trazar los dos ejes cartesianos con sus respectivas escalas en idntica forma como se hizo para el grfico de bastones,
procedemos a construir los escalones correspondientes a los valores de la variable, trazando segmentos horizontales de altura igual
a la de sus respectivas frecuencias acumuladas. De una manera
fcil se pueden dibujar dichos trazos manualmente, teniendo en
cuenta las siguientes frecuencias acumuladas:
0,
2,
13,
F ( x) =
24,
27,
30,
x<0
0 x <1
1 x < 2
2 x<4
4 x<5
5x
0, x < 0
6, 0 x < 1
43, 1 x < 2
H ( x) =
80, 2 x < 4
90, 4 x < 5
100, 5 x
83
02_cap2.p65
83
Ejemplo 9
Para el ejemplo 4, correspondiente a la tabla de distribucin de
frecuencias absolutas y relativas para la variable X 2 coeficiente
de inteligencia de la base DATOS1-maestra, se hace la representacin grfica.
84
02_cap2.p65
84
Solucin
Por ser la variable coeficiente de inteligencia una variable cuantitativa continua, su grfico apropiado puede ser el histograma de
frecuencias. Por tener todos los intervalos de clase la misma amplitud, los rectngulos que formarn el histograma se construirn de
la misma base y de altura igual a la frecuencia correspondiente.
Haciendo uso de los comandos del SPSS presentados en el captulo VII (procedimientos estadsticos) se obtienen los siguientes
histogramas de frecuencias absolutas y relativas respectivamente:
Figura 5: Histograma de
frecuencias absolutas de la
variable coeficiente
de inteligencia
Figura 6: Histograma de
frecuencias relativas (%) de la
variable coeficiente de inteligencia
85
02_cap2.p65
85
Ejemplo 10
Para el mismo conjunto de datos del ejemplo 9, construir el polgono de frecuencias absolutas y relativas expresadas en porcentaje.
Solucin
Mostraremos la salida del SPSS editado en Word, cuya presentacin es la siguiente:
86
02_cap2.p65
86
87
02_cap2.p65
87
Ejemplo 11
Construir la ojiva para la distribucin de frecuencia absoluta acumulada y relativa acumulada de la variable coeficiente de inteligencia de la base DATOS1-maestra.
Solucin
Salida del SPSS y editado en Word.
Figura 9. Ojiva de la
distribucin de frecuencias
absolutas acumuladas de la
variable coeficiente de
inteligencia.
Observamos en la figura 9 que 50 estudiantes tienen coeficiente de inteligencia menor a 104, lo que es equivalente a decir que el
71,4% de los estudiantes tienen coeficiente de inteligencia menor a
104, tal como se muestra en la figura 10.
En el captulo VII se ilustra cmo graficar la ojiva usando el
MATLAB para el ejemplo 3.
88
02_cap2.p65
88
Ejemplo 12
Para la tabla 3, correspondiente a la distribucin de frecuencias de
la variable conocimiento de otro idioma de los estudiantes de doctorado del ejemplo 5, construir el grfico apropiado.
Solucin
La variable conocimiento de otro idioma, como se observa en la Tabla 3, es cualitativa o categrica y posee dos categoras (conoce y no
conoce), siendo su grfico apropiado el de barras. En el eje Y se
colocan las frecuencias absolutas o las relativas y en el eje X colocamos las dos categoras, las cuales estarn representadas por barras separadas y de altura igual a las frecuencias absolutas o relativas, dependiendo del tipo de grficos de frecuencias a construir.
Usando los comandos del SPSS del captulo VII (procedimientos estadsticos), obtenemos los siguientes grficos solicitados:
Figura 11: Grfico de frecuencias
absolutas para la variable
conoce otro idioma.
25
80
20
60
15
40
10
20
5
N me ro de
estudiantes
c onoc e
no c onoc e
C onoce otro
idiom a
Porcentaje de
estudiantes
con oce
no con oce
Conoce otro
idioma
89
02_cap2.p65
89
Ejemplo 13
Para el conjunto de datos del ejemplo 12, construir el grfico de
sectores para la variable conocimiento de otro idioma.
Solucin
Para construir el grfico de sectores para la distribucin de frecuencia de la variable conocimiento de otro idioma, presentado en
la tabla 3, se empieza trazando un crculo y se le divide en dos
sectores circulares correspondientes a las categoras conoce 27% y
no conoce 73%. El ngulo central correspondiente al sector circular de la categora conoce es igual a 27 x 3,6 = 97,2 y para el otro
sector circular de la categora no conoce otro idioma, su ngulo
central es igual a 73 x 3,6 = 262,8
Usando los comandos del SPSS del captulo VII (procedimientos estadsticos), se obtiene el grfico solicitado:
F ig u r a 1 3 . G r fic o d e sec to res d e la v a riab le
C o no ce otro id io m a
2 6,6 7%
co noc e o tro id io m a
conoce
no cono ce
7 3,3 3%
90
02_cap2.p65
90
91
02_cap2.p65
91
los datos, seleccionar uno o ms de los primeros dgitos para formar el tallo y el dgito restante para formar las hojas.
Luego se debe hacer una lista de los posibles valores de los
tallos ordenados en una columna y registrar las hojas para cada
tallo correspondiente
Por ejemplo, si el siguiente conjunto de datos representa las
notas parciales para seis estudiantes en el curso de Estadstica (en
la escala de 1 a 30 puntos): 16,2, 16,5, 17,8, 18,6, 20,4, podemos
elegir como tallo la parte entera de cada nmero, es decir, 16, 17,
18, 19 y 20, y como sus respectivas hojas la parte decimal, como se
muestra a continuacin, acompaado de la unidad respectiva para
poder leer los datos.
Unidad : 0,1
Tallo hojas
16 2 5
17 8
18 6
19
20 4
Ejemplo 14
Presentaremos el diagrama de tallo y hojas para el ejemplo 3, aportaciones que realizaron 100 docentes universitarios al Sistema
Nacional de Pensiones.
92
02_cap2.p65
92
Solucin
Para la construccin del diagrama de tallo y hojas para la variable
aportaciones en nuevos soles, como los datos estn expresados en
nmeros enteros, elegimos las centenas y decenas para formar el
tallo y las unidades respectivas para formar las hojas. En el lado
izquierdo en una columna colocamos los valores ordenados de los
tallos totalizando 18 lneas desde 17 hasta 34, y en el lado derecho
colocamos en cada lnea las hojas correspondientes tambin en
forma ordenada de menor a mayor. La unidad es 1, que nos permitir leer los datos como 174, 187,..., 337, 349.
Unidad 1
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
4
7
7
0
0
0
1
2
0
0
0
0
0
0
7
1
4
9
5
4
1
1
2
0
0
1
0
3
1
8
8
7
8
5
3
4
3
0
0
1
0
4
7
8
55
56
13
01
24
01
68
8
5
8
4
2
4
1
9
8
4
3
4
3
9
8
3
4
3
8
4
5
6
8
455555577899
66788
7
93
02_cap2.p65
93
Ejemplo 15
Presentar el diagrama de tallo y hojas de la variable coeficiente de
inteligencia de la base DATOS1-maestra.
Solucin
Siguiendo el mismo procedimiento del ejemplo anterior, podemos
construir el diagrama de tallo y hojas solicitado, slo que en esta
oportunidad lo haremos haciendo uso del software SPSS, cuyos
comandos respectivos se encuentran en las pgina 286-287. La
salida del SPSS es la siguiente.
Case Processing Summary
Cases
Valid
Missing
Total
N
Percent
N Percent
N
INTELIGE
70
100,0%
0
,0%
70
INTELIGE Stem-and-Leaf Plot
Percent
100,0%
94
02_cap2.p65
94
Ejemplo 16
Representar mediante el diagrama de tallo y hojas las siguientes
ventas trimestrales expresadas en miles de soles de una tienda
comercial:
36 41 44 36 35 42 44 36 39 46 44 36 41 46 44 39
44 48 47 44 42 52 52 49 41 55 53 50 54 53 42 41
Solucin
Escogemos las decenas para el tallo y las unidades para las hojas.
Cada tallo lo desdoblamos en dos lneas y, para diferenciarlos, el
tallo va acompaado de la letras L y H.
Unidad 1
3H 5 6 6 6 6 9 9
4L 1 1 1 2 2 2 2 2 2 2 2 2
4H 6 6 7 8 8 9 9
5L 0 2 2 3 3 4
5H 5
95
02_cap2.p65
95
Unidad 1
55L 0
55T 2 2 3
55F 4 5 5 5
55S 6 7
55H 8 8 9
56L 0 0 1 1
56T 2 2 3 3
56F 4 4 4 5 5
56S 6 7 7
56H 8
80
60 80 90
90
50
60 70
20
96
02_cap2.p65
96
Grfico digidot
Un diagrama de tallo y hojas muestra las observaciones ordenadas de menor a mayor, pero no muestra el orden real en la cual
fueron apareciendo, pudiendo ocultar alguna informacin importante respecto al conjunto de datos. En tal situacin, el grfico
digidot combina las observaciones a travs del tiempo con el
diagrama de tallo y hojas, como se muestra a continuacin.
Ejemplo 17
Tomando el ejemplo 16, correspondiente a ventas trimestrales, realizaremos el grfico digidot.
Figura 15. Grfico digidot de las ventas trimestrales
60
3H
4L
4H
5L
5H
50
V EN T A S
40
5666699
111222222222
6678899
022334
5
30
1
11
13
15
17
19
21
23
25
27
29
31
S e q u en ce nu m b e r
Tiempo
grfico de lnea
97
02_cap2.p65
97
9
9
9
9
10
10
10
10
10
11
11
11
11
11
12
N = 70
333
44555
6666777
88899999999999
0000000000011
2222333
44445555
6677
8
0
2
4
67
8
00
Tambin deberamos preguntarnos cuntas lneas es permitido hacer en el diagrama de tallo y hojas? La respuesta ms inmediata es la de extrapolar los mismos criterios que usamos para la
construccin del nmero de intervalos de clase, como en el caso de
los histogramas (5-20), o siguiendo el criterio del estadstico.
Los diagramas de tallo y hojas resultan muy tiles cuando se
desea comparar dos o ms conjuntos de datos de naturaleza similar. As, si deseamos comparar los coeficientes de inteligencia de
varones y mujeres de nuestra base DATOS1-maestra, emplearamos el diagrama de tallo y hojas como se ilustra a continuacin.
98
02_cap2.p65
98
22
55
667
88888999999
000001111
22
44455
67
(>=114)
.
.
.
.
.
234
5566688888899
0023344
568
02
(>=120)
sexo de los
estudiantes
INTELIGE femenino
masculino
Cases
Valid
Missing
Total
N
Percent N Percent N Percent
41
29
100,0%
100,0%
0
0
,0%
,0%
41
29
100,0%
100,0%
99
02_cap2.p65
99
Ejercicios
Se recomienda realizar todos los ejercicios manualmente y despus
usar el SPSS o MATLAB. Comentar ambas salidas o resultados.
1. Para la base DATOS1, considere la variable X5: rendimiento acadmico en el curso de Estadstica y responda lo siguiente:
a) Elabore una tabla de distribucin de frecuencias absolutas,
relativas, absolutas acumuladas, relativas acumuladas y
luego interprete , f 2 , h3 , F4, H 5 % .
b) Qu porcentaje de estudiantes ha obtenido un rendimiento
acadmico entre 12 y 15?
2. Para la base DATOS3 considere la variable X4: nota promedio en
Geometra y conteste lo siguiente:
a) Elabore una tabla de distribucin de frecuencias relativas y
relativas acumuladas expresadas en porcentajes e interprete algunas de dichas frecuencias.
b) Qu porcentaje de estudiantes ha obtenido como nota promedio en Geometra una nota menor igual a 13?
3. Para la tabla de distribucin de frecuencias del ejercicio 1:
a) Construya un histograma de frecuencias y luego interprete
el grfico.
b) Construya un polgono de frecuencia e interprete el grfico.
100
02_cap2.p65
100
c) Sobre el histograma realizado en a), vuelva a trazar el polgono de frecuencia, compare ambos grficos y comente.
d) Construya la ojiva para las frecuencias absolutas acumuladas e interprete.
4. Considere la variable X4: nota promedio en Geometra de la base
DATOS3 y responda lo siguiente:
a) Construya el diagrama de tallo y hojas.
b) Podra identificar algn valor tpico o representativo del
conjunto de datos?
c) La distribucin de la nota promedio de Geometra le parece razonablemente simtrica? De no ser as, cmo podra
describir la forma de la distribucin?
d) Podra identificar una o ms notas promedio de Geometra apartadas del resto de las dems notas? Si su respuesta
es afirmativa, qu nombre le dara a dichas observaciones?
5. Para la base DATOS4, considere la variable nmero de asambleas vecinales a las que asisti el dirigente vecinal.
a) Elabore la tabla de distribucin de frecuencias para dicha
variable e interprete algunas de las frecuencias.
b) Cuntos dirigentes distritales asistieron a 4 asambleas vecinales?
c) Qu porcentaje de dirigentes distritales asistieron a ms de
5 asambleas vecinales?
d) Qu porcentaje de dirigentes distritales asistieron de 2 a 5
asambleas vecinales?
6. Construya el grfico de barras o bastones usando las frecuencias
absolutas para los datos del ejercicio 5 e interprete. Observando
el grfico, responda: Cuntos participantes distritales asistieron a 3 asambleas vecinales?
7. Construya el grfico de escalera usando las frecuencias absolutas acumuladas para los datos del ejercicio 5 e interprete. Observando el grfico, responda: Cuntos participantes distritales
asistieron a 4 o menos asambleas vecinales?
101
02_cap2.p65
101
a) Construya una tabla de distribucin de frecuencias absolutas, relativas, absolutas acumuladas y relativas acumuladas.
Recomendacin: Emplee 10 intervalos de clase y considere
el lmite inferior del primer intervalo igual a 4 000 y el lmite superior 4 200.
b) Construya un histograma de frecuencia relativa expresada
en porcentaje.
c) Segn a) y b), diga qu forma tiene la distribucin de los
gastos de los estudiantes de maestra.
102
02_cap2.p65
102
Trabajadores
6
11
16
25
34
46
33
16
2
2
191
Porcentaje de trabajadores
7
43
40
10
100
103
02_cap2.p65
103
a) Elabore una tabla de distribucin de frecuencias para la variable E.A.P. considerando las frecuencias absolutas y relativas expresadas en porcentaje.
b) Qu porcentaje de alumnos pertenece a la E. A. P. de Estadstica?
c) Cuntos alumnos pertenecen a la E.A.P. de Matemtica?
13. Considerando la parte a) del ejercicio 12:
a) Construya el grfico de barras para la variable E.A.P. usando las frecuencias absolutas e interprete.
b) Construya el grfico de sectores o circular usando la distribucin de frecuencias relativas expresadas en porcentaje e
interprete.
14. Considere el ejercicio 1, correspondiente al rendimiento acadmico de los estudiantes del curso de Estadstica. Responda lo
siguiente:
a) Construya el diagrama de tallo y hojas.
b) Podra identificar algn valor tpico o representativo del
conjunto de datos?
c) La distribucin de las notas de los alumnos del curso de
Estadstica le parece razonablemente simtrica? De no ser
as, cmo podra describir la forma de la distribucin?
d) Podra identificar una o ms notas del curso de Estadstica apartadas del resto de las dems notas? Si su respuesta
es afirmativa, qu nombre le dara a dichas observaciones?
15. Compare los resultados obtenidos en los ejercicios 1 y 14, respecto a la presentacin y organizacin de las notas de los alumnos del curso de Estadstica.
16. Retome el ejercicio 9, correspondiente a los gastos (expresados
en nuevos soles) realizados por 100 estudiantes de maestra y
responda lo siguiente:
a) Construya el diagrama de tallo y hojas.
b) Podra identificar algn valor tpico o representativo del
conjunto de datos?
104
02_cap2.p65
104
c) La distribucin de los gastos de los estudiantes de maestra le parece razonablemente simtrica? De no ser as, cmo
podra describir la forma de la distribucin?
d) Existe uno o ms gastos que difieran del resto de los dems? Si su respuesta es afirmativa, qu nombre le dara a
dichas observaciones?
17. Compare los resultados obtenidos en los ejercicios 9 y 15 respecto a la representacin y organizacin de los gastos (expresados
en nuevos soles) de los alumnos de maestra.
105
02_cap2.p65
105
106
02_cap2.p65
106