Documentos de Académico
Documentos de Profesional
Documentos de Cultura
FACULTAD DE CIENCIAS
DEPARTAMENTO ACADÉMICO DE MATEMÁTICAS Y
ESTADÍSTICA
Contenido:
✓ Distribución de Frecuencias.
✓ Representación gráfica.
✓ Diagrama de tallo y hojas.
Profesor:
Estadística
Cusco – Perú
2021
Estadística Semestre 2021-I
Capítulo II
Distribución de frecuencias unidimensional
Precisión
Alta Baja
Baja
Exactitud
Alta
ck nk hk pk
TOTAL n 1 100%
Fuente:
a) Frecuencia absoluta (ni)
Es el número de veces que se repite un valor o una categoría
k
Propiedad: ni = n1 + n2 + n3 + + nk = n
i =1
k
Propiedad: hi = h1 + h2 + h3 + + hk = 1
i =1
k
Propiedad: pi = p1 + p2 + p3 + + pk = 100%
i =1
Tabla Nº 2.1
Sabor de helado favorito de alumnos universitarios
Sabor ni hi pi i
Fresa 25 0,208 20,8 74,9
Vainilla 30 0,250 25,0 90,0
Chocolate 45 0,375 37,5 135,0
Menta 15 0,125 12,5 45,0
Tiramisú 5 0,042 4,2 15,1
Total 120 1 100% 360o
40 37,5%
30
25,0%
20,8%
20
12,5%
10
4,2%
0
Fresa Vainilla Chocolate Menta Tiramisú
Vainilla
Chocolate 25,0%
37,5%
3. Pictogramas
Es la representación de datos estadísticos mediante símbolos o figuras que por su
forma sugieren la naturaleza del dato. Los pictogramas son de muy sencilla
interpretación para los menos entendidos, pero son poco precisos, por lo que son
escasamente utilizados por los expertos.
Ejemplo 2.4
Se considera la población de vicuñas por regiones del Perú, reportadas por el
Ministerio de Agricultura en el año 2017.
Figura 2.4
Población de vicuñas por regiones Perú-2017
Ayacucho
(62 133)
Puno
(38 673)
Huancavelica
(23 616)
Junín
(21 325)
Cusco
(17 833)
Arequipa
(15 213)
Apurímac
(11 439)
Lima
(9515)
=10 000
Fuente: Ministerio de Agricultura
UNSAAC -5- Prof. Edgar Centeno H.
Estadística Semestre 2021-I
4. Diagrama de Pareto
Este diagrama debe su nombre al matemático y economista italiano Vilfredo Pareto,
quien en el siglo XVI demostró matemáticamente que el 80% de la riqueza del mundo
la controlaba el 20% de la población. Es decir que la minoría de la población poseía la
mayor parte de la riqueza y la mayoría de la población poseía la menor parte de la
riqueza. Con esto estableció la llamada Ley de Pareto según la cual la desigualdad
económica es inevitable en cualquier sociedad.
A este diagrama también se le llama “regla 80-20”, y nos indica que existen muchos
problemas sin importancia frente a solo unos pocos graves. Según este concepto, si se
tiene un problema con muchas causas, es posible afirmar que el 20% de las causas
resuelven el 80% del problema y el 80% de las causas solo resuelven el 20% del
problema. Esta técnica permite separar los “poco vitales” de los “muchos triviales”.
Sirve para establecer prioridades y enfocar y dirigir las acciones a desarrollar
posteriormente.
En el diagrama de Pareto se dibujan rectángulos sobre las categorías del atributo, los
cuales se ordenan de mayor a menor frecuencia. Posteriormente se procede a
acumular las frecuencias sobre cada categoría trazando una línea que nace del primer
rectángulo y que expresa en qué medida contribuye cada categoría a la frecuencia
total.
Ejemplo 2.5
Una encuesta sobre satisfacción de pacientes conducida para una muestra de 210
individuos dados de alta de un hospital durante el mes de junio condujo a la siguiente
lista de 384 quejas:
xk nk hk pk Nk Hk Pk
TOTAL n 1 100%
Fuente:
UNSAAC -7- Prof. Edgar Centeno H.
Estadística Semestre 2021-I
a) Frecuencia acumulada absoluta (Ni)
Es el número observaciones menores o iguales a x i . Viene dada por:
i
N i = n1 + n 2 + + n i = n j ; i = 1,2,...,k
j=1
Propiedades:
• N1 = n1
• Nk = n
b) Frecuencia acumulada relativa (Hi)
i Ni
Hi = h1 + h2 + + hi = h j o Hi = ; i = 1,2,...,k
j=1 n
Propiedades:
• H1 = h1
• Hk = 1
c) Frecuencia acumulada porcentual (Pi)
i
Pi = p1 + p2 + + pi = p j o Pi = Hi 100% ; i = 1,2,...,k
j=1
Propiedades:
• P1 = p1
• Pk = 100%
REPRESENTACIÓN GRÁFICA
Con frecuencia se utilizan tres tipos de gráficas: El diagrama de barras (o “bastones”), el
diagrama de puntos y el diagrama de escalera.
1. Diagrama de barras (bastones)
Se utiliza para la representación gráfica de variables cuantitativas discretas. Sobre el eje
horizontal se representan los valores discretos que toma la variable, y sobre cada uno de
ellos se dibujan rectángulos o segmentos de recta con una altura igual a la frecuencia
absoluta o relativa.
2. Diagrama de puntos.
Consiste en superponer tantos puntos como frecuencias se observen en cada valor de la
distribución.
3. Diagrama de escalera.
En este caso, sobre el eje horizontal se representan los valores discretos que toma la
variable, y sobre el eje vertical representamos las frecuencias acumuladas, obteniéndose
un gráfico en forma de escalera o escalón.
Ejemplo 2.6
Se considera el estudio de la variable X=número de componentes por familia observada en
una muestra 40 familias.
2 3 4 5 8 2 4 5 7 2 1 3 6 4 2 5 5 1 3 4
4 4 5 6 7 3 2 4 5 6 7 5 5 4 6 4 5 6 5 7
Elabore una tabla de frecuencias y represéntelo gráficamente.
25%
10
22,5%
8
Frecuencia absoluta
6
12,5% 12,5%
10% 10%
4
5%
2
2,5%
0
1 2 3 4 5 6 7 8
Número de componentes por familia
L1 − L2 x2 n2 h2 p2 N2 H2 P2
Lk−1 − Lk xk nk hk pk Nk Hk Pk
TOTAL n 1 100%
NOTAS
a) El agrupamiento de los datos da lugar a pérdida de información, pero con ello se gana una
mayor manejabilidad de los mismos.
b) El número de intervalos y de las amplitudes de los mismos deben ser escogidos
convenientemente. En la práctica, es frecuente la elección de intervalos de amplitud
constante, ya que con ello se facilita el cálculo de la mayoría de las características
descriptivas de la estadística.
R = máx x i − mín x i
i i
k= n
En ambos casos el valor de k se redondea al entero más cercano.
REPRESENTACIÓN GRÁFICA
En este tipo de análisis es común utilizar cuatro tipos de gráficas: El histograma, el diagrama
escalonado, el polígono de frecuencias y el polígono de frecuencias acumuladas u ojiva.
1. Histograma
La idea del histograma es representar frecuencias por medio de áreas. Se construye
dibujando sobre cada intervalo un rectángulo de área proporcional a la frecuencia
absoluta (o relativa) correspondiente a dicho intervalo. Si las longitudes de los intervalos
no son iguales, cada rectángulo tendrá una altura igual a la densidad de frecuencia ni/wi. Si
por el contrario, las longitudes de los intervalos son iguales, se utiliza como altura la
frecuencia absoluta (ni) o relativa (hi).
2. Polígono de frecuencias.
Es el gráfico que se forma al unir los puntos medios de las bases superiores de los
rectángulos del histograma y cierra el polígono cortando el eje de las abscisas, de forma
que el área encerrada entre el polígono de frecuencias y el eje horizontal coincida con el
área del histograma.
UNSAAC - 11 - Prof. Edgar Centeno H.
Estadística Semestre 2021-I
3. Diagrama escalonado
El diagrama escalonado es un histograma donde los rectángulos tienen alturas
proporcionales a las frecuencias acumuladas.
4. Polígono de frecuencias acumuladas u ojiva.
Se construye a partir del diagrama escalonado, y ofrecen un medio gráfico para aproximar
el número o porcentaje de observaciones menores o iguales que un valor específico.
Ejemplo 2.7
Los datos que se muestran a continuación representan las edades de 50 pacientes atendidos en
el servicio de emergencia de un hospital de la ciudad:
63 89 36 49 56 64 59 35 78 43
53 70 57 62 43 68 62 26 64 72
52 51 62 60 71 61 55 59 60 67
57 67 61 67 51 81 53 64 76 44
73 56 62 63 60 58 45 36 60 50
a) Elabore la distribución o tabla de frecuencias con intervalos de igual amplitud.
b) Grafique el histograma, diagrama escalonado, el polígono de frecuencias y la ojiva.
Solución
a) Para elaborar la tabla de frecuencias debemos seguir los pasos que se señalaron
anteriormente.
Paso 1: Determinamos el recorrido o rango (R), observamos que la mayor edad es 89 años
y la menor edad 26 años, entonces el rango es R = 89 − 26 = 63 .
Paso 2: Determinamos el número de clases (k). En el ejemplo no nos dice con cuantas
clases debemos construir la tabla de frecuencias por lo que podemos seleccionar una
cantidad arbitrariamente (de 5 a 10) o aplicar la regla de Sturges (que es la que
utilizaremos). Como el tamaño de nuestra muestra es n=40, entonces, la regla de
Sturges nos sugiere usar 7 clases, es decir:
k = 1 + 3,33log50 = 6,65757 7
Observemos que utilizando la otra regla obtenemos el mismo resultado:
k = 50 = 7,07107 7
Paso 3: Ahora determinamos la amplitud o ancho de clase (w). En este caso:
R 63
w= = =9
k 7
En este caso el ancho de clase común y constante para todas las clases es igual al
número entero 9, y no necesitamos aproximar por exceso al valor más cercano, como
sí debería hacerse en la mayoría de los casos.
Paso 4: A continuación se construye la primera clase con ancho w=9. Para ello, primero
tenemos que encontrar los límites inferior y superior de esta clase.
Límite inferior: L0 = dato menor = 26
Para obtener las clases que siguen a esta primera, tenga en cuenta que el límite inferior
de la clase precedente coincide con el límite superior de la clase anterior y que el ancho
de clase es w=9. De esta forma se obtienen las siete clases:
clase 1=I1 = L0 ;L1 = 26;35 : 26 − 35
Paso 5: Finalmente para determinar las frecuencia absolutas para cada clase usamos una
columna de conteos. Si uno de los datos cae en una clase, anotamos con un palote.
Luego se calculan las frecuencias relativas, frecuencias porcentuales y las respectivas
frecuencias acumuladas así como las marcas de clase. La tabla 2.3 contiene las
frecuencias para los 50 datos del ejemplo.
Tabla Nº 2.3
Edades de pacientes atendidos en un Hospital
Frecuencias Frecuencias acumuladas
Ii Conteos xi
Abs.(ni) Rel.(hi) Porc.(pi) Abs.(Ni) Rel.(Hi) Porc.(Pi)
26 – 35 30,5 1 0,02 2% 1 0,02 2%
35 – 44 39,5 5 0,10 10% 6 0,12 12%
44 – 53 48,5 7 0,14 14% 13 0,26 26%
53 – 62 57,5 16 0,32 32% 29 0,58 58%
62 – 71 66,5 14 0,28 28% 43 0,86 86%
71 – 80 75,5 5 0,10 10% 48 0,96 96%
80 – 89 84,5 2 0,04 4% 50 1,00 100%
TOTAL n=50 1 100%
b) Representación gráfica.
Ejemplo 2.8
Suponga que los datos que se presentan a continuación representan los precios en soles de un
determinado producto en 40 bodegas de una ciudad.
5,2 10,2 7,0 7,1 10,2 8,3 9,4 9,2 5,4 8,1
6,5 7,1 6,6 7,8 6,8 7,2 8,4 9,6 8,7 7,3
8,5 5,7 6,4 10,1 8,2 9,0 7,8 8,2 7,8 6,6
5,3 6,2 9,1 8,6 7,0 7,7 8,3 7,5 9,8 7,5
a) Elabore la distribución de frecuencias con 6 intervalos de clase.
b) Graficar el polígono de frecuencias.
c) Hallar el número de bodegas donde el precio del producto este entre S/6,9 y S/9,7.
d) Halle el porcentaje de bodegas en el que precio sean superiores o iguales a 9,0 soles.
Solución
a) Para elaborar la tabla de frecuencias seguiremos los pasos:
Paso 1: Determinamos el recorrido o rango (R): R = 10,2 − 5,2 = 5 .
Paso 2: Determinamos el número de clases (k): k = 6 (Valor que nos dan en la pregunta)
Paso 3: Ahora determinamos la amplitud o ancho de clase (w). En este caso:
R 5
w= = = 0,8333 0,9
k 6
El valor del ancho de clase que resulta al dividir el recorrido y el número de clases es
igual a 0,8333, pero como se indicó, w debe ser un número que debe tener la misma
cantidad de cifras decimales que los datos originales. Por lo tanto necesitamos un w que
se debe aproximar al décimo, esto es, al valor más cercano y por exceso. En nuestro
caso para que todos los datos en el momento del conteo caigan en las seis clases
utilizadas, aproximamos el ancho de clase a w = 0,9 .
Paso 4: Finalmente procedemos a contar los datos y a calcular sus frecuencias como se observa
en la tabla 2.4.
UNSAAC - 14 - Prof. Edgar Centeno H.
Estadística Semestre 2021-I
Tabla Nº 2.4
Niveles de hemoglobina de un grupo de niños
Frecuencias simples Frecuencias acumuladas
Ii Conteos xi
ni hi pi Ni Hi Pi
5,2 – 6,1 5,65 4 0,100 10% 4 0,100 10%
6,1 – 7,0 6,55 6 0,150 15% 10 0,250 25%
7,0 – 7,9 7,45 12 0,300 30% 22 0,550 55%
7,9 – 8,8 8,35 9 0,225 22,5% 31 0,775 77,5%
8,8 – 9,7 9,25 5 0,125 12,5% 36 0,900 90%
9,7 – 10,6 10,15 4 0,100 10% 40 1,000 100%
TOTAL n=4 1 100%
b) Polígono de frecuencias:
c) Número de bodegas con precios que están entre S/6,9 y S/9,7 = 6,9 − 9,7 = 7,0 − 9,7
= 12 + 9 + 5 = 26
d) Porcentaje de bodegas con precios superiores o iguales a 9,0 soles = 9,0 − 10,6
12,5% 10%
x
Ejemplo 2.9
En un programa para la detección temprana de hipertensión en una muestra de 50 varones con
edades comprendidas entre los 30 y 40 años, la distribución de la presión diastólica (mínima) en
mmHg fue la siguiente:
70 85 85 75 65 90 110 95 90 70
60 75 80 120 85 95 90 70 100 65
80 90 95 90 95 110 100 85 80 75
60 75 80 85 90 90 105 110 120 95
90 95 85 90 90 95 100 105 120 70
Organice los datos en un diagrama de tallo y hojas.
Solución
Utilizando el software Minitab obtenemos el diagrama de tallo y hojas.
Tallo Hojas
4 6 0055
12 7 00005555
22 8 0000555555
(17) 9 00000000005555555
11 10 00055
6 11 000
3 12 000
Del diagrama de tallo y hojas se pueden sacar varias conclusiones, como entre otras, las
siguientes:
1º. La presión diastólica mínima es de 60 mmHg y la máxima de 120 mmHg.
2º. Doce varones tuvieron presiones diastólicas inferiores a 80 mmHg y 6 superiores a 105
mmHg.
3º. La mayoría de varones tienen presiones diastólicas comprendidas entre 75 y 100 mmHg.
4º. Diez varones tuvieron una presión diastólica de 90 mmHg y siete, 95 mmHg.
UNSAAC - 16 - Prof. Edgar Centeno H.
Estadística Semestre 2021-I
NOTA:
Algunos softwares como SPSS o Minitab pueden separar el tallo en una parte inferior (hojas
desde 0 a 4) y otra superior (hojas de 5 a 9).
Tallo Hojas
2 6 00
4 6 55
8 7 0000
12 7 5555
16 8 0000
22 8 555555
(10) 9 0000000000
18 9 5555555
11 10 000
8 10 55
6 11 000
3 11
3 12 000