Está en la página 1de 17

UNIVERSIDAD NACIONAL DE SAN ANTONIO ABAD DEL CUSCO

FACULTAD DE CIENCIAS
DEPARTAMENTO ACADÉMICO DE MATEMÁTICAS Y
ESTADÍSTICA

Distribución de frecuencias unidimensional


Económica I

Contenido:
✓ Distribución de Frecuencias.
✓ Representación gráfica.
✓ Diagrama de tallo y hojas.

Profesor:
Estadística

Edgar Centeno Huamaní

Cusco – Perú
2021
Estadística Semestre 2021-I

Capítulo II
Distribución de frecuencias unidimensional

2.1 Distribución de frecuencias


Después de la recolección de los datos mediante un censo o un muestreo, es necesario
resumirlos y presentarlos tal que faciliten su comprensión y posterior análisis y utilización. En
este capítulo mostramos algunos procedimientos para la clasificación y presentación de los
datos. A las tablas numéricas ordenadas que recogen de manera sistemática los datos de una
variable estadística se le llama tabla o distribución de frecuencias.
EXACTITUD Y PRECISIÓN DE LOS DATOS
“Exactitud” y “precisión” se utilizan como sinónimos en el lenguaje ordinario, pero en
estadística se define con más rigurosidad. Exactitud es la proximidad de un valor medido o
calculado a su verdadero valor, así pues, una medición es más exacta cuanto más pequeño es el
error de medida; precisión es la proximidad de medidas repetidas de la misma cantidad, la
precisión depende pues únicamente de la distribución de los resultados y no está relacionada
con el valor convencionalmente “verdadero” de la medición .

Precisión
Alta Baja
Baja
Exactitud
Alta

Figura 2.1: Resultados de cuatro series de disparo a un blanco.

REDONDEO POR APROXIMACION


Cuando se quiere reducir el número de cifras significativas, realizamos el proceso de redondeo
de números. Las reglas para redondear son muy sencillas:
1º. Un número dígito que se quiere redondear no se cambia si va seguido por un número
dígito menor que 5.
2º. Un número dígito se aumenta en uno, si va seguido por un número dígito mayor que 5 o
por 5 seguido de otros números dígitos distintos de cero
3º. Cuando el número dígito que se va a redondear va seguido por un 5 solo o seguido de
ceros, se aumenta en uno si es impar pero no se cambia si es par (la razón es que se
busca un equilibrio)
UNSAAC -2- Prof. Edgar Centeno H.
Estadística Semestre 2021-I
Ejemplo 2.1:
Redondear por aproximación:
Redondeo al
Sin redondeo
entero décimo centésimo milésimo
325,825621 326 325,8 325,83 325,826
16,543018 17 16,5 16,54 16,543
985,695405 986 985,7 985,70 985,695
120,791500 121 120,8 120,79 120,792
73,018500 73 73,0 73,02 73,018

2.2 Organización de datos cualitativos


Si en una muestra de n datos se observa k categorías C1, C2, … , Ck de alguna variable
cualitativa X, entonces la información se resume en una tabla de frecuencias como sigue:
TITULO
Variable Frecuencia Frecuencia Frecuencia
Cualitativa (X) absoluta (ni) relativa (hi) porcentual (pi)
c1 n1 h1 p1
c2 n2 h2 p2

ck nk hk pk
TOTAL n 1 100%
Fuente:
a) Frecuencia absoluta (ni)
Es el número de veces que se repite un valor o una categoría
k
Propiedad:  ni = n1 + n2 + n3 + + nk = n
i =1

b) Frecuencia relativa (hi)


ni
Se define por: hi =  i = 1, 2, 3, ... , k
n

k
Propiedad:  hi = h1 + h2 + h3 + + hk = 1
i =1

c) Frecuencia porcentual (pi)


Se define por: pi = hi  100%  i = 1, 2, 3, ... , k

k
Propiedad:  pi = p1 + p2 + p3 + + pk = 100%
i =1

UNSAAC -3- Prof. Edgar Centeno H.


Estadística Semestre 2021-I
REPRESENTACIÓN GRÁFICA DE DATOS CUALITATIVOS
Hay gráficas de varios tipos, entre los cuales se encuentran los siguientes: el diagrama de
barras, el diagrama circular o de pastel, el pictograma y diagrama de Pareto.

1. Diagrama de barras o de rectángulos


Es una representación gráfica en la que se dibuja sobre cada categoría de la variable
cualitativa, rectángulos de igual base y altura proporcional a la frecuencia absoluta,
relativa o porcentual. Este tipo de gráficos se usan tanto para datos cualitativos como
cuantitativos.
Ejemplo 2.2
Supongamos que se toma una muestra aleatoria de 120 estudiantes de una
universidad a los que le pedimos que nos digan “cuál es el sabor de su helado
favorito” (entre 5 opciones), obteniéndose los resultados:

Tabla Nº 2.1
Sabor de helado favorito de alumnos universitarios

Sabor ni hi pi i
Fresa 25 0,208 20,8 74,9
Vainilla 30 0,250 25,0 90,0
Chocolate 45 0,375 37,5 135,0
Menta 15 0,125 12,5 45,0
Tiramisú 5 0,042 4,2 15,1
Total 120 1 100% 360o

40 37,5%

30
25,0%
20,8%
20

12,5%
10
4,2%

0
Fresa Vainilla Chocolate Menta Tiramisú

Figura 2.2: Diagrama de barras de sabores de helado favoritos

2. Diagrama circular o de sectores


El área de cada sector circular que representa a cada categoría del atributo debe ser
proporcional a su frecuencia absoluta. Se utiliza cuando el número de categorías es
pequeño. Los ángulos de cada sector circular asociados a cada categoría se calculan
por: i = hi  360O  i = 1, 2, 3, ... , k

UNSAAC -4- Prof. Edgar Centeno H.


Estadística Semestre 2021-I
Ejemplo 2.3
Utilizando la tabla anterior (Tabla 2.1) se obtiene el siguiente diagrama circular o de
sectores:
Tiramisú
Menta 4,2% Fresa
12,5% 20,8%

Vainilla
Chocolate 25,0%
37,5%

Figura 2.3: Diagrama de sectores de sabores de helado favoritos

3. Pictogramas
Es la representación de datos estadísticos mediante símbolos o figuras que por su
forma sugieren la naturaleza del dato. Los pictogramas son de muy sencilla
interpretación para los menos entendidos, pero son poco precisos, por lo que son
escasamente utilizados por los expertos.
Ejemplo 2.4
Se considera la población de vicuñas por regiones del Perú, reportadas por el
Ministerio de Agricultura en el año 2017.
Figura 2.4
Población de vicuñas por regiones Perú-2017

Ayacucho
(62 133)
Puno
(38 673)
Huancavelica
(23 616)
Junín
(21 325)
Cusco
(17 833)
Arequipa
(15 213)
Apurímac
(11 439)
Lima
(9515)

=10 000
Fuente: Ministerio de Agricultura
UNSAAC -5- Prof. Edgar Centeno H.
Estadística Semestre 2021-I
4. Diagrama de Pareto
Este diagrama debe su nombre al matemático y economista italiano Vilfredo Pareto,
quien en el siglo XVI demostró matemáticamente que el 80% de la riqueza del mundo
la controlaba el 20% de la población. Es decir que la minoría de la población poseía la
mayor parte de la riqueza y la mayoría de la población poseía la menor parte de la
riqueza. Con esto estableció la llamada Ley de Pareto según la cual la desigualdad
económica es inevitable en cualquier sociedad.
A este diagrama también se le llama “regla 80-20”, y nos indica que existen muchos
problemas sin importancia frente a solo unos pocos graves. Según este concepto, si se
tiene un problema con muchas causas, es posible afirmar que el 20% de las causas
resuelven el 80% del problema y el 80% de las causas solo resuelven el 20% del
problema. Esta técnica permite separar los “poco vitales” de los “muchos triviales”.
Sirve para establecer prioridades y enfocar y dirigir las acciones a desarrollar
posteriormente.
En el diagrama de Pareto se dibujan rectángulos sobre las categorías del atributo, los
cuales se ordenan de mayor a menor frecuencia. Posteriormente se procede a
acumular las frecuencias sobre cada categoría trazando una línea que nace del primer
rectángulo y que expresa en qué medida contribuye cada categoría a la frecuencia
total.
Ejemplo 2.5
Una encuesta sobre satisfacción de pacientes conducida para una muestra de 210
individuos dados de alta de un hospital durante el mes de junio condujo a la siguiente
lista de 384 quejas:

Razón de queja Número


Enojo con otros pacientes 13
Ninguna respuesta a zumbador 71
Respuestas inadecuadas a preguntas 38
Tardanza en pruebas 34
Ruido 28
Mal servicio de comidas 117
Descortesía de personal 62
Otros 21
Elabore un diagrama de Pareto.
Solución
1º. Ordenamos las frecuencias absolutas y porcentuales de mayor a menor.
2º. Dibujamos rectángulos con la frecuencia absoluta acumulada y la poligonal
asociada a la frecuencia acumulada porcentual.
Razón de queja ni pi Pi
Mal servicio de comidas 117 30,5% 30,5%
Ninguna respuesta a zumbador 71 18,5% 49,0%
Descortesía de personal 62 16,1% 65,1%
Respuestas inadecuadas a preguntas 38 9,9% 75,0%
Tardanzas en pruebas 34 8,9% 83,9%
Ruido 28 7,3% 91,1%
otros 21 5,5% 96,6%
Enojo con otros pacientes 13 3,4% 100,0%
Total 384 100%
UNSAAC -6- Prof. Edgar Centeno H.
Estadística Semestre 2021-I

Figura 2.5: Diagrama de Pareto de razones de quejas de pacientes dados de alta.


La figura 2.4 muestra el diagrama de Pareto correspondiente a los datos sobre razones de
queja. Las frecuencias absolutas de cada queja vienen representadas por rectángulos,
mientras que las frecuencias porcentuales acumuladas están indicadas por la poligonal que
aparece encima de los rectángulos. En la figura puede observarse que las quejas aparecen
ordenados de mayor a menor frecuencia absoluta. En nuestro ejemplo se ve claramente
que cuatro razones: Mal servicio de comidas (30,5%), Ninguna respuesta a zumbador
(18,5%) y Descortesía de personal (16,1%) y Respuestas inadecuadas a preguntas (9,9%),
representan el 75,0% de las razones de quejas, por lo tanto el hospital debe dirigir sus
esfuerzo disminuir o eliminar esas razones de quejas tomando alguna medida.
2.3 Organización de datos cuantitativos discretos
Cuando se tiene datos cuantitativos discretos en el cual el número de resultados posibles
diferente no sea muy grande, la información puede ser presentada directamente en una tabla de
frecuencias de modo que nuestros datos no perderán su identidad.
TITULO
Variable Frecuencias Frecuencias acumuladas
Cuantitativa absoluta relativa porcentual absoluta relativa porcentual
discreta (X) (ni) (hi) (pi) (Ni) (Hi) (Pi)
x1 n1 h1 p1 N1 H1 P1
x2 n2 h2 p2 N2 H2 P2

xk nk hk pk Nk Hk Pk
TOTAL n 1 100%
Fuente:
UNSAAC -7- Prof. Edgar Centeno H.
Estadística Semestre 2021-I
a) Frecuencia acumulada absoluta (Ni)
Es el número observaciones menores o iguales a x i . Viene dada por:
i
N i = n1 + n 2 + + n i =  n j ;  i = 1,2,...,k
j=1

Propiedades:
• N1 = n1
• Nk = n
b) Frecuencia acumulada relativa (Hi)
i Ni
Hi = h1 + h2 + + hi =  h j o Hi = ;  i = 1,2,...,k
j=1 n
Propiedades:
• H1 = h1
• Hk = 1
c) Frecuencia acumulada porcentual (Pi)
i
Pi = p1 + p2 + + pi =  p j o Pi = Hi  100% ;  i = 1,2,...,k
j=1

Propiedades:
• P1 = p1
• Pk = 100%

REPRESENTACIÓN GRÁFICA
Con frecuencia se utilizan tres tipos de gráficas: El diagrama de barras (o “bastones”), el
diagrama de puntos y el diagrama de escalera.
1. Diagrama de barras (bastones)
Se utiliza para la representación gráfica de variables cuantitativas discretas. Sobre el eje
horizontal se representan los valores discretos que toma la variable, y sobre cada uno de
ellos se dibujan rectángulos o segmentos de recta con una altura igual a la frecuencia
absoluta o relativa.
2. Diagrama de puntos.
Consiste en superponer tantos puntos como frecuencias se observen en cada valor de la
distribución.
3. Diagrama de escalera.
En este caso, sobre el eje horizontal se representan los valores discretos que toma la
variable, y sobre el eje vertical representamos las frecuencias acumuladas, obteniéndose
un gráfico en forma de escalera o escalón.
Ejemplo 2.6
Se considera el estudio de la variable X=número de componentes por familia observada en
una muestra 40 familias.
2 3 4 5 8 2 4 5 7 2 1 3 6 4 2 5 5 1 3 4
4 4 5 6 7 3 2 4 5 6 7 5 5 4 6 4 5 6 5 7
Elabore una tabla de frecuencias y represéntelo gráficamente.

UNSAAC -8- Prof. Edgar Centeno H.


Estadística Semestre 2021-I
Solución
Tabla Nº 2.2
Número de componentes por familia
xi ni hi pi Ni Hi Pi
1 2 0,050 5,0 2 0,050 5,0
2 5 0,125 12,5 7 0,175 17,5
3 4 0,100 10,0 11 0,275 27,5
4 9 0,225 22,5 20 0,500 50,0
5 10 0,250 25,0 30 0,750 75,0
6 5 0,125 12,5 35 0,875 87,5
7 4 0,100 10,0 39 0,975 97,5
8 1 0,025 2,5 40 1,000 100,0
TOTAL 40 1 100%
Fuente: Encuesta propia

25%
10
22,5%

8
Frecuencia absoluta

6
12,5% 12,5%
10% 10%
4

5%
2
2,5%

0
1 2 3 4 5 6 7 8
Número de componentes por familia

Figura 2.6: Diagrama de barras para el número de componentes por familia

Figura 2.7: Diagrama de puntos para el número de componentes por familia

UNSAAC -9- Prof. Edgar Centeno H.


Estadística Semestre 2021-I

Figura 2.8: Diagrama de escalera para el número de componentes por familia

2.4 Organización de datos cuantitativos mediante intervalos de clase


Cuando en una muestra, la variable cuantitativa es continua o el número de valores
diferentes de una variable cuantitativa discreta es muy grande, se recomienda, aún a costa de
perder información, agrupar los datos en clases o intervalos. En este caso los datos se clasifican
en intervalos mutuamente excluyentes. Ii = Li−1 ; Li , donde Li−1 es el límite inferior del

intervalo y L i el límite superior.


Los elementos de una distribución de frecuencias mediante intervalos son los mismos que
en el caso de una distribución de frecuencias para datos cuantitativos discretos.

Frecuencias Frecuencias acumuladas


Ii Conteos xi
Abs.(ni) Rel.(hi) Porc.(pi) Abs.(Ni) Rel.(Hi) Porc.(Pi)
L0 − L1 x1 n1 h1 p1 N1 H1 P1

L1 − L2 x2 n2 h2 p2 N2 H2 P2

Lk−1 − Lk xk nk hk pk Nk Hk Pk
TOTAL n 1 100%

NOTAS
a) El agrupamiento de los datos da lugar a pérdida de información, pero con ello se gana una
mayor manejabilidad de los mismos.
b) El número de intervalos y de las amplitudes de los mismos deben ser escogidos
convenientemente. En la práctica, es frecuente la elección de intervalos de amplitud
constante, ya que con ello se facilita el cálculo de la mayoría de las características
descriptivas de la estadística.

UNSAAC - 10 - Prof. Edgar Centeno H.


Estadística Semestre 2021-I

PASOS PARA LA ELABORACIÓN DE UNA TABLA DE FRECUENCIAS CON INTERVALOS

1º. Determinar el RECORRIDO o RANGO de los datos (R)

 
R = máx x i − mín x i
i i
 

2º. Determinar el NÚMERO DE INTERVALOS o NÚMERO DE CLASES (k)


Mientras menos clases se escoja será más fácil el trabajo, pero se perderá más información.
Debido a que no hay un acuerdo general acerca del número de clases que debe usarse
escogeremos de 5 a 10 clases. Un valor aproximado para hallar el número de clases se
obtiene con la Regla de Sturges.
k = 1 + 3,33logn
Otra regla razonable para obtener el número de clases aproximada se da por la fórmula:

k= n
En ambos casos el valor de k se redondea al entero más cercano.

3º. Determinar la AMPLITUD o ANCHO DE CLASE (w)


Se calcula dividiendo el recorrido R entre el número de clases k.
R
w=
k
En las aplicaciones es común considerar al valor de w con la misma cantidad de cifras
decimales que los datos originales y por ello w se redondea por exceso al valor más cercano.

4º. Determinar la MARCA DE CLASE o PUNTO MEDIO DEL INTERVALO (xi)


Li−1 + Li
xi =
2

REPRESENTACIÓN GRÁFICA
En este tipo de análisis es común utilizar cuatro tipos de gráficas: El histograma, el diagrama
escalonado, el polígono de frecuencias y el polígono de frecuencias acumuladas u ojiva.
1. Histograma
La idea del histograma es representar frecuencias por medio de áreas. Se construye
dibujando sobre cada intervalo un rectángulo de área proporcional a la frecuencia
absoluta (o relativa) correspondiente a dicho intervalo. Si las longitudes de los intervalos
no son iguales, cada rectángulo tendrá una altura igual a la densidad de frecuencia ni/wi. Si
por el contrario, las longitudes de los intervalos son iguales, se utiliza como altura la
frecuencia absoluta (ni) o relativa (hi).
2. Polígono de frecuencias.
Es el gráfico que se forma al unir los puntos medios de las bases superiores de los
rectángulos del histograma y cierra el polígono cortando el eje de las abscisas, de forma
que el área encerrada entre el polígono de frecuencias y el eje horizontal coincida con el
área del histograma.
UNSAAC - 11 - Prof. Edgar Centeno H.
Estadística Semestre 2021-I
3. Diagrama escalonado
El diagrama escalonado es un histograma donde los rectángulos tienen alturas
proporcionales a las frecuencias acumuladas.
4. Polígono de frecuencias acumuladas u ojiva.
Se construye a partir del diagrama escalonado, y ofrecen un medio gráfico para aproximar
el número o porcentaje de observaciones menores o iguales que un valor específico.

Ejemplo 2.7
Los datos que se muestran a continuación representan las edades de 50 pacientes atendidos en
el servicio de emergencia de un hospital de la ciudad:
63 89 36 49 56 64 59 35 78 43
53 70 57 62 43 68 62 26 64 72
52 51 62 60 71 61 55 59 60 67
57 67 61 67 51 81 53 64 76 44
73 56 62 63 60 58 45 36 60 50
a) Elabore la distribución o tabla de frecuencias con intervalos de igual amplitud.
b) Grafique el histograma, diagrama escalonado, el polígono de frecuencias y la ojiva.
Solución
a) Para elaborar la tabla de frecuencias debemos seguir los pasos que se señalaron
anteriormente.
Paso 1: Determinamos el recorrido o rango (R), observamos que la mayor edad es 89 años
y la menor edad 26 años, entonces el rango es R = 89 − 26 = 63 .
Paso 2: Determinamos el número de clases (k). En el ejemplo no nos dice con cuantas
clases debemos construir la tabla de frecuencias por lo que podemos seleccionar una
cantidad arbitrariamente (de 5 a 10) o aplicar la regla de Sturges (que es la que
utilizaremos). Como el tamaño de nuestra muestra es n=40, entonces, la regla de
Sturges nos sugiere usar 7 clases, es decir:
k = 1 + 3,33log50 = 6,65757  7
Observemos que utilizando la otra regla obtenemos el mismo resultado:

k = 50 = 7,07107  7
Paso 3: Ahora determinamos la amplitud o ancho de clase (w). En este caso:
R 63
w= = =9
k 7
En este caso el ancho de clase común y constante para todas las clases es igual al
número entero 9, y no necesitamos aproximar por exceso al valor más cercano, como
sí debería hacerse en la mayoría de los casos.
Paso 4: A continuación se construye la primera clase con ancho w=9. Para ello, primero
tenemos que encontrar los límites inferior y superior de esta clase.
Límite inferior: L0 = dato menor = 26

Límite superior: L1 = dato menor + w = 26 + 9 = 35

UNSAAC - 12 - Prof. Edgar Centeno H.


Estadística Semestre 2021-I
En consecuencia, la primera clase resulta ser el intervalo I1 = 26;35

Para obtener las clases que siguen a esta primera, tenga en cuenta que el límite inferior
de la clase precedente coincide con el límite superior de la clase anterior y que el ancho
de clase es w=9. De esta forma se obtienen las siete clases:
clase 1=I1 = L0 ;L1 = 26;35 : 26 − 35

clase 2=I2 = L1 ;L2 = 35;44 : 35 − 44

clase 7=I7 = L6 ;L7  = 80;89 : 80 − 89

Paso 5: Finalmente para determinar las frecuencia absolutas para cada clase usamos una
columna de conteos. Si uno de los datos cae en una clase, anotamos con un palote.
Luego se calculan las frecuencias relativas, frecuencias porcentuales y las respectivas
frecuencias acumuladas así como las marcas de clase. La tabla 2.3 contiene las
frecuencias para los 50 datos del ejemplo.
Tabla Nº 2.3
Edades de pacientes atendidos en un Hospital
Frecuencias Frecuencias acumuladas
Ii Conteos xi
Abs.(ni) Rel.(hi) Porc.(pi) Abs.(Ni) Rel.(Hi) Porc.(Pi)
26 – 35 30,5 1 0,02 2% 1 0,02 2%
35 – 44 39,5 5 0,10 10% 6 0,12 12%
44 – 53 48,5 7 0,14 14% 13 0,26 26%
53 – 62 57,5 16 0,32 32% 29 0,58 58%
62 – 71 66,5 14 0,28 28% 43 0,86 86%
71 – 80 75,5 5 0,10 10% 48 0,96 96%
80 – 89 84,5 2 0,04 4% 50 1,00 100%
TOTAL n=50 1 100%

b) Representación gráfica.

Figura 2.9: Histograma y polígono de frecuencias.


UNSAAC - 13 - Prof. Edgar Centeno H.
Estadística Semestre 2021-I

Figura 2.10: Diagrama escalonado y polígono de frecuencias acumulada u ojiva.

Ejemplo 2.8
Suponga que los datos que se presentan a continuación representan los precios en soles de un
determinado producto en 40 bodegas de una ciudad.
5,2 10,2 7,0 7,1 10,2 8,3 9,4 9,2 5,4 8,1
6,5 7,1 6,6 7,8 6,8 7,2 8,4 9,6 8,7 7,3
8,5 5,7 6,4 10,1 8,2 9,0 7,8 8,2 7,8 6,6
5,3 6,2 9,1 8,6 7,0 7,7 8,3 7,5 9,8 7,5
a) Elabore la distribución de frecuencias con 6 intervalos de clase.
b) Graficar el polígono de frecuencias.
c) Hallar el número de bodegas donde el precio del producto este entre S/6,9 y S/9,7.
d) Halle el porcentaje de bodegas en el que precio sean superiores o iguales a 9,0 soles.
Solución
a) Para elaborar la tabla de frecuencias seguiremos los pasos:
Paso 1: Determinamos el recorrido o rango (R): R = 10,2 − 5,2 = 5 .

Paso 2: Determinamos el número de clases (k): k = 6 (Valor que nos dan en la pregunta)
Paso 3: Ahora determinamos la amplitud o ancho de clase (w). En este caso:
R 5
w= = = 0,8333  0,9
k 6
El valor del ancho de clase que resulta al dividir el recorrido y el número de clases es
igual a 0,8333, pero como se indicó, w debe ser un número que debe tener la misma
cantidad de cifras decimales que los datos originales. Por lo tanto necesitamos un w que
se debe aproximar al décimo, esto es, al valor más cercano y por exceso. En nuestro
caso para que todos los datos en el momento del conteo caigan en las seis clases
utilizadas, aproximamos el ancho de clase a w = 0,9 .
Paso 4: Finalmente procedemos a contar los datos y a calcular sus frecuencias como se observa
en la tabla 2.4.
UNSAAC - 14 - Prof. Edgar Centeno H.
Estadística Semestre 2021-I
Tabla Nº 2.4
Niveles de hemoglobina de un grupo de niños
Frecuencias simples Frecuencias acumuladas
Ii Conteos xi
ni hi pi Ni Hi Pi
5,2 – 6,1 5,65 4 0,100 10% 4 0,100 10%
6,1 – 7,0 6,55 6 0,150 15% 10 0,250 25%
7,0 – 7,9 7,45 12 0,300 30% 22 0,550 55%
7,9 – 8,8 8,35 9 0,225 22,5% 31 0,775 77,5%
8,8 – 9,7 9,25 5 0,125 12,5% 36 0,900 90%
9,7 – 10,6 10,15 4 0,100 10% 40 1,000 100%
TOTAL n=4 1 100%

b) Polígono de frecuencias:

Precio del producto


Figura 2.11: Histograma y polígono de frecuencias.

c) Número de bodegas con precios que están entre S/6,9 y S/9,7 = 6,9 − 9,7 = 7,0 − 9,7

= 12 + 9 + 5 = 26
d) Porcentaje de bodegas con precios superiores o iguales a 9,0 soles = 9,0 − 10,6
12,5% 10%
x

8,8 9,0 9,7 10,6


En vista de que el valor 9,0 no es un límite de alguna clase, entonces el porcentaje de
bodegas con precios de producto superior o igual a 9,0 soles se calcula por aproximación
(proporciones), es decir: 9,0 − 9,7 + 9,7 − 10,6 = x + 10%
x 12,5%
=  x = 9,7%
9,7 − 9,0 9,7 − 8,8
 El porcentaje de bodegas con precios superiores o igual a 9,0 soles = 9,7%+10%
= 19,7%
UNSAAC - 15 - Prof. Edgar Centeno H.
Estadística Semestre 2021-I
DIAGRAMA DE TALLO Y HOJAS
El diagrama de tallo y hojas es un tipo de representación propuesta por el estadístico
norteamericano J. W. Tukey. Este tipo de diagrama permite obtener simultáneamente tanto la
distribución de frecuencias como su representación gráfica y tiene la ventaja de no perder
información. El diagrama está formado por una parte que es el tallo y otra parte que es la hoja.
Los datos aparecen representados en una tabla de dos columnas. En la columna de la derecha
(hoja) se representan las unidades de los valores, mientras que en la columna de la izquierda
(tallo) se representan las decenas, centenas, etc. Algunos programas estadísticos muestran a la
izquierda del diagrama las frecuencias absolutas acumuladas por ambos lados para los tallos.
Por ejemplo, el número 538 se puede descomponer como:
53 8
tallo hoja

1º. Ordene los datos de menor a mayor (opcional)


2º. Separar cada dato en un tallo y una hoja
3º. Agrupar los datos con los mismos tallos y ponga las hojas en un listado en orden creciente.

Ejemplo 2.9
En un programa para la detección temprana de hipertensión en una muestra de 50 varones con
edades comprendidas entre los 30 y 40 años, la distribución de la presión diastólica (mínima) en
mmHg fue la siguiente:
70 85 85 75 65 90 110 95 90 70
60 75 80 120 85 95 90 70 100 65
80 90 95 90 95 110 100 85 80 75
60 75 80 85 90 90 105 110 120 95
90 95 85 90 90 95 100 105 120 70
Organice los datos en un diagrama de tallo y hojas.
Solución
Utilizando el software Minitab obtenemos el diagrama de tallo y hojas.

Tallo Hojas
4 6 0055
12 7 00005555
22 8 0000555555
(17) 9 00000000005555555
11 10 00055
6 11 000
3 12 000

Figura 2.12: Diagrama de tallo y hojas para la presión diastólica.

Del diagrama de tallo y hojas se pueden sacar varias conclusiones, como entre otras, las
siguientes:
1º. La presión diastólica mínima es de 60 mmHg y la máxima de 120 mmHg.
2º. Doce varones tuvieron presiones diastólicas inferiores a 80 mmHg y 6 superiores a 105
mmHg.
3º. La mayoría de varones tienen presiones diastólicas comprendidas entre 75 y 100 mmHg.
4º. Diez varones tuvieron una presión diastólica de 90 mmHg y siete, 95 mmHg.
UNSAAC - 16 - Prof. Edgar Centeno H.
Estadística Semestre 2021-I
NOTA:
Algunos softwares como SPSS o Minitab pueden separar el tallo en una parte inferior (hojas
desde 0 a 4) y otra superior (hojas de 5 a 9).

Tallo Hojas
2 6 00
4 6 55
8 7 0000
12 7 5555
16 8 0000
22 8 555555
(10) 9 0000000000
18 9 5555555
11 10 000
8 10 55
6 11 000
3 11
3 12 000

Figura 2.13: Diagrama de tallo y hojas desdoblado para la presión diastólica.

UNSAAC - 17 - Prof. Edgar Centeno H.

También podría gustarte