Está en la página 1de 18

Estadística Descriptiva 2021 02 47

Unidad 2. Organización de datos

Logro de la unidad 2
Al finalizar la unidad 2, el estudiante interpreta tablas y gráficas estadísticas aplicando estas herra-
mientas en situaciones del ámbito empresarial valorando su utilidad en su profesión.

Temario
• Métodos de organización y presentación de datos:
• Datos cualitativos
• Datos cuantitativos
• Tablas de distribución de frecuencias y representaciones gráficas (circular, barras, Pareto)
• Tablas de doble entrada
Estadística Descriptiva 2021 02 48

Estadística descriptiva

Frecuencia absoluta simple de una clase


Es la cantidad de elementos que pertenecen a esa clase. Se denota por 𝑓𝑖 .

Frecuencia relativa simple de una clase


Es la proporción de elementos que pertenecen a esa clase. Se calcula dividiendo la frecuencia absoluta
entre el número total de datos. Se denota por ℎ𝑖 y se calcula con:

𝑓𝑖
ℎ𝑖 =
𝑛

Frecuencia porcentual simple de una clase


Es la frecuencia relativa multiplicada por 100%. Se denota por 𝑝𝑖 y se calcula con:

𝑝𝑖 = ℎ𝑖 × 100%

Distribución de frecuencias
Es un resumen, expresado en un cuadro, de un conjunto de datos que muestra las frecuencias absolu-
tas, relativas y porcentuales en cada una de varias clases que no se traslapan. La distribución de fre-
cuencias es un cuadro que se calcula de la siguiente manera:

Distribución de <unidades elementales> según <variable>


Variable Frecuencia absoluta 𝒇𝒊 Frecuencia relativa 𝒉𝒊 Frecuencia porcentual 𝒑𝒊
𝑓1
Categoría 1 𝑓1 ℎ1 = 𝑝1 = ℎ1 × 100%
𝑛
𝑓2
Categoría 2 𝑓2 ℎ2 = 𝑝2 = ℎ2 × 100%
𝑛
⋮ ⋮ ⋮ ⋮

𝑓𝑘
Categoría 𝑘 𝑓𝑘 ℎ𝑘 = 𝑝𝑘 = ℎ𝑘 × 100%
𝑛
Total 𝒏 1 100%
Fuente:

Título de una tabla de distribución de frecuencias

De acuerdo con el INEI, para los títulos seguiremos el siguiente esquema:

Distribución de <unidades elementales> según <variable>


Estadística Descriptiva 2021 02 49

Distribución de frecuencias de variables cualitativas


La distribución de frecuencias es un cuadro que se calcula de la siguiente manera:

Distribución de <unidades elementales> según <variable>


Variable Frecuencia absoluta fi Frecuencia relativa hi
𝑓1
Categoría 1 𝑓1 ℎ1 =
𝑛
𝑓2
Categoría 2 𝑓2 ℎ2 =
𝑛
⋮ ⋮ ⋮
𝑓𝑘
Categoría k 𝑓𝑘 ℎ𝑘 =
𝑛
𝑛 1
Fuente: …………………………

Ejemplo 15
La Defensoría del Pueblo presentó el Reporte de Conflictos Sociales N° 204, correspondiente al mes de
febrero de 2021, el cual da cuenta de 197 conflictos sociales registrados (144 activos y 53 latentes).

Distribución de conflictos sociales activos en el Perú según actividad, febrero 2021

Ejemplo 16
Las contraseñas más comunes han vuelto a ser combinaciones de números y palabras fáciles de adivi-
nar. Así lo demuestra la empresa NordPass en su estudio sobre las claves más usadas en 2020.

Distribución de aplicaciones según contraseña


Contraseña Frecuencia absoluta fi Frecuencia relativa hi
123456 2543285 0.4764
123456789 961 435 0.1801
picture1 371 612 0.0696
password 360 467 0.0675
12345678 322 187 0.0603
111111 230 507 0.0432
123123 189 327 0.0355
12345 188 268 0.0353
1234567890 171 724 0.0322
Total 5338812 1
Fuente: NordPass Noviembre 2020
Estadística Descriptiva 2021 02 50
Ejercicios

21. En enero del presente año se entrevistó a una muestra de 400 alumnos de pregrado de la univer-
sidad A y se obtuvo la siguiente información referente al plato peruano preferido.
Complete lo faltante.

Imagen tomada de https://sthephanierv.wordpress.com/2016/11/08/la-gastronomia-peruana-a-los-ojos-del-mundo/

Distribución de alumnos según plato peruano preferido


Plato peruano preferido Cantidad de alumnos Porcentaje de alumnos
Ají de gallina (pollo) 123
Lomo saltado 115
Ceviche 78 19,50%
Pollo a la brasa 45 11,25%
Causa 6,75%
Otro 3,00%
Total 400 100,00%
Fuente: Universidad A

22. La empresa DGS va a contratar más personal si el porcentaje de trabajos de la zona Norte supera
al 40%. Organice la siguiente información y proponga la decisión. ¿Se contratará más personal?

Norte Norte Este Este Este Este Este Norte Este Sur Sur Norte Norte Norte Este
Este Sur Sur Norte Sur Sur Este Sur Sur Norte Norte Norte Sur Norte Sur
Norte Este Sur Sur Norte Norte Norte Este Norte Sur Sur Este Sur Este Sur

23. En los Censos Nacionales 2017 ejecutados por el INEI se preguntó a todos los peruanos el idioma
o lengua con el que aprendió hablar, obteniéndose los siguientes resultados. Complete lo faltante.

Perú. Distribución de peruanos según idioma o lengua con el que aprendió hablar
Estadística Descriptiva 2021 02 51
Idioma o lengua con que aprendió a hablar Casos Porcentaje Porcentaje acumulado
Castellano 23 178 478
Quechua 3 799 780
Aimara 450 010 1,61% 98,15%
Ashaninka 73 567 0,26% 98,41%
Lengua de señas peruanas 10 447 0,04% 98,45%
Otro lengua extranjera 49 876 0,18% 98,63%
Otra lengua nativa u originaria 179 601 0,64% 99,27%
No sabe / No responde 204 301 0,73% 100,00%
Total 27 946 060 100,00% 100.00%
Fuente INEI. Censos Nacionales 2017

24. El objetivo de una investigación es estimar el porcentaje de peruanos que aprueban la gestión de
del presidente de la República, para lo cual se tomó una muestra aleatoria de personas de 18 a 70
años y se les preguntó por su opinión. Los resultados son los siguientes.

Desaprueba Aprueba Desaprueba Aprueba Desaprueba Desaprueba Desaprueba


No sabe Aprueba Aprueba Desaprueba Aprueba Aprueba Aprueba
Desaprueba Desaprueba Aprueba Aprueba Desaprueba No sabe Desaprueba
Aprueba Desaprueba Aprueba Aprueba Desaprueba Desaprueba Aprueba
Desaprueba Desaprueba Desaprueba Desaprueba Aprueba Desaprueba Desaprueba
Aprueba No sabe Desaprueba Desaprueba Aprueba Desaprueba No sabe
Aprueba Desaprueba Desaprueba Desaprueba Aprueba Aprueba Desaprueba
Desaprueba Desaprueba Desaprueba Aprueba Aprueba Desaprueba Desaprueba
Aprueba Desaprueba No sabe Aprueba Desaprueba Desaprueba Aprueba
Aprueba Aprueba Aprueba Desaprueba Desaprueba Desaprueba Desaprueba

Construya la distribución de frecuencias de los datos. Interprete los valores f2 y h1.


Estadística Descriptiva 2021 02 52

Gráficos estadísticos
• El método gráfico es una forma de simplificar lo tedioso y lo complejo
• Las personas ocupadas necesitan ayuda visual
• Un gráfico es más accesible que una tabla
• El método gráfico ayuda al cerebro, ya que permite entender y memorizar mejor.

Ejemplo 17
En enero de 2021, en WhatsApp tenía dos mil millones de usuarios activos. El alcance de la aplicación
es muy fuerte en mercados fuera de los Estados Unidos y es una de las aplicaciones sociales móviles
más populares en todo el mundo. Publicado por H. Tankovska en 10 de febrero de 2021

Distribución de usuarios activos de aplicaciones de mensajería según aplicación


Estadística Descriptiva 2021 02 53
Gráfico de barras
Es una forma de representar datos cualitativos resumidos en una distribución de frecuencias.
En uno de los ejes, se representan las categorías o clases de la variable; para el otro eje, se puede usar
una escala de frecuencias absolutas, relativas o porcentuales. Se traza una barra sobre cada indicador
de clase de una altura proporcional a la frecuencia correspondiente. Las barras deben estar separadas
para enfatizar el hecho de que cada clase es diferente de otra.

Ejemplo 18
España. Distribución de apps descargadas según aplicación

Tomado de https://es.statista.com/grafico/22369/numero-de-descargas-de-apps-en-espana/

Ejemplo 19
Distribución de casos confirmados de coronavirus al 12 de marzo de 2021 según país

Tomado de: https://es.statista.com/estadisticas/1091192/paises-afectados-por-el-coronavirus-de-wuhan-segun-los-casos-confirmados/


Estadística Descriptiva 2021 02 54
Diagrama circular

Cada sector circular representa la frecuencia observada de una clase o categoría. El sector circular que
representa a una determinada clase de la variable tiene un ángulo en el centro proporcional a la fre-
cuencia relativa de dicha clase. El ángulo que le corresponde a cada clase se obtiene multiplicando
360º por la respectiva frecuencia relativa.

Ejemplo 20

Según el II Informe Bienal sobre la Realidad Universitaria en el Perú publicado por la Superintendencia
Nacional de Educación Superior Universitaria en el año 2020, observamos que no hay gran diferencia
entre la matrícula universitaria entre hombres (48,9%) y mujeres (51,1%). Además, que dentro de las
ciencias sociales (52,8% del total), las ciencias administrativas son las que cuentan con más alumnos
(54,9%).

Distribución de alumnos de pregrado matriculados en el Perú según sexo

Distribución de alumnos de pregrado matriculados en el Perú según área del conocimiento


Estadística Descriptiva 2021 02 55
Según el mismo informe, observamos que el 45,7% de los investigadores registrados en el Registro
Nacional de Ciencia, Tecnología y de Innovación Tecnológica trabajan principalmente en universidades
públicas.

Distribución de investigadores universitarios registrados en el Renacyt


según tipo de gestión de la universidad donde investigan

Ejemplo 21

La Defensoría del Pueblo presentó el Reporte de Conflictos Sociales N° 204, correspondiente al mes de
febrero de 2021, el cual da cuenta -entre otros aspectos- de 197 conflictos sociales registrados (144
activos y 53 latentes).

Distribución de conflictos sociales en el Perú según actividad, febrero 2021


Estadística Descriptiva 2021 02 56
Ejercicios

25. América Noticias realizó Feminicidios 2019, un proyecto digital que busca registrar el número de
mujeres asesinadas en el Perú; de lo publicado por este proyecto se tiene los siguientes gráficos.
Póngales título.

Solución

Hotel/hostal Casa de familiar Centro de labores


5,7% 2,9% de la víctima
Casa de agresor 1,4%
6,4% Otros
29,3%

Casa de ambos
7,9%

Lugar desolado
9,3%

Calle-vía pública
12,1% Casa de la víctima
25,0%
Fuente: Feminicidios 2019

70 66

60
Número de feminicidas

50

40
28
30 25

20
11 10
10

0
Detenido sin Prófugo Libre en Cometió suicidio Otros
sentencia investigación
Fuente: Feminicidios 2019 Situación legal del feminicida
América Noticias

26. Se tiene como objetivo mostrar la composición porcentual de alumnos universitarios en el Perú
por tipo de institución educativa al final de la secundaria, para lo cual se tomó como referencia los
datos del II Censo Universitario 2010 realizado por el INEI, donde se preguntó a los alumnos
universitarios por el tipo de institución educativa donde terminaron su educación secundaria. Los
resultados se muestran en la siguiente tabla.

Título:
Estadística Descriptiva 2021 02 57
Tipo de institución fi hi
Estatal 256 060 0,5405
Particular 154 275 0,3256
Particular religioso 58 673 0,1238
No escolarizado 4 472 0,0094
Otro 309 0,0007
Total 473 789
Fuente:
Realice un diagrama circular con dichos datos.
Rpta:
Distribución de estudiantes de pregrado según institución donde
terminaron la secundaria
No escolarizado Otro
0.94% 0.07%
Particular religioso
12.38%

Estatal
54.05%
Particular
32.56%

Fuente: II Censo Universitario 2010 INEI Perú

27. El Banco Europeo de Inversiones publicó el 15 de marzo del 2021 la tercera edición de la encuesta
sobre el clima 2020-2021, que analiza las expectativas de los ciudadanos respecto a las políticas
de lucha contra el cambio climático. Ponga título al gráfico circular.
Estadística Descriptiva 2021 02 58
Frecuencias acumuladas, absolutas relativas y porcentuales

Frecuencia absoluta acumulada de una clase

Es la suma de la frecuencia absoluta de un valor determinado de la variable con las frecuencias abso-
lutas de los valores menores de la variable. Se denota por 𝐹𝑖 .

La frecuencia absoluta acumulada del último valor de la variable es igual al total de casos.

Frecuencia relativa acumulada de una clase

Es la suma de la frecuencia relativa de un valor determinado de la variable con las frecuencias relativas
de los valores menores de la variable. Se denota por 𝐻𝑖 .

La frecuencia relativa acumulada del valor más alto de la variable es igual a 1.

Frecuencia porcentual acumulada de una clase

Es la suma de la frecuencia porcentual de un valor determinado de la variable con las frecuencias por-
centuales de los valores menores de la variable. Se denota por 𝑃𝑖 .

La frecuencia porcentual acumulada del valor más alto de la variable es igual a 100%.

Distribución de <unidades elementales> según <variable>


Variable Frecuencia absoluta 𝒇𝒊 Frecuencia porcentual 𝒑𝒊 Frecuencia porcentual 𝑷𝒊
𝑓1
Categoría 1 𝑓1 𝑝1 = × 100% 𝑃1
𝑛
𝑓2
Categoría 2 𝑓2 𝑝2 = × 100% 𝑃2 = 𝑝1 + 𝑃1
𝑛

⋮ ⋮ ⋮ ⋮

𝑓𝑘
Otros 𝑓𝑘 𝑝𝑘 = × 100% 𝑃𝑘 = 𝑝𝑘 + 𝑃𝑘−1
𝑛

Total 𝒏 100% 100%

Fuente:
Estadística Descriptiva 2021 02 59
Diagrama de Pareto

El diagrama de Pareto es una representación gráfica que permite identificar y seleccionar los aspectos
prioritarios que hay que tratar en un determinado problema.

También se conoce como diagrama ABC o Ley de las prioridades 80 - 20, que dice: “el 80% de los
problemas que ocurren en cualquier actividad son ocasionados por el 20% de los elementos que inter-
vienen en producirlos” (pocos vitales, muchos triviales).

Según este concepto se tiene un problema con muchas causas, podemos decir que el 20% de las causas
resuelven el 80 % del problema. Por ejemplo, en control de calidad, se puede mostrar que la mayoría
de los defectos surgen de un número pequeño de causas.

Pasos para la elaboración del diagrama de Pareto

Los pasos para la elaboración del diagrama de Pareto son los siguientes:

1. Construya una tabla de distribución de frecuencias ordenando las categorías en forma descen-
dente respecto a la frecuencia.

• La categoría Otros se coloca al final, no importa cuán grande sea, pues está compuesta por
categorías cuyas frecuencias son menores al valor de la variable con frecuencia más pequeña
listada individualmente.
• Agregue a la tabla de distribución de frecuencias una columna para la frecuencia acumulada.

Distribución de <unidades elementales> según <variable>


Variable Frecuencia absoluta 𝒇𝒊 Frecuencia porcentual 𝒑𝒊 Frecuencia porcentual 𝑷𝒊
Categoría 1 𝑓1 𝑝1 𝑃1
Categoría 2 𝑓2 𝑝2 𝑃2
⋮ ⋮ ⋮ ⋮
Otros 𝑓𝑘 𝑝𝑘 𝑃𝑘
Total 𝒏 100% 100%
Fuente:

2. Dibuje los ejes verticales y horizontal, título, rótulos de los ejes y fuente.

• Dibuje un eje vertical izquierdo, un eje vertical derecho y uno horizontal.


• En el eje vertical izquierdo, ponga alguna de las frecuencias simples (𝑓𝑖 , ℎ𝑖 o 𝑝𝑖 ).
• Si usa la frecuencia absoluta 𝑓𝑖 , marque una escala de 0 a 𝑛.
• Si usa la frecuencia relativa ℎ𝑖 , marque una escala de 0 a 1.
• Si usa la frecuencia absoluta 𝑝𝑖 , marque una escala de 0% a 100%.
• En el eje vertical derecho, use alguna de las frecuencias acumuladas (𝐹𝑖 , 𝐻𝑖 o 𝑃𝑖 = 𝐻𝑖 %). Se
recomienda usar la frecuencia porcentual acumulada; en ese caso, marque una escala de 0%
a 100%.

• En el eje horizontal, marque los espacios donde estarán dibujadas las barras para cada una de
las categorías incluida la categoría Otros.
Estadística Descriptiva 2021 02 60

Distribución de unidades elementales según variable

Frecuencia acumulada porcentual


100%

Frecuencia simple
75%

50%

25%

Categoría 1 Categoría 2 Categoría 3 Otros

Variable
Fuente:

3. Grafique el diagrama de barras.


Distribución de unidades elementales según variable

Frecuencia acumulada porcentual


100%
Frecuencia simple

75%

50%

25%

Categoría 1 Categoría 2 Categoría 3 Otros

Variable
Fuente:

4. Dibuje la línea de frecuencias acumuladas (curva de Pareto). Indique las etiquetas de datos de las
frecuencias simples y de las frecuencias acumuladas.
Distribución de unidades elementales según variable

100%
Frecuencia acumulada porcentual

100% 𝟏𝟎𝟎%
𝑃3
Frecuencia simple

𝐏𝟑
𝑃2 75%
𝑃1 𝐏𝟐
𝐏𝟏
50%

25%

Categoría 1 Categoría 2 Categoría 3 Otros

Variable
Fuente:
Estadística Descriptiva 2021 02 61
Ejemplo 22

El gerente de producción de una empresa, que produce asientos de fibra de vidrio, quiere identificar
los problemas más frecuentes reportados en la fabricación de este producto, y planear soluciones de
acuerdo con la recurrencia del problema.

Al extraer una muestra aleatoria de productos fallados, obtuvo los siguientes resultados:

Distribución de productos según problemas reportados en los asientos de fibra de vidrio


Tipo de problema reportado Número de ocurrencias (fi)
Color inadecuado 28
Forma no simétrica 16
Medidas fuera de norma 50
Superficie rugosa 71
Bordes afilados 9
Desprendimiento de capa protectora 12
Otros 14
Fuente: Gerencia de Producción

Elabore el diagrama de Pareto.

Solución

Lo primero es ordenar los datos en orden descendente a la frecuencia fi. La categoría Otros va al final.

Luego, se calcula las frecuencias relativas y las relativas acumuladas.

Distribución de productos según problemas reportados de asientos de fibra de vidrio


Tipo de problema reportado fi hi Fi Hi
Superficie rugosa 71 0,355 71 0,355
Medidas fuera de norma 50 0,250 121 0,605
Color inadecuado 28 0,140 149 0,745
Forma no simétrica 16 0,080 165 0,825
Desprendimiento de capa protectora 12 0,060 177 0,885
Bordes afilados 9 0,045 186 0,930
Otros 14 0,070 200 1,000
Fuente: Gerencia de Producción
Estadística Descriptiva 2021 02 62

También se puede realizar el gráfico de Pareto usando las frecuencias relativas hi y las frecuencias
relativas acumuladas Hi.

Distribución de productos según problemas reportados de asientos de fibra de vidrio


Estadística Descriptiva 2021 02 63
Ejercicios

28. El Gerente Financiero del Banco JJF realizó un estudio sobre los principales problemas que decla-
raron los clientes que poseen la tarjeta de crédito TravelMax. Si se quiere identificar los problemas
más importantes que deben resolverse para solucionar el 70% de la problemática. ¿Usted que le
recomendaría a Gerente Financiero?

Distribución de … según …
Principal problema fi FI hi Hi
Poca información sobre beneficios 77 77 35,00% 35,00%
Alto costo de membresía 46 123 20,91% 55,91%
Pocos puntos TravelMax por compras 31 154 14,09% 70,00%
Pocos destinos para elegir 24 178 10,91% 80,91%
Altos intereses 19 197 8,64% 89,55%
Otros 23 220 10,45% 100,00%
Total 220 100,00%
Fuente: Banco JJF

29. La siguiente tabla fue desarrollada con información de los Censos Nacionales 2017. Se quiere rea-
lizar un comentario a partir de un gráfico que muestre que en pocos tipos de materiales de cons-
trucción en las paredes se concentra la mayor cantidad de viviendas.

Distribución de ……… según …………


Material de construcción predominante en las paredes Casos Porcentaje Porcentaje acumulado
Ladrillo o bloque de cemento 4 298 274 55,83% 55,83%

Adobe 1 791 829 23,27% 79,10%

Madera (pona, tornillo etc.) 727 778 9,45% 88,56%


Tapia 356 665 4,63% 93,19%
Triplay / calamina / estera 239 012 3,10% 96,29%

Otro material 285 342 3,71% 100,00%


Total 7 698 900 100,00% 100,00%
Fuente: Censos Nacionales 2017 INEI

Solución

La unidad elemental es ……

La variable en estudio es …..

El gráfico más adecuado es …….


Estadística Descriptiva 2021 02 64

Distribución de viviendas según material de construcción predominante en las paredes


100%
7 000 000 90%

Porcentaje acumulado de viviendas


6 000 000 80%
Número de viviendas

70%
5 000 000
60%
4 000 000 50%

3 000 000 40%

30%
2 000 000
20%
1 000 000
10%

0 0%
Ladrillo o bloque Adobe Madera (pona, Tapia Triplay / calamina Otro material
de cemento tornillo etc.) / estera

Fuente: Censos Nacionales 2017. INEI Material predominante en las paredes

30. En la agencia de viajes A se realizó una encuesta a 330 clientes respecto a las principales quejas
que tienen clientes acerca de los tours del tipo todo incluido al exterior. Las cuales se detallan en
el siguiente cuadro.
Distribución de clientes según principales quejas de clientes
Principal queja Frecuencia absoluta
Cambio de fecha de los vuelos 120
El hotel no era de la categoría que se veía en el folleto 94
Los hoteles no incluyen bebidas premium 61
La comida de los hoteles no es de calidad excelente 23
Otros 25
Que les venden otros servicios como tiempo compartido 7
Fuente: Dirección de Atención al cliente. Agencia A

Realice el diagrama de Pareto correspondiente a estos datos.

31. Objetivo: Identificar las principales quejas de los pasajeros sobre el servicio que brinda la aerolí-
nea. Teniendo en cuenta la siguiente información, elabore el diagrama de Pareto.

Distribución de pasajeros según principal queja del servicio de la aerolínea Wayra


Principal queja Número de pasajeros pi Fi Pi
Mucho tiempo en cola en el counter 124
La comida no es buena 59
Impuntualidad de los vuelos 25
Pocos vuelos 16
Tarifas muy caras 9
Otros 17
Fuente: Wayra S.A n = 250

También podría gustarte