Está en la página 1de 14

Estadística

VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83

Corporación Univeristaria de la Costa


CUC

Taller #1

Manejo de datos

Docente: Mg. Stat. Irina Romo Aguas.


Estudiante: Keily Travecedo.
1
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83

En el documento de Excel adjunto se encuentra una base de datos proveniente de datos abiertos
(https://www.datos.gov.co/Transporte/Accidentalidad-en-Barranquilla-victimas/y628-5q9a) donde se
reportan datos sobre las víctimas de accidentes en Barranquilla desde el 2015 hasta junio del 2023. Con
base a esta información resuelva los siguientes ejercicios.
1. Identifique la población y clasifique las variables en cualitativa nominal, cualitativa ordinal, cuantitativa
discreta, cuantitativa continua.

2. Construya una tabla de frecuencia y un gráfico de pastel para la variable condición víctima. Tenga
cuidado con las categorías repetidas. ¿Qué conclusiones puede obtener?

3. Para la variable cantidad víctima encuentre la media, mediana, moda, desviación estándar. Construya
un histograma. ¿Qué conclusiones puede obtener?

4. Divida la variable edad en dos grupos (hombres y mujeres) realice para cada grupo: a. Un histograma.
b. Un diagrama de caja y bigotes.
c. Halle la media, mediana y moda.
d. Escriba las conclusiones de lo encontrado en los puntos anteriores.

5. Plantee una pregunta problema que pueda ser resuelta con estos datos. Utilice gráficos y medidas de
resumen para responder dicha pregunta y justificar la respuesta.

2
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83

Ejercicio 1: Identifique la población y clasifique las variables en cualitativa nominal, cualitativa ordinal,
cuantitativa discreta, cuantitativa continua.

Solución:

Variable Tipo de Variable Cualitativa - Cuantitativa

AÑO_ACCIDENTE Discreta Cuantitativa


MES_ACCIDENTE Nominal Cualitativa
CONDICION_VICTIMA Nominal Cualitativa
GRAVEDAD_ACCIDENTE Ordinal Cualitativa
CLASE_ACCIDENTE Nominal Cualitativa
SEXO_VICTIMA Nominal Cualitativa
EDAD_VICTIMA Discreta Cuantitativa
CANTIDAD_VICTIMAS Discreta Cuantitativa
DIRECCION ACCIDENTE Nominal Cualitativa

Ejercicio 2: Construya una tabla de frecuencia y un gráfico de pastel para la variable condición víctima. Tenga
cuidado con las categorías repetidas. ¿Qué conclusiones puede obtener?

Solución:

Una vez identificadas las variables repetidas como:


Acompañante, Acompañante o Pasajero y Pasajero.

No reporto, No Reporta, Otros y (en


Etiquetas de fila Suma de CANTIDAD_VICTIMAS
blanco). Acompañante 905
Ciclista 444
Peatón y Peatón (con acento).
Conductor 1602
Menor de edad 1
Motociclista 6263
No reporto 5
Otros 6
Peaton 366
(en blanco)
Peatón 1565
Acompañante o Pasajero 4279
No Reporta 6
Pasajero 618
Total general 16060

3
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83

Se procedió a través del comando Ctrl + B, para buscar y reemplazar para evitar los datos parecidos.
Adjunto ejemplo con el caso de Peaton y Peatón (con acento).

Una vez realizado con todos los datos identificados la tabla queda así:

Condición Vícitma Suma de CANTIDAD_VICTIMAS


Acompañante 5802
Ciclista 444
Conductor 1602
Menor de edad 1
Motociclista 6263
No Reporto 17
Peaton 1931
Total general 16060

Nota: Conservando el total general

4
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83

Se procede a realiza la tabla de frecuencia y el gráfico de pastel.

Datos y Gráfico de pastel:

Condición Vícitma Suma de CANTIDAD_VICTIMAS


Acompañante 5802
Ciclista 444
Conductor 1602
Menor de edad 1
Motociclista 6263
No Reporto 17
Peaton 1931
Total general 16060

Datos de la tabla de frecuencia:

Tabla de Frecuencia Cantidad Victimas por Año


Etiquetas de fila 2015 2016 2017 2018 2019 2020 2021 2022 2023 Total general
Acompañante 352 345 481 922 842 565 772 1063 460 5802
Ciclista 9 17 28 73 61 59 95 75 27 444
Conductor 80 68 92 281 202 178 235 313 153 1602
Menor de edad 1 1
Motociclista 453 419 454 974 899 594 839 1080 551 6263
No Reporto 7 1 3 1 3 2 17
Peaton 210 212 211 330 250 179 173 258 108 1931
Total general 1111 1062 1269 2580 2254 1576 2114 2793 1301 16060

5
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83

Conclusiones:

1. La mayor cantidad de accidentes registrados fueron de motociclistas, la cual tuvo un pico máximo en
el año 2022 por 1080 accidentes.
Tabla de Frecuencia Cantidad
Etiquetas de fila 2015 2016 2017 2018 2019 2020 2021 2022 2023 Total general
Acompañante 352 345 481 922 842 565 772 1063 460 5802
Ciclista 9 17 28 73 61 59 95 75 27 444
Conductor 80 68 92 281 202 178 235 313 153 1602
Menor de edad 1 1
Motociclista 453 419 454 974 899 594 839 1080 551 6263
No Reporto 7 1 3 1 3 2 17
Peaton 210 212 211 330 250 179 173 258 108 1931
Total general 1111 1062 1269 2580 2254 1576 2114 2793 1301 16060

2. Como se puede observar en la tabla Gravedad - Accidente nos muestra que un 2% de los accidentes
terminaron en el fallecimiento de las siento un total 142 en los años.
Cuenta de GRAVEDAD_ACCIDENTE Etiquetas de columna
Etiquetas de fila herido muerto Total general
Acompañante 5557 45 5602
Ciclista 434 10 444
Conductor 1587 15 1602
Menor de edad 1 1
Motociclista 6106 142 6248
No Reporto 15 2 17
Peaton 1810 110 1920
Total general 15510 324 15834

3. La mayoría de estos accidentes fueron provocados por choques.


Cuenta de CLASE_ACCIDENTE Etiquetas de columna
Etiquetas de fila Acompañante Ciclista Conductor Menor de edad Motociclista No Reporto Peaton Total general
Atropello 140 13 36 299 3 1751 2242
Caida Ocupante 227 2 16 8 253
Choque 5058 426 1530 1 5822 14 147 12998
Incendio 20 1 21
Otro 57 3 4 81 13 158
Volcamiento 100 31 30 1 162
Total general 5602 444 1602 1 6248 17 1920 15834

6
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83

Ejercicio 3: Para la variable cantidad víctima encuentre la media, mediana, moda, desviación estándar.
Construya un histograma. ¿Qué conclusiones puede obtener?

Solución:

Para encontrar la media de esta variable se tomó en cuenta lo siguiente:

nvictimas Etiquetas de columna


Cantidad de victimas 2015 2016 2017 2018 2019 2020 2021 2022 2023 Total general
1 1100 1048 1221 2523 2191 1513 2048 2735 1277 15656
2 8 10 32 54 40 46 48 52 14 304
3 3 12 3 6 6 6 6 6 48
4 4 4 4 4 16
5 5 5 10
6 12 6 18
8 8 8
Total general 1111 1062 1269 2580 2254 1576 2114 2793 1301 16060

Datos registrados: 15.834


Total general: 16.060

Se procedió a realizar una división

𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷 𝑅𝑅𝑅𝑅𝑅𝑅,
𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 =
𝑇𝑇. 𝐺𝐺𝐺𝐺𝐺𝐺𝐺𝐺

15.834
𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 =
16.060

𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 = 1,0143

Para encontrar la mediana el procedimiento fue el siguiente:

Datos registrados: 15.834

Dividirlo entre 2 y buscar el número que corresponde a la celda H7917. Siendo el resultado: 1.
Se puede confirmar a través de la formula +mediana en Excel.

7
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83

Para el dato moda, se tomó en cuenta lo siguiente:

Cantidad de veces que un número víctimas se repiten:

Siendo el número 1 la moda debido a que se registra 15.656


veces.

Para la desviación estándar se procedió de la siguiente manera:

Definimos los datos a utilizar:


Xi fi Xi^2 x fi
1 15656 15656
2 304 1216
Datos registrados: 15.834 3 48 432
Media: 1,0143 4 16 256
Total: 1,0143 5 10 250
6 18 648
8 8 512
Total 18970

𝑥𝑥𝑥𝑥 2 . 𝑓𝑓𝑓𝑓
𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷 𝐸𝐸𝐸𝐸𝐸𝐸. = � − 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚2
𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅

18.970
𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷 𝐸𝐸𝐸𝐸𝐸𝐸. = � − 1,0142
15834

8
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83

Histograma:

Conclusiones:
1. La mayor cantidad de accidentes registrados tuvieron una víctima por accidente.
2. La menor cantidad de accidentes registrados tuvieron ocho víctimas por accidente.
3. El pico más alto en total de accidentes se presentó en 2022 con un total 2.793 víctimas.
4. El año 2016 fue el que menos víctimas registró siendo un total de 1.062.

9
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83

Ejercicio 4: Divida la variable edad en dos grupos (hombres y mujeres) realice para cada grupo:
a. Un histograma.
b. Un diagrama de caja y bigotes.
c. Halle la media, mediana y moda.
d. Escriba las conclusiones de lo encontrado en los puntos anteriores.

Solución:

Una vez separadas las cantidades por sexo obtenemos estos resultados para cada sexo:
Ejemplo: En el caso de los hombres hay dos que tienen 0 años, la tabla lo registra como 0 personas.

Una tabla dinámica suma los valores de forma predeterminada, por lo que de esta manera no se puede ver
cuantas personas hay por cada edad, por lo que se procede a ir a la configuración de campo de valor:

Presionamos
“Recuento”.

De esta manera ya podemos observar la cantidad de personas que hay por edad:
Continuando con el ejemplo del hombre con 0:
Ahora nos muestra que hay 2.

10
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83

Luego de realizar esta configuración se procede a establecer intervalos para el histograma:

Excel nos ofrece un intervalo de 10:

Resultado para la tabla de mujeres:

Etiquetas de fila Cuenta de EDAD_VICTIMA


1-10 77
11-20 228
21-30 958
31-40 923
41-50 587
51-60 308
61-70 215
71-80 78
81-90 29
91-100 6
Total general 3409

Cajas y bigotes:

11
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83

Resultado para la tabla de hombres:

Etiquetas de fila Cuenta de EDAD_VICTIMA


0-9 189
10-19 534
20-29 3661
30-39 3574
40-49 1996
50-59 1133
60-69 877
70-79 279
80-89 107
90-99 22
100-109 1
120-129 3
Total general 12376

Cajas y bigotes:

Para la media:

Dato Mujeres Hombres


Media 4,63 1,28
Mediana 35 34
Moda 34 años = 116 casos 31 años = 455 casos

12
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83

Ejercicio 5: Plantee una pregunta problema que pueda ser resuelta con estos datos. Utilice gráficos y medidas
de resumen para responder dicha pregunta y justificar la respuesta.

¿Cuál es la cantidad de cantidad de conductores que forman parte de la categoría adulto mayor (60 años en
adelante)? A su vez muestre el porcentaje que representa este grupo a comparación del total.

Solución:

Luego de analizar la tabla se logró observar que la cantidad de conductores mayores de 60 años da un total
de: 214.

Etiquetas de fila Cuenta de EDAD_VICTIMA


60 14
61 37
62 22
63 28
64 14
65 15
66 10
67 17
68 10
69 13
70 8
71 8
72 5
73 1
74 1
75 1
76 2
77 1
78 4
79 1
86 1
89 1
Total general 214

13
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83

Luego de dividir las edades en intervalos de 10 en 10 se puede observar que este grupo representa un 10,35%
del total de conductores registrados en la matriz. Se adjuntan datos y gráfico:
Etiquetas de fila Suma de %
0-9 1,62%
10-19 4,63%
20-29 28,95% 60-69 6,96%
30-39 28,57% 70-79 2,31%
40-49 16,70%
50-59 9,18% 80-89 0,87%
60-69 6,96% 90-99 0,18%
70-79 2,31%
80-89 0,87%
100-109 0,01%
90-99 0,18% 120-129 0,02%
100-109 0,01%
120-129 0,02%
60 a 122 10,35%
Total general 100%

14
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)

También podría gustarte