Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Taller No 1 Manejo de Datos
Taller No 1 Manejo de Datos
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83
Taller #1
Manejo de datos
En el documento de Excel adjunto se encuentra una base de datos proveniente de datos abiertos
(https://www.datos.gov.co/Transporte/Accidentalidad-en-Barranquilla-victimas/y628-5q9a) donde se
reportan datos sobre las víctimas de accidentes en Barranquilla desde el 2015 hasta junio del 2023. Con
base a esta información resuelva los siguientes ejercicios.
1. Identifique la población y clasifique las variables en cualitativa nominal, cualitativa ordinal, cuantitativa
discreta, cuantitativa continua.
2. Construya una tabla de frecuencia y un gráfico de pastel para la variable condición víctima. Tenga
cuidado con las categorías repetidas. ¿Qué conclusiones puede obtener?
3. Para la variable cantidad víctima encuentre la media, mediana, moda, desviación estándar. Construya
un histograma. ¿Qué conclusiones puede obtener?
4. Divida la variable edad en dos grupos (hombres y mujeres) realice para cada grupo: a. Un histograma.
b. Un diagrama de caja y bigotes.
c. Halle la media, mediana y moda.
d. Escriba las conclusiones de lo encontrado en los puntos anteriores.
5. Plantee una pregunta problema que pueda ser resuelta con estos datos. Utilice gráficos y medidas de
resumen para responder dicha pregunta y justificar la respuesta.
2
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83
Ejercicio 1: Identifique la población y clasifique las variables en cualitativa nominal, cualitativa ordinal,
cuantitativa discreta, cuantitativa continua.
Solución:
Ejercicio 2: Construya una tabla de frecuencia y un gráfico de pastel para la variable condición víctima. Tenga
cuidado con las categorías repetidas. ¿Qué conclusiones puede obtener?
Solución:
3
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83
Se procedió a través del comando Ctrl + B, para buscar y reemplazar para evitar los datos parecidos.
Adjunto ejemplo con el caso de Peaton y Peatón (con acento).
Una vez realizado con todos los datos identificados la tabla queda así:
4
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83
5
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83
Conclusiones:
1. La mayor cantidad de accidentes registrados fueron de motociclistas, la cual tuvo un pico máximo en
el año 2022 por 1080 accidentes.
Tabla de Frecuencia Cantidad
Etiquetas de fila 2015 2016 2017 2018 2019 2020 2021 2022 2023 Total general
Acompañante 352 345 481 922 842 565 772 1063 460 5802
Ciclista 9 17 28 73 61 59 95 75 27 444
Conductor 80 68 92 281 202 178 235 313 153 1602
Menor de edad 1 1
Motociclista 453 419 454 974 899 594 839 1080 551 6263
No Reporto 7 1 3 1 3 2 17
Peaton 210 212 211 330 250 179 173 258 108 1931
Total general 1111 1062 1269 2580 2254 1576 2114 2793 1301 16060
2. Como se puede observar en la tabla Gravedad - Accidente nos muestra que un 2% de los accidentes
terminaron en el fallecimiento de las siento un total 142 en los años.
Cuenta de GRAVEDAD_ACCIDENTE Etiquetas de columna
Etiquetas de fila herido muerto Total general
Acompañante 5557 45 5602
Ciclista 434 10 444
Conductor 1587 15 1602
Menor de edad 1 1
Motociclista 6106 142 6248
No Reporto 15 2 17
Peaton 1810 110 1920
Total general 15510 324 15834
6
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83
Ejercicio 3: Para la variable cantidad víctima encuentre la media, mediana, moda, desviación estándar.
Construya un histograma. ¿Qué conclusiones puede obtener?
Solución:
𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷 𝑅𝑅𝑅𝑅𝑅𝑅,
𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 =
𝑇𝑇. 𝐺𝐺𝐺𝐺𝐺𝐺𝐺𝐺
15.834
𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 =
16.060
𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 = 1,0143
Dividirlo entre 2 y buscar el número que corresponde a la celda H7917. Siendo el resultado: 1.
Se puede confirmar a través de la formula +mediana en Excel.
7
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83
𝑥𝑥𝑥𝑥 2 . 𝑓𝑓𝑓𝑓
𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷 𝐸𝐸𝐸𝐸𝐸𝐸. = � − 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚2
𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷 𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅
18.970
𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷𝐷 𝐸𝐸𝐸𝐸𝐸𝐸. = � − 1,0142
15834
8
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83
Histograma:
Conclusiones:
1. La mayor cantidad de accidentes registrados tuvieron una víctima por accidente.
2. La menor cantidad de accidentes registrados tuvieron ocho víctimas por accidente.
3. El pico más alto en total de accidentes se presentó en 2022 con un total 2.793 víctimas.
4. El año 2016 fue el que menos víctimas registró siendo un total de 1.062.
9
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83
Ejercicio 4: Divida la variable edad en dos grupos (hombres y mujeres) realice para cada grupo:
a. Un histograma.
b. Un diagrama de caja y bigotes.
c. Halle la media, mediana y moda.
d. Escriba las conclusiones de lo encontrado en los puntos anteriores.
Solución:
Una vez separadas las cantidades por sexo obtenemos estos resultados para cada sexo:
Ejemplo: En el caso de los hombres hay dos que tienen 0 años, la tabla lo registra como 0 personas.
Una tabla dinámica suma los valores de forma predeterminada, por lo que de esta manera no se puede ver
cuantas personas hay por cada edad, por lo que se procede a ir a la configuración de campo de valor:
Presionamos
“Recuento”.
De esta manera ya podemos observar la cantidad de personas que hay por edad:
Continuando con el ejemplo del hombre con 0:
Ahora nos muestra que hay 2.
10
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83
Cajas y bigotes:
11
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83
Cajas y bigotes:
Para la media:
12
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83
Ejercicio 5: Plantee una pregunta problema que pueda ser resuelta con estos datos. Utilice gráficos y medidas
de resumen para responder dicha pregunta y justificar la respuesta.
¿Cuál es la cantidad de cantidad de conductores que forman parte de la categoría adulto mayor (60 años en
adelante)? A su vez muestre el porcentaje que representa este grupo a comparación del total.
Solución:
Luego de analizar la tabla se logró observar que la cantidad de conductores mayores de 60 años da un total
de: 214.
13
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)
Estadística
VERSIÓN: 00
Manejo de datos FECHA: Abril 2022
Taller No 1
TRD: 800-801-83
Luego de dividir las edades en intervalos de 10 en 10 se puede observar que este grupo representa un 10,35%
del total de conductores registrados en la matriz. Se adjuntan datos y gráfico:
Etiquetas de fila Suma de %
0-9 1,62%
10-19 4,63%
20-29 28,95% 60-69 6,96%
30-39 28,57% 70-79 2,31%
40-49 16,70%
50-59 9,18% 80-89 0,87%
60-69 6,96% 90-99 0,18%
70-79 2,31%
80-89 0,87%
100-109 0,01%
90-99 0,18% 120-129 0,02%
100-109 0,01%
120-129 0,02%
60 a 122 10,35%
Total general 100%
14
Nota: Verifique la versión vigente en (INGRESAR ENLACE DE LISTADO MAESTRO)