Está en la página 1de 6

Tipos de delitos criminales en Chile desde

el 2005 al 2016
Asignatura: Sistemas De gestión Empresarial -Sección ICIE 1040.

Profesor: Cristian Gustavo Divin Ortiz


Fecha de envío: 23 de junio de 2022
Nombre de estudiantes: Juan Manuel Cueto Moreno
Constanza Vitalia Santiago Moran
Nirza Morelia Fierro Oñate.
Organización y Estructura
1. Verificamos que los tres archivos son CSV, por lo tanto, los valores estarán
separados por punto y coma.
2. Se verifica que las hojas de nuestros archivos excel correspondan a los nombres de
archivos.
3. Abrimos una nueva hoja de excel, y en la pestaña "datos", utilizamos el comando
"obtener datos”:
 Escogemos "de un archivo"-> de texto/CSV.
 Importamos nuestro archivo y en la columna origen de archivo,
modificamos a 65001:unicode(UTF-8) -> cargar.
 Teniendo seleccionada nuestra tabla, nos dirigimos a la pestaña de consulta
y eliminamos la conexión que se tenía con el archivo CSV original.
4. En el archivo categories_id en su columna felony_es existe la palabra veículo, por
lo cual con el atajo CTRL+B reemplazamos al texto correcto "Vehículo".
Análisis de datos

1. Al cargar los archivos en power Bi se verifica que los documentos categories_id y


felonies no tienen celdas vacías, por lo cual cargamos inmediatamente, por otro
lado, comunas_id si presenta not available y se consultara con nuestra tabla de
estrategias para tomar la mejor decisión para seguir analizando nuestra data.

Estrategia para datos no disponibles (NA - Not available)


Paso Detalle Verificador
1 Análisis exploratorio En Power BI - Sección estadísticas de columna
2 Densidad de NA Dividir total NA con total de registros
3 Analizar el registro Analizar el criterio del número obtenido en el paso 2
4 Si Densidad NA > 0.3 Proceder con la estrategia de datos
Filtrar datos eliminando los NA (transformándolos)
Si Densidad NA <= puede elegir si los hace 0
4 0.3 puede elegir si los convierte en la media

Estrategias de datos para NA


Opció
n Factor Regla
1 NA > 0.3 y NA < 0.5 Ocupar regla de la media
Ocupar regla del filtrado de columnas categóricas
2 NA >= 0.5 y NA < 0.7 es decir, dejar solo los valores válidos
3 NA >= 0.7 y NA = 1 No utilizar los datos

De acuerdo con nuestra Cheat sheet verificamos que las columnas


comuna_customs_id y comuna_tax_office_id tienen NA, por esta razón, calculamos
la densidad obteniendo 0.0086 y 0.0029 respectivamente, con esto decidimos
eliminar los NA. A continuación, se presenta una tabla sobre las diferencias de las
estadísticas de las columnas.
comuna_customs_id comuna_tax_office_id
Recuento 348 Recuento 348
Error 0 Error 0
Vacío 3 Vacío 1
Distintos 346 Distintos 348
Únicos 345 Únicos 348
NaN 0 NaN 0
Cero 0 Cero 0
Mín. 1101 Mín. 1101
Máx. 15202 Máx. 16404
Promedio 8544 Promedio 8535
Desviación estándar 3357 Desviación estándar 3686
Par 159 Par 160
Impar 186 Impar 187

Estructura de dashboard “Total_delitos”

1. Seleccionamos en objeto visual “Tarjeta” y de la tabla felonies marcamos la casilla


Σ cases, como resultado tendremos el total de delitos a nivel nacional en el rango
del 2005 al 2016.
2. Seleccionamos en objeto visual “Segmentación de datos” y de la tabla felonies
marcamos la casilla year.
3. Seleccionamos en objeto visual “Treemap” y de la tabla comunas_id y felonies
marcamos la casilla región_name y Σ cases respectivamente.
4. Seleccionamos en objeto visual “Grafico de barras agrupadas” y de la tabla
categories_id y felonies marcamos la casilla felony_es y Σ cases respectivamente.
5. Seleccionamos en objeto visual “Grafico de líneas” y de la tabla felonies marcamos
la casilla Σ cases y year.

Estructura de dashboard “Segmentación_delitos”

1. Seleccionamos en objeto visual “Segmentación de datos” y de la tabla felonies


marcamos la casilla year filtrando por los últimos 5 años.
2. En la tabla categories_id generamos una nueva medida:
 #categories_id = COUNTROWS(categories_id)
Luego seleccionamos en objeto visual “Tarjeta” y marcamos la nueva
casilla generada.
3. En la tabla categories_id generamos una nueva medida:
 #comunas_name = COUNTROWS( comunas_id )
Luego seleccionamos en objeto visual “Tarjeta” y marcamos la nueva
casilla generada.
4. Seleccionamos en objeto visual “Esquema jerárquico” y de la tabla comunas_id y
felonies marcamos la casilla comuna_name y Σ cases respectivamente,
adicionalmente filtramos en comuna_name por top N, se nos entregaran los
cálculos de delitos por comuna. Luego generaremos los mismos pasos anteriores,
pero agregando de categories_id la casilla felonies_es.

Máximo Delito

Creamos una nueva medida, esta tiene por nombre Delito max, hay que sumar en
la tabla delitos los casos. La fórmula de este es sum(felonies(casos)).
Seleccionamos una tabla y arrastramos la nueva medida creada (Delito max), nos
aparecerá un número, este significa el valor Máximo de delitos, no es la suma, es la
mayor cantidad de ocurrencias de delitos que hubo.

Mapa

Seleccionamos mapa para que nos mostrara los delitos por región y no nos
funcionó correctamente las ubicaciones como tal, ya que coinciden los nombres de
las comunas y regiones de Chile con las de otros países, por ende, para que el
mapa nos funcionara adecuadamente, buscamos una tabla en internet que nos
mostró la longitud y latitud de las comunas en Chile, finalmente se unió la tabla
con el mapa, para la obtención de este último y un resultado correcto.
Referencias
 https://campusvirtual.umayor.cl/ultra/courses/_95316_1/cl/outline

También podría gustarte