Está en la página 1de 13

Trabajo Práctico 2 [TP2]

Pregunta en la posición 1
1
 
5 puntos 
La pregunta 1 está anclada. Haga clic para desanclar. 
 
Pregunta en la posición 1 
A partir de los datos que Juan Manuel recibe en su base original, recodifica
los valores de las variables “POINT_X” y “POINT_Y” para obtener las zonas
en las cuales ocurren los ataques. A partir de esta recodificación y observando
los valores de la variable “zona del ataque” se infiere que esta es: 
A partir de los datos que Juan Manuel recibe en su base original, recodifica
los valores de las variables “POINT_X” y “POINT_Y” para obtener las zonas
en las cuales ocurren los ataques. A partir de esta recodificación y observando
los valores de la variable “zona del ataque” se infiere que esta es: 

Cualitativa nominal, ya que la numeración de las zonas no implica una


relación de orden, sino que es una mera etiqueta para designarlas.

Cuantitativa continua, ya que las zonas están numeradas de manera continua a


través de valores numéricos.

Cualitativa ordinal, ya que la numeración de las zonas implica un orden de


prelación o importancia entre ellas.

Cuantitativa discreta, ya que es una variable numérica cuyos valores


enumeran unidades indivisibles como son las zonas.
Pregunta en la posición 2
2
 
5 puntos 
La pregunta 2 no está anclada. Haga clic para anclar. 
 
Pregunta en la posición 2 
Juan Manuel analiza matemáticamente las propiedades de la variable “edad”
de la víctima de los distintos hechos y encuentra que la edad promedio es de:
Juan Manuel analiza matemáticamente las propiedades de la variable “edad”
de la víctima de los distintos hechos y encuentra que la edad promedio es de:

18 años.
20,5 años.

22,7 años.
 

24,3 años.
Pregunta en la posición 3
3
 
5 puntos 
La pregunta 3 está anclada. Haga clic para desanclar. 
 
Pregunta en la posición 3 
Juan Manuel se ha propuesto, dentro de su prueba piloto, analizar perfiles de
riesgo de distintas víctimas de ataque. En esas condiciones, ¿cuáles de las
siguientes variables disponibles en la base de datos ya pre-procesada debería
seleccionar?
Juan Manuel se ha propuesto, dentro de su prueba piloto, analizar perfiles de
riesgo de distintas víctimas de ataque. En esas condiciones, ¿cuáles de las
siguientes variables disponibles en la base de datos ya pre-procesada debería
seleccionar?

Sexo, rango etario, ocupación, horario, día, POINT_X, POINT_Y, ya que son
variables que hacen a las condiciones de vulnerabilidad o posible
vulnerabilidad de la víctima.

Nombre y apellido, sexo, rango etario, ocupación, horario y día, ya que son
variables que hacen a las condiciones de vulnerabilidad o posible
vulnerabilidad de la víctima

Sexo, rango etario, ocupación, horario, día y fecha, ya que son variables que
hacen a las condiciones de vulnerabilidad o posible vulnerabilidad de la
víctima.

Sexo, rango etario, ocupación, horario, día, lugar del ataque, ya que son
variables que hacen a las condiciones de vulnerabilidad o posible
vulnerabilidad de la víctima.
Pregunta en la posición 4
4
 
5 puntos 
La pregunta 4 no está anclada. Haga clic para anclar. 
 
Pregunta en la posición 4 
En la base original que Juan Manuel evalúa, teniendo en cuenta que el valor
para la variable “características del sindicado” para el registro #51, la
situación es la siguiente: Hay dos datos, cuyas variables son “estatura” y
“complexión” y sus valores son “alto” y “delgado”, respectivamente.
En la base original que Juan Manuel evalúa, teniendo en cuenta que el valor
para la variable “características del sindicado” para el registro #51, la
situación es la siguiente: Hay dos datos, cuyas variables son “estatura” y
“complexión” y sus valores son “alto” y “delgado”, respectivamente.

Falso, ya que hay una única oración que contiene la información, por lo cual
hay un solo dato.

Verdadero, ya que ambas palabras corresponden a características distintas,


susceptibles de ser medidas de forma separada.
Pregunta en la posición 5
5
 
5 puntos 
La pregunta 5 no está anclada. Haga clic para anclar. 
 
Pregunta en la posición 5 
Juan Manuel elaboró el siguiente gráfico para representar la distribución de
los valores de la variable “sexo”. ¿Es correcto lo que hizo? 

Juan Manuel elaboró el siguiente gráfico para representar la distribución de


los valores de la variable “sexo”. ¿Es correcto lo que hizo? 
Sí, ya que la variable padece de sinonimia.

Sí, ya que la variable padece multivaluación.

No, ya que hay ausencia de datos.

No, ya que la variable padece de multivaluación.


Pregunta en la posición 6
6
 
5 puntos 
La pregunta 6 no está anclada. Haga clic para anclar. 
 
Pregunta en la posición 6 
Para dar una solución al problema de los datos faltantes sin tener que volver a
la fuente para completarlos y, al mismo tiempo, no sesgar la muestra, la única
cosa que Juan Manuel tiene que hacer es elegir una palabra que represente la
ausencia de datos y usarla de forma consistente a lo largo y ancho de toda la
edad estimada de datos.
Para dar una solución al problema de los datos faltantes sin tener que volver a
la fuente para completarlos y, al mismo tiempo, no sesgar la muestra, la única
cosa que Juan Manuel tiene que hacer es elegir una palabra que represente la
ausencia de datos y usarla de forma consistente a lo largo y ancho de toda la
base de datos.
Verdadero, ya que esa uniformidad permite que la ausencia de datos no
moleste al analista ni distorsione los resultados del análisis.

Falso, ya que la palabra utilizada para designar la ausencia de datos podría ser
interpretada por los algoritmos como un valor más y eso distorsionaría los
resultados del análisis.
Pregunta en la posición 7
7
 
5 puntos 
La pregunta 7 no está anclada. Haga clic para anclar. 
 
Pregunta en la posición 7 
Las variables “número de caso” y “número de sindicados” que aparecen en la
base original evaluada por Juan Manuel son:
Las variables “número de caso” y “número de sindicados” que aparecen en la
base original evaluada por Juan Manuel son:

Cualitativas nominales, dado que ambas variables tienen valores que son
distintos unos de otros.

Cuantitativas discretas, dado que la suma y/o la diferencia entre los valores de
ambas variables tiene un significado conceptual preciso.

Cuantitativas continuas, dado que los valores pueden asumir cualquier valor
necesario y la división entre sus valores tiene un significado preciso.

Cualitativas ordinales, dado que los valores de ambas variables tienen un


orden entre sí.
Pregunta en la posición 8
8
 
5 puntos 
La pregunta 8 está anclada. Haga clic para desanclar. 
 
Pregunta en la posición 8 
Juan Manuel estudia la variable “hora” y calcula sus distintas medidas de
centralidad. ¿Cuál es el valor que divide la distribución de horas de los
distintos hechos delictivos en dos grupos exactamente iguales?
Juan Manuel estudia la variable “hora” y calcula sus distintas medidas de
centralidad. ¿Cuál es el valor que divide la distribución de horas de los
distintos hechos delictivos en dos grupos exactamente iguales?
14:12:30 h, ya que es el segundo cuartil de la distribución de la variable
“hora”.

15:24:44 h, ya que es el quincuagésimo percentil de la distribución de la


variable “hora”.

13:19:15 h, ya que es el semi-rango de la distribución de la variable “hora”.

15:02:18 h, ya que es la mediana de la distribución de la variable “hora”.


 
Pregunta en la posición 9
9
 
5 puntos 
La pregunta 9 no está anclada. Haga clic para anclar. 
 
Pregunta en la posición 9 
Juan Manuel analiza los valores de la variable “mes” y su distribución de
frecuencias. Esta variable es una de las que él ha obtenido a partir del proceso
de recodificación de variables pre-existentes. A partir de este análisis
encuentra que la moda de la distribución es:
Juan Manuel analiza los valores de la variable “mes” y su distribución de
frecuencias. Esta variable es una de las que él ha obtenido a partir del proceso
de recodificación de variables pre-existentes. A partir de este análisis
encuentra que la moda de la distribución es:

Diciembre, ya que su frecuencia es de 115 casos.

Marzo, ya que su frecuencia es de 123 casos.

Agosto, ya que su frecuencia es de 100 casos.

Octubre, ya que su frecuencia es de 9.


Pregunta en la posición 10
10
 
5 puntos 
La pregunta 10 no está anclada. Haga clic para anclar. 
 
Pregunta en la posición 10 
La escala de medición de la variable “altura estimada”, que consta en la base
original que Juan Manuel evaluó, es:
La escala de medición de la variable “altura estimada”, que consta en la base
original que Juan Manuel evaluó, es:

Nominal, ya que la estatura de las personas varía de una persona a otra.

De intervalos iguales, ya que solamente la diferencia de estaturas entre


personas tiene sentido.

De cocientes, ya que el cero de la escala corresponde a una situación en que la


persona tiene nula estatura.

Ordinal, ya que existe un orden de estaturas donde las personas más altas
tienen un valor mayor en la escala de medición.
Pregunta en la posición 11
11
 
5 puntos 
La pregunta 11 no está anclada. Haga clic para anclar. 
 
Pregunta en la posición 11 
Dados los requerimientos de los algoritmos de aprendizaje automático
aplicados al ámbito de la criminología y la seguridad pública, y considerando
la base de datos tal y cómo Juan Manuel la encontró, ¿qué combinación de
variables tendría más probabilidades de conducir a grupos de casos
semejantes?
Dados los requerimientos de los algoritmos de aprendizaje automático
aplicados al ámbito de la criminología y la seguridad pública, y considerando
la base de datos tal y cómo Juan Manuel la encontró, ¿qué combinación de
variables tendría más probabilidades de conducir a grupos de casos
semejantes?

“Sexo”, “rango edad”, “día”, “descripción del arma”, “POINT_X” y


“POINT_Y”, ya que estas variables son operacionalmente accionables.

“Sexo”, “rango edad”, “día”, “categoría de arma” y “zona del ataque”, ya que
estas variables son cualitativas y tienen poca dispersión de valores.

“Sexo”, “rango edad”, “hora”, “categoría de arma” y “zona del ataque”, ya


que estas variables son cualitativas y tienen un mejor acuerdo con los
objetivos del proyecto.
“Sexo”, “rango edad”, “fecha”, “categoría de arma”, “características del
sindicado” y “zona del ataque”, ya que estas variables son accionables y
tienen un mejor acuerdo con los objetivos del proyecto.
Pregunta en la posición 12
12
 
5 puntos 
La pregunta 12 está anclada. Haga clic para desanclar. 
 
Pregunta en la posición 12 
¿Cuál combinación de defectos presenta la variable “edad estimada” (del
agresor) tal como Juan Manuel la encontró al momento de evaluar la base de
datos?
¿Cuál combinación de defectos presenta la variable “edad estimada” (del
agresor) tal como Juan Manuel la encontró al momento de evaluar la base de
datos?

Ausencia de datos y sinonimia, ya que el 0 representa valores desconocidos y


varias celdas tienen más de una edad.

Ausencia de datos y multivaluación, ya que el 0 representa valores


desconocidos y varias celdas tienen más de una edad.

Incompatibilidad y multivaluación, ya que el 0 es incompatible con cualquier


edad real y varias celdas tienen más de una edad.

Ausencia de datos y redundancia, ya que el 0 representa valores desconocidos


y varias celdas tienen más de una edad.
Pregunta en la posición 13
13
 
5 puntos 
La pregunta 13 no está anclada. Haga clic para anclar. 
 
Pregunta en la posición 13 
La variable “tatuajes” que se encuentra en la base original recibida por Juan
Manuel es dicotómica.
La variable “tatuajes” que se encuentra en la base original recibida por Juan
Manuel es dicotómica.

Falso, ya que sus valores posibles son “sí”, “no” y “ocasionalmente”.


Verdadero, ya que sus valores posibles son “sí” y “no”.
Pregunta en la posición 14
14
 
5 puntos 
La pregunta 14 no está anclada. Haga clic para anclar. 
 
Pregunta en la posición 14 
Considera la variable “rango de edad”, obtenida por Juan Manuel a partir de la
variable “edad”. ¿Cómo se divide la edad en rangos según la información
disponible en la base de datos? (Ayuda: observa qué rango de edades
corresponde a cada valor).
Considera la variable “rango de edad”, obtenida por Juan Manuel a partir de la
variable “edad”. ¿Cómo se divide la edad en rangos según la información
disponible en la base de datos? (Ayuda: observa qué rango de edades
corresponde a cada valor).

Niño (0-10 años), adolescente (11-17 años), adulto joven (18-30 años), adulto
mediana edad (31-59 años) y adulto tercera edad (61-78 años), ya que los
valores se obtienen por un proceso de potenciación a partir de la edad.

Niño (0-12 años), adolescente (13-17 años), adulto joven (18-40 años), adulto
mediana edad (41-59 años) y adulto tercera edad (60-68 años), ya que los
valores se obtienen por un proceso de discretización a partir de la edad.

Niño (0-12 años), adolescente (13-17 años), adulto joven (18-40 años), adulto
mediana edad (41-59 años) y adulto tercera edad (61-68 años), ya que los
valores se obtienen por un proceso de generalización a partir de la edad.
Pregunta en la posición 15
15
 
5 puntos 
La pregunta 15 no está anclada. Haga clic para anclar. 
 
Pregunta en la posición 15 
Al evaluar la variable “edad”, Juan Manuel realiza un histograma para
estudiar la distribución de los valores. A partir de esta representación y de las
propiedades de centralidad de la distribución, concluye que la distribución de
datos está:
Al evaluar la variable “edad”, Juan Manuel realiza un histograma para
estudiar la distribución de los valores. A partir de esta representación y de las
propiedades de centralidad de la distribución, concluye que la distribución de
datos está:
Positivamente sesgada con una media desplazada hacia la derecha, ya que eso
indican las medidas de centralidad de la variable “edad”.

Positivamente sesgada con una media desplazada hacia la izquierda, ya que


eso indican las medidas de dispersión de la variable “edad”.

Negativamente sesgada con una media desplazada a la izquierda, ya que eso


indican las medidas de dispersión de la variable “edad”.

Negativamente sesgada con una media desplazada a la derecha, ya que eso


indican las medidas de centralidad de la variable “edad”.
Pregunta en la posición 16
16
 
5 puntos 
La pregunta 16 no está anclada. Haga clic para anclar. 
 
Pregunta en la posición 16 
La variable “estado”, que Juan Manuel encontró en la base de datos, tiene un
defecto fundamental. ¿Cuál es?
La variable “estado”, que Juan Manuel encontró en la base de datos, tiene un
defecto fundamental. ¿Cuál es?

Sinonimia, dado que algunos valores conceptualmente únicos aparecen


escritos de distintas maneras.

Ininterpretabilidad, dado que del nombre de la variable y sus valores posibles


no se infiere su significado.

Multivaluación, ya que en algunas celdas aparece más de un valor para la


variable en un mismo registro.

Superposición de criterios, dado que los valores posibles corresponden a


distintos esquemas de clasificación de la variable.
Pregunta en la posición 17
17
 
5 puntos 
La pregunta 17 no está anclada. Haga clic para anclar. 
 
Pregunta en la posición 17 
Considera la variable “hora”, tal como aparece en la base de datos original
analizada por Juan Manuel. ¿Cuál combinación de defectos presenta la
variable en cuestión?
Considera la variable “hora”, tal como aparece en la base de datos original
analizada por Juan Manuel. ¿Cuál combinación de defectos presenta la
variable en cuestión?

Ausencia de datos, sinonimia y superposición de criterios.

Ausencia de datos, sinonimia e imprecisión. No es

Ausencia de datos, redundancia y superposición de criterios.

Ausencia de datos, imprecisión y superposición de criterios. No es


Pregunta en la posición 18
18
 
5 puntos 
La pregunta 18 no está anclada. Haga clic para anclar. 
 
Pregunta en la posición 18 
Juan Manuel analiza la desviación típica de la variable “altura estimada”, tal
como la encuentra en la base de datos. Teniendo en cuenta que para el cálculo
se debe ignorar las celdas cuyo valor se desconoce y las multivaluadas, la
desviación típica es:
Juan Manuel analiza la desviación típica de la variable “altura estimada”, tal
como la encuentra en la base de datos. Teniendo en cuenta que para el cálculo
se debe ignorar las celdas cuyo valor se desconoce y las multivaluadas, la
desviación típica es:

0,1 m, ya que las alturas consideradas tienen una desviación intermedia con
relación a la altura promedio.

0,08 m, ya que las alturas consideradas están muy concentradas alrededor de


una altura media.

0 m, ya que hay muy pocas estimaciones de estatura y todos sus valores son
iguales.

0,33 m, ya que las alturas consideradas están fuertemente desviadas con


relación a la altura media.
Pregunta en la posición 19
19
 
5 puntos 
La pregunta 19 no está anclada. Haga clic para anclar. 
 
Pregunta en la posición 19 
Considera los registros duplicados presentes en la base de datos original que
Juan Manuel revisó y compáralos con la base final, luego del pre-
procesamiento. ¿Qué alternativa de resolución prefirió Juan Manuel para
abordar el problema de la duplicación en dichos registros?
Considera los registros duplicados presentes en la base de datos original que
Juan Manuel revisó y compáralos con la base final, luego del pre-
procesamiento. ¿Qué alternativa de resolución prefirió Juan Manuel para
abordar el problema de la duplicación en dichos registros?

Mantuvo los registros duplicados correspondientes a los valores 245 y 617, ya


que correspondían a la presencia de distintas víctimas correspondientes a un
mismo ataque.

Mantuvo los registros duplicados correspondientes a los valores 520 y 784, ya


que correspondían a la presencia de distintas víctimas correspondientes a un
mismo ataque.

Eliminó los registros duplicados correspondientes a los valores 520 y 784 de


la variable “número”, ya que eran copias exactas debidas a errores de carga o
sistema.

Eliminó los registros duplicados correspondientes a los valores 245 y 617 de


la variable “número”, ya que eran copias exactas debidas a errores de carga o
sistema.
Pregunta en la posición 20
20
 
5 puntos 
La pregunta 20 no está anclada. Haga clic para anclar. 
 
Pregunta en la posición 20 
Dentro de las distintas opciones que podía explorar, Juan Manuel se ha
propuesto realizar vinculación de casos. Para eso, buscará formar grupos de
casos que compartan características tales que sugieran la presencia de un
agresor común a todos los casos dentro de cada grupo. Para eso, ¿cuál
combinación de variables le conviene elegir?
Dentro de las distintas opciones que podía explorar, Juan Manuel se ha
propuesto realizar vinculación de casos. Para eso, buscará formar grupos de
casos que compartan características tales que sugieran la presencia de un
agresor común a todos los casos dentro de cada grupo. Para eso, ¿cuál
combinación de variables le conviene elegir?

Sexo, rango etario, ocupación, horario de servicio, día, lugar del ataque,
categoría de arma y vehículo utilizado, ya que son variables que hacen a las
preferencias de un agresor y tienen una apropiada granularidad.

Sexo, rango etario, ocupación, horario, día, POINT_X, POIN_Y, categoría de


arma y vehículo utilizado, ya que son variables que hacen a las preferencias de
un agresor y tienen una apropiada granularidad.

Sexo, rango etario, ocupación, horario, día, altura estimada, categoría de arma
y vehículo utilizado, ya que son variables que hacen a las preferencias de un
agresor y tienen una apropiada granularidad.

Sexo, rango etario, ocupación, hora, día, lugar del ataque, categoría de arma y
vehículo utilizado, ya que son variables que hacen a las preferencias de un
agresor y tienen una apropiada granularidad.

También podría gustarte