Está en la página 1de 1

ASIGNACIÓN

1) Leer los siguientes documentos:


 United Nations (2009). Making data meaningful: a guide to writing stories about
numbers. United Nations.
 United Nations (2009). Making data meaningful: a guide to presenting statistics.
United Nations.

2) El repositorio de aprendizaje de máquina de la Universidad de California Irvine


(UCI) contiene más de 400 bases de datos usadas en comunidades académicas de
todo el mundo. Las bases de datos se encuentran disponibles en el sitio web
https://archive.ics.uci.edu/ml/datasets.php. Para esta actividad cada grupo de trabajo
deberá seleccionar una base de datos. La selección de la base de datos debe
considerar los siguientes elementos:
 Contener un gran volumen de datos. Preferiblemente más de 1000
observaciones o instancias.
 Tener un número significativo de atributos o características. Preferiblemente
más de cinco atributos.
 Contener datos tanto cualitativos como cuantitativos. Dentro de los datos
cualitativos preferiblemente contener variables nominales y ordinales. Dentro
de los datos cualitativos preferiblemente considerar variables discretas y
continuas.
La selección de la base de datos debe ser cuidadosa ya que la misma base de datos
será usada en futuras asignaciones. Una vez seleccionada la base de datos realizar
una caracterización de los datos considerando lo siguiente:
a) Describir brevemente el contenido de la base de datos
b) Identificar la población
c) Identificar el número d observaciones o instancias
d) Describir y clasificar las características o atributos de la base de datos
e) ¿Cómo puede usarse la información para caracterizar el sistema bajo estudio?

También podría gustarte