Está en la página 1de 7

REPORTE DE CALIDAD DE DATOS

PRESENTADO POR:
VALENTINA FUENTES MEJIA

PRESENTADO A:
OSWALDO VELEZ

ASIGNATURA:
APRENDIZAJE COMPUTACIONAL

FACULTAD DE INGENIERIA
INGENIERIA DE SISTEMA
UNIVERSIDAD DE CORBOBA

2021
INTRODUCCION
El caso de uso mostrado a continuación para aprender a elaborar un Reporte de
Calidad de Datos (RCD), como identificar aspectos de los datos y un plan de
manejo de dichos aspectos, se toma como insumo el conjunto de datos:
“Motor Insurance Fraud Claims

REPORTE DE CALIDAD DE DATOS


Numero de instancias: 500
DESCRIPCION DE LOS ATRIBUTOS:
1. Ingresos de seguro (cuantitativo)
Tipo Numérico
Ingreso de seguro(cualitativo)
Tiene seguro
No tiene seguro
2. Estado civil(cualitativo)
Tipo Nominal
Casado Divorciado
soltero
3. núm. Reclamantes(cuantitativo) tipo
numérico
4. tipo de lesión(cualitativo)
Tipo nominal
Tejido blando
Espalda
Miembro roto
Grave
5. estancia en el hospital durante la
noche(cualitativa)
Tipo numérico
Si paso la noche
No paso la noche
6. cantidad de reclamos(cuantitativo) Tipo
numérico
7. total reclamos (cuantitativo) Tipo
numérico
8. núm. Reclamo (cuantitativo) Tipo
numérico
9. núm. tejido blando (cualitativo) tipo
numérico
10. % tejido blando (cualitativo) Tipo
numérico
11. cantidad de reclamación recibida
(cualitativo) Tipo numérico
12. FRAUDE (cualitativo)
Tipo numérico
Si (0)
No (1)
OBSERVACION DE LOS DATOS:
Luego de abrir el archivo en weka se observa lo siguiente: En
el primer atributo

• que las instancias son 500


• que los atributos son 13
• el histograma
• tipo nominal

 En las siguientes imágenes observaremos todos los atributos de tipo


numérico con sus respectivos histogramas
 Y la siguiente informacion
• Mínimum
• Máximum
• Mean
• StdDev
• Missing
• Distinct
 En las siguientes imágenes observaremos todos los atributos de tipo
nominal con sus respectivos histogramas.
 También encontramos la siguiente información.
 Mínimum
 Máximum
 Mean
 StdDev
 Missing
 Distinct
CONCLUSION:

El reporte de calidad de datos va acompañado de histogramas y de la


caracterización de cada uno de los atributos que contiene el conjunto de datos y la
herramienta weka es una herramienta de mucha ayuda para hacer un RCD

También podría gustarte