Está en la página 1de 8

APLICACIONES DE CIENCIAS DE DATOS EN INGENIERIA

2° CUATRIMESTRE 2022

TP 2 CLASIFICACION

Ejercicio 1 – Caudalímetros Ultrasónicos A

El data set “meter_a” contiene 87 observaciones y 37 parámetros de diagnóstico para un


medidor de flujo ultrasónico líquido (USM) de 8 vías. Utilizando como variables predictoras las
columnas (1,2,3, 12,20,21,37), queremos separar y clasificar los medidores sin defectos (clase 1)
y los que poseen algún tipo de defecto (clase 2).

Usando al menos 2 de los métodos vistos en la materia:

1-Establecer un criterio de clasificación, calcular la correspondiente matriz de confusión, ecm,


sensibilidad y especificidad obtenidas para cada método.

2- Usando la matriz de costo/Gancia , como criterio, seleccionar el mejor método para este
problema.

Variables predictoras : 1-Relación de planitud


2-Simetria
3-Flujo cruzado
4 a 11- Velocidad de flujo en cada uno de los ocho caminos
12 a 19- Velocidad del sonido en cada uno de los ocho caminos
20- Velocidad promedio del sonido en los ocho caminos
21-36 Ganancia en ambos extremos de cada uno de los ocho caminos
Variable de respuesta: 37- Estado del medidor: Clase 1 Sin defectos
Clase 2 Defectos de instalación

Matriz de Costo/ ganancia:

0 −30
( )
−50 70

NOTA 1: para facilitar el análisis, codificar la variable de clasificación como 0 sin defectos, 1
defectos.

1
APLICACIONES DE CIENCIAS DE DATOS EN INGENIERIA

2° CUATRIMESTRE 2022

Ejercicio 2 – Caudalímetros Ultrasónicos – defectos de instalación

El data set “meter_c” contiene 181 observaciones y 44 parámetros de diagnóstico para un


medidor de flujo ultrasónico líquido (USM) de 8 vías. Utilizando como variables predictoras las
columnas (2,3,4,23,28,44), queremos separar y clasificar los medidores sin defectos (clase 1) y
los que poseen defectos de instalación (clase 3).

Usando al menos 2 de los métodos vistos en la materia:

1-Establecer un criterio de clasificación, calcular la correspondiente matriz de confusión, ecm,


sensibilidad y especificidad obtenidas para cada método.

2- Usando la matriz de costo, como criterio, seleccionar el mejor método para este problema.

Variables predictoras: 1- Factor de perfil


2-Simetría
3-Flujo cruzado
4-7 Velocidad de flujo en cada uno de los cuatro caminos
8-11 Velocidad del sonido en cada uno de los cuatro caminos
12-19 Intensidad de la señal en ambos extremos de cada una de las
cuatro rutas
20-27 Calidad de la señal en ambos extremos de cada uno de los
cuatro caminos
28-35 Ganancia en ambos extremos de cada uno de los cuatro caminos
36-43 Tiempo de tránsito en ambos extremos de cada uno de los
cuatro caminos
Variable de respuesta 44- Estado del medidor: Clase '1’ Sin defectos
Clase '2’ Defectos en Inyección de gas
Clase '3': Defectos de instalación
Clase '4’ Defectos de fricción
0 −50
Matriz de Costo/ ganancia : ( )
−50 100

NOTA 1: para facilitar el análisis, codificar la variable de clasificación como 0 y 1.

2
APLICACIONES DE CIENCIAS DE DATOS EN INGENIERIA

2° CUATRIMESTRE 2022

Ejercicio 3 – Caudalímetros Ultrasónicos -Defectos de Fricción

El data set “meter_c” contiene 181 observaciones y 44 parámetros de diagnóstico para un


medidor de flujo ultrasónico líquido (USM) de 8 vías. Utilizando como variables predictoras las
columnas (1,2,28,33,39,44), queremos separar y clasificar los medidores sin defectos (clase 1) y
los que poseen defectos de fricción (clase 4).

Usando al menos 2 de los métodos vistos en la materia:

1-Establecer un criterio de clasificación, calcular la correspondiente matriz de confusión, ecm,


sensibilidad y especificidad obtenidas para cada método.

2- Usando como criterio el menor costo seleccionar el mejor método para este problema.

Variables predictoras: 1- Factor de perfil


2-Simetría
3-Flujo cruzado
4-7 Velocidad de flujo en cada uno de los cuatro caminos
8-11 Velocidad del sonido en cada uno de los cuatro caminos
12-19 Intensidad de la señal en ambos extremos de cada una de las
cuatro rutas
20-27 Calidad de la señal en ambos extremos de cada uno de los
cuatro caminos
28-35 Ganancia en ambos extremos de cada uno de los cuatro caminos
36-43 Tiempo de tránsito en ambos extremos de cada uno de los
cuatro caminos
Variable de respuesta 44- Estado del medidor: Clase '1’ Sin defectos
Clase '2’ Defectos en Inyección de gas
Clase '3': Defectos de instalación
Clase '4’ Defectos de fricción
NOTA 1: para facilitar el análisis, codificar la variable de clasificación como 0 y 1.

0 −50
Matriz de Costo/ ganancia : ( )
−50 100

3
APLICACIONES DE CIENCIAS DE DATOS EN INGENIERIA

2° CUATRIMESTRE 2022

Ejercicio 4 – Caudalímetros Ultrasónicos D

El data set “meter_d” contiene 180 observaciones y 44 parámetros de diagnóstico para un


medidor de flujo ultrasónico líquido (USM) de 8 vías. Utilizando como variables predictoras las
columnas (1,2,3,4,21,29,36,44) , queremos separar y clasificar los medidores sin defectos (clase
1) y los que poseen defectos de instalación (clase 3), defectos de inyección(clase 2) y defectos
de fricción (clase 4).

1-Establecer un criterio de clasificación, calcular la correspondiente matriz de confusión para


cada método.

2-Calcular para cada clase la sensibilidad y la especificidad.

3- Indicar cual es el método que separa y clasifica mejor los datos usando la tasa de aciertos
como medida.

Variables predictoras: 1- Factor de perfil


2-Simetría
3-Flujo cruzado
4-7 Velocidad de flujo en cada uno de los cuatro caminos
8-11 Velocidad del sonido en cada uno de los cuatro caminos
12-19 Intensidad de la señal en ambos extremos de cada una de las
cuatro rutas
20-27 Calidad de la señal en ambos extremos de cada uno de los
cuatro caminos
28-35 Ganancia en ambos extremos de cada uno de los cuatro caminos
36-43 Tiempo de tránsito en ambos extremos de cada uno de los
cuatro caminos

Variable de respuesta 44- Estado del medidor: Clase '1’ Defectos


Clase '2’ Defectos en Inyección de gas
Clase '3': Defectos de instalación
Clase '4’ Defectos de fricción

4
APLICACIONES DE CIENCIAS DE DATOS EN INGENIERIA

2° CUATRIMESTRE 2022

Ejercicio 5 –Sistema de Presión de Aire

El data set “fallas” contiene 16000 observaciones y 171 variables, con información de sistemas
de presión de aire (APS) en camiones pesados. Las variables predictoras se encuentran
codificadas por razones de confidencialidad, la variable de interés es “class”; cuando es 1
corresponde a fallas de componentes del APS, en cambio sí es 0 corresponde a fallas de
componentes no relacionados con APS. El objetivo es separar y clasificar las fallas de
componentes APS.

Para resolver el ejercicio usar el data set: “datos1.csv”

Usando al menos 2 de los métodos vistos en la materia:

1-Establecer un criterio de clasificación, calcular la correspondiente matriz de confusión, ecm,


sensibilidad y especificidad obtenidas para cada método.

2- Usando como criterio el menor costo seleccionar el mejor método para este problema.
1000 −500
Matriz de Costo: ( )
−50 100

NOTA 1: para facilitar el análisis, codificar la variable de clasificación como 0 y 1.

5
APLICACIONES DE CIENCIAS DE DATOS EN INGENIERIA

2° CUATRIMESTRE 2022

Ejercicio 6 – Caudalímetros Ultrasónicos f

El data set “meter_f” contiene 87 observaciones y 37 parámetros de diagnóstico para un


medidor de flujo ultrasónico líquido (USM) de 8 vías. Utilizando como variables predictoras las
columnas (1,2,11,16,20,31,37), queremos separar y clasificar los medidores sin defectos (clase
1) y los que poseen algún tipo de defecto (clase 2).

Usando al menos 2 de los métodos vistos en la materia:

1-Establecer un criterio de clasificación, calcular la correspondiente matriz de confusión, ecm,


sensibilidad y especificidad obtenidas para cada método.

2- Usando la matriz de costo, como criterio, seleccionar el mejor método para este problema.

Variables predictoras : 1-Relación de planitud


2-Simetria
3-Flujo cruzado
4 a 11- Velocidad de flujo en cada uno de los ocho caminos
12 a 19- Velocidad del sonido en cada uno de los ocho caminos
20- Velocidad promedio del sonido en los ocho caminos
21-36 Ganancia en ambos extremos de cada uno de los ocho caminos
Variable de respuesta: 37- Estado del medidor: Clase 1 Sin defectos
Clase 2 Defectos de instalación

Matriz de Costo/ ganancia:

100 0
( )
0 −70

NOTA 1: para facilitar el análisis, codificar la variable de clasificación como 0 sin defectos, 1
defectos.

6
APLICACIONES DE CIENCIAS DE DATOS EN INGENIERIA

2° CUATRIMESTRE 2022

Ejercicio 7 – Caudalímetros Ultrasónicos D (b)

El data set “meter_d” contiene 180 observaciones y 44 parámetros de diagnóstico para un


medidor de flujo ultrasónico líquido (USM) de 8 vías. Utilizando como variables predictoras las
columnas (1,2,3,5,29,44) , queremos separar y clasificar los medidores sin defectos (clase 1) y
los que poseen defectos de instalación (clase 3), defectos de inyección(clase 2) y defectos de
fricción (clase 4).

1-Establecer un criterio de clasificación, calcular la correspondiente matriz de confusión para


cada método.

2-Calcular para cada clase la sensibilidad y la especificidad.

3- Indicar cual es el método que separa y clasifica mejor los datos usando la tasa de aciertos
como medida.

Variables predictoras: 1- Factor de perfil


2-Simetría
3-Flujo cruzado
4-7 Velocidad de flujo en cada uno de los cuatro caminos
8-11 Velocidad del sonido en cada uno de los cuatro caminos
12-19 Intensidad de la señal en ambos extremos de cada una de las
cuatro rutas
20-27 Calidad de la señal en ambos extremos de cada uno de los
cuatro caminos
28-35 Ganancia en ambos extremos de cada uno de los cuatro caminos
36-43 Tiempo de tránsito en ambos extremos de cada uno de los
cuatro caminos

Variable de respuesta 44- Estado del medidor: Clase '1’ Defectos


Clase '2’ Defectos en Inyección de gas
Clase '3': Defectos de instalación
Clase '4’ Defectos de fricción

7
APLICACIONES DE CIENCIAS DE DATOS EN INGENIERIA

2° CUATRIMESTRE 2022

Ejercicio 8 –Sistema de Presión de Aire (b)

El data set “fallas” contiene 16000 observaciones y 171 variables, con información de sistemas
de presión de aire (APS) en camiones pesados. Las variables predictoras se encuentran
codificadas por razones de confidencialidad, la variable de interés es “class”; cuando es 1
corresponde a fallas de componentes del APS, en cambio sí es 0 corresponde a fallas de
componentes no relacionados con APS. El objetivo es separar y clasificar las fallas de
componentes APS.

Para resolver el ejercicio usar el data set: “datos2.csv”

Usando al menos 2 de los métodos vistos en la materia:

1-Establecer un criterio de clasificación, calcular la correspondiente matriz de confusión, ecm,


sensibilidad y especificidad obtenidas para cada método.

2- Usando como criterio el menor costo seleccionar el mejor método para este problema.
1000 −400
Matriz de Costo: ( )
−90 200

NOTA 1: para facilitar el análisis, codificar la variable de clasificación como 0 y 1.

También podría gustarte