Está en la página 1de 2

Inteligencia de Negocio(examen parcial) (2019/20)

4o Grado en Ingenierı́a Informática


13 de Noviembre de 2019

Normas para la realización del examen: Duración: 2 horas

• El único material permitido durante la realización del examen es un bolı́grafo azul o negro.
• Debe disponer de un documento oficial que acredite su identidad a disposición del profesor.
• No olvide escribir su nombre completo y grupo en todos y cada uno de los folios que entregue.

1 Preguntas cortas

/ Ejercicio 1 . Algunos conceptos teóricos [4 puntos]

• ¿Qué es la Inteligencia de Negocio? (0.5 puntos)


Es el proceso de convertir datos en conocimiento y éstos en acciones para mejorar la capacidad competitiva del negocio
• ¿Y la minerı́a de datos? (1 puntos).
Es el proceso de extracción de patrones de información (implı́citos, no triviales, desconocidos y potencialmente útiles) a partir
de grandes cantidades de datos
• ¿Qué es el KDD (Knowledge Discovery from Databases)? (0.5 puntos)
Es el proceso de extracción de conocimiento a partir de Bases de Datos
Relaciona los distintos conceptos entre sı́ (1 punto).
El KDD es el proceso completo de obtener conocimiento en el que la minerı́a de Datos es sólo una parte (hay otras fases
como extraer y preparar datos, evaluar los modelos, y obtener conclusiones datos, evaluar, ...). El término Inteligencia de
Negocio se emplea en cuanto este procedimiento de obtener conocimiento se hace en el ámbito de una empresa para mejorar su
competitividad.

• ¿Que diferencia hay entre un problema de clasificación y un problema de agrupamiento? (1 punto)


En el clasificación es supervisado, se posee un conjunto de instancias ya etiquetadas sobre las que aprender, y en el problema de
agrupamiento no, si no que se busca agrupar instancias con caracterı́sticas similares

/ Ejercicio 2 . Preguntas prácticas [3 puntos]

• A la hora de usar un clasificador K-NN, ¿cómo influye el ruido en el valor correcto de k? Justifica la respuesta (0.5 puntos)
Si existe ruido algunas instancias no serán correctas, por lo que k deberá de ser más grande para ofrecer robustez
• Indica los distintos métodos vistos en clase para evaluar clasificaciones, con una frase . (2 puntos)

– Hold-out: Divide los grupos de entrenamiento y prueba en grupos dijuntos (ej: 70% y 30%).
– Validación cruzada: Dividir los datos en varios grupos, y para cada uno de ellos se valida con dichos datos (el resto se usa
para entrenar), y se hace el promedio.
– Leave-one-out: Un caso extremo del anterior, se valida para cada instancia, y se entrena con el resto.
– Bootstraping: Se escoge aleatoriamente para generar el conjunto de entrenamiento, el resto se usa para validar.

– ¿Es cuáles no es necesario que estén ordenados aleatoriamente? Justifı́calo. (0.5 puntos)
Sólo no es necesario en leaving-one-out porque escoge cada instancia para validar, ası́ que el orden no influye, y en bootstrap
al elegirse de forma aleatoria instancia por instancia.

/ Ejercicio 3 . Sobre modelos de clasificación [3 puntos]

Pág. 1/ 1
Inteligencia de Negocio(examen parcial) (2019/20)
4o Grado en Ingenierı́a Informática
13 de Noviembre de 2019

• ¿Cuál es el criterio principal para elegir el K-NN o un árbol de decisión? (1 punto)


El tipo de representación de los atributos, los árboles de decisión son mejores con atributos discretos, mientras que el K-NN es
mejor cuando la mayorı́a de atributos son continuos
• ¿Para qué se usan las medidas de reducción de incertidumbre en los árboles de decisión? ¿Qué ventaja ofrece su uso? (0.5
puntos)
Permite consultar primero por los atributos que clasifiquen en grupos más distintos. De esta manera se consiguen árboles mucho
más cortos.

• Indica alguna diferencia entre el ID3 y el C4.5. (0.5 puntos)


El C4.5 es capaz de trabajar con valores numéricos mientras que el ID.3 sólo trabaja con valores categóricos o discretos
• Ordena los siguientes modelos en base a su interpretabilidad, justificando la respuesta: Árboles de clasificación, Clasificador
basado en reglas, Bayesiano, Redes Neuronales. (1 punto)
Los más interpretables son los árboles de decisión o los basados en reglas (a nivel de interpretabilidad son equivalentes), luego
los sistemas bayesianos (pueden justificar su decisión pero no son fácilmente interpretables por un humano), y por último las
redes neuronales (ni son interpretables si justifican sus decisiones)

Pág. 2/ 1

También podría gustarte