Está en la página 1de 10

UNIVERSIDAD ARGENTINA DE LA EMPRESA

Departamento de Tecnología Informática


3.4.096 - INTELIGENCIA ARTIFICIAL

Docentes: Sciolla, Pablo


Docentes: Ponzoni, Nelson

Examen Parcial Mayo 2020


Cuatrimestre I
LU: FECHA: 11/05/2020

ALUMNO:

CARRERA: Ingeniería en Informática (1608)

NOTA: EL EXAMEN ESCRITO ES UN DOCUMENTO DE GRAN IMPORTANCIA PARA LA EVALUACIÓN DE LOS


CONOCIMIENTOS ADQUIRIDOS, POR LO TANTO, SE SOLICITA LEER ATENTAMENTE LO SIGUIENTE:
 Mantenga una secuencia lógica y consistente en la presentación de los conceptos.
 Responda claramente y justifique teóricamente cada punto.
 Sea prolijo y ordenado en el desarrollo de los temas.
 Sea cuidadoso con las faltas de ortografía y sus oraciones.
 Los ejemplos deben ser propios, ejemplos de la bibliografía o dados en clase reducen la valoración de la
respuesta.
 El examen debe ser respondido en el mismo documento Word.
 Cuenta con recuadros para completar con las respuestas. Trate de no extenderse más allá del espacio
recomendado para la respuesta.
 Si no contesta una pregunta/inciso, indique en el cuadro “NO RESPONDE”.
 Una vez finalizado se debe enviar por mail a nponzoni@uade.edu.ar y psciolla@uade.edu.ar

Condiciones de aprobación: Para aprobar el examen debe responder adecuadamente el 60% del mismo.
Aprobación del examen: Con nota mayor o igual a 4 (cuatro).
Duración de examen: 150 minutos.

A completar por el docente:

C1 Machine Learning /25


C2 Redes Neuronales /10
C3 Evaluación de Modelos /10
C4 Búsqueda /25
C5 Minimax /20
C6 CSP /10
Total /100
Consigna 1: Machine Learning
Responda. Justifique en todos los casos.
a) [5pts] ¿Cuál de las siguientes técnicas puede ser aplicada para mitigar el problema de overfitting en los
árboles de decisión? Puede aplicar más de una respuesta.
i. Usar la medida de informatión gain para medir el rango de las características
ii. Limitar la profundidad del árbol
iii. Limitar la cantidad máxima de splits o divisiones, limitar la ramificación
iv. Usar la regularización L2: la suma de los pesos al cuadrado
v. Corte temprano: terminar el entrenamiento cuando no se observa ningún cambio favorable en el
conjunto de validación
vi. Podar los nodos que no generan ninguna mejora en el conjunto de validación

Respuesta:

b) [5pts] Entrenamos cinco diferentes modelos de regresión para predecir el valor de la variable Y para
una variable de entrada X . Como resultado, pueden observarse las siguientes graficas para los modelos
entrenados.

i. ¿Cuál de las cinco curvas (numeradas desde 1 a 5) Ud. cree que corresponde a la producida por
un árbol de decisión?

Inteligencia Artificial
Parcial I – 11 May 20
Pág. 2 de 9
Respuesta:

c) [10pts] Si usamos arboles de decisión con variables numéricas, ¿Por qué no es necesario escalar los
datos utilizados?

Respuesta:

d) [5pts] Dado un modelo KNN que presenta características de undefitting, ¿Qué harías con el valor de k?

Respuesta:

Inteligencia Artificial
Parcial I – 11 May 20
Pág. 3 de 9
Consigna 2: Redes Neuronales
Responda
a) [5pts] Si usamos el gradiente descendiente (o gradiente descendiente estocástico) para minimizar la
función de error con respecto a los pesos W del modelo, ¿Qué influencia tiene el parámetro tasa de
aprendizaje, denominado comúnmente como η ?

Respuesta:

b) [5pts] ¿Por qué necesitamos prestar atención a como son inicializados los pesos w i en una red neuronal?

Respuesta:

Inteligencia Artificial
Parcial I – 11 May 20
Pág. 4 de 9
Consigna 3: Evaluación de modelos
a) [3pts] ¿Por qué de las siguientes sentencias sobre ajustes de hiperparámetros son falsas?
i. Si tenemos seis hiperparámetros y necesitamos explorar diez valores para cada uno de ellos,
una búsqueda en grilla necesitará entrenar y evaluar 1 millón de modelos.
ii. Para problemas de regresión logística, un posible hiperparámetro a ajustar puede ser el tipo de
regulizador y otro la función de error
iii. Al contrario que la búsqueda aleatoria (random search), la búsqueda por grilla (grid search),
solo puede ser utilizada para modelos de regresión, no para modelos de clasificación.

Respuesta:

b) [7pts] Una compañía de seguros ha desarrollado un modelo para detectar potenciales clientes
fraudulentos o no. Su tarea es evaluar el clasificador sobre el conjunto de pruebas.
A continuación, se encuentra la matriz de confusión (en la tabla, F y NF significan fraudulento y no
fraudulento respectivamente)

Predicción
F NF
F 10 5
Real
NF 20 965
i. Calcule la medida de accuracy del clasificador
ii. Calcule la medida de precision del modelo
iii. Calcule la medida de recall del modelo
iv. ¿Qué opina de la medida de accuracy y su valor obtenido? ¿Es suficiente o requiere observar las
otras medidas?
Respuesta:

Inteligencia Artificial
Parcial I – 11 May 20
Pág. 5 de 9
Inteligencia Artificial
Parcial I – 11 May 20
Pág. 6 de 9
Consigna 4: Búsqueda
Considere la figura a continuación. Se trata de un mapa de carreteras entre las principales ciudades de
la República Argentina (versión resumida). Solo se contemplan las ciudades descriptas en él.
Cada ciudad (circulo) se conecta a través de una ruta nacional (línea punteada). Ud. Es residente de la ciudad
de La Plata, Buenos Aires y desea realizar sus vacaciones en la ciudad de Formosa, capital de provincia
homónima. Un amigo suyo, le sugirió varias alternativas para llegar destino. Ud., hábil conocedor de los
algoritmos de búsqueda utiliza técnicas aprendidas en inteligencia artificial para encontrar la ruta que lo
llevará a destino.
Ciudades: La Plata, Rosario, Santa Fe, Paraná, Corrientes, Santa Fe, Resistencia, Formosa
Provincias: Formosa, Chaco, Corrientes, Santa Fe, Entre Ríos, Buenos Aires
Utilice criterio de ordenamiento alfabético para los nodos.

Se solicita, para cada algoritmo indique el camino hallado y su costo (si aplica):
a) [5pts] Implemente el algoritmo búsqueda primero en profundidad.
b) [5pts] Implemente el algoritmo búsqueda en anchura.
c) [10pts] Implemente el algoritmo búsqueda A*. Utilice las tablas 1.A y 1.B como apoyo
d) [5pts] Un error en los datos confeccionados en la tabla 1.B lo obligan a analizar si puede aplicar el
algoritmo A*. Justifique si es posible o no aplicarlo.
 Corrección: Distancia en línea recta desde Santa Fe a Formosa es de 723 km.

Kilómetros
Desde A
por ruta
La Plata Rosario 354
Rosario Santa Fe 173
Santa Fe Paraná 31
Paraná Corrientes 581
Corrientes Resistencia 21
Santa Fe Resistencia 547
Resistencia Formosa 175

1.A. Distancias entre dos ciudades por rutas


nacionales en kilómetros. Datos Google Maps.

Inteligencia Artificial
1.B. Distancias en línea recta entre La Parcial I – 11 May 20
Plata a Formosa. Datos Google Maps. Pág. 7 de 9
Kilómetros
Desde línea recta
A Formosa
La Plata 973
Rosario 792
175 21 Santa Fe 649
Paraná 660
Corrientes 158
547
581 Resistencia 164
31
Formosa 0

173

354

Gráfico 1. Mapa de las principales ciudades.

Respuesta:

Inteligencia Artificial
Parcial I – 11 May 20
Pág. 8 de 9
Consigna 5: Minimax
En la figura 5.1 se detallan los valores alcanzados según la perspectiva de cada jugador en un juego
donde se aplicó el algoritmo MINIMAX. Dentro de cada nodo hoja está el valor de una función de evaluación.
Indicar que rama debe ser podada (tachar) una vez que haya aplicado la técnica de poda Alpha-Beta. No es
necesario detallar cálculos auxiliares.

Se solicita,
a) [15pts] Aplicar el algoritmo MINIMAX con la técnica de poda Alpha-Beta. Indicar las ramas que son
podadas (Debe listarlas, por ej. “Se podarán las ramas A1, A2 , C 3 D ”).
b) [5pts]¿Cuál es el camino resultante desde el nodo a hoja que debe elegir el jugador MAX del inciso (a)?

Respuesta:

Inteligencia Artificial
Parcial I – 11 May 20
Pág. 9 de 9
Consigna 6: CSP
Justifique
a) [2pts] ¿Por qué se utiliza la heurística de grado para seleccionar variables en problemas de CSP?

Respuesta:

b) [8pts] ¿Pueden colorearse las regiones del grafico de la consigna 4 con solo 2 colores? Justifique con
algunas de las técnicas aprendidas en clase
Respuesta:

Inteligencia Artificial
Parcial I – 11 May 20
Pág. 10 de 9

También podría gustarte