Está en la página 1de 10

FACULTAD DE INGENIERÍA, ARQUITECTURA Y DISEÑO.

LIC. EN ING. EN SISTEMAS COMPUTACIONALES

Inteligencia
Artificial
Taller #2

DIRECCIÓN DE INVESTIGACIÓN
Dr. Ing. Carlos Allan Boya Lara
Jugando con Regresión lineal
• Atender a las instrucciones.
• 3 % del valor de la nota.
• Trabajo en grupo de 2 estudiantes.
• Entregar no después del viernes 26 de junio. Si hay problemas en la
entrega no es culpa del profesor. Tratar de entregar antes de esa fecha
para evitar problemas.
• Se debe entregar preferiblemente en lenguaje Python, sin embargo, puede
utilizar otros si lo prefiere, pero debe explicar cada línea.

DIRECCIÓN DE INVESTIGACIÓN
Dr. Ing. Carlos Allan Boya Lara
Regresión
• Es un conjunto de procesos estadísticos para estimar la relación entre
una variable independiente y una o mas variables independientes.
• La mas común, es la regresión lineal, en el cual se busca una línea
que se ajuste lo mas posible a los datos de acuerdo a algún criterio
matemático.
• Un modelo de regresión involucra:
• Parámetros desconocidos,
• Variables independientes, donde , denota las filas.
• Variable dependiente, .
• Un termino de error, normalmente no depende de .
• Normalmente el modelo matemático se define:

• Donde es una función escogida para que se adapte a los datos.


Ejemplo, una lineal: de tal forma que quedaría así:
• La función, puede ser de otro tipo, como cuadrática, cubica, polinomial
logarítmica, etc.

DIRECCIÓN DE INVESTIGACIÓN
Dr. Ing. Carlos Allan Boya Lara
Regresión Lineal
Regresión lineal simple

Modelo de un parámetro

Estimación de parámetros

DIRECCIÓN DE INVESTIGACIÓN
Dr. Ing. Carlos Allan Boya Lara
Codigo en Python
• Pandas, numpy y matplotlib son librerías. Favor investigar.
• En el siguiente sitio hay referencia de estos paquetes:
• https://scikit-learn.org/stable/index.html
• https://pandas.pydata.org/
• https://numpy.org/
• https://matplotlib.org/
• En esta primera parte del código se crea los datos. X es la variable
independiente y y es la dependiente. . Identifique beta1, beta2 y el
error.

DIRECCIÓN DE INVESTIGACIÓN
Dr. Ing. Carlos Allan Boya Lara
Codigo en Python
• DataFrame es para crear la tabla. Se visualiza con el comando
df.head(). Si utiliza la plataforma Spyder, puede ver el valor de las
variables en el Explorador de variables.

DIRECCIÓN DE INVESTIGACIÓN
Dr. Ing. Carlos Allan Boya Lara
Codigo en Python
• Comparar este código con la diapositiva 4. La formulas de la media y
la varianza.

• Quien es Beta y Alfa? Compárelo con la formula de regresión. Imprimir


sus valores.

DIRECCIÓN DE INVESTIGACIÓN
Dr. Ing. Carlos Allan Boya Lara
Codigo en Python
• Identifique el modelo matemático de la regresión lineal en el siguiente
código. Corra todo el código y grafique.

DIRECCIÓN DE INVESTIGACIÓN
Dr. Ing. Carlos Allan Boya Lara
Codigo en Python
• Corra todo el código y grafique, pero ahora cambiando la semilla
random, np.random.seed(1). ¿Cambiaron los valores de los
parámetros del modelo de predicción? Explique.
• Cambie la semilla para tres números mas.
• Evalúe el rendimiento con , donde , que es la suma al cuadrado de los
residuos; y , que es la suma cuadrada total de la diferencia entre los
datos de y su media, . son los valores pronosticados para . Un R
cuadrado = 1 indica ajuste perfecto y un 0 indica que no hay ningún
ajuste ni relación entre las X y las Y.

• Como cambia para diferentes semillas. Haga una tabla para 5


semillas con sus graficas. Explique.

DIRECCIÓN DE INVESTIGACIÓN
Dr. Ing. Carlos Allan Boya Lara
Código en Python
• Cambie la cantidad de muestras a n=1000.

• Utilice correlación cruzada. Divida los datos 4-fold. Obtenga el valor


promedio de para todos los test.
• Nota: en entrenamiento obtenga los parámetros. Después utilice
estos parámetros para predecir con los datos de test y obtenga el
.

DIRECCIÓN DE INVESTIGACIÓN
Dr. Ing. Carlos Allan Boya Lara

También podría gustarte