Inteligencia
Artificial
Taller #2
DIRECCIÓN DE INVESTIGACIÓN
Dr. Ing. Carlos Allan Boya Lara
Jugando con Regresión lineal
• Atender a las instrucciones.
• 3 % del valor de la nota.
• Trabajo en grupo de 2 estudiantes.
• Entregar no después del viernes 26 de junio. Si hay problemas en la
entrega no es culpa del profesor. Tratar de entregar antes de esa fecha
para evitar problemas.
• Se debe entregar preferiblemente en lenguaje Python, sin embargo, puede
utilizar otros si lo prefiere, pero debe explicar cada línea.
DIRECCIÓN DE INVESTIGACIÓN
Dr. Ing. Carlos Allan Boya Lara
Regresión
• Es un conjunto de procesos estadísticos para estimar la relación entre
una variable independiente y una o mas variables independientes.
• La mas común, es la regresión lineal, en el cual se busca una línea
que se ajuste lo mas posible a los datos de acuerdo a algún criterio
matemático.
• Un modelo de regresión involucra:
• Parámetros desconocidos,
• Variables independientes, donde , denota las filas.
• Variable dependiente, .
• Un termino de error, normalmente no depende de .
• Normalmente el modelo matemático se define:
DIRECCIÓN DE INVESTIGACIÓN
Dr. Ing. Carlos Allan Boya Lara
Regresión Lineal
Regresión lineal simple
Modelo de un parámetro
Estimación de parámetros
DIRECCIÓN DE INVESTIGACIÓN
Dr. Ing. Carlos Allan Boya Lara
Codigo en Python
• Pandas, numpy y matplotlib son librerías. Favor investigar.
• En el siguiente sitio hay referencia de estos paquetes:
• https://scikit-learn.org/stable/index.html
• https://pandas.pydata.org/
• https://numpy.org/
• https://matplotlib.org/
• En esta primera parte del código se crea los datos. X es la variable
independiente y y es la dependiente. . Identifique beta1, beta2 y el
error.
DIRECCIÓN DE INVESTIGACIÓN
Dr. Ing. Carlos Allan Boya Lara
Codigo en Python
• DataFrame es para crear la tabla. Se visualiza con el comando
df.head(). Si utiliza la plataforma Spyder, puede ver el valor de las
variables en el Explorador de variables.
DIRECCIÓN DE INVESTIGACIÓN
Dr. Ing. Carlos Allan Boya Lara
Codigo en Python
• Comparar este código con la diapositiva 4. La formulas de la media y
la varianza.
DIRECCIÓN DE INVESTIGACIÓN
Dr. Ing. Carlos Allan Boya Lara
Codigo en Python
• Identifique el modelo matemático de la regresión lineal en el siguiente
código. Corra todo el código y grafique.
DIRECCIÓN DE INVESTIGACIÓN
Dr. Ing. Carlos Allan Boya Lara
Codigo en Python
• Corra todo el código y grafique, pero ahora cambiando la semilla
random, np.random.seed(1). ¿Cambiaron los valores de los
parámetros del modelo de predicción? Explique.
• Cambie la semilla para tres números mas.
• Evalúe el rendimiento con , donde , que es la suma al cuadrado de los
residuos; y , que es la suma cuadrada total de la diferencia entre los
datos de y su media, . son los valores pronosticados para . Un R
cuadrado = 1 indica ajuste perfecto y un 0 indica que no hay ningún
ajuste ni relación entre las X y las Y.
DIRECCIÓN DE INVESTIGACIÓN
Dr. Ing. Carlos Allan Boya Lara
Código en Python
• Cambie la cantidad de muestras a n=1000.
DIRECCIÓN DE INVESTIGACIÓN
Dr. Ing. Carlos Allan Boya Lara