Está en la página 1de 3

Estudiante: JOSE FRANCISICO GUEVARA ZUÑIGA Matrícula: UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN

1884300 Facultad de Ingeniería Mecánica y Eléctrica


Materia: reconocimiento de patrones Grupo: 001 Ingeniería en IMTC
Evidencia 2 No.2
evidencia:
DEFINIR EL CONCEPTO A GRANDES Fecha:19/08/22
RASGOS DE REGRESION LINEAL.

• UTILIZANDO UNA BASE DE DATOS


APLICAR EL CONCEPTO DE
REGRESION LINEAL UTILIZANDO
(PYTHON - PUDIENDO SER SPYDER,
JUPYTER O COLAB).
o DEBE DE DESCRIBIR LA
BASE DE DATOS Y
CONCLUSION UTILIZANDO EL
CONCEPTO ADQUIRIDO.

Comentarios: Puntaje:

REGRESION LINEAL
las ventas de una empresa y sus gastos en
Pongamos que necesitamos realizar una investigación publicidad. ¿Qué podemos hacer? El análisis de
para una empresa. Esta quiere saber la relación entre regresión lineal nos permite saber en qué grado los
las ventas de una empresa y sus gastos en gastos en publicidad explican la variable ventas.
publicidad. ¿Qué podemos hacer? Así, esta última variable será la variable dependiente
A veces, en la investigación, nos interesa saber si del modelo, mientras que la variable explicativa o
existe una relación lineal entre dos variables independiente serán los gastos en publicidad.
aleatorias. Es por eso que utilizamos el análisis de
regresión lineal.
Supuestos del modelo de regresión lineal
El coeficiente que nos permite obtener este dato es el Si nuestras observaciones son una muestra aleatoria
coeficiente de correlación lineal de Pearson r, cuyo que viene de una población, entonces nos interesa
valor oscila entre -1 y +1 (1). En los casos en los que realizar inferencias sobre la misma. Para que estas
el coeficiente de regresión lineal se acerque a +1 o -1, inferencias sean “estadísticamente razonables”, se han
tiene sentido considerar la ecuación de la recta que de cumplir las siguientes condiciones:
“mejor se ajuste” a la nube de puntos como un • En la población, la relación entre
modelado aceptable de la asociación entre las dos variables X e Y debe ser
variables. aproximadamente lineal.
• Los residuos se distribuyen según una
Principalmente, esta recta nos permite estimar los curva normal de media 0.
valores de Y que obtendríamos para distintos valores • Además, los residuos son
de X. Estos conceptos quedarán representados en lo independientes unos de otros.
que llamamos diagrama de dispersión. Por otro • Los residuos tienen varianza constante.
lado, el procedimiento más usual para determinar la Así, este modelo de regresión lineal es bastante
recta de mejor ajuste es el de mínimos cuadrados. “robusto”. Ello quiere decir que no es necesario que las
condiciones anteriores se cumplan con exactitud (en
Un ejemplo de la utilización del análisis de regresión particular las tres últimas).
lineal
Pongamos que necesitamos realizar una investigación
para una empresa. Esta quiere saber la relación entre
Utilizando una base de datos de estados de
estados unidos sobre los accidentes de
coches obtuve los siguientes valores y la
tabla de datos comparados en donde cada fila
representa un estado de estados unidos y
cada columna son características de Conclusión
En esta evidencia necesite valores y para ello utilice un
accidentes de carros
comando llamado seaborn que me ayudo a descargar los
datos de la tabla y con ello pude seguir con la realización
import seaborn as sns de la actividad utilizando comandos como el de graficar y
df = sns.load_dataset(name='car_crashes') de valores en x y y con comandos plot pude realizar con
df.head() éxito esta segunda actividad

sns.scatterplot(x='alcohol', y='total',
data=df)

import sklearn
explicativas = df[['alcohol']]
objetivo = df['total']
from sklearn.linear_model import
LinearRegression
model = LinearRegression()
type(model)
sklearn.linear_model._base.LinearRegressio
n
model.fit (X=explicativas, y=objetivo)
LinearRegression()
model.__dict__

model.predict(X=[[2]])
y_pred = model.predict(X=df[['alcohol']])
df.insert(0, 'pred' , y_pred)
df.head
sns.scatterplot(x='alcohol', y='total',
data=df)
sns.scatterplot(x='alcohol', y='pred',
data=df)
sns.lineplot (x='alcohol', y='total',
data=df, color ='red')

También podría gustarte