Está en la página 1de 5

Instituto Tecnológico Superior P’urhépecha

Carrera: Ingeniería en Gestión Empresarial

Materia: Estadística Inferencial II

Actividad 1: REGRESIÓN LINEAL SIMPLE

Semestre: 5to Semestre

Nombre del alumno: Montserrat Hernández Trujillo

Nombre del docente: Ing. Esaú Ramos Macías

Fecha: 08 de noviembre de 2022


Introducción

Existen situaciones donde se requiere determinar si el comportamiento de cierto


suceso se explica con el conocimiento de otra información. Por ejemplo, puede ser
de interés conocer el impacto del número de horas de preparación para un examen
de admisión a una institución de educación superior en el porcentaje de aciertos; o
la afectación de los ingresos de una organización en función del presupuesto
destinado a publicidad; o la duración de la batería de un dispositivo electrónico de
acuerdo con el tiempo destinado a descargar tutoriales.

Para los problemas descritos anteriormente, se emplea el análisis de regresión


lineal simple, técnica que trata de explicar una variable de interés o respuesta (y) en
función de otra (x), mediante un modelo lineal.

Se mostrarán las características del modelo de regresión y el método para estimar


sus parámetros. Una vez obtenidos los parámetros, se expone cómo determinar la
ecuación del modelo, los supuestos que debe cumplir y la manera de realizar
inferencias sobre la pendiente de la recta de regresión. concluye con el análisis de
correlación lineal entre dos variables continuas.

El modelo de regresión lineal explica la relación entre una variable dependiente, a


la que se denotará y, con otra(s) explicativa(s) a través de una ecuación de primer
orden. Tanto las variables dependientes como las explicativas son observables.

La relación matemática determinística más simple entre dos variables x y y es una


relación lineal 𝑦 = 𝛽0 + 𝛽1 𝑥. El conjunto de pares (x, y) para los cuales 𝑦 = 𝛽0 + 𝛽𝑥
determina una línea recta con pendiente 𝛽1 e intersección en y 𝛽0.

Si las dos variables no están determinísticamente relacionadas, entonces con un


valor fijo de x el valor de la segunda variable es incierto.

La variable cuyo valor es fijado por el experimentador será denotada por x y se


llamará variable independiente, pronosticadora o explicativa. Con x fija, la segunda
variable será aleatoria; esta variable aleatoria y su valor observado se designan por
Y y y, respectivamente, y se le conoce como variable dependiente o de respuesta.

Normalmente se realizarán observaciones para varios escenarios de la variable


independiente. Sean 𝑥1, 𝑥2, . . . , 𝑥𝑛 los valores de la variable independiente para la
que se realizan las observaciones y sean 𝑌𝑖 y 𝑦𝑖 , respectivamente, la variable
aleatoria y el valor observado asociado con 𝑥𝑖 . Los datos bivariantes disponibles se
componen entonces de los n pares (𝑥1 , 𝑦1 ), (𝑥2 , 𝑦2 ), . . . , (𝑥𝑛 , 𝑦𝑛 ). Una imagen de
estos datos llamada gráfica de dispersión proporciona impresiones preliminares
acerca de la naturaleza de cualquier relación. En una gráfica como esa, cada (xi, yi)
se representa como un punto colocado en un sistema de coordenadas
bidimensional.
Un aspecto fundamental cuando se trabaja con esta técnica es que el modelo de
regresión lineal simple es estimado con los valores de una muestra, por lo que los
valores obtenidos de 𝛽0 𝑦 𝛽1 son estimaciones de los parámetros de la recta con
toda la población. Así, el propósito del modelo no es solamente calcular los
parámetros, sino realizar inferencia sobre los verdaderos valores de esos
parámetros. Por lo anterior, es necesario considerar los siguientes supuestos al
emplear una regresión lineal simple.

1. En el modelo de regresión lineal simple 𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝜀𝑖 = (𝑖 = 1, … , 𝑛) tanto la


variable dependiente (Y) como la explicativa (X) son observables

2. El modelo es lineal en los parámetros no en las variables. Esto significa que se


pueden realizar transformaciones sobre las variables originales para que haya una
relación lineal, y la esencia del modelo no se pierde.

3. El error de estimación 𝜀𝑖 es una variable aleatoria cuyo valor esperado es cero y


su varianza es 𝜎 2 , la cual se mantiene constante en todas las observaciones y es
desconocida.

4. Los errores 𝜀𝑖 son independientes. Esto significa que, dados dos valores
cualesquiera de 𝑋, 𝑥𝑖, 𝑥𝑗 (𝑖 ≠ 𝑗), los errores 𝜀𝑖 , 𝜀𝑗 son independientes.

5. El error 𝜀𝑖 es una variable aleatoria con distribución normal. Al ser y una función
lineal del error, también se distribuye normalmente.

Uno de los aspectos que más se descuida al ajustar un modelo de regresión lineal
simple es revisar que se cumplan los supuestos del modelo (esta revisión implica
analizar el comportamiento de los residuos).

El propósito del modelo de regresión lineal simple no se reduce a calcular los


parámetros de la recta, sino que implica realizar inferencia sobre ellos. Cuando se
ajusta un modelo de regresión, la primera prueba efectuada es referente a si un
modelo lineal es el adecuado para los datos, y posteriormente se hacen inferencias
sobre la pendiente.

En el análisis de regresión lineal simple, si la variable X es explicativa de Y, entonces


el modelo muestra el efecto de un cambio en X sobre Y. Un análisis complementario
es el de correlación, el cual determina el grado de asociación lineal entre dos
variables.

La correlación entre las variables X y Y se denota como ρxy, y se define como el


grado en que se encuentran asociadas estas variables. El estimador de esta
correlación es conocido como coeficiente de correlación, denotado como r, y su
fórmula es
∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅)
𝑟=
√∑(𝑥𝑖 − 𝑥̅ )2 ∑(𝑦𝑖 − 𝑦̅)2
El coeficiente de correlación es un valor independiente de las unidades de las
variables, lo que permite que pueda ser empleado en comparativos; toma valores
entre –1 y 1 (en –1 significa que existe una asociación lineal perfecta negativa, es
decir, el incremento de la variable explicativa resultará una disminución en la
variable respuesta; y en 1, la asociación lineal entre las variables es perfecta y
positiva, lo que implica que un aumento de la variable explicativa hará que aumente
el valor de la variable respuesta). Cuando el coeficiente de correlación es cero,
significa que las variables no están asociadas o que su asociación no es lineal.

Nivel de asociación de dos variables de acuerdo con el valor del coeficiente


de correlación

En la figura anterior, se muestra cómo interpretar los niveles de asociación entre


dos variables de acuerdo con el valor del coeficiente de correlación. Un valor mayor
a cero indica que existe una correlación positiva; en caso contrario, la correlación
es negativa. Las variables se considerarán con una asociación débil si su
correlación tiene un valor absoluto entre 0 y 35; moderada, entre 35 y 65; y fuerte,
mayor a 65.

Coeficiente de determinación 𝑹𝟐
Para valorar el ajuste del modelo de regresión lineal simple, se considera otro
coeficiente llamado coeficiente de determinación, denotado como R2 , que mide la
variabilidad explicada por el modelo. Para calcular el coeficiente de determinación,
se utiliza la siguiente fórmula:
∑(𝑦̂𝑖 − 𝑦̅)2
𝑅2 =
∑(𝑦𝑖 − 𝑦̅)2

Donde:
𝑅 2 : Coeficiente de determinación
𝑦̂∶
𝑖 i-ésima estimación de Y
𝑦𝑖 : i-ésima observación de Y
𝑦̅ : promedio de Y

Conclusión
Existen situaciones donde se requiere determinar si el comportamiento de cierto
suceso se explica con el conocimiento de otra información. Por ejemplo, puede ser
de interés conocer el impacto del número de horas de preparación para un examen
de admisión a una institución de educación superior en el porcentaje de aciertos; o
la afectación de los ingresos de una organización en función del presupuesto
destinado a publicidad; o la duración de la batería de un dispositivo electrónico de
acuerdo con el tiempo destinado a descargar tutoriales.

Para los problemas descritos, se emplea el análisis de regresión lineal simple,


técnica que trata de explicar una variable de interés o respuesta (y) en función de
otra (x), mediante un modelo lineal.

Bibliografía:

Anderson, D. R (2016). Estadística para negocios y economía. (12a ed.), México:


Cengage Leraning. 560-641

Levin, D. M (2014). Estadística para administración. (6 ed.), México: Pearson. 509-


564

Lind, A. D. (2015). Estadística aplicada a los negocios y a la economía. (16a ed.),


México: McGraw-Hill. 461-511

También podría gustarte