Está en la página 1de 8

ANALISIS DE REGRESION LINEAL

I. INTRODUCCIÓN

Cuando, simultáneamente, contemplamos dos variables continuas, aunque


por extensión se pueden emplear para variables discretas cuantitativas,
surgen preguntas y problemas específicos. Esencialmente, se emplearán
estadísticos descriptivos y técnicas de estimación para contestar esas
preguntas, y técnicas de contraste de hipótesis específicos para resolver
dichos problemas. La mayoría de estos métodos están encuadrados en las
técnicas regresión y correlación En forma más especifica el análisis de
correlación y regresión comprende el análisis de los datos muestrales para
saber qué es y cómo se relacionan entre si dos o más variables en una
población. El análisis de correlación produce un número que resume el grado
de la fuerza de relación entre dos variables; y el análisis de regresión da lugar
a una ecuación matemática que describe dicha relación.

El análisis de regresión lineal, en general, nos permite obtener una función


lineal de una o más variables independientes o predictoras (X1, X2, ... XK) a
partir de la cual explicar o predecir el valor de una variable dependiente o
criterio (Y). En el análisis de regresión lineal podemos diferenciar entre
análisis de regresión lineal simple y análisis de regresión lineal múltiple. En
el primero, se intenta explicar o predecir la variable dependiente Y a partir de
una única variable independiente, X1; mientras que, en el segundo,
contamos con un conjunto de variables independientes, X1, X2, ... XK, para
estimar la variable dependiente Y. En ambos casos, tanto la variable
dependiente como la/s independiente/s están medidas en escala de intervalo
o de razón.

II. OBJETIVOS
Introducir la técnica de regresión lineal simple, en la que para cada
valor x de una variable no aleatoria X -conocida como predictora, regresora
o independiente, interviene una variable aleatoria Yx, denominada variable
respuesta o dependiente; relacionadas, a través del valor medio o esperado
de la variable respuesta, por la expresión.
III. MARCO TEORICO

Regresión lineal

También conocida como método de mínimos cuadrados, consiste en encontrar la


ecuación de una recta que mejor se ajuste a un conjunto de puntos (datos)5. La
regresión lineal nos permite identificar el grado de correlación entre una variable
dependiente y una o más variables independientes. El criterio de este método es
usar la recta (Y = a + bX) cuya suma de los cuadrados de los errores sea mínima.
Las fórmulas y la definición de las variables para el desarrollo de la regresión lineal
son las siguientes:

donde:
x = valores de la variable
independiente y = valores de la
variable dependiente
n = número de observaciones
a = intersección en el eje vertical
b = pendiente de la línea de regresión
Y = valores de y que caen en la línea de tendencia Y = a + bX X = valores de x
que caen en la línea de tendencia.

Figura 1. Tipos de relación entre dos variables

Fuente: Levin y Rubin, 2004


En esta figura, el segmento (e) ilustra una relación lineal inversa con un patrón de
puntos ampliamente disperso. Esta mayor dispersión indica que existe menor grado
o fuerza de asociación entre las variables. El patrón de puntos señalado en el
segmento (f) de la misma figura parece indicar que no existe relación entre las dos
variables, por tanto, conocer el pasado referente a una variable no nos permitirá
pronosticar ocurrencias futuras de la otra.
En los diagramas de dispersión que se mostraron en la figura 1 se pusieron las
líneas de regresión ajustando las líneas visualmente entre los puntos de datos.

Propiedades descriptivas en la regresión lineal simple

Las propiedades que se exponen a continuación son propiedades derivadas


exclusivamente de la aplicación del método de estimación por mínimos cuadrados
al modelo de regresión lineal simple, en el que se incluye como primer regresor el
término independiente.

1. La suma de los residuos mínimo-cuadráticos es igual a cero:

2. La recta de regresión pasa necesariamente por el punto (Y X, )

3. La suma de los productos cruzados entre la variable explicativa y


los residuos es igual a 0, es decir,

4. La suma de los productos cruzados entre los valores ajustados y


los residuos es igual a 0, es decir,

Estimación de los parámetros o coeficientes de regresión: la ecuación de predicción


o ecuación de regresión simple: la ecuación de predicción o ecuación de regresión
simple
Una vez que ya hemos analizado el carácter e intensidad de la relación entre las
variables, podemos proceder a estimar los parámetros de la ecuación de predicción
o de regresión lineal. El criterio para obtener los coeficientes de regresión B0 y B1
es el de mínimos cuadrados. Este consiste en minimizar la suma de los cuadrados
de los residuos de tal manera que la recta de regresión que definamos es la que
más se acerca a la nube de puntos observados y, en consecuencia, la que mejor
los representa. Los estadísticos asociados a la variable independiente que a pasado
a formar parte del modelo de regresión simple son:
1.- Coeficiente de regresión B. Este coeficiente nos indica el número de
unidades que aumentará la variable dependiente o criterio por cada unidad
que aumente la variable independiente.
2.- SEB. Error típico de B.
3.- Coeficiente Beta. El coeficiente Beta es el coeficiente de regresión
estandarizado. Expresa la pendiente de la recta de regresión en el caso de
que todas las variables estén transformadas en puntuaciones Z.
4.- Constante. El valor de la constante coincide con el punto en el que la recta
de regresión corta el eje de ordenadas. En la ecuación de predicción se
mantiene constante para todos los individuos. Cuando las variables han sido
estandarizadas (puntuaciones Z) o si se utilizan los coeficientes Beta, la
constante es igual a 0 por lo que no se incluye en la ecuación de predicción.
5.- Tolerancia. Tolerancia es la proporción de variabilidad no explicada por el
resto de variables (1-R2). Cuanto mayor sea la T más independiente es la
variable en cuestión.
6.- Valor T. El estadístico T nos permite comprobar si la regresión entre una
variable independiente y la dependiente es significativa. Si el p-valor asociado
al estadístico T (Sig T) es mayor al nivel de significación (normalmente 0.05)
rechazaremos que la regresión sea significativa para las dos variables
relacionadas. En nuestro caso la significación del estadístico T asociado al
modelo generado con la única variable independiente que disponemos es
inferior a 0.05 de ahí que podamos ratificar el carácter predictivo de dicha
variable y podamos, en consecuencia, exponer la ecuación del modelo. En el
ejemplo que recogemos en la sección de Resultados, la transcripción de los
resultados a la ecuación quedaría como sigue:
Y = a + b1x1 + e ó presente (p7A) = 0,51 + 0,87pasado (p7B) + e
en el supuesto caso de que los valores de las variables siguieran una escala
diferente, tendríamos que estandarizar utilizando los coeficientes Beta, y no B.
Del mismo modo, al contar con la misma escala la constante será cero.
presente (p7A) = 0 + 0,87pasado (p7B) + e
Una vez expuestos, desde un punto de vista teórico, los principales elementos
que debemos considerar a la hora de abordar una análisis de regresión simple,
su obtención informática parte de la consideración de tres cuadros de diálogos.
IV. METODOLOGIA Y RESULTADOS
En esta sección describiremos cómo se pueden automatizar los cálculos por medio
del programa Microsoft EXCEL® 2010. Para hacer uso de esta hoja de cálculo, se
analizará la relación entre las variables pulsaciones por minuto en reposo y el tiempo
en correr una milla de una muestra proveniente de 20 empleados del club de salud
de una empresa.

Fuente: S. Chatterjee - A. Hadi: " Sentivity Analysis in Linear Regression"

Se ingresan estos datos en la hoja de cálculo y se procede a hacer la gráfica de


dispersión en el menú insertar—gráficos—dispersión (figura 1).
Figura 1. Instrucciones para la gráfica de dispersión en EXCEL

Fuente: Elaboración propia.


La gráfica de dispersión nos sugiere que existe una relación lineal entre la variable
independiente pulsaciones por minuto en reposo y la variable dependiente tiempo
(figura 2).
Figura 2. Gráfica de dispersión de los datos de la Tabla 1

tiempo en correr 1 milla(Y)


600.00

500.00

400.00

300.00

200.00

100.00

-
0 10 20 30 40 50 60 70 80 90

Fuente: Elaboración propia.

Ahora se procede a encontrar la ecuación estimada de regresión y a hacer el


análisis de ésta con respecto a los datos por medio de la instrucción Regresión del
menú de Análisis de datos (figura 3).
Figura 3. Instrucciones para el análisis de regresión en Excel

Fuente: Elaboración propia.


Luego se ingresan los rangos de las variables y se fija el nivel de confianza para el
intervalo estimado de los parámetros X e Y (figura 4).
Figura 4. Cuadro de diálogo para el análisis de regresión en EXCEL

Fuente: Elaboración propia.

Los resultados que arroja el programa son los siguientes:


Tabla 2. Estadísticos de la regresión lineal con Excel

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.46511722
Coeficiente de determinación R^2 0.21633402
R^2 ajustado 0.17279703
Error típico 65.295815
Observaciones 20

ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de Valor
F
libertad cuadrados los cuadrados crítico de F
Regresión 1 21185.4179 21185.41789 4.96896962 0.03878581
Residuos 18 76743.7821 4263.543451
Total 19 97929.2
Fuente: Elaboración propia.
Tabla 3. Regresores estimados de la ecuación lineal
Inferior Superior Inferior Superior
Coeficientes Error típico Estadístico t Probabilidad
95% 95% 95.0% 95.0%
Intercepción 98.3042876 128.45944 0.765255455 0.45403705 -171.57898 368.187557 -171.57898 368.187557
Variable X 1 4.42450564 1.98486778 2.229118575 0.03878581 0.25445317 8.5945581 0.25445317 8.5945581
Fuente: Elaboración propia.

De la información obtenida se deduce:


Por cada milla adicional que corre la persona, las pulsaciones aumentan en
promedio 4.42 pulsación/minuto en reposo.

V. BIBLIOGRAFIA

Análisis de Regresión Simple. (1 de DICIEMBRE de 2017). Obtenido de Análisis de


Regresión Simple:
https://rua.ua.es/dspace/bitstream/10045/8141/1/REGRESION%20SIMPLE.pdf
Cardona Madariaga, D., & González Rodríguez, J. (1 de DICIEMBRE de 2017). Inferencia
estadística Módulo de regresión lineal simple. Obtenido de Inferencia estadística
Módulo de regresión lineal simple: http://www.urosario.edu.co/Escuela-
administracion/Documentos/BI_147-Web.pdf
Galbiati Riesco, J. (1 de DICIEMBRE de 2017). REGRESION LINEAL SIMPLE. Obtenido
de REGRESION LINEAL SIMPLE:
http://depa.fquim.unam.mx/amyd/archivero/Estadistica_Regresion_18920.pdf
Universidad de Valencia. (1 de DICIEMBRE de 2017). Modelo de regresión lineal simple .
Obtenido de Modelo de regresión lineal simple :
https://www.uv.es/uriel/material/Morelisi.pdf

También podría gustarte