Está en la página 1de 13

REGRESIÓN Y CORRELACIÓN LINEAL

Son dos herramientas para investigar la dependencia de una variable dependiente Y en


función de una variable independiente X. Y = f(X)

Y = Variable dependiente que se desea explicar o predecir, también se llama regresor o


respuesta

X = Variable independiente, también se llama variable explicativa, regresor o predictor

Regresión lineal – La relación entre X y Y se representa por medio de una línea recta
Regresión curvilínea – La relación entre X y Y se representa por medio de una curva.

La ecuación de la recta es la siguiente:

Y=b1 X +b0

El error es la diferencia entre los valores reales observados (Xi ,Yi) y los valores estimados
por la ecuación de la recta. Se trata de que estos sean mínimos, para lo cual se utiliza el
método de mínimos cuadrados.

El coeficiente de Correlación r desarrollado por Carl Pearson es un indicador de la fuerza


de la relación entre las variables X y Y, puede asumir valores entre -1 y 1 para
correlación negativa y positiva perfecta respectivamente. Por ejemplo si se encuentra
que la variable presión tiene una correlación positiva con el rendimiento de una caldera,
se deben buscar soluciones al problema mediante acciones asociadas con la variable
presión; de lo contrario, sería necesario buscar la solución por otro lado.
Ejemplo:

A continuación se presentan las ventas trimestrales en miles de pesos de diez restaurantes


localizados cerca de una Universidad Adolfo Ibañez y la población estudiantil en miles que
acude a dichos restaurantes:

Calcule el coeficiente de correlación, elabore la ecuación de la regresión y pronostique


las ventas trimestrales para una población estudiantil de 10
Pasos:

1. Encontrar el coeficiente de correlación

a. Sitúe el cursor en la celda donde desea que Excel proporcione el resultado.


b. Seleccione el menú fórmulas y click en insertar función

c. Seleccione la categoría de estadísticas y posteriormente COEF.DE.CORREL presione


aceptar

d.En la matriz 1 elija la columna "x" y en la matriz 2 la columna "y" click en aceptar
2. Encontrar los valores de la ecuación de regresión.

a. Sitúe el cursor donde desea que aparezcan los valores.


b. Agregue las herramientas de análisis de excel si no las tiene activas para ello: sitúe el
cursor en la parte superior de los menús, click derecho, elegir personalizar barra de
herramientas de acceso rápido

c. Elegir Complementos, en la parte inferior elija complementos de excel ir a


d. Elija herramientas para análisis y click en aceptar.
e. Click en análisis de datos, a continuación elija regresión y click en aceptar

f. En rango y de entrada elija la columna de datos "y" y en rango x de entrada elija la


columna de datos "x" en rango de salida elija la celda donde desea el resultado y haga
click en aceptar.
g. En la imagen puede observar que obtuvo el valor de la correlación y los valores de las
variables b0 y b1 para la ecuación de la regresión lineal en este caso los valores son: 60 y 5
respectivamente.
3. Pronostique para cada población estudiantil incluyendo la solicitada que es 10.

4. Realice la gráfica tomando en cuenta las ventas trimestrales y el valor estimado


(pronóstico, ver abajo)
Gráficos

Una vez que se han presentado y calculado todos los parámetros en la hoja de cálculo se
le da nombre y pasamos a representar la grafica correspondiente de la nube de puntos y
la recta de regresión calculada, para ello, seleccionaremos los datos y a continuación
escogeremos la opción asistente para gráficos de la barra de herramientas, y el diagrama
de dispersión XY.

quedará en este momento el gráfico como muestra la siguiente figura, apretando la


opción con el botón derecho del mouse en seleccionar datos (seleccione ambas
columnas):

2
6
8
8
12
16
20
20
22
26
para que aparezca conjuntamente la recta de regresión y la ecuación de dicha recta,
debemos seleccionar los puntos dentro del menú gráfico (botón derecho mouse),
AGREGAR LINEAS DE TENDENCIA.

Aparecerá una nueva ventana donde podremos escoger el tipo de línea de tendencia que
deseamos, en este caso LINEAL:
y dentro de la ficha de opciones, seleccionaremos, PRESENTAR ECUACIÓN EN EL GRAFICO.

Una vez creado el grafico, podemos cambiar fácilmente las opciones de color
de la recta y de todos los textos, fondos, títulos, colores, etc. de la gráfica
final.

Para obtener datos reales pueden usar:

https://datos.bancomundial.org/

http://www.oecd.org/pages/0,3417,es_36288966_36288678_1_1_1_1_1,00.
html
EJERCICIO (Los datos se encuentran disponibles en la hoja Excel):

1. Se presentan los datos del porcentaje de niños inmunizados contra DDT (Difteria, tos
ferina y tétanos) y tasa de mortalidad Inferior a 5 años en 20 países (1992).

a) ¿Cuáles son las variables independiente y dependiente del problema?


b) Antes de analizar los datos, postule el tipo de correlación que debería encontrar.
c) Trazar un gráfico que muestre ambas variables.
d) Obtener el coeficiente de correlación.
e) Realice una discusión de los resultados (Establezca al menos cuatro aspectos).

También podría gustarte