Está en la página 1de 11

UNIVERSIDAD SANTIAGO DE CALI

FACULTAD DE CIENCIAS BÁSICAS


Pág.1/11
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

UNIDAD 4: CORRELACIÓN Y REGRESIÓN


ANÁLISIS DE CORRELACIÓN Y REGRESIÓN SIMPLE

REGRESIÓN LINEAL SIMPLE EN EXCEL


Cuando se tienen un gran volumen de datos es importante contar con
herramientas computacionales como el Excel, que faciliten el cálculo de
las técnicas descritas anteriormente.

Ejemplo: Un empresa quiere analizar la relación existente entre el precio de un


producto (en miles de pesos) y la demanda del mismo (en número de unidades),
para esto se selecciona una muestra aleatoria cuyos resultados son los siguientes:

X 7 5 12 9 30 17 24 21 29 19 11 15 27 13 23 20 17 26 8 25
Y 90 100 72 86 43 60 55 54 44 66 82 70 45 62 51 61 70 46 87 42

Donde:
𝑋: es el precio del producto.
𝑌: es la demanda del producto.

Estos datos se ingresan en Excel y se visualizan de la siguiente forma:

Es recomendable ingresar primero la información de X y en la columna siguiente la


información de Y, para no tener problemas con los gráficos.
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.2/11
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

Para realizar el diagrama de dispersión se procede de la siguiente forma:


1. Se seleccionan ambos conjuntos de datos sin considerar los títulos.
2. Se da clic en la cinta Insertar (ubicada en la parte superior izquierda de la
pantalla).

3. Se da clic en el botón Insertar gráfico de dispersión (X, Y) o de burbujas (ubicado


en el centro de la parte superior de la pantalla), ver flecha en color rojo de la
siguiente imagen.
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.3/11
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

4. Se da clic en el primer icono con nombre Dispersión (ubicado en el centro de la


parte superior de la pantalla), ver flecha en color rojo de la siguiente imagen:

En el gráfico obtenido el eje horizontal corresponde a los valores de la variable X


y el eje vertical corresponde a los valores de la variable Y. Para garantizar que
los valores de la variable X queden en el eje horizontal y los valores de la variable
Y queden en el eje vertical, se deben ingresar en Excel los datos de la variable X
siempre en una columna antes a la columna donde se ingresan los datos de la
variable Y.

El gráfico de dispersión anterior muestra que la relación entre las variables precio
del producto y la demanda del mismo es indirecta o negativa. Antes de realizar
el análisis de regresión se debe calcular primero el coeficiente de correlación,
para ver si las variables están altamente correlacionadas.

5. Se calcula el coeficiente de correlación, con el fin de identificar con exactitud el


tipo y la magnitud de la relación entre ambas variables. Para esto en una celda
vacía se escribe Coeficiente de correlación y en la celda vacía del lado derecho
se ingresa la fórmula: =coef.de.correl(matriz1; matriz2). Dentro del paréntesis
primero se seleccionan los datos de la variable X (matriz1), luego se pone el
separador ; (punto y coma) o , (coma) y por último se seleccionan los datos de la
variable Y (matriz2), es decir:
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.4/11
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

Este resultado indica que además de encontrar una relación indirecta entre el
precio del producto y su demanda, esta relación es fuerte. Sugiriendo que entre
menor sea el precio del producto mayor será su demanda.

Ahora se pueden calcular los diferentes procesos del análisis de regresión.

6. Se da clic derecho en cualquiera de los puntos del gráfico y se da un clic en la


ventana emergente en la opción: Agregar línea de tendencia…
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.5/11
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

Inmediatamente el Excel traza la línea de regresión (línea punteada) y muestra


una información importante en una ventana al lado derecho de la pantalla.

Se pueden seleccionar algunas opciones de la ventana del lado derecho, por


ejemplo: Presentar ecuación en el gráfico, la cual muestra la ecuación de la recta
de regresión. Otra opción puede ser: Presentar el valor R cuadrado en el gráfico,
la cual muestra el valor del coeficiente de determinación. Para esto se da un clic
en las casillas en blanco al lado izquierdo de cada una de las opciones.
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.6/11
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

Si la ecuación se sobrepone a los puntos en el gráfico esta se puede seleccionar


y desplazarla a otro lugar dentro del gráfico.

La ecuación obtenida en este ejemplo es: 𝑦 = −2.1846𝑥 + 103.4.


Hay que tener claro que el valor que acompaña a la X, corresponde al coeficiente
𝑏 y el otro valor corresponde al coeficiente 𝑎, puesto que en términos generales
la ecuación de regresión es: 𝑦 = 𝑎 + 𝑏𝑥. Solo que Excel muestra la ecuación de
la forma 𝑦 = 𝑏𝑥 + 𝑎, sin embargo, los resultados obtenidos son los mismos. Por
lo tanto 𝑎 = 103.4 y 𝑏 = −2.1846.

La interpretación de los coeficientes en este caso es la siguiente:


𝑎 = 103.4, indica que, en la eventual ausencia de un precio para el producto (es
decir si es gratis), la demanda del mismo sería de 103.4, es decir,
aproximadamente 103 unidades.
𝑏 = −2.1846, indica que, por cada mil pesos que aumente el precio del producto,
la demanda del mismo disminuiría en 2.1846, es decir, aproximadamente en 2
unidades. O por cada mil pesos que disminuya el precio del producto, la demanda
del mismo aumentaría en 2.1846, es decir, aproximadamente en 2 unidades.

7. El valor del coeficiente de determinación y los coeficientes de regresión se


pueden igualmente calcular en las celdas de la hoja de cálculo de Excel de la
siguiente forma: En una celda vacía se escribe Coeficiente de determinación y en
una de las celdas vacías de las del lado derecho se ingresa la fórmula:
=coeficiente.r2(conocido_y; conocido_x). Dentro del paréntesis primero se
seleccionan los datos de la variable Y (conocido_y), luego se pone el respectivo
separador ; (punto y coma) o , (coma) y por último se seleccionan los datos de la
variable X (conocido_x), es decir:
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.7/11
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

Otra opción mucho más rápida para calcular el coeficiente de determinación es


multiplicar el valor del coeficiente de correlación por el mismo.

Para calcular los coeficientes de regresión se procede así: En unas celdas vacías
se escriben los coeficientes a y b, luego se selecciona la celda del lado derecho
frente a cada uno de ellos y se ingresan las siguientes formulas:
=interseccion.eje(conocido_y; conocido_x) para calcular el coeficiente a. y
=pendiente(conocido_y; conocido_x) para calcular el coeficiente b. En cada
caso dentro del paréntesis primero se seleccionan los datos de la variable Y
(conocido_y), luego se pone el respectivo separador ; (punto y coma) o , (coma)
y por último se seleccionan los datos de la variable X (conocido_x), es decir:
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.8/11
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

8. Finalmente, a partir de estos resultados de los coeficientes, se pueden hacer


algunas predicciones como son:

¿Cuántas serían las unidades demandadas, si el precio del producto fuera de 18


mil pesos? (Predecir Y por medio de X), o ¿Cuánto sería el precio del producto,
si las unidades demandadas fueran 95? (Predecir X por medio de Y).

Para responder estas preguntas se seleccionan varias celdas vacías y se escribe


lo siguiente:
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.9/11
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

¿Cuántas serían las unidades demandadas, si el precio del producto fuera de 18


mil pesos? (Predecir Y por medio de X). En este caso en la celda del lado derecho
de la palabra Con X, se escribe el valor que toma esta variable que es 18,
posteriormente en la celda del lado derecho de la palabra Predecir Y, se ingresa
la siguiente formula: =selección de celda donde está el valor del coeficiente
a + selección de celda donde está el valor del coeficiente b * selección de
celda donde está el valor de X, es decir:
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.10/11
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

¿Cuánto sería el precio del producto, si las unidades demandadas fueran 95?
(Predecir X por medio de Y). En este caso en la celda del lado derecho de la
palabra Con Y, se escribe el valor que toma esta variable que es 95,
posteriormente en la celda del lado derecho de la palabra Predecir X, se ingresa
la siguiente formula: =(selección de celda donde está el valor de X - selección
de celda donde está el valor del coeficiente a )/ selección de celda donde
está el valor del coeficiente b, es decir:
UNIVERSIDAD SANTIAGO DE CALI
FACULTAD DE CIENCIAS BÁSICAS
Pág.11/11
DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA
ÁREA DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I

Es decir que, si el precio del producto fuera de 18 mil pesos se demandarían


aproximadamente 64 unidades. Por otro lado, si las unidades demandadas
fueran 95, el precio del producto sería de aproximadamente 3847 pesos.

También podría gustarte