Está en la página 1de 10

Correlación y Regresión Lineal

INTRODUCCIÓN ________________________________________________________

El objetivo de este trabajo es analizar el grado de la relación existente entre variables


utilizando modelos matemáticos y representaciones gráficas. Así pues, para representar la
relación entre dos o más variables desarrollaremos una ecuación que permitirá estimar una
variable en función de la otra.

Por ejemplo, ¿en qué medida, un aumento de los gastos en publicidad hace aumentar
las ventas de un determinado producto?, ¿cómo representamos que la bajada de
temperaturas implica un aumento del consumo de la calefacción?...

A continuación, estudiaremos dicho grado de relación entre dos variables en lo que


llamaremos análisis de correlación. Para representar esta relación utilizaremos una
representación gráfica llamada diagrama de dispersión y, finalmente, estudiaremos un
modelo matemático para estimar el valor de una variable basándonos en el valor de otra,
en lo que llamaremos análisis de regresión.

OBJETIVOS _____________________________________________________________

• Aprender a calcular la correlación entre dos variables


• Saber dibujar un diagrama de dispersión
• Representar la recta que define la relación lineal entre dos variables
• Saber estimar la recta de regresión
• Realizar inferencia sobre los parámetros de la recta de regresión
• Predecir la variable independiente en función de la variable dependiente mediante la
recta de regresión

CONCEPTOS FUNDAMENTALES__________________________________________

 Definición de Correlación Lineal

La correlación trata de establecer la relación o dependencia que existe entre las dos
variables que intervienen en una distribución bidimensional.

Es decir, determinar si los cambios en una de las variables influyen en los cambios de la
otra. En caso de que suceda, diremos que las variables están correlacionadas o que hay
correlación entre ellas.
Correlación y Regresión Lineal

 Tipos de correlación

a) Correlación Directa:

La correlación directa se da cuando al aumentar una de las variables la otra aumenta. En


este caso la relación tiene un valor positivo significa que a valores altos en una variable
corresponden valores altos en la otra variable.

b) Correlación Inversa:

La correlación inversa se da cuando al aumentar una de las variables la otra disminuye.


En este caso la relación tiene signo negativo significa que las variables están relacionadas de
manera inversa de modo que cuando el valor aumenta en una, disminuye en la otra.

CONCEPTOS FUNDAMENTALES__________________________________________

c) Correlación Nula

La correlación nula se da cuando no hay dependencia entre las variables. En este caso se dice que
no hay una correlación lineal

Representación grafica

C orrel aci ón Nul a C orrel a ci ón Di rect a C or rel a c i ón Inve rsa


Correlación y Regresión Lineal

 Definición Regresión

Proceso general que consiste en predecir una variable a partir de otra mediante
medios estadísticos, utilizando datos anteriores

Recta de Regresión

Se llama así a la recta que atraviesa la nube de puntos y que mejor se ajusta a ellos. Si
llegamos a conocer esa ecuación, podremos llegar a estimar valores de”y” desconocidos a
partir de valores de “x” conocidos. La ecuación de una recta, ecuación de estimación o de
regresión es:

Dónde:
Y = es la variable dependiente
a = es el punto de intersección en y
b = es la pendiente de la recta. Si b es positiva (+) indica un una correlación directa; si b es
negativa (-) la correlación es inversa
X = La variable dependiente

Nota: Para determinar la ecuación de regresión es necesario calcular a y b, con las formulas
a continuación

Donde: es la media de las X, es decir la sumatoria de todos los valores de X entre el


número de datos y es la media de las Y es decir la sumatoria de todos los valores de y
dividido entre el número de datos.
Correlación y Regresión Lineal

CONCEPTOS FUNDAMENTALES__________________________________________

 Coeficiente de correlación de Pearson (Ґ)

Este coeficiente nos informa del grado de relación entre dos variables. El coeficiente Ґ
será positivo si la relación es positiva (al aumentar x aumenta y), y Ґ será negativo en el caso
contrario (si al aumentar x, disminuye y).

Coeficiente de Interpretación
correlación
1.00 Correlación Perfecta
0.80 a 0.99 Una alta relación de dependencia o correlación fuerte
0.60 a 0.79 Una relación entre moderada a acentuada
0.40 a 0.59 Una mediana relación
0.20 a 0.39 Una ligera relación o correlación débil
0.00 a 0.19 Una relación fortuita o insignificante

Ejercicio_________________________________________________________________

Zippy Cola está estudiando el efecto de su última campaña publicitaria. Se escogieron


personas al azar y se les llamó para preguntarles cuántas latas de Zippy Cola habían comprado
la semana anterior y cuántos anuncios de Zippy cola habían leído o visto la semana anterior.

X (números de anuncios) 3 7 4 2 0 4 1 2
y(latas compradas) 11 18 9 4 7 6 3 8

a. Construya el diagrama de dispersión, concluya


b. Desarrolle la ecuación de estimación que mejor se ajuste a los datos
c. Construya la recta de regresión.
Correlación y Regresión Lineal

d. Clasifique el tipo de correlación que rige el comportamiento o dependencia de las


variables observadas.
e. Efectuar el pronostico señalado en l ejercicio
f. Una persona compro 10 latas de Zippy, estime cuantos anuncios leyó
g. Calcule el valor del coeficiente de correlacion de Pearson. Interpretar

Solución ________________________________________________________________

Cálculos:

Multiplicar columna
Elevar al
1 por columna 2 Elevar al
cuadrado la
cuadrado la
Columna 1
Columna 2

N° N° latas
anuncios Y XY X² Y²
X

3 11 33 9 121

7 18 126 49 324
Correlación y Regresión Lineal

4 9 36 16 81

2 4 8 4 16

0 7 0 0 49

4 6 24 16 36

1 3 3 1 9

2 8 16 4 64

23 66 246 99 700

ES DECIR LAS VALROES TOTALES (SUMATORIAS) POR COLUMNAS SON


LOS SIGUIENTES: Sumatorias
columnas
por

∑X=23
∑Y=66
∑XY=246
∑X²=99
∑Y²=700

a. Construcción del diagrama de dispersión. ( A cada valor de x se asocia con el


valor de y para crear cada uno de los puntos)
Correlación y Regresión Lineal

Conclusión:
Se observa una Correlación Directa

b. Desarrolle la ecuación de estimación que mejor se ajuste a los datos

Tenemos que la ecuación de estimación es:

 Cálculo de la pendiente de la recta (b):

Donde
Correlación y Regresión Lineal

5
y

Luego se susitutye en la formaula cada valor

 Cálculo de del punto de corte con el eje “Y” (a):

Finalmente sustituyendo los valores de a y b en la ecuación de regresión tenemos que:

c. Construya la Recta de Regresión

Utilizamos la ecuación de regresión para trazar la recta. Para esto, seleccionamos dos valores
cualquiera de X se recomienda tomar el valor mayor y menor de X en la tabla de datos. Donde
está la X se coloca el numero o valor que vamos a sustituir

Tenemos que:

Para X1 = 0

Para X2 = 7

Obtenemos un valore de Y para cada valor de X, estos pares de valores se grafican sobre la
grafica de dispersión y obtenemos:
X1= 0 X2= 7
Y1 = 3,33 Y2 = 15,3
Correlación y Regresión Lineal

d. Clasifique el tipo de correlación que rige el comportamiento o dependencia de las


variables observadas.
Ya que b es mayor que cero ( , entonces podemos afirmar que existe una
correlación directa es decir que a medida que las personas lean mas anuncios de Zipp
Cola, comprara mas y viceversa.

e. Mediante la ecuación de regresión prediga el valor del número de latas compradas


por una persona que leyó 5 anuncios.
X= 5 ; Y= ? : se sustituye X en la ecuación de regresión

Aproximadamente 12

Conclusión: Se estima que para una persona que leyó 5 anuncios, comprara 12 latas
de Zipp Cola

f. Una persona compro 10 latas de Zippy, Cola estime cuantos anuncios leyó
Se despeja de la ecuación de regresión X
Y=10; X=?

Aproximadamente 4

Conclusión: Se estima que una persona que haya comprado 10 lata de Zipp Cola debe
haber leído 4 anuncios.
Correlación y Regresión Lineal

g. Calcule el valor del coeficiente de Pearson. Concluya

Conclusión: Existe una moderada correlación lineal entre el número de anuncios


leído y el número de latas compradas, es decir que a mayor anuncio leído mayor será
el número de datos comprados.

También podría gustarte