Está en la página 1de 29

ASIGNATURA ESTADÍSTICA

SESIÓN 10

William David Patiño

Docente

Tecnológico de Antioquia
SESIÓN 10

REGRESIÓN LINEAL Y
CORRELACIÓN
SESIÓN 10

REGRESIÓN LINEAL Y CORRELACIÓN

En las unidades anteriores se ha centrado la


atención en el tratamiento de los valores que
puede tomar una variable definida en una
investigación, tanto en el nivel de muestra
como en el de población. Sin embargo,
frecuentemente las investigaciones implican
considerar dos o más variables y la relación que
se establece entre ellas.
SESIÓN 10
REGRESIÓN LINEAL Y CORRELACIÓN

En las diversas aplicaciones de las ciencias físicas, biológicas,


económicas y sociales encontramos a menudo variables
estadísticas que presentan algún tipo de asociación o
dependencia unas de otras. Por ejemplo, la cantidad recogida
de cierta cosecha es una región geográfica es una variable que
se encuentra asociada con la participación fluvial en dicha
región. Otras variables relacionadas entre sí podrían ser: la
contaminación atmosférica con la incidencia de alguna
epidemia, el consumo de cigarrillos con el cáncer pulmonar, el
aumento de peso de un animal con la relación diaria de
alimentos, el entrenamiento en la realización de una actividad
con el tiempo gastado en hacerla. En todos estos casos se
observa algún grado de relación entre las variables y decimos
que ellas esta correlacionadas.
SESIÓN 10
REGRESIÓN LINEAL Y CORRELACIÓN

La regresión lineal y la correlación son dos


técnicas estrechamente relacionadas, el
coeficiente de correlación es un número que da el
grado de intensidad de la relación mutua entre
dos variables; y la regresión lineal da lugar a una
ecuación matemática que muestra dicha relación,
esta ecuación se puede utilizar para estimar o
predecir los valores futuros que puede tomar una
variable cuando se conoce o suponen los valores
de la otra variable.
SESIÓN 10
REGRESIÓN LINEAL Y CORRELACIÓN

Para cuantificar el grado de relación entre dos


variables se utiliza el coeficiente de correlación
de Pearson que se representa por “r”

n XiYi    Xi   Yi 
r = n
 xi    xi  n yi    yi  
2 2 2 2
SESIÓN 10
REGRESIÓN LINEAL Y CORRELACIÓN
Características de r:
 
 Se encuentra en el intervalo [ -1 , 1]
 Una relación positiva ( r positivo) entre dos variables
significa que los valores altos de una variable están
relacionados con los valores altos de otra variable.
 una relación negativa (r negativo) entre dos variables,
significa que los valores altos de una variable están
relacionados con los valores bajos de la otra variable.
SESIÓN 10
REGRESIÓN LINEAL Y CORRELACIÓN
Características de r:
 
SESIÓN 10
REGRESIÓN LINEAL Y CORRELACIÓN
Características de r:
 
SESIÓN 10
REGRESIÓN LINEAL Y CORRELACIÓN
Para la regresión lineal el método que más se utiliza es la
de los mínimos cuadrados, que es una técnica para
llegar a la ecuación de la recta minimizando la suma de los
cuadrados de las distancias verticales entre los valores de
la variable y verdaderos y los valores pronosticados.
 
La ecuación de la recta está dada por: Y= A + BX
 
X = variable independiente
Y = variable dependiente 
SESIÓN 10
REGRESIÓN LINEAL Y CORRELACIÓN
Características de r:
 
SESIÓN 10
REGRESIÓN LINEAL Y CORRELACIÓN
 
SESIÓN 10
REGRESIÓN LINEAL Y CORRELACIÓN
 La ecuación de la recta está dada por: Y= A + BX
 
X = variable independiente
Y = variable dependiente

Los valores de A y de B dados por las siguientes fórmulas:

  y   x     x    x y 
2
i i i
B
 i
 
n  x i. y    xi   y
i

A
  
i i

n  x     x i 
2
i
2
n  xi   x i
2
 2
SESIÓN 10
REGRESIÓN LINEAL Y CORRELACIÓN
 
SESIÓN 10
REGRESIÓN LINEAL Y CORRELACIÓN
DIAGRAMA DE DISPERSIÓN: Es una gráfica de puntos (x , y) que muestra la
 
relación mutua entre las variables.

CORRELACIÓN POSITIVA

40
35
30
25
Y

20
15
10
5
0
0 10 20 30 40
X
SESIÓN 10
REGRESIÓN LINEAL Y CORRELACIÓN
DIAGRAMA DE DISPERSIÓN: Es una gráfica de puntos (x , y) que muestra la
 
relación mutua entre las variables.

CORRELACIÓN NEGATIVA

35
30
25
Y

20
15
10
5
0
0 10 20 30 40
X
SESIÓN 10
REGRESIÓN LINEAL Y CORRELACIÓN
EJEMPLO 1: La siguiente tabla muestra el precio en miles de pesos y el
 
número de unidades vendidas (demanda) de cierto producto.

Precio 10.0 4.7 8.5 8.0 4.5 4.0 3.0 2.0


No. de Unidades 100 150 128 120 162 170 180 200
Vendidas

1. Determinar el coeficiente de correlación de Pearson.


2. Hallar la recta que mejor se ajusta a este conjunto de datos.
3. Hacer un diagrama de dispersión y graficar la recta.
4. Estimar el número de unidades vendidas cuando el precio sea de $5000.
SESIÓN 10

EJEMPLO 1: La siguiente tabla muestra el precio en miles de pesos y el


número de unidades vendidas (demanda) de cierto producto.

Precio 10.0 4.7 8.5 8.0 4.5 4.0 3.0 2.0


No. de Unidades 100 150 128 120 162 170 180 200
Vendidas

1. Determinar el coeficiente de correlación de Pearson.

n xi . yi  ( xi ).( yi )
r
 n xi 2  ( xi ) 2  .  n yi 2  ( yi ) 2 
SESIÓN 10

EJEMPLO 1: La siguiente tabla muestra el precio en miles de pesos y el


número de unidades vendidas (demanda) de cierto producto.

Precio 10.0 4.7 8.5 8.0 4.5 4.0 3.0 2.0


No. de Unidades 100 150 128 120 162 170 180 200
Vendidas

1. Determinar el coeficiente de correlación de Pearson.


Xi Yi Xi ^2 Yi ^2 Xi * Yi
10.0 100 100 10000 1000
4.7 150 22.09 22500 705
8.5 128 72.25 16384 1088
8.0 120 64 14400 960
4.5 162 20.25 26244 729
4.0 170 16 28900 680
3.0 180 9 32400 540
2.0 200 4 40000 400

  44.7   1210   307.59   190828   6102


SESIÓN 10

1. Para hallar el coeficiente de correlación de Pearson reemplazamos los


valores de la anterior tabla en la siguiente expresión.

n xi . yi  ( xi ).( yi )
r
 n xi 2  ( xi ) 2  .  n yi 2  ( yi ) 2 

8(6102)  (44.7)(1210)
r  0.98
8(307.59)  (44.7)  . 8(190828)  (1210) 
2 2

Como r < -0,7 podemos decir que hay una alta correlación negativa entre las
dos variables: es decir, a medida que aumenta el precio del artículo
disminuye la demanda.
SESIÓN 10

2. Para hallar la recta de mejor ajuste por el método de los mínimos cuadrados
empleamos las expresiones:

La ecuación de la recta que está dada por: Y= A + BX

Y los valores de A y B que están dados por las expresiones:

A
  y   x     x    x y 
2
i i i
B
 i
 
n  x i. y    xi   y
i

  
i i

n  x     x i  n  xi   x i 
2 2 2 2
i
SESIÓN 10

2. Para hallar la recta de mejor ajuste por el método de los mínimos cuadrados
empleamos las expresiones:

( yi ).( xi 2 ) ( xi ).( xi. yi ) (1210).(307.59)  (44.7).(6102)


A   214.91
n( xi 2 ) ( xi ) 2 8(307.59)  (44.7) 2

n xi . yi  ( xi ).( yi ) 8(6102)  (44.7)(1210)


B   11.39
n( xi 2 ) ( xi ) 2 8(307.59)  (44.7) 2

La ecuación de la recta que mejor se ajusta esta dada por Y = A + BX


por lo tanto:

Y = 214,91 – 11,39X

donde X representa el precio y Y la demanda.


SESIÓN 10

3. En la siguiente gráfica se presenta el diagrama de dispersión y la línea de


mejor ajuste.

DEMANDA
NÚM ERO DE UNIDADES

210
190
170 y = -11,394x + 214,91
150
130
110
90
0 2 4 6 8 10 12

MILES DE $
SESIÓN 10

4. Cuando el precio sea de $5000 se puede estimar la demanda reemplazando


en la ecuación X = 5 y obtener un valor para Y así:

Y = 214,91 – 11,39X

Y = 214,91 – 11,39(5)

Y = 214,91 – 56,95

Y = 158

Cuando el precio sea de $5000 se espera vender 158 unidades del producto.
SESIÓN 10
REGRESIÓN LINEAL Y CORRELACIÓN
EJEMPLO 2: La siguiente tabla muestra la edad y la presión sanguínea de
 
doce mujeres:

Edad 56 42 72 36 63 47 55 49 38 42 68 60
Presión Sanguínea 147 125 160 118 149 128 150 145 115 140 152 155

1. Determinar el coeficiente de correlación de Pearson.


2. Hallar la recta que mejor se ajusta a este conjunto de datos.
3. Hacer un diagrama de dispersión y graficar la recta.
4. Estimar la presión sanguínea de una mujer de 45 años.

r = 0,90
A = 80,78
B = 1,14
SESIÓN 10
REGRESIÓN LINEAL Y CORRELACIÓN
EJEMPLO 3: Se hace un estudio para determinar la relación entre las edades
de  un gran grupo de máquinas en una fábrica y sus respectivas eficiencias.
Las siguientes son las edades en años y un índice de eficiencia para una
muestra aleatoria de 8 de estas máquinas:
Edad 2 4 11 9 4 6 7 8
Eficiencia 90 65 25 40 80 60 35 50

1. Determinar el coeficiente de correlación de Pearson.


2. Hallar la recta que mejor se ajusta a este conjunto de datos.
3. Hacer un diagrama de dispersión y graficar la recta.
4. Estimar la eficiencia de una máquina de 10 años.

r = 0,94
A = 100,64
B = -7,06
SESIÓN 10
REGRESIÓN LINEAL Y CORRELACIÓN
EJEMPLO 4: Una empresa de bebidas refrescantes observa que sus ventas (y)
  de botellas) de la calle se ven afectadas por la temperatura (x) (grados
(miles
centígrados) que hace en el día. La siguiente tabla expone los resultados de 10
ciudades

x 5 7 10 12 16 20 23 27 19 14
y 9 11 15 16 20 24 27 29 22 20

1. Determinar el coeficiente de correlación de Pearson.


2. Hallar la recta que mejor se ajusta a este conjunto de datos.
3. Hacer un diagrama de dispersión y graficar la recta.
4. Estimar la proyección de ventas para un día soleado a 30°.

r = 0,99
A = 5,2
B = 0,92
SESIÓN 10

¿INQUIETUDES?
SESIÓN 10

Relación de Componentes Curriculares

¡POR SER PARTE DE ESTE GRAN RETO!

También podría gustarte