Está en la página 1de 53

ESTADISTICA MATEMATICA

REGRESIÓN Y CORRELACIÓN Introducción

 El término regresión fue introducido por Galton en su libro


“Natural inheritance” (1889) refiriéndose a la “ley de la regresión
universal”:

“Cada peculiaridad en un hombre es compartida por sus


descendientes, pero en media, en un grado menor.”

 Se introdujo la idea de regresión a la media

 Su trabajo se centraba en la descripción de los rasgos físicos de los


descendientes (una variable) a partir de los de sus padres (otra
variable).

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Introducción

 Pearson (un amigo suyo) realizó un estudio con más de 1000


registros de grupos familiares observando una relación del tipo:

Altura del hijo = 85cm + 0,5 • altura del padre (aproximadamente)

 La conclusión fue:
o los padres muy altos tienen tendencia a tener hijos que
heredan parte de esta altura, aunque tienen tendencia a acercarse
(regresar) a la media.
o Lo mismo puede decirse de los padres muy bajos.

 Actualmente el sentido de regresión es el de predicción de una


medida basándose en el conocimiento de otra.

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Introducción

Muchas veces las decisiones estadísticas se basan en la relación


entre dos o más variables.

Ejemplos

 Relación entre el ingreso familiar y el gasto por consumo.

 Relación entre la dosis de fertilizantes aplicadas en un terreno y


rendimiento del cultivo.

 Relación entre el tamaño de un lote de producción y la cantidad de


horas –hombres utilizadas para realizarlo.

 Relación entre el número de horas de estudio previas a un examen


y la calificación obtenida en el mismo

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Relación funcional entre dos variables

 Una relación funcional se expresa mediante una función matemática.

 Si X es la variable independiente e Y es la variable dependiente, una


relación funcional tiene la forma:

Y=f(X)

Ejemplo
Se ha observado la dosis de fertilizante aplicada en determinadas parcelas
y el rendimiento del cultivo existente en ellas.

Parcela Dosis Rend.(kg/h)


1 75 150
2 25 50
3 130 260

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Relación funcional entre dos variables

Relación funcional perfecta entre dosis y


rendimientos

300

250

200

150
Rend.
100
im
toR
n
d
e

50

0 20 40 60 80 100 120 14

Nota: Las observaciones caen exactamente sobre la línea de relación


Dosis
funcional

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Relación estadística entre dos variables

En la relación estadística las observaciones no caen exactamente sobre la


curva de relación entre las variables
Lote de prod. Tamaño del lote Horas hombre
Ejemplo
1 30 73
2 20 50
3 60 128
4 80 170
5 40 87

La mayor parte de los puntos no caen directamente sobre la línea de relación


estadística.
Esta dispersión de punto alrededor de la línea representa la variación aleatoria
Dra. Norka Bedregal Alpaca
REGRESIÓN Y CORRELACIÓN Relación estadística entre dos variables

Ejemplo
El dueño de una empresa que vende carros desea determinar si hay
relación lineal entre los años de experiencia de sus vendedores y la
cantidad de carros que venden.

Los siguientes datos representan los años de experiencia (X) y las


unidades de carros vendidas al año (Y), de 10 vendedores de la empresa

Primero se grafican los puntos obtenidos considerando los años de


experiencia en el eje horizontal y las ventas en el eje vertical

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Relación estadística entre dos variables

Scatterplot of ventas vs years


50

40
ventas

30

20

10

0 5 10 15 20 25
years

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Relación estadística entre dos variables

Ejemplo: Estudio conjunto de dos variables aleatorias


 Se tiene una muestra de individuos, en los
Altura en Peso en
que se ha observado el peso y la estatura cm. Kg.
162 61
 En cada fila se tiene los datos de un
154 60
individuo
180 78

 Cada columna representa los valores que 158 62

toma una variable aleatoria sobre los mismos. 171 66


169 60
 Las individuos no se muestran en ningún 166 54
orden particular. 176 84
163 68
 El objetivo es determinar si hay relación ... ...
entre las variables, de qué tipo, y si es posible
predecir el valor de una de ellas en función de
la otra.
Dra. Norka Bedregal Alpaca
REGRESIÓN Y CORRELACIÓN Relación estadística entre dos variables

 Primero se grafican los puntos obtenidos

 Cada punto es un valor particular de la variable aleatoria


bidimensional (X, Y). ¿quién es X? ¿quién es Y?

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Relación estadística entre dos variables

Se tienen las alturas y los pesos de 30 individuos representados en un


diagrama de puntos llamado diagrama de dispersión.

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Relación estadística entre dos variables

Predicción de una variable en función de otra


Aparentemente el peso aumenta 10Kg por cada 10 cm de altura... O sea,
el peso aumenta en una unidad por cada unidad de altura.

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Conceptos básicos

 Análisis de Regresión:
Es el procedimiento estadístico que estudia la naturaleza de la relación
funcional entre variables, con la finalidad de predecir una variable en
función de las otras.

 Análisis de Correlación:
Conjunto de técnicas estadísticas usadas para medir el grado de la
relación entre dos variables

 Diagrama de Dispersión:
Gráfico que muestra la forma y el sentido de la relación entre dos
variables de interés. También proporciona una idea del grado o
intensidad de esa relación

 Variable dependiente (respuesta, predicha, endógena):


Variable que se desea predecir o estimar

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Conceptos básicos

Variables independientes (predictoras, explicativas exógenas).


Son las variables que proveen las bases para estimar.

 Regresión simple:
Interviene una sola variable independiente

 Regresión múltiple:
Intervienen dos o más variables independientes.

 Regresión lineal:
La función es una combinación lineal de los parámetros.

 Regresión no lineal:
La función que relaciona los parámetros no es una combinación lineal

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Diagrama de dispersión

 Los diagramas de dispersión muestran la forma de la relación existente


entre variables
 También resaltan las observaciones individuales que se desvían de la
relación general.
 Estas observaciones son conocidas como outliers o valores inusitados,
que son puntos de los datos que aparecen separados del resto.

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Covarianza de dos variables aleatorias X e Y

 La covarianza entre dos variables, Sxy, nos indica si la posible


relación entre dos variables es directa o inversa

 Se calcula mediante:

1
S xy = ∑ ( xi − x )( yi − y )
n i

 Directa: Sxy > 0


 Inversa: Sxy < 0
 Incorreladas: Sxy = 0
El signo de la covarianza indica si el aspecto de la nube de puntos es
creciente o no, pero no nos dice nada sobre el grado de relación entre las
variables.

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Coeficiente de correlación lineal

 También se le llama coeficiente de correlación de Pearson

 Se representa por r y es una medida que representa el grado de


asociación entre dos variables cuantitativas X e Y.

 Indica si los puntos tienen una tendencia a disponerse alineadamente


(excluyendo rectas horizontales y verticales).

 Tiene el mismo signo que Sxy . Por tanto de su signo se obtine el que
la posible relación sea directa o inversa.

 Es útil para determinar si hay relación lineal entre dos variables, pero
no servirá para otro tipo de relaciones (cuadrática, logarítmica,...)

 Se define por:
S xy
r=
SxS y
Dra. Norka Bedregal Alpaca
REGRESIÓN Y CORRELACIÓN Coeficiente de correlación lineal

Otras formas de calcular r


Mediante la fórmula desarrollada:
n(ΣXY ) - (ΣX )(ΣY )
r=
[ n(ΣX 2
][ ( )
) - (ΣX ) 2 n ΣY 2 - ( ΣY )
2
]
En función de las observaciones individuales

Donde:

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Coeficiente de correlación lineal

Observaciones
Tanto Sxx como Syy no pueden ser negativas

 Sxy si puede ser positiva o negativa.

 Varía entre -1 y 1.

 Valores de -1 ó 1 indican correlación perfecta.

 Valor igual a 0 indica ausencia de correlación.

 Valores negativos indican una relación lineal inversa y valores


positivos indican una relación lineal directa

 En la mayoría de los problemas, una correlación mayor que 0.75 o


menor que -0.75 es considerada bastante aceptable.

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Coeficiente de correlación lineal

Observaciones
 Una correlación que cae entre -0.3 y 0.3 es considerada muy baja.

 Si la correlación es positiva entonces cuando X aumenta se espera que


Y tambien aumente.

 Si la correlación es negativa entonces cuando X aumenta se espera que


Y disminuya.

 Si r = 0 no necesariamente las variables son independientes

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Correlación Negativa Perfecta

10
9
8
7
6
Y 5
4
3
2
1
0

0 1 2 3 4 5 6 7 8 9 10
X
Dra. Norka Bedregal Alpaca
REGRESIÓN Y CORRELACIÓN Correlación Positiva Perfecta

10
9
8
7
6
Y 5
4
3
2
1
0

0 1 2 3 4 5 6 7 8 9 10
X
Dra. Norka Bedregal Alpaca
REGRESIÓN Y CORRELACIÓN Ausencia de Correlación

10
9
8
7
6
Y 5
4
3
2
1
0

0 1 2 3 4 5 6 7 8 9 10
X
Dra. Norka Bedregal Alpaca
REGRESIÓN Y CORRELACIÓN Correlación Fuerte y Positiva

10
9
8
7
6
Y 5
4
3
2
1
0

0 1 2 3 4 5 6 7 8 9 10
X
Dra. Norka Bedregal Alpaca
REGRESIÓN Y CORRELACIÓN Modelos de Regresión

 Un modelo de regresión, es una forma de expresar dos componentes


presentes en una relación estadística:
o La tendencia de la variable dependiente Y a variar de manera
conjunta con la variación de la variable independiente X de manera
sistemática
o La dispersión de las observaciones en torno a la curva de relación
estadística

 Estas dos características están presentes en un modelo de regresión,


suponiendo que:
o En la población de observaciones asociadas con el proceso que
fue muestreado, hay una distribución de probabilidades de Y para
cada nivel de X.
o Las medias de estas distribuciones varían de manera sistemática al
variar X.

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Representación gráfica del modelo de Regresión Lineal

Nota:
En la figura se muestran las distribuciones de probabilidades de Y para
distintos valores de X

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Análisis de Regresión
 Utilidad:
El análisis de regresión sirve para predecir una medida en función de
otra medida (regresión simple) o de varias medidas (regresión múltiple)
Se determina la ecuación de regresión que servirá para predecir los
valores de la variable dependiente (Y) en base a la o las variables
independientes (X).

 Supuestos de Regresión Lineal Clásica


Cada error está normalmente distribuido con:
o Esperanza de los errores igual a 0
o Variancia de los errores igual a una constante σ 2.
o Covariancia de los errores nula para todo i≠ j

Procedimiento:
o Seleccionar una muestra a partir de la población
o Listar pares de datos para cada observación
o Dibujar un diagrama de dispersión para obtener una idea visual de
la relación
o Determinar la ecuación de regresión. Dra. Norka Bedregal Alpaca
REGRESIÓN Y CORRELACIÓN Modelo de Regresión Lineal Simple

Se tiene que:
 Y : Variable dependiente, predicha, explicada
 X : Variable independiente, predictora, controlada, explicativa

¿Es posible descubrir una relación?


Y = f(X) + error

donde:
 f es una función de un tipo determinado
 el error es aleatorio, pequeño, y no depende de X

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Modelo de Regresión Lineal Simple

El modelo de regresión lineal está dado por la ecuación


Y =α +βX + ε
yˆ i = α + β xi + ei

La ecuación de regresión lineal está dada por la ecuación


yˆ = α + β x

Como los parámetros α , β son desconocidos, es necesario


estimar su valor para ello se sigue el siguiente:

Procedimiento:
o Seleccionar una muestra a partir de la población
o Listar pares de datos para cada observación
o Dibujar un diagrama de dispersión para obtener una idea visual
de la relación
o Determinar la ecuación de regresión.
Dra. Norka Bedregal Alpaca
REGRESIÓN Y CORRELACIÓN Regresión Lineal Simple

Considerando los datos obtenidos en la muestra y el modelo de


regresión lineal:
yi = α + β xi + ei

es posible estimarlos valores de α y de β mediante los estadísticos


muestrales a , b y e

con lo que el modelo de regresión en la muestra queda determinada


por la ecuación
yˆ i = a + b xi

Donde:
 ŷi es el valor estimado de Y para distintos X.
 a es la intersección o el valor estimado de Y cuando X=0
 b es la pendiente de la línea, o el cambio promedio de ŷi para cada
cambio en una unidad de X

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Regresión Lineal Simple

y e ŷ rara vez coincidirán por muy bueno que sea el modelo de regresión.

A la cantidad
e = y-ŷ
se le denomina residuo o error residual

La estimación de α y de β mediante los estadísticos muestrales a , b


se hace mediante el método de mínimos cuadrados, que se basa en
minimizar la suma del cuadrados de los errores.
n n

∑e = ∑ ( yi − a − b xi )
2 2
i
i =1 i =1

Con lo que se obtiene:

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Regresión Lineal Simple

Las que también pueden expresarse como:

n( Σ XY ) − ( Σ X )( Σ Y )
b=
n( Σ X 2 ) − ( Σ X ) 2
ΣY ΣX
a = −b
n n

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Regresión Lineal Simple

Ejemplo : Venta de automóviles

Una importadora de automóviles está interesada en aumentar sus


volúmenes de venta.
Se piensa que si aumentan el porcentaje de comisión pagada al vendedor
de automóviles, entonces aumentaría la venta.

Para validar esta suposición se ha tomado información sobre 15


concesionarios similares, se ha considerado:

• las comisiones pagadas ha vendedores (en % del valor de la ventas)


• la ganancia neta por ventas en el mismo mes (en miles de soles)

¿cuál es la posible relación funcional? ¿las comisiones dependen de la


ganancia neta? ¿la ganancia neta depende de las comisiones?

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Regresión Lineal Simple

X: Comisiones pagadas a vendedores de autos en un mes (%)


Y: Ganancias netas por ventas, en el mismo mes (Miles de S/.)

Observación X Y
1 3.6 11.28
2 5.2 14.74
3 5.3 18.46
4 7.3 20.01
5 5 12.43
6 5.2 15.37
7 3 9.59
8 3.1 11.26
9 3.2 8.05
10 7.5 27.91
11 8.3 24.62
12 6.1 18.8
13 4.9 13.87
14 5.8 12.11
15 7.1 23.68

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Regresión Lineal Simple

Se representan de los datos en un diagrama o gráfico de dispersión:

Se puede apreciar la relación lineal existente entre ambas variables


observadas.

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Regresión Lineal Simple

El problema es estimar los parámetros a, b para poder identificar la


ecuación de regresión

Para ello se utiliza el método de Mínimos cuadrados, que consiste en


encontrar aquellos valores de a y de b que hagan mínima la suma de los
cuadrados de las desviaciones de las observaciones respecto de la recta
que representa el modelo, en el sentido vertical

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Regresión Lineal Simple

Es necesario saber si los datos observados se pueden o no ajustar


mediante un modelo lineal, para ello se encuentra el coeficiente de
correlación:
Observación X Y XY X2 Y2

1 3.6 11.28 40.608 12.96 127.2384


2 5.2 14.74 76.648 27.04 217.2676
3 5.3 18.46 97.838 28.09 340.7716
4 7.3 20.01 146.073 53.29 400.4001
5 5 12.43 62.15 25 154.5049
6 5.2 15.37 79.924 27.04 236.2369
7 3 9.59 28.77 9 91.9681
8 3.1 11.26 34.906 9.61 126.7876
9 3.2 8.05 25.76 10.24 64.8025
10 7.5 27.91 209.325 56.25 778.9681
11 8.3 24.62 204.346 68.89 606.1444
12 6.1 18.8 114.68 37.21 353.44
13 4.9 13.87 67.963 24.01 192.3769
14 5.8 12.11 70.238 33.64 146.6521
15 7.1 23.68 168.128 50.41 560.7424
TOTAL 80.6 242.18 1427.357 472.68 4398.302

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Regresión Lineal Simple

Aplicando la fórmula correspondiente:

n(ΣXY ) - (ΣX )(ΣY )


r=
[ n(ΣX 2
][ ( )
) - (ΣX ) 2 n ΣY 2 - ( ΣY )
2
]
1890.65
r = = 0.91
2085.40

Como r  1, existe una fuerte correlación positiva por tanto se puede


aplicar mínimos cuadrados para estimar los coeficientes del modelo

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Regresión Lineal Simple
La solución está dada por las siguientes fórmulas:

Se calculan las desviaciones respecto de las medias, sus cuadrados y productos:

Observación X Y X - 5.4 Y - 16.1 (X - 5.4)2 (Y - 16.1)2 (X - 5.4) (Y - 16.1)


1 3.6 11.28 -1.8 -4.9 3.145 23.671 8.628
2 5.2 14.74 -0.2 -1.4 0.030 1.975 0.244
3 5.3 18.46 -0.1 2.3 0.005 5.358 -0.170
4 7.3 20.01 1.9 3.9 3.712 14.936 7.446
5 5 12.43 -0.4 -3.7 0.139 13.804 1.387
6 5.2 15.37 -0.2 -0.8 0.030 0.601 0.134
7 3 9.59 -2.4 -6.6 5.633 42.972 15.558
8 3.1 11.26 -2.3 -4.9 5.168 23.866 11.106
9 3.2 8.05 -2.2 -8.1 4.723 65.534 17.594
10 7.5 27.91 2.1 11.8 4.523 138.407 25.020
11 8.3 24.62 2.9 8.5 8.565 71.820 24.803
12 6.1 18.8 0.7 2.7 0.528 7.047 1.929
13 4.9 13.87 -0.5 -2.3 0.224 5.177 1.077
14 5.8 12.11 0.4 -4.0 0.182 16.284 -1.722
15 7.1 23.68 1.7 7.5 2.981 56.771 13.010
TOTAL 80.6 242.18 0.0 0.0 39.589 488.225 126.043
PROMEDIO 5.4 16.1
Dra. Norka Bedregal Alpaca
REGRESIÓN Y CORRELACIÓN Regresión Lineal Simple

Entonces utilizando las fórmulas anteriores:

b =3.18 a = -0.96

Luego, la ecuación de regresión para estos datos es

yˆ i = − 0.96 + 3.18 xi

Esta ecuación representa una recta:


 cuyo intercepto con el eje vertical es -0.96
 con pendiente 3.18

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Regresión Lineal Simple

Luego:
 Interpretación de a: no tiene interpretación práctica

 Interpretación de b: (pendiente de la recta) si el porcentaje de comisión X


aumenta en 1%, la ganancia neta Y aumenta en 3.18 Millones de soles

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Regresión Lineal Simple

Valores ajustados al modelo.

 El modelo de regresión lineal se puede utilizar para obtener valores de


Y ajustados al modelo

 Los valores puntuales se obtienen mediante la ecuación de regresión


donde:
o a y b son los valores estimados anteriormente
o Xi toma los valores de la muestra.
o Los puntos que representan estos valores en el gráfico de
dispersión, caen exactamente sobre la recta.

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Regresión Lineal Simple

La tabla siguiente contiene los valores de Y ajustados , para cada valor de


X, además de los valores de Y observados, a modo de comparación
Observació X Y Y e= y - y est
n estimado
1 3.6 11.28 10.5 0.79
2 5.2 14.74 15.6 -0.84
3 5.3 18.46 15.9 2.57
4 7.3 20.01 22.3 -2.24
5 5 12.43 14.9 -2.51
6 5.2 15.37 15.6 -0.21
7 3 9.59 8.6 1.01
8 3.1 11.26 8.9 2.36
9 3.2 8.05 9.2 -1.17
10 7.5 27.91 22.9 5.02
11 8.3 24.62 25.4 -0.81
12 6.1 18.8 18.4 0.36
13 4.9 13.87 14.6 -0.75
14 5.8 12.11 17.5 -5.37
15 7.1 23.68 21.6 2.06
PROMEDIO 5.4 16.1 16.1 0.02

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Ejercicios Propuestos

Ejercicio 1.-
En la oficina central de turismo de Arequipa se ha observado que el número
de plazas hoteleras ocupadas es diferente según sea el precio de la
habitación. Sobre el total de plazas ocupadas en un año se tiene:
precio S/. /noche 25 65 100 140 210 250 270 330 400

Nº habitaciones ocupadas 4725 2610 1872 943 750 700 700 580 500

Se pide:
1.Representar gráficamente para determinar si existe cierta dependencia
lineal entre las variables.
2.Hallar el coeficiente de correlación
3.Si es conveniente, halle la ecuación de la recta de regresión del número
de habitaciones sobre el precio.
4.Es posible determinar ¿Cuántas habitaciones se llenarían a 150 soles?
Dra. Norka Bedregal Alpaca
REGRESIÓN Y CORRELACIÓN Ejercicios Propuestos

Mientras que la misma información relativa ala ciudad del Cusco


proporciona los siguientes datos
x y
Se pide: 25 6165
a) Representa gráficamente para 30 6000
comprobar que existe cierta 35 6100
60 5880
dependencia lineal entre las variables.
65 5556
b) Halla la ecuación de la recta de 80 5385
regresión del precio sobre el número 100 5350
de habitaciones. 150 4322
b) Halla la ecuación de la recta de 180 3955
regresión del número de habitaciones 210 3810
sobre el precio. 245 3100
c) ¿Cuántas habitaciones se llenarían 300 2470
320 2100
a 150 soles?
400 1450
430 904
500 98

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Ejercicios Propuestos

Ejercicio 2.-
Los datos de la tabla adjunta muestran el tiempo en horas de impresión
de trabajos que se han imprimido en una
impresora Láser de la marca HP. Se está interesado en estudiar la
relación existente entre la variable de interés
“tiempo de impresión de un trabajo” y la variable explicativa “número
de páginas del trabajo”. Hacer el estudio en
base a los datos obtenidos en el muestreo y que son los de la tabla
adjunta.

Se pide:
a) Recta de regresión considerando el tiempo
como variable independiente.
b) Recta de regresión considerando el número
de páginas como variable independiente
c) ¿Estime cuántas paginas se imprimirían en
12 horas?

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Ejercicios Propuestos

Ejercicio 3.-
El número de libras de vapor utilizadas por mes por una planta química,
está relacionado con la temperatura ambiente promedio (en grados
Farenheit) de ese mes. En la tabla siguiente se muestra el uso del vapor
de un año y la temperatura del mes correspondiente

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Ejercicios Propuestos

a) Elabore el diagrama de dispersión.


b) Suponga que resulta apropiado un modelo de regresión lineal simple. Ajuste
el modelo de regresión que relaciona el uso de vapor (y) con la temperatura
promedio (x).
c) ¿Cuál es la estimación de uso de vapor esperado cuando la temperatura
promedio es 55°F?
d) ¿Cuál es el cambio esperado en el uso del vapor promedio cuando a
temperatura mensual promedio cambia en 1°F?
e) Suponga que la temperatura mensual promedio es 47°F, Calcule el valor
ajustado de y y el residuo correspondiente.

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Ejercicios Propuestos

Ejercicio 4.-
Un centro comercial sabe en función de la distancia, en kilómetros, a la
que se sitúe de un núcleo de población, acuden los clientes, en cientos,
que figuran en la tabla:

1. Calcular el coeficiente de correlación lineal.


2. Si el centro comercial se sitúa a 2 km, ¿cuántos clientes puede esperar?
3. Si desea recibir a 500 clientes, ¿a qué distancia del núcleo de población
debe situarse?

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Ejercicios Propuestos

Ejercicio 5.-
Un conjunto de datos bidimensionales (X, Y) tiene coeficiente de
correlación r = −0.9, se sabe que la media de las distribución de x igual
a 1, y de la variable e igual a 2.

Una de las cuatro ecuaciones siguientes corresponde a la recta de


regresión de Y sobre X:
y = -x + 2 3x - y = 1 2x + y = 4 y=x+1
Seleccionar razonadamente esta recta.

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN Ejercicios Propuestos

Ejercicio 6.-
Se ha solicitado a un grupo de 50 individuos información sobre el
número de horas que dedican diariamente a dormir y ver la televisión.
La clasificación de las respuestas ha permitido elaborar la siente tabla:

Se pide:
1.Calcular el coeficiente de correlación.
2.Determinar la ecuación de la recta de regresión de Y sobre X.
3.Si una persona duerme ocho horas y media, ¿cuánto cabe esperar que vea
la televisión?

Dra. Norka Bedregal Alpaca


REGRESIÓN Y CORRELACIÓN

FIN

Dra. Norka Bedregal Alpaca