Está en la página 1de 61

1

Correlaci
ny
regresin
Lineal.
Definicion

El coeficiente de correlacin
lineal de Pearson es una
medida numrica de la fuerza
de la relacin entre dos
variables que representan
datos cuantitativos.
Utiliza datos muestrales
apareados
ESTADSTICA II
Coeficiente de correlacin lineal
Ejempl
Presupuestos e o: En
ingresos brutos. la siguiente tabla se
muestran los presupuestos (en millones de dlares) y los ingresos
brutos (en millones de dlares) de pelculas seleccionadas al azar
(segn datos de la Motion Picture Association of America). Parece
existir una correlacin lineal entre el dinero gastado para filmar la
pelcula y la cantidad recuperada en las salas de cine? Adems del
monto del presupuesto, identifique otro factor importante que puede
afectar la cantidad de dinero que obtiene la pelcula.
Sistema de Hiptesis

H0: = 0 (No existe correlacin lineal entre Presupuestos e

Ingresos

1:
HClculo 0 sumatorias
de (Existe correlacin lineal entre Presupuestos e Ingresos)
Mtodo 2

Estadstico de Prueba

nxy (x)(y)
r n(x2) (x)2 n(y2) (y)2
=
7(153215) (627)
r (1028)
7(73769) (627)2 7(398600) (1028)2
=
r 0.926
=

Variacin explicada:
El valor de r es la proporcin de la variacin
y en que se explica por la relacin lineal entre x
y.

r = (0.926) = 0.857

Aproximadamente el 85.7 % la variacin de ingreso bruto pueden ser


explicados por la relacin lineal entre el dinero gastado para filmar la
pelcula y la cantidad de dinero recuperada en las salas de cine.
Clculo de
r
Justificacin de r Frmula

Otro
mtodo
Pruebas de una cola
Pruebas cuando 0

Estadstico de prueba:
Valor crtico: Tabla A-2

Intervalos de confianza para


REGRESIN
15. Presupuestos e ingresos brutos de
pelculas. Calcule la mejor cantidad
predicha de los ingresos brutos de una
pelcula con un presupuesto de $40
millones. (En la siguiente tabla, todas las
cantidades estn en millones de dlares).
Nota:
Cuando existe correlacin lineal, se utilizar la
ecuacin de regresin lineal para realizar las
proyecciones.
Reemplazando en la Ecuacin de Regresin
Lineal:

y^= - 164.134 +
3.472( X )
y^= - 164.134 + 3.472(40) =
-25.254
31. Conjunto de datos del apndice B: Elementos dainos en
cigarrillos. Remtase al conjunto de datos 5 del apndice B.
a. Utilice los datos apareados referentes a alquitrn y nicotina. Cul
es el mejor contenido predicho de nicotina de un cigarrillo con 15 mg
de alquitrn?
b. Utilice los datos apareados referentes a monxido de carbono y
nicotina . Cul es el mejor nivel predicho de nicotina para un cigarrillo
con 15 mg de monxido de carbono?
^
a) y = 0.154 + 0.065 (15)
Interpolando: =1.129
^
Para n=29 b) y = 0.192 +
0.0606(15)=1.100
V.c. = 0.368
Intervalos de Prediccin

El error estndar de estimacin es una


medida de las diferencias (o distancias)
^
entre la muestra Y valores observados y
los valores de y predicho que se
obtienen usando la ecuacin de
regresin.
Ejemplo:
Barcos y
manates
Teniendo en cuenta los datos de la muestra en la Tabla 9-1, hallar
el valor del coeficiente de correlacin lineal r, a continuacin,
consulte la Tabla A-6 para determinar si existe una correlacin
lineal entre el nmero de barcos registrados y el nmero de
manates muertos por embarcaciones .
Ejemplo:
Barcos y
manates
Utilizando los datos del barco / de manates en la Tabla 9-1,
probar la afirmacin de que existe una correlacin lineal
entre el nmero de barcos registrados y el nmero de
muertes de manates de barcos. Utilice el mtodo 2.

Barcos y
Teniendo en cuenta losmanates
datos de la muestra en la Tabla 9-1, se
^
encontr que la ecuacin de regresin es y = -113 + 2.27x.
Encuentra el error estndar de estimacin para los datos de
barcos / manat.

y2 - b0 y - b1 xy
n = 10 se =
y2 = n-
33456 2
y = 558
xy = 33456 (112.70)(558) (2.27408)(42214
42214
b0 = se = 10
112.70 2
b1 =
se = 6.595
2.274
Prediccin Intervalo

^E < y ^< y
y-
+E
donde
n(x x)2
1 +1 0

E= t n n(x2) (x)2
/2
+
se

Ejemplo:
Barcos y
Teniendo en cuenta los datosmanates
de la muestra en la Tabla 9-1, se encontr que
la ecuacin de regresin es^
y = -113 + 2.27x. Tambin hemos encontrado
que cuando x = 85, el nmero previsto de muertes de manates es 80

Construya un intervalo de prediccin del 95% dado que x = 85.

n ( x0 x )2
1+ +
E = t/2 1 n
n(x2) (x)2
se

1+ + 10(8574.1)2
E = ( 2.306 ) 1 1 10(55289) (741)2
(6.595) 0
E=
18.071
Barcos y
manates muestra en la Tabla
Teniendo en cuenta los datos de la ^
9-1, se encontr que la ecuacin de regresin es y=
-113 + 2.27x

Tambin hemos encontrado que cuando x = 85, el


nmero previsto de muertes de manates es 80

Construya un intervalo de prediccin del 95% dado que


x = 85 ^ ^
yE < y < y + E
80 18.071 < y < 80 + 18.071
61.929 < y < 98.071
15. Presupuestos e ingresos brutos de
pelculas. Calcular los intervalos de prediccin de
los ingresos brutos de una pelcula con un
presupuesto de $40 millones. (En la siguiente
tabla, todas las cantidades estn en millones de
dlares).
Las variables tienen que tener
correlacin lineal
Valor
predicho:
^
y = -164 +3.47(40) =
-25.254
Error estndar de
estimacin:

(398600) (-164.134)(1028) (3.472)(153215)

se = 7-
2

se =
84.104

t=
2.571
Error
:
7 ( 40 89.571)2
1+ +
e = 2.571* 1 7
7(73769) (627)2
84.104
e=
244.868
Intervalo de
Prediccin:
^
y - e < y < y^ + e

-270.122 < y <


219.614
Clculo de medidas de variacin. Calcular:
a) la variacin explicada
b) la variacin no explicada
c) la variacin total
d) el coeficiente de determinacin
e) el error estndar del estimado Se
En este caso existe una correlacin lineal significativa, de manera que
es razonable utilizar la ecuacin de regresin para hacer predicciones.

13. Pesos de automvil y consumo de combustible. Acontinuacin


se presentan los pesos (en libras) y las cantidades de combustible
consumidas en carretera (en mi/gal) de automviles elegidos al azar
(Chrysler, Sebring, Ford Mustang, BMW Serie 3, Ford Crown Victoria,
Honda Civic, Mazda Protg, Hyundai Accent).

a) 147.397
b) 18.032
c) 165.42
d) 0.891
e) Se =1.899 e = 5.66
16. Grillos y temperatura. Una aplicacin clsica de la
correlacin es la asociacin entre la temperatura y el nmero
de veces que un grillo chirra en un minuto. Acontinuacin se
listan los nmeros de chirridos en un minuto y las temperaturas
correspondientes en grados Fahrenheit (segn datos de The
Song of Insects, de George w. Pierce, Harvard University Press).
Existe una correlacin lineal entre la temperatura y el nmero
de veces que un grillo chirra e un minuto?

r 0.870 Existe correlacin lnea entre la temperatura y el


= nmero de veces que un grillo chirra e un minuto.
17. Efecto de la variacin en un intervalo de
prediccin. Remtase a los datos del ejercicio 13 y suponga
que se cumplen las condiciones necesarias de normalidad y
varianza.
a. Calcule la tasa de consumo de combustible predicha para
un automvil que pesa 3700 lb.
b. Calcule un estimado de un intervalo de prediccin del
95% de la proporcin del consumo de combustible para un
automvil que pesa 3700 lb.
bo = 54.695
b1 =
-0.0079689
^
a) y = 25.21
Se =1.899 e=
5.66

b) 19.5 < y <


30.9
20. Clculo del valor predicho y del intervalo de
prediccin. Remtase a los datos del ejercicio 16 y suponga
que se cumplen las condiciones necesarias de normalidad y
varianza.
a. Calcule la temperatura predicha cuando un grillo chirra
1000 veces en un minuto.
b. Calcule un estimado de un intervalo de prediccin del 99%
de la temperatura, cuando un grillo chirra 1000 veces en un
minuto.
^
a) y = 79.905
Se = 4.305 e = 16.94

b) 62.965 < y <


96.845
Prueba de Hiptesis para la regresin

Estadstico de prueba:

Valores crticos: Tabla A-3 con n-2 grados de libertad


Intervalo de confianza para 1 y 0

Con t/2 con n-2 grados de libertad


Si una grfica residual no revela ningn patrn, la
ecuacin de regresin es una buena representacin
de la asociacin entre las dos variables.
Si una grfica residual revela algn patrn
sistemtico, la ecuacin de regresin no es una
buena representacin de la asociacin entre las dos
variables.
Variacin

También podría gustarte