Está en la página 1de 13

28/11/2014

UNIVERSIDAD NACIONAL AGRARIA LA MOLINA


Dpto. de Estadstica e Informtica
Objetivo

Al finalizar este captulo el estudiante


debe conocer los supuestos y
Captulo XI estimacin de parmetros en el anlisis
de regresin lineal simple, probar si
existe relacin lineal entre dos
Anlisis de regresin variables, calcular el coeficiente de
lineal simple determinacin y el coeficiente de
correlacin.

Estadstica General Semestre 2014 - II 2

1
28/11/2014

Contenido
? Correlacin y coeficiente de correlacin.

Modelo y supuestos del anlisis de regresin lineal


Cmo influye el gasto semanal en simple
publicidad sobre las ventas semanales?.
Estimaciones de parmetros en el modelo de RLS

Recta de regresin estimada

Cmo influye el nmero de horas de Anlisis de varianza


estudio que dedica el alumno al curso de
estadstica general sobre la nota que Coeficiente de determinacin
obtiene en las evaluaciones?
Evaluacin

2
28/11/2014

Diagrama de dispersin
Correlacin
Delitos vs poblacin Peso vs velocidad
12000
100
10000 80

velocidad
8000 60

Una correlacin existe

Delitos
6000 40
20
4000

entre dos variables


0
2000
0 2 4 6 8
0 Fuente: Elaboracion
Peso

cuando una de ellas


0 2 4 6 8
Fuente: Elaboracion propia Poblacin

Correlacin lineal positiva Correlacin lineal negativa

est relacionada con la 100 Precio vs demanda

otra de alguna manera.


80

Demanda
60
40
20
0
0 20 40 60 80 100
Precio

Ninguna correlacin lineal


5 6

3
28/11/2014

Coeficiente de correlacin lineal


Valores de r
El coeficiente de correlacin (r) mide la fuerza
o Si r > 0, la correlacin lineal es positiva
de la relacin lineal entre valores cuantitativos
de dos variables. Ejemplo: altura y peso

Tambin se le conoce como coeficiente de o Si r < 0, la correlacin lineal es negativa


correlacin de Pearson, en honor a karl
Pearson quien lo desarroll originalmente.
Ejemplo: peso y velocidad

( )( )
=
( 2 ) ( )2 2 ( )2 o Si r = 0, no existe correlacin lineal
entre las variables, pero podra existir
1 r 1 otro tipo de correlacin.
7 8

4
28/11/2014

Ejemplo 1 (Pg. 215) Anlisis de regresin lineal simple


Distribucin del nmeros de delitos por Definicin
departamento en el 2007
Departamento Poblacin N Delitos vs poblacin
delitos 12000
El anlisis de regresin lineal simple, es
Amazonas 376.0 811
una tcnica estadstica que permite
10000

Ica 711.9 2548 8000

estudiar la relacin funcional entre dos


Delitos

La Libertad 1617.1 9763 6000

Piura 1676.3 5518 4000 variables, una de ellas es la variable


Arequipa 1152.3 9188
2000
dependiente Y (o respuesta) y la otra la
variable independiente X (explicativa o
0
Ucayali 432.2 2856 0 2 4 6 8
Fuente: Elaboracion propia
Poblacin

Correlacin lineal positiva


predictora)
r = 0.659
9 10

5
28/11/2014

El Modelo de Regresin Lineal Simple Supuestos del anlisis de regresin


lineal simple
El modelo de regresin lineal simple es definido por:
La variable independiente X es fija (no aleatoria).
La variable dependiente Y es aleatoria.
( 1 )
Donde: Para cada valor de X existe una distribucin normal de Y.
~ N ( 0 , 2 ) para i = 1,2,3,...,n. Adems:
es independi
Y es la variable dependiente o variable respuesta.
X es la variable independiente, explicativa o de prediccin. es independiente de X
0 es el coeficiente de interseccin paramtrico. Es el valor
de Y cuando X=0. En consecuencia:
1 es el coeficiente de regresin paramtrico. Es la
pendiente del modelo de regresin.
es el error o residual.
Notar que 1 mide el cambio en el promedio . ante el cambio
11 en una unidad de X. 12

6
28/11/2014

Estimacin de parmetros por el mtodo de b1 y b0 se calcula:


mnimos cuadrados.
El mtodo de mnimos cuadrados consiste en
minimizar la suma de cuadrados del error.
Del modelo de regresin lineal simple (1) se
obtiene: i Yi 0 1 X i , Suma de cuadrados de X:

por lo tanto: Suma de productos X e Y:

Interpretacin de los coeficientes de regresin:


bo= Mide el valor promedio de Y, cuando X es igual a cero.
Los estimadores mnimos cuadrticos de los b1=Mide el cambio (aumento, si es positivo o disminucin,
parmetros 0 1 , denotamos como b0 y si es negativo) de Y, cuando X se incrementa en una
unidad.
b1 .
13 14

7
28/11/2014

Recta de regresin estimada Anlisis de la variancia


Fuente de Grados de Suma de Cuadrado F
variacin Libertad Cuadrados Medio calculado
(GL) (SC) (CM)
La ecuacin de la recta Yi b0 b1 X i estima a Y . X 0 1 X i Regresin 1 SCR CMR Fc =CMR/CME

Error n-2 SCE CME


El error estimado es: Total n-1 SCT

Donde:


SCR Yi y
2

b12 xi x
2
b1SP ( XY ) b12 SC ( X )
( yi ) 2
SCT SC (Y ) yi2 yi2 n y
2

SCE SCT SCR

15 16

8
28/11/2014

Hay relacin lineal entre X e Y? Coeficiente de determinacin y de no determinacin


Prueba de hiptesis
El coeficiente de determinacin (r2) mide la
H p : 1 0 ( No hay relacin lineal entre X e Y ) proporcin o porcentaje de la variacin total de
H a : 1 0 ( Si hay relacin lineal entre X e Y ) Y que es explicada por el modelo de regresin y
Nivel de significacin: = 0.05
el coeficiente de no determinacin (1 - r2) mide
Estadstico de prueba la proporcin o porcentaje de la variacin total
Fc= CMR / CME de Y que no es explicada por el modelo de
regresin.
Decisin estadstica
De acuerdo a la hiptesis alternativa la prueba es unilateral a la derecha por
lo tanto:

Si Fc es mayor que Ftab se rechaza la Hp.


Si Fc es menor o igual que Ftab no se rechaza la Hp.

17 18

9
28/11/2014

Ejemplo 2 (Pag. 220) Clculos previos


En cierto pas se estudi la captura de anchoas, en
millones de toneladas mtricas, (X), y los precios de
harina de pescado, en dlares por tonelada, (Y) para los
ltimos 13 aos.
Y 190 160 134 129 172 197 167 239 542 372 245 376 454

X 7.23 8.53 9.82 10.26 8.96 12.27 10.28 4.45 1.78 4.00 3.30 4.30 0.80

a) Halle la lnea de regresin estimada. Interprete el coeficiente


estimado de interseccin y el coeficiente estimado de
regresin.

19 20

10
28/11/2014

b) Hay relacin lineal entre X e Y?


Use = 0.01

Fuente de G. L. S. C. C. M. F calculado
variacin
Regresin 1 151438.0750 151438.075 27.45
La lnea de regresin estimada: Yi 461 .0062 30 .4266 X i Error 11 60686.2327 5516.9302
Total 12 212124.3077
El coeficiente de interseccin estimado, , representa el
precio promedio de harina de pescado cuando no hay captura de
anchoas. Prueba de hiptes is Como ,
entonces se rechaza la hiptesis
El coeficiente de regresin estimado, , indica que el precio H p : 1 0 ( No hay relacin lineal entre X e Y ) planteada por lo tanto hay
promedio de harina de pescado disminuye en 30.4266 dlares por evidencias estadsticas para
H a : 1 0 ( Si hay relacin lineal entre X e Y ) concluir que existe relacin lineal
tonelada, cuando se incrementa en un milln de toneladas
21 entre X e Y. 22
mtricas la captura de anchoas.

11
28/11/2014

c) Estime el precio promedio de harina de pescado (en


dlares por tonelada) para una captura de 5 millones de Coeficiente de correlacin
toneladas mtricas de anchoas.
Como la lnea estimada es:
Se puede afirmar que hay una alta
asociacin negativa entre X e Y en
Y como Xi=5, se tiene:
otras palabras cuando aumenta una
El precio promedio de harina de pescado es de $ 308.9 para una de ellas disminuye la otra.
captura de 5 millones de toneladas mtricas de anchoas.

d) Calcule e interprete el coeficiente de determinacin y el


coeficiente de correlacin.
Coeficiente de determinacin
SC R SP XY
2
Indica que el 71.39% de la
r2 0.7139 71.39% variacin de los precios es
SC Y SC X SC Y
explicada por la regresin.
23 24

12
28/11/2014

Ejercicio 1 (Pag. 223) EVALUACIN


Se estudia la tasa de flujo Y (en ) de un dispositivo empleado
para medir la calidad del aire y la cada de presin X (en mm Complete con verdadero (V) o falso (F)
de agua) a travs del filtro del dispositivo. Se tom una
muestra de 10 mediciones encontrndose los siguientes
datos:
El objetivo del anlisis de regresin lineal simple es la
prediccin. ( )
Y 0.6 0.7 0.8 1.0 1.1 1.2 1.4 1.8 2.2 2.6
X 127 178 229 254 330 381 406 432 457 507 El coeficiente de determinacin mide la relacin o
asociacin entre dos variables cuantitativas ( )
Asumiendo que se cumplen los supuestos respectivos
La variable dependiente Y es aleatoria ( )
a. Estime la lnea de regresin. Interprete los coeficientes.
b. Hay relacin lineal entre estas variables? Use = 0.05 1 es el coeficiente de interseccin paramtrico ( )
c. Calcule e interprete el coeficiente de determinacin.
d. Estime la tasa de flujo promedio para una cada de presin
de 400 mm de agua.
e. Halle e interprete el coeficiente de correlacin.
25 26

13

También podría gustarte