Está en la página 1de 9

INSTITUTO TECNOLOGICO

SUPERIOR DE MISANTLA

ING.EN GESTION EMPRESARIAL

ESTADISTICA INFERENCIAL II

REPORTE:
EJERCICIO DE REGRESION LINEAL

FACILITADOR: VICENTE SANCHEZ Y
RAMIREZ

ALUMNA: CONTRERAS ENCARNACIN MARLENNY
ALEYDA

GRUPO: 509

Misantla, Ver., a 30 de Agosto de 2013
Un artculo de technometrics de S.C. Narula y J.F. Wellington (Prediccin,
regresin lineal, y suma mnima de errores relativos, Vol. 19) presenta los datos
sobre el precio de venta y los impuestos anuales de 24 casas. Los datos se
muestran en la tabla siguiente:
Precio de venta/1000 Impuestos (locales, educacin,
municipales)/10000
25.9 4.9176
29.5 5.0208
27.9 4.5429
25.9 4.5573
29.9 5.0597
29.9 3.8910
30.9 5.8980
28.9 5.6039
35.9 5.8282
31.5 5.3003
31.0 6.2712
30.9 5.9592
30.0 5.0500
36.9 8.2464
41.9 6.6969
40.5 7.7841
43.9 9.0384
37.5 5.9894
37.9 7.5422
44.5 8.7951
37.9 6.0831
38.9 8.3607
36.9 8.1400
45.8 9.1416








Estadstica Inferencial II

3

Para tener una idea de cmo estn distribuidos los datos, debemos graficar las
variables en estudio:
Diagrama de dispersin
45 40 35 30 25
9
8
7
6
5
4
x
y
precio de venta e impuestos
precio de venta
impuestos

La grafica sugiere que existe correlacin lineal entre las dos variables y que
podemos ajustar una ecuacin de primer grado de la forma a los
pares de valores observados.
Coeficiente de correlacin lineal




Estadstica Inferencial II

4

Sustituyendo estos valores en el coeficiente de correlacin lineal tenemos:
|
|
|
|
|
.
|

\
|
|
.
|

\
|

|
|
|
|
|
.
|

\
|
|
.
|

\
|


=
=
=
=
=
= =
n
i
n
i
i
i
n
i
n
i
i
i
n
i
n
i
n
i
i i
i i
n
y
y
n
x
x
n
y x
y x
r
1
2
1 2
1
2
1 2
1
1 1


El valor de r=0.875976 nos indica que existe alta correlacin lineal entre los
precios de venta y los impuestos de las casas. Adems nos dice que la ecuacin
que ajustamos a los datos tiene una pendiente positiva.
Regresin lineal
Los clculos bsicos de la variable dependiente e independiente para el clculo
del coeficiente de correlacin r se presentan a continuacin.
El programa minitab nos arroja los siguientes valores:
a= -1.58437
Indica que la ecuacin que estimamos corta al eje de la ordenada (y) en un
sistema de coordenadas en el punto negativo de -1.58437
b= 0.23082
Significa que por cada peso adicional de venta se logra un incremento de 0.23082
ms en los impuestos.
Sustituimos los valores en la ecuacin, para obtener el valor de la estimacin,
denotada .
Estadstica Inferencial II

5

Suponiendo que deseamos encontrar el valor de y cuando x =7.50. La respuesta
ser:
=
=
=
= 0.14678
Si se sustituyen ms valores de x en la ecuacin, se observara que y se
incrementa en la medida que x aumenta, por lo tanto la relacin entre las variables
es directa, y la pendiente positiva.
Error estndar de estimacin

Con esta suma ya podemos sacar el error de estimacin


Por lo tanto el error estndar de estimacin ser:


Estadstica Inferencial II

6

Coeficiente de determinacin
Para saber si el error estndar es chico o grande, se recomienda recurrir al
coeficiente de determinacin que se simboliza por

0.767334 indica que el error en porcentaje es de



lo que dice que el error es grande (solo me explica el 73.7334%, no el 23.26%).
Prueba de hiptesis de la regresin lineal
Un caso muy especial en la prueba de hiptesis es:


Anlisis de varianzas para probar la significacin de la regresin
Si la probabilidad de tener una F
Medida de adecuacin del modelo de regresin
Anlisis residual
Un residuo se define como:

=






Tabla del ANOVA
Fuente de
variabilidad
G. L. Suma de
cuadrados
Cuadrado
medio
F
Regresin 1 44.170 44.170 72.56
Error 22 13.393 0.609
Total 23 57.563
Estadstica Inferencial II

7

Para decir si el precio de venta influye de manera significativa en los impuestos de
las casas, se obtiene la probabilidad de tener un F= 72.56 de la tabla F de Fisher.
Si la probabilidad de tener una F igual a la de la muestra es menor al 5% se
rechaza la hiptesis


22 5.79 4.30 7.95

As se puede ver que el valor de F= 72.56 se encuentra a la derecha de 7.95 por
lo que le corresponde una probabilidad menor a 0.01. Puesto que la probabilidad
de que se hubiese obtenido por mero azar una F=72.56 es menor al 5%,
rechazamos la hiptesis nula

y aceptamos la hiptesis alterna

,
con lo que se puede concluir que el precio de venta si influye de manera
significativa en los impuestos de las casas.
Anlisis residual
Las grficas de residuos contra los datos estimados

y contra la variable
independiente

, se presentan a continuacin:
9 8 7 6 5 4
1.0
0.5
0.0
-0.5
-1.0
-1.5
Valor ajustado
R
e
s
i
d
u
o
vs. ajustes
(la respuesta es y)

Estadstica Inferencial II

8

45 40 35 30 25
1.0
0.5
0.0
-0.5
-1.0
-1.5
x
R
e
s
i
d
u
o
Residuos vs. x
(la respuesta es y)

En ambas graficas se puede apreciar que no hay un patrn definido en su figura,
lo que significa que las varianzas no se incrementan o disminuyen con el aumento
de

o de

, lo que nos indica que las varianzas de los errores son iguales.
Para verificar el supuesto de que los errores se distribuyen de manera normal
realizamos la grfica normal de residuos, en ella se puede observar que los
residuos caen aproximadamente sobre una recta, con lo que se puede concluir
que no hay desviacin importante de normalidad, o sea que el supuesto de que los
errores se distribuyen de manera normal se cumple.
Estadstica Inferencial II

9

2 1 0 -1 -2
99
95
90
80
70
60
50
40
30
20
10
5
1
Residuo
P
o
r
c
e
n
t
a
j
e
Grfica de probabilidad normal
(la respuesta es y)

Por lo tanto en base a la evidencia encontrada en las grficas, podemos concluir
que no existe insuficiencia seria del modelo, dicho en otras palabras nuestro
modelo es vlido.

Bibliografa
MONTGOMERY, Douglas C. probabilidad y estadstica aplicada a la
ingeniera. Segunda edicin. Editorial LIMUSA WILEY. Pp. 439-440.