Está en la página 1de 8

GRUPO: 00

Miguel ngel Mixuxi Almazn

Unidad 1

Jos Carlos Tovar Ramrez


Estadstica Inferencial 2.

Regresin Lineal Simple.


Conforme a temas vistos en clase y siguiendo los puntos de Regresin lineal por
Edgar Acua.
En la tabla adjunta se presentan el nmero de pginas y el precio de doce libros
tcnicos, (siendo X el nmero de pginas e Y el precio).
Paginas
310
300
280
310

Precio
350
350
350
730

Paginas
400
170
430
230

Precio
800
180
700
320

Paginas
420
610
420
450

Precio
250
500
540
370

Grafica de dispersin:
Grfica de dispersin de Precioy vs. Pginasx
800
700

Precioy

600
500
400
300
200
100
200

300

400
Pginasx

500

600

Como podemos observar en la grfica aparentemente no hay relacin lineal


puesto que los datos se muestran muy dispersos.
Con esto se puede decir que la causa y efecto de la relacin de variables del
nmero de hojas y el precio es bajo.

Grfica de lnea ajustada


Y (Precio de libros) = 208.4 + 0.6787 X (numero de paginas)
1200

Regresin
I C de 95%
PI de 95%

Y (Precio de libros)

900

S
R-cuad.
R-cuad.(ajustado)

192.330
15.9%
7.5%

600

300

200

300
400
500
X (numero de paginas)

600

Como podemos ver en la grfica cuando se toma un valor de x cercano al


promedio las bandas de confianza se angostan.

1.- Interpretacin de los Coeficientes de Regresin:

Ecuacin de Regresin.
Y (Precio de libros) = 208 + 0.679 X (nmero de pginas).
Coeficiente de interseccin :
Cuando X obtiene un valor 0. El precio por el nmero de pginas ser de 208, lo
cual no es razonable debido a que al no tener un nmero de pginas, no podemos
pagar por un libro tcnico.
Coeficiente de la pendiente :
Por cada unidad que incremente el nmero de pginas de libros tcnicos en
promedio el precio aumentara en unos 0.679 pesos.

2.- Inferencia acerca de los coeficientes de regresin.


Prueba de hiptesis para los coeficientes.

Para interseccin :

Para pendiente :

Ho: = 0

Ho: = 0

Ha: 0

Ha: 0

Nivel de significancia:
= 0.05

Regin Crtica.
Grfica de distribucin
T, df=10
0.4

Densidad

0.3

0.2

0.1

0.0

0.0125

0.0125
-2.63

0
X

2.63

Conclusin para pendiente :


Con un nivel de significancia de = 0.05, y dado que nuestro valor P= 0.198 >0.05
(Nivel de significancia), no se rechaza la hiptesis nula, lo que nos indica que, la
variable X (nmero de pginas), no es importante para predecir el precio de los
libros tcnicos.

Intervalo de confianza del 95% para la pendiente:


t 0.025-10 gl=2.228

0.6787- (2.228 x 0.4928) < < 0.6787+ (2.228 x 0.4928)


-0.4192 < < 1.7766
Con una confianza del 95 % existe la posibilidad de que la pendiente de la
regresin poblacional caiga en el intervalo (-0.4192 a 1.7766), para el modelo
Y (Precio de libros) = 208 + 0.679 X (nmero de pginas)

Intervalo de confianza del 95% para la interseccin:


t 0.025-10 gl=2.228
208 - (2.228 x 186.3) < < 208+ (2.228 x 186.3)
-207.0764 < < 623.0764
Con una confianza del 95 % existe la posibilidad de que la interseccin de la
regresin poblacional caiga en el intervalo (-207.0764 a 623.0764)), para el
modelo Y (Precio de libros) = 208 + 0.679 X (nmero de pginas)
4.- El Anlisis de Varianza para Regresin Lineal Simple.

Anlisis de varianza
Fuente
Regresin
Error residual
Falta de ajuste
Error puro
Total

GL
1
10
8
2
11

SC
70159
369907
255657
114250
440067

MC
F
P
70159 1.90 0.198
36991
31957 0.56 0.772
57125

La hiptesis nula Ho: = 0 se rechaza si el P valor de la prueba de F es menor


que .05.
Como el valor p (0.198)> 0.05, la Hiptesis nula no se rechaza lo que nos
indica que no hay una cantidad significativa de variacin entre el nmero de
pginas y el precio de los libros para el modelo de regresin:
Y (Precio de libros) = 208 + 0.679 X (nmero de pginas).

5.- El Coeficiente de correlacin.


Correlacin de Pearson de Y (Precio de libros) y X (nmero de pginas) = 0.399
Valor P = 0.198.
Con los datos que nos arroja minitab con respecto a r, se puede asegurar una
correlacin baja por lo tanto la intensidad en la relacin del nmero de pginas con
respecto al precio es dbil. As que no se puede utilizar el nmero de pginas para
predecir el precio de los libros a travs de una lnea recta.

6.- El Coeficiente de Determinacin.

R-cuad. = 15.9%
(0.399)^2=0.159 o 15.9 %
Como podemos observar el valor del coeficiente de determinacin es muy
pequeo por lo que la asociacin lineal de las variables en este caso el nmero de
pginas y el precio es baja.
As que solo el 15.9% de la variabilidad de las pginas de un libro es explicado por
su relacin lineal con el precio. No se podra usar el nmero de pginas para
predecir el precio.
Grfica de lnea ajustada
Precioy = 208.4 + 0.6787 Pginasx
S
R-cuad.
R-cuad.(ajustado)

800
700

192.330
15.9%
7.5%

Precioy

600
500
400
300
200
100
200

300

400
Pginasx

500

600

7.- Intervalos de Confianza para el valor medio de Y e Intervalo de Prediccin.

Tomando el valor de Xo=360.


Valores pronosticados para nuevas observaciones
Nueva
Obs Ajuste
1
452.8

Ajuste
SE
IC de 95%
PI de 95%
55.5 (329.1, 576.5) (6.7, 898.8)

Valores de predictores para nuevas observaciones


Nueva
Obs
1

X (numero
de pginas)
360

No hay evidencia de falta de ajuste (P >= 0.1).


Con el 95 % de confianza de que el valor medio de todos los libros tcnicos de
360 pginas caiga en un intervalo de (329.1, 576.5).
Intervalo de Prediccin.
Hay un 95 % de confianza de que el valor de un libro tcnico se encuentre entre el
intervalo (6.7, 898.8) pesos.

8.- Anlisis de Residuales.

Grficas de residuos para Precioy


Grfica de probabilidad normal

Porcentaje

90
50
10
1

vs. ajustes
Residuo estandarizado

99

-2

-1
0
1
Residuo estandarizado

2
1
0
-1
300

400

Frecuencia

4
3
2
1
0

-1.5

-1.0 -0.5 0.0


0.5
1.0
Residuo estandarizado

600

vs. orden
Residuo estandarizado

Histograma

500
Valor ajustado

1.5

2
1
0
-1
1

4 5 6 7 8 9
Orden de observacin

10 11 12

El anlisis de residuales nos muestra a travs del histograma que la


normalidad en estos no existe puesto que no hay simetra ni un pico en
medio y no se asemeja a una campana de distribucin.

Adems nos muestra datos normales y una varianza constante.

Nos muestra tambin que ningn dato es atpico algunos estn muy cerca
de serlo pero tambin cabe resaltar que ninguno sigue la lnea de
normalidad.

Y con respecto a la varianza de errores con respecto a la variable


predictora no es constante puesto que cuando esta aumenta los errores
tambin.

prueba de normalidad
Normal
99

Media
Desv.Est.
N
AD
Valor P

95
90

Porcentaje

80
70
60
50
40
30
20
10
5

-3

-2

-1

0
RESIDEST1

-0.03150
1.031
12
0.636
0.074