Está en la página 1de 18

Resumen

Estadísticas de la regresión
Coeficiente de correlación múltiple 0.94529437
Coeficiente de determinación R^2 0.89358144
R^2 ajustado 0.88027912
Error típico 1.43313579
Observaciones 10

ANÁLISIS DE VARIANZA
Grados de libertad
Suma de Promedio
cuadradosde los cuadrados
F
Regresión 1 137.968974 137.968974 67.1748574
Residuos 8 16.4310255 2.05387819
Total 9 154.4

Coeficientes Error típico Estadístico t Probabilidad


Intercepción -1.46798542 1.19560952 -1.22781343 0.25441492
x 0.42373764 0.05170037 8.19602693 3.667E-05

Análisis de los residuales

Observación Pronóstico Y Residuos


Residuos estándares
1 2.76939094 0.23060906 0.17067318
2 6.15929204 -1.15929204 -0.8579891
3 3.61686622 0.38313378 0.28355634
4 5.31181676 -0.31181676 -0.2307748
5 7.85424258 0.14575742 0.1078747
6 13.7865695 -1.7865695 -1.32223556
7 11.2441437 -1.24414368 -0.92078759
8 12.0916189 1.90838105 1.41238799
9 9.54919313 2.45080687 1.81383597
10 3.61686622 -0.61686622 -0.45654113
x Gráfico de los residuale
3
2 x Curva de regresió

Residuos
1 15
0 Gráfico de
-1 5 1010 15 20 25 3
15
-2 5

Y
10
0 x
Valor crítico de F 5 10 5 15 20 25

Y
3.667E-05 0 x
0 10 20 30

Inferior 95% Superior 95%Inferior 95.0%


Superior 95.0%
-4.22506591 1.28909506 -4.22506591 1.28909506
0.30451637 0.54295891 0.30451637 0.54295891

Resultados de datos de probabilidad

Percentil Y
5 3
15 3
25 4
35 5
45 5
55 8
65 10
75 12
85 12
95 14
ráfico de los residuales
x Curva de regresión ajustada
Gráfico de probabilidad normal
15 20 25 30 35 40 Y
15
Pronóstico Y
10
x
10 5 15 20 25 30 35 40
Y

0 x
0 10 20 30 40 50 60 70 80 90 100
Muestra percentil
Suponga que se realiza una investigación por muestreo aleatorio a 10 empresas, q
producen un determinado producto, en cuanto al valor de la producción (toneladas
anuales) y el costo del mismo (millones de soles), los resultados fueron:

Producci
Costo
ón
(Miles de
(Tonela
soles)
das)
10 3
18 5
12 4
16 5
22 8
36 12
30 10
32 14
26 12
12 3

Datos: 10 10 10

n= 10 X i  214  X  5348
i
2
Y
i 1
i  76
i 1 i 1
10

 Yi
10 2
 732
 X Y  1952
i 1
i i
X  21.4 Y  7.6
i 1

Datos en terminos de desvios:


10 10

 x y  325.6
10

x 2
i  768.4  yi2  154.4
i 1 i 1
i i
i 1

1. medias y desviaciones típicas de las dos variables [‘a mano’ o, mejor, con la calculadora];

Medias: variable X variable Y


Producci
Costo
ón
(Miles de
(Tonela
soles)
das) se tiene una muestra de 10 empresas
10 3
18 5 Media(X)= 214 =
12 4 10
16 5
22 8 Media(Y)= 76 =
36 12 10
30 10
32 14
26 12
12 3
214 76

Desviaciones tipicas: Para obtener las desviaciones tipicas primero debemos encontrar las varianzas

Para calcular la varianza utilizamos los datos en terminos de desvios que obtenemos de la consigna

Var (X)= 768.4 = 76.84


10

Var (Y)= 154.4 = 15.44


10

Desv.tipica 8.7658428

Desv.tipica 3.92937654

2. el coeficiente de correlación de Pearson entre ambas variables [ídem];

Los datos que necesitamos son:10


N= 10 
X iYi  1952
i 1
10 10 10
10

X i  214  Yi  76  X i2  5348 Y  732


i 1
i
2

i 1 i 1 i 1

r= 10*1952 - 214*76 = 3256


raiz(( 10 * 5348)(10*732 - 76^2)) 9086.97529

Entonces: r= 0.35831505

El coeficiente de correlacion de Pearson es de 0.358


3. la ecuación del modelo de regresión lineal del costo (Y) sobre la producción (X) [ídem];

variable X variable Y
x Y
1 10 3
2 18 5
3 12 4
4 16 5
5 22 8
6 36 12
7 30 10
8 32 14
9 26 12
10 12 3
214 76

Si: Y = b0 su sistema normal de ecuaciones y su solucion son:

∑ Y = b0 N + b1 ∑ X

∑ XY = b0 ∑ X + B1 ∑ X^2

Entonces podemos encontrar los parametros de la siguiente manera


b0 = ∑ Y ∑ X^2 - ∑ X ∑ XY b1= N ∑ XY - ∑ X ∑ Y
N ∑ X^2 - (∑ X)^2 N ∑ X^2 - (∑ X)^2

b0 = (76 * 5348) - (214*1952) = -11280


(10*5348) - (214)^2 7684
b0 = -1.4679854

b1 = (10*1952) - (214*76) = 3256


(10*5348) - (214)^2 7684
b1 = 0.42373764

La ecuacion del modelo de regresion lineal de YY=-1.468


sobre X+ es:
0.424 * X

Verificando si cumple la condicion


∑ Y = b0 N 76
∑ XY = b0 1952

4. los valores predichos por la ecuación de regresión para quinto sujeto;

variable X variable Y
x Y
1 10 3
2 18 5
3 12 4
4 16 5
5 22 8
6 36 12
7 30 10
8 32 14
9 26 12
10 12 3
214 76

Para el quinto sujeto, se tiene que X=22 y Y=8, utilizando la ecuacion de regresion obtenida tenemos los valores pr

Y=-1.468 + 0.424 * X

Si X=22 Y=-1.468 + 0.424 * 22


entonces Y_ Yˆi
= 7.86

5. los errores de predicción o residuales para quinto sujeto ( )

𝑒=(𝑌−𝑌 ̂ )
Tenemos que Y=8 para el quinto sujeto y Y estimado nos resulto igual a 7.86

= 8-7.86 ei
= ei
0.14

Los errores de prediccion para el quinto sujeto es de 0.14

6. la varianza de los errores (); SY2. X

Varianza de los errores=∑▒(𝑌−𝑌 ̂ )^2

(𝑦−𝑌 ̂ )^2
x Y
𝑌 ̂
10 3 2.8 0.051984
18 5 6.2 1.354896
12 4 3.6 0.1444
16 5 5.3 0.099856
22 8 7.9 0.0196
36 12 14 3.225616
30 10 11 1.567504
32 14 12 3.61
26 12 9.6 5.973136
12 3 3.6 0.3844
214 76 16.431392
Varianza de los errores=16.43
7.la varianza de Y () SY2 Media (Y) 7.6

Varianza de Y=∑▒(𝑌−𝑌 ̅ )^2

(𝑌−𝑌 ̅ )^2
x Y Media(Y)
10 3 7.6 21.16
18 5 7.6 6.76
12 4 7.6 12.96
16 5 7.6 6.76
22 8 7.6 0.16
36 12 7.6 19.36
30 10 7.6 5.76
32 14 7.6 40.96
26 12 7.6 19.36
12 3 7.6 21.16
214 76 154.4

Varianza de Y=154.4
8. la varianza de las puntuaciones predichas () [‘a mano’ o, mejor, con la calculador

𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 𝑌_𝑒𝑠𝑡=(𝑌 ̂−𝑌 ̅ )^2


(𝑌 ̂−𝑌 ̅ )^2
x Y
𝑌 ̂ Media(Y)
10 3 2.772 7.6 23.309584
18 5 6.164 7.6 2.062096
12 4 3.62 7.6 15.8404
16 5 5.316 7.6 5.216656
22 8 7.86 7.6 0.0676
36 12 13.796 7.6 38.390416
30 10 11.252 7.6 13.337104
32 14 12.1 7.6 20.25
26 12 9.556 7.6 3.825936
12 3 3.62 7.6 15.8404
214 76 138.140192
Varianza de Y predicho =138.14
9.comprobar que es cierta la igualdad de la descomposición de la varianza
SY2  SY2ˆ ();
SY2. X

Recolectamos la informacion calculada anteriormente para las varianzas

SY2ˆ Varianza de Y predicho =138


SY2 Varianza de Y=154.4
S 2 Varianza de los errores=16.4
Y .X

Por lo tanto comprobamos la igualdad de la descomposicion de la varianza

SY2  SY2ˆ  SY2. X

SY2 = 138+16.4 = 154.4

10. el coeficiente de determinación [de dos formas:


10.1. a partir de las varianzas
Utilizamos lo que encontramos anteriormente

SY2ˆ Varianza de Y predicho =138

SY2 Varianza de Y=154.4

Entonces: R^2 = 138 = 0.893782383419689


154.4

R^2 = 0.893

10.2 a partir del coeficiente de correlación entre X e Y];


Primero debemos encontrar el coeficiente de correlacion que ya lo teniamos calculado anteriormente

x Y COVxy
10 3 52.44
18 5 8.84
12 4 33.84
16 5 14.04
22 8 0.24
36 12 64.24
30 10 20.64
32 14 67.84
26 12 20.24
12 3 43.24
214 76 325.6

r= 0.27444147
r^{2} = 0.07531812

11.interpretar las estimaciones puntuales de los parámetros de la ecuación de regre

̂ Tenemos que b0= - 1.47

̂ Tenemos que b1 = 0.42

Interpretacion:
Ante un incremento de X en una unidad, se tiene que Y incrementa en 0.42, manteniendo lo demas ce
Ante el supuesto de que X es igual a cero por lo cual no tiene ningun incremento, la variable Y disminu

12. estimar según el modelo de regresión obtenido cuál será el costo medio de prod

El modelo de regresion obtenido es: Y=-1.468 + 0.424 * X

Si en promedio la produccion es de 35 toneladas anuales, el promedio del costo sera:


Entonces X=35

Y_est =-1.468 + 0.424 * 35

Y_est = 13.372

Por lo tanto, el costo medio de produccion sera de 13.37 miles de soles


leatorio a 10 empresas, que
e la producción (toneladas
ultados fueron:

a calculadora];

21.4

7.6
trar las varianzas

s de la consigna
n (X) [ídem];
obtenida tenemos los valores predichos

esulto igual a 7.86


2
mejor, con la calculadora]; SYˆ
de la varianza
SY2  SY2ˆ ();
SY2. X

redicho =138

=154.4

do anteriormente
de la ecuación de regresión obtenidos ( y );

0.42, manteniendo lo demas ceteris paribus


ncremento, la variable Y disminuye en 1.47 unidades

el costo medio de producción (miles de soles) obtenida para una producción de 35 tonelada

del costo sera:


roducción de 35 toneladas anuales.

También podría gustarte