Está en la página 1de 12

Mgt.

Alfredo Marcavillaca Luna Estadística II

APLICACIÓN DEL MODELO:


INTERVALOS DE ESTIMACIÓN E INTERVALOS DE PREDICCIÓN

Después de haber analizado la validez del modelo de regresión lineal calculado


de la muestra y comprobado la existencia de regresión lineal en la población de
la cual se ha obtenido la muestra, a más específicamente, después de haber
concluido que el modelo lineal estimado, Ŷ = a + bX, es adecuado para describir
la relación lineal entre X e Y, se puede explicar esta estimación del modelo de
regresión, para pronosticar o predecir el valor de Y para un valor especifico de
X.
Hay dos formas de aplicar el modelo de regresión lineal estimado:
• El primero, es estimar el valor medio Y/X0 de todos los valores de Y que
corresponden al valor X = x 0 es un intervalo de confianza.
• El segundo, es, predecir un solo valor Y0 de todos los valores de Y que
corresponden a X = x 0 , y calcular los extremos del intervalo de esa
predicción.
INTERVALO DE CONFIANZA PARA EL VALOR MEDIO DE Y CUANDO
Sea Y/X0 =  + x 0 el valor de la media Y/X =  + X cuando, X = x 0 , y sea
Ŷ0 = a + bx 0 el valor de Ŷ = a + bX cuando, X = x 0 Esto es, 𝑌̂0 es un valor de la
variable Ŷ0 = a + bx 0

Para calcular el intervalo de confianza de la media 𝜇𝑦/𝑥0 se utiliza la


distribución muestral de la estadística: 𝑌̂0 =∝ +𝑏𝑥0 . Esta distribución es
normal.
ˆ ) = E(a + bx ) =  + bx =  ˆ
Con media, Yˆ = E(Y
0
0 0 Y/ X 0

 1 (x − x)2  n
Y con varianza: 2Ŷ = 2  + 0
n S
 , donde, S XX =  (xi − x)2 =  x 2 − n(x)2 .
 
0
xx i=1

 1 (x − x)2 
La estimación de la varianza  2Ŷ , es: 2Ŷ = s2  + 0 
n Sxx 
0 0

Ŷ0 −  y/ x0
Por lo tanto, la estadística: T = t(n − 2)
1 (x 0 − x)2
+
n S xx

Esta variable se utiliza como variable aleatoria pivote para obtener el intervalo
de confianza de la media  Y/ x0

Observe que, E(Yˆ 0 ) =  Y/ x0 , Es decir, la estadística Ŷ0 es un estimador puntual


insesgado de  Y/ x0

UNIVERSIDAD ANDINA DEL CUSCO


Mgt. Alfredo Marcavillaca Luna Estadística II

Luego, si ŷ 0 es un valor de Ŷ0 El intervalo de confianza del (1−∝) ×


100% para la media: 𝜇𝑦⁄𝑥0 tiene los siguientes límites de confianza:

 1 (x 0 − x)2 
IC =  y 0 S + 
 n S XX 

Donde, 𝑡0 = 𝑡1−∝. 𝑛−2 es un valor de 𝑡-Student con 𝑛 − 2 grados de libertad y
2

cola a la derecha de , Los grados de libertad son de la MCE (media
2
cuadrática de error)
EJEMPLO
1. Continuando con el ejemplo 9.1 Si un obrero tuviera un salario tuviera $ 90 ¿en
cuánto se estima el promedio de sus gastos? Calcule el intervalo de confianza
del 95% para esta estimación.
SOLUCION:
De la ecuación de regresión muestral, cuando x0 = 90, se obtiene,

ŷ0 = a + bx0 = 1.2866 + 0.82026  90 = 7495206

este valor es la estimación puntual de la media  Y/ x0

Además, n = 20, x = 47.45, s = 13.85 = 3.72156,

Sxx =  x 2 + n(x) = 52877 − 20  ( 47.45)2 = 7846.95,


2
t 0.975,18 = 2.101,

Luego, de los límites de confianza de la media  Y/ x0

1 (90 − 47.45)2
IC = 74.952 2.101  3.72  + ,
20 7846.95
IC = 74.952 4.141

IC =  70.811; 79.093

Se obtiene el intervalo de confianza, 70.811   Y/ x0  79.093

Esto es, si un obrero de la empresa tuviera un salario de $90, se estima que su


gasto medio, se encuentre entre 70.835 y 79.069 dólares, con una confianza
del 95%
INTERVALO DE PREDICCIÓN PARA UN SOLO VALOR y 0
Sea y 0 la predicción real (parámetro) que se calcula en el modelo de regresión
Y0 =  + X cuando, X = x 0 y sea Ŷ₀ el valor calculado en la ecuación estimada
Ŷ0 = a + bX cuando, X = x 0 .

Para obtener el intervalo de predicción del valor y 0 de la variable aleatoria


Y0 =  + x0 , se considera a la diferencia ŷ0 − y0 como un valor de la variable

UNIVERSIDAD ANDINA DEL CUSCO


Mgt. Alfredo Marcavillaca Luna Estadística II

aleatoria diferencia, Ŷ0 − Y0 , cuya distribución muestral puede demostrarse que


es normal con media cero y desviación estándar estimada,

1 (x − x)2
ˆ Ŷ − Y = S 1+ +
0 0
n s XX

El intervalo de predicción del valor y 0 con nivel de confianza de (n − 2)  100% se


obtiene aplicando como variable aleatoria pivote de estadística:

Ŷ0 − Y0
T= t(n − 2)
1 (x − x)2
S 1+ + 0
n S XX

Los limites inferiores y superiores del intervalo de la predicción del (n − 2)  100%


del valor y 0 , son los siguientes números:

 1 (x 0 − x)2 
IC =  yˆ 0 t0s 1 + + 
 n sxx 

Donde, t 0 = t  , Los grados de libertad son de la MCE (medias cuadrática


1− ,n− 2
2
error).
EJEMPLO
2. Continuando con el ejemplo 9.1, si un obrero tuviera un salario semanal de
$90. ¿Cuánto seria su gasto semanal? Calcule el intervalo de confianza del
95% para esta predicción.
SOLUCIÓN.
Su gasto semanal seria: Ŷ0 = a + bx 0 = 1.12866 + 0.82026x90 = 74.95206

Además, n = 20, x = 47.45, s = 13.85 = 3.72156,

SXX =  x 2 − n(x)2 = 52877 − 20  ( 47.45)2 = 7846.95, t 0.975,18 = 2.101

El intervalo de predicción del 95% para y₀ tiene los siguientes límites de


1 (90 − 47.45)2
predicción: IC = 74.952 2.101x3.72x 1 + +
20 7846.95

IC = 74.952 Ŧ 8.845

Luego, 66.107  y0  83.797

Por lo tanto, si un empleado de la empresa tuviera un salario semanal de $90,


su gasto semanal, se estima se encontraría entre 66.107 y 83.797 dólares, con
una confianza del 95%.
Observe que un intervalo de predicción es más amplio que el que se construyó
para la media de y.

UNIVERSIDAD ANDINA DEL CUSCO


Mgt. Alfredo Marcavillaca Luna Estadística II

EJERCICIO 1
El Organismo Operador de agua en el Municipio de Izcalli OPERAGUA quiere
conocer la relación entre en consumo mensual domiciliario de agua y el tamaño
de las familias, toma una muestra de 10 familias elegidas al azar y encuentra
los siguientes datos:

Tamaño de la familia 2 7 9 4 12 6 9 3 3 4
Consumo en m3 de consumo 65 120 130 43 140 90 180 64 79 92
a) Calcula la pendiente y ordenada al origen.
b) Obtener la ecuación que mejor se ajusta a los datos
c) Prediga cuantos metros cúbicos al mes consumirá una familia que tiene 10
miembros.
d) Calcule el error estándar
e) Calcule el coeficiente de correlación y el coeficiente de determinación e
interprételos.
f) Determina el intervalo de confianza al 95%.
g) Determina el intervalo de predicción 95%
SOLUCIÓN

Xi Yi Xi2 Yi2 Xi Yi
2 65 4 4225 130
7 120 49 14400 840
9 130 81 16900 1170
4 43 16 1849 172
12 140 144 19600 1680
6 90 36 8100 540
9 180 81 32400 1620
3 64 9 4096 192
3 79 9 6241 237
4 92 16 8464 368
X i = 59  Y = 1003i X 2
i = 445 Y i
2
= 116275 X Y i i = 6949

a). Calculamos los promedios:

x=
x i
=
59
= 5.9 y=
y i
=
1003
= 100.3
n 10 n 10
b). Calcula la pendiente y ordenada al origen:

b=
x y i i − n( x )( y )
=
6949 − 10(5.9)(100.3) 6949 − 5917.70 1031.30
= = = 10.64
x 2
i − n( x ) 2
445 − 10(5.9)2 445 − 348.10 96.90

Hallemos el parámetro “a” que es la ordenada en el origen:


si: y = bx + a  a = y − bx

UNIVERSIDAD ANDINA DEL CUSCO


Mgt. Alfredo Marcavillaca Luna Estadística II

a = 100.3 − 10.64(5.9)
a = 100.3 − 62.78 = 37.52
c). Obtener la ecuación que mejor se ajusta a los datos

como: yˆ = a + bx  yˆ = 37.52 + 10.64 x

d). Prediga cuantos metros cúbicos al mes consumirá una familia que tiene 10 miembros
Reemplazamos en la ecuación obtenida anteriormente

yˆ = 37.52 + 10.64 x yˆ = 37.52 + 10.64(10)


yˆ = 37.52 + 106.4 = 143.92

Una familia que tiene 10 miembros consumirá 143.92 metros cúbicos de


agua al mes

e). Calcula el error estándar de estimación:

S=
y 2
i − a y i − b xi y i
=
116275 − (37.52  1003) − (10.64)(6949)
n−2 10 − 2

116275 − 37632.56 − 73937.36 4705.08


S= =
8 8

S = 588.14 = 24.25
f). Calcule el coeficiente de determinación y el coeficiente de correlación.

Calcula el coeficiente de determinación

a  y i + b  xi y i − n ( y ) 2 37.52(1003) + 10.64(6949) − 10(100.3) 2


r =
2
=
y i
2
− n(y )2 116275 − 10(100.3) 2

37632.56 + 73937.36 − 100600.9 10969.02


r2 = = = 0.6998
116275 − 100600.90 15674.1
Determina el coeficiente de correlación.

r = r 2 = 0.6998 = 0.84

Tiene una correlación positiva muy fuerte


g). Determina el intervalo de confianza al 95%.

Además: n = 10, x = 5.9, S = 24.25, x 2


i = 445, t 0 = 2.306

Sxx =  xi2 − n( x )2 = 445 − 10(5.9)2 = 96.90


n = 10, x = 5.9, S = 24.25, x 2
i = 445, t 0 = 2.306,

hallamos la t-student

Nivel de confianza es: 95%=0.95  1 − 0.95 =    = 0.05  = 0.025
2

UNIVERSIDAD ANDINA DEL CUSCO


Mgt. Alfredo Marcavillaca Luna Estadística II

t0 = t1− /2,n −2 = t1−0.025,8 = t0.975,8 = 2,306

h). Luego el intervalo de confianza para la media es:

 1 ( x0 − x ) 2   1 (10 − 5.9) 2 
IC =  yˆ 0 t0S +  = 143.92 2.306  24.25 + 
 n Sxx   10 96.90 

IC = 143.92 55.69 0.10 + 0.17  = 143.92 28.95


IC = 143.92 − 28.95;143.92 + 28.95

IC = 114.97;172.87
Se obtiene un intervalo de confianza: 114.97  y / x0  172.87

Se puede asegurar con un nivel de confianza del 95% que los 10 miembros
de una familia pueden consumir entre 114.97 y 172.87 metros cúbicos
mensuales de agua
g). Determinar el intervalo de predicción 95%

De la ecuación muestral cuando x0 = 10 , se obtiene

𝑦̂ = 37.52 + 10.64(10) = 143.92


Considerando 𝑦̂ = 143.92 𝑚𝑒𝑡𝑟𝑜𝑠 𝑐𝑢𝑏𝑖𝑐𝑜𝑠 𝑚𝑒𝑛𝑠𝑢𝑎𝑙𝑒𝑠

Además:
n = 10, x0 = 10, x = 5.9, S = 24.25, x 2
i = 445, t 0 = 2.306, Sxx = 96.90, yˆ 0 = 143.92
 1 ( x0 − x ) 2   1 (10 − 5.9) 2 
IC =  yˆ t0S 1 + +  = 143.92 2.306  24.25 1 + + 
 n Sxx   10 96.90 

 16.81  
IC = 143.92 55.69 1 + 0.1 +  = 143.92 55.69 1.10 + 0.17 
 96.90 
IC = 143.92 55.69 1.27  = 143.92 55.69(1.13) = 143.92 62.92

IC = 143.92 − 62.92;143.92 + 62.92 = 81 ; 206.84

Se obtiene un intervalo de confianza


81  y / x0  206.84

EJERCICIO 2
Un gerente de ventas reunió los datos siguientes relacionados con las ventas
anuales en miles de soles y los años de experiencia de diez vendedores.
Estime las ventas anuales para un vendedor con 7 años de experiencia. Se pu
vendedor 1 2 3 4 5 6 7 8 9 10 miem
Años de experiencia xi 1 3 4 4 6 8 10 10 11 13 cúbic
Ventas anuales (yi) 80 97 92 102 103 111 119 123 117 136
a) Calcula la pendiente y ordenada al origen.

UNIVERSIDAD ANDINA DEL CUSCO


Mgt. Alfredo Marcavillaca Luna Estadística II

b) Obtener la ecuación que mejor se ajusta a los datos.


c) Calcula el error estándar de estimación.
d) Calcula el coeficiente de determinación.
e) Determina el coeficiente de correlación.
f) Determina el intervalo de confianza al 95%.
g) Determina el intervalo de predicción para un vendedor con 9 años de
experiencia se tiene.
SOLUCIÓN
Construyendo la tabla se tiene:
Xi Yi Xi2 Yi2 Xi Yi
1 80 1 6400 80
3 97 9 9409 291
4 92 16 8464 368
4 102 16 10404 408
6 103 36 10609 618
8 111 64 12321 888
10 119 100 14161 1190
10 123 100 15129 1230
11 117 121 13689 1287
13 136 169 18496 1768

X i = 70  Y = 1080
i X 2
i = 632 Y
i
2
= 119082 X Y
i i = 8128

a). Hallamos los promedios

x=
x i
=
70
=7 y=
y i
=
1080
= 108
n 10 n 10
b) Calcula la pendiente y ordenada al origen.
Calculamos la pendiente

b=
x y i i − n( x )( y )
=
8128 − 10(7)(108) 8128 − 7560 568
= = =4
x 2
i − n( x ) 2
632 − 10(7) 2 632 − 490 142

Ordenada al origen

si: y = bx + a  a = y − bx
a = 108 − 4(7)
a = 108 − 28 = 80
c) Obtener la ecuación que mejor se ajusta a los datos.

UNIVERSIDAD ANDINA DEL CUSCO


Mgt. Alfredo Marcavillaca Luna Estadística II

yˆ = a + bx
yˆ = 80 + 4 x

Para un vendedor con 7 años de experiencia, sus ventas estimadas serían:

yˆ = 80 + 4 x = 80 + 4(7) = 80 + 20
yˆ = 108 ventas anuales

c) Calcula el error estándar de estimación.

S=
y 2
i − a y i − b xi y i
=
119082 − (80  1080) − (4  8128)
n−2 10 − 2
119082 − 86400 − 32512
S=
8

170
S= = 21.25 = 4.61
8
d) Calcula el coeficiente de determinación.
Calcula el coeficiente de determinación

a  y i + b  xi y i − n ( y ) 2 (80  1080) + (4  8128) − (10  108) 2


r =
2
=
y i
2
− n(y )2 119082 − (10)(108) 2

86400 + 32512 − 116640 2272


r2 = = = 0.9303
119082 − 116640 2442
El 93% de las ventas anuales se deben a la experiencia de los vendedores y el 7%
restante se debe a otros factores.
h). Determina el coeficiente de correlación.

r = r 2 = 0.9303 = 0.9645

Este número nos indica que las variables X Y tienen una correlación positiva
intensa.
i). Determina el intervalo de confianza al 95%.
Además:
Sxx =  xi2 − n( x )2 = 632 − 10(7) 2 = 632 − 490 = 142
j). hallamos la t-student

Nivel de confianza es: 95%=0.95  1 − 0.95 =    = 0.05  = 0.025
2
t0 = t1− /2,n −2 = t1−0.025,8 = t0.975,8 = 2,306

Luego el intervalo de confianza al 95%, considerado yˆ = 108, y x0 = 7

n = 10, x = 7, yˆ 0 = 108, S = 4.61, x 2


i = 632, t 0 = 2.306, SXX = 142,

UNIVERSIDAD ANDINA DEL CUSCO


Mgt. Alfredo Marcavillaca Luna Estadística II

 1 ( x0 − x ) 2   1 (7 − 7) 2 
IC =  yˆ 0 t0S +  = 108 2.306  4.61 + 
 n Sxx   10 142 

IC = 108 10.631 0.10  = 108 3.362 = 108 − 3.362;108 + 3.362 

IC = 104.638;111.362
Se obtiene un intervalo de confianza: 104.638  y / x0  111.362

Se puede asegurar con un nivel de confianza del 95% que las ventas de los
vendedores con 7 años de experiencia están entre 104.6 y 111.4 miles soles
anuales.

j) Determina el intervalo de predicción para un vendedor con 9 años de


experiencia se tiene.
Datos:
n = 10, x = 7, yˆ 0 = 108, S = 4.61, x 2
i = 632, t 0 = 2.306, SXX = 142,

 1 ( x0 − x ) 2   1 (9 − 7) 2 
IC =  yˆ t0S 1 + +  = 108 2.306  4.61 1 + + 
 n Sxx   10 142 

 4  
IC = 108 10.631 1 + 0.1 +  = 108 10.631 1.128 
 142 

IC = 108 10.631  1.062 = 108 11.29  = 108 − 11.29;108 + 11.29 

IC = 96.71;119.29

Se obtiene el intervalo de predicción


96.71  y 0  119.29

Se puede asegurar con un nivel de confianza del 95% que las ventas pronosticadas de
un vendedor con 9 años de experiencia están entre 96.71 y 119.3 miles soles anuales.

EJERCICIO 3
Determinar un intervalo de confianza de 95% para todos los representantes de ventas
de la compañía COPIADORA DE VENTAS DE AMÉRICA que hacen 25 llamadas y un
intervalo de predicción para Sheila Baker, representante de ventas de la Costa Oeste
que hizo 25 llamadas.
-Determinar el intervalo de confianza y el intervalo de predicción

Representante de ventas 𝑿𝒊 𝒀𝒊
Tom Keller 20 30
Jeff Hall 40 60
Brian Virost 20 40
Greg Fish 30 60
Susan Welch 10 30
Carlos Ramirez 10 40

UNIVERSIDAD ANDINA DEL CUSCO


Mgt. Alfredo Marcavillaca Luna Estadística II

Rich Niles 20 40
Mike Kiel 20 50
Mark Reynolds 20 30
Soni Jones 30 70

Solución
𝑿𝒊 𝒀𝒊 𝑿𝟐𝒊 𝒀𝟐𝒊 𝑿𝒊 . 𝒀𝒊
Representante
de ventas
Tom Keller 20 30 400 900 600
Jeff Hall 40 60 1600 3600 2400
Brian Virost 20 40 400 1600 800
Greg Fish 30 60 900 3600 1800
Susan Welch 10 30 100 900 300
Carlos Ramirez 10 40 100 1600 400
Rich Niles 20 40 400 1600 800
Mike Kiel 20 50 400 2500 1000
Mark Reynolds 20 30 400 900 600
Soni Jones 30 70 900 4900 2100
X i = 220  Y = 450  X
i
2
i = 5600 Y
i
2
= 22100 X Yi i = 10800

a). Hallamos los promedios

x=
x i
=
220
= 22 y=
y i
=
450
= 45
n 10 n 10
b) Calcula la pendiente y ordenada al origen.
Calculamos la pendiente

b=
x y i i − n( x )( y )
=
10800 − 10(22)(45) 10800 − 9900 900
= = = 1.184
x i
2
− n( x ) 2
5600 − 10(22)2 5600 − 4840 760

Hallemos el valor de “a” si: y = bx + a  a = y − bx

a = 45 − 1.184  (22)
a = 45 − 3.938 = 18.95
c) Obtener la ecuación que mejor se ajusta a los datos hacen 25 llamadas.

yˆ = a + bx0
yˆ = 18.95 + 1.184 x = 18.95 + 1.184(25)
yˆ = 48.55

d) Calcula el error estándar de estimación.

S=
y i
2
− a y i − b xi y i
=
22100 − (18.95  450) − (1.184  10800)
n−2 10 − 2
22100 − 8527.5 − 12787.2
S=
8

UNIVERSIDAD ANDINA DEL CUSCO


Mgt. Alfredo Marcavillaca Luna Estadística II

785.3
S= = 98.1625 = 9.91
8
e). Determina el intervalo de confianza al 95%.
Además:
Sxx =  xi2 − n( x )2 = 5600 − 10(22) 2 = 5600 − 4840 = 760
hallamos la t-student
Nivel de confianza es: 95%=0.95

 1 − 0.95 =    = 0.05  = 0.025
2
t0 = t1− /2,n −2 = t1−0.025,8 = t0.975,8 = 2,306

n = 10, x0 = 25, x = 22, yˆ 0 = 48.55, S = 9.91, x 2


i = 5600, t 0 = 2.306, S XX = 760,

 1 ( x0 − x ) 2   1 (25 − 22) 2 
IC =  yˆ 0 t0S +  =  48.55 2.306  9.91 + 
 n Sxx   10 706 

IC =  48.55 22.85 0.112  =  48.55 7.647 =  48.55 − 7.647; 48.55 + 7.647

IC =  48.90;56.197

Se obtiene un intervalo de confianza: 48.90  y / x0  56.197

El intervalo de confianza de 95% para todos los representantes de ventas que


hacen 25 llamadas es de 48.90 a 56.197. para interpretar esto, redondee los
valores. Si un representante de ventas hace 25 llamadas, esperaría vender 48.55
copiadoras. Es probable que estas ventas varíen de 48.90 a 56.197 copiadoras.

f). DETERMINAR EL INTERVALO DE PREDICCIÓN


Se desea estimar el número de copiadoras vendidas por Sheila Baker, quien
hizo 25 llamadas. El intervalo de predicción de 95% es:
Datos:
n = 10, x0 = 25, x = 22, yˆ 0 = 48.55, S = 9.91, x 2
i = 5600, t 0 = 2.306, S XX = 760,

 1 ( x0 − x ) 2   1 (25 − 22) 2 
IC =  yˆ t 0S 1 + +  =  48.55 2.306  9.91 1 + + 
 n Sxx   10 760 

 9  
IC =  48.55 22.85 1 + 0.1 +  =  48. 22.85 1.112 
 760 

IC =  48.55 24.096 =  48.55 − 24.096; 48.55 + 24.096

IC =  24.454;72.646

UNIVERSIDAD ANDINA DEL CUSCO


Mgt. Alfredo Marcavillaca Luna Estadística II

Se obtiene el intervalo de predicción


24.454  y 0  72.646

El intervalo es de 24.454 a 72.646 copiadoras. Se concluye que el número de


copiadoras vendidas estará entre aproximadamente 24 y 73 para un
representante de ventas que haga 25 llamadas.

UNIVERSIDAD ANDINA DEL CUSCO

También podría gustarte