Documentos de Académico
Documentos de Profesional
Documentos de Cultura
1 (x − x)2 n
Y con varianza: 2Ŷ = 2 + 0
n S
, donde, S XX = (xi − x)2 = x 2 − n(x)2 .
0
xx i=1
1 (x − x)2
La estimación de la varianza 2Ŷ , es: 2Ŷ = s2 + 0
n Sxx
0 0
Ŷ0 − y/ x0
Por lo tanto, la estadística: T = t(n − 2)
1 (x 0 − x)2
+
n S xx
Esta variable se utiliza como variable aleatoria pivote para obtener el intervalo
de confianza de la media Y/ x0
1 (x 0 − x)2
IC = y 0 S +
n S XX
Donde, 𝑡0 = 𝑡1−∝. 𝑛−2 es un valor de 𝑡-Student con 𝑛 − 2 grados de libertad y
2
cola a la derecha de , Los grados de libertad son de la MCE (media
2
cuadrática de error)
EJEMPLO
1. Continuando con el ejemplo 9.1 Si un obrero tuviera un salario tuviera $ 90 ¿en
cuánto se estima el promedio de sus gastos? Calcule el intervalo de confianza
del 95% para esta estimación.
SOLUCION:
De la ecuación de regresión muestral, cuando x0 = 90, se obtiene,
1 (90 − 47.45)2
IC = 74.952 2.101 3.72 + ,
20 7846.95
IC = 74.952 4.141
IC = 70.811; 79.093
1 (x − x)2
ˆ Ŷ − Y = S 1+ +
0 0
n s XX
Ŷ0 − Y0
T= t(n − 2)
1 (x − x)2
S 1+ + 0
n S XX
1 (x 0 − x)2
IC = yˆ 0 t0s 1 + +
n sxx
IC = 74.952 Ŧ 8.845
EJERCICIO 1
El Organismo Operador de agua en el Municipio de Izcalli OPERAGUA quiere
conocer la relación entre en consumo mensual domiciliario de agua y el tamaño
de las familias, toma una muestra de 10 familias elegidas al azar y encuentra
los siguientes datos:
Tamaño de la familia 2 7 9 4 12 6 9 3 3 4
Consumo en m3 de consumo 65 120 130 43 140 90 180 64 79 92
a) Calcula la pendiente y ordenada al origen.
b) Obtener la ecuación que mejor se ajusta a los datos
c) Prediga cuantos metros cúbicos al mes consumirá una familia que tiene 10
miembros.
d) Calcule el error estándar
e) Calcule el coeficiente de correlación y el coeficiente de determinación e
interprételos.
f) Determina el intervalo de confianza al 95%.
g) Determina el intervalo de predicción 95%
SOLUCIÓN
Xi Yi Xi2 Yi2 Xi Yi
2 65 4 4225 130
7 120 49 14400 840
9 130 81 16900 1170
4 43 16 1849 172
12 140 144 19600 1680
6 90 36 8100 540
9 180 81 32400 1620
3 64 9 4096 192
3 79 9 6241 237
4 92 16 8464 368
X i = 59 Y = 1003i X 2
i = 445 Y i
2
= 116275 X Y i i = 6949
x=
x i
=
59
= 5.9 y=
y i
=
1003
= 100.3
n 10 n 10
b). Calcula la pendiente y ordenada al origen:
b=
x y i i − n( x )( y )
=
6949 − 10(5.9)(100.3) 6949 − 5917.70 1031.30
= = = 10.64
x 2
i − n( x ) 2
445 − 10(5.9)2 445 − 348.10 96.90
a = 100.3 − 10.64(5.9)
a = 100.3 − 62.78 = 37.52
c). Obtener la ecuación que mejor se ajusta a los datos
d). Prediga cuantos metros cúbicos al mes consumirá una familia que tiene 10 miembros
Reemplazamos en la ecuación obtenida anteriormente
S=
y 2
i − a y i − b xi y i
=
116275 − (37.52 1003) − (10.64)(6949)
n−2 10 − 2
S = 588.14 = 24.25
f). Calcule el coeficiente de determinación y el coeficiente de correlación.
r = r 2 = 0.6998 = 0.84
hallamos la t-student
Nivel de confianza es: 95%=0.95 1 − 0.95 = = 0.05 = 0.025
2
1 ( x0 − x ) 2 1 (10 − 5.9) 2
IC = yˆ 0 t0S + = 143.92 2.306 24.25 +
n Sxx 10 96.90
IC = 114.97;172.87
Se obtiene un intervalo de confianza: 114.97 y / x0 172.87
Se puede asegurar con un nivel de confianza del 95% que los 10 miembros
de una familia pueden consumir entre 114.97 y 172.87 metros cúbicos
mensuales de agua
g). Determinar el intervalo de predicción 95%
Además:
n = 10, x0 = 10, x = 5.9, S = 24.25, x 2
i = 445, t 0 = 2.306, Sxx = 96.90, yˆ 0 = 143.92
1 ( x0 − x ) 2 1 (10 − 5.9) 2
IC = yˆ t0S 1 + + = 143.92 2.306 24.25 1 + +
n Sxx 10 96.90
16.81
IC = 143.92 55.69 1 + 0.1 + = 143.92 55.69 1.10 + 0.17
96.90
IC = 143.92 55.69 1.27 = 143.92 55.69(1.13) = 143.92 62.92
EJERCICIO 2
Un gerente de ventas reunió los datos siguientes relacionados con las ventas
anuales en miles de soles y los años de experiencia de diez vendedores.
Estime las ventas anuales para un vendedor con 7 años de experiencia. Se pu
vendedor 1 2 3 4 5 6 7 8 9 10 miem
Años de experiencia xi 1 3 4 4 6 8 10 10 11 13 cúbic
Ventas anuales (yi) 80 97 92 102 103 111 119 123 117 136
a) Calcula la pendiente y ordenada al origen.
X i = 70 Y = 1080
i X 2
i = 632 Y
i
2
= 119082 X Y
i i = 8128
x=
x i
=
70
=7 y=
y i
=
1080
= 108
n 10 n 10
b) Calcula la pendiente y ordenada al origen.
Calculamos la pendiente
b=
x y i i − n( x )( y )
=
8128 − 10(7)(108) 8128 − 7560 568
= = =4
x 2
i − n( x ) 2
632 − 10(7) 2 632 − 490 142
Ordenada al origen
si: y = bx + a a = y − bx
a = 108 − 4(7)
a = 108 − 28 = 80
c) Obtener la ecuación que mejor se ajusta a los datos.
yˆ = a + bx
yˆ = 80 + 4 x
yˆ = 80 + 4 x = 80 + 4(7) = 80 + 20
yˆ = 108 ventas anuales
S=
y 2
i − a y i − b xi y i
=
119082 − (80 1080) − (4 8128)
n−2 10 − 2
119082 − 86400 − 32512
S=
8
170
S= = 21.25 = 4.61
8
d) Calcula el coeficiente de determinación.
Calcula el coeficiente de determinación
r = r 2 = 0.9303 = 0.9645
Este número nos indica que las variables X Y tienen una correlación positiva
intensa.
i). Determina el intervalo de confianza al 95%.
Además:
Sxx = xi2 − n( x )2 = 632 − 10(7) 2 = 632 − 490 = 142
j). hallamos la t-student
Nivel de confianza es: 95%=0.95 1 − 0.95 = = 0.05 = 0.025
2
t0 = t1− /2,n −2 = t1−0.025,8 = t0.975,8 = 2,306
1 ( x0 − x ) 2 1 (7 − 7) 2
IC = yˆ 0 t0S + = 108 2.306 4.61 +
n Sxx 10 142
IC = 104.638;111.362
Se obtiene un intervalo de confianza: 104.638 y / x0 111.362
Se puede asegurar con un nivel de confianza del 95% que las ventas de los
vendedores con 7 años de experiencia están entre 104.6 y 111.4 miles soles
anuales.
1 ( x0 − x ) 2 1 (9 − 7) 2
IC = yˆ t0S 1 + + = 108 2.306 4.61 1 + +
n Sxx 10 142
4
IC = 108 10.631 1 + 0.1 + = 108 10.631 1.128
142
IC = 96.71;119.29
Se puede asegurar con un nivel de confianza del 95% que las ventas pronosticadas de
un vendedor con 9 años de experiencia están entre 96.71 y 119.3 miles soles anuales.
EJERCICIO 3
Determinar un intervalo de confianza de 95% para todos los representantes de ventas
de la compañía COPIADORA DE VENTAS DE AMÉRICA que hacen 25 llamadas y un
intervalo de predicción para Sheila Baker, representante de ventas de la Costa Oeste
que hizo 25 llamadas.
-Determinar el intervalo de confianza y el intervalo de predicción
Representante de ventas 𝑿𝒊 𝒀𝒊
Tom Keller 20 30
Jeff Hall 40 60
Brian Virost 20 40
Greg Fish 30 60
Susan Welch 10 30
Carlos Ramirez 10 40
Rich Niles 20 40
Mike Kiel 20 50
Mark Reynolds 20 30
Soni Jones 30 70
Solución
𝑿𝒊 𝒀𝒊 𝑿𝟐𝒊 𝒀𝟐𝒊 𝑿𝒊 . 𝒀𝒊
Representante
de ventas
Tom Keller 20 30 400 900 600
Jeff Hall 40 60 1600 3600 2400
Brian Virost 20 40 400 1600 800
Greg Fish 30 60 900 3600 1800
Susan Welch 10 30 100 900 300
Carlos Ramirez 10 40 100 1600 400
Rich Niles 20 40 400 1600 800
Mike Kiel 20 50 400 2500 1000
Mark Reynolds 20 30 400 900 600
Soni Jones 30 70 900 4900 2100
X i = 220 Y = 450 X
i
2
i = 5600 Y
i
2
= 22100 X Yi i = 10800
x=
x i
=
220
= 22 y=
y i
=
450
= 45
n 10 n 10
b) Calcula la pendiente y ordenada al origen.
Calculamos la pendiente
b=
x y i i − n( x )( y )
=
10800 − 10(22)(45) 10800 − 9900 900
= = = 1.184
x i
2
− n( x ) 2
5600 − 10(22)2 5600 − 4840 760
a = 45 − 1.184 (22)
a = 45 − 3.938 = 18.95
c) Obtener la ecuación que mejor se ajusta a los datos hacen 25 llamadas.
yˆ = a + bx0
yˆ = 18.95 + 1.184 x = 18.95 + 1.184(25)
yˆ = 48.55
S=
y i
2
− a y i − b xi y i
=
22100 − (18.95 450) − (1.184 10800)
n−2 10 − 2
22100 − 8527.5 − 12787.2
S=
8
785.3
S= = 98.1625 = 9.91
8
e). Determina el intervalo de confianza al 95%.
Además:
Sxx = xi2 − n( x )2 = 5600 − 10(22) 2 = 5600 − 4840 = 760
hallamos la t-student
Nivel de confianza es: 95%=0.95
1 − 0.95 = = 0.05 = 0.025
2
t0 = t1− /2,n −2 = t1−0.025,8 = t0.975,8 = 2,306
1 ( x0 − x ) 2 1 (25 − 22) 2
IC = yˆ 0 t0S + = 48.55 2.306 9.91 +
n Sxx 10 706
IC = 48.90;56.197
1 ( x0 − x ) 2 1 (25 − 22) 2
IC = yˆ t 0S 1 + + = 48.55 2.306 9.91 1 + +
n Sxx 10 760
9
IC = 48.55 22.85 1 + 0.1 + = 48. 22.85 1.112
760
IC = 24.454;72.646