Documentos de Académico
Documentos de Profesional
Documentos de Cultura
INFERENCIAL
II
TABLA DE CONTENIDO
1
1.1.- MODELO DE REGRSIÓN SIMPLE.
̂ = 𝒂 + 𝒃𝒙
𝒚
Donde:
𝑥 = 𝑉𝑎𝑟𝑖𝑎𝑏𝑙𝑒 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒.
Los estadísticos han desarrollado ecuaciones que se utilizan para encontrar los valores de
a y b para cualquier recta de regresión. La pendiente b se encuentra mediante:
∑ 𝑥𝑦 − 𝑛 𝑥̅ ̅𝑦
𝑏=
∑ 𝑥 2 − 𝑛 𝑥̅ 2
2
Donde:
𝑛 = 𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠.
̅ − 𝒃𝒙
𝒂= 𝒚 ̅
3
1.2.- DETERMINACIÓN DE LA ECUACIÓN DE REGRESIÓN.
Solución.
VENTAS
4
3.5
3
2.5
2
VENTAS
1.5
1
0.5
0
0 2 4 6 8
4
Año Periodo (x) Demanda (y) xy x²
2001 1 74 74 1
2002 2 79 158 4
2003 3 80 240 9
2004 4 90 360 16
2005 5 105 525 25
2006 6 142 852 36
2007 7 122 854 49
Sumatorias 28 692 3, 063 140
n=7
28
𝑥̅ = =4
7
692
𝑦̅ = = 98.86
7
∑ 𝑥𝑦−𝑛 𝑥̅ ̅𝑦 3,063−(7∗4∗98.86)
𝑏= ∑ 𝑥 2 −𝑛 𝑥̅ 2
= = 10.54
140−7(4 2 )
5
Ejemplo 1:
Cierta compañía remodela casas viejas, con el tiempo se ha percatado de que su volumen
de dólares por trabajos de renovación depende de la nómina local. A continuación, se
muestran los ingresos de la compañía y el monto de dinero percibido por los
trabajadores de la nómina local durante los últimos 6 años.
Si la cámara de comercio predice que la nómina local será de 600 millones para el
próximo año ¿Cuáles serán las ventas de la compañía?
Solución:
VENTAS
4
3.5
3
2.5
2
VENTAS
1.5
1
0.5
0
0 2 4 6 8
6
Datos Nómina (x) Ventas (y) xy x²
1 1 2.0 2 1
2 3 3.0 9 9
3 4 2.5 10 16
4 2 2.0 4 4
5 1 2.0 2 1
6 7 3.5 24.5 49
Sumatorias 18 15 51.5 80
n=6
18
𝑥̅ = =3
6
15
𝑦̅ = = 2.5
6
∑ 𝑥𝑦−𝑛 𝑥̅ ̅𝑦 51.5−(6∗3∗2.5)
𝑏= ∑ 𝑥 2 −𝑛 𝑥̅ 2
= = 0.25
80−6(32 )
̂ = 𝟏. 𝟕𝟓 + 𝟎. 𝟐𝟓𝒙
𝒚
̂ = 𝟏. 𝟕𝟓 + 𝟎. 𝟐𝟓(𝟔) = 𝟑. 𝟐𝟓
𝒚
7
1.3.- MEDIDAS DE VARIACIÓN.
̂ )𝟐
∑(𝒚 − 𝒚 ∑ 𝒚𝟐 − 𝒂 ∑ 𝒚 − 𝒃 ∑ 𝒙𝒚
𝑺𝒚𝒙 = √ 𝑺𝒚𝒙 = √
𝒏−𝟐 𝒏−𝟐
En donde:
Directrices de decisión:
Si 𝑆𝑦𝑥 , es pequeño, significa que los datos están relativamente cercanos a la recta
de regresión, y la ecuación de regresión sirve para predecir y con poco error.
Si 𝑆𝑦𝑥 , es grande, significa que los datos están muy dispersos respecto a la recta
de regresión, y la ecuación de regresión no proporcionará una estimación precisa
de y.
8
Intervalo de confianza.
𝟏 ̅) 𝟐
(𝒙 − 𝒙
̂ ± 𝒕(𝑺𝒚𝒙 )√ +
𝒚
𝒏 ∑(𝒙 − 𝒙̅) 𝟐
En donde:
𝑥̅ = 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 𝑥.
𝑛 = 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠.
𝑡 = 𝑣𝑎𝑙𝑜𝑟 𝑡 𝑐𝑜𝑛 𝑛 − 2 𝑔. 𝑙.
Ejemplo 1 (continuación):
Cierta compañía remodela casas viejas, con el tiempo se ha percatado de que su volumen
de dólares por trabajos de renovación depende de la nómina local. A continuación, se
muestran los ingresos de la compañía y el monto de dinero percibido por los
trabajadores de la nómina local durante los últimos 6 años.
Se pide:
a) Análisis de regresión.
b) Si la cámara de comercio predice que la nómina local será de 600 millones para el
próximo año ¿Cuáles serán las ventas de la compañía?
c) Calcule el error estándar de estimación.
d) Calcule el intervalo de confianza del 95%, cuando la nómina local es de 600
millones.
9
Solución:
Datos x y xy x² ̂
𝒚 ̂ )𝟐
(𝒚 − 𝒚 ̅) 𝟐
(𝒙 − 𝒙
1 1 2.0 2 1 2 0 4
2 3 3.0 9 9 2.5 0.25 0
3 4 2.5 10 16 2.75 0.0625 1
4 2 2.0 4 4 2.25 0.0625 1
5 1 2.0 2 1 2 0 4
6 7 3.5 24.5 49 3.5 0 16
Sumas 18 15 51.5 80 0.375 26
a) Análisis de regresión.
̂ = 𝟏. 𝟕𝟓 + 𝟎. 𝟐𝟓𝒙
𝒚
b) Si la cámara de comercio predice que la nómina local será de 600 millones para el
próximo año ¿Cuáles serán las ventas de la compañía?
̂ = 𝟏. 𝟕𝟓 + 𝟎. 𝟐𝟓(𝟔) = 𝟑. 𝟐𝟓
𝒚
̂ )𝟐
∑(𝒚 − 𝒚 𝟎. 𝟑𝟕𝟓
𝑺𝒚𝒙 = √ =√ = 𝟎. 𝟑𝟎𝟔𝟏
𝒏−𝟐 𝟔−𝟐
El 𝑆𝑦𝑥 , es pequeño, por lo tanto significa que los datos están relativamente cercanos a la
recta de regresión, y la ecuación de regresión sirve para predecir y con poco error.
10
d) Calcule el intervalo de confianza del 95%, cuando la nómina local es de 600
millones.
𝑡0.05,4 = 2.132
1 (𝑥 − 𝑥̅ )2
𝑦̂ ± 𝑡(𝑆𝑦𝑥 )√ +
𝑛 ∑(𝑥 − 𝑥̅ )2
1 (6 − 3)2
3.25 ± 2.132(0.3061)√ +
6 26
𝟑. 𝟐𝟓 ± 𝟎. 𝟒𝟔𝟕𝟑
11
1.4.- CALCULO DE LOS COEFICIENTES DE CORRELACIÓN Y
DETERMINACIÓN.
Coeficiente de correlación.
Otra forma de evaluar la relación entre dos variables consiste en calcular el coeficiente de
correlación. Esta medida expresa el grado o la fuerza de la relación lineal. Usualmente
identificado como r, el coeficiente de correlación puede ser cualquier número entre +1 y
–1.
✓ Un valor cercano a 0 indica que hay poca asociación entre las variables.
✓ Un valor cercano a 1 indica una asociación directa o positiva entre las variables.
✓ Un valor cercano a -1 indica una asociación inversa o negativa entre las variables.
𝒏 ∑ 𝒙𝒚 − ∑ 𝒙 ∑ 𝒚
𝒓=
√[𝒏 ∑ 𝒙𝟐 − (∑ 𝒙)𝟐 ][𝒏 ∑ 𝒚𝟐 − (∑ 𝒚)𝟐 ]
Coeficiente de determinación.
12
Ejemplo 1 (continuación):
Cierta compañía remodela casas viejas, con el tiempo se ha percatado de que su volumen
de dólares por trabajos de renovación depende de la nómina local. A continuación se
muestran los ingresos de la compañía y el monto de dinero percibido por los
trabajadores de la nómina local durante los últimos 6 años.
Se pide:
Solución:
Datos x y xy x² ̂
𝒚 ̂ )𝟐
(𝒚 − 𝒚 ̅) 𝟐
(𝒙 − 𝒙 𝒚𝟐
1 1 2.0 2 1 2 0 4 4
2 3 3.0 9 9 2.5 0.25 0 9
3 4 2.5 10 16 2.75 0.0625 1 6.25
4 2 2.0 4 4 2.25 0.0625 1 4
5 1 2.0 2 1 2 0 4 4
6 7 3.5 24.5 49 3.5 0 16 12.25
Sumas 18 15 51.5 80 0.375 26 39.5
13
Ejemplo 1:
Se pide:
14
X Y XY X² ̂
𝒀 ̂ )𝟐
(𝒀 − 𝒀 Y² ̅ )𝟐
(𝑿 − 𝑿
1.0 8.1 8.1 1 7.99 0.0121 65.61 0.25
1.1 7.8 8.58 1.21 8.21 0.1681 60.84 0.16
1.2 8.5 10.2 1.44 8.43 0.0049 72.25 0.09
1.3 9.8 12.74 1.69 8.66 1.2996 96.04 0.04
1.4 9.5 13.3 1.96 8.88 0.3844 90.25 0.01
1.5 8.9 13.35 2.25 9.1 0.04 79.21 0
1.6 8.6 13.76 2.56 9.32 0.5184 73.96 0.01
1.7 10.2 17.34 2.89 9.54 0.4356 104.04 0.04
1.8 9.3 16.74 3.24 9.77 0.2209 86.49 0.09
1.9 9.2 17.48 3.61 9.99 0.6241 84.64 0.16
2.0 10.5 21 4 10.21 0.0841 110.25 0.25
16.5 100.4 152.59 25.85 3.7922 923.58 1.1
𝑛 = 11
∑ 𝑥 16.5
𝑥̅ = = = 1.5
𝑛 11
∑ 𝑦 100.4
𝑦̅ = = = 9.1
𝑛 11
𝑦̂ = 𝑎 + 𝑏𝑥 = 5.77 + 2.22𝑥
15
Calcule la cantidad media de azúcar convertida que se produce cuando la
temperatura registrada es 1.75.
La cantidad media de azúcar que se produce con una temperatura de 1.75 es de 9.65
̂ )𝟐
∑(𝒚 − 𝒚 ∑ 𝒚𝟐 − 𝒂 ∑ 𝒚 − 𝒃 ∑ 𝒙𝒚
𝑺𝒚𝒙 = √ 𝑺𝒚𝒙 = √
𝒏−𝟐 𝒏−𝟐
3.7922
𝑆𝑦𝑥 = √ = 0.65
11 − 2
De acuerdo al valor del error estándar la ecuación de regresión predice con poco error.
1 (𝑥 − 𝑥̅ )2
𝑦̂ ± 𝑡(𝑆𝑦𝑥 )√ +
𝑛 ∑(𝑥 − 𝑥̅ )2
16
1 (1.75 − 1.5)2
9.65 ± (1.833)(0.65)√ +
11 1.1
9.65 ± 0.46
El I.C. del 95% cuando se tiene una temperatura registrada de 1.75 va de 9.19 a 10.11
𝒏 ∑ 𝒙𝒚 − ∑ 𝒙 ∑ 𝒚
𝒓=
√[𝒏 ∑ 𝒙𝟐 − (∑ 𝒙)𝟐 ][𝒏 ∑ 𝒚𝟐 − (∑ 𝒚)𝟐 ]
(11 × 152.59) − (16.5 × 100.4)
= = 0.71
√[(11 × 25.85) − 16.52 ][(11 × 923.58) − 100.42 ]
De acuerdo al resultado del coeficiente de correlación se indica que hay una asociación
directa o positiva entre las variables.
El valor de r²=71%, lo cual significa que un 71% de la variación total se explica mediante
la ecuación de regresión.
17
Ejemplo 2:
Se pide:
18
X Y XY X² ̂
𝒀 (𝒀 − 𝒀̂ )𝟐 Y² ̅ )𝟐
(𝑿 − 𝑿
4.3 126 541.8 18.49 19.8025 15876 0.49
4.5 121 544.5 20.25 0.3025 14641 0.25
5.9 116 684.4 34.81 30.8025 13456 0.81
5.6 118 660.8 31.36 12.6025 13924 0.36
6.1 114 695.4 37.21 57.0025 12996 1.21
5.2 118 613.6 27.04 12.6025 13924 0.04
3.8 132 501.6 14.44 109.2025 17424 1.44
2.1 141 296.1 4.41 378.3025 19881 8.41
7.5 108 810 56.25 183.6025 11664 6.25
45 1094 5348.2 244.26 804.2225 133786 19.26
𝑛=9
𝑥̅ = 5
𝑦̅ = 121.55
5348.2 − (9 × 5 × 121.55)
𝑏= = −6.31
244.26 − 9(52 )
𝑎 = 121.55 + 6.31(5) = 153.1
𝑦̂ = 153.1 − 6.31 𝑥
19
3) Calcule el error estándar de estimación.
1 (4.8 − 5)2
122.81 ± (2.517)(2.44)√ +
9 19.26
122.81 ± 0.3364
20