Está en la página 1de 15

ANÁLISIS ESTRATÉGICO DE LA INFORMACIÓN

.
ALUMNA: EMELIA RODRIGUEZ RODRIGUEZ

MATRICULA. 160618

DOCENTE: RAMON BRISEÑO QUINTERO

ACTIVIDAD 2. REGRESIÓN, CORRELACIÓN Y


PROBABILIDAD

JALAPA, TABASCO A 23 DE MAYO DE 2022.


Actividad 2. Regresión, correlación y probabilidad
Resuelva los ejercicios 1, 3, 4, 5a y 5b de las páginas 82, 83 y 84 de la primera referencia
de la “Lecturas Clave” de la unidad 3, (Hernández, 2006)

Ejercicio 1
Los datos de la tabla de abajo muestran la edad y el peso de 6 niños.

Edad (año) 4 6 3 7 2 8
Peso (k) 18 24 16 23 12 26

a) Realizar el diagrama de dispersión.

30

25

20
Peso (K)

15

10

0
0 1 2 3 4 5 6 7 8 9
Edad (Años)

b) Encuentre la ecuación lineal de mínimos cuadrados que mejor se adapta a los


datos. Resp. Y = 8.76 + 2.21 X
n xi Peso (yi) (xi)2 (xi yi)
1 4 18 16 72
2 6 24 36 144
3 3 16 9 48
4 7 23 49 161
5 2 12 4 24
6 8 26 64 208
Total 30 119 178 657

Para el cálculo de la Ordenada al origen a0, Lo calculamos con la siguiente


formula y los datos ya ejemplificados en la tabla de arriba.

∑ 𝑥𝑖2 ∑ 𝑦𝑖 − ∑ 𝑥𝑖 ∑(𝑥𝑖 𝑦𝑖 )
𝑎0 = 2
𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )
a0 = [(178) (119) - (30) (657)] / [6(178) - (30)2]
a0 = [(21182) - (19710)] / [(1068) - (900)]
a0 = (1472) / (168)
a0 = 8.762
Para el cálculo de la Variable dependiente de x: a1, Lo calculamos con la siguiente
formula y los datos ya desglosados en la tabla de arriba.

𝑛 ∑(𝑥𝑖 𝑦𝑖 ) − ∑ 𝑥𝑖 ∑ 𝑦𝑖
𝑎1 = 2
𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )
a1 = [6(657) - (30) (119)] / [6(178) - (30)2]
a1 = (3942 - 3570) / (1068 - 900)
a1 = 372 / 168
a1 = 2.214
En el caso de la regresión lineal simple se considera un solo regresor (variable de
regresión) o predictor x, y una variable dependiente (Montgomery & Runger, 2002) es
descrita por la siguiente formula Y= a0 + a1 X.
Inferimos que la ecuación es: Y= 8.762 + 2.214 X

30

25

20
Peso (K)

15
y = 2.214x + 8.762

10

0
0 1 2 3 4 5 6 7 8 9
Edad (Años)

c) Encuentre el coeficiente de correlación. Resp r = 0.9736


El coeficiente de correlación de Pearson es una medida de dependencia lineal entre dos
variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de
Pearson es independiente de la escala de medida de las variables (Torre, 2008), la cual
es definida por la siguiente formula:
𝑛 ∑ 𝑥𝑖 𝑦𝑖 − ∑ 𝑥𝑖 ∑ 𝑦𝑖
𝑟=
√[𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )2 ] [𝑛 ∑ 𝑦𝑖2 − (∑ 𝑦𝑖 )2 ]
n Edad (xi) Peso (yi) (xi)2 (xiyi) (yi)2
1 4 18 16 72 324
2 6 24 36 144 576
3 3 16 9 48 256
4 7 23 49 161 529
5 2 12 4 24 144
6 8 26 64 208 676
Total 30 119 178 657 2505

r = [6(657) - (30)(119)] / √[[(6(178) - (30)2] [6(2505)-(119)2]]


r = [3942 - 3570] / √[(1068 - 900)(15030 - 14161)]
r = (372) / √[(168)(869)]
r = (372) / √(145992)
r = 372 / 382.09
r = 0.9736
Lo cual quiere decir que se tiene una correlación excelente al ser r= 0.9>1.

d) Estime el peso de un niño de 5 años de edad. Resp 19.81 k


y = 8.762 + 2.215 x
Donde x = 5
Por lo tanto = 8.762 + 2.215 (5) = 8.762 + 11.075 = 19.837
Se estima que un niño de 5 años tenga un peso de 19.83 kg

Comprobación de resultados con MINITAB ejercicio 1

HOJA DE TRABAJO 1 MINITAB


ANÁLISIS DE REGRESIÓN: PESO (KG) VS. EDAD (AÑOS)

La ecuación de regresión es
Peso (Kg) = 8.762 + 2.214 Edad (años)

Resumen del modelo


R-cuad.
S R-cuad. (ajustado)
1.37365 94.79% 93.49%
Análisis de Varianza
Fuente GL SC MC F P
Regresión 1 137.286 137.286 72.76 0.001
Error 4 7.548 1.887
Total 5 144.833
Ejercicio 3
La demanda (Q), de un producto depende del precio (P). Una compañía está intentando
estimar la función para el producto y tiene los datos de la tabla de abajo.
Q
P [*102$]
(Unidades)
10 100
4.7 150
8.5 128
8 120
4.5 162
4 170
3 180
2 200
a) Realice el diagrama de dispersión.

250

200
Q (Unidades)

150

100

50

0
0 2 4 6 8 10 12
P [*102$]

b) Encuentra la ecuación de estimación líneas. Resp Y = 88.92 + 9.64X


n xi Q (yi) (xi)2 (xiyi)
1 10 100 100 1000
2 4.7 150 22.09 705
3 8.5 128 72.25 1088
4 8 120 64 960
5 4.5 162 20.25 729
6 4 170 16 680
7 3 180 9 540
8 2 200 4 400
Total 44.7 1210 307.59 6102

Para el cálculo de la Ordenada al origen a0, Lo calculamos con la siguiente


formula y los datos ya ejemplificados en la tabla de arriba.
∑ 𝑥𝑖2 ∑ 𝑦𝑖 − ∑ 𝑥𝑖 ∑(𝑥𝑖 𝑦𝑖 )
𝑎0 = 2
𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )
a0 = [(307.59) (1210) - (44.7) (6102)] / [8(307.59) - (44.7)2]
a0 = [(372183.9) - (272759.4)] / [(2460.72) - (1998.09)]
a0 = (99424.5) / (462.63)
a0 = 214.92
Para el cálculo de la Variable dependiente de x: a1, Lo calculamos con la siguiente
formula y los datos ya desglosados en la tabla de arriba.

𝑛 ∑(𝑥𝑖 𝑦𝑖 ) − ∑ 𝑥𝑖 ∑ 𝑦𝑖
𝑎1 = 2
𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )
a1 = [8(6102) - (44.7) (1210)] / [8(307.59) - (44.7)2]
a1 = (48816 - 54087) / (2460.72 -1998.09)
a1 = (-5271) / 462.63
a1 = -11.394
En el caso de la regresión lineal simple se considera un solo regresor (variable de
regresión) o predictor x, y una variable dependiente (Montgomery & Runger, 2002) es
descrita por la siguiente formula Y= a0 + a1 X.
Inferimos que la ecuación es: Y= 214.92 – 11.394 X

250

200
Q (Unidades)

150
y = -11.394x + 214.92
100

50

0
0 2 4 6 8 10 12
P [*102$]

c) Encuentre el coeficiente de correlación. Resp r = -.098


El coeficiente de correlación de Pearson es una medida de dependencia lineal entre dos
variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de
Pearson es independiente de la escala de medida de las variables (Torre, 2008), la cual
es definida por la siguiente formula:
𝑛 ∑ 𝑥𝑖 𝑦𝑖 − ∑ 𝑥𝑖 ∑ 𝑦𝑖
𝑟=
√[𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )2 ] [𝑛 ∑ 𝑦𝑖2 − (∑ 𝑦𝑖 )2 ]
n xi Q (yi) (xi)2 (xiyi) (yi)2
1 10 100 100 1000 10000
2 4.7 150 22.09 705 22500
3 8.5 128 72.25 1088 16384
4 8 120 64 960 14400
5 4.5 162 20.25 729 26244
6 4 170 16 680 28900
7 3 180 9 540 32400
8 2 200 4 400 40000
Total 44.7 1210 307.59 6102 190828

r =[8(6102) - (44.7)(1210)] / √[[(8(307.59) - (44.7)2][8(190828)-(1210)2]]


r = [48816 - 54087] / √[(2460.72 - 1998.09)(1526624 - 1464100)]
r = (-5271) / √[( 462.63)(62524)]
r = (-5271) / √( 28925478.12)
r = (-5271) / 5378.24
r = - 0.9801
Lo cual quiere decir que se tiene una correlación excelente al ser r= -1 < -0.9. el signo
negativo solo indica la dirección de la pendiente que como podemos ver en la gráfica es
negativa.

Comprobación de resultados con MINITAB ejercicio 3

HOJA DE TRABAJO 3 MINITAB


ANÁLISIS DE REGRESIÓN: Q (UNIDADES) VS. P [*102$]

La ecuación de regresión es
Q (Unidades) = 214.9 - 11.39 P [*102$]

Resumen del modelo


R-cuad.
S R-cuad. (ajustado)
7.17138 96.05% 95.39%
Análisis de Varianza
Fuente GL SC MC F P
Regresión 1 7506.93 7506.93 145.97 0.000
Error 6 308.57 51.43
Total 7 7815.50
Ejercicio 4
Los datos de la tabla de abajo corresponden a cargamentos de café recolectados por
un agricultor.
Carga de
Año
café (k)
1996 90
1997 98
1998 110
1999 117
2000 124
2001 136
2002 150
a) Realice el diagrama de dispersión.

160

140

120
Carga de café (k)

100

80

60

40

20

0
1995 1996 1997 1998 1999 2000 2001 2002 2003
Año

b) Encuentre la ecuación de estimación lineal. Resp Y = 88.92 + 9.64 X


Año n Año (xi) Carga (yi) (xi)2 (xiyi)
1996 1 0 90 0 0
1997 2 1 98 1 98
1998 3 2 110 4 220
1999 4 3 117 9 351
2000 5 4 124 16 496
2001 6 5 136 25 680
2002 7 6 150 36 900
Total 21 825 91.00
2745
Para el cálculo de la Ordenada al origen a0, Lo calculamos con la siguiente
formula y los datos ya ejemplificados en la tabla de arriba.
∑ 𝑥𝑖2 ∑ 𝑦𝑖 − ∑ 𝑥𝑖 ∑(𝑥𝑖 𝑦𝑖 )
𝑎0 = 2
𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )
a0 = [(91) (825) - (21) (2745)] / [7(91) - (21)2]
a0 = [(75075) - (57645)] / [(637) - (441)]
a0 = (17430) / (196)
a0 = 88.928
Para el cálculo de la Variable dependiente de x: a1, Lo calculamos con la siguiente
formula y los datos ya desglosados en la tabla de arriba.

𝑛 ∑(𝑥𝑖 𝑦𝑖 ) − ∑ 𝑥𝑖 ∑ 𝑦𝑖
𝑎1 = 2
𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )
a1 = [7(2745) - (21) (825)] / [7(91) - (21)2]
a1 = (19215 - 17325) / (637 - 441)
a1 = 1890 / 196
a1 = 9.642
En el caso de la regresión lineal simple se considera un solo regresor (variable de
regresión) o predictor x, y una variable dependiente (Montgomery & Runger, 2002) es
descrita por la siguiente formula Y= a0 + a1 X.
Inferimos que la ecuación es: Y= 88.929 + 9.643 X

160

140

120
Carga de café (k)

100
y = 9.643x + 88.929
80

60

40

20

0
1995 1996 1997 1998 1999 2000 2001 2002 2003
Año

c) Encuentre el coeficiente de correlación. Resp. r = 0.994


El coeficiente de correlación de Pearson es una medida de dependencia lineal entre dos
variables aleatorias cuantitativas. A diferencia de la covarianza, la correlación de
Pearson es independiente de la escala de medida de las variables (Torre, 2008), la cual
es definida por la siguiente formula:
𝑛 ∑ 𝑥𝑖 𝑦𝑖 − ∑ 𝑥𝑖 ∑ 𝑦𝑖
𝑟=
√[𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )2 ] [𝑛 ∑ 𝑦𝑖2 − (∑ 𝑦𝑖 )2 ]
Año n Año (xi) Carga (yi) (xi)2 (xiyi) (yi)2
1996 1 0 90 0 0 8100
1997 2 1 98 1 98 9604
1998 3 2 110 4 220 12100
1999 4 3 117 9 351 13689
2000 5 4 124 16 496 15376
2001 6 5 136 25 680 18496
2002 7 6 150 36 900 22500
Total 21 825 91 2745 99865

r =[7(2745) - (21)(825)] / √[[(7(91) - (21)2][7(99865)-(825)2]]


r = [19215 - 17325] / √[(637 - 441)(699055 - 680625)]
r = 1890 / √[(196)(18430)]
r = 1890 / √(3612280)
r = 1890 / 1900.59
r = 0.9944
Lo cual quiere decir que se tiene una correlación excelente al ser r= 0.9>1.

Comprobación de resultados con MINITAB ejercicio 4

HOJA DE TRABAJO 4 MINITAB


ANÁLISIS DE REGRESIÓN: CARGA (KG) VS. AÑO

La ecuación de regresión es
Carga (Kg) = 88.93 + 9.643 Año

Resumen del modelo


R-cuad.
S R-cuad. (ajustado)
2.42015 98.89% 98.67%
Análisis de Varianza
Fuente GL SC MC F P
Regresión 1 2603.57 2603.57 444.51 0.000
Error 5 29.29 5.86
Total 6 2632.86
Ejercicio 5a y 5b
Los valores de la tabla de abajo corresponden a los pesos en (k) y los niveles de glucosa
en la sangre en (mg/100 ml), de 20 hombres adultos aparentemente saludables.

Glucosa Glucosa
Peso (k) Peso (k)
(mg/100ml) (mg/100ml)
64 108 76.7 99
75.3 109 82.1 100
73 104 83.9 108
82.1 102 73 104
76.2 105 64.4 102
95.7 121 77.6 87
59.4 79 85 102
93.4 107 89 115
82.1 101 90 120
78.9 85 59 89

a) Realice el diagrama de dispersión.

130

120

110
Glucosa (mg/100ml)

100

90

80

70

60
55 60 65 70 75 80 85 90 95 100
Peso (k)
b) Encuentre la ecuación de estimación lineal. Resp Y = 52.71 + 0.636X
n Peso (xi) Glucosa (yi) (xi)2 (xiyi)
1 64 108 4096 6912
2 75.3 109 5670.09 8207.7
3 73 104 5329 7592
4 82.1 102 6740.41 8374.2
5 76.2 105 5806.44 8001
6 95.7 121 9158.49 11579.7
7 59.4 79 3528.36 4692.6
8 93.4 107 8723.56 9993.8
9 82.1 101 6740.41 8292.1
10 78.9 85 6225.21 6706.5
11 76.7 99 5882.89 7593.3
12 82.1 100 6740.41 8210
13 83.9 108 7039.21 9061.2
14 73 104 5329 7592
15 64.4 102 4147.36 6568.8
16 77.6 87 6021.76 6751.2
17 85 102 7225 8670
18 89 115 7921 10235
19 90 120 8100 10800
20 59 89 3481 5251
Total 1560.8 2047 123905.60 161084.1

Para el cálculo de la Ordenada al origen a0, Lo calculamos con la siguiente formula y


los datos ya ejemplificados en la tabla de arriba.

∑ 𝑥𝑖2 ∑ 𝑦𝑖 − ∑ 𝑥𝑖 ∑(𝑥𝑖 𝑦𝑖 )
𝑎0 = 2
𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )

a0 = [(123905.6) (2047) - (1560.8) (161084.1)] / [20(123905.6) - (1560.8)2]


a0 = [(253634763.2) - (251420063.28)] / [(2478112) - (2436096.64)]
a0 = (2214699.92) / (42015.36)
a0 = 52.712
Para el cálculo de la Variable dependiente de x: a1, Lo calculamos con la siguiente
formula y los datos ya desglosados en la tabla de arriba.

𝑛 ∑(𝑥𝑖 𝑦𝑖 ) − ∑ 𝑥𝑖 ∑ 𝑦𝑖
𝑎1 = 2
𝑛 ∑ 𝑥𝑖2 − (∑ 𝑥𝑖 )
a1 = [20(161084.1) - (1560.8) (2047)] / [20(123905.6) - (1560.8)2]
a1 = (3221682 - 3194957.6) / (2478112) - (2436096.64)
a1 = 26724.4 / 42015.36
a1 = 0.636
En el caso de la regresión lineal simple se considera un solo regresor (variable de
regresión) o predictor x, y una variable dependiente (Montgomery & Runger, 2002) es
descrita por la siguiente formula Y= a0 + a1 X.
Inferimos que la ecuación es: Y= 52.712 + 0.636 X

130

120

110
Glucosa (mg/100ml)

100

y = 0.636x + 52.712
90

80

70

60
55 60 65 70 75 80 85 90 95 100
Peso (k)

Si calculamos el coeficiente de correlación de este ejercicio nos da un coeficiente


r=0.6159, con el cual, aunque en la gráfica es evidente, el análisis de resultados nos
muestra que se tiene una correlación regular al estar en el rango de 0.6 < r < 0.8,
aunque es más mala que regular, lo cual nos deja concluir que no hay una relación
directa de correlación entre el Peso y los niveles de glucosa en la sangre. Si bien puede
influir, no es un factor predominante para una variable dependiente.

Como es sabido, que el aumento del IMC se asocia con un mayor riesgo de sufrir
diabetes y es un factor altamente influyente de sufrir esta enfermedad, la obesidad es
causada de hábitos alimenticios poco saludables, mucha comida chatarra, poco
nutritiva, alta en carbohidratos y/o azucares procesados, los cuales llevan a un
incremento de la masa corporal, y esta mala alimentación aunada a la falta de ejercicio
genera que los niveles de glucosa se eleven, por eso existen “flacos” a los que se les
diagnostico diabetes, aun contando con IMC normal.
Comprobación de resultados con MINITAB ejercicio 5a y 5b

HOJA DE TRABAJO 5 A 5 B MINITAB


ANÁLISIS DE REGRESIÓN: GLUCOSA (MG/100ML) VS. PESO (K)

La ecuación de regresión es
Glucosa (mg/100ml) = 52.71 + 0.6361 Peso (k)

Resumen del modelo


R-cuad.
S R-cuad. (ajustado)
8.78961 37.93% 34.49%
Análisis de Varianza
Fuente GL SC MC F P
Regresión 1 849.92 849.920 11.00 0.004
Error 18 1390.63 77.257
Total 19 2240.55
Referencias
Hernández, E. (2006). Manual de estadistica. En E. Hernández, Manual de estadistica
(págs. 82-84). Bogotá: Universidad Cooperativa de Colombia EDUEC.

Montgomery, D. C., & Runger, G. C. (2002). Probabilidad y estadística aplicadas a la


ingeniería. México: Limusa Wiley.

Torre, R. D. (2008). Probabilidad y Estadística para Ciencias e Ingenierias. Madrid: Delta


Publicaciones.

También podría gustarte