Está en la página 1de 16

CHI CUADRADO

TEMA: REGRESIN Y CORRELACIN SIMPLE


32. Ajustar una recta de mnimos cuadrados a los datos de la tabla adjunta tomando
(a) X como variables independiente.

(b) X como variable dependiente.

Representa los datos y las rectas de mnimos cuadrados en el mismo sistema de ejes coordenados.
Parte a:
X
y

3
2

9
8

5
3

6
4

8
6

9
5

Estadsticas de la regresin
Coeficiente de correlacin mltiple
0,958314847
Coeficiente de determinacin R^2
0,918367347
R^2 ajustado
0,897959184
Error tpico
0,690065559
Observaciones
6

y = 0.7143x - 0.3333
R = 0.9184

7
6
5

11
8

4
3
2
1
0

ANLISIS DE VARIANZA

10
X

Intercepcin
Variable X 1

15

Regresin
Residuos
Total

Coeficientes Error tpico Estadstico t


-0,333333
0,796819
-0,418330
0,714286
0,106479
6,708204

Grados de
Suma de
Promedio de
libertad
cuadrados los cuadrados
1 21,4285714 21,42857143
4 1,9047619 0,476190476
5 23,3333333

Probabilidad Inferior 95%


0,697189
-2,545658
0,002570
0,418651

F
45

Valor crtico
de F
0,002570261

Superior
95%
Inferior 95,0% Superior 95,0%
1,878991
-2,545658
1,878991
1,009920
0,418651
1,009920

Parte b:
12

Estadsticas de la regresin
Coeficiente de correlacin mltiple
0,958314847
Coeficiente de determinacin R^2
0,918367347
R^2 ajustado
0,897959184
Error tpico
0,9258201
Observaciones
6

y = 1.2857x + 1
R = 0.9184

10
8
X

6
4
2

ANLISIS DE VARIANZA

0
0

10

Regresin
Residuos
Total

Intercepcin
Variable X 1

Coeficientes
1,0000000
1,2857143

Error tpico
0,9710083
0,1916630

Grados de
Suma de
libertad
cuadrados
1 38,57142857
4 3,428571429
5
42

Estadstico t Probabilidad
1,0298573
0,3612731
6,7082039
0,0025703

Inferior 95%
-1,6959513
0,7535726

Promedio de
los cuadrados
38,57142857
0,857142857

F
45

Superior
95%
Inferior 95,0%
3,6959513
-1,6959513
1,8178560
0,7535726

Valor crtico
de F
0,002570261

Superior
95,0%
3,6959513
1,8178560

33. Para los datos del problema anterior, hallar, (a) los valores de Y para X=5 y X=12, (b) el valor de X para Y=7.
(a)

Y= - 0,333 + 0,714X

Si X = 5

Y = 3,24

Si X = 12

Y = 8,24

(b)

X = 1 + 1,285Y
Si Y = 7

X = 10

34. (a) Mediante el mtodo libre obtener la ecuacin de una recta de ajuste de los datos del problema 32. (b) Contestar
al problema 33 mediante el resultado de (a).
Y = aX + b

(3,2)

(11,8)

a = 0,75

b = -0,25

Y = 0,75X 0,25

X= aY + b

(3,2)

(11,8)

a = 1,333

b = 0,333

X = 1,333Y + 0,333

(b)

Y= - 0,25 + 0,75X
Si X = 5

Y = 3,5

Si X = 12

Y = 8,75

X = 0,333 + 1,333Y
Si Y = 7

X = 9,664

35. La tabla siguiente muestra las puntuaciones finales de algebra y fsica de 10 estudiantes elegidos al azar entre un
gran nmero de ellos. (a) Representar los datos. (b) Hallar la recta de mnimos cuadrados que se ajuste a los datos,
tomando X como variable independiente. (c) igual que en (b), pero tomando Y como variable independiente. (d) Si un
estudiante tiene una puntuacin de 75 en algebra, Cul es su puntuacin en fsica esperada?. (e) Si un estudiante tiene
una puntuacin de 95 en fsica, Cul es su puntuacin en algebra esperada?.
a)
Algebra X
Fsica Y

b)

Y = 29,13 + 0,661X

75
82

80
78

93
86

65
72

87
91

71
80

98
95

Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,872098413
Coeficiente de determinacin R^2 0,760555642
R^2 ajustado
0,730625098
Error tpico
4,233840246
Observaciones
10

68
72

84
89

77
74

c)

X = - 14,39 + 1,15Y

Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones

d)

Y = 29,13 + 0,661X

Si X = 75

Y = 78,71

e)

X = - 14,39 + 1,15Y

Si Y = 95

X = 94,35

0,872098413
0,760555642
0,730625098
5,583516398
10

36. La siguiente tabla muestra el nmero de trabajadores agrcolas en Estados Unidos (en millones) durante los aos 1949
1957. (a) Representar los datos. (b) Hallar una recta de mnimos cuadrados que se ajuste a esta serie de tiempo y
construir su grafico. (c) Calcular los valores de tendencia y comparar con los valores reales. (d) Estimar el nmero de
trabajadores agrcolas en 1948 y comparar con el valor real (10,36 millones). (e) Predecir el nmero de trabajadores
agrcolas en 1958 (el verdadero valor es (7,53 millones). Discutir las posibles fuentes de error en tal prediccin.
Parte a:
Ao
Nmero de
trabajadores
agrcolas en
millones

1949

1950

1951

1952

1953

1954

1955

1956

1957

9,96

9,93

9,55

9,15

8,86

8,84

8,36

7,82

7,58

Parte b:

Y = 618,859 - 0,312X
Parte c:

Nmero de trabajadores en
millones
12

10
# de trabajadores (en
millones)

y = -0.3123x + 618.86
R = 0.9867

8
6

Linear (# de
trabajadores (en
millones))

4
2
0
1948

Parte d:
Si
Parte e:
Si

1950

1952

1954

1956

1958

Y = 618,859 - 0,312X
X = 1948

Y = 11,083

mayor que el valor real (10,36 millones).

Y = 618,859 - 0,312X
X = 1958

Y = 7,963

mayor que el valor real (7,53 millones).

X (Aos)
1949
1950
1951
1952
1953
1954
1955
1956
1957

Y (Calculado)
10,771
10,459
10,147
9,835
9,523
9,211
8,899
8,587
8,275

37. El ndice de coste al usuario por el cuidado mdico en Estados Unidos viene dado por la tabal adjunta para los aos
1950 1957(Al periodo de referencia o periodo base 1947 1949 se le asigno el valor 100, el cual realmente significa el
1000 por ciento. El ndice para 1952, por ejemplo, es 117.2 y muestra que durante 1952 el promedio del precio del
cuidado mdico fue 117,2% del que rigi en el periodo base, es decir, se incremento en un 17,2%. a) representar los
datos. b) Hallar la recta de mnimos cuadrados que se adjunte a los datos y construir su grafico. c) Calcular los valores de
tendencia y comparar con los valores reales. d) Predecir el ndice de costo para el cuidado mdico durante 1958 y
comparar con el valor verdadero (144,4). e) En qu ao se puede esperar que el ndice de consto medico sea el doble
de 1947 1949 suponiendo que la tendencia se mantiene?
Parte a:
Ao
ndice de coste al
usuario por el cuidado
mdico (19471949 =
100)
Parte b:
Y = 4,3786x - 8431,1

1950
106,0

1951
111,1

1952
117,2

1953
121,3

1954
125,2

1955
128,0

1956
132,6

160
140
120
100

y = 4.3786x - 8431.1
R = 0.9923

80

Series1
Linear (Series1)

60

Linear (Series1)

40
20
0
1948

1950

1952

1954

1956

1958

1957
138,0

Parte c:
x
1950
1951
1952
1953
1954
1955
1956
1957

Parte d:
y calculado
105,98571
110,36371
114,74171
119,11971
123,49771
127,87571
132,25371
136,63171

Parte e:

Y = 4,378X 8431, 1142


Durante x = 1958
Y = 4,378*(1958)-8431,1142
Y = 141,0098 Valor generado

r2 = 0,992
r = 0,997 >= 0,8

Y = 4,378X 8431, 1142


200 = 4,378*X 8431, 1142
X = 1971

En este ao la tendencia seria el doble.

38) Ajustar una parbola de mnimos cuadrados,


X
Y

0
2,4

1
2,1

2
3,2

3
5,6

Estadsticas de la regresin
Coeficiente de correlacin mltiple
0,92922863
Coeficiente de determinacin R^2
0,86346584
R^2 ajustado
0,83615901
Error tpico
3,01121712
Observaciones
7

a los datos de la tabla adjunta.


4
9,3

5
14,6

6
21,9

Valor Real 144,4

ANLISIS DE VARIANZA
Valor crtico de
Grados de libertad
Suma de cuadrados Promedio de los cuadrados
F
F
1
286,72
286,72 31,6208722
0,002462807
5
45,33714286
9,067428571
6
332,0571429

Regresin
Residuos
Total

Intercepcin
Variable X 1

Coeficientes
-1,1571429
3,2000000

Error tpico
2,0517986
0,5690665

Estadstico t
-0,5639651
5,6232439

25
y = 0.7333x2 - 1.2x + 2.5095
R = 0.9995

20

15
10
5

0
0
-5

Probabilidad Inferior 95%


0,5971341 -6,4314591
0,0024628
1,7371679

Superior
95%
Inferior 95,0%
4,1171734
-6,4314591
4,6628321
1,7371679

Superior
95,0%
4,1171734
4,6628321

39. El tiempo total necesario para detener un automvil despus de percibir un peligro se compone del tiempo de
reaccin (tiempo entre el conocimiento del peligro y la aplicacin del freno) mas el tiempo de frenado (tiempo para
detener el vehculo despus de aplicar el frenado). La tabla adjunta de las distancias D parada (en pies) de un
automvil que marcha a las velocidades V (millas por hora) desde el instante en que se observa el peligro.
a) Representar los datos. b) Ajustar una parbola de mnimos cuadrados de la forma D = a0 +a1V + a2V2 a los datos.
c) Estimar D cuando V= 45 millas/h. y 80 millas/h
Velocidad V
(millas/h)
Distancia de
parada D
(pies)

Parte a:

20

30

40

50

60

70

54

90

138

206

292

396

Distancia de parada D (pies)

450
400
350
300
250
200
150

100
50
0
0

20

40
Velocidad V (millas/h)

60

80

Parte b:

Y=a0+a1x+ a2x2

D = 41,77-1,095V+ 0,087V2
Parte c:

Estimar D

V= 45 millas/h

V= 80 millas/h

D = 41,77-1,095(45)+ 0,087(45)2

D = 41,77-1,095(45)+ 0,087(45)2

D = 170 pies

D = 516 pies

r = 0,999 >= 0,8


40) La tabla adjunta muestra la natalidad por cada 1000 individuos en Estados Unidos durante los aos 1915-1955 con
intervalo de 5 aos.
a) Representar los datos.
b) Hallar la parbola de mnimos cuadrados que se ajuste a los datos.
c) Calcular los valores de tendencia y compararlos con los reales.
AO
1915
NATALIDAD 25,0
POR CADA
1000
HABITANTES

1920
23,7

1925
21,3

1930
18,9

Estadsticas de la regresin
Coeficiente de correlacin mltiple
0,09654932
Coeficiente de determinacin R^2
0,00932177
R^2 ajustado
-0,13220369
Error tpico
3,26968398
Observaciones
9

1935
16,9

1940
17,9

1945
19,5

1950
23,6

1955
24,6

ANLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados Promedio de los cuadrados
F
Valor crtico de F
Regresin
1
0,704166667
0,704166667 0,0658664
0,804832834
Residuos
7
74,83583333
10,69083333
Total
8
75,54

Intercepcin
Variable X 1

Coeficientes
63,1916667
-0,0216667

Error tpico
163,3619034
0,0844229

Estadstico t Probabilidad
0,3868201
0,7103799
-0,2566445
0,8048328

Inferior 95% Superior 95% Inferior 95,0%


-323,0978519 449,4811852 -323,0978519
-0,2212950
0,1779617
-0,2212950

30

y = 0.0186x2 - 72.044x + 69742


25
R = 0.8919
20
Series1

15

Poly.
(Series1)

10
5

0
1900

1920

1940

1960

1915
1920
1925
1930
1935
1940
1945
1950
1955

Y calculado
-11,875
-15,44
-18,075
-19,78
-20,555
-20,4
-19,315
-17,3
-14,355

Superior
95,0%
449,4811852
0,1779617

41. El numero Y de bacterias por unidad de volumen presentes en un cultivo despus de X horas esta dado en la tabla
adjunta. a) Representar los datos en un papel grafico semi-logaritmico, donde la escala logartmica se utiliza para Y y la
escala aritmtica para X. b) Ajustar una curva de mnimo cuadrados de la forma Y = abx a los datos y explicar porque
esta ecuacin particular da buenos resultados. c) Comprara los valores Y obtenidos de esta ecuacin con los valores
reales. d) Estimar el valor de Y cuando X=7.
Parte a:
Nmero de horas
( X)
Numero de
bacterias por
unidad de
volmenes (Y)

32

47

65

92

132

190

275

ndice de coste al usuario por el


cuidado mdico

160
140
120
100
80
60

40
20
0
1948

1950

1952

1954
Ao

1956

1958

Parte c:
x
0
1
2
3
4
5
6

y calculado
32,147
87,375546
237,486734
645,488943
1754,43895
4768,56506
12960,9598

Parte d:

35227,88882

12.2 En Applied Spectroscopy se estudian las propiedades de reflectancia infrarroja de un lquido viscoso utilizando en
la industria electrnica como lubricante. El experimento que se diseo consisti en el efecto de frecuencia de banda X1
y el espesor de pelcula X2 sobre la densidad ptica y usando un espectroscopio infrarrojo Perkin-Elmer modelo 621.
[Fuente: Pachansky, J., England, C.D.. y Wattman, R. Infrarred sprectoscopis studies of poly (perfrouropropylenexide) on
gold substrate. A classical dispersion analysis for the refractive index. Applied Spectroscopy, vol. 40, num. 1, enero de
1986,p. 9, table 1.]
X1
740
740
740
805
805
805
980
980
980
1235
1235
1235

X2
1,10
0,62
0,31
1,10
0,62
0,31
1,10
0,62
0,31
1,10
0,62
0,31

Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,90710716
Coeficiente de determinacin R^2
0,82284339
R^2 ajustado
0,78347526
Error tpico
0,4063014
Observaciones
12

1500

X2

Y
0,231
0,107
0,053
0,129
0,069
0,030
1,005
0,559
0,321
2,948
1,633
0,934

1000
500

1000-1500

500-1000

X1
y = 3.3727 + 0.0036x1 + 0.9476x2.

0-500

ANLISIS DE VARIANZA
Grados de libertad

Suma de cuadrados
2
6,900792767
9
1,485727483
11
8,38652025

Regresin
Residuos
Total

Intercepcin
Variable X 1
Variable X 2

Promedio de los cuadrados


F
3,450396383 20,90125397
0,165080831

Coeficientes Error tpico Estadstico t Probabilidad


-3,372673 0,635996
-5,302976
0,000492
0,003617 0,000612
5,908318
0,000227
0,947599 0,360894
2,625696
0,027552

Valor crtico de
F
0,00041458

Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%


-4,811397
-1,933950
-4,811397
-1,933950
0,002232
0,005001
0,002232
0,005001
0,131199
1,763999
0,131199
1,763999

12.3 Se efectu un conjunto de ensayos experimentales para determinar una forma de predecir el tiempo de coccin y
a diferentes niveles de ancho del horno X1 y a temperaturas de la chimenea X2. Los siguientes son los datos registrados:
Estime la ecuacin de regresin lineal mltiple
Ux1,x2 = Bo + B1 X1 + B2 X2
y = 0.58 + 2.7122x1 + 2.0497x2

Estadsticas de la regresin
Coeficiente de correlacin mltiple 0,99986211
Coeficiente de determinacin R^2
0,99972424
R^2 ajustado
0,99964545
Error tpico
0,65697115
Observaciones
10

Y
6,4
15,05
18,75
30,25
44,85
48,94
51,55
61,5
100,44
111,42

X1
1,32
2,69
3,56
4,41
5,35
6,2
7,12
8,87
9,8
10,65

X2
1,15
3,4
4,1
8,75
14,82
15,15
15,32
18,18
35,19
40,4

ANLISIS DE VARIANZA
Grados de libertad
Suma de cuadrados Promedio de los cuadrados
F
Valor crtico de F
Regresin
2
10953,20257
5476,601286 12688,7407
3,4822E-13
Residuos
7
3,021277663
0,431611095
Total
9
10956,22385

Intercepcin
Variable X 1
Variable X 2

Coeficientes Error tpico


0,57998789 0,606853464
2,71223758 0,202086444
2,04970749 0,048081813

Estadstico t
0,955729726
13,42117522
42,62958013

Probabilidad
0,371041828
2,99026E-06
1,02001E-09

Inferior 95%
Superior 95% Inferior 95,0% Superior 95,0%
-0,854992523 2,014968313 -0,854992523
2,014968313
2,234379072 3,190096087 2,234379072
3,190096087
1,936012067 2,163402907 1,936012067
2,163402907

y = 0.58 + 2.7122x1 + 2.0497x2

50
30

40-50

20

30-40

10
0

111.42

100.44

61.5

51.55

48.94

44.85

30.25

18.75

15.05

20-30
6.4

X2

40

X1

10-20
0-10

También podría gustarte