P. 1
Ejemplos de Chi Cuadrado

Ejemplos de Chi Cuadrado

|Views: 994|Likes:
Publicado porJose Verdezoto

More info:

Published by: Jose Verdezoto on Dec 14, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as DOCX, PDF, TXT or read online from Scribd
See more
See less

08/15/2013

pdf

text

original

CHI CUADRADO

TEMA: REGRESIÓN Y CORRELACIÓN SIMPLE
32. Ajustar una recta de mínimos cuadrados a los datos de la tabla adjunta tomando
(a) X como variables independiente. (b) X como variable dependiente.
Representa los datos y las rectas de mínimos cuadrados en el mismo sistema de ejes coordenados.
Parte a:
X 3 5 6 8 9 11
y 2 3 4 6 5 8





ANÁLISIS DE VARIANZA


Grados de
libertad
Suma de
cuadrados
Promedio de
los cuadrados F
Valor crítico
de F
Regresión 1 21,4285714 21,42857143 45 0,002570261
Residuos 4 1,9047619 0,476190476

Total 5 23,3333333

Coeficientes Error típico Estadístico t Probabilidad Inferior 95%
Superior
95% Inferior 95,0% Superior 95,0%
Intercepción -0,333333 0,796819 -0,418330 0,697189 -2,545658 1,878991 -2,545658 1,878991
Variable X 1 0,714286 0,106479 6,708204 0,002570 0,418651 1,009920 0,418651 1,009920
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,958314847
Coeficiente de determinación R^2 0,918367347
R^2 ajustado 0,897959184
Error típico 0,690065559
Observaciones 6
y = 0.7143x - 0.3333
R² = 0.9184
0
1
2
3
4
5
6
7
8
9
0 5 10 15
Y

X
Parte b:





ANÁLISIS DE VARIANZA


Grados de
libertad
Suma de
cuadrados
Promedio de
los cuadrados F
Valor crítico
de F
Regresión 1 38,57142857 38,57142857 45 0,002570261
Residuos 4 3,428571429 0,857142857

Total 5 42

Coeficientes Error típico Estadístico t Probabilidad Inferior 95%
Superior
95% Inferior 95,0%
Superior
95,0%
Intercepción 1,0000000 0,9710083 1,0298573 0,3612731 -1,6959513 3,6959513 -1,6959513 3,6959513
Variable X 1 1,2857143 0,1916630 6,7082039 0,0025703 0,7535726 1,8178560 0,7535726 1,8178560

33. Para los datos del problema anterior, hallar, (a) los valores de Y para X=5 y X=12, (b) el valor de X para Y=7.
(a) Y= - 0,333 + 0,714X (b) X = 1 + 1,285Y
Si X = 5 Y = 3,24 Si Y = 7 X = 10
Si X = 12 Y = 8,24

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,958314847
Coeficiente de determinación R^2 0,918367347
R^2 ajustado 0,897959184
Error típico 0,9258201
Observaciones 6
y = 1.2857x + 1
R² = 0.9184
0
2
4
6
8
10
12
0 5 10
X

Y
34. (a) Mediante el método libre obtener la ecuación de una recta de ajuste de los datos del problema 32. (b) Contestar
al problema 33 mediante el resultado de (a).
Y = aX + b (3,2) (11,8) a = 0,75 b = -0,25 Y = 0,75X – 0,25
X= aY + b (3,2) (11,8) a = 1,333 b = 0,333 X = 1,333Y + 0,333
(b) Y= - 0,25 + 0,75X
Si X = 5 Y = 3,5
Si X = 12 Y = 8,75
X = 0,333 + 1,333Y
Si Y = 7 X = 9,664
35. La tabla siguiente muestra las puntuaciones finales de algebra y física de 10 estudiantes elegidos al azar entre un
gran número de ellos. (a) Representar los datos. (b) Hallar la recta de mínimos cuadrados que se ajuste a los datos,
tomando X como variable independiente. (c) igual que en (b), pero tomando Y como variable independiente. (d) Si un
estudiante tiene una puntuación de 75 en algebra, ¿Cuál es su puntuación en física esperada?. (e) Si un estudiante tiene
una puntuación de 95 en física, ¿Cuál es su puntuación en algebra esperada?.
a)
Algebra X 75 80 93 65 87 71 98 68 84 77
Física Y 82 78 86 72 91 80 95 72 89 74

b) Y = 29,13 + 0,661X


Estadísticas de la regresión
Coeficiente de correlación múltiple 0,872098413
Coeficiente de determinación R^2 0,760555642
R^2 ajustado 0,730625098
Error típico 4,233840246
Observaciones 10
c) X = - 14,39 + 1,15Y




d) Y = 29,13 + 0,661X Si X = 75 Y = 78,71
e) X = - 14,39 + 1,15Y Si Y = 95 X = 94,35

36. La siguiente tabla muestra el número de trabajadores agrícolas en Estados Unidos (en millones) durante los años 1949
– 1957. (a) Representar los datos. (b) Hallar una recta de mínimos cuadrados que se ajuste a esta serie de tiempo y
construir su grafico. (c) Calcular los valores de tendencia y comparar con los valores reales. (d) Estimar el número de
trabajadores agrícolas en 1948 y comparar con el valor real (10,36 millones). (e) Predecir el número de trabajadores
agrícolas en 1958 (el verdadero valor es (7,53 millones). Discutir las posibles fuentes de error en tal predicción.
Parte a:





Estadísticas de la regresión
Coeficiente de correlación múltiple 0,872098413
Coeficiente de determinación R^2 0,760555642
R^2 ajustado 0,730625098
Error típico 5,583516398
Observaciones 10
Año 1949 1950 1951 1952 1953 1954 1955 1956 1957
Número de
trabajadores
agrícolas en
millones
9,96 9,93 9,55 9,15 8,86 8,84 8,36 7,82 7,58
Parte b: Y = 618,859 - 0,312X
Parte c:










Parte d: Y = 618,859 - 0,312X
Si X = 1948 Y = 11,083 mayor que el valor real (10,36 millones).
Parte e: Y = 618,859 - 0,312X
Si X = 1958 Y = 7,963 mayor que el valor real (7,53 millones).

X (Años) Y (Calculado)
1949 10,771
1950 10,459
1951 10,147
1952 9,835
1953 9,523
1954 9,211
1955 8,899
1956 8,587
1957 8,275
y = -0.3123x + 618.86
R² = 0.9867
0
2
4
6
8
10
12
1948 1950 1952 1954 1956 1958
Número de trabajadores en
millones
# de trabajadores (en
millones)
Linear (# de
trabajadores (en
millones))
37. El índice de coste al usuario por el cuidado médico en Estados Unidos viene dado por la tabal adjunta para los años
1950 – 1957(Al periodo de referencia o periodo base 1947 – 1949 se le asigno el valor 100, el cual realmente significa el
1000 por ciento. El índice para 1952, por ejemplo, es 117.2 y muestra que durante 1952 el promedio del precio del
cuidado médico fue 117,2% del que rigió en el periodo base, es decir, se incremento en un 17,2%. a) representar los
datos. b) Hallar la recta de mínimos cuadrados que se adjunte a los datos y construir su grafico. c) Calcular los valores de
tendencia y comparar con los valores reales. d) Predecir el índice de costo para el cuidado médico durante 1958 y
comparar con el valor verdadero (144,4). e) ¿En qué año se puede esperar que el índice de consto medico sea el doble
de 1947 – 1949 suponiendo que la tendencia se mantiene?
Parte a:
Año 1950 1951 1952 1953 1954 1955 1956 1957
Índice de coste al
usuario por el cuidado
médico (1947–1949 =
100)
106,0 111,1 117,2 121,3 125,2 128,0 132,6 138,0

Parte b:
Y = 4,3786x - 8431,1


y = 4.3786x - 8431.1
R² = 0.9923
0
20
40
60
80
100
120
140
160
1948 1950 1952 1954 1956 1958
Series1
Linear (Series1)
Linear (Series1)
Parte c: Parte d: Y = 4,378X – 8431, 1142
Durante x = 1958
Y = 4,378*(1958)-8431,1142
Y = 141,0098 Valor generado Valor Real 144,4
r
2
= 0,992
r = 0,997 >= 0,8

Parte e: Y = 4,378X – 8431, 1142
200 = 4,378*X – 8431, 1142
X = 1971 En este año la tendencia seria el doble.
38) Ajustar una parábola de mínimos cuadrados,

a los datos de la tabla adjunta.
X 0 1 2 3 4 5 6
Y 2,4 2,1 3,2 5,6 9,3 14,6 21,9

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,92922863
Coeficiente de determinación R^2 0,86346584
R^2 ajustado 0,83615901
Error típico 3,01121712
Observaciones 7


x y calculado
1950 105,98571
1951 110,36371
1952 114,74171
1953 119,11971
1954 123,49771
1955 127,87571
1956 132,25371
1957 136,63171
ANÁLISIS DE VARIANZA

Grados de libertad Suma de cuadrados Promedio de los cuadrados F
Valor crítico de
F
Regresión 1 286,72 286,72 31,6208722 0,002462807
Residuos 5 45,33714286 9,067428571

Total 6 332,0571429

Coeficientes Error típico Estadístico t Probabilidad Inferior 95%
Superior
95% Inferior 95,0%
Superior
95,0%
Intercepción -1,1571429 2,0517986 -0,5639651 0,5971341 -6,4314591 4,1171734 -6,4314591 4,1171734
Variable X 1 3,2000000 0,5690665 5,6232439 0,0024628 1,7371679 4,6628321 1,7371679 4,6628321











y = 0.7333x
2
- 1.2x + 2.5095
R² = 0.9995
-5
0
5
10
15
20
25
0 2 4 6 8
39. El tiempo total necesario para detener un automóvil después de percibir un peligro se compone del tiempo de
reacción (tiempo entre el conocimiento del peligro y la aplicación del freno) mas el tiempo de frenado (tiempo para
detener el vehículo después de aplicar el frenado). La tabla adjunta de las distancias D parada (en pies) de un
automóvil que marcha a las velocidades V (millas por hora) desde el instante en que se observa el peligro.
a) Representar los datos. b) Ajustar una parábola de mínimos cuadrados de la forma D = a0 +a1V + a2V2 a los datos.
c) Estimar D cuando V= 45 millas/h. y 80 millas/h Parte a:
Velocidad V
(millas/h)
20 30 40 50 60 70
Distancia de
parada D
(pies)
54 90 138 206 292 396






0
50
100
150
200
250
300
350
400
450
0 20 40 60 80

D
i
s
t
a
n
c
i
a

d
e

p
a
r
a
d
a

D

(
p
i
e
s
)


Velocidad V (millas/h)
Parte b: Y=a
0
+a
1
x+ a
2
x
2

D = 41,77-1,095V+ 0,087V
2
Parte c: Estimar D
V= 45 millas/h V= 80 millas/h
D = 41,77-1,095(45)+ 0,087(45)
2
D = 41,77-1,095(45)+ 0,087(45)
2

D = 170 pies D = 516 pies
r = 0,999 >= 0,8
40) La tabla adjunta muestra la natalidad por cada 1000 individuos en Estados Unidos durante los años 1915-1955 con
intervalo de 5 años.
a) Representar los datos.
b) Hallar la parábola de mínimos cuadrados que se ajuste a los datos.
c) Calcular los valores de tendencia y compararlos con los reales.
AÑO 1915 1920 1925 1930 1935 1940 1945 1950 1955
NATALIDAD
POR CADA
1000
HABITANTES
25,0 23,7 21,3 18,9 16,9 17,9 19,5 23,6 24,6


Estadísticas de la regresión
Coeficiente de correlación múltiple 0,09654932
Coeficiente de determinación R^2 0,00932177
R^2 ajustado -0,13220369
Error típico 3,26968398
Observaciones 9
ANÁLISIS DE VARIANZA

Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 1 0,704166667 0,704166667 0,0658664 0,804832834
Residuos 7 74,83583333 10,69083333

Total 8 75,54

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0%
Superior
95,0%
Intercepción 63,1916667 163,3619034 0,3868201 0,7103799 -323,0978519 449,4811852 -323,0978519 449,4811852
Variable X 1 -0,0216667 0,0844229 -0,2566445 0,8048328 -0,2212950 0,1779617 -0,2212950 0,1779617


y = 0.0186x
2
- 72.044x + 69742
R² = 0.8919
0
5
10
15
20
25
30
1900 1920 1940 1960
Series1
Poly.
(Series1)
x Y calculado
1915 -11,875
1920 -15,44
1925 -18,075
1930 -19,78
1935 -20,555
1940 -20,4
1945 -19,315
1950 -17,3
1955 -14,355
41. El numero Y de bacterias por unidad de volumen presentes en un cultivo después de X horas esta dado en la tabla
adjunta. a) Representar los datos en un papel grafico semi-logaritmico, donde la escala logarítmica se utiliza para Y y la
escala aritmética para X. b) Ajustar una curva de mínimo cuadrados de la forma Y = abx a los datos y explicar porque
esta ecuación particular da buenos resultados. c) Comprara los valores Y obtenidos de esta ecuación con los valores
reales. d) Estimar el valor de Y cuando X=7.
Parte a:
Número de horas
( X)
0 1 2 3 4 5 6
Numero de
bacterias por
unidad de
volúmenes (Y)
32 47 65 92 132 190 275



0
20
40
60
80
100
120
140
160
1948 1950 1952 1954 1956 1958
Í
n
d
i
c
e

d
e

c
o
s
t
e

a
l

u
s
u
a
r
i
o

p
o
r

e
l

c
u
i
d
a
d
o

m
é
d
i
c
o


Año
Y
Parte c:
x y calculado
0 32,147
1 87,375546
2 237,486734
3 645,488943
4 1754,43895
5 4768,56506
6 12960,9598

Parte d: 35227,88882


12.2 En Applied Spectroscopy se estudian las propiedades de reflectancia infrarroja de un líquido viscoso utilizando en
la industria electrónica como lubricante. El experimento que se diseño consistió en el efecto de frecuencia de banda X1
y el espesor de película X2 sobre la densidad óptica y usando un espectroscopio infrarrojo Perkin-Elmer modelo 621.
[Fuente: Pachansky, J., England, C.D.. y Wattman, R. “Infrarred sprectoscopis studies of poly (perfrouropropylenexide) on
gold substrate. A classical dispersion analysis for the refractive index.” Applied Spectroscopy, vol. 40, num. 1, enero de
1986,p. 9, table 1.]










y = −3.3727 + 0.0036x1 + 0.9476x2.


Y X1 X2
0,231 740 1,10
0,107 740 0,62
0,053 740 0,31
0,129 805 1,10
0,069 805 0,62
0,030 805 0,31
1,005 980 1,10
0,559 980 0,62
0,321 980 0,31
2,948 1235 1,10
1,633 1235 0,62
0,934 1235 0,31
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,90710716
Coeficiente de determinación R^2 0,82284339
R^2 ajustado 0,78347526
Error típico 0,4063014
Observaciones 12
X1
0
500
1000
1500
X
2

Y
1000-1500
500-1000
0-500

ANÁLISIS DE VARIANZA

Grados de libertad Suma de cuadrados Promedio de los cuadrados F
Valor crítico de
F
Regresión 2 6,900792767 3,450396383 20,90125397 0,00041458
Residuos 9 1,485727483 0,165080831

Total 11 8,38652025

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción -3,372673 0,635996 -5,302976 0,000492 -4,811397 -1,933950 -4,811397 -1,933950
Variable X 1 0,003617 0,000612 5,908318 0,000227 0,002232 0,005001 0,002232 0,005001
Variable X 2 0,947599 0,360894 2,625696 0,027552 0,131199 1,763999 0,131199 1,763999

12.3 Se efectuó un conjunto de ensayos experimentales para determinar una forma de predecir el tiempo de cocción y
a diferentes niveles de ancho del horno X1 y a temperaturas de la chimenea X2. Los siguientes son los datos registrados:
Estime la ecuación de regresión lineal múltiple
U
x1,x2
= B
o
+ B
1
X
1
+ B
2
X
2

y = 0.58 + 2.7122x1 + 2.0497x2

Estadísticas de la regresión
Coeficiente de correlación múltiple 0,99986211
Coeficiente de determinación R^2 0,99972424
R^2 ajustado 0,99964545
Error típico 0,65697115
Observaciones 10

Y X1 X2
6,4 1,32 1,15
15,05 2,69 3,4
18,75 3,56 4,1
30,25 4,41 8,75
44,85 5,35 14,82
48,94 6,2 15,15
51,55 7,12 15,32
61,5 8,87 18,18
100,44 9,8 35,19
111,42 10,65 40,4

ANÁLISIS DE VARIANZA

Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 2 10953,20257 5476,601286 12688,7407 3,4822E-13
Residuos 7 3,021277663 0,431611095

Total 9 10956,22385

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción 0,57998789 0,606853464 0,955729726 0,371041828 -0,854992523 2,014968313 -0,854992523 2,014968313
Variable X 1 2,71223758 0,202086444 13,42117522 2,99026E-06 2,234379072 3,190096087 2,234379072 3,190096087
Variable X 2 2,04970749 0,048081813 42,62958013 1,02001E-09 1,936012067 2,163402907 1,936012067 2,163402907

y = 0.58 + 2.7122x1 + 2.0497x2






X1
0
10
20
30
40
50
6
.
4
1
5
.
0
5
1
8
.
7
5
3
0
.
2
5
4
4
.
8
5
4
8
.
9
4
5
1
.
5
5
6
1
.
5
1
0
0
.
4
4
1
1
1
.
4
2
X
2

Y
40-50
30-40
20-30
10-20
0-10

(b) el valor de X para Y=7.002570261 Regresión Residuos Total Intercepción Variable X 1 Coeficientes 1.24 Y = 8.0.9258201 Observaciones 6 ANÁLISIS DE VARIANZA Grados de Suma de libertad cuadrados 1 38. (a) los valores de Y para X=5 y X=12.0000000 1.9184 Estadísticas de la regresión Coeficiente de correlación múltiple 0.3612731 6.7535726 Superior 95% Inferior 95.6959513 1.714X Y = 3.428571429 5 42 Promedio de los cuadrados 38. (a) Si X = 5 Si X = 12 Y= .7082039 0.Parte b: 12 10 8 6 4 2 0 0 5 Y 10 X y = 1.0025703 Inferior 95% -1.285Y Si Y = 7 X = 10 . Para los datos del problema anterior.857142857 F 45 Valor crítico de F 0.918367347 R^2 ajustado 0.24 (b) X = 1 + 1.9710083 0.7535726 Superior 95.0298573 0.897959184 Error típico 0.8178560 33.958314847 Coeficiente de determinación R^2 0.8178560 0.57142857 4 3. hallar.2857x + 1 R² = 0.333 + 0.6959513 1.57142857 0.0% 3.1916630 Estadístico t Probabilidad 1.2857143 Error típico 0.6959513 0.6959513 -1.0% 3.

You're Reading a Free Preview

Descarga
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->