CHI CUADRADO

TEMA: REGRESIÓN Y CORRELACIÓN SIMPLE
32. Ajustar una recta de mínimos cuadrados a los datos de la tabla adjunta tomando
(a) X como variables independiente.

(b) X como variable dependiente.

Representa los datos y las rectas de mínimos cuadrados en el mismo sistema de ejes coordenados.
Parte a:
X
y

3
2

Y

9
8

5
3

6
4

8
6

9
5

Estadísticas de la regresión
Coeficiente de correlación múltiple
0,958314847
Coeficiente de determinación R^2
0,918367347
R^2 ajustado
0,897959184
Error típico
0,690065559
Observaciones
6

y = 0.7143x - 0.3333
R² = 0.9184

7
6
5

11
8

4
3
2
1
0

ANÁLISIS DE VARIANZA

0

5

10
X

Intercepción
Variable X 1

15

Regresión
Residuos
Total

Coeficientes Error típico Estadístico t
-0,333333
0,796819
-0,418330
0,714286
0,106479
6,708204

Grados de
Suma de
Promedio de
libertad
cuadrados los cuadrados
1 21,4285714 21,42857143
4 1,9047619 0,476190476
5 23,3333333

Probabilidad Inferior 95%
0,697189
-2,545658
0,002570
0,418651

F
45

Valor crítico
de F
0,002570261

Superior
95%
Inferior 95,0% Superior 95,0%
1,878991
-2,545658
1,878991
1,009920
0,418651
1,009920

57142857 4 3.9258201 Observaciones 6 y = 1.6959513 1.7535726 Promedio de los cuadrados 38.9710083 0.0025703 Inferior 95% -1. Para los datos del problema anterior.0% 3.2857143 Error típico 0.428571429 5 42 Estadístico t Probabilidad 1.1916630 Grados de Suma de libertad cuadrados 1 38.Parte b: 12 Estadísticas de la regresión Coeficiente de correlación múltiple 0.6959513 0.958314847 Coeficiente de determinación R^2 0.7082039 0.002570261 Superior 95.0298573 0.333 + 0.6959513 -1.57142857 0.6959513 1.714X Si X = 5 Y = 3.7535726 Valor crítico de F 0.24 Si X = 12 Y = 8. (a) Y= .897959184 Error típico 0. (a) los valores de Y para X=5 y X=12.0.24 (b) X = 1 + 1.3612731 6.2857x + 1 R² = 0. (b) el valor de X para Y=7.0000000 1.8178560 0.918367347 R^2 ajustado 0.9184 10 8 X 6 4 2 ANÁLISIS DE VARIANZA 0 0 5 10 Y Regresión Residuos Total Intercepción Variable X 1 Coeficientes 1. hallar.857142857 F 45 Superior 95% Inferior 95.8178560 33.0% 3.285Y Si Y = 7 X = 10 .

333Y + 0. (d) Si un estudiante tiene una puntuación de 75 en algebra. La tabla siguiente muestra las puntuaciones finales de algebra y física de 10 estudiantes elegidos al azar entre un gran número de ellos. tomando X como variable independiente.75 b = -0. a) Algebra X Física Y b) Y = 29.233840246 Observaciones 10 68 72 84 89 77 74 .333 + 1.333Y Si Y = 7 X = 9. Y = aX + b (3. (e) Si un estudiante tiene una puntuación de 95 en física. (b) Hallar la recta de mínimos cuadrados que se ajuste a los datos.333 (b) Y= .75X – 0.8) a = 0.760555642 R^2 ajustado 0. (a) Representar los datos.333 X = 1. (b) Contestar al problema 33 mediante el resultado de (a).730625098 Error típico 4. ¿Cuál es su puntuación en algebra esperada?.75X Si X = 5 Y = 3.0.2) (11.25 + 0.2) (11.8) a = 1. (c) igual que en (b).333 b = 0. pero tomando Y como variable independiente.5 Si X = 12 Y = 8.661X 75 82 80 78 93 86 65 72 87 91 71 80 98 95 Estadísticas de la regresión Coeficiente de correlación múltiple 0.872098413 Coeficiente de determinación R^2 0.75 X = 0.664 35.13 + 0.25 Y = 0.34. ¿Cuál es su puntuación en física esperada?.25 X= aY + b (3. (a) Mediante el método libre obtener la ecuación de una recta de ajuste de los datos del problema 32.

Parte a: Año Número de trabajadores agrícolas en millones 1949 1950 1951 1952 1953 1954 1955 1956 1957 9.36 7.15Y Estadísticas de la regresión Coeficiente de correlación múltiple Coeficiente de determinación R^2 R^2 ajustado Error típico Observaciones d) Y = 29.14.39 + 1.82 7.55 9. (a) Representar los datos.39 + 1. (d) Estimar el número de trabajadores agrícolas en 1948 y comparar con el valor real (10.14.583516398 10 36.53 millones). (c) Calcular los valores de tendencia y comparar con los valores reales.13 + 0. (b) Hallar una recta de mínimos cuadrados que se ajuste a esta serie de tiempo y construir su grafico.872098413 0.93 9.36 millones). (e) Predecir el número de trabajadores agrícolas en 1958 (el verdadero valor es (7.c) X = .86 8.96 9. Discutir las posibles fuentes de error en tal predicción.760555642 0.15 8.71 e) X = .35 0.730625098 5. La siguiente tabla muestra el número de trabajadores agrícolas en Estados Unidos (en millones) durante los años 1949 – 1957.15Y Si Y = 95 X = 94.661X Si X = 75 Y = 78.84 8.58 .

Y = 618.859 .312X Parte c: Número de trabajadores en millones 12 10 # de trabajadores (en millones) y = -0.312X X = 1958 Y = 7.771 10.0.275 .963 mayor que el valor real (7.36 millones).523 9.0.0.899 8.835 9. X (Años) 1949 1950 1951 1952 1953 1954 1955 1956 1957 Y (Calculado) 10.9867 8 6 Linear (# de trabajadores (en millones)) 4 2 0 1948 Parte d: Si Parte e: Si 1950 1952 1954 1956 1958 Y = 618.459 10.147 9.86 R² = 0.587 8.53 millones).083 mayor que el valor real (10.859 .312X X = 1948 Y = 11.Parte b: Y = 618.3123x + 618.211 8.859 .

2 1953 121. El índice para 1952.2 1955 128.1 1950 106.4).3786x . el cual realmente significa el 1000 por ciento.3786x .9923 80 Series1 Linear (Series1) 60 Linear (Series1) 40 20 0 1948 1950 1952 1954 1956 1958 1957 138. d) Predecir el índice de costo para el cuidado médico durante 1958 y comparar con el valor verdadero (144.6 160 140 120 100 y = 4.37.2%.0 1951 111.8431.2% del que rigió en el periodo base.0 1956 132. es decir. e) ¿En qué año se puede esperar que el índice de consto medico sea el doble de 1947 – 1949 suponiendo que la tendencia se mantiene? Parte a: Año Índice de coste al usuario por el cuidado médico (1947–1949 = 100) Parte b: Y = 4.2 y muestra que durante 1952 el promedio del precio del cuidado médico fue 117. por ejemplo. c) Calcular los valores de tendencia y comparar con los valores reales. es 117. El índice de coste al usuario por el cuidado médico en Estados Unidos viene dado por la tabal adjunta para los años 1950 – 1957(Al periodo de referencia o periodo base 1947 – 1949 se le asigno el valor 100. se incremento en un 17.0 . b) Hallar la recta de mínimos cuadrados que se adjunte a los datos y construir su grafico.3 1954 125. a) representar los datos.1 1952 117.8431.1 R² = 0.

86346584 R^2 ajustado 0.6 Estadísticas de la regresión Coeficiente de correlación múltiple 0.25371 136.98571 110.Parte c: x 1950 1951 1952 1953 1954 1955 1956 1957 Parte d: y calculado 105.8 Y = 4.6 6 21.36371 114.0098 Valor generado r2 = 0.378X – 8431.378*X – 8431.63171 Parte e: Y = 4.992 r = 0. 1142 Durante x = 1958 Y = 4. 1142 200 = 4. 38) Ajustar una parábola de mínimos cuadrados.9 Valor Real 144.92922863 Coeficiente de determinación R^2 0.378*(1958)-8431. 4 9.4 1 2.11971 123.1142 Y = 141. 1142 X = 1971 En este año la tendencia seria el doble. X Y 0 2.49771 127.2 3 5.74171 119.1 2 3.378X – 8431.3 5 14.83615901 Error típico 3.4 .01121712 Observaciones 7 a los datos de la tabla adjunta.87571 132.997 >= 0.

4314591 0.7371679 Superior 95.1171734 4.0517986 0.0024628 1.72 286.7333x2 .1571429 3.7371679 Superior 95% Inferior 95.6208722 0.6628321 .72 31.0% 4.5639651 5.2x + 2.4314591 4.6628321 1.33714286 9.ANÁLISIS DE VARIANZA Valor crítico de Grados de libertad Suma de cuadrados Promedio de los cuadrados F F 1 286.002462807 5 45.5971341 -6.6232439 25 y = 0.1171734 -6.1.5095 R² = 0.0571429 Regresión Residuos Total Intercepción Variable X 1 Coeficientes -1.0% 4.9995 20 15 10 5 0 0 -5 2 4 6 8 Probabilidad Inferior 95% 0.067428571 6 332.5690665 Estadístico t -0.2000000 Error típico 2.

b) Ajustar una parábola de mínimos cuadrados de la forma D = a0 +a1V + a2V2 a los datos. y 80 millas/h Velocidad V (millas/h) Distancia de parada D (pies) Parte a: 20 30 40 50 60 70 54 90 138 206 292 396 Distancia de parada D (pies) 450 400 350 300 250 200 150 100 50 0 0 20 40 Velocidad V (millas/h) 60 80 .39. c) Estimar D cuando V= 45 millas/h. El tiempo total necesario para detener un automóvil después de percibir un peligro se compone del tiempo de reacción (tiempo entre el conocimiento del peligro y la aplicación del freno) mas el tiempo de frenado (tiempo para detener el vehículo después de aplicar el frenado). La tabla adjunta de las distancias D parada (en pies) de un automóvil que marcha a las velocidades V (millas por hora) desde el instante en que se observa el peligro. a) Representar los datos.

b) Hallar la parábola de mínimos cuadrados que se ajuste a los datos.087(45)2 D = 41.6 .9 1945 19.999 >= 0.77-1.9 Estadísticas de la regresión Coeficiente de correlación múltiple 0.3 1930 18.77-1.Parte b: Y=a0+a1x+ a2x2 D = 41.9 1940 17.6 1955 24.8 40) La tabla adjunta muestra la natalidad por cada 1000 individuos en Estados Unidos durante los años 1915-1955 con intervalo de 5 años.26968398 Observaciones 9 1935 16.095(45)+ 0. AÑO 1915 NATALIDAD 25. a) Representar los datos.095(45)+ 0.77-1.7 1925 21.13220369 Error típico 3.087(45)2 D = 170 pies D = 516 pies r = 0.09654932 Coeficiente de determinación R^2 0.5 1950 23. c) Calcular los valores de tendencia y compararlos con los reales.087V2 Parte c: Estimar D V= 45 millas/h V= 80 millas/h D = 41.0 POR CADA 1000 HABITANTES 1920 23.00932177 R^2 ajustado -0.095V+ 0.

4811852 0.54 Intercepción Variable X 1 Coeficientes 63.4811852 -323.83583333 10.704166667 0.044x + 69742 25 R² = 0.1779617 . (Series1) 10 5 0 1900 1920 1940 1960 1915 1920 1925 1930 1935 1940 1945 1950 1955 Y calculado -11.8919 20 Series1 15 Poly.0978519 -0.704166667 0.0658664 0.0978519 449.0% 449.1779617 -0.69083333 Total 8 75.ANÁLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F Regresión 1 0.3 -14.0844229 Estadístico t Probabilidad 0.2212950 30 x y = 0.075 -19.72.0186x2 .2212950 0.1916667 -0.2566445 0.3868201 0.0% -323.804832834 Residuos 7 74.3619034 0.0216667 Error típico 163.4 -19.875 -15.8048328 Inferior 95% Superior 95% Inferior 95.555 -20.44 -18.315 -17.7103799 -0.355 Superior 95.78 -20.

donde la escala logarítmica se utiliza para Y y la escala aritmética para X. Parte a: Número de horas ( X) Numero de bacterias por unidad de volúmenes (Y) 0 1 2 3 4 5 6 32 47 65 92 132 190 275 Índice de coste al usuario por el cuidado médico 160 140 120 100 80 60 Y 40 20 0 1948 1950 1952 1954 Año 1956 1958 . d) Estimar el valor de Y cuando X=7.41. b) Ajustar una curva de mínimo cuadrados de la forma Y = abx a los datos y explicar porque esta ecuación particular da buenos resultados. a) Representar los datos en un papel grafico semi-logaritmico. c) Comprara los valores Y obtenidos de esta ecuación con los valores reales. El numero Y de bacterias por unidad de volumen presentes en un cultivo después de X horas esta dado en la tabla adjunta.

147 87.488943 1754.375546 237.9598 Parte d: 35227.43895 4768.486734 645.Parte c: x 0 1 2 3 4 5 6 y calculado 32.56506 12960.88882 .

005 0.D.069 0. England.62 0.934 1000 500 1000-1500 0 500-1000 X1 y = −3.3727 + 0.78347526 Error típico 0.2 En Applied Spectroscopy se estudian las propiedades de reflectancia infrarroja de un líquido viscoso utilizando en la industria electrónica como lubricante.82284339 R^2 ajustado 0.] X1 740 740 740 805 805 805 980 980 980 1235 1235 1235 X2 1.31 1.107 0.559 0. A classical dispersion analysis for the refractive index.31 Estadísticas de la regresión Coeficiente de correlación múltiple 0.9476x2.31 1. Y 0-500 . y Wattman.62 0..321 2.10 0.633 0. J.p.10 0.948 1.10 0.90710716 Coeficiente de determinación R^2 0. num.053 0..62 0. 1. vol.030 1. table 1. 40.31 1.” Applied Spectroscopy. enero de 1986.0036x1 + 0.129 0.12. R.10 0. El experimento que se diseño consistió en el efecto de frecuencia de banda X1 y el espesor de película X2 sobre la densidad óptica y usando un espectroscopio infrarrojo Perkin-Elmer modelo 621.231 0. [Fuente: Pachansky. “Infrarred sprectoscopis studies of poly (perfrouropropylenexide) on gold substrate. 9. C.4063014 Observaciones 12 1500 X2 Y 0.62 0.

65697115 Observaciones 10 Y 6.947599 0.55 61.99972424 R^2 ajustado 0.19 40.65 X2 1.4 4.763999 0.165080831 Coeficientes Error típico Estadístico t Probabilidad -3.131199 1.131199 1.38652025 Regresión Residuos Total Intercepción Variable X 1 Variable X 2 Promedio de los cuadrados F 3.32 18.002232 0.12 8.05 18.44 111.360894 2.1 8.69 3.56 4.32 2.002232 0.027552 Valor crítico de F 0.15 3.99986211 Coeficiente de determinación R^2 0.000612 5.933950 0.302976 0.90125397 0.15 15.372673 0.005001 0.82 15.933950 -4.005001 0.8 10.908318 0.ANÁLISIS DE VARIANZA Grados de libertad Suma de cuadrados 2 6.003617 0.41 5.75 14.0497x2 Estadísticas de la regresión Coeficiente de correlación múltiple 0.763999 12. Los siguientes son los datos registrados: Estime la ecuación de regresión lineal múltiple Ux1.900792767 9 1.x2 = Bo + B1 X1 + B2 X2 y = 0.35 6.42 X1 1.625696 0.811397 -1.85 48.4 .75 30.811397 -1.450396383 20.25 44.7122x1 + 2.0% -4.485727483 11 8.4 15.000227 0.58 + 2.87 9.2 7.000492 0.99964545 Error típico 0.0% Superior 95.94 51.00041458 Inferior 95% Superior 95% Inferior 95.5 100.635996 -5.18 35.3 Se efectuó un conjunto de ensayos experimentales para determinar una forma de predecir el tiempo de cocción y a diferentes niveles de ancho del horno X1 y a temperaturas de la chimenea X2.

936012067 2.048081813 Estadístico t 0.75 15.7407 3.936012067 2.57998789 0.7122x1 + 2.44 61.202086444 2.955729726 13.58 + 2.94 44.04970749 0.431611095 Total 9 10956.71223758 0.5 51.234379072 3.190096087 2.42117522 42.601286 12688.0% -0.99026E-06 1.371041828 2.0% Superior 95.4822E-13 Residuos 7 3.014968313 -0.25 18.854992523 2.014968313 2.0497x2 50 30 40-50 20 30-40 10 0 Y 111.55 48.234379072 3.20257 5476.021277663 0.85 30.62958013 Probabilidad 0.606853464 2.05 20-30 6.854992523 2.190096087 1.163402907 y = 0.4 X2 40 X1 10-20 0-10 .42 100.ANÁLISIS DE VARIANZA Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F Regresión 2 10953.163402907 1.02001E-09 Inferior 95% Superior 95% Inferior 95.22385 Intercepción Variable X 1 Variable X 2 Coeficientes Error típico 0.

147 87.37554 6 237.88882 x 0 1 2 3 4 5 6 Parte d: .4889 43 1754.Parte c: y calculad o 32.438 95 4768.95 98 35227.565 06 12960.4867 34 645.

Sign up to vote on this title
UsefulNot useful