Está en la página 1de 5

Material de trabajo (Estadística aplicada)

Práctica de Estadística Aplicada - N° 9


Análisis de correlación y regresión lineal simple
Sección : ………………………..………………... Apellidos : ………………………..……………….
Nombres : …………………………………………….
Docente : Escribir el nombre del docente Fecha : .…../……/20 Duración: 45 minutos
Tipo de Práctica: Individual ( ) Grupal (X)

Instrucciones: Responda a cada una de las preguntas de acuerdo a lo solicitado

Análisis de Correlación Lineal Simple


Cantidad de
Velocidad Coef. Vida (horas)
1. La tabla muestra las Aditivo
(cm/s) (mm2/s)
mediciones de la velocidad 90 0,35 0 2
del aire y el coeficiente de 100 0,37 1 4
evaporación de gotas de 140 0,78 2 3
combustible quemado en un 180 0,70 3 7
motor de impulso, realizado a 220 0,75 4 9
9 vehículos. 260 1,18
a) Grafique e interprete. 300 1,32 a) Determine si existe correlación.
b) Determine si existe 340 1,45 b) Pruebe que ρ>0, para α=0,01
correlación lineal entre las 380 1,65 c) Pruebe que ρ=0,90 para α=0,02
variables. Determine un intervalo de confianza para ρ
c) Determina un intervalo de confianza para ρ.
5. Los siguientes datos son los precios
2. Se realizó un estudio sobre la Años Dólares
Temp. Azúcar de venta y de cierta marca y
cantidad de azúcar 1 6250
x y modelo de automóvil usado x años.
transformada en cierto proceso 2 5695
1,0 8,1
a varias temperaturas. Los datos a) Realice un análisis de 3 5650
1,1 7,8 correlación al α=0,01 4 5395
se recolectan y se registran
como sigue: 1,2 8,5 b) Determine un intervalo de 5 4985
1,3 9,8 confianza para ρ. 6 4900
a) Grafique, calcule r e
1,4 9,5
interprete. 6. Los siguientes datos se Presión Lectura en
b) Determine si existe 1,5 8,9 reunieron para determinar (lb/pulg2) (x) la escala (y)
correlación lineal entre las 1,6 8,6 la relación entre presión y la 10 13
variables. 1,7 10,2 correspondiente lectura en
10 18
c) Determine un intervalo de 1,8 9,3 la escala con el propósito de
10 16
confianza para ρ. 1,9 9,2 calibración.
10 15
a) Grafique, calcule r e 10 20
3. Un estudio de la cantidad de Interprete. 50 86
precipitación pluvial y la Partículas b) Pruebe si existe 50 90
Precipitación eliminadas
cantidad de contaminación correlación. α=0,01 50 88
eliminada del aire produce (0,01 cm) 3
c) Determine un intervalo
(mcg/m ) 50 88
los datos que se presentan de confianza para ρ. 50 92
4,3 126
en la tabla.
4,5 121
a) Grafique, calcule r e 5,9 116
Interprete. 6,1 114 7. Las cantidades de un compuesto químico y, que se disuelve en
b) Pruebe si existe 5,2 118 100 gramos de agua a varias gramos
oC (x)
correlación lineal. 3,8 132 temperaturas, se registran como (y)
c) Determine un intervalo 2,1 141 sigue: 0 7
de confianza para ρ. 7,5 108 a) Grafique, calcule r e Interprete. 15 13
30 22
b) Determine si existe correlación 45 33
lineal entre las variables. 60 39
4. Un ingeniero descubrió que, al incluir pequeñas cantidades de c) Determine un intervalo de 75 47
un compuesto en baterías recargables para computadoras confianza para ρ.
portátiles, podría extender su tiempo de vida. Experimentó con
diferentes cantidades del aditivo y los datos fueron 8. Una compañía de sustancias químicas, que busca estudiar el
efecto del tiempo de extracción sobre la eficiencia de una
Material de trabajo (Estadística aplicada)

operación de extracción, obtuvo los datos que se presentan en ancho del intervalo del inciso a)? Responda sin calcular
la tabla siguiente: este nuevo intervalo.
Tiempo (Min)
27 45 41 19 35 11. La Bradford Electric Illuminating Company estudia la relación
x
entre kilowatts-hora (miles) usados y el número de habitaciones
Eficiencia (%)
57 64 80 46 62 en una residencia privada familiar. Una muestra aleatoria de 10
y
casas reveló lo siguiente.

Tiempo (Min) KW/Hr (miles) 9 7 10 5 8


39 19 49 15 31
x N° de habitaciones 12 9 14 6 10
Eficiencia (%)
72 52 77 57 68
y KW/Hr (miles) 6 8 10 4 7
N° de habitaciones 8 10 10 5 7
a) Determine si existe correlación.
b) Pruebe que ρ=0,64 a) Determine la ecuación de regresión.
c) Determine un intervalo de confianza para ρ b) Encuentre el número de kilowatts-hora, en miles, para
una casa de seis habitaciones al 98%.
9. Un estudio para valorar la capacidad de sistemas de c) Cuál es la bondad de ajuste del modelo
humedecimiento de suelos mediante flujo subsuperficial para
eliminar la demanda de oxígeno bioquímico (BOD, por sus siglas 12. Se investiga la relación entre el precio de la tonelada de trigo y
en inglés) y varios otros constituyentes químicos dio los datos las cantidades producidas en los últimos años:
adjuntos sobre x carga masiva de BOD (kg/ha/d) y y eliminación
Precio
masiva de BOD (kg/ha/d) (“Subsurface Flow Wetlands-A 0.89 1.65 1.56 2 1.89
Performance Evaluation”, Water Envir. Res., 1995. 244-247). (US$/TN)
Cantidad
700 500 350 1400 400
x 3 8 10 11 13 16 27 (miles TN)
y 4 7 8 8 10 11 16
Precio
2.33 5.36 7.86 9.23
x 30 35 37 38 44 103 142 (US$/TN)
Cantidad
y 26 21 9 31 30 75 90 1500 150 90 40
(miles TN)
a) Construya gráficas de caja tanto de carga masiva como
a. ¿Cuál será el nivel de producción de trigo si el precio por
de eliminación masiva y comente sobre cualquier
tonelada es 1,93 US$/TN?
característica interesante.
b. ¿Cuál será el precio por tonelada si se ha producido
b) Construya una gráfica de puntos de los datos y comente
800mil TN?
sobre cualquier característica importante.
c) Si es posible pruebe si existe correlación lineal entre las 13. Mike Godfrey, auditor de un sistema escolarizado de educación
variables.
pública, ha revisado los registros de inventario para determinar
si las existencias reales de libros de texto son típicas. Las
10. El artículo “The Incorporation of Uranium and Silver by
cantidades de inventario siguientes corresponden a los cinco
Hydrothermally Synthesized Galena” (Econ. Geology, 1964:
años anteriores:
1003-1024) reporta sobre la determinación de contenido de
plata de cristales de galena desarrollados en un sistema Año 2001 2002 2003 2004 2005
hidrotérmico cerrado dentro de un rango de temperatura. Con Inventario $4,620 $4,910 $5,490 $5,730 $5,990
temperatura de cristalización en °C y Ag2S en mol%, los datos (miles US$)
son los siguientes:
a) Encuentre la ecuación lineal que describa la
Temp. °C 398 292 352 575 568 450 550 tendencia en las existencias de inventario.
Ag2S b) Estime para el auditor el valor del inventario para el
0.15 0.05 0.23 0.43 0.23 0.40 0.44 año 2006
mol%
14. Richard Jackson desarrolló un ratón para computadora
ergonómico en 1989 y las ventas han ido en aumento desde
Temp. °C 408 484 350 503 600 600
entonces. A continuación, se presentan datos en términos de
Ag2S miles de ratones vendidos por año.
0.44 0.45 0.09 0.59 0.63 0.60
mol%
Año 2009 2010 2001 2002
a. ¿Existe correlación lineal? Número
b. Estime el contenido de plata promedio verdadero 82.4 125.7 276.9 342.5
vendido
cuando la temperatura es de 500°C utilizando un
intervalo de confianza de 95 por ciento. Año 2003 2004 2005 2006
c. ¿Cómo se compararía el ancho de un intervalo de Número
confianza de 95% para el contenido de plata promedio 543.6 691.5 782.4 889.5
vendido
verdadero cuando la temperatura es de 400°C con el
Material de trabajo (Estadística aplicada)

a) Desarrolle la ecuación de estimación lineal que Obs 9 10 11 12 13 14 15


mejor describa estos datos.
b) Desarrolle la ecuación de estimación de segundo Poros. 112.1 112.4 113.6 113.8 115.1 115.4 120
grado que mejor describa estos datos. pcf 17.1 18.9 16 16.7 13 13.6 10.8
c) Estime el número de ratones que venderá en 2008
usando ambas ecuaciones. a) ¿Cuál es el mejor modelo de regresión lineal para los
d) Si se supone que la tasa de crecimiento de las ventas datos? Estime un valor de Pcf para una porosidad de 95.
de ratones decrecerá pronto con base en la oferta y b) Al nivel del 95% determine un estimado para un pcf
la demanda, ¿qué modelo será un mejor cuando la porosidad es de 95.
18. La ley de Moore expresa que aproximadamente cada dos años
pronosticador para su respuesta en c)?
se duplica el número de transistores en un circuito integrado.1
15. A menudo, quienes hacen la contabilidad de costos estiman los
Se trata de una ley empírica, formulada por el cofundador de
gastos generales con base en el nivel de producción. En
Intel, Gordon E. Moore. Con los datos siguientes:
Standard Knitting Co. han reunido información acerca de los
gastos generales y las unidades producidas en diferentes Año 1975 1978 1982 1986 1989 1993
plantas, y ahora desean estimar una ecuación de regresión para Transis 2.3 5 29 120 275 1180
predecir los gastos generales futuros. tores
n=10 Σx=420 Σy=1922 Σx2=18228 Σxy=84541 Σy2=395024.
Año 1997 2001 2003 2004 2012 2014
Determine si existe correlación lineal entre las variables y Transis 3100 7500 24000 42000
22000 41000
que tan fuerte es. tores 0 0
Solo si existiera correlación lineal defina un intervalo de a. Grafique, calcule r e interprete
confianza al 90% para una producción 45 mil unidades b. ¿Un modelo lineal es adecuado para los
16. La presión de aire (lb/pulg2) y la temperatura (°F) se midieron datos? Explique
para un proceso de compresión de cierto aparato de émbolo y
cilindro y produjeron los datos siguientes (de Introduction to
Engineering Experimentation, Prentice-Hall, Inc., 1996, p. 153):
Análisis de regresión lineal simple

Presión 40.4 80.2 141.1 161.4 181.9 19. Las cantidades de un compuesto químico y, que se disuelve en
100 gramos de agua a varias temperaturas x, se registran como
Temperatura 73.9 164.8 228.4 279.5 269.4 sigue. Si existe correlación lineal:

d) Determine una ecuación de regresión, la que mejor se


Presión 280.4 341.1 480.8 220.8 241.8 acomode a los datos.
e) Interprete los valores de b0 y b1
Temperatura 322.3 332.6 342.9 291.5 287.3
f) Determine un intervalo de confianza al 95% para una
a) ¿Ajustaría el lector el modelo de regresión lineal simple a estimación cuando la temperatura sea de 20°C.
los datos y lo usaría como base para pronosticar la
temperatura a partir de la presión? ¿Por qué sí o por qué
20. El ingeniero de control de calidad de una empresa desea
no?
estimar la resistencia a la tensión mecánica de un alambre de
b) Encuentre un modelo probabilístico apropiado y del
acero, en función de su diámetro exterior. Para hacer un
modo más informativo posible, úselo como base para
experimento seleccionó cinco trozos de alambre. A
predecir el valor de temperatura que resultaría de una
presión de 200 lb/pulg2. continuación, midió su diámetro exterior (mm) y la resistencia
17. El concreto sin finos, hecho de un agregado grueso a la tensión (lb/pulg2) de cada trozo. Los resultados fueron:
uniformemente graduado y una pasta de cemento y agua, es Tramo A B C D E
benéfico en áreas propensas a lluvias intensas debido a sus
Diámetro Exterior, x 0,3 0,2 0,4 0,3 0,5
excelentes propiedades de drenaje. El artículo “Pavement
Resistencia tensión, y 11 9 16 12 18
Thickness Design for No-Fines Concrete Parking Lots” (J. of
Transportation Engr., 1995: 476-484) empleó un análisis de a) Halle e interprete el coeficiente de correlación y de
mínimos cuadrados al estudiar cómo la porosidad (%) está determinación.
relacionada con peso unitario (pcf) en especímenes de b) Halle la ecuación estimada de regresión lineal.
concreto. Considere los siguientes datos, considere que
c) Interprete el valor de b0 y de b1 en la ecuación estimada.
provienen de poblaciones no normales.
d) Halle la mejor resistencia a la tensión predicha para un
Obs 1 2 3 4 5 6 7 8 diámetro exterior de 0,1 mm.
e) Construya el intervalo de predicción del 95% para la
Poros. 99 101.1 102.7 103 105.4 107 108.7 110.8
resistencia a la tensión mecánica de un alambre dado un
pcf 28.8 27.9 27 25.2 22.8 21.5 20.9 19.6 diámetro de 6 milímetros. Interprete los resultados.
f) Pruebe que β1=31,92
Material de trabajo (Estadística aplicada)

g) Determine un intervalo de confianza para β0 y β1, para d) Pruebe que β1=10,5


α=0,01 e) Determine un intervalo de confianza para β0 y β1, para
α=0,05
21. En una empresa dedicada a anodizar artículos (baterías de
cocina), el anodizado se logra con una solución hecha a base de 24. La tabla lista la distancia d (en pies) por encima del suelo para
ácidos (sulfúrico, cítrico, bórico) y dicromato de aluminio. En el caso de un objeto que se deja caer en el vacío desde una
este proceso se controla el pH de la solución, la temperatura, la altura de 500 pies. El tiempo t (en segundos) es el tiempo que
corriente y el tiempo de permanencia. Se decide estudiar, transcurre desde que se suelta el objeto.
mediante un experimento, la relación del pH y el espesor (cm).
Los datos se muestran en la tabla: t (s) 1 2 3 4 5
d (pies) 484 436 356 244 100
Espesor, x 18 15 12 9 10 11 13
pH, y 1,0 1,1 1,4 1,8 1,7 1,6 1,1 a) Halle la ecuación estimada de regresión lineal.
a) Halle e interprete el coeficiente de correlación y de b) Halle la mejor distancia por encima del suelo predicha para
determinación. un tiempo de 4,5 segundos desde que se soltó el objeto.
c) Pruebe que β1=-96
b) Halle la ecuación estimada de regresión lineal.
d) Determine un intervalo de confianza para β0 y β1, para
c) Interprete el valor de b0 y de b1 en la ecuación estimada.
α=0,05
d) d)Halle el mejor pH predicho para un espesor de 16 cm.
e) Construya el intervalo de predicción del 98% del pH para
25. A continuación, se presentan las concentraciones de dióxido de
14 cm de espesor. Interprete los resultados.
carbono (en partes por millón) en la atmósfera de la Tierra para
f) Pruebe que β1=-0,10 los años 1950, 1955, 1960, 1965, 1970, 1975, 1980, 1985, 1990,
1995, 2000 y 2005. Calcule la concentración predicha de dióxido
g) Determine un intervalo de confianza para β0 y β1, para
de carbono para el año 2010.
α=0,05
22. En una cuenca, se tienen dos estaciones de aforo A y B, en las 311 314 317 320 326 331
que se midieron los caudales medios mensuales, en m /s para 3 339 346 454 361 369 381
el año 2016, los que se muestran en la tabla. Considerando que a) Halle la ecuación estimada de regresión lineal.
los caudales de la estación A, es la variable independiente (x) y b) Halle la mejor estimación de concentración de dióxido de
que los caudales de la estación B es la variable dependiente (y). carbono en la atmósfera para el año 2010.
Mes Est. A Est. B Mes Est. A Est. B c) Pruebe que β1=8,08
E 175 321 J 171 456 d) Determine un intervalo de confianza para β0 y β1, para
F 75 222 A 475 1270 α=0,10
M 45 155 S 897 2089
A 77 274 O 710 1618 26. Una compañía de sustancias químicas, que busca estudiar el
M 131 431 N 268 431 efecto del tiempo de extracción sobre la eficiencia de una
J 136 446 D 224 509 operación de extracción, obtuvo los datos que se presentan en
la tabla siguiente:
a) Halle e interprete el coeficiente de correlación.
b) Halle la ecuación estimada de regresión lineal. Tiempo (Min) x 27 45 41 19 35
c) Halle el mejor caudal predicho en la estación B, para un
caudal de 250 m3/s en la estación A. Eficiencia (%) y 57 64 80 46 62

d) Pruebe que β1=2,26


e) Determine un intervalo de confianza para β0 y β1, para Tiempo (Min) x 39 19 49 15 31
α=0,02 Eficiencia (%) y 72 52 77 57 68

23. A continuación, tenemos una lista de las distancias que Si se sabe que existe correlación lineal:
necesitan ciertos vehículos para detenerse cuando viajan a d) Determine el mejor estimado para un tiempo de 40 minutos.
diferentes velocidades. Interprete.
e) Determine un intervalo de confianza para la estimación de la
Velocidad millas/h, x 30 40 50 60 70
pregunta a) al 99% de confianza.
Distancia pies,y 90 150 240 370 530

a) Halle e interprete el coeficiente de correlación. 27. A continuación, se presentan las temperaturas medias globales
b) Halle la ecuación estimada de regresión lineal. (en °C) de la superficie de la Tierra para los años 1960; 1965;
c) Halle la mejor distancia predicha para detenerse cuando 1970; 1975, 1980; 1985; 1990; 1995; 2000 y 2005.
se viaja a una velocidad de 65 millas/hora. 13,9 14,0 13,9 14,1 14,3
Material de trabajo (Estadística aplicada)

14,1 14,5 14,5 14,4 14,8 concreto. Considere los siguientes datos, considere que
a) Halle la ecuación estimada de regresión lineal. provienen de poblaciones normales.
b) Halle la mejor temperatura predicha para el año 2010.
Obs 1 2 3 4 5 6 7 8
c) Pruebe que β1=0,09

101.1

102.7

105.4

108.7

110.8
d) Determine un intervalo de confianza para β0 y β1, para

103

107
99
Poros.
α=0,05

28.8

27.9

25.2

22.8

21.5

20.9

19.6
28. El artículo “The Incorporation of Uranium and Silver by

27
pcf
Hydrothermally Synthesized Galena” (Econ. Geology, 1964:
1003-1024) reporta sobre la determinación de contenido de
plata de cristales de galena desarrollados en un sistema Obs 9 10 11 12 13 14 15
hidrotérmico cerrado dentro de un rango de temperatura. Con

112.1

112.4

113.6

113.8

115.1

115.4

120
temperatura de cristalización en °C y Ag2S en mol%, los datos Poros.
son los siguientes:

17.1

18.9

16.7

13.6

10.8
16

13
Temp. °C 398 292 352 575 568 450 550 pcf

Ag2S
0.15 0.05 0.23 0.43 0.23 0.40 0.44 c) ¿Cuál es el mejor modelo de regresión lineal para los
mol%
datos?
d) Interprete b0 y b1 en la ecuación de regresión estimada.
Temp. °C 408 484 350 503 600 600
Realice una estimación
Ag2S
0.44 0.45 0.09 0.59 0.63 0.60
mol%

d. ¿Un modelo lineal puede ser tomado en cuenta para


pronosticar valores de concentración de contenido de
plata?
e. ¿Cómo interpreta los valores b0 y b1 en la ecuación de
regresión?
f. Estime con intervalo, el contenido de plata promedio
verdadero cuando la temperatura es de 500°C.
29. Richard Jackson desarrolló un ratón para computadora
ergonómico en 1989 y las ventas han ido en aumento desde
entonces. A continuación, se presentan datos en términos de
miles de ratones vendidos por año.

Año 2009 2010 2011 2012


Número
82.4 125.7 276.9 342.5
vendido

Año 2013 2014 2015 2016


Número
543.6 691.5 782.4 889.5
vendido

e) Determine el mejor modelo de regresión lineal. Interprete


el valor de b1.
f) Determina un intervalo al 90% para el número de ratones
vendidos para el año 2018

30. El concreto sin finos, hecho de un agregado grueso


uniformemente graduado y una pasta de cemento y agua, es
benéfico en áreas propensas a lluvias intensas debido a sus
excelentes propiedades de drenaje. El artículo “Pavement
Thickness Design for No-Fines Concrete Parking Lots” (J. of
Transportation Engr., 1995: 476-484) empleó un análisis de
mínimos cuadrados al estudiar cómo la porosidad (%) está
relacionada con peso unitario (pcf) en especímenes de

También podría gustarte