Está en la página 1de 10

11.21.

El grado de transmisión de la enfermedad puede verse afectado en gran medida por la


viabilidad de estos organismos deben ser estudiados en una cámara hermética. Una manera de hacer
esto para dispersar una nube de aerosol, preparado a partir de una solución que contiene los
organismos en la cámara. La recuperación biológica en cualquier momento particular es el
porcentaje del número total de organismos en suspensión en el aerosol que son viables. Los datos de
la tabla adjunta son el porcentaje de recuperación biológica calculado a partir de 13 nubes de
aerosol diferentes. Para cada una de las nubes, los porcentajes de recuperación se determinaron en
diferentes momentos.

Nube Tiempo x (en Recuperación Biológica a. Grafica la información


minutos)
1 0 70.6 b. Desde donde hay curvatura, tratar de
2 5 52 finalizar los datos mediante el registro
3 10 33.4 de la recuperación biológica.
4 15 22
5 20 18.3
6 25 15.1
7 30 13
8 35 10
9 40 9.1
10 45 8.3

11.23. Consulte el ejercicio 11.22 y realice una prueba de la hipótesis nula de que B1 = 0 alfa =
0.05

11.43 Un fabricante de detergente para la ropa está interesado en probar un nuevo producto antes de
su lanzamiento al mercado. Un área de preocupación era la relación entre la altura de la espuma del
detergente en una lavadora en función de la cantidad de detergente añadido en el ciclo de lavado.

Para una carga estándar de lavado la maquina se llenó hasta el nivel completo, el fabricante hizo
asignaciones aleatorias de cantidades de detergente y los probó en la máquina de lavado. Los datos
aparecen a continuación.

11.55 Calcula una ecuación de regresión con el ejercicio de 11,54 como la variable dependiente.
Una parte de la salida se muestra aquí:
Escriba la ecuación de predicción. Interpretar los coeficientes. Es el término constante
(intersección) significativo en este contexto?

Busque la desviación estándar residual. ¿Qué significa el número?

¿Es la relación aparente estadísticamente detectable (significación)?

¿Qué parte de la variabilidad de los salarios se explica por la variación en los años de experiencia
laboral previa?

11.89.- Un reactor en una zona suburbana intentado predecir precios de las casas únicamente sobre
la base de su tamaño. Desde un servicio de listado múltiple, la inmobiliaria tamaño en miles de
metros cuadrados y el precio que pide obtiene en miles de dólares. La información se almacena en
el archivo DAT EX 1189 en los conjuntos de datos de sitios web, con precios en la columna 1 y
columna 2 Haga que su programa de software estadístico leer este archivo.

a.-Obtener una parcela de precio y tamaño. ¿Parece existe una relación creciente?

b.-Localizar un aparente valor atípico en los datos. ¿Es un punto de apalancamiento alto?

c.-Obtener una ecuación de regresión e incluir el valor atípico en los datos.

d.-Eliminar el valor atípico y obtener una nueva ecuación de regresión. ¿Cuánto cuesta el cambio de
pendiente sin que el valor atípico? ¿Por qué?

e.-Localizar las desviaciones standar residuales para los modelos atípicos-incluido y atípicos-
excluidos. ¿Difieren mucho? ¿Por qué?

11.90.-Obtener el modelo de regresión de valores atípicos-excluido de los datos del ejercicio 11.89.

a.-Interpretar el intercepto (constante) plazo. ¿Cuánto sentido tiene este número tiene en este
contexto?

b.-¿Qué significaría en este contexto, si la pendiente fuera 0? ¿Puede la hipótesis nula de pendiente
cero se rechazó enfáticamente?
c.-Calcula un intervalo de confianza del 95% para el valor real de la población de la pendiente. La
salida de la computadora debe darle la pendiente estimada y el error estándar, pero probablemente
tendrá que hacer los cálculos a mano.

11.96 Un fabricante de pintura utilizada para el marcado de superficies de carretera desarrollado


una nueva formulación que necesita ser probado para la durabilidad. Una pregunta concentración de
pigmento en la pintura. Si la concentración es demasiado baja, la pintura se desvanecen rápidamente
si la concentración es demasiado alta, la pintura no se adhiere bien a la superficie de la carretera. El
fabricante de la pintura aplica a diversas concentraciones para muestrear superficies de la carretera
y obtiene una medición durabilidad para cada muestra. Los datos se almacenan en el archivo
EX1196.DAT en los conjuntos de datos de sitios web, con una durabilidad en la columna 1 y la
concentración en la columna 2.

a. Haga que su programa informático calcular una ecuación de regresión con la durabilidad
predicho por la concentración. Interprete el coeficiente de la pendiente.

b. Encuentre el coeficiente de determinación. ¿Qué indica sobre el valor predictivo de la


concentración?

12.25 Una empresa metalúrgica lleva a cabo un estudio energético utilizando métodos de regresión
múltiple. La variable dependiente es el costo del consumo y = energía por día (en miles de dólares).
Y las variables independientes son X1 = toneladas de metal tratados en el día, X2 = temperatura
exterior promedio -60 ° F (un contrato sindical requiere de refrigeración de la planta cuando las
temperaturas exteriores llegan a 60 °), X3 = potencia nominal para la maquinaria en uso, y X4 =
X1X2, los datos se analizaron mediante estadísticas.

La salida seleccionada se muestra aquí


Escriba el modelo estimado

Resumir los resultados de los diferentes test de la t

Calcula un intervalo de confianza del 95% para el coeficiente de METXTEMP

¿Qué indica la columna de salida de VIF acerca de los problemas de colineridad?

12.26
El resultado para el ejercicio 12.15 se muestra aquí.
a) Buscar el valor de R2. Lo utilizan para confirmar el cálculo del estadístico de F.
b) ¿Podemos concluir que hay por lo menos algunos valores de predicción aleatoriamente entre las
variables independientes?
12.27

Otro análisis de regresión de los datos del ejercicio 12.26 utilizando sólo las actividades de
promoción como una variable independiente. El resultado son los siguientes:

a) Buscar el R2 para este modelo reducido.


b) Llevar a cabo los pasos de una prueba F utilizando α = 0.01
c) ¿Podemos concluir que existe por lo menos algunos valores de prediccion aleatoriamente entre
las variables independientes omitidos?

12.28 Se calcularon 2 modelos basados en los datos del ejemplo 12.13, con los siguientes
resultados:

12.29

Calcula el estadístico F en el ejercicio anterior, con base en las sumas de cuadrados que se muestran
en la salida. Interprete los resultados de la prueba F.

12.31

Se analizaron los datos de calificación crediticia, utilizando sólo la variable de ingreso mensual que
es un predictor. Se muestran los resultados de JMP.

a) Por cuanto tiene la regresión suma de cuadrados reducido por la eliminación hecha ?
b) ¿Estas variables que agregan valor predictivo estadísticamente significativo (en los niveles
normales de alfa). una vez que se le da ingreso?

12.56 Un productor de diversos alimentos aditivos para el ganado lleva a cabo un estudio sobre el
número de días de los tiempos de engorda necesarios para traer ganado de carne a peso de mercado.
Dieciocho novillos de edad y peso esencialmente idénticos son comprados y llevados a un corral de
engorde. Cada novillo se alimenta con una dieta con una conformación específica de la
concentración de antibiótico contenido de proteína y el porcentaje de suplemento alimenticio
Los datos son los siguientes:

Novillo 1 2 3 4 5 6 7 8 9
Proteína 10 10 10 10 10 10 15 15 15
Antibiótico 1 1 1 2 2 2 1 1 1
Suplemento 3 5 7 3 5 7 3 5 7
Tiempo 88 82 81 82 83 75 80 80 75
Novillo 10 11 12 13 14 15 16 17 18
Proteína 15 15 15 20 20 20 20 20 20
Antibiótico 2 2 2 1 1 1 2 2 2
Suplemento 3 5 7 3 5 7 3 5 7
Tiempo 77 76 72 79 74 75 74 70 69

a) escribe la ecuación de regresión


b) encuentra la desviación estándar
c) encuentra el valor de r cuadrado
d) ¿Encuentra un problema con el valor de colinearidad respecto a estos datos?

13.41 El efecto abrasivo de un probador de desgaste para telas experimentales se probó en un tejido
particular, mientras que se corre a seis diferentes velocidades de la máquina. Cuarenta y ocho piezas
idénticas de 5 pulgadas cuadradas de tejido fueron cortadas, con ocho plazas asignadas al azar a
cada una de las seis velocidades de la máquina: 100, 120, 140, 160, 180 y 200 revoluciones por
minuto (rev / min). El orden para la asignación de los cuadrados a la máquina fue al azar, con cada
cuadrado probado durante un período de 3 minutos en el ajuste de la máquina correspondiente. La
cantidad de desgaste se midió y registró para cada cuadrado. Los datos aparecen en la tabla adjunta.

a) Grafica los datos medios por revoluciones por nivel en minuto y sugerir un modelo.

b) Realice el modelo sugerido con los datos

c) Sugerir cuál de los gráficos de residuos podría ser útil en el control de las hipótesis en base del
modelo
EJERCICIO 12.58. Los datos del ejercicio 12.56 también son analizados por un modelo de
regresión utilizando sólo el contenido proteico como una variable independiente, con el siguiente
resultado:

c) a) Escribe la ecuación de regresión

b) encontrar el valor de R2

d) c) Prueba de la hipótesis nula de que los coeficientes de antibiótico y suplemento son con
valor de zeta y alfa = 0.05
e) 12.59: Una encuesta de administradores de sistemas de información fue usado para predecir
el salario anual programador de principio/ análisis en un área metropolitana. Los
administradores especificaron sus salarios por personal. Las firmas del margen de beneficio
bruto en centavos por dólar de ventas, y las firmas de información procesando costo como
un porcentaje del costo administrativo total. Los datos son almacenados en el ejercicio
1252.DAT archivo en el sitio web en datos enviados, con salario mínimo en la columna 1,
número de empleados en la columna 2, margen de ganancia en la columna 3, y costo del
procesamiento de la información en la columna 4.
f) a) Obtén una ecuación de regresión múltiple con salarios como la variable dependiente y
las otras tres variables como predictores, interpreta cada uno de los (parcial) coeficientes de
pendientes.
g) b) ¿Hay evidencia concluyente que lo tres predictores juntos tienen la menos algún valor en
la predicción del salario? Ubica un valor de P para la prueba apropiada.
h) c) ¿cada una de las variables independientes, si ninguno, tienen estadísticamente detectable
(α= .05) valor predicho como el ultimo predictor en la ecuación?
i) 12.60: a) localiza el coeficiente de determinación (R 2) para el modelo de regresión del
ejercicio 12.59
j) b) obtén otro modelo de regresión con el número de empleados como la sola variable
independiente. Encuentra el coeficiente de determinación para este modelo.
k) c) a mano, prueba la hipótesis nula que añadida margen de ganancia y costo de
procesamiento de información de números de empleados, Usa α= 0.01 que puedes concluir
de esta prueba?

EJERCICIO 12.64. Utilizar los datos de eliminación de ejercicio 12.62 para predecir los gastos
generales de un contrato cuando el contratista cuenta con 500 empleados, el contrato es de 2.50%
de los ingresos del contratista, y el costo del personal es de 55% del costo directo. Obtener un
intervalo de predicción de 95%. Tendría un costo de gastos generales igual al costo directo 88.9%
razonable en este situación?

13.43 Referirse a los datos del ejercicio 13.41. supongamos que otra variable fue controlada y que
los primeros cuatro cuadrados en cada velocidad se trataron con una concentración 2 de capa
protectora y los segundos cuatro cuadrados fueron tratados con una concentración 4 del mismo
recubrimiento. dado que x1 indica la velocidad de la máquina y X2 indica la concentración de la
capa protectora, colocar estos modelos.

13.44 El efecto abrasivo de un probador de desgaste de tejidos experimentales se probó en


particular, la tela, mientras que correr a las seis velocidades de máquina diferentes. cuarenta y ocho
piezas idénticas 5 pulgadas cuadrados de tela se cortaron, con ocho cuadrados asignados
aleatoriamente a cada una de las seis velocidades de máquina 100, 120, 140, 160,180, y 200
revoluciones por minuto. el orden de asignación de los cuadrados a la máquina fue al azar, con cada
cuadrado probado durante un período de 3 minutos en el ajuste de la máquina correspondiente. la
cantidad de desgaste se midió y registró para cada cuadrado. los datos aparecen en la tabla adjunta

a) representar los datos medios por revoluciones por minuto y nivel de sugerir un modelo.

b) ajustar el modelo sugerido a los datos.

c) sugieren que las parcelas residual podría ser útil en el control de las hipótesis de base del modelo.

d) utilizar los gráficos de residuos para detectar posibles violaciones de los supuestos

Altura, y Agitación , Cantidad x2 Altura , y Agitación, x2 Altura x2


x1
28.1 1 6 69.2 2 9

32.3 1 7 72.9 2 10
34.8 1 8 88.2 3 6
38.2 1 9 89.3 3 7
43.5 1 10 94.1 3 8
60.3 2 6 95.7 3 9
63.7 2 7 100.6 3 10
65.4 2 8

13.65 se realizó un estudio para determinar si la infección por un programa de vigilancia control
han reducido las tasas de hospitalización adquirido la infección en los hospitales de Estados Unidos.
Este conjunto de datos considerado muestra aleatoria de 28 hospitales seleccionados de 338
hospitales participantes en un estudio . Cada uno en conjunto de datos proporciona información
sobre variables para un solo hospital. Las variables son como sigue.

RIESGO = variable de salida, la probabilidad media estimada de adquirir la infección en el hospital


(en porcentaje)

ESTANCIA variable = entrada, estancia media de todos PACIENTES en un hospital (en días)

EDAD variable = entrada, la edad media de los pacientes (en años)

INS variable = entrada, relación del número de cultivos realizados al número de pacient sin canta o
síntomas de hospitalización adquirido la infección (100 veces)

ESCUELA = variable de entrada simulado para la afiliación de espacios escolares médica, 1 = sí, 0
= no

RC1 = variable de entrada simulado para la región del país, 1 = noreste, 0 = otro

RC2 = variable de entrada simulado para la región del país, 1 = el centro norte, 0 = otro

RC3 = variable de entrada simulado para la región del país, 1 = sur, 0 = otro

nota que hay cuatro regiones geográficas del país. Estas cuatro regiones del país requieren sólo tres
variables dummy para codificar para ellos. Los datos fueron analizados usando SAS con los
siguientes Resultados
13.67 Consulte el ejercicio 13.65. Supongamos que decidimos eliminar del modelo completo
algunas variables que creemos contribuyen poco para explicar la variable de salida. ¿qué le elección
de un modelo de ser? ¿Por qué elegir este modelo?

Examinando la falta de ajuste en regresión.

Un fabricante de detergente estaba interesado en probar un nuevo producto antes de la


liberación del mercado. Una preocupación era la relación entre la altura de la espuma de
detergente en la lavadora en función de la cantidad de detergente en el ciclo del lavado.
Para una lavadora de tamaño estándar llenada hasta el nivel completo, el fabricante hechó
al azar asignaciones de cantidades de detergente y había probado en la lavadora. Los datos
aparecen siguientes.

Height (y) Altura Amount (x) importe


28.1, 27.6 6
32.3, 33.2 7
34.8, 35.0 8
38.2, 39.4 9
43.5, 46.8 10

a) Plot the data


b) Fit a linear regression model
c) Use a residual plot to investigate possible lack of fit.

a) Representar gráficamente los datos

b) Ajuste un modelo de regresión lineal

c) Utilice un gráfico de residuos para investigar la posible falta de ajuste.

También podría gustarte