Está en la página 1de 5

ANOVA, Correlación y Regresión

1. Calcular los siguientes valores siguientes de la distribución F (para la cola derecha


o cola mayor) usando el SPSS:

a) Para 0.05 con 5 y 10 grados de libertad


b) Para 0.025 con 20 y 15 grados de libertad
c) Para 0.01 con 8 y 12 grados de libertad
d) Para 0.10 con 10 y 20 grados de libertad

2. Una empresa ensambla componentes eléctricos para teléfonos celulares.


Durante los últimos 10 días, el operario Mark ha promediado 9 productos
rechazados, con una desviación estándar de 2 rechazos por día. Otra operaria,
Debbie, promedió 8.5 productos rechazados, con una desviación estándar de 1.5
rechazos durante el mismo periodo. Con un nivel de significancia de 0.05,
¿podría concluir que hay más variación en el número de productos rechazados
por día de Mark?

3. Desde hace algún tiempo las aerolíneas han reducido sus servicios, como
alimentos y bocadillos durante sus vuelos, y empezaron a cobrar un precio
adicional por algunos de ellos, como llevar sobrepeso de equipaje, cambios de
vuelo de último momento y por mascotas que viajan en la cabina. Sin embargo,
aún están muy preocupadas por el servicio que ofrecen. Hace poco un grupo de
cuatro aerolíneas contrató a Brunner Marketing Research, Inc., para encuestar a
sus pasajeros sobre la adquisición de boletos, abordaje, servicio durante el vuelo,
manejo del equipaje, comunicación del piloto, etc. Hicieron 25 preguntas con
diversas respuestas posibles: excelente, bueno, regular o deficiente. Una
respuesta de excelente tiene una calificación de 4, bueno 3, regular 2 y deficiente
1. Estas respuestas se sumaron, de modo que la calificación final fue una
indicación de la satisfacción con el vuelo. Entre mayor la calificación, mayor el
nivel de satisfacción con el servicio. La calificación mayor posible fue 100.
Brunner seleccionó y estudió al azar pasajeros de las cuatro aerolíneas. A
continuación, se muestra la información. ¿Hay alguna diferencia entre los niveles
de satisfacción medios con respecto a las cuatro aerolíneas? Use el nivel de
significancia de 0.01.
4. Los siguientes datos son las colegiaturas por semestre (en miles de dólares) de
una muestra de universidades privadas en varias regiones de Estados Unidos. A
un nivel de significancia de 0.05, ¿se puede concluir que hay una diferencia entre
las colegiaturas medias de las diversas regiones?

a) Formule las hipótesis nula y alternativa.


b) ¿Cuál es la regla de decisión?
c) Elabore una tabla ANOVA. ¿Cuál es el valor del estadístico de prueba?
d) ¿Cuál es su decisión respecto de la hipótesis nula?

5. Un negocio familiar que vende a clientes minoristas en el área de Chicago desde


hace muchos años. Tanto en radio como en televisión e internet, la compañía
destaca sus precios bajos y fáciles términos de crédito. El propietario desea
analizar la relación entre las ventas y la suma de dinero que gastó en publicidad.
A continuación, se presenta la información de las ventas y de los gastos
publicitarios durante los últimos cuatro meses.

a) El propietario desea pronosticar las ventas con base en los gastos


publicitarios. ¿Cuál es la variable dependiente? ¿Cuál es la variable
independiente?
b) Trace un diagrama de dispersión.
c) Determine el coeficiente de correlación.
d) Interprete la fuerza del coeficiente de correlación.

6. Del ejercicio anterior:


a) Determine la ecuación de regresión.
b) Interprete los valores de a y b.
c) Estime las ventas cuando se gastan $3 millones en publicidad.

7. Dadas las siguientes cinco observaciones de las variables x e y.


a) Trace el diagrama de dispersión correspondiente a estos datos.
b) Obtenga la ecuación de regresión estimada.
c) Use la ecuación de regresión estimada para predecir el valor cuando x = 4.
d) Calcule SCE, STC y SCR.
e) Calcule el coeficiente de determinación r2. Haga un comentario sobre la
bondad del ajuste.

8. Se recoge datos sobre la tasa de desocupación en edificios de oficinas y las


tasas de las rentas en mercados de Estados Unidos. Los datos siguientes dan la
tasa de desocupación (%) y las tasas de rentas promedio (por metro cuadrado)
en las zonas comerciales centrales de 18 mercados. (la data se encuentra en el
Excel Data_ejercicios5.xlsx)

a) Con estos datos trace un diagrama de dispersión; en el eje horizontal


grafique la tasa de desocupación.
b) ¿Parece haber alguna relación entre las tasas de desocupación y las tasas
de rentas?
c) Dé la ecuación de regresión para predecir la tasa promedio de renta en
función de una tasa de desocupación dada.
d) Empleando como nivel de significancia 0.05 pruebe la significancia de
esta relación.
e) ¿Proporciona, la ecuación de regresión estimada, un buen ajuste?
f) Pronostique la tasa de renta esperada en los mercados en los que la tasa
de desocupación en zonas comerciales centrales es 25%.

9. La Nacional Basketball Association (NBA) lleva un registro de diversos datos


estadísticos de cada equipo. Cuatro de estos datos estadísticos son la proporción
de juegos ganados (PCT), la proporción de anotaciones de campo (FG%), la
proporción de tiros de tres puntos hechos por el equipo contrario (Opp 3 Pt%) y
la cantidad de recuperaciones hechas por el equipo contrario (Opp TO). Los
siguientes datos muestran los valores de estas estadísticas para los 29 equipos
de la NBA en una fracción de la temporada 2004. (la data se encuentra en el Excel
Data_ejercicios5.xlsx)

a) Obtenga una ecuación de regresión estimada que sirva para predecir la


proporción de juegos ganados dada la proporción de anotaciones de
campo del equipo.
b) Interprete la pendiente de la ecuación de regresión estimada obtenida.
c) Obtenga una ecuación de regresión estimada que sirva para predecir la
proporción de juegos ganados dada la proporción de anotaciones de
campo del equipo, la proporción de tiros de tres puntos hechos por el
equipo contrario y la proporción de recuperaciones hechas por el equipo
contrario.
d) Analice las implicaciones prácticas de la ecuación de regresión estimada
obtenida en el inciso anterior.
e) Estime la proporción de juegos ganados por un equipo para el que los
valores de las tres variables independientes son: FG% = 0.45, Opp 3 Pt%
= 0.34 y Opp TO = 17.
f) Emplee la prueba F para determinar la significancia global de la relación.
Empleando como nivel de significancia 0.05, ¿cuál es la conclusión?
g) Emplee la prueba t para determinar la significancia de cada una de las
variables independientes. Empleando como nivel de significancia 0.05,
¿cuál es la conclusión?

10. Un estudio realizado a lo largo de 10 años por la American Heart Association


proporcionó datos sobre la relación que tienen la edad, la presión sanguínea y el
fumar sobre el riesgo de sufrir un infarto. Los datos que se dan a continuación se
obtuvieron como parte de este estudio. El riesgo se interpreta como la
probabilidad (multiplicada por 100) de que el paciente sufra un infarto en los
próximos 10 años. Para fumar, defina una variable ficticia que tome el valor 1 si
la persona es fumadora y el valor 0 si no es fumadora. (la data se encuentra en
el Excel Data_ejercicios5.xlsx)

a) Obtenga la ecuación de regresión estimada que relaciona el riesgo de


infarto con la edad, la presión sanguínea y el fumar o no fumar.
b) ¿Es el fumar un factor significativo para el riesgo de infarto? Explique. Use
α = 0.05.
c) ¿Cuál es la probabilidad de que Art Apeen sufra un infarto en los
próximos 10 años, si tiene 68 años, fuma y su presión sanguínea es 175?
¿Qué recomendará el médico hacer a este paciente?

11. Jeff Sagarin proporciona, desde 1985, evaluaciones deportivas para USA Today.
En el béisbol sus pronósticos RPG (runs/game) estadísticos toman en cuenta
todas las estadísticas de ofensiva del jugador y, se asegura, que es la mejor
medida del verdadero valor de la ofensiva de un jugador. En los datos que se
presentan a continuación se da el RPG y varios estadísticos de ofensiva de la
temporada de la Liga Mayor de Béisbol correspondientes a 20 miembros de los
Yankees de Nueva York (www.usatoday.com, 3 de marzo de 2006). Los rótulos
de las columnas se definen como sigue: RPG, estadístico que predice número de
carreras por juego; H, batazos buenos; 2B, dobles; 3B, triples; HR,
cuadrangulares; RBI, carreras bateadas; BB, bases por bola; SO, ponchadas; SB,
bases robadas; CS, atrapado en robo de base; OBP, porcentaje en base; SLG,
porcentaje de potencia de bateo; AVG, promedio de bateo (la data se encuentra
en el Excel Data_ejercicios5.xlsx). Considere que la variable dependiente es la
estadística RPG.
a) Obtenga la mejor ecuación estimada de regresión con una variable.
b) Emplee métodos de selección de variables para obtener la mejor
ecuación estimada de regresión múltiple que estime el RPG de un
jugador.
12. Se realizó una prueba de sabor a 19 marcas de chocolates. En los datos a
continuación se da el precio por porción, en base al tamaño de porción de la FDA
que es de 1.4 onzas, así como una evaluación de la calidad de los 19 chocolates
tomados para la prueba (la data se encuentra en el Excel Data_ejercicios5.xlsx).
Suponga que desea determinar si los productos que son más caros son mejor
evaluados. Para los propósitos de este ejercicio, emplee la siguiente variable
binaria dependiente.

y = 1 si la evaluación de la calidad fue excelente o muy buena y


y = 0 si la evaluación de la calidad fue buena o regular.

a) Dé la ecuación de regresión logística que relaciona x = precio por porción


con y.
b) Use SPSS para calcular el logit estimado.
c) Use el logit estimado que obtuvo en el inciso anterior para obtener una
estimación de la probabilidad de que la evaluación de un chocolate cuyo
precio por porción es $4.00 sea muy bueno o excelente.
d) Dé la estimación del cociente de posibilidades. Dé su interpretación.

También podría gustarte