Está en la página 1de 110

1) Un ingeniero está evaluando la posibilidad de usar un nuevo software en el laboratorio de computo que lidera.

C
A fin de tomar una decisión se selecciona una muestra aleatoria de 7 usuarios del laboratorio de computo y se re
A partir de estos datos, ¿se cambiará el software antiguo por el nuevo? Use un nivel de significación del 5% y con

Usuario Paquete antiguo Paquete nuevo D


1 10 6 4
2 10 10 0
3 15 12 3
4 12 8 4 2
5 16 15 1 2.38047614
6 14 16 -2
7 16 12 4

X1~N(μ1_1^2
, ) : Tiempo de procesamiento de determinada tarea con el software antiguo
X2~N(μ2_2^2
, ) : Tiempo de procesamiento de determinada tarea con el software nuevo

i) Definir hipótesis μD = μ1 - μ2

H0: μD=0
H0: μD>0

ii) Valores críticos

t(1−a, n−1)=t(0.95,6)= 1.94

RC=<1.94,+µ>

RA=<-µ,1.94]

iii) Valor estadístico de prueba

T0=𝐷 ̅/ 2/(2.38/√7)
= .= 2.22
(𝑆_𝐷/
√𝑛)

SD= 2.38
𝐷 ̅.=2

iv) Regla de decisión

Como T0>t(0.95,6) (2.22>1.94), T0 pertenece a RC, por lo tanto se debe rechazar H 0

v) Conclusión

Con un nivel de significancia de 5%, existe evidencia estadística para demostrar que el software nuevo usa meno
2) Se comparan dos métodos (Método A y Método B) para medir la resistencia al corte de vigas de placas de acero
aplicaron a nueve vigas específicas seleccionadas aleatoriamente. ¿Se puede concluir con 𝛼 = 0.05 que ambos m

Viga Método A Método B D


1 1.186 1.061 0.125
2 1.151 0.992 0.159
3 1.322 1.063 0.259 prom
4 1.339 1.062 0.277 desv
5 1.2 1.065 0.135
6 1.402 1.178 0.224
7 1.365 1.037 0.328
8 1.537 1.086 0.451
9 1.559 1.052 0.507

X1~N(μ1_1^2
, ) : Resistencia al corte de vigas de placas de acero (en Kn) con el método A
X2~N(μ2_2^2
, ) : Resistencia al corte de vigas de placas de acero (en Kn) con el método B

i) Definir hipótesis μD = μ1 - μ2

H0: μD=0
H0: μD¹0

ii) Valores críticos

−t(1− 𝛼/2 , 𝑛−1)=-t(0.975,8)= - 2.31


t(1− 𝛼/2 , 𝑛−1)=t(0.975,8)= 2.31

RC= <-µ, -2.31> U <2.31, +µ>

iii) Valor estadístico de prueba

T0=𝐷 ̅/ = 0.27/.= 6.08


(𝑆_𝐷/ (0.14
√𝑛) /√9)

SD= 0.1350994
𝐷 ̅.=0.2738889

iv) Regla de decisión

Como T0>t(0.975,9) (5.79>2.31), T0 pertenece a RC, por lo tanto se debe rechazar H 0

v) Conclusión

Con un nivel de significancia de 5%, existe evidencia estadística para afirmar que ambos métodos para medir la r

3) Una compañía de transporte interprovincial debe decidir si compra la marca A o la marca B de neumáticos para s
de cada marca a las ruedas delanteras de 12 ómnibus y se registran en miles de kilómetros las distancias en el ar
Utilizando un nivel de significación del 5%, ¿se puede concluir que los promedios de rendimiento son iguales en a

X1~N(μ1_1^2
, ) :Kilómetros recorridos por los neumáticos de la marca A (en miles)
X2~N(μ2_2^2
, ) :Kilómetros recorridos por los neumáticos de la marca B (en miles)

i) Definir hipótesis

H0: μD=0
H0: μD¹0

ii) Valores críticos

−t(1− 𝛼/2 , 𝑛−1)=-t(0.975,11)= - 2.2


t(1− 𝛼/2 , 𝑛−1)=t(0.975,11)= 2.2

RC= <-µ, -2.2> U <2.2, +µ>

iii) Valor estadístico de prueba

t.test(x=MarcaA, y=MarcaB, mu = 0, paired=TRUE, alternative="two.sided")

t=4.2

iv) Regla de decisión

Como T0>t(0.975,11), T0 pertenece a RC, por lo tanto se debe rechazar H0

v) Conclusión

Con un nivel de significancia de 5%, no existe evidencia estadística para concluir que los promedios de rendimien
boratorio de computo que lidera. Cambiará de software si hay evidencia que el nuevo usa menos tiempo que el antiguo al procesar determ
del laboratorio de computo y se registra el tiempo de procesamiento en segundos con ambos softwares tal y como se da en la tabla que s
n nivel de significación del 5% y considere poblaciones normales.

ar que el software nuevo usa menos tiempo que el antiguo al procesar determinada tarea, por lo tanto el ingeniero debería cambiar el soft
l corte de vigas de placas de acero (en kilonewton (kN)). En la tabla que sigue se presentan los datos de estos dos métodos (en kN) cuando
concluir con 𝛼 = 0.05 que ambos métodos son diferentes en promedio? Suponga que las resistencias obtenidas con ambos métodos sigue

0.27388889
0.13509945

que ambos métodos para medir la resistencia al corte de vigas de placas de acero son diferentes en promedio.

A o la marca B de neumáticos para su flota de ómnibus. Para estimar la diferencia entre las dos marcas asigna un neumático
de kilómetros las distancias en el archivo DatosEjerc11Lab3.xlsx.
ios de rendimiento son iguales en ambas marcas? Considerar que las distancias están distribuidas normalmente.

uir que los promedios de rendimiento de los neumáticos son iguales en la marca A y B.
ue el antiguo al procesar determinada tarea.
al y como se da en la tabla que sigue.

ngeniero debería cambiar el software antiguo.


tos dos métodos (en kN) cuando se
nidas con ambos métodos siguen distribuciones normales.

na un neumático
Positivo o Negativo

El 47.85% es el porcentaje de variabilidad de y debido a otros regresores considerados en el modelo


Interpretación: El 52.15% de la variabilidad de las ventas semanales es explicado por las variaciones del precio

CORRELACIÓN
Los valores del VIF son menores a 10, por consiguiente cumplen con el supuesto de no multicolinealidad

Interpretación: Manteniendo constantes la demanda mensual y la inversión mensual, por cada mil TM que se i
12.49 millones de dólares

Hipótesis:

Modelo adecuado (Distribución F) Significancia

H0: _1= _2=_3=0 (El modelo lineal no es adecuado)


H1: Al menos un ¹0 (El modelo lineal es adecuado )

Normalidad (Residuos)

H0= Los residuos siguen una distribución normal


H1= Los residuos no siguen una distribución normal

Multicolinealidad (Supuesto 5)

Ho: Cumple el supuesto de no multicolinealidad


H1: No Cumple con el supuesto de no multicolinealidad

Variables Significativas

H0: _𝑖=0 (𝑋_𝑖no es significativa)


H1: _𝑖¹0 (𝑋_𝑖es significativa)

Homogeneidad de proporciones

H0: pA=pB=pC
H1: H0 no es verdadero

Independencia

H0: La proporción de anillos en cada categoría no varía entre todas las máquinas (son independientes)
H1: La proporción de anillos en cada categoría varía entre todas las máquinas (son dependientes)
P.Bondad

H0: El número de accidentes por año se ajusta a una distribución de Poisson H0: El monto de compra y la form
H1: El número de accidentes por año no se ajusta a una distribución de Poisson H1: El monto de compra y la form

PH. Proporción

H0: p1=p2
H1: p1>p2

Datos pareados

μD = μ1 - μ2
H0: μD=0
H0: μD>0
Método de regresión por pasos

Minitab->Estadísticas->Regresión->Regresión->Paso a Paso->Método(Paso a Paso)->Indicar: Detalles Paso a Paso

Estadísticas > Regresión > Regresión > Predecir

Coeficiente de determinación= R^2

Coeficiente de correlación= R

Intervalos de confianza

Estadísticas > Regresión > Regresión > Ajustar modelo de regresión:


Resultados > Presentación de resultados: Tablas Expandidas
Opciones > Nivel de confianza: 95% y Tipo de Intervalo: Bilateral

Intervalo de confianza para un valor específico

Estadísticas > Regresión > Regresión > Predecir > Ingresar valores individuales

Condición de normalidad

Estadísticas > Regresión > Regresión > Ajustar modelo de regresión > Almacenamiento > Marcar Residuos (se g
rados en el modelo Estadísticas > Estadísticas básicas > Prueba de normalidad > Agregar la variable RESID y marcar La
o por las variaciones del precio y la publicidad

VENTAJA ODDS

PROCEDIMIENTO EN MINITAB: Estadísticas > Regresión > Regresión logística binaria

𝛽1 = −0.232 < 0,
indica que incrementos en la Temperatura de los anillos en el lanzamiento ( 𝑥) disminu
o de no multicolinealidad

nsual, por cada mil TM que se incrementa en la producción mensual, el monto mensual de exportaciones aumenta, en promedio

Método de regresión por pasos alfa entra alfa sale

Estadísticas > Regresión > Regresión > Ajustar modelo de regresión > Paso a paso
Método > Paso a paso
Alfa a entrar = 0.15 (por default), Alfa a retirar = 0.15 (por default)
Mostrar la tabla de detalles de selección del modelo > Incluir detalles de cada paso

(son independientes)
n dependientes)
0: El monto de compra y la forma de pago no tienen relación (son independientes)
1: El monto de compra y la forma de pago tienen relación (son dependientes)
Detalles Paso a Paso

miento > Marcar Residuos (se generará una columna RESID con los residuos)
ar la variable RESID y marcar La prueba de normalidad Anderson-Darling

n > Regresión logística binaria > Predecir

os en el lanzamiento ( 𝑥) disminuyen la probabilidad estimada de que SI ocurra una falla en los anillos
s aumenta, en promedio
1) Un patrocinador de un programa especial de televisión afirma que el programa representa un atractivo mayor pa
que es igual al porcentaje de televidentes hombres y mujeres que ven el programa especial. Si una muestra aleat
programa especial de televisión, ¿puede respaldarse estadísticamente la afirmación del patrocinador consideran

p1=Proporción de hombres que ven el programa


p1=Proporción de mujeres que ven el programa

y1=número de hombres que ven el programa en la muestra de tamaño n 1 donde n1=300, y1=120
y2=número de mujeres que ven el programa en la muestra de tamaño n 2 donde n2=400, y1=120

i) Definir hipótesis

H0: p1=p2
H0: p1>p2

ii) Valores críticos

𝑧(1− 𝛼)= .z(0.95)= 1.64

RC= <1.64,+µ>

iii) Valor estadístico de prueba


𝑍_0=(𝑃 ̅_1−𝑃 ̅_2)/√((𝑝 ̂(1−𝑝 ̂))/𝑛_1 +(𝑝 ̂(1−𝑝 ̂))/𝑛_2 )
(0.4−0.3)/√(0.225/300+0.225/400)
= =2.76

𝑝 ̂=(𝑦_1+𝑦_2)/(𝑛_1+𝑛_2
240/700 =
)=(120+120)/(300+400.3429
0) =
iv) Regla de decisión

Como Z0 > Z(0.95), Z0 pertenece a RC, por lo tanto se debe rechazar H 0

v) Conclusión

Con un nivel de significancia de 5%, no existe evidencia estadística para respaldar la afirmación del patrocinador,

2) Una empresa de estudios de mercado quiere saber si un producto proporcionado a nivel nacional lo adquieren lo
independientes de 900 hombres y 800 mujeres se encontró que 270 hombres y 200 mujeres adquieren el produc

p1= Proporción de hombres que adquieren el producto


p2= Proporción de mujeres que adquieren el producto

y1=número de hombres que adquieren el producto en la muestra de tamaño n 1 donde n1=900, y1=270
y2=número de mujeres que adquieren el producto en la muestra de tamaño n 2 donde n2=800, y2=200
i) Definir hipótesis

H0: p1=p2
H0: p1>p2

ii) Valores críticos

𝑧(1−𝛼)= z(0.996)= 2.65207

RC= <2.65,+µ>

iii) Valor estadístico de prueba


𝑍_0=(𝑃 ̅_1−𝑃 ̅_2)/√((𝑝 ̂(1−𝑝 ̂))/𝑛_1 +(𝑝 ̂(1−𝑝 ̂))/𝑛_2 )
(0.3−0.25)/√(0.2/900+0.2/800)
= =2.3

𝑝 ̂=(𝑦_1+𝑦_2)/(𝑛_1+𝑛_2
470/1700 =
)=(270+200)/(900+800.27647
0) =
iv) Regla de decisión

Como Z0>z(1− a/2), Z0 pertenece a RC, por lo tanto se debe rechazar H 0

v) Conclusión

Con un nivel de significancia de 0.4%, existe evidencia estadística para afirmar que el producto proporcionado a n

3) Se evalúan dos tipos diferentes de soluciones de pulido para su posible uso en una operación de pulido rotatorio
Se pulieron rotatoriamente 300 lentes usando la primera solución de pulido, de los cuales 253 no tuvieron defect
de pulido, y 196 lentes fueron pulidos satisfactoriamente al término de la operación. ¿Hay alguna razón para cree

p1= Proporción de lentes pulidos usando la primera solución de pulido


p2= Proporción de lentes pulidos usando la segunda solución de pulido

y1=número de lentes pulidos usando la primera solución de pulido sin defectos en la muestra de tamaño n 1 dond
y2=número de lentes pulidos usando la segunda solución de pulido sin defectos en la muestra de tamaño n 2 don

i) Definir hipótesis

H0: p1=p2
H0: p1¹p2

ii) Valores críticos

−𝑧(1− 𝛼/2)= .-z(0.995)= .-2.575829


𝑧(1− 𝛼/2)= .z(0.995)= 2.575829

RC=<-µ,-2.58> U <2.58,+µ>

iii) Valor estadístico de prueba


𝑍_0=(𝑃 ̅_1−𝑃 ̅_2)/√((𝑝 ̂(1−𝑝 ̂))/𝑛_1 +(𝑝 ̂(1−𝑝 ̂))/𝑛_2 )
(0.84−0.65)/√(0.188/300+0.188/300)
= =5.36

𝑝 ̂=(𝑦_1+𝑦_2)/(𝑛_1+𝑛_2
449/600 =
)=(253+196)/(300+300.748333
0) =
iv) Regla de decisión

Como Z0>z(1− a/2), Z0 pertenece a RC, por lo tanto se debe rechazar H 0

v) Conclusión

Con un nivel de significancia de 1%, existe evidencia estadística para creer que las dos soluciones de pulido difier
epresenta un atractivo mayor para los televidentes hombres que para las mujeres, pero el personal de producción del programa piensa
ma especial. Si una muestra aleatoria de 300 hombres y otra de 400 mujeres reveló que 120 hombres y 120 mujeres estaban viendo el
ón del patrocinador considerando 𝛼 = 0.05?

n1=300, y1=120
n2=400, y1=120

la afirmación del patrocinador, pues el porcentaje de hombres y mujeres que ven el programa es diferente.

o a nivel nacional lo adquieren los hombres en mayor porcentaje que las mujeres. Si en dos muestras aleatorias
00 mujeres adquieren el producto, ¿cuál es su decisión al nivel 𝛼 = 0.004?

donde n1=900, y1=270


onde n2=800, y2=200
e el producto proporcionado a nivel nacional lo adquieren los hombres en mayor porcentaje que las mujeres.

a operación de pulido rotatorio en la fabricación de lentes intraoculares usados en el ojo humano después de una cirugía de cataratas.
os cuales 253 no tuvieron defectos producidos por el pulido. Otros 300 lentes se pulieron rotatoriamente usando la segunda solución
ón. ¿Hay alguna razón para creer que las dos soluciones de pulido difieren? Use 𝛼 = 0.01.

n la muestra de tamaño n 1 donde n1=300, y1=253


n la muestra de tamaño n 2 donde n2=300, y2=196
s dos soluciones de pulido difieren.
ducción del programa piensa
mujeres estaban viendo el
de una cirugía de cataratas.
usando la segunda solución
1) Se propone hipotéticamente que el número de defectos en tarjetas de memoria RAM para computadoras sigue u
y se observó el número de defectos:

Usando un 𝛼 = 0.05, ¿se puede considerar apropiado que el número de defectos en estas tarjetas de memoria tie

Número de defectos Frecuencia observada (Oi)


0 34
1 21 MINITAB-> Estadística-> Estadísticas Básicas
2 16 COLA SUPERIOR
3 9

H0: El número de defectos en tarjetas de memoria RAM para computadora sigue una distribución de Poisson
H1: El número de defectos en tarjetas de memoria RAM para computadora no sigue una distribución de Poisson
Frecuencia observada (𝑂_𝑖)
ii) Valores críticos Número de de
0 34
Sea uniulateral superior  ̂=1 1 21
2 16
𝑋_((1−𝑎,𝑘−𝑝−1))^2 𝑋_((0.95,2))^2
𝑋_((1−0.05,4−1−1))^2
.= .= .=5.99 3 9
n 80
RC= <5.99,+µ> Lambda estimado 1.0000

iii) Valor estadístico de prueba


∑26_(𝑖=1)^𝑘▒((
𝑋_0 .= 4.2695
^2=〖𝑂 _𝑖−𝐸_𝑖) 〗 ^2
)/𝐸_𝑖

iv) Regla de decisión

Como X𝑋_((0.95,2))^2
0< , X0 no pertenece a RC, por lo tanto no se debe rechazar H 0

v) Conclusión

Con un nivel de significancia de 5%, existe evidencia estadística para afirmar que el número de defectos en tarjet

2) Omega S.A. es una empresa agroindustrial ubicada en el norte del país, dedicada a cultivar y procesar caña de az
Para cumplir con dicho objetivo, selecciona muestras aleatorias e independientes de empleados de los distintos t

Número de accidentes al año ocurridos al trabajador del turno de la mañana

Número de accidentes 0 1 2 3
Número de trabajadores 40 25 17 18

Con 4% de significación, realizar una prueba de hipótesis para determinar si la distribución del número de accide

i) Definir hipótesis
 ̂=
H0: El número de accidentes por año se ajusta a una distribución de Poisson
H1: El número de accidentes por año no se ajusta a una distribución de Poisson

ii) Valores críticos Frecuencia observada (𝑂_𝑖)


Número de ac
Sea uniulateral superior  ̂=1.13 0 40
1 25
𝑋_((1−𝑎,𝑘−𝑝−1))^2 𝑋_((0.96,2))^2
𝑋_((1−0.04,4−1.13−1))^2
.= .= .=6.43 2 17
3 18
RC= <6.18,+µ> n 100

iii) Valor estadístico de prueba


∑26_(𝑖=1)^𝑘▒((
𝑋_0 .= 11.32
^2=〖𝑂 _𝑖−𝐸_𝑖) 〗 ^2
)/𝐸_𝑖

iv) Regla de decisión

Como X𝑋_((0.96,2))^2
0> , X0 pertenece a RC, por lo tanto se debe rechazar H 0

v) Conclusión

Con un nivel de significancia de 4%, no existe evidencia estadística para afirmar que el número de accidentes por
RAM para computadoras sigue una distribución de Poisson. Se ha colectado una muestra aleatoria de 𝑛 = 80 tarjetas de memoria

en estas tarjetas de memoria tiene una distribución de Poisson?

stadística-> Estadísticas Básicas-> Prueba de bondad de ajuste para Poisson


OLA SUPERIOR

una distribución de Poisson


ue una distribución de Poisson
Probabilidades teóricas (𝑝_𝑖)
Ei
0.3679 29.43 0.71
0.3679 29.43 2.41
0.1839 14.72 0.11
0.0803 6.42 1.03
4.2695

el número de defectos en tarjetas de memoria RAM para computadoras sigue una distribución de Poisson.

a cultivar y procesar caña de azúcar. El jefe de personal tiene como objetivo realizar un estudio sobre los trabajadores que laboran en la e
s de empleados de los distintos turnos a la que pertenece cada trabajador. El jefe de personal ha obtenido la siguiente información.

tribución del número de accidentes por año se ajusta a una distribución de Poisson.
Probabilidades teóricas (𝑝_𝑖)
Ei
0.3230 32.30 1.83
0.3650 36.50 3.62
0.2062 20.62 0.64
0.1057 10.57 5.22
11.3185

ue el número de accidentes por año se ajusta a una distribución de Poisson.


80 tarjetas de memoria

rabajadores que laboran en la empresa.


la siguiente información.
1) La siguiente tabla muestra la distribución, según el coeficiente intelectual y el rendimiento en un programa de ca

Rendimiento
Coeficiente Intelectual
Deficiente Regular Bueno
Bajó el promedio 67 64 25
Promedio 42 76 56
Sobre el promedio 10 23 37

De acuerdo a la información proporcionada, contraste las hipótesis adecuadas para determinar si hay relación sig

H0: El coeficiente intelectual y el rendimiento en un programa de capacitación de trabajo no tienen relación (son
H1: El coeficiente intelectual y el rendimiento en un programa de capacitación de trabajo tienen relación (son de

ii) Valor crítico


MINITAB-> Estadísticas->Tablas->Prueba
a=0.03 I=3 J=3
COLA SUPERIOR
𝑋_((1−𝑎,(𝐼−1)∗(𝐽−1)))^2
𝑋_((0.97,4))^2
.= .=10.7119

RC=<10.71,+µ>

iii) Valor estadístico de prueba

Con minitab: 41.014

iv) Regla de decisión

Como X0> 𝑋_((0.97,4))^2


, X0 pertenece a RC, por lo tanto se debe rechazar H0

v) Conclusión

Con un nivel se significancia de 3%, existe evidencia estadística para afirmar que el coeficiente intelectual y el ren

2) Cuatro máquinas fabrican anillos de acero. Los anillos están sujetos a una especificación de diámetro. Un anillo p
Se muestrean anillos de cada máquina y se cuenta su número en cada categoría. Los datos obtenidos se presenta

Muy angostoEstá bien Muy grueso


Máquina 1 10 102 8
Máquina 2 34 161 5
Máquina 3 12 79 9
Máquina 4 10 60 10

Con α = 0.04, ¿es posible afirmar que la proporción de anillos en cada categoría varía entre todas las máquinas?

H0: La proporción de anillos en cada categoría no varía entre todas las máquinas (son independientes)
H1: La proporción de anillos en cada categoría varía entre todas las máquinas (son dependientes)
ii) Valor crítico

a=0.04 I=4 J=3

𝑋_((1−𝑎,(𝐼−1)∗(𝐽−1)))^2
𝑋_((0.96,6))^2
.= .=13.2

RC=<13.2,+µ>

iii) Valor estadístico de prueba

Con minitab: 15.584

iv) Regla de decisión

Como X0> 𝑋_((0.97,6))^2


, X0 pertenece a RC, por lo tanto se debe rechazar H0

v) Conclusión

Con un nivel de significancia de 3%, existe evidencia estadística para afirmar que la proporción de anillos en cada

3) Una compañía que produce tuercas puede fabricarlas usando cualquiera de las cuatro máquinas con las que cuen
Durante un mes de producción se recaban los datos de las averías de las máquinas en cada uno de los tres turno
saber si existe relación (o dependencia) entre las averías de los diferentes tipos de máquinas y los turnos de prod

Máquinas
Turno
A B C D
Mañana 41 20 12 16
Tarde 31 11 9 14
Noche 15 17 16 10

H0: Las averías de los diferentes tipos de máquuinas y los turnos de producción no tienen relación (son independ
H1: Las averías de los diferentes tipos de máquuinas y los turnos de producción tienen relación (son dependiente

ii) Valor crítico

a=0.05 I=3 J=4

𝑋_((1−𝑎,(𝐼−1)∗(𝐽−1)))^2
𝑋_((0.95,6))^2
.= .=12.59159

RC=<12.6,+µ>

iii) Valor estadístico de prueba

Con minitab: 11.649

iv) Regla de decisión

Como X0< 𝑋_((0.95,6))^2


, X0 no pertenece a RC, por lo tanto no se debe rechazar H0
𝑋_((0.95,6))^2

v) Conclusión

Con un nivel de significancia de 5%, existe evidencia estadística para afirmar que las averías de los diferentes tipo

4) Si se quiere comprobar la dificultad de un examen de Calculo I de acuerdo a 3 universidades (A, B y C) en donde s


identificando el número de alumnos reprobados en cada una de las 3 universidades. Con 𝛼=0.05, ¿se puede afirm
universidades, así como también iguales proporciones de alumnos reprobados?

Universidad Aprobados Desaprobados Total


Universidad A 90 10 100
Universidad B 85 15 100
Universidad C 95 5 100
Total 270 30 300

H0: pA=pB=pC
H1: H0 no es verdadero

ii) Valor crítico

a=0.05 I=3 J=2

𝑋_((1−𝑎,(𝐼−1)∗(𝐽−1)))^2
𝑋_((0.95,2))^2
.= .=5.991465

RC=<5.99+µ>

iii) Valor estadístico de prueba

Con minitab: 5.556

iv) Regla de decisión

Como X0< 𝑋_((0.95,4))^2


, X0 no pertenece a RC, por lo tanto no se debe rechazar H0

v) Conclusión

Con un nivel de significancia de 5%, existe evidencia estadística para aceptar la homogeneidad de proporciones d

5) El administrador de una cadena de tiendas por departamento afirma que los clientes son clasificados de acuerdo
compras entre 100 y 500 soles, M3: compras superiores a 500 soles y la forma de pago, F1: contado, F2: tarjeta.
que están en la categoría M1, 100 pagaron con tarjeta; de los 380 que están en M2, 40 pagaron al contado y de l
significativamente relacionado con la forma de pago? α = 0.03

F1 F2 TOTAL
M1 200 100 300
M2 40 340 380
M3 10 310 320
TOTAL 250 750 1000
H0: El monto de compra y la forma de pago no tienen relación (son independientes)
H1: El monto de compra y la forma de pago tienen relación (son dependientes)

ii) Valor crítico

a=0.03 I=3 J=2

𝑋_((1−𝑎,(𝐼−1)∗(𝐽−1)))^2
𝑋_((0.97,2))^2
.= .=7.013116

RC=<7.01+µ>

iii) Valor estadístico de prueba

Con minitab: 401.901

iv) Regla de decisión

Como X0> 𝑋_((0.97,2))^2


, X0 pertenece a RC, por lo tanto se debe rechazar H0

v) Conclusión

Con un nivel de significancia de 3%, existe evidencia estadística para afirmar que el monto de compra y la forma

6) Cerveza Perú S.A. es una empresa dedicada a la fabricación de cerveza con más de 8 años en el mercado. Las tres
El gerente general de la empresa está interesado en analizar F1 F2 TOTAL M1 200 100 300 M2 40 340 380 M3 10
Para ello se tomó una muestra aleatoria de botellas por cada lote, donde la característica a analizar es el Tipo de
Con α = 0.03 y la información de la siguiente tabla, ¿se puede afirmar que las proporciones de botellas de cada ti

Número de botellas según tipo y ciudad

Ciudades
Tipo Total
Piura Tumbes Chiclayo
Dorada 85 15 10 110
Malta 65 20 20 105
Trigo 40 35 35 110
Quinua 110 50 40 200
Total 300 120 105 525

i) Definir hipótesis

H0= pD=pM=pT=pQ
H1= H0 no es verdadero

ii) Valor crítico

a=0.03 I=4 J=3


𝑋_((1−𝑎,(𝐼−1)∗(𝐽−1)))^2
𝑋_((0.97,6))^2
.= .=13.96762

RC=<13.97+µ>

iii) Valor estadístico de prueba

Según minitab: 39.989

iv) Regla de decisión

𝑋_((0.97,6))^2
Como X0> , X0 pertenece a RC, por lo tanto se debe rechazar H0

v) Conclusión

Con un nivel de significancia de 3%, no existe evidencia estadística para aceptar la homogeneidad de proporcione
ento en un programa de capacitación de trabajo, de una muestra aleatoria de 400 trabajadores de una gran compañía

terminar si hay relación significativa entre las variables. Use 𝛼=0.03.

ajo no tienen relación (son independientes)


ajo tienen relación (son dependientes)

adísticas->Tablas->Prueba Chi-cuadrara de asociación

ficiente intelectual y el rendimiento en un programa de capacitación de trabajo tienen relación, es decir, son dependientes.

n de diámetro. Un anillo podría satisfacer la especificación, o ser demasiado angosto o demasiado grueso.
atos obtenidos se presentan en la siguiente tabla:

ntre todas las máquinas?

ndependientes)
oporción de anillos en cada categoría varía entre todas las máquinas .

máquinas con las que cuenta (A, B, C, D) y en los tres turnos diarios de producción (Mañana, Tarde y Noche).
cada uno de los tres turnos. Usando los datos recolectados (212 averías) y un 𝛼=0.05, el gerente de producción desea
quinas y los turnos de producción.

en relación (son independientes)


relación (son dependientes)
erías de los diferentes tipos de máquuinas y los turnos de producción no tienen relación, es decir, son independientes.

dades (A, B y C) en donde se evaluaron a los alumnos. Para esto se tomaron muestras aleatorias de 100 alumnos en cada una de las 3 univ
on 𝛼=0.05, ¿se puede afirmar que las 3 universidades son homogéneas, es decir, que se tienen iguales proporciones de alumnos aprobado

Homegeneidad de proporciones
COLA SUPERIOR

eneidad de proporciones de alumnos aprobados (y también reprobados) en las 3 universidades de Cálculo I.

on clasificados de acuerdo con el monto de sus compras en tres categorías, M1: compras menores de 100 soles, M2:
, F1: contado, F2: tarjeta. Se eligió al azar a 1000 clientes y se obtuvo la siguiente información: De los 300 clientes
0 pagaron al contado y de los que están en la categoría M3, sólo 10 pagaron al contado. ¿El monto de la compra está
onto de compra y la forma de pago tienen relación, es decir, son dependientes.

ños en el mercado. Las tres principales ciudades donde se distribuye su producto son; Piura, Tumbes y Chiclayo.
300 M2 40 340 380 M3 10 310 320 TOTAL 250 750 1000 la producción de botellas de 500 ml. con destino a las mencionadas ciudades.
tica a analizar es el Tipo de cerveza (1: Dorada, 2: Malta, 3: Trigo, 4: Quinua)
ones de botellas de cada tipo no son las mismas en las 3 ciudades?
mogeneidad de proporciones de las botellas de cada tipo en las 3 ciudades.
n compañía

on dependientes.
ependientes.

mnos en cada una de las 3 universidades,


porciones de alumnos aprobados en las tres
a las mencionadas ciudades.
1) Para estudiar la relación entre las variables. Tiempo de operación (en años) y costo mensual de mantenimiento (

Autobús 1 2 3 4 5 6
Tiempo 9 6 4 10 12 3
Costo 759 582 371 608 994 124

X: Tiempo (años) n=9


Y: Costo (soles)

a) Determine los coeficientes estimados de la recta de regresión mínimo cuadrática empleada para estimar los

= 37.3 + 70.92X

(_0: ) ̂Costo inicial estimado (37.3)

(_1 :) ̂Existe relación lineal directa entre X e Y, asimismo, por cada año transcurrido aumenta en promedio 70.92 so

Si X=5, =391.5; es decir, que cuando un autobús tiene 5 años de operación, el costo estimado de su mantenim

b) Halle e interprete los coeficientes de determinación y de correlación.

𝑅^2: Coeficiente de determinación𝑅^2


( =87.92%)

El 87.92% de la variabilidad de los costos mensuales de mantenimiento es explicada por las variaciones del tiem

R: Coeficiente de correlación (R=0.9377) 0.93765665

Existe una fuerte correlación entre X e Y.

c) ¿es el modelo lineal adecuado para estimar el costo de mantenimiento? α = 0.05

Pueba de hipótesis para la linealidad del modelo

H0= _1=0 (Modelo lineal no es adecuado) a=0.05


H1= _1¹0 (Modelo lineal es adecuado)

Valores Críticos

f(0.95,1,7)=5.6

RC= <5.6, +µ>

Valor estadístico

Según minitab: F0=50.96


Regla de decisión

Como F0>f(0.95,1,7), F0 pertenece a RC, por lo tanto se debe rechazar H 0

Conclusión

Con un nivel de significancia de 5%, se puede afirmar que el modelo lineal es adecuado para estimar el costo de m

d) ¿Cuáles son los límites de confianza del 95% para la pendiente de la recta

IC para _1=[47.43 , 94.41]

e) Con 95% de confianza, estime el costo promedio de mantenimiento para los autobuses que tienen 5 años de

IC= [285.373 , 498.379] 391.876

El costo promedio de mantenimiento para los autobuses que tienen 5 años de operación es de 391.876 soles

f) Con 95% de seguridad, ¿en cuánto pronostica el costo de mantenimiento de un autobús que tiene 7 años de

IP= [255.215 ; 812.209] 533.7525

Y está entre 255.215 y 812.209 soles. Su valor estimado es 533.7525 soles

h) ¿Se cumple la condición de normalidad de los residuales? α = 0.05

H0= Los residuos siguen una distribución normal


H1= Los residuos no siguen una distribución normal

p valor= 0.118

como p valor > a, no se debe rechazar H0

Por lo tanto, con un nivel de significancia de 5%, existe evidencia estadística para afirmar que los residuos cumpl

2) Una empresa de embutidos está interesada en medir el efecto del precio de jamón sobre la cantidad vendida

Precio 20 18 25 19 21 19
Ventas 50 60 33 62 45 65

X: Precio (soles) n=8


Y: Ventas (Kg)

a) Halle la recta de regresión empleada para estimar las ventas. Estime las ventas, cuando el precio del jamón e

= 144.3- 4.537X 44.486


(_0: ) ̂Precio inicial estimado (144.3)

(_1 :) ̂Por cada sol de aumento en el precio, las ventas disminuyen en promedio 4.537 kg.

Si X=22, =44.486; es decir, que cuando el precio del jamón es de 22 soles, la venta estimada es de 44.486 kg.

b) Halle e interprete los coeficientes de determinación y de correlación

𝑅^2: Coeficiente de determinación𝑅^2


( =86.02%)

El 86.02% de la variabilidad de las ventas es explicada por las variaciones en el precio del jamón

R: Coeficiente de correlación (R=-0.9275) 0.92746968

Existe una correlación fuerte entre el precio y la venta.

c) ¿Es el modelo lineal adecuado para estimar las ventas? a=0.03

Pueba de hipótesis para la linealidad del modelo

H0= _1=0 (Modelo lineal no es adecuado)


H1= _1¹0 (Modelo lineal es adecuado)

Valores críticos

f(0.97,1,6)= 8 RC=<8, +µ>

Estadístico de prueba

F0=36.91

Regla de decisión

Como F0>f(0.97,1,6), F0 pertenece a RC, por lo tanto se debe rechazar H0

Conclusión:

Con un nivel de significancia de 3%, se puede afirmar que el modelo lineal es adecuado para estimar las ventas.

d) Con 95% de confianza, ¿entre que valores estará el promedio de ventas cuando el precio de ventas es de 22

IC= [39.7982 , 49.2057] Estimación= 44.5

El promedio de ventas cuando el precio de ventas es de 22 soles estará entre 39.8 y 49.2 soles.

e) ¿Los residuales están normalmente distribuidos? α = 0.03


H0= Los residuos siguen una distribución normal
H1= Los residuos no siguen una distribución normal

p valor= 0.352

como p valor> a, no se debe rechazar H0

Con un nivel de significancia de 3%, existe evidencia estadística para afirmar que los residuales están normalmen

El modelo es explicativo, predictivo y cumple la condición de normalidad de los residuos.

3) El gerente de “Sondeos Líder” empresa consultora que opera en Lima, considera que en la variable Y: costo de ap
X1: área geográfica de la población (km2 ), X2: tiempo de llenado de un cuestionario (minutos), X3: edad del encu
informes de los archivos de la empresa, obteniendo los datos que se encuentran en la hoja de trabajo “Encuestas

a) Encuentre la ecuación de ajuste con el modelo de regresión múltiple. Interprete el coeficiente estimado de la

= 355.7+0.782X1+3.98X2-3.26X3
Interpretación del coeficiente X2: Manteniendo constantes X1 y X3, por cada minuto más de llenado, el
costo aumenta, en promedio, 3.98 miles de soles

b) Pruebe si el modelo lineal es apropiado para expresar la relación entre las variables en estudio. Use α = 0.03

H0:_1= _2=_3=0 (El modelo lineal no es adecuado)


_𝑖 ¹0 (El modelo lineal es adecuado )
H1: Al menos un

Valor crítico

f(0.97,3,8)= 5.04 RC=<5.04, +µ>

Valor estadístico de prueba

Según minitab: F0=66.76

Como F0>f(0.97,3,8), F0 pertenece a RC, por lo tanto se debe rechazar H0

Con un nivel de significancia de 3%, existe evidencia estadística para afirmar que el modelo lineal es adecuado pa

c) Realice la prueba de significancia de cada una de las variables predictoras. Use α = 0.03 Muestre los resultad

H0: _𝑖=0 (𝑋_𝑖no es significativa)


H1: _𝑖¹0 (𝑋_𝑖es significativa)

_1 𝑡_0=5.35 p= 0.001 α = 0.03


_2 𝑡_0=1.61 p=0.147
_3 𝑡_0=- p=0.289
1.14
Solo X1 es significativa

4) El gerente de personal de una empresa considera que puede haber una relación entre el ausentismo (días), la ed
Selecciona una muestra aleatoria de 8 empleados y los datos obtenidos se presentan en las columnas C1, C2 y C3

a) Presente la ecuación lineal estimada e interprete el coeficiente estimado de la variable salario

= 25.43 - 0.1789X1 - 0.554 X2


Interpretación: Manteniendo la variable edad constante, por cada mil soles que se incrementa el salario, el
ausentismo disminuye, en promedio, 0.554 días

b) Pruebe si el modelo conjunto es apropiado.  = 0.02

H0= _1 =_2 =0 (Modelo lineal no es adecuado)


H1= Al menos un_𝑖 ¹0 (Modelo lineal es adecuado)

p valor= 0

como p valor<a, se debe rechazar H0

Con un nivel de significancia de 2%, existe evidencia estadística para afirmar que el modelo lineal es apropiado.

c) ¿Cuál o cuáles de las variables predictoras son significativas?  = 0.02

H0: _𝑖=0 (𝑋_𝑖no es significativa)


H1: _𝑖¹0 (𝑋_𝑖es significativa)

_1 𝑡_0=- p= 0.004 α = 0.02


4.91
𝑡_0=- p=0.019
_2
3.41
En ambos casos se rechaza H0, por lo tanto b1 y b2 son significativas

Ambas variables son significativas

d) Construya un intervalo de predicción del 96% para el número de días de ausencia de un empleado que tiene

IP=[8.86 , 14.82]

5) La Cámara de Comercio del Perú, tiene interés de realizar un estudio relacionado con el comportamiento de la va
y evaluar el tipo de relación con algunas variables como las siguientes: X1: producción mensual de cobre en el Pe
X3: inversión mensual en promoción internacional de productos de origen peruano en USA (millones de dólares)
de trabajo “Exportaciones” y fijando un nivel de significancia del 6% donde corresponda:

Considerando un modelo de regresión lineal múltiple con las tres variables regresoras (predictoras), resuelva lo s

a. ¿El tipo de variables elegidas corresponden a las que se deben utilizar en un modelo de regresión? ¿por qué?
Sí, pues son variables cuantitativas

b. Realice, una a una, la prueba de hipótesis para conocer cuál o cuáles de las variables regresoras resultan sign

H0: _𝑖=0 (𝑋_𝑖no es significativa)


H1: _𝑖¹0 (𝑋_𝑖es significativa)

_1 𝑡_0=2.67 p= 0.022 VC=±2.1 RC=<-µ , -2.1> U <2.1, +µ>


_2 𝑡_0=0.47 p=0.65 VC=±2.1 RC=<-µ , -2.1> U <2.1, +µ>
_3 𝑡_0=2.62 p=0.024 VC=±2.1 RC=<-µ , -2.1> U <2.1, +µ>

Con un nivel de significancia de 6%, existe evidencia estadística para afirmar que X1 y X3 son variables regresoras

c) Desarrolle el procedimiento de prueba de los supuestos de normalidad de los residuos y la no multicolinealid


y las conclusiones al respecto.

H0= Los residuos siguen una distribución normal


H1= Los residuos no siguen una distribución normal

valor p= 0.630

Como p valor>a, no se debe rechazar H0

Con un nivel de significancia de 6%, existe evidencia estadística para afirmar que los residuos siguen una distribu

Ho: Cumple el supuesto de no multicolinealidad


H1: No Cumple con el supuesto de no multicolinealidad

Los valores de VIF no es mayor a 10: Cumple con el supuesto de no multicolinealidad.

d. Interprete el coeficiente de la variable X1.

Interpretación: Manteniendo constantes la demanda mensual y la inversión mensual, por cada mil TM que se i
12.49 millones de dólares

e. Si en el análisis de varianza, se hubiera obtenido un valor de Fo igual a la décima parte del hallado, ¿cuánto h
F0= 28.67--> décima parte= 2.867
Fo=2.867 ; P(Fo>2.867)=0.08508. El valor de p_value=0.08508> alfa=0.06, se concluiría que el modelo de regresió

f. Con 90% de confianza, estime mediante un intervalo el monto esperado de las exportaciones, si X1=125, X2=

IC=[501.45 ; 529.1]

6) Una empresa que se encarga de la distribución de artefactos en Lima Metropolitana está interesada en estudiar
(miles de kg), valor del vehículo utilizado (miles de dólares), Con tal propósito, se ha obtenido una muestra de da
4% o un nivel de confianza del 96%, resuelva las siguientes interrogantes:

a. ¿Qué variables son significantes al modelo? Considere hipótesis, estadístico de prueba, región crítica y result
H0: _𝑖=0 (𝑋_𝑖no es significativa)
H1: _𝑖¹0 (𝑋_𝑖es significativa)

_1 𝑡_0=3.31 p= 0.007 VC=±2.3 RC=<-µ , -2.3> U <2.3, +µ>


_2 𝑡_0=3.38 p=0.006 VC=±2.3 RC=<-µ , -2.3> U <2.3, +µ>
_3 𝑡_0=0.29 p=0.778 VC=±2.3 RC=<-µ , -2.3> U <2.3, +µ>

Conclusión:

Con un nivel de significancia de 4%, existe evidencia estadística para afirmar que la distancia y el peso son variab

CON LAS VARIABLES SIGNIFICATIVAS (EN MINITAB SE ELIMINAN LAS QUE NO LO SON)

b. Estime un intervalo de confianza para el coeficiente del parámetro peso de la carga e interprete su resultado

IC=[1.54 ; 6.93]

El peso promedio de la carga es de 1540 a 6930 kilos con una confianza del 96% de seguridad

c. ¿Se puede afirmar que el modelo lineal es apropiado para expresar la relación entre las variables involucrada

H0:_1= _2=_3=0 (El modelo lineal no es adecuado)


H1: Al menos un ¹0 (El modelo lineal es adecuado )

Valor crítico

f(0.96,3,11)= 3.91

RC=<3.91, +µ>

Valor estadístico

f0= 24.23

Como f0>f(0.96,3,11), f0 pertenece a RC, por lo tanto se debe rechazar H0

Con un nivel de significancia de 4%, existe evidencia estadística para afirmar que el modelo lineal es apropiado p

d. ¿Cuál es el porcentaje de variación del tiempo de entrega explicado por la variación de la distancia y del pes

El porcentaje de variación del tiempo de entrega explicado por la variación de la distancia y del peso es 80.16%.

e. Utilizando un intervalo de confianza, estime el valor del tiempo promedio de entrega que corresponde para

IC=[143.57; 191.58] Estimación= 167.575

Con un 96% de confianza, el valor del tiempo promedio de entrega se encuentra entre los valores de 143.57 y 19
f. ¿Qué puede afirmar acerca del cumplimiento del supuesto de no multicolinealidad de las variables independ

Los valores del VIF son menores a 10, por consiguiente cumplen con el supuesto de no multicolinealidad

7) El gerente de un banco está interesado en obtener una mejor “percepción “de las características de las familias q
por mes (Y) está relacionada con la edad del jefe de la familia (X1 en años), el ingreso familiar (X2 en miles de dól
aleatoria de 28 clientes registrándose los valores de las variables indicadas. El reporte de MINITAB del análisis de

a) Interprete los valores de los estimadores de los coeficientes de regresión β1 y β2

= -17.154+ 0.1141X1 + 1.8451X2 + 2.793X3

Interpretación B1: Manteniendo constantes el ingreso familiar y el número de miembros en la familia, por año

Interpretación B2: Manteniendo constantes X1 y X3 constantes, por cada mil dólares incrementados en el ingre

b) ¿Es el modelo significativo con  = 0.01?.

H0: _1= _2=_3=0 (El modelo lineal no es adecuado)


H1: Al menos un_𝑖 ¹0 (El modelo lineal es adecuado )

Valor crítico

f(0.99,3,24)= 4.72 RC= <4.72, +µ>

Valor estadístico de prueba

F0= 25.29

como F0>f(0.99,3,24), se debe rechazar H0

Con un nivel de significancia de 1%, existe evidencia estadística para afirmar que el modelo lineal es adecuado pa
c) ¿Algunas de las variables independientes (Xi) no son significativas? Use  = 0.04.

_1 𝑡_0=0.63 VC=±2.17 RC=<-µ , -2.17> U <2.17, +


_2 𝑡_0=6.08 VC=±2.17 RC=<-µ , -2.17> U <2.17, +
_3 𝑡_0=2.35 VC=±2.17 RC=<-µ , -2.17> U <2.17, +

Con un nivel de significancia de 4%, el ingreso familiar y el número de miembros en la familia son variables signifi

d) Calcule e interprete el coeficiente de determinación.

El 75,97% de variabilidad de Y, es explicado por las variaciones deX1,X2 y X3.

e) ¿Entre qué valores se encuentra el coeficiente de regresión de X2 con 95% de confianza?


to mensual de mantenimiento (en soles) de los buses de transporte ´publico se eligieron al azar a 9 de ellos y se obtuvo los siguientes dato

7 8 9
2 9 13
220 551 949

tica empleada para estimar los costos en función del tiempo de operación. Estime el costo de mantenimiento para un autobús que tiene

( 〖 ( 〗 _1 ) ̂=70.92)
aumenta en promedio 70.92 soles el costo mensual de manetenimiento.

osto estimado de su mantenimiento es 391.5 soles

cada por las variaciones del tiempo de operación del autobús.


cuado para estimar el costo de mantenimiento.

autobuses que tienen 5 años de operación

eración es de 391.876 soles

un autobús que tiene 7 años de operación?

afirmar que los residuos cumplen la condición de normalidad.

ón sobre la cantidad vendida

20 21
52 48

as, cuando el precio del jamón es S/. 22.


nta estimada es de 44.486 kg.

precio del jamón

NEGATIVO PORQUE DISMINUYE EL REGRESOR

cuado para estimar las ventas.

do el precio de ventas es de 22 soles?

8 y 49.2 soles.
los residuales están normalmente distribuidos.

YAPA

que en la variable Y: costo de aplicación de encuestas (miles de soles) podrían influir de manera relevante las siguientes variables
ario (minutos), X3: edad del encuestador (en años). Con el fin de comprobar esta sospecha, elige, al azar, una muestra de 12
en la hoja de trabajo “Encuestas”.

ete el coeficiente estimado de la variable X2.

nuto más de llenado, el

riables en estudio. Use α = 0.03

el modelo lineal es adecuado para expresar la relación entre las variables de estudio.

e α = 0.03 Muestre los resultados numéricos que sustenten su respuesta.


entre el ausentismo (días), la edad (años) y el salario (miles de soles).
ntan en las columnas C1, C2 y C3 de la hoja de trabajo “Resort”

a variable salario

se incrementa el salario, el

el modelo lineal es apropiado.

ncia de un empleado que tiene 45 años de edad y un salario de 10.0 miles de soles.

con el comportamiento de la variable monto mensual de las exportaciones (millones de dólares) a Estados Unidos de Norteamérica (Y)
cción mensual de cobre en el Perú (miles de TM), X2: demanda mensual de productos agroindustriales en USA (miles de TM),
no en USA (millones de dólares). Suponiendo que los datos recopilados para una muestra de 15 meses se han registrado en la hoja

oras (predictoras), resuelva lo siguiente:

modelo de regresión? ¿por qué?


ariables regresoras resultan significativas en el modelo. Considere hipótesis, estadístico de prueba con sus valores, región crítica y conclu

U <2.1, +µ>
U <2.1, +µ>
U <2.1, +µ>

X1 y X3 son variables regresoras significativas en el modelo.

residuos y la no multicolinealidad de las variables independientes, mostrando los valores de los indicadores utilizados del reporte mini

los residuos siguen una distribución normal.

nsual, por cada mil TM que se incrementa en la producción mensual, el monto mensual de exportaciones aumenta, en promedio

ma parte del hallado, ¿cuánto hubiera sido el p-value y cuál sería su conclusión con estos valores?

cluiría que el modelo de regresión lineal múltiple no es el apropiado para expresar la relación entre estas variables.

s exportaciones, si X1=125, X2=245, X3=1.2.

ana está interesada en estudiar la relación entre el tiempo de entrega (minutos), respecto a la distancia hasta el punto de entrega (km), pe
ha obtenido una muestra de datos registrados en la hoja de trabajo “Entregas”. Considerando donde sea necesario un nivel de significanc

e prueba, región crítica y resultados.


Coeficientes
Coef EE del coef. IC de 98% Valor T Valor p
U <2.3, +µ> Constante -97.4 54.1 (-244.5; 49.6) -1.8 0.099
U <2.3, +µ> Distancia 5.16 1.56 (0.92; 9.40) 3.31 0.007
U <2.3, +µ> Peso 4.18 1.24 (0.82; 7.54) 3.38 0.006
valor 0.46 1.58 (-3.84; 4.75) 0.29 0.778

la distancia y el peso son variables significativas en el modelo

carga e interprete su resultado. Considere fórmula con sus valores, resultado y conclusión.

de seguridad

n entre las variables involucradas? Considere hipótesis, estadístico de prueba con sus valores, región crítica, resultados e interpretación.

el modelo lineal es apropiado para expresar la relación entre las variables involucradas.

riación de la distancia y del peso?

distancia y del peso es 80.16%.

entrega que corresponde para una distancia de 24 kms. y peso de 32000 kg en la carga.

entre los valores de 143.57 y 191.58.


lidad de las variables independientes?.

de no multicolinealidad

s características de las familias que pagan sus gastos mensuales con cheques. El gerente considera que el número de cheques girados
reso familiar (X2 en miles de dólares) y el número de miembros de la familia (X3). Para analizar esta relación, se seleccionó una muestra
porte de MINITAB del análisis de regresión de los datos registrados fue:

miembros en la familia, por año que se incrementa en la edad del jefe de la familia, Y aumenta en 0.1141

lares incrementados en el ingreso familiar, Y aumenta en 1.8451

el modelo lineal es adecuado para estimar los valores de Y.


> U <2.17, +µ> H0: _𝑖=0 (𝑋_𝑖no es significativa)
> U <2.17, +µ> H1: _𝑖¹0 (𝑋_𝑖es significativa)
> U <2.17, +µ>

en la familia son variables significativas.

confianza?
s y se obtuvo los siguientes datos

ento para un autobús que tiene 5 años de operación.


las siguientes variables
na muestra de 12
s Unidos de Norteamérica (Y)
USA (miles de TM),
an registrado en la hoja
s valores, región crítica y conclusión

ores utilizados del reporte minitab

s aumenta, en promedio

sta el punto de entrega (km), peso de la carga


necesario un nivel de significancia del
FIV

1.99
1.18
1.76

ca, resultados e interpretación.


úmero de cheques girados
n, se seleccionó una muestra
1) a) Identifique la variable dependiente y la variable independiente de este caso. Represente mediante un diagra
permita analizar como la falla en los anillos en el lanzamiento ( 𝑌) es afectada por la temperatura del anillo en e

Y: Falla en los anillos en el lanzamiento (Variable dependiente)


X: Temperatura de los anillos en el momento del lanzamiento ( variable independiente)

= 2.905-0.0374X

El supuesto de colinealidad se cumple ya que FVI<10 y el de normalidad (falta a)

b) Construya el modelo de regresión logística binaria e interprete el coeficiente estimado del regresor. Represe

c) Estime la probabilidad de la falla en los anillos en el lanzamiento (probabilidad de éxito) y la respectiva venta

 ̂(55)= 1/(1+exp(-15.04+0.232*55))) = 0.9072

Ventaja= 0.9072 = 9.78


1-0.9072

Para una temperatura de 55 °F, la probabilidad estimada de que fallen los anillos es del 90.72%. Asimismo, la pro

d) Calcule e interprete el cociente de ventaja (𝑂𝑅) del regresor Temperatura de los anillos ( 𝑥).

OR=exp(-0.232)= 0.7928

Esto significa que por cada grado (°F) incrementado en la temperatura, la ventaja disminuye en 20,72%, es decir
2) CASO MISILES: En la pestaña “Misiles” del archivo Datos Lab 3 (Parte 2)_DE - 2022- 2.xlsx se presentan los resulta
El resultado de cada prueba de disparo es un éxito ( 𝑌 = 1) o un fracaso ( 𝑌 = 0). Responda a las siguientes pregunt

a) Construya un modelo de regresión logística binaria e interprete el coeficiente estimado del regresor. Estime

 ̂= 1/(1+exp(-(6.07-0.0177X)))

(_1:-0.0177.
) ̂ Por cada aumento de un km en la velocidad de disparo del misil, la probabilidad estimada de que fall

b) Estime la probabilidad de éxito del disparo de un misil y la respectiva ventaja ( 𝑂𝐷𝐷𝑆) cuando la velocidad de

 ̂(450)=1/(1+exp(-(6.07-0.0177*450))) = 0.13

Para una velocidad de 450 km/h, la probabilidad estimada de que falle la prueba de disparo es de 13,06%. Asimis

Ventaja= 0.1306= 0.1502


1-0.1306

c) Calcule e interprete el cociente de ventaja (𝑂𝑅) del regresor Temperatura de los anillos ( 𝑥)

Coeficiente= 0.9825 .= exp(-0.0177)

Esto significa que por cada km incrementado en la velocidad, la ventaja disminuye en 2.75%, es decir, la probabi

3) CASO AUTOMÓVILES: se hizo un estudio para investigar compras de automóviles nuevos. Se seleccionó una mue
familiar total (en dólares). Se hizo una encuesta de seguimiento 6 meses después, para determinar si en realidad
esta muestra se encuentran en la pestaña “Automóviles” del archivo Datos Lab 3 (Parte 2)_DE - 2022-2.xlsx. Resp

a) Construya un modelo de regresión logística binaria e interprete los coeficientes estimados de los regresores.

 ̂= 1/(1+exp(16.86-0.000274X1 - 1.239 X2))

(_1:0.000274.
) ̂ Por cada aumento de un dólar en el ingreso familiar total, la probabilidad estimada de que la famili

(_2:1.239. Por cada aumento de un año en la edad del auto más antiguo que posee la familia, la probabilidad estim
) ̂

b) Estime la probabilidad de que una familia haya comprado un nuevo automóvil y la respectiva ventaja ( 𝑂𝐷𝐷𝑆)

 ̂(68000,8) 1/(1+exp(16.86-0.000274*68000 - 1.239*8)).=0.99999


=
Ventaja= 0.9999= 9999.0000
1-0.9999
Dada una antigüedad del carro de 8 años y un ingreso familiar de 68 000 dólares, la probabilidad de comprar un n

c) Calcule e interprete el cociente de ventaja (𝑂𝑅) de cada uno de los regresores

Para B1= exp(0.000274)= 1.0003

Por cada aumento de un dólar en el ingreso familiar total, la probabilidad de que la familia compre el auto repect

(1.0003-1)*100=0.03 NO OLVIDAR

Para B2= exp(1.239)= 3.45

Por cada aumento de un año en la edad del auto , la probabilidad de que la familia compre el auto nuevo respect

(3.45-1)*100=2.45 NO OLVIDAR
so. Represente mediante un diagrama de dispersión la relación entre las variables y construya un modelo de regresión lineal simple que
a por la temperatura del anillo en el lanzamiento ( 𝑥). También verifique los supuestos del modelo e indique si el modelo lineal es adecua

nte estimado del regresor. Represente gráficamente este modelo.

p= Probabilidad de falla de los anillos de lanzamiento

 ̂= 1/(1+exp(-(15.04-0.232X)))

(_1:-2.32.
) ̂ Por cada aumento en un grado (°F), la probabilidad estimada de que fallen los anillos en el lanzamiento

lidad de éxito) y la respectiva ventaja ( 𝑂𝐷𝐷𝑆) cuando la temperatura de los anillos en el lanzamiento es 55 ℉.

llos es del 90.72%. Asimismo, la probabilidad de que fallen los anillos es 9.72 veces la probabilidad de que no fallen.

de los anillos ( 𝑥).

ntaja disminuye en 20,72%, es decir, la probabilidad que los anillos fallen durante el lanzamiento con respecto a que no fallen disminuye en
2022- 2.xlsx se presentan los resultados del disparo de 25 misiles antiaéreos (de superficie a aire) con diversas velocidades en km/hora.
. Responda a las siguientes preguntas:

ente estimado del regresor. Estime e interprete dicho coeficiente del regresor por medio de un intervalo del 97% de confianza.

a probabilidad estimada de que falle la prueba de disparo disminuye en 0.0177

taja ( 𝑂𝐷𝐷𝑆) cuando la velocidad de disparo es de 450 km/hora.

eba de disparo es de 13,06%. Asimismo, la probabilidad de que fallen los anillos es 0.1502 veces la probabilidad de que no fallen cuando la

de los anillos ( 𝑥)

nuye en 2.75%, es decir, la probabilidad que la prueba de disparo falle con respecto a que no falle disminuye en 2.75% .

iles nuevos. Se seleccionó una muestra de 20 familias que fueron encuestadas para determinar la edad del auto más antiguo que poseen (
ués, para determinar si en realidad habían comprado un nuevo vehículo en ese lapso ( 𝑌 = 1 indica que sí, mientras que 𝑌 = 0 indica no). Lo
b 3 (Parte 2)_DE - 2022-2.xlsx. Responda a las siguientes preguntas:

entes estimados de los regresores. Estime dichos coeficientes de los regresores por medio de intervalos de confianza del 94% de confia

babilidad estimada de que la familia compre un nuevo vehículo aumenta en 0.000274.

osee la familia, la probabilidad estimada de que compren unnuevo vehículo aumenta en 1.239.

móvil y la respectiva ventaja ( 𝑂𝐷𝐷𝑆) si dicha familia tiene un ingreso mensual total de 68 000 dólares y el automóvil más antiguo que pos
res, la probabilidad de comprar un nuevo vehiculo es del 99.99%,.Asimismo, la probabilidad de comprar un nuevo vehículo es 9999 veces

que la familia compre el auto repecto a que no la compre aumenta en 0.03%

milia compre el auto nuevo respecto a que no la compre aumenta en 245%.


o de regresión lineal simple que nos
ue si el modelo lineal es adecuado.

en los anillos en el lanzamiento disminuye.

cto a que no fallen disminuye en 20.72%.


sas velocidades en km/hora.

del 97% de confianza.

lidad de que no fallen cuando la velocidad es 450 km/h.

ye en 2.75% .

l auto más antiguo que poseen (en años) y el ingreso


mientras que 𝑌 = 0 indica no). Los datos de

de confianza del 94% de confianza

automóvil más antiguo que posee tiene 8 años.


n nuevo vehículo es 9999 veces la probabilidad de no comprarlo.
1 Andrea es fabricante de billeteras y morrales de cuero. Con la finalidad de conocer mejor el mercado, realizó un
clientes, de donde se obtuvieron los siguientes resultados:

Provincia donde reside


Lima Metropolitana Callao
Tipo de producto
Género
Masculino Femenino Masculino Femenino
Billetera 50 15 30 10
Morral 65 20 70 40

¿La proporción de hombres que prefieren la billetera en Lima Metropolitana es menor que la proporción de ho

p1=Proporción de hombres que prefieren la billetera en Lima Metropolitana


p2=Proporción de hombres que prefieren la billetera en el Callao

y1=número de hombres que que prefieren la billetera en Lima Metropolitana en la muestra de tamaño n 1 donde
y2=número de mujeres que ven el programa en la muestra de tamaño n 2 donde n2=100, y1=30

i) Definir hipótesis

H0: p1=p2
H0: p1<p2

Valor crítico

−𝑧(1−a)= -1.96 RC= <-µ,-1.96>

Valor estadístico de prueba


𝑍_0=(𝑃 ̅_1−𝑃 ̅_2)/√((𝑝 ̂(1−𝑝 ̂))/𝑛_1 +(𝑝 ̂(1−𝑝 ̂))/𝑛_2 ) (0.4348−0.3)/√(0.2336/115+0.2336/100)
= =2.04

𝑝 ̂=(𝑦_1+𝑦_2)/(𝑛_1+𝑛_2 0.3721
)=80/215 =
Regla de decisión

Como Z0>-z(1-a), z0 no pertenece a RC, por lo tant no se debe rechazar H0.

Conclusión:

Con un nivel de significancia de 2.5%, no existe evidencia estadística para afirmar que la proporción de hombres

2) En una fábrica se producen 2 productos en 2 turnos de trabajo. El ingeniero sospecha que en el turno de la tarde
Para verificar la sospecha del ingeniero, se tomó una muestra aleatoria de cada turno de trabajo, de donde se ob
Producto
A B
Turno
Condición
Defectuosos Buenos Defectuosos Buenos
Mañana 20 200 50 300
Tarde 5 150 25 200

¿Cuál es su conclusión con un 5% de significancia?

p1= proporción de artículos defectuosos producidos en la tarde


p2= proporción de artículos defectuosos producidos en la mañana

y1=número de artículos defectuosos producidos en la tarde en la muestra de tamaño n 1 donde n1=155, y1=5
y2=número de artículos defectuosos producidos en la mañana en la muestra de tamaño n 2 donde n2=225, y1=25

i) Definir hipótesis

H0: p1=p2
H0: p1<p2

P valor 0.0025

pvalor < 0.05 se debe rechazar H0

Conclusión

Con un nivel de significancia de 5%, existe evidencia estadística para afirmar que en el turno de la tarde se produ

3) Una empresa estima que una nueva presentación de su producto aumentará las ventas. Para ello toma una mue
al mes, antes (1) y después (2), de la nueva presentación. Los resultados se presentan a continuación:

Jóvenes 1 2 3 4
Antes (1) 20 10 26 8
Después (2) 35 15 40 10

A un nivel de significación del 4%, ¿se puede afirmar que las ventas aumentaron debido a la nueva presentación?

X1~N(μ1_1^2
, ) : Número de unidades del producto consumidas al mes antes de la nueva presentación
X2~N(μ2_2^2
, ) : Número de unidades del producto consumidas al mes después de la nueva presentación

i) Definir hipótesis μD = μ1 - μ2

H0: μD=0
H0: μD<0

Valor crítico
−𝑡(1−𝛼, 𝑛−1)= .-t(0.96,5)= -2.19

RC=<-µ,-2.19>

Valor estadístico de prueba

(−8.
T0=𝐷 ̅/ = 33)/ .= -3.39
(𝑆_𝐷/
√𝑛) (6.02
2/
√6)
Regla de decisión

Como T0<-t(0.96,5), T0 pertenece a RC, por lo tanto se debe rechazar H0

Conclusión

Con un nivel de significancia de 4%, existe evidencia estadística para afirmar que las ventas aumentaron debido a

2 El huerto Valle Hermoso desea determinar si un abono incrementa la producción de naranjas (kg). Se elige al aza
Los datos obtenidos son los siguientes:

Árboles 1 2 3 4
Antes 10 8 5 2
Después 12 7 6 8

A un nivel de significación del 1%, pruebe si hubo un aumento en la producción.

X1~N(μ1_1^2
, ) : Producción de naranjas (kg) antes de abonar los árboles
X2~N(μ2_2^2
, ) :Producción de naranjas (kg) después de abonar los árboles

i) Definir hipótesis
-2.625
H0: μD=0 3.24862608
H0: μD<0

Valor crítico

−𝑡(1−𝛼, 𝑛−1)= .-t(0.99,7)= -3.00

RC=<-µ,-3>

Valor estadístico de prueba

T0=𝐷 ̅/ = (−2.62
.= -2.28
(𝑆_𝐷/ 5)/
√𝑛) (3.25/
√8)
Regla de decisión

Como T0>-t(0.99,7), no pertenece a RC, por lo tanto no se debe rechazar H0

Conclusión

Con un nivel de significancia de 1%, no existe evidencia estadística para afirmar que el abono incrementó la prod

Chi cuadrado

Un servicio de delivery tiene tres locales desde los que parten los pedidos recibidos por sus clientes. Con el fin de
obteniéndose los siguientes resultados:

Local A Local B Local C


Entregados a tiempo 150 200 330
Entregados con retraso 50 100 70
Total 200 300 400

Se desea probar si la proporción de pedidos entregados a tiempo es la misma en los tres locales, usando un nivel

H0: pA=pB=pC
H1: H0 no es verdadero
Prueba de chi-cuadrada
Valor estadístico = 23.312 Chi-cuadrada
Pearson
P valor= 0 Relación de v

p valor<a, por lo tanto se debe rechazar H0

Conclusión:

Con un nivel de significancia de 2%, no existe evidencia estadística para afirmar que la proporción de pedidos ent

2 Dos de las preguntas de un estudio aplicado a una muestra de suscriptores de una revista de negocios fueron: “D
Y ¿Qué tipo de viaje realizó?”. Las respuestas obtenidas se tabularon en la Tabla 1.

Tipo de viaje
Tipo de vuelo
Comercial Técnico De formación
Primera clase 20 25 15
Clase de negocios 92 108 130
Clase económica 420 322 240

Usando un nivel de significación 0.03, probar si existe relación entre el tipo de vuelo y el tipo de viaje. Presentar l

H0: El tipo de vuelo y el tipo de viaje no tienen relación (son independientes)


H1: El tipo de vuelo y el tipo de viaje tienen relación (son dependientes)

Valor estadístico de prueba


Según minitab= 35.865

P valor= 0

como pvalor<a, se debe rechazar H0

Conclusión

Con un nivel de significancia de 3%, existe evidencia estadística para afirmar que existe relación entre el tipo de v

1 El conjunto de datos CarPrice.mpx será usado para obtener un modelo de regresión que permita estimar Y = prec

X1 = Distancia entre ejes X2 = Longitud del auto X3 = Ancho del auto X4 = Altura del auto Responda a las siguient

a) Obtener un modelo de regresión lineal múltiple considerando todas las variables predictoras disponibles. Evalu
Presentar la hipótesis estadística, el estadístico de prueba, el p-valor y las conclusiones.

H0: _1= _2=_3=0 (El modelo lineal no es adecuado)


H1: Al menos un ¹0 (El modelo lineal es adecuado )

alfa=0.04
p valor= 0

Rechazamos H0

con un nivel de significancia de 4%, existe evidencia estadística para afirmar que el modelo es significativo

b) ¿Existen problemas de multicolinealidad en el modelo obtenido en la pregunta anterior? Complete la tabla SÓ

Ho: Cumple el supuesto de no multicolinealidad


H1: No Cumple con el supuesto de no multicolinealidad

Variable Indicador Conclusiones


X1
X2
X3
X4
X5 11.92 existe multicolinealidad
X6
X7
X8

c) Aplicar el método de regresión por pasos considerando alfa a entrar = 0.15 y alfa a salir = 0.15. Presentar el mo

Ecuación de regresión
Y = -65743 - 74.6 X2 + 659 X3 + 258 X4 + 3.40 X5 + 101.7 X6 + 31.5 X7 + 1.9
d) Considerando las variables predictoras del modelo obtenido con el método de regresión por pasos, estime el p

2 Se recolectó información de 8 ferreterías de Lima Metropolitana que vendieron lijas de pared durante el último m

Venta de lijas en el mes pasado (unidades vendidas)


 Precio de venta por lija de pared (en soles)
 Antigüedad de la ferretería (en años)
 Número de trabajadores en la ferretería

) Obtener un modelo de regresión lineal múltiple considerando todas las variables predictoras disponibles. ¿El m
Presente las hipótesis, el estadístico de prueba, valor p y la conclusión usando un nivel de significación del 2%

1 El conjunto de datos Prestamo tiene información relacionada con las solicitudes de préstamos recibidas por una
cuando se acepta la solicitud de préstamo, y 0 cuando se rechaza la solicitud de crédito. Las variables predictoras

Estimar el modelo de regresión logística que incluya todas las variables predictoras disponibles. Use nivel de si

p= Probabilidad de aceptar la solicitud de préstamo

 ̂= 1/(1+exp(-(1.034 - 0.000002 X1 - 0.000038 X2 - 0.003366 X3 + 0.001150 X4 + 0.029 X5)))

b. En el modelo construido, ¿cuál de las variables predictoras tiene el odds ratio mayor que uno? Interpretar su

c. Estimar la probabilidad de que la solicitud de préstamo de un cliente sea aceptada considerando la siguiente

 ̂= 1/(1+exp(-(1.034 - 0.000002 X1 - 0.000038 X2 - 0.003366 X3 + 0.001150 X4 + 0.029 X5)))

4166 3449 116 360 3

2 El conjunto de datos Doctorado.mpx contiene información proveniente de una encuesta a 30 candidatos a progr
Aceptación (cuyos valores son 1 cuando el candidato fue aceptado al programa de doctorado y 0 cuando no fue a

x1: cantidad de artículos publicados en revistas de autoría del candidato.


x2: años de actividades de investigación del candidato.
x3: edad del candidato.

Se tiene como objetivo analizar que tanto influyen estos regresores en la aceptación de candidatos a programas

Presente el modelo de regresión logística binaria estimado que incluya todos los regresores disponibles. Con este
i se incrementa en un año la actividad de investigación (x2) de un candidato y se mantienen constantes los otros

 ̂= 1/(1+exp(-(-4.77 + 1.099 Artículos publicados (x1) + 0.295 Años como investigador (x2)-0.0279Edad(x3))))

Porcentaje de aumento (o disminución) de la ventaja según lo solicitado (mostrar el cálculo):

ORX2 .=1.3434

(1.3434-1)*100= 34.34%

Por cada aumento de un año a la actividad de investigación de candidato, la ventaja aumenta en 34.34%, la prob
La ventaja del modelo aumenta

Con el modelo construido en la pregunta (a), estime la probabilidad de que un candidato de 43 años, que ha teni
publicados en revistas sea aceptado en el programa de doctorado en una universidad de EE.UU. Además, determ

 ̂(5,7,43)= 1/(1+exp(-(-4.77 + 1.099 (5) + 0.295 (7)-0.0279(43))))

 ̂(5,7,43)= 0.8307

VENTAJA ODDS= 0.83057 4.90


1-0.8307

La probabilidad de que el candidato que tiene 5 artículos publicados, 7 años de experiencia y 43 años sea acepta
onocer mejor el mercado, realizó un estudio para conocer la preferencia de sus clientes. Para tal fin, se seleccionó una muestra aleatoria d

na es menor que la proporción de hombres que prefiere la billetera en el Callao? Utilice un 2.5% de significancia.

a en la muestra de tamaño n 1 donde n1=115, y1=50


nde n2=100, y1=30

+0.2336/100)

rmar que la proporción de hombres que prefieren la billetera en Lima Metropolitana es menor que la proporción de hombres que prefiere

sospecha que en el turno de la tarde se producen artículos con un menor porcentaje de unidades defectuosas que en el turno de la mañan
ada turno de trabajo, de donde se obtuvieron los siguientes resultados:
e tamaño n 1 donde n1=155, y1=5
de tamaño n 2 donde n2=225, y1=25

que en el turno de la tarde se producen artículos con un menor porcentaje de unidades defectuosas que en el turno de la mañana.

á las ventas. Para ello toma una muestra de seis jóvenes, a los cuales se les ha preguntado por el número de unidades del producto consum
presentan a continuación:

5 6D
10 15 -15 -5 -14 -2 -12 -2
22 17

aron debido a la nueva presentación?

de la nueva presentación
és de la nueva presentación

prom D -8.33333333
6.02218122
que las ventas aumentaron debido a la nueva presentación

cción de naranjas (kg). Se elige al azar 8 árboles y se registra su producción de antes (1) y después (2) de que se abonó los árboles.

5 6 7 8D
3 7 3 3 -2 1 -1 -6
9 8 10 2
mar que el abono incrementó la producción de naranjas (kg).

cibidos por sus clientes. Con el fin de evaluar el servicio se seleccionan muestras aleatorias independientes de pedidos en sus tres locales

a en los tres locales, usando un nivel de significación del 2%. Presentar las hipótesis estadísticas, el valor del estadístico de prueba, p-valor

rueba de chi-cuadrada
GL Valor p
23.312 4 0
23.245 4 0

mar que la proporción de pedidos entregados a tiempo es la misma en los tres locales

de una revista de negocios fueron: “Durante los últimos 12 meses, en viajes de negocios, ¿qué tipo de vuelo utilizó con más frecuencia?

de vuelo y el tipo de viaje. Presentar las hipótesis estadísticas, el valor del estadístico de prueba, el p-valor y la conclusión en términos del p

10.7119
Prueba de chi-cuadrada
Chi-cuadradaGL Valor p
Pearson 35.865 4 0
Relación de v 35.282 4 0

que existe relación entre el tipo de vuelo y el tipo de viaje

gresión que permita estimar Y = precio de un auto sobre la base de algunas de sus características. Las variables predictoras consideradas s

ura del auto Responda a las siguientes preguntas: X5 = Peso del auto X6 = Tamaño del auto X7 = Potencia del auto X8 = Revoluciones por m

riables predictoras disponibles. Evaluar el modelo obtenido usando un nivel de significación del 4%.

que el modelo es significativo

gunta anterior? Complete la tabla SÓLO para las variables que presentan multicolinealidad.

5 y alfa a salir = 0.15. Presentar el modelo de regresión obtenido al final del proceso

+ 3.40 X5 + 101.7 X6 + 31.5 X7 + 1.913 X8


o de regresión por pasos, estime el precio de un auto que tiene las siguientes características:

ron lijas de pared durante el último mes. Los datos recolectados se encuentran en el archivo Lijas.mwx y corresponden a las siguientes var

iables predictoras disponibles. ¿El modelo posee al menos una variable predictora significativa para la variable respuesta?
do un nivel de significación del 2%

des de préstamos recibidas por una entidad bancaria. La variable respuesta es Solicitud, cuyos valores son 1,
de crédito. Las variables predictoras potenciales son:

dictoras disponibles. Use nivel de significancia de 4%

X4 + 0.029 X5)))

ratio mayor que uno? Interpretar su valor en términos de la variable correspondiente.

aceptada considerando la siguiente información:

X4 + 0.029 X5)))

na encuesta a 30 candidatos a programas de doctorados de diversas universidades de EE.UU. en el año 2020. La variable respuesta (Y) es
ma de doctorado y 0 cuando no fue aceptado) que dependería de los regresores:
eptación de candidatos a programas de doctorado en EE.UU. Con la información dada, responda las siguientes preguntas:

s los regresores disponibles. Con este modelo construido, ¿en qué porcentaje aumenta (o disminuye) la ventaja del modelo s
y se mantienen constantes los otros dos regresores (x1 y x3)?

vestigador (x2)-0.0279Edad(x3))))

ostrar el cálculo):

ventaja aumenta en 34.34%, la probabilidad de que el candidato sea aceptado al programa de doctorado respecto a que sea rechazado au

un candidato de 43 años, que ha tenido 7 años de experiencia en investigación y es autor de 5 artículos


niversidad de EE.UU. Además, determine e interprete la ventaja resultante (en términos del caso de estudio).

de experiencia y 43 años sea aceptado por el programa de doctorado, es 4.9 veces la probabilidad de que no sea aceptado.
eccionó una muestra aleatoria de

porción de hombres que prefiere la billetera en el Callao

osas que en el turno de la mañana.


en el turno de la mañana.

e unidades del producto consumidas


ue se abonó los árboles.

-6 -1 -7 1
s de pedidos en sus tres locales

el estadístico de prueba, p-valor y conclusión.

o utilizó con más frecuencia?

y la conclusión en términos del problema.


ables predictoras consideradas son:

del auto X8 = Revoluciones por minuto


orresponden a las siguientes variables:

able respuesta?

20. La variable respuesta (Y) es


ntes preguntas:

ntaja del modelo s

respecto a que sea rechazado aumenta en 34.34%.

no sea aceptado.
Un equipo de investigadores está evaluando el impacto del consumo de una vitamina (a base de hierro) durante
de esta vitamina incrementa significativamente el nivel de hemoglobina de los niños. Para comprobar dicha sosp
mide el nivel de hemoglobina antes de consumir la vitamina (Sin vitamina (1)) y después de consumir las vitamin
obteniéndose los siguientes resultados (g/dL):

Considere poblaciones normales. Si se realiza la prueba de hipótesis respectiva, con 6% de nivel de significación,

Hemoglobina 1 2 3 4 5
Sin vin 7.8 10.9 9.1 12.6 10.2
Con vin 9.1 11.2 9.2 12.9 10.4
D -1.3 -0.3 -0.1 -0.3 -0.2
X1~N(μ1_1^2
, ) : Nivel de hemoglobina antes de consumir la vitamina(Sin vitamina(1)) (en g/dL)
X2~N(μ2_2^2
, ) : Nivel de hemoglobina después de consumir la vitamina(Con vitamina(2)) (en g/dL)

i) Definir hipótesis μD = μ1 - μ2

H0: μD=0
H0: μD<0

ii) Valores críticos

−𝑡(1−𝛼, 𝑛−1)=-t(0.94,7)=-1.77

RC=<-µ,1.77>

iii) Valor estadístico de prueba

T0=𝐷 ̅/ =(−0.51)/(0.42/√8)
.= -3.43
(𝑆_𝐷/
√𝑛)

SD= 0.4155461
𝐷 ̅.=-0.5125

iv) Regla de decisión

Como T0<-t(0.94,7), T0 pertenece a RC por lo tanto se debe rechazar H0

v) Conclusión

Con un nivel de significancia de 6%, existe evidencia estadística para confirmar la sospecha del equipo de investig

2) Una empresa que produce bolsas de detergente evalúa el cumplimiento de la especificación del peso de las bolsa
(Población 2). Se seleccionan dos muestras independientes de bolsas de detergentes en cada una de las dos plan
Considerando un nivel de significación de 0.04, ¿existe evidencia suficiente para afirmar que la proporción de det
a la proporción de la planta de Colombia (2)? Realice la prueba de hipótesis necesaria y responda a la siguiente p

Perú 150 12
Colombia 120 18

p1= Proporción de bolsas de detergente inspeccionadas en la planta de Perú


p2= Proporción de bolsas de detergente inspeccionadas en la planta de Colombia

y1=Número de bolsas de detergente con menos peso que lo especificado en la planta de Perú en la muestra de ta
y2=número de bolsas de detergente con menos peso que lo especificado en la planta de Colombia en la muestra

i) Definir hipótesis

H0: p1=p2
H0: p1<p2

ii) Valores críticos

−𝑧(1−a)=-z(0.96)= 1.75

RC=<-µ,1.75>

iii) Valor estadístico de prueba


𝑍_0=(𝑃 ̅_1−𝑃 ̅_2)/√((𝑝 ̂(1−𝑝 ̂))/𝑛_1 +(𝑝 ̂(1−𝑝 ̂))/𝑛_2 )
(0.08−0.15)/√(0.099/150+0.099/120)
= = -1.82

𝑝 ̂=(𝑦_1+𝑦_2)/(𝑛_1+𝑛_2 30/270 =
)=(12+18)/(150+120) 0.11111
=
iv) Regla de decisión

Como Z0<-Z(1-a), Z0 pertenece a RC, por lo tanto se debe rechazar H0

3) En un almacén de un terminal portuario se despachan contenedores de importación a camiones de carga a lo lar


que se elaboró la siguiente tabla que presenta información sobre el número de camiones que llegan por hora a d
Con un nivel de significación del 3%, ¿el número de camiones que llegan por hora al almacén del terminal portua

Número de camiones que Número de horas


llegan por hora
0 12
1 15
2 20
3 14
4 14
5 10

i) Definir hipótesis

H0: El número de camiones que llegan por hora al almacén del terminal portuario siguen una distribución de Pois
H1: El número de camiones que llegan por hora al almacén del terminal portuario no siguen una distribución de P

ii) Valores críticos

Sea uniulateral superior  ̂= 2.39

𝑋_((1−0.03,𝑘−𝑝−1))^2
𝑋_((1−0.03,6−2.39−1))^2
.= 𝑋_((0.97,2.61))^2
.= .=8.22

RC= <8.22,+µ>

iii) Valor estadístico de prueba


∑26_(𝑖=1)^𝑘▒((
𝑋_0 .= 5.568
^2=〖𝑂 _𝑖−𝐸_𝑖) 〗 ^2
)/𝐸_𝑖

iv) Regla de decisión

Como 𝑋_((0.97,2.61))^2
X0< , X0 no pertenece a RC, por lo tanto no se debe rechazar H 0

v)Conclusión

Con un nivel de significancia de 3%, existe evidencia estadística para afirmar que el número de camiones que lleg

4) Una organización que estudia temas ambientales realizó un estudio para determinar si el sector habitacional de r
Una muestra aleatoria de 300 personas de dicha ciudad (a las que se les examinó) proporcionó los siguientes res

Sector Grado de contaminación


habitacional Alto Medio Bajo
Zona de parques 18 6 12
Zona de playa 42 24 30
Grandes vías 36 72 60

Con un nivel de significancia del 4% se realiza la prueba correspondiente.

H0: El sector habitacional de residencia y el grado de contaminación por el plomo no tienen relación (son indepen
H1: El sector habitacional de residencia y el grado de contaminación por el plomo tienen relación (son dependien

ii) Valor crítico

a=0.04 I=3 J=3

𝑋_((1−𝑎,(𝐼−1)∗(𝐽−1)))^2
𝑋_((0.96,4))^2
.= .=10.02552
RC=<10.71,+µ>

iii) Valor estadístico de prueba

Según mini tab: 23.362

iv) Regla de decisión

𝑋_((0.97,4))^2
Como X0> ,X0 pertenece a RC, por lo tanto, se debe rechazar H0

v) Conclusión

Con un nivel de significancia de 4%, existe evidencia estadística para afirmar que el sector habitacional de residen

5) En un proceso de fabricación de tornillos, el fabricante quería determinar si la proporción de tornillos defectuoso


Para verificar esto se seleccionaron muestras de 400 tornillos de la producción de cada máquina y se contó el nú

Máquina
Calidad Total
1 2 3
Defectuosos 16 24 9 49
No defectuosos 384 376 391 1151
Total 400 400 400 1200

Con 5% de significación, verifique si la proporción de tornillos con cada tipo de calidad varía entre las diferentes m

H0= p1=p2=p3
H1= H0 no es verdadero

ii) Valor crítico

a=0.05 I=3 J=2

𝑋_((1−𝑎,(𝐼−1)∗(𝐽−1)))^2
𝑋_((0.95,2))^2
.= .=5.991465

RC=<6.44+µ>

iii) Valor estadístico de prueba

Según mini tab: 7.192

iv) Regla de decisión

𝑋_((0.95,2))^2
Como X0> ,X0 pertenece a RC, por lo tanto, se debe rechazar H0

v) Conclusión
Con un nivel de significancia de 5%, existe evidencia estadística para aceptar que la proporción de tornillos con c
vitamina (a base de hierro) durante un mes en niños que sufren de anemia. Este equipo sospecha que, en promedio, el consumo
os niños. Para comprobar dicha sospecha, se seleccionan aleatoriamente 8 niños que sufren de anemia y se les
)) y después de consumir las vitaminas (Con vitamina (2), esto se mide dos semanas después de finalizar la dosis de vitamina),

va, con 6% de nivel de significación, ¿será posible confirmar la sospecha del equipo de investigadores? Responda a las siguientes pregunta

6 7 8D
8.3 11.6 7.2
9 11.9 8.1
-0.7 -0.3 -0.9
mina(1)) (en g/dL)
itamina(2)) (en g/dL)

ar la sospecha del equipo de investigadores, pues el consumo de esta vitamina incrementa significativamente el nivel de hemoglobina de

a especificación del peso de las bolsas de detergente (peso mínimo de 400 g) en su planta de Perú (Población 1) y de Colombia
ergentes en cada una de las dos plantas, tal y como se muestra a continuación:
para afirmar que la proporción de detergentes fuera de especificación en la planta de Perú (1) es inferior en comparación
necesaria y responda a la siguiente pregunta:

la planta de Perú en la muestra de tamaño n 1 donde n1=150, y1=12


la planta de Colombia en la muestra de tamaño n 2 donde n2=120, y2=18

ortación a camiones de carga a lo largo del día. Se seleccionó una muestra aleatoria de 85 horas (durante un año) con la
de camiones que llegan por hora a dicho almacén:
hora al almacén del terminal portuario sigue una distribución de Poisson?
uario siguen una distribución de Poisson
uario no siguen una distribución de Poisson

que el número de camiones que llegan por hora al almacén del terminal portuario siguen una distribución de Poisson

erminar si el sector habitacional de residencia se relaciona con el grado de contaminación por plomo en una ciudad del país.
minó) proporcionó los siguientes resultados:

omo no tienen relación (son independientes)


omo tienen relación (son dependientes)
que el sector habitacional de residencia y el grado de contaminación por el plomo tienen relación, es decir, son dependientes.

a proporción de tornillos defectuosos producidos por tres máquinas variaba de una máquina a otra.
ón de cada máquina y se contó el número de tornillos defectuosos en cada una, obteniendo la siguiente tabla de frecuencias.

de calidad varía entre las diferentes máquinas. Utilizando la tabla indique la respuesta correcta.
que la proporción de tornillos con cada tipo de calidad varía entre las diferentes máquinas.
promedio, el consumo

dosis de vitamina),

ponda a las siguientes preguntas:

nte el nivel de hemoglobina de los niños.

ión 1) y de Colombia
n comparación

un año) con la
de Poisson

na ciudad del país.


r, son dependientes.

bla de frecuencias.

También podría gustarte