Documentos de Académico
Documentos de Profesional
Documentos de Cultura
N .C .=95 % (0.95)
n=154
~
x=4367.66
σ =4550.89
Con estos datos calculamos el intervalo de confianza:
Z=1.96
Z∗σ
I . C .=~x ±
√n
1.96∗4550.89
I . C .=4367.66 ± =[3648.89−5086.43]
√ 154
Esto nos indica, que con un 95% de confianza, el total de casos confirmados en Colombia se
encuentra entre los valores de 3649 y 5086.
N .C .=95 % (0.95)
n=154
~
x=133.97
σ =115.50
Con estos datos calculamos el intervalo de confianza:
Z=1.96
Z∗σ
I . C .=~x ±
√n
1.96∗115.50
I . C .=133.97 ± =[ 115.73−152.51]
√ 154
Esto nos indica, que con un 95% de confianza, el total de casos de recuperados en Colombia se
encuentra entre los valores de 116 y 156.
N .C .=95 % (0.95)
n=154
~
x=15939.99
σ =34107.10
Con estos datos calculamos el intervalo de confianza:
Z=1.96
Z∗σ
I . C .=~x ±
√n
1.96∗34107.10
I . C .=15939.99± =[10553.07−21326.91]
√ 154
Esto nos indica, que con un 95% de confianza, el total de fallecidos en Colombia se encuentra entre
los valores de 10553 y 21327.
Se observa que los todos los valores de la muestra se encuentran dentro de los intervalos de
confianza calculados, por lo que podemos decir que el diseño muestral realizado presenta un nivel
alto de calidad.
2. Existe la creencia de que el valor medio de las estadísticas obtenidas con base en lo reportado los
domingos y lunes, sobre casos confirmados, casos recuperados y fallecidos, versus el valor medio
estimado de los demás días de la semana, para esas mismas variables, presenta diferencias
significativas. De confirmarse esa creencia, ¿cuáles podrían ser las explicaciones de ese
comportamiento?
Prueba de hipótesis: los casos confirmados, casos recuperados y fallecidos, presentan diferencias
significativas para los datos reportados domingos y lunes con los demás días de la semana.
H 0 : μ1=μ2
H a : μ 1 ≠ μ2
4425.13−4347.97
Z c= =0.15
√ 4552.902 4559.252
154
+
154
135.74−133.53
Z c= =0.17
√
2 2
115.22 115.75
+
154 154
16148.58−15909.65
Z c= =0.06
√ 34283.082 34217.022
154
+
154
Todos los valores de Z se encuentran dentro del rango de valores de Z crítico [-1.96 – 1.96], por lo
tanto, se acepta la hipótesis nula, por lo que podemos decir que con un nivel de confianza de 95%,
que los casos confirmados, casos recuperados y fallecidos, para los días domingos y lunes, y para los
demás días de la semana, no presenta diferencias significativas su valor estimado.
3. Se considera valioso y de bastante utilidad práctica, el poder contar con modelo simple pero
eficiente, que permita pronosticar el número de fallecidos diariamente. Un experto sugiere que si se
consideran las correlaciones lineales entre los diversos pares de variables en escala de razón, que
aparecen en el archivo, se podría encontrar un óptimo modelo lineal simple que explique
mayormente la variable que se quiere pronosticar.
a) De acuerdo con el ejercicio anterior, cuáles serían las variables dependiente e independiente que
incluiría en el modelo. Justifique su elección.
En el estudio de regresión lineal la variable dependiente sería el número de muertes, mientras que
las variables independientes serían el número de días, el número de nuevos casos, número de
recuperados. El número de PCR y la proporción de hombres fallecidos.
Modelo Valor de R2
Número de fallecidos vs Número de días 0.0941
Número de fallecidos vs Número de nuevos 0.0541
casos
Número de fallecidos vs Número de 0.0901
recuperados
Número de fallecidos vs Número de PCR 0.0192
Número de fallecidos vs Proporción de hombres 0.0164
muertos
Se observa que el mejor modelo a aplicar es que relaciona las variables Número de fallecidos y
Número de días, esto debido a que es la regresión que presenta el mayor valor de R 2.
200000
100000
-200000
-300000
-400000
Número de fallecidos vs Número de nuevos casos
300000
200000
100000
-200000
-300000
-400000
200000
100000
-200000
-300000
-400000
200000
100000
f(x) = 0.64326184229022
0 x + 13041.5076299766
-20000 -10000R² = 0.0191692002955932
0 10000 20000 30000 40000
-100000
-200000
-300000
-400000
Número de fallecidos vs Propoción de hombres
muertos
300000
200000
100000
-200000
-300000
-400000
Las hipótesis que se deberían comprobar es si el modelo de regresión lineal que relaciona las
variables Número de fallecidos y Número de días, es el mejor modelo de los cinco posibles.
En realidad, podemos considerar que ninguno de los modelos es lo suficientemente bueno para
describir de manera correcta la relación entre las dos variables debido a su bajo grado de correlación,
sin embargo, de los 5 modelos encontrados, el que mejor representa esta relación es:
y=2.6189 x +3751.9
Donde x representa el Número de días y la variable y, representa el Número de fallecidos.