Está en la página 1de 5

1. Con una confiabilidad del 0.

95 (o 95 %) es necesario conocer entre qué valores mínimos y


máximos, se encuentra el total de casos confirmados en Colombia, el total de casos recuperados y el
total de fallecidos. Compare esos resultados con la realidad; evalúe y comente sobre la calidad del
diseño muestral utilizado.

Total de casos confirmados en Colombia:

Calculamos el promedio y la desviación estándar:

N .C .=95 % (0.95)
n=154
~
x=4367.66
σ =4550.89
Con estos datos calculamos el intervalo de confianza:

Z=1.96
Z∗σ
I . C .=~x ±
√n
1.96∗4550.89
I . C .=4367.66 ± =[3648.89−5086.43]
√ 154
Esto nos indica, que con un 95% de confianza, el total de casos confirmados en Colombia se
encuentra entre los valores de 3649 y 5086.

Total de casos de recuperados en Colombia:

Calculamos el promedio y la desviación estándar:

N .C .=95 % (0.95)
n=154
~
x=133.97
σ =115.50
Con estos datos calculamos el intervalo de confianza:

Z=1.96
Z∗σ
I . C .=~x ±
√n
1.96∗115.50
I . C .=133.97 ± =[ 115.73−152.51]
√ 154
Esto nos indica, que con un 95% de confianza, el total de casos de recuperados en Colombia se
encuentra entre los valores de 116 y 156.

Total de fallecidos en Colombia:

Calculamos el promedio y la desviación estándar:

N .C .=95 % (0.95)
n=154
~
x=15939.99
σ =34107.10
Con estos datos calculamos el intervalo de confianza:
Z=1.96
Z∗σ
I . C .=~x ±
√n
1.96∗34107.10
I . C .=15939.99± =[10553.07−21326.91]
√ 154
Esto nos indica, que con un 95% de confianza, el total de fallecidos en Colombia se encuentra entre
los valores de 10553 y 21327.

Se observa que los todos los valores de la muestra se encuentran dentro de los intervalos de
confianza calculados, por lo que podemos decir que el diseño muestral realizado presenta un nivel
alto de calidad.

2. Existe la creencia de que el valor medio de las estadísticas obtenidas con base en lo reportado los
domingos y lunes, sobre casos confirmados, casos recuperados y fallecidos, versus el valor medio
estimado de los demás días de la semana, para esas mismas variables, presenta diferencias
significativas. De confirmarse esa creencia, ¿cuáles podrían ser las explicaciones de ese
comportamiento?

Prueba de hipótesis: los casos confirmados, casos recuperados y fallecidos, presentan diferencias
significativas para los datos reportados domingos y lunes con los demás días de la semana.

H 0 : μ1=μ2

H a : μ 1 ≠ μ2

Días domingos y lunes:

Promedio Desviación estándar


Casos confirmados 4425.13 4552.90
Casos de recuperados 135.74 115.22
Casos de fallecidos 16148.58 34283.08

Demás días de la semana:

Promedio Desviación estándar


Casos confirmados 4347.97 4559.25
Casos de recuperados 133.53 115.75
Casos de fallecidos 15909.65 34217.02

Calculamos el valor de Z para cada caso:

4425.13−4347.97
Z c= =0.15

√ 4552.902 4559.252
154
+
154
135.74−133.53
Z c= =0.17


2 2
115.22 115.75
+
154 154
16148.58−15909.65
Z c= =0.06

√ 34283.082 34217.022
154
+
154
Todos los valores de Z se encuentran dentro del rango de valores de Z crítico [-1.96 – 1.96], por lo
tanto, se acepta la hipótesis nula, por lo que podemos decir que con un nivel de confianza de 95%,
que los casos confirmados, casos recuperados y fallecidos, para los días domingos y lunes, y para los
demás días de la semana, no presenta diferencias significativas su valor estimado.
3. Se considera valioso y de bastante utilidad práctica, el poder contar con modelo simple pero
eficiente, que permita pronosticar el número de fallecidos diariamente. Un experto sugiere que si se
consideran las correlaciones lineales entre los diversos pares de variables en escala de razón, que
aparecen en el archivo, se podría encontrar un óptimo modelo lineal simple que explique
mayormente la variable que se quiere pronosticar.

a) De acuerdo con el ejercicio anterior, cuáles serían las variables dependiente e independiente que
incluiría en el modelo. Justifique su elección.

En el estudio de regresión lineal la variable dependiente sería el número de muertes, mientras que
las variables independientes serían el número de días, el número de nuevos casos, número de
recuperados. El número de PCR y la proporción de hombres fallecidos.

b) Encuentre ese mejor modelo de los cinco posibles.

Aplicando el modelo de regresión se obtienen los siguientes resultados:

Modelo Valor de R2
Número de fallecidos vs Número de días 0.0941
Número de fallecidos vs Número de nuevos 0.0541
casos
Número de fallecidos vs Número de 0.0901
recuperados
Número de fallecidos vs Número de PCR 0.0192
Número de fallecidos vs Proporción de hombres 0.0164
muertos

Se observa que el mejor modelo a aplicar es que relaciona las variables Número de fallecidos y
Número de días, esto debido a que es la regresión que presenta el mayor valor de R 2.

c) Muestre y explique los resultados de las hipótesis que se deberían comprobar.

Número de fallecidos vs Número de días


300000

200000

100000

0 f(x) = 2.61890343075989 x + 3751.93355769272


0 R² = 0.094131165762877
2000 4000 6000 8000 10000 12000 14000
-100000

-200000

-300000

-400000
Número de fallecidos vs Número de nuevos casos
300000

200000

100000

0 f(x) = 1.74352702059894 x + 8324.86103202444


0 R² = 0.0541202643899793
2000 4000 6000 8000 10000 12000 14000 16000 18000
-100000

-200000

-300000

-400000

Número de fallecidos vs Número de recuperados


300000

200000

100000

0 f(x) = 88.6234999875987 x + 4066.73992373938


0 R² = 0.0900678139118844
50 100 150 200 250 300 350 400 450
-100000

-200000

-300000

-400000

Número de fallecidos vs Número de PCR


300000

200000

100000

f(x) = 0.64326184229022
0 x + 13041.5076299766
-20000 -10000R² = 0.0191692002955932
0 10000 20000 30000 40000
-100000

-200000

-300000

-400000
Número de fallecidos vs Propoción de hombres
muertos
300000

200000

100000

0 f(x) = − 147275.399864049 x + 109664.138818937


0.5000 0.5500 0.6000
R² = 0.0163994198636315 0.6500 0.7000 0.7500
-100000

-200000

-300000

-400000

Las hipótesis que se deberían comprobar es si el modelo de regresión lineal que relaciona las
variables Número de fallecidos y Número de días, es el mejor modelo de los cinco posibles.

d) Si los resultados lo llevan a considerar que el modelo, en un buen grado explica el


comportamiento de la variable dependiente, justifique esa decisión, y escriba la ecuación que
representa la relación buscada.

En realidad, podemos considerar que ninguno de los modelos es lo suficientemente bueno para
describir de manera correcta la relación entre las dos variables debido a su bajo grado de correlación,
sin embargo, de los 5 modelos encontrados, el que mejor representa esta relación es:

y=2.6189 x +3751.9
Donde x representa el Número de días y la variable y, representa el Número de fallecidos.

También podría gustarte