Está en la página 1de 8

Actividad 1. Ajuste de datos.

Descripción de la actividad colaborativa.

Para iniciar su trabajo, el grupo deberá ajustar la base de datos: Anexo 1-Evolución Covid

19 - 400 Pacientes Colombia - 2021 (16-1) trabajada en el periodo, la cual se encuentra en

el entorno de aprendizaje colaborativo, en la carpeta: guía de actividades y rúbrica de

evaluación - Paso 2– organización y presentación, el grupo dejará sólo los primeros 200

datos en cada una de las variables y procederá a procesarlos como una muestra de la base

original.

Actividad 2. Procesamiento de variables

Descripción de la actividad colaborativa

Una vez ajustada la base de datos, el grupo deberá tomar mínimo seis variables (al menos

dos cualitativas, dos cuantitativas discretas y dos cuantitativas continuas) y procesará para

cada variable la información solicitada a continuación:

Las variables seleccionadas son:

Variable cualitativa

Cuidad de Ubicación y Genero.

Variable cuantitativa Discreta y Continua

Discretas: Edad y Dia del mes de marzo de notificación.

Continuas: Peso e IMC (índice de masa corporal)


Descripción de la actividad Colaborativa

Caracterizar una de las variables cualitativas elegidas presentando: tabla de frecuencias,

diagrama de barras o circular, moda, tabla de contingencias y conclusiones

Variable Cuidad de Origen

Tabla de Frecuencias

Frecuencia Frecuencia
Cuidad de Frecuencia Frecuencia Relativa Frecuencia Porcentual
Ubicación Absoluta Relativa Acumulada Porcentual Acumulada
Anapoima 2 0,010 2 1,0% 1,0%
Apartadó 1 0,005 3 0,5% 1,5%
Armenia 7 0,035 10 3,5% 5,0%
Barranquilla 9 0,045 19 4,5% 9,5%
Bello 2 0,010 21 1,0% 10,5%
Bogotá D.C. 139 0,695 160 69,5% 80,0%
Bucaramanga 2 0,010 162 1,0% 81,0%
Cáceres 1 0,005 163 0,5% 81,5%
Cajicá 3 0,015 166 1,5% 83,0%
Calarcá 1 0,005 167 0,5% 83,5%
Cali 33 0,165 200 16,5% 100,0%

La moda de la variable es Bogotá D.C. es decir, que es la cuidad que más encontramos

repetida.
Gráfico de Barras

Frecuencia Absoluta
Variable Cuidad de Origen

Frecuencia
Absoluta

0 20 40 60 80 100 120 140 160

Anapoima Apartadó Armenia Barranquilla Bello Bogotá D.C.


Bucaramanga Cáceres Cajicá Calarcá Cali

Variable Genero

Tabla de Frecuencias

Frecuenci
Frecuenci Frecuenci Frecuencia a Frecuencia
Gener a a Relativa Porcentua Porcentual
o Absoluta Relativa Acumulada l Acumulada
F 95 0,475 95 48% 48%
M 105 0,525 200 53% 100%

La moda de la variable Genero es M, es decir que el genero Masculino es el que más

encontramos repetido.
Gráfico de Barras

Frecuencia Absoluta
Variable Genero

Frecuencia
Absoluta

90 92 94 96 98 100 102 104 106

F M

Tabla de Contingencias

TABLA DE CONTINGENCIAS
CUIDAD DE ORIGEN/GENERO
  F M Total
Anapoima 0 2 2
Apartadó 1 0 1
Armenia 5 2 7
Barranquilla 5 4 9
Bello 0 2 2
Bogotá D.C. 67 72 139
Bucaramanga 2 0 2
Cáceres 0 1 1
Cajicá 0 3 3
Calarcá 0 1 1
Cali 15 18 33
Total 95 105 200
Conclusiones.

Según el análisis de las variables cualitativas, edad y cuidad de origen, podemos inferir que;

el virus se propaga sin diferencia de género, los valores obtenidos en nuestra tabla de

frecuencias nos indica que de 200 pacientes contagiados con covid-19 el 48% son mujeres

y el 52% hombres, al tener una diferencia relativamente pequeña descartamos que el genero

sea un factor importante que aumente la tasa de contagio.

Ahora con los datos obtenidos en la tabla de frecuencias de la variable Cuidad de Origen, si

podemos evidenciar una tendencia, donde la mayor cantidad de pacientes contagiados se

presenta en ciudades con mayor población. Por ejemplo Bogotá D.C. con un 69% y Cali

con un 16.5% son las ciudades con mas pacientes contagiados de la muestra y a su vez son

ciudades con una gran población. Con esto podemos determinar que el virus se propaga en

mayor medida en ciudades con más población, donde se presenta más contacto y grandes

concentraciones de personas, lo que hace que la tasa de contagio sea mayor.

Descripción de la actividad colaborativa

Para una de las variables discreta elegida, se deberán calcular las medidas univariantes de

tendencia central: Media, Mediana, Moda. Todos los cuartiles. Así mismo deberán calcular

las medidas univariantes de dispersión: Rango, Varianza, Desviación típica y Coeficiente

de variación.
Variable Discreta edad

Medidas univariantes de tendencia central

Tipo de medida Resultado


Media 43
4
Mediana 1
Moda 23

Cuartiles

Tipo de medida Resultado


2
Q1 9
4
Q2 1
5
Q3 4
8
Q4 7
2
P25 9
4
P50 1

Medidas univariantes de dispersión

Tipo de medida Resultado


Varianza 250,679375
15,8725886
Desviación típica 5
0,37150587
Coeficiente de variación 8
Min 18
Max 87
Rango 69
Variable Discreta Dia del mes de marzo de notificación.

Medidas univariantes de tendencia central

Tipo de medida Resultado


Media 18
1
Mediana 9
Moda 20

Cuartiles

Tipo de medida Resultado


1
Q1 7
1
Q2 9
2
Q3 1
2
Q4 4
1
P25 7
1
P50 9

Medidas univariantes de dispersión

Tipo de medida Resultado


Varianza 12,498975
Desviación típica 3,544260701
Coeficiente de variación 0,193095108
Min 2
Max 24
Rango 22
Para una de las variables continúa elegida, se deberán calcular las medidas

univariantes de tendencia central: Media, Mediana, Moda. Todos los cuartiles Así mismo

deberán calcular las medidas univariantes de dispersión: Rango, Varianza, Desviación

típica y Coeficiente de variación.

Variable continua Peso

Variable IMC (índice de masa corporal)

Regresión y correlación entre variables cuantitativas

Identificar dos variables cuantitativas de la situación estudiada que puedan estar

relacionadas y:

a. Realizar el diagrama de dispersión de dichas variables y determinar el tipo de

asociación entre las variables.

b. Encontrar el modelo matemático que permite predecir el efecto de una variable

sobre la otra. ¿Es confiable?

c. Determinar el grado de relación de las dos variables.

d. Relacionar la información obtenida con el problema.

También podría gustarte