Está en la página 1de 4

UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MEDELLÍN

ESCUELA DE ESTADÍSTICA

PRIMER TRABAJO Análisis descriptivo de datos (10%) SEM. 02 – 2021

# cédula usado 1000306711 Grupo: G5

Nombre Completo Alejandro Valencia Ossa D. I. 1000306711

Nombre Completo Manuel Mateo Perez Ramirez D. I. 1002458857

La base de datos con la que le corresponde trabajar se obtiene como una muestra aleatoria
de una gran base de datos. La base original corresponde a la información de 465
estudiantes de la Universidad Nacional Sede Medellín. Dicha base contiene las variables:
EDAD (en días), GENERO (HOMBRE o MUJER), LONG_ABDO (longitud abdominal, en cm),
TIPO_COLE (PUBLICO, PRIVADO, OTROS), LONG_PIE (Longitud promedio de los pies, en
cm) y LONG_MAN (Longitud promedio de las manos, en cm).

Cada pareja debe generar una base de datos, que corresponderá a una muestra de tamaño
100 de la base original. Los datos originales están en el archivo: “base.txt”, el cual está
disponible en Moodle. Para hacerlo debe seguir los siguientes pasos:

# Primero leer el archivo de datos.

uno <- read.table(file.choose(), header=T)

# Copiar el siguiente código en R sin modificar nada

genera <- function(cedula){


set.seed(cedula)
data <- uno[sample(1:465,100),]
data
}
# Para crear la base de datos con la cual trabajara, debe ejecutar la siguiente línea:

datos <- genera(cedula)

“cedula” representa el número de cedula de uno de los dos integrantes. En el trabajo debe indicar
cuál número de cédula usó. Este debe escribirse en la parte superior izquierda. En la parte superior
derecha, el grupo al cual pertenecen los estudiantes. Se aclara que ambos estudiantes deben
pertenecer al mismo grupo en el cual están matriculados.
Usando la base de datos generada, responda a las siguientes preguntas:
1. Para las variables LONG_ABDO y LONG_MAN, calcule: Media,
Mediana y desviación estándar e interprete sus resultados en el
contexto de la información. Para la variable TIPO_COLE, elabore
una tabla de porcentajes y el respectivo diagrama de barras.
Comente los resultados obtenidos en el gráfico.

*Gracias a los resultados podemos inferir que la población en


general tienen un promedio de longitud abdominal de 77.0460
cm con una desviación estándar un poco alta, lo que significa
mayor dispersión de datos, además tenemos que la mediana es
77cm; Ahora para la longitud de manos tenemos que el
promedio de esta longitud para toda la población es de
17.8505 cm con una desviación estándar baja lo que nos dice
que no tiene datos muy dispersos, además la mediana de la
longitud de manos es de 18 cm. *Ahora según la gráfica del
tipo de colegio se tiene que el 69% de la población general
provienen de colegio publico mientras que el 24% provienen de
colegios privados, el porcentaje sobrante que es 7%
corresponde a otros sistemas educativos.

Longitud Abdominal Longitud Manos


(cm) (cm)
Media 77.05 17.85
Mediana 77.00 18.00
Desviación Estándar 12.84 1.44

Podemos notar que tanto la media aritmética como la mediana son muy similares para ambas
variables, lo cual quiere decir que esta distribución de datos es simétrica respecto a un valor
central. Por otro lado, las distribuciones estándar de ambas variables son también bajos. Por lo
tanto, podemos esperar que los datos no estén excesivamente distribuidos sino más bien
compactos.
Tipo de Colegio
Frecuencia Porcentaje (%)
Público 69 69
Privado 24 24
Otros 7 7

En esta gráfica la frecuencia asociada al tipo de colegio al que se pertenece coincide exactamente
con el porcentaje que representa sobre el total de la muestra, esto debido a que tomamos una
muestra de 100 datos sobre toda la población. Por lo tanto, la frecuencia representa el porcentaje.

2. Si se considera la variable EDAD, ¿Esta se comporta igual en los


hombres y mujeres? Justifique su respuesta. Elabore los gráficos
que considere pertinentes. Estos deben ser interpretados, en el
contexto de la información analizada.

Podemos notar que la edad no se comporta de igual manera para hombres y


mujeres, ya que en promedio, los hombres tienen mayor edad que las mujeres;
además de que hay más hombres que mujeres. Podemos concluir entonces
que los hombres de la Universidad Nacional Sede Medellín son mayores con
respecto a las mujeres de la universidad.

3. ¿Se puede afirmar que los Hombres en promedio tienen los pies
más largos que las Mujeres? Justifique su respuesta. Puede
anexar los resúmenes y/o gráficos que considere pertinentes.

Longitud de Pie (cm)


Hombres Mujeres
Media Aritmética 25.52 22.69
Gracias a los resúmenes numéricos podemos notar que el promedio de
longitud de pies para hombres es de 25.51930 cm, mientras que el promedio
de longitud de pies para mujeres es de 22.69302 cm, lo que nos indica que en
promedio los hombres tienen lo pies más grandes que las mujeres, aunque no
sea mucha la diferencia y esto lo sabemos ya que las desviaciones estándar
nos muestran una baja dispersión de datos.

4. ¿Se puede afirmar que el porcentaje de Hombres que provienen


de colegios públicos es mayor al porcentaje de Mujeres que vienen
de colegios privados? Justifique su respuesta. Puede anexar los
resúmenes y/o gráficos que considere pertinentes.

Gracias a la gráfica podemos


notar que el porcentaje de
los hombres que provienen
de colegios públicos es
mayor(63%), mientras que el
Porcentaje de mujeres que
provienen de colegios
privados es mucho
menor(12%), lo que nos dice
que podemos afirmar la
respectiva pregunta.

El trabajo debe cargarse en la carpeta definida en el curso en


Moodle, en la pestaña Trabajos – Trabajo I – Soporte trabajo I,
antes de las 4:00 pm del sábado 23 de octubre de 2021.

También podría gustarte