Está en la página 1de 8

Práctica estadística descriptiva univariante

Álvaro Gómez Aguilar

1. Elegir variables apropiadas del archivo de datos que puedan representarse


mediante un diagrama de sectores y un diagrama de barras. Añadir las etiquetas de
datos (frecuencias y/o porcentajes) para identificar las categorías más frecuentes de
la variable.
2.      Realizar un histograma para la variable que representa el precio del coche
principal (coche), agrupando los datos en diez intervalos o clases. ¿Entre qué valores
está comprendido el precio más frecuente

El histograma nos muestra que el precio más frecuente está entre 10.000 y 20.000€.

3.      A la vista del diagrama de caja para la variable que representa el número de
personas en el hogar (residen), ¿existen datos anómales, especialmente alejados de
los demás, en esta distribución? Si observamos el 25% de los hogares en los que
conviven un menor número de personas, ¿cuántas personas residen en ellos?
Existen 7 datos anómalos en esta distribución, los cuales, representan 7 hogares en
los que viven más de 6 personas y, por lo tanto, se encuentran más alejados del
resto de datos.

En este diagrama de cajas, podemos observar que el mínimo coincide con el Q1,
con lo cual, en este último vienen representados el 25% de los hogares en los que
conviven un menor número de personas, en los que residen 1 persona.

4.      Observando la tabla de frecuencias para la variable nivel de estudios


(estudios), ¿cuántas personas tienen estudios de Bachillerato? ¿qué porcentaje
representan sobre el total? ¿Y qué porcentaje de personas tiene, como mucho,
estudio de Bachillerato?
Son 1936 las personas que tienen estudios de bachillerato, quienes representan el
30,3% del total.

Las personas que tienen como mucho, estudios de bachillerato o inferiores es el


52% del total.

5.      Proporciona la media, la mediana y la media recortada al 5% para el precio


del coche principal (coche). ¿Se deduce la presencia de datos anómalos al comparar
dichas medidas descriptivas?

Al comparar la media con la media recortada al 5% se puede concluir que si existen


datos anómalos.

6.      Repite el apartado anterior considerando los individuos con una edad


superior a 45 años y compara los resultados con los obtenidos en el apartado
anterior.
Comparando la desviación típica de ambas variables deducimos que la dispersión es
mayor en la variable edad ya que su d. típica es superior a la de la variable empleo, por
lo tanto, la media de la variable edad es menos representativa. Por otra parte, la
variable edad presenta una distribución que se asemeja mucho más a la normal ya que
su coeficiente de asimetría es más cercano a 0 (presenta asimetría positiva), aunque
esté menos apuntada que la normal.

7.      Determina los cuartiles para la variable edad para dividir su distribución en


cuatro partes, cada una, conteniendo el 25% de los datos. Compara los resultados
con los que se obtienen gráficamente al representar la distribución mediante el
diagrama de caja.
8.      Compara la dispersión o variabilidad para las variables edad e ingresos,
determinando en cuál de ellas su media es más representativa. Utiliza el coeficiente
de variación para eliminar el efecto de las unidades de medida.

Cómo 0.2922 < 1.1331 por tanto podemos concluir que la media más
representativa es la menor, es decir, la variable edad en años.

9.      Calcula e interpreta las medidas de asimetría y curtosis para las


variables edad y años con la empresa actual (empleo). Puedes comparar los
resultados numéricos con las intuiciones que se deducen de la observación de los
correspondientes histogramas.
La variable edad en años es más simétrica porque su valor de asimetría está más
cercano a 0 mientras que, la variable años con la empresa actual es menos simétrica
porque su valor de 1,101 se encuentra más lejos de 0.

La variable edad en años es menos apuntada porque su valor de curtosis es


negativo, en cambio, la variable años con la empresa actual, es más apuntada
porque su valor de 0,734 es positivo.

También podría gustarte