Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Código: 20191373027
ESTADÍSTICA DESCRIPTIVA
Media -15889292.88
Error típico 219413.9086
Mediana -11811198
Moda -66915382
Desviación estándar 16303206.43
Varianza de la muestra 265794539922644
Curtosis 5.401798833
Coeficiente de asimetría -2.602728587
Rango 93113952.89
Mínimo -93114074
Máximo -121.11
Suma -87724785974
Cuenta 5521
El error típico también conocido como error estándar es el valor que nos cuantifica cuanto
se apartan los valores de la media de la población. Este error nos cuantifica las
oscilaciones de la media muestral alrededor de la media poblacional.
El error típico obtenido para el ejercicio fue 219413.9086 lo cual corresponde al error que
se comete al tomar la media calculada de la muestra como estimación de la media de la
población total.
La Mediana se refiere al dato que se encuentra en la mitad de los datos de la muestra,
teniendo una parte de los datos por debajo y la otra por encima. Para hallar la mediana es
necesario ordenar los datos de menor a mayor. Tomamos el numero que se encuentra
justamente en la mitad si tenemos dos números justamente en la mitad entonces
tomamos estos dos números y los dividimos entre 2 y ese resultado será nuestra mediana.
La mediana para el ejercicio nos arrojo -11811198 lo cual tiene una gran ventaja ya que en
la base de datos se encuentra algunos datos sesgados y esto afecta cuando hallamos la
media. Mientras que al hallar la mediana el impacto es menor.
La Moda de un conjunto de datos se define como el número que esta representado mas
veces dentro de la muestra. Se tienen distintos tipos de moda, en funciona del numero de
veces que se repite el mismo dato, las cuales son: moda unimodal, moda bimodal y moda
multimodal.
Para el ejercicio la moda es -66915382 de tipo unimodal ya que es el dato que se repite
dentro de la base de datos.
La desviación estándar indica que tan dispersión están los datos con respecto a la media.
Mientras mayor sea la desviación estándar, mayor será la dispersión entre los datos.
Para el caso de estudio la desviación estándar arrojo 16303206.43 lo cual nos indica que
los valores se encuentran alejados unos de los otros.
El Rango hace referencia a un valor numérico que indica la diferencia entre el valor
máximo y el mínimo de una población.
Para el ejercicio la diferencia entre el mayor y el menor valor es 93113952.89 es decir el
rango.
El Mínimo se refiere al menor valor que se puede encontrar en la base de datos para el
caso de estudio es -93114074
El Máximo se refiere al mayor valor que se puede encontrar en la base de datos, para el
caso de estudio es -121.11
Según los datos recopilados y el análisis que se realizo por variable los datos se
encuentran muy lejanos unos de los otros. Por tal razón se ve necesario hacer una
limpieza de la Base y elegir que datos se pueden descartar. Esto con el fin de que los datos
sean similares y disminuir el dato de la varianza ya que es un valor muy alto así como el
valor que se halló como rango.
Bibliografía.