Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Código: 1045526302
Tutor
VANESSA VENTURA
Ingeniería en sistemas
Estadística descriptiva
Turbo, Antioquia
DICIEMBRE, 2020
Tabla de contenido
Introducción .................................................................................................................................. 3
Justificación ................................................................................................................................... 4
Objetivos ....................................................................................................................................... 5
Actividad 2. Procesamiento de variables ...................................................................................... 6
Variables cualitativas escogidas ................................................................................................ 6
Variables cuantitativas discretas escogidas .............................................................................. 9
Variables cuantitativas continúas escogidas ........................................................................... 11
Actividad 3. Propuesta de solución a la problemática ................................................................ 18
Bibliografía .................................................................................................................................. 20
Introducción
Colaborativa Una vez ajustada la base de datos, el grupo deberá tomar mínimo
seis variables (al menos dos cualitativas, dos cuantitativas discretas y dos
cuantitativas continuas) y procesará para cada variable la información solicitada
a continuación:
Variables cualitativas escogidas
• Genero
• Rural o Urbana
Tabla de frecuencia sobre los involucrados en accidentes según su
género.
Conclusión.
A partir de los resultados en la tabla de frecuencias y el diagrama circular, cada
zona representa un 50% del total de casos, por ende, se puede analizar que de
100 casos totales ninguna zona prevalece por encima de la otra, es decir que
en cada zona hubo el mismo número de fallecidos, pero analizando los
fallecidos por géneros como se hizo en las tablas de contingencias, el género
masculino es el más frecuente en cada una de las zonas tanto rurales como
urbanas.
Variables cuantitativas discretas escogidas
• Usuario de moto
• Fallecidos ene- feb 2019
Regla de sturges
𝒌 = 𝟏 + 𝟑, 𝟑. 𝒍𝒐𝒈𝑵
𝑳𝒐𝒈(𝟏𝟎𝟎) = 𝟐 ∗ 𝟑, 𝟑𝟐𝟐 = 𝟔, 𝟔𝟒𝟒 + 𝟏 = 𝟕, 𝟔𝟒𝟒
𝒌=𝟖
Tabla de frecuencias para la variable cuantitativa discreta “Usuario de
moto”
Para obtener el rango restamos el valor máximo con el valor mínimo obtenido
en la tabla de medidas de infostat:
Rango = 371 – 15 = 356
Por lo tanto, tenemos que el rango para las medidas de dispersión es igual a
356.
Análisis
A partir de los 100 datos analizados podemos observar que hubo un promedio
de 35,48% de los fallecidos entre enero y febrero del año 2019, ya que la
desviación típica o estándar tiene un valor igual a 38,02 y la variancia tiene un
valor de 1431,13 lo cual es alto, nos indica que existe una diferencia
significativa entre los datos de la variable “Fallecidos ene- feb 2019”, también
las medidas resumen nos indican que de los datos analizados entre enero y
febrero el numero más bajo de fallecidos ha sido 15 y el numero más alto 371.
Variables cuantitativas continúas escogidas
• Tasa lesionados 2019
• Pesos
Regla de sturges
𝒌 = 𝟏 + 𝟑, 𝟑. 𝒍𝒐𝒈𝑵
𝑳𝒐𝒈(𝟏𝟎𝟎) = 𝟐 ∗ 𝟑, 𝟑𝟐𝟐 = 𝟔, 𝟔𝟒𝟒 + 𝟏 = 𝟕, 𝟔𝟒𝟒
𝒌=𝟖
Para obtener el rango restamos el valor máximo con el valor mínimo obtenido
en la tabla de medidas de infostat:
Rango = 25,88 – 0 = 25,88
Por lo tanto, tenemos que el rango para las medidas de dispersión es igual a
25,88.
Análisis
Como podemos observar hubo un promedio del 2,21% de la tasa de lesionados
en el año 2019, hemos obtenido una desviación típica o estándar de 2,21 lo
cual es un valor considerable, esto indica que no existe mucha diferencia entre
los datos de los lesionados. Así mismo se observa que el valor más bajo de la
tasa de lesionados fue 0, y el máximo en todos los 100 datos analizados fue
25,88.
Tabla de frecuencias para la variable cuantitativa continua “Pesos”
Medidas de tendencias central y de Posición para la variable cuantitativa
continua “PESOS”
La moda es el valor que tiene mayor frecuencia por el cual en este caso es
30843284,5 ya que es el valor que más se repite
Medidas univariantes de dispersión para la variable cuantitativa continua
“PESOS”
Para obtener el rango restamos el valor máximo con el valor mínimo obtenido
en la tabla de medidas de infostat:
Rango = 97020276,50 – 1120068,50 = 95900208
Por lo tanto, tenemos que el rango para las medidas de dispersión es igual a
95900208.
Análisis
Se calcula un promedio de perdidas equivalentes a $29.227.386,25 en el cual
el 50% de los accidentes deja un total de $13.186.458,50, se obtuvo que las
mínimas perdidas por los accidentes fueron de un total de $97.020.276,50 y las
máximas de $13.245.244,50 por último teniendo en cuenta que la desviación
estándar se aleja demasiado del valor 0, se puede decir que los datos no son
representativos.
Regresión y correlación entre variables cuantitativas
Identificar dos variables cuantitativas de la situación estudiada que puedan
estar relacionadas
Variable dependiente: Tasa Lesionados 2019
Variable independiente: Promedio de edad
a) Realizar el diagrama de dispersión de dichas variables y determinar
el tipo de asociación entre las variables.