Está en la página 1de 20

Paso 5 - Presentación de resultados.

Nombre: Yeisson Mena Bogallo

Código: 1045526302

Grupo Colaborativo: 100105_284

Tutor

VANESSA VENTURA

Universidad Nacional Abierta y a Distancia – UNAD

Ingeniería en sistemas

Estadística descriptiva

Turbo, Antioquia

DICIEMBRE, 2020
Tabla de contenido

Introducción .................................................................................................................................. 3
Justificación ................................................................................................................................... 4
Objetivos ....................................................................................................................................... 5
Actividad 2. Procesamiento de variables ...................................................................................... 6
Variables cualitativas escogidas ................................................................................................ 6
Variables cuantitativas discretas escogidas .............................................................................. 9
Variables cuantitativas continúas escogidas ........................................................................... 11
Actividad 3. Propuesta de solución a la problemática ................................................................ 18
Bibliografía .................................................................................................................................. 20
Introducción

El siguiente documento pretende dar desarrollo al trabajo colaborativo final del


curso de estadística descriptiva, se dará respuesta a la problemática hemos
venido trabajando desde el inicio, en la cual se presenta la pregunta “¿Cuáles
son los factores que influyen en la accidentalidad de vehículos y en el grado de
muertes asociadas a los accidentes de tránsito en Colombia?”
En la cual se aportarán tablas de frecuencias, diagramas, tablas de
contingencias y análisis exhaustivos para cada una de las variables escogidas,
aplicando el conocimiento y enseñanzas adquiridas en los anteriores trabajos
realizados.
Justificación

El propósito de realizar este trabajo se centra en demostrar las habilidades


adquiridas para el uso de la estadística en los diferentes ámbitos, en este caso
es sobre los índices de accidentalidad los municipios de Colombia, por lo cual
se desea lograr resolver por medio de herramientas y análisis los factores
principales que llevan a cabo estos accidentes donde procesaremos la
información de acuerdo al tamaño de la muestra para las variables cuantitativas
y cualitativas.
Objetivos

• Proponer una alternativa de solución a la problemática objeto de estudio,


a través de un informe descriptivo de las técnicas estadísticas
implementadas a la base de datos

• Realizar un análisis de la información en base a los resultados obtenidos


en cada una de las variables a elegir.
Actividad 2. Procesamiento de variables

Colaborativa Una vez ajustada la base de datos, el grupo deberá tomar mínimo
seis variables (al menos dos cualitativas, dos cuantitativas discretas y dos
cuantitativas continuas) y procesará para cada variable la información solicitada
a continuación:
Variables cualitativas escogidas
• Genero
• Rural o Urbana
Tabla de frecuencia sobre los involucrados en accidentes según su
género.

Diagrama circular para la variable Genero

Teniendo en cuenta que la moda es el valor con mayor frecuencia en una de


las distribuciones de datos, en la anterior tabla de frecuencias la moda de la
variable Genero es 69 en el género hombre, ya que es el valor que más se
repite.
Tabla de contingencias
Conclusión.
A partir de los resultados en la tabla de frecuencias, el género hombre
representa la moda como el valor más frecuente en los datos, por ende, se
puede analizar que el género masculino presenta la mayor tasa de fallecidos
que según el diagrama circular es equivalente al 69% de los casos tanto para
las zonas rurales y urbanas como se muestra en la tabla de frecuencias
absolutas.
Tabla de frecuencia sobre los accidentes presentados en zonas rurales o
urbanas

Diagrama de barras para la variable Rural o Urbana


Teniendo en cuenta que la moda es el valor con mayor frecuencia en una de
las distribuciones de datos, en la anterior tabla de frecuencias la moda de la
variable “Rural o Urbano” es 50 ya que es el elemento más común en la tabla.
Tabla de contingencias para la variable Rural o Urbana

Conclusión.
A partir de los resultados en la tabla de frecuencias y el diagrama circular, cada
zona representa un 50% del total de casos, por ende, se puede analizar que de
100 casos totales ninguna zona prevalece por encima de la otra, es decir que
en cada zona hubo el mismo número de fallecidos, pero analizando los
fallecidos por géneros como se hizo en las tablas de contingencias, el género
masculino es el más frecuente en cada una de las zonas tanto rurales como
urbanas.
Variables cuantitativas discretas escogidas
• Usuario de moto
• Fallecidos ene- feb 2019
Regla de sturges
𝒌 = 𝟏 + 𝟑, 𝟑. 𝒍𝒐𝒈𝑵
𝑳𝒐𝒈(𝟏𝟎𝟎) = 𝟐 ∗ 𝟑, 𝟑𝟐𝟐 = 𝟔, 𝟔𝟒𝟒 + 𝟏 = 𝟕, 𝟔𝟒𝟒
𝒌=𝟖
Tabla de frecuencias para la variable cuantitativa discreta “Usuario de
moto”

Medidas univariantes de tendencia central para la variable “Usuario de


moto”

Medidas univariantes de dispersión para la variable “Usuario de moto”


Para obtener el rango restamos el valor máximo con el valor mínimo obtenido
en la tabla de medidas de infostat:
Rango = 205 – 2 = 203
Por lo tanto, tenemos que el rango para las medidas de dispersión es igual a
203.
Análisis
Como podemos observar de los 100 datos recopilados hubo un promedio del
6,85% de fallecidos por actor vial que son motociclistas, hemos obtenido una
desviación típica o estándar de 20,22 lo cual es un valor alto, esto indica que
existe una diferencia significativa entre los datos de los usuarios de moto, esto
se confirma con la varianza que también presenta un valor alto. Así mismo se
observa que el número más bajo de accidentes de usuarios de moto fueron 2, y
el máximo en todos los 100 datos analizados fueron 205.
Tabla de frecuencias para la variable cuantitativa discreta “Fallecidos ene-
feb 2019”

Medidas univariantes de tendencia central para la variable “Fallecidos


ene- feb 2019”
Medidas univariantes de dispersión para la variable “Fallecidos ene – feb
2019”

Para obtener el rango restamos el valor máximo con el valor mínimo obtenido
en la tabla de medidas de infostat:
Rango = 371 – 15 = 356
Por lo tanto, tenemos que el rango para las medidas de dispersión es igual a
356.
Análisis
A partir de los 100 datos analizados podemos observar que hubo un promedio
de 35,48% de los fallecidos entre enero y febrero del año 2019, ya que la
desviación típica o estándar tiene un valor igual a 38,02 y la variancia tiene un
valor de 1431,13 lo cual es alto, nos indica que existe una diferencia
significativa entre los datos de la variable “Fallecidos ene- feb 2019”, también
las medidas resumen nos indican que de los datos analizados entre enero y
febrero el numero más bajo de fallecidos ha sido 15 y el numero más alto 371.
Variables cuantitativas continúas escogidas
• Tasa lesionados 2019
• Pesos
Regla de sturges
𝒌 = 𝟏 + 𝟑, 𝟑. 𝒍𝒐𝒈𝑵
𝑳𝒐𝒈(𝟏𝟎𝟎) = 𝟐 ∗ 𝟑, 𝟑𝟐𝟐 = 𝟔, 𝟔𝟒𝟒 + 𝟏 = 𝟕, 𝟔𝟒𝟒
𝒌=𝟖

Tabla de frecuencias para la variable cuantitativa continua “Tasa


lesionados 2019”

Medidas de tendencias central y de Posición para la variable cuantitativa


continua “Tasa lesionados 2019”
La moda es el valor que tiene mayor frecuencia por el cual en este caso es 0 ya
que es el valor que más se repite
Medidas univariantes de dispersión para la variable cuantitativa continua
“Tasa lesionados 2019”

Para obtener el rango restamos el valor máximo con el valor mínimo obtenido
en la tabla de medidas de infostat:
Rango = 25,88 – 0 = 25,88
Por lo tanto, tenemos que el rango para las medidas de dispersión es igual a
25,88.
Análisis
Como podemos observar hubo un promedio del 2,21% de la tasa de lesionados
en el año 2019, hemos obtenido una desviación típica o estándar de 2,21 lo
cual es un valor considerable, esto indica que no existe mucha diferencia entre
los datos de los lesionados. Así mismo se observa que el valor más bajo de la
tasa de lesionados fue 0, y el máximo en todos los 100 datos analizados fue
25,88.
Tabla de frecuencias para la variable cuantitativa continua “Pesos”
Medidas de tendencias central y de Posición para la variable cuantitativa
continua “PESOS”

La moda es el valor que tiene mayor frecuencia por el cual en este caso es
30843284,5 ya que es el valor que más se repite
Medidas univariantes de dispersión para la variable cuantitativa continua
“PESOS”

Para obtener el rango restamos el valor máximo con el valor mínimo obtenido
en la tabla de medidas de infostat:
Rango = 97020276,50 – 1120068,50 = 95900208
Por lo tanto, tenemos que el rango para las medidas de dispersión es igual a
95900208.
Análisis
Se calcula un promedio de perdidas equivalentes a $29.227.386,25 en el cual
el 50% de los accidentes deja un total de $13.186.458,50, se obtuvo que las
mínimas perdidas por los accidentes fueron de un total de $97.020.276,50 y las
máximas de $13.245.244,50 por último teniendo en cuenta que la desviación
estándar se aleja demasiado del valor 0, se puede decir que los datos no son
representativos.
Regresión y correlación entre variables cuantitativas
Identificar dos variables cuantitativas de la situación estudiada que puedan
estar relacionadas
Variable dependiente: Tasa Lesionados 2019
Variable independiente: Promedio de edad
a) Realizar el diagrama de dispersión de dichas variables y determinar
el tipo de asociación entre las variables.

El tipo de asociación entre las variables es lineal negativa

b) Encontrar el modelo matemático que permite predecir el efecto de


una variable sobre la otra. ¿Es confiable?

Usamos el modelo matemático que permite predecir el efecto de una


variable sobre la otra que es igual a 𝑦 = -0,08𝑥 + 5,06. Ya que 𝑅 2 es
igual a 0,06 hallamos el coeficiente de determinación concluyendo que al
ser multiplicado por el 100% la confiabilidad del modelo es equivalente al
6%, con esto podemos asegurar que la ecuación de la recta es poco
confiable.

c) Determinar el grado de relación de las dos variables.


Teniendo en cuenta la gráfica entre la relación de tasa de lesionados
2019 y promedio de dad sabemos que es una relación lineal en la cual el
𝑅 2 equivale al 0,06 y hallando su raíz cuadrada √0,06 su coeficiente de
correlación seria 0,24

Así que según la tabla podemos concluir en base a que el coeficiente de


correlación se encuentra en el rango 0<r<0.30 que no existe o no hay
correlación.

d) Relacionar la información obtenida con el problema.

De acuerdo con el análisis anteriormente realizado, obtenemos que la


variable Tasa lesionados 2019 y la variable Promedio de edad no
están relacionadas de tal manera ya que presentan un 6% de
confiabilidad en la cual no existe una correlación ya que solo equivale al
24%

Actividad 3. Propuesta de solución a la problemática

• De la tabla de frecuencias sobre las personas involucradas en


accidentes según su género, hemos observado que la frecuencia
absoluta de mayor valor en el género hombre, asi mismo en el grafico
circular se presenta un total del 69% de víctimas de este género de los
100 casos tomados, por lo cual se sugiere dar implementación de
acciones preventivas sobre la seguridad vial que vayan enfocados
principalmente al género masculino.
• En las tablas de contingencias para la variable género, existe una gran
diferencia entre los valores sobre los accidentes que se presentan en la
zona rural o urbana, donde el género masculino abarca con un total del
34 accidentes y zona rural y 35 en zona urbana, de la cual da un total de
69 accidentes y por otor lado el género femenino tiene un total de 31
accidentes divididos en las dos zonas, se concluye que las medidas
preventivas se deben enfocar sobre todo al género masculino ya que
estos llegan a superar más del doble de accidentes que de la totalidad
de los datos, por lo cual son necesarias estrategias sobre la seguridad
vial para reducir estos índices.

• En la tabla de frecuencias sobre los casos de accidentes presentados en


las zonas rural o urbana se observa que las zonas mantienen un mismo
valor, esto se ve reflejado en el grafico circular donde vemos que cada
zona obtiene un 50% del total de los valores, esto indica que las
medidas de prevención para reducir los accidentes que se mantienen en
un total de 100 se deben aplicar en igual medida para las dos zonas.

• Observamos que en la tabla de contingencias para la variable Rural o


Urbana los hombres predominan en la mayoría de los accidentes en las
dos zonas obteniendo datos muy similares que superan hasta el doble
de los accidentes por el género femenino, por esta razón se deben
implementar recursos para el control de conducción en las distintas
zonas, como mayores señalizaciones y métodos para la reducción de
velocidad.

• Si observamos la tabla de frecuencias de la variable “Usuario moto”, nos


muestra que casi el total de accidentes viales por motociclistas tienen un
límite inferior de 2 y un límite superior de 27,38 con una media de 14,69
que representa el 99% de los accidentes viales, mientras tanto un solo
accidente presenta un límite inferior de 179,63 y un límite superior de
205 con una media de 1992,31 que representa el 1% del total de
accidentes. Por lo tanto, las medidas a llevarse a cabo para reducir
estas cifras deben ser enfocadas para la protección personal de cada
motociclista, se pueden realizar campañas para incentivar el uso de
elementos o materiales para su mismo cuidado y el respeto de las
señalizaciones y velocidades permitidas.
Bibliografía

• Martínez, C. (2011). Capítulo 2. Distribuciones de frecuencia. En:


Estadística y muestreo, 13a ed. [Online] Bogotá: Ecoe Ediciones. (pp
570 – 582). Recuperado de http://www.ebooks7-
24.com.bibliotecavirtual.unad.edu.co/?il=739
• Montero, J.M. (2007). Regresión y Correlación Simple. Madrid:
Paraninfo. (pp 130 – 158).
Recuperado de https://link.gale.com/apps/doc/CX4052100011/GVRL?u
=unad&sid=GVRL&xid=696103db
• Churchill, G.A. (2009). Análisis de Correlación y de Regresión Simple.
México City: Cengage Learning. (pp-675–686). Recuperado
de https://link.gale.com/apps/doc/CX4058900232/GVRL?u=unad&sid=G
VRL&xid=a2479593
• Monroy, S. S. (2005). Estadística descriptiva. México, D.F., MX: Instituto
Politécnico Nacional. (pp 21-29). Recuperado de https://elibro-
net.bibliotecavirtual.unad.edu.co/es/ereader/unad/74722
• OVI. Ortegon Pava, M. (30,04,2020). Medidas Bivariantes - Regresión
lineal simple. [Archivo de video]. Recuperado
de https://repository.unad.edu.co/handle/10596/33651

También podría gustarte