Está en la página 1de 24

Análisis de la información

Bella Esmeralda Villalobos Burgos Cód. 1032498118

Grupo: 204040_6

Abril 2020

Tutor: Milton Eduardo Salgado

Universidad Nacional Abierta y a Distancia

Escuela de Ciencias Sociales Artes y Humanidades

Estadística Descriptiva

Facatativá
TABLA DE CONTENIDO

INTRODUCCIÓN............................................................................................................................3
JUSTIFICACIÓN............................................................................................................................4
OBJETIVOS.....................................................................................................................................5
OBJETIVO GENERAL...............................................................................................................5
OBJETIVOS ESPECÍFICOS......................................................................................................5
MAPA MENTAL.............................................................................................................................6
ANALISIS DE LA VARIABLE DISCRETA CANTIDAD CHOQUES BICICLETA...............7
ANALISIS DE LA VARIABLE CONTINUA TASAS DE FALLECIDOS...............................14
ANALISIS DE LA INFORMACIÓN OBTENIDA.....................................................................21
CONCLUSIONES..........................................................................................................................22
REFERENCIAS BIBLIOGRAFICAS..........................................................................................23
INTRODUCCIÓN

El siguiente trabajo corresponde a un análisis de un conjunto de datos, con relación a los

factores incidentes en la accidentalidad de vehículos y el grado de muertes asociadas a los

accidentes de tránsito en Colombia. Para ello se tomaron 200 municipios del país y se

tomaron 2 variables principales de estudio, la cantidad de accidentes donde el objeto de

choque fue una bicicleta, y la tasa de fallecidos en el año 2019, para poder determinar su

relevancia en términos de que cada municipio adopte normas y políticas de prevención y

control para poder reducir y evitar estos accidentes.


JUSTIFICACIÓN

Este análisis tiene como propósito identificar algunas características con respecto a algunos

de los factores que inciden en la accidentalidad de vehículos y grado de muertes para 200

municipios encuestados del país. Tiene varias ventajas el analizar factores incidentes,

puesto que al tener cifras concretas sobre los municipios, se puede determinar si son de

gran relevancia para considerarlo una problemática en la que se deban crear nuevas

estrategias para la prevención de accidentes. Otra ventaja, es mostrar la diferencia y la

proporción que existe entre los accidentes de tránsito para las ciudades y los municipios

encuestados, ya que al mostrar una mayor proporción un pueblo que la de una ciudad, si

sería necesaria la creación para estas nuevas estrategias. Otra ventaja puede ser observar si

dependiendo del objeto de choque, la relación con otros objetos sigue manteniendo la

proporcionalidad. Y finalmente, se muestra si todos los municipios manejan una relación

particular con respecto a las tasas de accidentalidad para el año 2019.


OBJETIVOS

OBJETIVO GENERAL

Analizar los factores que inciden en la accidentalidad de vehículos y el grado de muertes en

accidentes de tránsito, teniendo en cuenta los accidentes donde el objeto de choque fue una

bicicleta, y las tasas de fallecidos en el año 2019 para los 200 municipios encuestados.

OBJETIVOS ESPECÍFICOS

 Diseñar representaciones que muestren la cantidad de choques en bicicleta de estos 200

municipios, y las tasas de fallecidos en el año 2019.

 Analizar el posicionamiento de la cantidad de choques para cada municipio, y de las

tasas de fallecidos en el año 2019, para determinar promedios, datos centrales, y datos

de mayor frecuencia.

 Determinar si los datos están muy dispersos o concentrados en su promedio, de manera

que pueda conocerse si se presentan los mismos datos en la mayoría de los municipios o

por el contrario son independientes.


MAPA MENTAL

Para el desarrollo y análisis de los datos, es de vital importancia que estos deben pasar por 3 partes fundamentales, luego de haber sido

representados ya sea en una tabla de frecuencias, o en histogramas, o polígonos de frecuencia. Para ello se define cada una de las

medidas a tener en cuenta para observar la centralidad, el posicionamiento no central y la dispersión de los datos.
ANALISIS DE LA VARIABLE DISCRETA CANTIDAD CHOQUES BICICLETA
1.

a. La variable escogida fue cantidad de choques en bicicleta de los 200 municipios

encuestados Los datos son:

Organizando los datos en una tabla de frecuencia se tiene:

CANTIDAD MUNICIPI
ACCIDENTES EN

BICICLETA OS
4 29
5 29
7 64
8 21
10 29
11 5
13 7
16 4
17 5
20 1
26 3
31 2
93 1
TOTAL 200

La media para estos datos es la suma de todos divididos en la cantidad de datos que hay. Esto es:

x́=
∑ Xi∗fi = 4∗29+5∗29+7∗64+ 8∗21+10∗29+11∗5+13∗7+16∗4 +17∗5+20∗1+ 26∗3+¿ 31∗2+93∗1
n 200

1697
¿ ¿ 8,485 MEDIA
200

Entonces el promedio de accidentes donde el objeto de choque fue una bicicleta para los 200

municipios encuestados es de aproximadamente 8 o 9 accidentes

Para la mediana, al ordenar los datos de menor a mayor se determina que la mediana está entre

los números 7. En la tabla de frecuencias se observa mirando donde se encuentra el dato de la

mitad (dato 100 o 101).


CANTIDAD F.

ACCIDENTES EN MUNICIPI ACUMULA

BICICLETA OS DA
4 29 29
5 29 58
7 64 122
(MEDIANA)
8 21 143
10 29 172
11 5 177
13 7 184
Por lo tanto, la 16 4 188 cantidad central de
17 5 193
accidentes donde el 20 1 194 objeto de choque
26 3 197
fue una bicicleta 31 2 199 para los 200
93 1 200
municipios TOTAL 200 encuestados es de 7

accidentes.

Por otra parte la cantidad de accidentes que más frecuencia (MODA) tienen los 200 municipios

es de 7 accidentes, ya que 64 de los 200 municipios presentan tener 7 accidentes donde el objeto

de choque fue una bicicleta.

b. Para determinar los cuartiles es necesaria la ecuación:

( k∗n )
Qn= donde, k es el número del cuartil (k= 1, 2, 3)
A

n es el total de la muestra, en este caso n=200

A = 4 puesto que se divide en 4 partes (quartil)

Entonces el cuartil 1 es:


( 1∗200 )
Q 1= =50
4

Entonces el dato de la posición 50, es el 5, lo que significa que:

El 25% de accidentes donde el objeto de choque es una bicicleta, para los 200 municipios

encuestados está por debajo de 5 accidentes, y el 75% restante está por encima de 5 accidentes.

Para el cuartil 2 es:

( 2∗200 )
Q 2= =100
4

Entonces el dato de la posición 100, es el 7, lo que significa que:

El 50% de accidentes donde el objeto de choque es una bicicleta, para los 200 municipios

encuestados está por debajo de 7 accidentes, y el 50% restante está por encima de 7 accidentes.

Para el cuartil 3 es:

( 3∗200 )
Q 3= =150
4

Entonces el dato de la posición 150, es el 10, lo que significa que:


El 75% de accidentes donde el objeto de choque es una bicicleta, para los 200 municipios

encuestados está por debajo de 10 accidentes, y el 25% restante está por encima de 10

accidentes.

Para determinar los deciles es necesaria la ecuación:

( k∗n )
Qn= donde, k es el número del decil (k= 1, 2, 3, …, 10)
A

n es el total de la muestra, en este caso n=200

A = 10 puesto que se divide en 10 partes (decil)

El decil 5 corresponde al mismo cuartil 2, por lo tanto se maneja la misma interpretación para

ambos.

Para el decil 7, entonces:

( 7∗200 )
D 7= =140
10

Entonces el dato de la posición 140, es el 8, lo que significa que:

El 70% de accidentes donde el objeto de choque es una bicicleta, para los 200 municipios

encuestados está por debajo de 8 accidentes, y el 30% restante está por encima de 8 accidentes.

Los percentiles 25 y 50 corresponden a los cuartiles 1 y 2, por propiedades entre estas

expresiones. Por lo tanto se maneja la misma interpretación de los cuartiles 1 y 2.


2. Para determinar el rango, simplemente se restan el valor máximo (93) y el valor minimo que

es 4. Entonces:

RANGO = 93-4 = 89

La diferencia entre la mayor cantidad de accidentes donde el objeto de choque fue una

bicicleta con la menor cantidad de accidentes es de 89.

Para la varianza se tiene en cuenta la ecuación

2 ∑ ( xi−x́ )2 2∑ ( xi−x́ )2∗fi


S= o también S=
n−1 n

Entonces, al hacer la resta de cada dato con la media, elevar al cuadrado y sumar todos los

resultados se tiene que:

11132
S2 = =55,9397
199

La varianza para la situación presentada es de 55.9397. Por lo tanto la desviación típica es:

S= √ 55.9397=7,4792
Por lo tanto la desviación típica es de 7,4792.

Finalmente para determinar el coeficiente de variación se divide la desviación típica con la

media. Entonces:

7,4792
CV = ∗100
8,485

CV =88,14

Esto quiere decir que los datos están muy dispersos respecto de la media, aproximadamente

un 88,14%

ANALISIS DE LA VARIABLE CONTINUA TASAS DE FALLECIDOS.

La variable cuantitativa continua escogida fueron las tasas de fallecidos en el año 2019. Primero

fue necesario determinar el rango, el número de intervalos (con la raíz cuadrada del total de la

población) y luego determinar la amplitud de los intervalos.


Rango = valor máximo – valor mínimo

Numero intervalos =
√ 200 ≈ 14

Amplitud = Rango / número de intervalos

Y al organizar la información se obtuvo la siguiente tabla de frecuencia.

El histograma para la variable Tasas de fallecidos en el año 2019 queda de la siguiente forma:
El polígono de frecuencias también es de la forma:

Para determinar la media se hizo la sumatoria de todos los datos correspondientes a tasas de

fallecidos en el año 2019, y se dividieron entre la cantidad total de datos que son 200

x́=¿ ¿ = 0,592864869/200 x́=¿0,0029643243

Significa que el promedio de tasas de fallecidos en el año 2019 fue de 0,0029643243% (media)
Por otra parte, se observa en la tabla de frecuencias y en el histograma o polígono de frecuencias

que las tasas de mayor frecuencia de fallecidos en el año 2019 está entre 0,000013490% y

0,0014649322% (moda)

Mientras que la tasa central de fallecidos es del 0,0017298729%. (Mediana)

Ahora, para determinar qué tasas están por debajo del 25% 50% y 75% se procede a determinar

los cuartiles, el decil 5 (equivalente al cuartil 2) y los percentiles 25 (equivalente al cuartil 2) y

50 (equivalente al cuartil 2 o al decil 5).

Entonces el cuartil 1 es:

( 1∗200 )
Q 1= =50
4

Entonces el dato de la posición 50, es el 0,0009005918, lo que significa que:

El 25% de tasas de fallecidos en el año 2019, para los 200 municipios encuestados está por

debajo de 0,00090059185%, y el 75% restante está por encima de 0,0009005918%.

Para el cuartil 2 es:

( 2∗200 )
Q 2= =100
4

Entonces el dato de la posición 100, es el 0,0017120496, lo que significa que:


El 50% de tasas de fallecidos en el año 2019, para los 200 municipios encuestados está por

debajo de 0,0017120496%, y el 50% restante está por encima de 0,0017120496%.

Finalmente, para el cuartil 3 es:

( 3∗200 )
Q 3= =150
4

Entonces el dato de la posición 150, es el 0,0035479632, lo que significa que:

El 75% de accidentes donde el objeto de choque es una bicicleta, para los 200 municipios

encuestados está por debajo de 0,0035479632%, y el 25% restante está por encima de

0,0035479632%.

En la lista ordenada de las tasas de fallecidos en el año 2019 se puede observar detalladamente

cada cuartil
Con respecto a la asimetría, esta se determina por el coeficiente de Bowley, con los cuartiles y la

mediana de la siguiente manera

Q 3+Q 1−2 Me
CA =
Q 3−Q1

0,0035479632+0,00090059185−2(0,0017298729)
CA=
0,0035479632−0,00090059185

CA =0,37350653

Ya que el coeficiente de asimetría es positivo, la mayoría de tasas de fallecidos en el año 2019 de

los 200 municipios están más a la derecha del promedio.

Para el coeficiente de curtosis se tiene en cuenta la expresión:


De donde Sx es la desviación estándar a la cuarta potencia. O en dado caso, la varianza elevada

al cuadrado.

Para la varianza (s2) se toma la expresión:

La sumatoria de todos los datos restando la media y elevando al cuadrado dio 0,002347204 y el

total de la muestra restando 1 es 199. Luego la varianza es:

0,002347204
s2=
199

s2=0,000011795

Ahora, la sumatoria de todos los datos restando el promedio, elevando a la cuarta potencia da

000000267547020646, y por otro lado, el producto del total de datos con la varianza al cuadrado

es 0,000000027824388742

Por lo tanto, el coeficiente de Curtosis, es:

0,000000267547020646
Curtosis= −3
0,000000027824388742

Curtosis=9,61555789−3

Curtosis=6,615557888
Ya que el coeficiente es positivo, la distribución es leptocúrtica, es decir, que la distribución es

más puntiaguda y esto quiere decir que hay una mayor concentración de los datos en torno a la

media.

Finalmente, se determina la desviación típica y el coeficiente de variación para conocer qué tan

dispersas o concentradas están las tasas de fallecidos en torno al promedio. Entonces:

s= √0,000011795

s=0,003434384

Ahora, el coeficiente de variación es:

s
CV =

0,003434384
CV =
0,0029643243

CV =1,158572427

ANALISIS DE LA INFORMACIÓN OBTENIDA

En este caso se puede demostrar que hay mucha heterogeneidad en las tasas de fallecidos para

los 200 municipios en el año 2019. Lo cual podría presentarse por diferentes factores, como el

tipo de población (urbana o rural), la cantidad de habitantes, los tipos de vehículos para cada

municipio, entre otras.

Este análisis puede dar fe que en cada municipio pueden tener distintas estrategias que eviten

mitigar los accidentes de tránsito para ciertos municipios, o también puede probar que un modelo

único de prevención no sirve en todos los contextos por diferentes factores, ya que en un pueblo
pueden verse menores proporciones de vehículos que en ciudades donde a mayor cantidad de

vehículos, mayor cantidad de accidentes.

Por otra parte, los accidentes donde el objeto de choque implicado era una bicicleta muestra más

municipios donde se presentan pocos accidentes, sin embargo existe atipicidad en los datos, lo

que implica en el cálculo del promedio y que ese promedio sea significativo para el estudio en

cuestión.

También se observa que son pocos los accidentes en la mayoría de los municipios cuando el

objeto de choque fue una bicicleta, sin embargo al presentarse más de 10 en algunos municipios,

sería una causa por la cual es necesaria una estrategia para estos municipios donde se arroja una

alta concentración de accidentes en bicicleta.

CONCLUSIONES

- Se pudo determinar que el promedio de accidentes donde el objeto de choque fue una

bicicleta es de aproximadamente 8 o 9 accidentes. Lo que querría decir que al año pueden

estar produciéndose 8 o 9 accidentes en bicicleta, lo cual en otros términos puede explicarse

como cada 4 meses se presentan aproximadamente 3 accidentes. Mientras que el promedio de

tasas de fallecidos en el año 2019 es de 0,0029643243%

- En las representaciones se muestra de una manera más clara, que las distribuciones son de

gran asimetría, asimismo se puede observar que la mayor tasa de accidentes presentados en
los 200 municipios fue de 93, mientras que la menor fue de 4. Por otro lado la mayor tasa de

fallecidos es de 0,020333681% y la menor fue de 0,00001349.

- Al observar la dispersion de los datos por el coeficiente de variación en los casos de las tasas

de fallecidos y la cantidad de choques en bicicleta. Existe mayor concentración en la cantidad

de choques que en las tasas de fallecidos.

REFERENCIAS BIBLIOGRAFICAS.

 García, J. E (2005). Análisis de Datos Unidimensionales.et al. Madrid: Paraninfo. (pp 26

-42). Recuperado de http://go.galegroup.com/ps/i.do?id=GALE

%7CCX4052300007&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=03f8699ec7ccf10e

8745c0ceb7b85bf1

 Matus, R., Hernández, Martha, and García, E (2010). Estadística. México, D.F., MX:

Instituto Politécnico Nacional, (2010).  ProQuest ebrary. (pp 8-15).   Recuperado


de http://site.ebrary.com/lib/unadsp/reader.action?

ppg=12&docID=10365616&tm=1471981556569    

 Monroy, S. S. (2005). Estadística descriptiva. México, D.F., MX: Instituto Politécnico

Nacional. (pp 55-79).Recuperado de http://site.ebrary.com/lib/unadsp/reader.action?

ppg=1&docID=10436604&tm=1471981857855  

 Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical

Descriptive.   Cengage Learning Paraninfo, S.A.(pp 41-50). Recuperado

de http://go.galegroup.com/ps/i.do?id=GALE

%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbe

a60961107ffc27a0

 Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical

Descriptive.   Cengage Learning Paraninfo, S.A. (pp 41-50). Recuperado

de http://go.galegroup.com/ps/i.do?id=GALE

%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbe

a60961107ffc27a0

  Ortegón Pava, M. (2017). Ova_Medidas_Univariantes.Colombia.Recuperado

de  http://hdl.handle.net/10596/11577

También podría gustarte