Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Código 100105
Grupo 202
Realizado por:
Código: 87247954
Pasto Nariño
Noviembre, 2016
ESTADISTICA DESCRIPTIVA
Código 100105
Grupo 202
Presentado al docente:
Pasto Nariño
Noviembre, 2016
INTRODUCCIÓN
La finalidad del presente trabajo es abordar los temas relacionados en la Unidad 2 como el
Análisis de datos Unidimensionales, aprender a calcular resultados de datos ya sean
agrupados o no agrupados, saber como interpretarlos para obtener conclusiones de una serie
de medidas
Como complemento del trabajo se realizan unas conclusiones y se presentan las referencias
bibliográficas como referentes para el desarrollo de la actividad.
OBJETIVOS
a. Elegir una variable discreta que sea representativa y elaborar una tabla de
frecuencias para datos no agrupados
- Las variables discretas del problema son Número de Muertos y Número de
heridos, y para el desarrollo de la actividad escogí la variable "Número de
muertos" de acuerdo a esto presento la tabla de frecuencia, la gráfica y el cálculo de
las medidas de tendencia univariantes con su respectivo análisis
Según la gráfica podemos observar que en el mayor número de accidentes fueron de a dos
personas que perdieron la vida
- Calcular las medidas de tendencia central: media, mediana, moda, los
cuartiles, deciles 5 y 7; percentiles 30, 50 e interpretar sus resultados.
Para el desarrollo de la actividad, se ha seleccionada la variable cuantitativa discreta
“número de muertos”
Media 4
Moda 2
Mediana 3
Para la Media, en las 100 muestras tomadas de los accidentes de tránsito en la
ciudad de Medellín se puede deducir que en promedio mueren 4 personas por
accidente.
De acuerdo a las tablas presentadas se puede observar que el cuartil 2 (Q2), el decíl 5 (D5)
y el percentil 50 (P50) es la misma Mediana, por lo que podemos decir que entre 1 y 3
muertos corresponden al 50% de los accidentes de tránsito en Medellín y el otro 50% está
entre 3 y 10 muertos en cada accidente de tránsito ocurrido en la ciudad de Medellín
Dato valor
n = Número de datos 100
Min = Dato mínimo 33
Max = Dato máximo 88
Rango = Max - Min 55
K = Número de intervalos 7,6640 se aproxima a 8
A = Amplitud (Ran/K) 6,9
TABLA DE FRECUENCIAS PARA DATOS AGRUPADOS
Frecuencia
numero de límite límite marca de frecuencia
absoluta f*x
intervalos inferior superior clase (x) absoluta (f)
acumulada
1 33 39,9 36,44 2 2 72,88
2 39,9 46,8 43,31 4 6 173,25
3 46,8 53,6 50,19 6 12 301,13
4 53,6 60,5 57,06 9 21 513,56
5 60,5 67,4 63,94 12 33 767,25
6 67,4 74,3 70,81 30 63 2124,38
7 74,3 81,1 77,69 25 88 1942,19
8 81,1 88,0 84,56 12 100 1014,75
total de muestra 100 6909,38
MEDIA
𝑓∗𝑥 6909,38
𝑥= 𝑥= 𝑥 = 69,09
𝑛 100
Dato Valor
n/2 50
N 100
Fk-1 33
fk 30
Ak 8
Lk 67,4
MEDIANA 71,93
𝑛
− 𝐹𝑘−1
𝑀𝑒 = 2 ∗ 𝐴𝑘 + 𝐿𝑘
𝑓𝑘
100
− 33
𝑀𝑒 = 2 ∗ 8 + 67,4
30
17
𝑀𝑒 = ∗ 8 + 67,4
30
𝑀𝑒 = 0,56 ∗ 8 + 67,4
𝑀𝑒 = 71,93
Para el caso de los accidentes de tránsito en la ciudad de Medellín, miramos que el 50% de
estos se presentan entre velocidades que van desde los 33 a los 71,93 km/h y el otro 50% de
los accidentes ocurren por velocidades entre 71,93 km/h y los 88 km/h
Dato Valor
fk-1 12
fk+1 25
Ak 8
Lk 67,4
MODA 69,99
𝑓𝑘−1
𝑀𝑜 = ∗ 𝐴𝑘 + 𝐿𝑘
𝑓𝑘−1 + 𝑓𝑘+1
12
𝑀𝑜 = ∗ 8 + 67,4
12 + 25
12
𝑀𝑜 = ∗ 8 + 67,4
37
𝑀𝑜 = 0,324 ∗ 8 + 67,4
𝑀𝑜 = 2,59 + 67,4 = 69,99
La tendencia que se presenta en la ciudad de Medellín en cuanto a la velocidad es que los
accidentes de tránsito ocurren a por ir a una velocidad de 69.99 km/h.
35
30
30
25
25
20
15
12 12
9
10
6
4
5
2
0
36,44 43,31 50,19 57,06 63,94 70,81 77,69 84,56
Dato Valor 𝐾 𝑁 − 𝐹𝑘
4
K(n/4) 25 𝑄𝑘 = 𝐿𝑘 + ∗𝑐
n 100 𝑓𝑘
FK 33
fk 12 25 − 33
𝑄𝑘 = 60,5 + ∗ 6,9
c 6,9 12
Lk 60,5
Q1 55,90 −8
𝑄𝑘 = 60,5 + ∗ 6,9
12
Dato Valor
75 − 88
K(n/4) 75 𝑄𝑘 = 74,3 + ∗ 6,9
n 100 25
FK 88
fk 25
𝑄𝑘 = 74,3 + −0,52 ∗ 6,9
c 6,9
Lk 74,3 𝑄𝑘 = 74,3 + −3,59 = 70,71
Q3 70,71
Para el caso de los accidentes de tránsito en la ciudad de Medellín, miramos que según el
Q1, el 25% de estos se presentan entre velocidades que van desde los 33 a los 55,9 km/h y
el otro 75% de los accidentes ocurren por velocidades entre 55,9 km/h y los 88 km/h
Para el caso de los accidentes de tránsito en la ciudad de Medellín, miramos que según el
Q2, el 50% de estos se presentan entre velocidades que van desde los 33 a los 64,4 km/h y
el otro 50% de los accidentes ocurren por velocidades entre 64,4 km/h y los 88 km/h
Para el caso de los accidentes de tránsito en la ciudad de Medellín, miramos que según el
Q3, el 75% de estos se presentan entre velocidades que van desde los 33 a los 70,71 km/h y
el otro 25% de los accidentes ocurren por velocidades entre 70,71 km/h y los 88 km/h
Dato Valor 𝐾 𝑁 − 𝐹𝑘
10
K(n/10) 50
𝐷𝑘 = 𝐿𝑘 + ∗𝑐
n 100 𝑓𝑘
FK 33
fk 30 50 − 33
𝐷𝑘 = 67,4 + ∗ 6,9
c 6,9 30
Lk 67,4
D5 71,31 𝐷𝑘 = 67,4 + 0.566 ∗ 6,9
Dato Valor 𝐾 𝑁 − 𝐹𝑘
10
K(n/10) 84
𝐷𝑘 = 𝐿𝑘 + ∗𝑐
n 100 𝑓𝑘
FK 63
fk 25
84 − 63
c 6,9
𝐷𝑘 = 74,3 + ∗ 6,9
Lk 74,3 25
D7 80,10
𝐷𝑘 = 74,3 + 0.84 ∗ 6,9
Para el caso de los accidentes de tránsito en la ciudad de Medellín, miramos que según el
D7, el 70% de estos se presentan entre velocidades que van desde los 33 a los 80,10 km/h y
el 30% restante de los accidentes ocurren en velocidades entre 80,10 km/h y los 88 km/h
Dato Valor
𝑁
K(n/10) 25 𝐾 100 − 𝐹𝑘
n 100 𝑃𝑘 = 𝐿𝑘 + ∗𝑐
FK 21 𝑓𝑘
fk 12
c 6,9 25−21
Lk 60,5 𝑃𝑘 = 60,5 + ∗6,9
12
P25 62,80
𝑃𝑘 = 60,5 + 0.333 ∗ 6,9
Para el caso de los accidentes de tránsito en la ciudad de Medellín, miramos que según el
P25, el 25% de estos se presentan entre velocidades que van desde los 33 a los 62,80 km/h
y el 75% de los accidentes ocurren por velocidades entre 62,80 km/h y los 88 km/h
Dato Valor 𝑁
K(n/10) 50 𝐾 100 − 𝐹𝑘
n 100 𝑃𝑘 = 𝐿𝑘 + ∗𝑐
FK 33 𝑓𝑘
fk 30
c 6,9 50−33
Lk 67,4 𝑃𝑘 = 67,4 + ∗6,9
30
P50 71,31
𝑃𝑘 = 67,4 + 0.566 ∗ 6,9
- Identificar las variables discretas dentro del problema de estudio y calcular las
medidas univariantes de dispersión más adecuadas, a aquellas que consideren sean
relevantes para el problema de estudio.
TABLA DE FRECUENCIAS
Número de Frecuencia
Muertos (x) absoluta (f)
f*x x2 𝒙− 𝒙 ⬚
𝒙− 𝒙 𝟐 𝒙 − 𝒙 𝟐 *f
1 7 7 1 -3 9 63
2 24 48 4 -2 4 96
3 22 66 9 -1 1 22
4 10 40 16 0 0 0
5 9 45 25 1 1 9
6 4 24 36 2 4 16
7 10 70 49 3 9 90
8 8 64 64 4 16 128
9 5 45 81 5 25 125
10 1 10 100 6 36 36
TOTAL 100 419 385 15 105 585
MEDIA VARIANZA
2
𝑓∗𝑥 2
𝑥−𝑥 ∗𝑓
𝑥= 𝑆 =
𝑛 𝑛
419 585
𝑥= = 4,19 = 4 𝑆2 = = 5,85
100 100
DESVIACION ESTANDAR COEFICIENTE DE VARIACION
𝑠
𝑠= 𝑆2 𝐶𝑉 = ∗ 100%
𝑥
2,419
𝑠= 5,85 = 2,419 𝐶𝑉 = ∗ 100% = 60,47%
4
Columna1
DATOS VALOR
Media 4,19
MEDIA 4
Error típico 0,24233502
VARIANZA 5,85
Mediana 3
DESVIACION TIPICA 2,419
Moda 2
COEFICIENTE DE VARIACION 60,47%
Desviación estándar 2,42335021
MIN 1
Varianza de la muestra 5,87262626
MAX 10
Curtosis -0,76137554
MODA 2
Coeficiente de asimetría 0,6727742
MEDIANA 3
Rango 9
RANGO 9
Mínimo 1
SUMA (f*x) 419
Máximo 10
N° DATOS 100
Suma 419
Cuenta 100
- Con la variable Continua elegida calcular: rango, varianza, desviación típica y
coeficiente de variación. Interpretar los resultados obtenidos y asociarlos con el
problema objeto de estudio.
TABLA DE FRECUENCIAS
Frecuencia
numero de límite límite marca de 2 frecuencia absoluta 2
intervalos inferior superior clase (x) x absoluta (f) acumulada
f*x (f)* x
(Fk)
1 33 39,9 36,44 1327,69 2 2 72,88 2655,38
2 39,9 46,8 43,31 1875,97 4 6 173,25 7503,89
3 46,8 53,6 50,19 2518,79 6 12 301,13 15112,71
4 53,6 60,5 57,06 3256,13 9 21 513,56 29305,16
5 60,5 67,4 63,94 4088,00 12 33 767,25 49056,05
6 67,4 74,3 70,81 5014,41 30 63 2124,38 150432,30
7 74,3 81,1 77,69 6035,35 25 88 1942,19 150883,69
8 81,1 88,0 84,56 7150,82 12 100 1014,75 85809,80
total de muestra 31.267,16 100 6.909,38 490.758,98
Dato valor
n = Número de datos 100
Min = Dato mínimo 33
MEDIA 69,09
Max = Dato máximo 88 MEIDA ^2 4773,95
Rango = Max - Min 55 VARIANZA 133,64
7,6640 DESVIACION ESTANDAR 11,56
K = Número de intervalos
Aproximada a 8
A = Amplitud (Ran/K) 6,9
2
2
𝑓 𝑥−𝑥 2
𝑓 ∗ 𝑥2
𝑆 = ⇒ 𝑆 = − 𝑥2
𝑛 𝑛
490.758,98
𝑆2 = − 4773,95
100
490.758,98
𝑆2 = − 4773,95 = 133,64
100
REFERENCIAS
https://www.youtube.com/watch?v=pRxnxVuj3tU&list=PL5ZGqf5LzqrVQUIkKjyalgMF9
BDrYpdYQ&index=4
https://www.youtube.com/watch?v=Kj9g-
BC2YSg&list=PL5ZGqf5LzqrVQUIkKjyalgMF9BDrYpdYQ&index=1
https://www.youtube.com/watch?v=gCjJdLG5l2A&index=3&list=PL5ZGqf5LzqrVQUIkK
jyalgMF9BDrYpdYQ
https://www.youtube.com/watch?v=Ktk263q-W-4&feature=youtu.be
http://estadisticadescriptivaunad100105.blogspot.com.co/2012/02/medidas-de-dispersion-y-
apuntamiento.html