Está en la página 1de 17

ESTADISTICA DESCRIPTIVA

Código 100105

Grupo 202

FASE INTERMEDIA TRABAJO COLABORATIVO 2

Realizado por:

JHON JAIRO MUÑOZ GÓMEZ

Código: 87247954

Universidad Nacional Abierta y a Distancia – UNAD

Escuela De Ciencias Básicas, Tecnología E Ingeniería ECBTI


Ingeniería de Sistemas

Pasto Nariño

Noviembre, 2016
ESTADISTICA DESCRIPTIVA

Código 100105

Grupo 202

FASE INTERMEDIA TRABAJO COLABORATIVO 2

Presentado al docente:

Ing. LUIS GERMAN HUÉRFANO LADINO

Universidad Nacional Abierta y a Distancia – UNAD

Escuela De Ciencias Básicas, Tecnología E Ingeniería ECBTI


Ingeniería de Sistemas

Pasto Nariño

Noviembre, 2016
INTRODUCCIÓN

La finalidad del presente trabajo es abordar los temas relacionados en la Unidad 2 como el
Análisis de datos Unidimensionales, aprender a calcular resultados de datos ya sean
agrupados o no agrupados, saber como interpretarlos para obtener conclusiones de una serie
de medidas

El trabajo práctico nos permite desarrollar estrategias y habilidades que favorecen el


aprendizaje autónomo y contribuyen a nuestra formación académica.

Como complemento del trabajo se realizan unas conclusiones y se presentan las referencias
bibliográficas como referentes para el desarrollo de la actividad.
OBJETIVOS

 Aprender a calcular e interpretar resultados de una serie de medidas

 Realizar el análisis de la información obtenida de una serie de datos que permita


desarrollar la guía de actividades.

 Identificar las variables dentro de un problema de estudio

 Comprender los conceptos básicos para el desarrollo de las actividades planteadas.


1. MEDIDAS UNIVARIANTES DE TENDENCIA CENTRAL

a. Elegir una variable discreta que sea representativa y elaborar una tabla de
frecuencias para datos no agrupados
- Las variables discretas del problema son Número de Muertos y Número de
heridos, y para el desarrollo de la actividad escogí la variable "Número de
muertos" de acuerdo a esto presento la tabla de frecuencia, la gráfica y el cálculo de
las medidas de tendencia univariantes con su respectivo análisis

Número de Muertos TOTAL


1 7
2 24
3 22
4 10
5 9
6 4
7 10
8 8
9 5
10 1
TOTAL 100

Según la gráfica podemos observar que en el mayor número de accidentes fueron de a dos
personas que perdieron la vida
- Calcular las medidas de tendencia central: media, mediana, moda, los
cuartiles, deciles 5 y 7; percentiles 30, 50 e interpretar sus resultados.
Para el desarrollo de la actividad, se ha seleccionada la variable cuantitativa discreta
“número de muertos”

Se tiene una muestra de 100 accidentes de tránsito en la ciudad de Medellín, de esta


muestra se obtienen los siguientes resultados en cuanto a Medidas de tendencia central

Media 4
Moda 2
Mediana 3
 Para la Media, en las 100 muestras tomadas de los accidentes de tránsito en la
ciudad de Medellín se puede deducir que en promedio mueren 4 personas por
accidente.

 Respecto a la Moda, la tendencia que se presenta en los accidentes de tránsito en


Medellín es que mueren de a 2 personas en cada accidente

 De acuerdo a la mediana podemos identificar que en el 50% de los accidentes de


tránsito ocurridos en Medellín se presentaron entre 1 y 3 muertos por cada accidente
y entre 3 y 10 muertos en cada accidente esta el 50% restante de la muestra.

Para las medidas de posición tenemos los cuartiles, deciles y percentiles

CUARTILES VALOR DECILES VALOR PERCENTILES VALOR


Q1 2 D1 2 P30 2
Q2 3 D2 2 P50 3
Q3 6 D3 2
D4 3
D5 3
D6 4
D7 5
D8 7
D9 8
D10 10
P30 P50
D5
Q1 Q2 Q3
v. mínimo mediana v. máximo
1 2 2 3 6 10
25% 50% 75%

De acuerdo a las tablas presentadas se puede observar que el cuartil 2 (Q2), el decíl 5 (D5)
y el percentil 50 (P50) es la misma Mediana, por lo que podemos decir que entre 1 y 3
muertos corresponden al 50% de los accidentes de tránsito en Medellín y el otro 50% está
entre 3 y 10 muertos en cada accidente de tránsito ocurrido en la ciudad de Medellín

El Q1 que corresponde al 25% , de los accidentes de tránsito que ocurren en la ciudad de


Medellín deja entre 1 y 2 muertos en cada accidente, mientras que el Q3 representa el otro
75% de estos accidentes donde mueren de 6 a 10 personas en cada accidente.

b) Elegir una variable Continua que sea representativa y siguiendo los


lineamientos, diseñar una tabla de frecuencia para datos agrupados,
representarla gráficamente por medio de un histograma de frecuencias, un
polígono de frecuencias, calcular las medidas de tendencia central, determinar
el tipo de asimetría, los cuartiles , deciles 5 y 7; percentiles 25, 50 ( Interpretar
sus resultados)

- Para este ejemplo se toma la variable continua “Velocidad”,

TABLA GENERAL DE DATOS

Dato valor
n = Número de datos 100
Min = Dato mínimo 33
Max = Dato máximo 88
Rango = Max - Min 55
K = Número de intervalos 7,6640 se aproxima a 8
A = Amplitud (Ran/K) 6,9
TABLA DE FRECUENCIAS PARA DATOS AGRUPADOS

Frecuencia
numero de límite límite marca de frecuencia
absoluta f*x
intervalos inferior superior clase (x) absoluta (f)
acumulada
1 33 39,9 36,44 2 2 72,88
2 39,9 46,8 43,31 4 6 173,25
3 46,8 53,6 50,19 6 12 301,13
4 53,6 60,5 57,06 9 21 513,56
5 60,5 67,4 63,94 12 33 767,25
6 67,4 74,3 70,81 30 63 2124,38
7 74,3 81,1 77,69 25 88 1942,19
8 81,1 88,0 84,56 12 100 1014,75
total de muestra 100 6909,38

MEDIA

𝑓∗𝑥 6909,38
𝑥= 𝑥= 𝑥 = 69,09
𝑛 100

De acuerdo a los resultados presentados en la muestra se puede deducir que la mayoría de


accidentes de tránsito ocurridos en la ciudad de Medellín se presentan a un promedio de
velocidad de 69.09 Km/h

DATOS PARA CALCULAR LA MEDIANA

Dato Valor
n/2 50
N 100
Fk-1 33
fk 30
Ak 8
Lk 67,4
MEDIANA 71,93

𝑛
− 𝐹𝑘−1
𝑀𝑒 = 2 ∗ 𝐴𝑘 + 𝐿𝑘
𝑓𝑘
100
− 33
𝑀𝑒 = 2 ∗ 8 + 67,4
30
17
𝑀𝑒 = ∗ 8 + 67,4
30
𝑀𝑒 = 0,56 ∗ 8 + 67,4
𝑀𝑒 = 71,93
Para el caso de los accidentes de tránsito en la ciudad de Medellín, miramos que el 50% de
estos se presentan entre velocidades que van desde los 33 a los 71,93 km/h y el otro 50% de
los accidentes ocurren por velocidades entre 71,93 km/h y los 88 km/h

DATOS PARA CALCULAR LA MODA

Dato Valor
fk-1 12
fk+1 25
Ak 8
Lk 67,4
MODA 69,99

𝑓𝑘−1
𝑀𝑜 = ∗ 𝐴𝑘 + 𝐿𝑘
𝑓𝑘−1 + 𝑓𝑘+1
12
𝑀𝑜 = ∗ 8 + 67,4
12 + 25
12
𝑀𝑜 = ∗ 8 + 67,4
37
𝑀𝑜 = 0,324 ∗ 8 + 67,4
𝑀𝑜 = 2,59 + 67,4 = 69,99
La tendencia que se presenta en la ciudad de Medellín en cuanto a la velocidad es que los
accidentes de tránsito ocurren a por ir a una velocidad de 69.99 km/h.

GRAFICA DE HISTOGRAMA Y POLIGONO DE FRECUENCIAS

Histrograma de Frecuencia Poligono de Frecuencia

35
30
30
25
25

20

15
12 12
9
10
6
4
5
2

0
36,44 43,31 50,19 57,06 63,94 70,81 77,69 84,56

DATOS PARA CALCULAR LOS CUATRILES

Dato Valor 𝐾 𝑁 − 𝐹𝑘
4
K(n/4) 25 𝑄𝑘 = 𝐿𝑘 + ∗𝑐
n 100 𝑓𝑘
FK 33
fk 12 25 − 33
𝑄𝑘 = 60,5 + ∗ 6,9
c 6,9 12
Lk 60,5
Q1 55,90 −8
𝑄𝑘 = 60,5 + ∗ 6,9
12

𝑄𝑘 = 60,5 + −0,66 ∗ 6,9

𝑄𝑘 = 60,5 + −4,55 = 55,9


Dato Valor
50 − 63
K(n/4) 50 𝑄𝑘 = 67,4 + ∗ 6,9
n 100 30
FK 63
fk 30 𝑄𝑘 = 67,4 + −0,43 ∗ 6,9
c 6,9
Lk 67,4 𝑄𝑘 = 67,4 + −2,97 = 64.4
Q2 64,41

Dato Valor
75 − 88
K(n/4) 75 𝑄𝑘 = 74,3 + ∗ 6,9
n 100 25
FK 88
fk 25
𝑄𝑘 = 74,3 + −0,52 ∗ 6,9
c 6,9
Lk 74,3 𝑄𝑘 = 74,3 + −3,59 = 70,71
Q3 70,71

Para el caso de los accidentes de tránsito en la ciudad de Medellín, miramos que según el
Q1, el 25% de estos se presentan entre velocidades que van desde los 33 a los 55,9 km/h y
el otro 75% de los accidentes ocurren por velocidades entre 55,9 km/h y los 88 km/h

Para el caso de los accidentes de tránsito en la ciudad de Medellín, miramos que según el
Q2, el 50% de estos se presentan entre velocidades que van desde los 33 a los 64,4 km/h y
el otro 50% de los accidentes ocurren por velocidades entre 64,4 km/h y los 88 km/h

Para el caso de los accidentes de tránsito en la ciudad de Medellín, miramos que según el
Q3, el 75% de estos se presentan entre velocidades que van desde los 33 a los 70,71 km/h y
el otro 25% de los accidentes ocurren por velocidades entre 70,71 km/h y los 88 km/h

DATOS PARA CALCULAR LOS DECILES

Dato Valor 𝐾 𝑁 − 𝐹𝑘
10
K(n/10) 50
𝐷𝑘 = 𝐿𝑘 + ∗𝑐
n 100 𝑓𝑘
FK 33
fk 30 50 − 33
𝐷𝑘 = 67,4 + ∗ 6,9
c 6,9 30
Lk 67,4
D5 71,31 𝐷𝑘 = 67,4 + 0.566 ∗ 6,9

𝐷𝑘 = 67,4 + 3,91 = 71,31


Para el caso de los accidentes de tránsito en la ciudad de Medellín, miramos que según el
D5, el 50% de estos se presentan entre velocidades que van desde los 33 a los 71,93 km/h y
el otro 50% de los accidentes ocurren por velocidades entre 71,93 km/h y los 88 km/h

Dato Valor 𝐾 𝑁 − 𝐹𝑘
10
K(n/10) 84
𝐷𝑘 = 𝐿𝑘 + ∗𝑐
n 100 𝑓𝑘
FK 63
fk 25
84 − 63
c 6,9
𝐷𝑘 = 74,3 + ∗ 6,9
Lk 74,3 25
D7 80,10
𝐷𝑘 = 74,3 + 0.84 ∗ 6,9

𝐷𝑘 = 74,3 + 5,79 = 80,1

Para el caso de los accidentes de tránsito en la ciudad de Medellín, miramos que según el
D7, el 70% de estos se presentan entre velocidades que van desde los 33 a los 80,10 km/h y
el 30% restante de los accidentes ocurren en velocidades entre 80,10 km/h y los 88 km/h

DATOS PARA CALCULAR LOS PERCENTILES

Dato Valor
𝑁
K(n/10) 25 𝐾 100 − 𝐹𝑘
n 100 𝑃𝑘 = 𝐿𝑘 + ∗𝑐
FK 21 𝑓𝑘
fk 12
c 6,9 25−21
Lk 60,5 𝑃𝑘 = 60,5 + ∗6,9
12
P25 62,80
𝑃𝑘 = 60,5 + 0.333 ∗ 6,9

𝑃𝑘 = 60,5 + 2,297 = 62,80

Para el caso de los accidentes de tránsito en la ciudad de Medellín, miramos que según el
P25, el 25% de estos se presentan entre velocidades que van desde los 33 a los 62,80 km/h
y el 75% de los accidentes ocurren por velocidades entre 62,80 km/h y los 88 km/h
Dato Valor 𝑁
K(n/10) 50 𝐾 100 − 𝐹𝑘
n 100 𝑃𝑘 = 𝐿𝑘 + ∗𝑐
FK 33 𝑓𝑘
fk 30
c 6,9 50−33
Lk 67,4 𝑃𝑘 = 67,4 + ∗6,9
30
P50 71,31
𝑃𝑘 = 67,4 + 0.566 ∗ 6,9

𝑃𝑘 = 67,4 + 3,91 = 71,31


Para el caso de los accidentes de tránsito en la ciudad de Medellín, miramos que según el
P50, el 50% de estos se presentan entre velocidades que van desde los 33 a los 71,31 km/h
y el otro 50% de los accidentes ocurren por velocidades entre 71,31 km/h y los 88 km/h
2. MEDIDAS UNIVARIANTES DE DISPERSION.

- Identificar las variables discretas dentro del problema de estudio y calcular las
medidas univariantes de dispersión más adecuadas, a aquellas que consideren sean
relevantes para el problema de estudio.

Las variables discretas del problema son Número de Muertos y Número de


heridos, y para el desarrollo de la actividad escogí la variable "Número de
muertos"

- Con la variable Discreta elegida calcular: rango, varianza, desviación típica y


coeficiente de variación. Interpretar los resultados obtenidos y asociarlos con el
problema objeto de estudio.

TABLA DE FRECUENCIAS

Número de Frecuencia
Muertos (x) absoluta (f)
f*x x2 𝒙− 𝒙 ⬚
𝒙− 𝒙 𝟐 𝒙 − 𝒙 𝟐 *f
1 7 7 1 -3 9 63
2 24 48 4 -2 4 96
3 22 66 9 -1 1 22
4 10 40 16 0 0 0
5 9 45 25 1 1 9
6 4 24 36 2 4 16
7 10 70 49 3 9 90
8 8 64 64 4 16 128
9 5 45 81 5 25 125
10 1 10 100 6 36 36
TOTAL 100 419 385 15 105 585

MEDIA VARIANZA

2
𝑓∗𝑥 2
𝑥−𝑥 ∗𝑓
𝑥= 𝑆 =
𝑛 𝑛
419 585
𝑥= = 4,19 = 4 𝑆2 = = 5,85
100 100
DESVIACION ESTANDAR COEFICIENTE DE VARIACION

𝑠
𝑠= 𝑆2 𝐶𝑉 = ∗ 100%
𝑥

2,419
𝑠= 5,85 = 2,419 𝐶𝑉 = ∗ 100% = 60,47%
4

Columna1
DATOS VALOR
Media 4,19
MEDIA 4
Error típico 0,24233502
VARIANZA 5,85
Mediana 3
DESVIACION TIPICA 2,419
Moda 2
COEFICIENTE DE VARIACION 60,47%
Desviación estándar 2,42335021
MIN 1
Varianza de la muestra 5,87262626
MAX 10
Curtosis -0,76137554
MODA 2
Coeficiente de asimetría 0,6727742
MEDIANA 3
Rango 9
RANGO 9
Mínimo 1
SUMA (f*x) 419
Máximo 10
N° DATOS 100
Suma 419

Cuenta 100
- Con la variable Continua elegida calcular: rango, varianza, desviación típica y
coeficiente de variación. Interpretar los resultados obtenidos y asociarlos con el
problema objeto de estudio.

TABLA DE FRECUENCIAS

Frecuencia
numero de límite límite marca de 2 frecuencia absoluta 2
intervalos inferior superior clase (x) x absoluta (f) acumulada
f*x (f)* x
(Fk)
1 33 39,9 36,44 1327,69 2 2 72,88 2655,38
2 39,9 46,8 43,31 1875,97 4 6 173,25 7503,89
3 46,8 53,6 50,19 2518,79 6 12 301,13 15112,71
4 53,6 60,5 57,06 3256,13 9 21 513,56 29305,16
5 60,5 67,4 63,94 4088,00 12 33 767,25 49056,05
6 67,4 74,3 70,81 5014,41 30 63 2124,38 150432,30
7 74,3 81,1 77,69 6035,35 25 88 1942,19 150883,69
8 81,1 88,0 84,56 7150,82 12 100 1014,75 85809,80
total de muestra 31.267,16 100 6.909,38 490.758,98

Dato valor
n = Número de datos 100
Min = Dato mínimo 33
MEDIA 69,09
Max = Dato máximo 88 MEIDA ^2 4773,95
Rango = Max - Min 55 VARIANZA 133,64
7,6640 DESVIACION ESTANDAR 11,56
K = Número de intervalos
Aproximada a 8
A = Amplitud (Ran/K) 6,9

2
2
𝑓 𝑥−𝑥 2
𝑓 ∗ 𝑥2
𝑆 = ⇒ 𝑆 = − 𝑥2
𝑛 𝑛
490.758,98
𝑆2 = − 4773,95
100

490.758,98
𝑆2 = − 4773,95 = 133,64
100
REFERENCIAS

Estaban García, Jesús, et al. "Análisis de Datos Unidimensionales." Estadística descriptiva y


nociones de probabilidad, Paraninfo, 2005, pp. 25-69. Gale Virtual Reference
Library, go.galegroup.com/ps/i.do?p=GVRL&sw=w&u=unad&v=2.1&id=GALE%7CCX4052300
007&it=r&asid=03f8699ec7ccf10e8745c0ceb7b85bf1. Accessed 30 Oct. 2016.

https://www.youtube.com/watch?v=pRxnxVuj3tU&list=PL5ZGqf5LzqrVQUIkKjyalgMF9
BDrYpdYQ&index=4

https://www.youtube.com/watch?v=Kj9g-
BC2YSg&list=PL5ZGqf5LzqrVQUIkKjyalgMF9BDrYpdYQ&index=1

https://www.youtube.com/watch?v=gCjJdLG5l2A&index=3&list=PL5ZGqf5LzqrVQUIkK
jyalgMF9BDrYpdYQ

https://www.youtube.com/watch?v=Ktk263q-W-4&feature=youtu.be

http://estadisticadescriptivaunad100105.blogspot.com.co/2012/02/medidas-de-dispersion-y-
apuntamiento.html

También podría gustarte