Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Unidad 1 2 Paso 3 Analisis de La Informacion
Unidad 1 2 Paso 3 Analisis de La Informacion
ACTIVIDAD COLABORATIVA
INTEGRANTES
Tutor
DANIEL FRANCISCO CHICA
La actividad está dirigida a una gran variedad de datos con mucha información
recolectada, dando soluciones por medio de un estudio descriptivo con reglas y
fórmulas para hallar la solución a cada problema, obteniendo óptimos resultados
estadísticos, para predecir o descifrar cualquier estudio en específico.
OBJETIVOS
Objetivo General
Objetivos Específicos
5,193,946
4,437,638 Mediana 5,888,935
Dato mínimo Q1 Q2 Q3 Dato máximo
2,282,953 25% 50% 75% 7,874,204
El 25% (Q1) del estudio sobre las personas sin empleo se encuentra entre 2, 282,953 y
4, 405,881; el 50% (Q2) entre 4, 405, 881 y 5, 193,946 y el 75% (Q3) consta desde 5,
193, 496 y 5, 896, 375.
En promedio 5, 148,582 personas quedaron sin empleo en Colombia en los periodos de
enero de 2001 a marzo de 2017.
Para la variable personas sin empleo en Colombia, no existe moda porque no hay datos
repetidos por ende es amodal.
Las personas sin empleo para el primer 50% estuvo entre 2, 282,953 y 5, 139,325, y
para el segundo 50% la persona sin empleo en el país de Colombia fue entre 5, 198,271
y 7, 874,204.
VARIABLE CONTINUA_ TASA DE DESEMPLEO (%)
Tabla de frecuencia
Nº Clases Frecuenci Frecuenci
Límite Límite Marca de
(intervalos a absoluta a absoluta f*x
inferior superior clase(x)
) f acumulad
a
1 7,27 8,21 7,7 6 6 46,2
2 8,21 9,15 8,7 24 30 208,8
3 9,15 10,09 9,6 25 55 240
4 10,09 11,03 10,6 27 82 286,2
5 11,03 11,97 11,5 34 116 39,1
6 11,97 12,91 12,4 28 144 347,2
7 12,91 13,85 13,4 14 158 187,6
8 13,85 14,79 14,3 18 176 257,4
9 14,79 15,73 15,3 9 185 137,7
185 1750,2
N 185
Min 7,27
Max 15,77
Rango 8,5
K=Nº 8,53154448
Intervalos 2 9
A 0,94
1.5
1
Clase Frecuenci
a
0.5
0
7,27 1
9,77666666
7,27
2
9,776666667 12,28333333 y mayor...
7
12,2833333 3
3
y mayor... 3
Polígono de frecuencias.
FRECUENCIA ABSOLUTA ACUMULADA
3.5
2.5
1.5
0.5
0
1 2 3 4
MEDIA_9,46
Desde el año 2001 hasta el año 2017, el promedio de la tasa de desempleo en Colombia
fue de 9,46%.
MODA
fk-1 27
fk+1 28
Ak 0,94
Lk 11,03
Moda= 11,5
Desde el 2001 hasta el 2017 la tasa de desempleo que más se repitió en esos años fue de
11,5 algunos meses o algunos años estuvieron por encima y otro por debajo pero el que
más se repitió fue 11,5.
MEDIANA
n/2 92,5
n 185
Fk-1 82
fk 34
Ak 0,94
Lk 11,03
Mediana = 11,32
EL 50% de esos 185 meses en donde se estudió el desempleo en Colombia, presento
una tasa de desempleo entre 7,27% y 11,32%, el otro 50% de esos 185 meses presento
una tasa de desempleo entre 11,32% y 15,77%.
CUARTILES y PERCENTILES
k(n/100) 46,25 Q 1=¿
n 185 n
FK 30 K [ ]
100
− F k−1
fk 25 185∗Ak + Lk
A 0,94 Q 1=¿
f 25
k
[ ]
100
−30
∗0,94+ ¿
9,15=9,8
LK 9,15 25
Q1 9,8
k(n/100) 92,5
n 185
FK 82
fk 34
A 0,94
LK 11,03
Q2 11,32
k(n/100) 138,75
n 185
FK 116
fk 28
A 0,94
LK 11,97
Q3 12,73
P2 Q1 9,8
5
P5 Q2 11,32
0
Q3 12,73
Tanto el Q1, Q2, P25 Y P50 contienen los mismos resultado puesto que representa
el 25% y 50% de la variable continua, estos son los cortes que se realizaran para el
listado de Tasa de desempleo (%), incluyendo también el corte del Q3.
DECILES 5 y 7.
FK 82 Kn
fk 34 [ ]
D5¿ 10
− F k−1
∗Ak + Lk
A 0,94 fk
LK 11,03
[ 5 ]∗185
−F k−1
D5¿ 10
D5 11,32 ∗Ak + Lk
fk
92,5−82
D5¿ ∗0,94+¿ 11,03
34
=11,32
FK 116 [ 7 ]∗185
fk 28 −Fk−1
D7¿ 10
A 0,94 ∗A k + L k
fk
LK 11,97 129,5−116
D7 12,42 D7¿ ∗0,94+ ¿
28
11,97
D5 11,39
D7 12,42
El decil 5 es el misma cuartil 2 y percentil 50, por ende tienen los mismo valores. El
decil 7 es el 70% de los datos contenidos en la variable tasa de desempleo (%).
Variable discreta
Desarrollo
Columna1
Media 44808391.83
Error típico 177320.5802
NUMERO
Mediana 44808392
DE DATOS
195
Moda #N/A
Desviación estándar 2476147.147
Varianza de la muestra 6.1313E+12
Curtosis -1.200000006
Coeficiente de asimetría 1.1785E-08
Rango 8511840 MEDIANA 44,808,392.00
Mínimo 40552472
Máximo 49064312
Suma 8737636406
Cuenta 195
CALCULAR CUARTILES
DESILES
CALCULO D5 CALCULO D7
D5 44,808,392.00 D7 46,519,535.00
PERCENTIL
DATO 59 DATO 98
59 43,097,249.00 98 44,808,392.00
Donde tenemos 195 datos, espesamos con el primer estudio que es la mediana, y nos
arroja 44,808,392.00 es el dato intermedio durante la investigación en cantidad de
población, el Q1 el primer bloque de la investigación desde el 1 dato recolectado
40,552,472 hasta el dato 49 42,658,494, que equivale el 25%. El Q2 equivale al
segundo bloque de la investigación y comprende desde el dato 50_ 42,702,370 al 98_
44,808,392 y equivale a un 50% de la investigación, lo mismo el Q3 es el 75% de la
investigación, esta es la manera de hacer particiones significativas en una investigación
según la cantidad de datos recolectadas.
N 195
DATO
136.8
MAYOR
DATO
62.6
MENOR
RANGO 74.1
No
INTERVALOS 8.6074950 9
AMPLITUD
8.235
(ai)
Tabla de frecuencia
L L Valor
inferior Superior Dólar Xi fi fr f fi*Xi fi*Xi^2
[1,713;1,93 66.75 0.112820 1468.674
63 71 0) 8 22 51 22 56 98045.68
[1,930;2,14 74.99 0.097435 1424.865 106854.8
71 79 7) 3 19 9 41 74 61
[2,147;2,36 83.22 0.035897 582.5955 48488.22
79 87 4) 8 7 44 48 28 12
[2,364;2,58 91.46 0.194871 3475.591 317887.7
87 96 0) 3 38 79 86 4 78
[2,580;2,79 99.69 0.123076 11 2392.750 238552.2
96 104 7) 8 24 92 0 33 56
[2,797;3,01 107.9 0.174358 14 3669.719 396083.5
104 112 4) 33 34 97 4 6 87
[3,014;3,23 116.1 0.128205 16 2904.198 337374.6
112 120 0) 68 25 13 9 21 9
[3,230;3,44 124.4 0.061538 18 1492.835 185713.0
120 129 7) 03 12 46 1 13 6
[3,447;3,66 132.6 0.071794 19 1856.930 246299.4
129 137 4] 38 14 87 5 97 74
19 1975299.
5 1 61
Histograma de frecuencia
Clase Frecuencia
7 1
48.87930883 8
90.75861767 3
y mayor... 6
INDICE DE PRECIOS
9
8
7
6
5
4
3
2
1
0
7 48.87930883 90.75861767 y mayor...
Polígono de frecuencias
FA DE INDICE DE PRECIOS
9
8 8
7
6 6
5
4
3 3
2
1 1
0
1 2 3 4
Aquí podemos apreciar mediante gráficas, concluir las frecuencias de los datos están dentro
índices de la investigación variados o inestables 7, 48.87930883, 9075861767, estos
resultados fueron cambiantes durante la investigación de índice de precios,
MEDIDAS DE TENDENCIA CENTRAL
98.81
MEDIA 1
La media es el índice
estadístico durante los años
de investigación en este
caso sería desde el 2001 al
2017 y el promedio fue de
98.8%
MEDIANA 99.53
N/2 97.5
n 195
fi-1 86
fi 24
8.23
ai 5
La mediana es el resultado que obtiene la tendencia central nada más que la ubicación del centro de un
grupo de números en una distribución estadística donde obtuvo la partición de los datos, con un 99.53%
MODA 89.20
fi-1 7
fi+1 24
ai 8.235
Li 87.345
MEDIDAS DE DISPERSIÓN
COEFICIENTE DE
VARIANZA 98.81108445 VARIACIÓN
CV 0.100599812
DESVIACIÓN
ESTÁNDAR 9.940376474
Las medidas de dispersión es la variabilidad de los datos. Las medidas de dispersión más
utilizadas son el rango, la desviación estándar y la varianza. 98.81108445, 0.100599812,
9.940376474 estos los resultados durante los años encuestados de variación y desviación de
los 195 datos del índice de precios
K 3 K 7 K 50
K*N/4 146 K*N/10 137 K*N/100 98
Li 96 Li 87 Li 79
fi-1 86 fi-1 48 fi-1 41
fi 24 fi 38 fi 7
ai 8.235 ai 8.235 ai 8.235
Como podemos observar tenemos los resultados de los cuartiles desiles y percentiles de la
variable continúa obteniendo los siguientes resultados 116.25, 106.5243, 145.58 resultados
muy diferentes a la variable discreta. En cuanto a las particiones.
Columna1
5633846.2
Media 58
101911.04
Error típico 82
5544586.2
Mediana 68
Moda #N/A No hay
911520.12
Desviación estándar 55
8.30869E+
Varianza de la muestra 11
0.1891363
Curtosis 23
0.2728275
Coeficiente de asimetría 32
4808386.3
Rango 63
3060315.3
Mínimo 66
7868701.7
Máximo 29
450707700
Suma .6
Cuenta 80
CALCULO QDP
CUARTILES
DECILES
CALCULO DE D5 CALCULO DE D7
n 195 n 195
k 5 k 7
L 97.5 L 136.5
Dato 40 Dato 56
40 42,263,615 56 42,965,622
41 42,307,490 57 43,009,498
D5 42,285,553 D7 42,987,560
PERCENTILES
n 195 n 195
k 25 k 50
L 48.75 L 97.5
Dato 24 Dato 40
24 41,561,607 40 42,263,615
25 41,605,483 41 42,307,490
n 195
k 9
L 17.55
Dato 8
P9 40,859,600
TABLA f AGRUPADOS
N 195
Dato Mayor 49064312.00
Dato Menor 40552472.00
Rango 8511840.00
N° Intervalos 8.60749 8
Amplitud (ai) 1063980.00
Tasa de
L inf L Sup xi fi fr F fi*xi fi*xi^2
desempleo
40552472.00 41616452.00 [9,96;10,94) 41084462 6 0.030769231 6 246506772 1.01276E+16
41616452.00 42680432.00 [10,94;11,93) 42148442 12 0.061538462 18 505781304 2.13179E+16
42680432.00 43744412.00 [11,93;12,92) 43212422 15 0.076923077 33 648186330 2.80097E+16
43744412.00 44808392.00 [12,92;13,91) 44276402 13 0.066666667 46 575593226 2.54852E+16
44808392.00 45872372.00 [13,91;14,90) 45340382 17 0.087179487 63 770786494 3.49478E+16
45872372.00 46936352.00 [14,90;15,89) 46404362 9 0.046153846 72 417639258 1.93803E+16
46936352.00 48000332.00 [15,89;16,88) 47468342 5 0.025641026 77 237341710 1.12662E+16
48000332.00 49064312.00 [16,88;17,87] 48532322 3 0.015384615 80 145596966 7.06616E+15
TOTAL 80 0.41025641 3547432060 1.57601E+17
MEDIDAS DE DISPERSIÓN
K 3 K 7 K 30
K*N/4 146.25 K*N/10 136.5 K*N/100 58.5
Li 44808392.00 Li 44808392.00 Li 42680432.00
Fi-1 46 Fi-1 46 Fi-1 18
fi 17 fi 17 fi 15
ai 1063980.00 ai 1063980.00 ai 1063980.00
MEDIANA 49023389.69
Li 43744412.00
N/2 97.5
Fi-1 33
fi 13
ai 1063980.00
MODA 45163052.00
Li 44808392.00
fi 17
fi-1 13
fi+1 9
ai 1063980.00
HISTOGRAMA DE FRECUENCIAS
18
16
14
12
10
8
6
4
2
0
[9,96;10,94) [10,94;11,93) [11,93;12,92) [12,92;13,91) [13,91;14,90) [14,90;15,89) [15,89;16,88) [16,88;17,87]
POLÍGONO DE FRECUENCIAS
18
16
14
12
10
8
6
4
2
0
[9,96;10,94) [10,94;11,93) [11,93;12,92) [12,92;13,91) [13,91;14,90) [14,90;15,89) [15,89;16,88) [16,88;17,87]
Columna1
Media 44808391.83
Error típico 177320.5802
Mediana 44808392
Moda #N/A No existe
Desviación estándar 2476147.147
Varianza de la muestra 6.1313E+12
Curtosis -1.200000006
Coeficiente de asimetría 1.1785E-08
Rango 8511840
Mínimo 40552472
Máximo 49064312
Suma 8737636406
Cuenta 195
Calculo QDP
CUARTIL
ES
MEDIANA 44,808,392
DECILES
CALCULO DE CALCULO DE
D5 D7
n 195 n 195
k 5 k 7
L 97.5 L 136.5
D5 42,285,553 D7 42,987,560
PERCENTILES
CALCULO DE CALCULO DE
P30 P50
n 195 n 195
k 30 k 50
L 58.5 L 97.5
CALCULO DE P9
n 195
k 9
L 17.55
Dato 18
P9 40,859,600
Aporte estudiante: DIANA KAROLINA FONSECA SIERRA
POBLACIÓN CANTIDAD DE PERSONAS
Variable discreta
Desarrollo
Columna1
Media 44808391.83
Error típico 177320.5802
Mediana 44808392
Moda #N/A
Desviación estándar 2476147.147
Varianza de la muestra 6.1313E+12
Curtosis -1.200000006
Coeficiente de asimetría 1.1785E-08
Rango 8511840
Mínimo 40552472
Máximo 49064312
Suma 8737636406
Cuenta 195
CALCULAR CUARTILES
CALCULAR DECILES
Decil 1 Decil 2
Datos total 195 Datos total 195
D 5 D 7
L 97.5 L 136.5
CALCULAR
PERCENTIL
Percentil 1 Percentil 2
Datos total 195 Datos total 195
P 30 P 50
L 58.5 L 97.5
Dato 59 Dato 98
59 43,097,249 98 44,808,392
Para esta variable discreta concluimos que el total de datos contados es de 195, donde se
puede ver el valor de la moda la cual no existe, la mediana 44, 808,392.00. también
observamos que se arroja para el dato del 25% un resultado de 49 42,658,494 para el q1.
Para q2 vemos dato del 50_42.702.370 al 98_ 44, 808,392 que es para el 50% y por último
es el de 75% el cual arrojo un dato igualitario al de 50%.
Variable Continua
N 195
Dato mayor 136.8
Dato menor 62.6
Rango 74.1
N° 8.60749497
intervalos 9 9
Amplitud 8.234999
Clase Frecuencia
7 1
48.87930883 8
90.75861767 3
Y mayor 6
INDICE DE PRECIOS
9
8
7
6
5
4
3
2
1
0
7 48.87930883 90.75861767 Y mayor
INDICE DE PRECIOS
8
Estos gráficos calculados, nos ayuden a entender de mejor manera y fácilmente las
frecuencias de la investigación
CONCLUSION
Con este trabajo podemos concluir que al tener pleno conocimiento en la temática
de medidas univariantes estamos en la capacidad de desarrollar ejercicios prácticos donde
interpretamos los resultados de la base de datos propuestos en este caso El desempleo en
Colombia, con el cual se determinó a través de tablas de frecuencia y graficas
representativas los resultados para la moda, media, mediana, los cuartiles, deciles,
percentiles que son indispensables para el análisis de una información estadística.
La cual nos permite conocer de forma porcentual las cifras de desempleo, además de
conocer datos exactos sobre la cantidad y cualidades de la problemática para tener claridad
sobre el objeto de estudio.
BIBLIOGRAFIA