Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Estudiantes:
Código 23561513
Código. 1098708450
Código.91181418
100109_99
Presentado a
2018
1
INTRODUCCIÓN
En el trabajo colaborativo que se presenta a continuación, se aplican los conceptos básicos de la
Estadística Descriptiva, requeridos para el análisis e interpretación de las variables cuantitativas,
involucradas en un problema de investigación.
2
JUSTIFICACIÓN
Teniendo en cuenta el problema objeto de estudio para el desarrollo de nuestra actividad “El
Desempleo en Colombia”, siendo la base suministrada en nuestra actividad; cada uno de los
integrantes del grupo ha seleccionado una variable discreta y sobre la misma se ha realizado el
cálculo de las medidas univariantes de dispersión más adecuada, la guía nos señala el desarrolla
de la variable discreta donde se calcula el rango, varianza, desviación típica y coeficiente de
variación.
Una vez realizado el ejercicio se desarrolla la interpretación de los resultados obtenidos, los
hemos asociados con el problema objeto de estudio.
De otra parte se calcula la variable Continua elegida por cada estudiante realizando los siguientes
cálculos: rango, varianza, desviación típica y coeficiente de variación, siendo interpretados los
resultados correlacionados con el objeto de estudio.
El desarrollo de la actividad le permitirá a los integrantes del grupo colaborativo, afianzar los
conceptos fundamentales de la Estadística Descriptiva y generar mayores expectativas en cuanto
al alcance de esta rama de las matemáticas.
3
OBJETIVOS
1. Conocer y asimilar los conceptos básicos de la Estadística Descriptiva por medio del estudio
del material bibliográfico incluyendo los recursos audiovisuales.
2. Proporcionar a los estudiantes herramientas teóricas y prácticas que les permitan interpretar
diferentes situaciones a través de análisis cuantitativos y el manejo estadístico de datos.
3. Aplicar y afianzar los conceptos adquiridos por medio del desarrollo de la actividad propuesta,
en sus fases individual y colaborativa.
5. Aclarar las dudas surgidas en el desarrollo del trabajo por medio de la interacción con la tutora
y los integrantes del grupo de trabajo.
4
MEDIDAS UNIVARIANTES DE TENDENCIA CENTRAL
VARIABLE DISCRETA
Definir las medidas de tendencia central y las fórmulas a utilizar para datos no agrupados
(variables discretas).
MEDIA: Se define como la suma de los valores de una cantidad dada de números dividido entre
la cantidad de números.
MEDIANA: Se define como el valor que divide una distribución de datos ordenados en dos
mitades, es decir, se encuentra en el centro de la distribución.
MODA: Se trata del valor más frecuente en un conjunto de datos. Se considera como el valor
más representativo o típico de una serie de valores. Es simbolizada como Mo. Si dos valores
tienen la misma frecuencia se dice que el conjunto es bimodal. Cuando más de dos valores
ocurren con la misma frecuencia y ésta es la más alta, todos los valores son modas, por lo que el
conjunto de datos recibe el nombre de multimodal o polimodal.
CUARTILES, DECILES Y PERCENTILES: Son medidas que se utilizan para determinar los
intervalos dentro de los cuales quedan proporcionalmente repartidos los términos de la
distribución.
Los cuartiles dividen la distribución en cuatro partes iguales, de manera que cada una tendrá el
25% de las observaciones. Los tres puntos de separación de los valores son los cuartiles. El
cuartil inferior (Q1) es aquel valor de la variable que representa el 25% de las observaciones y a
la vez, es superado por el 75% restante. El segundo cuartil (Q2) corresponderá a la mediana de la
distribución. El tercer cuartil (Q3) es aquel valor que representa el 75% y es superado por el 25%
restante de las observaciones.
5
Los deciles dividen el conjunto de datos en 10 partes iguales, de manera que se obtienen nueve
valores que dividen la frecuencia total en diez partes iguales. El primer decil (D1) es igual al
valor que supera al 10% de las observaciones y es superado por el 90% restante y así para cada
uno de los deciles.
El centil o percentil divide en cien partes iguales la distribución. El primer percentil (P1) es
igual al valor que supera al 1% de las observaciones y es superado por el 99% restante y así
sucesivamente.
6
Estudiante 1: Gloria Edilsa Romero Lozano
Variable discreta: Personas sin empleo
MEDIA 4.945.286
MEDIANA 4.946.357
MODA Amodal
CUARTIL 1 4.221.136
CUARTIL 2 4.946.357
CUARTIL 3 5.708.950
DECIL 5 4.946.357
DECIL 7 5.552.705
PERCENTIL 30 4.399.785
PERCENTIL 50 4.946.357
Gráfica:
7
DESEMPLEO EN COLOMBIA
9,000,000
PERSONAS SIN EMPLEO
8,000,000
7,000,000
6,000,000
5,000,000
4,000,000
3,000,000
2,000,000
1,000,000
-
1
8
15
22
29
36
43
50
57
64
71
78
85
92
99
106
113
120
127
134
141
148
155
MESES
MEDIA 4.945.286
MEDIANA 4.946.357
MODA Amodal
CUARTIL 1 4.221.136
CUARTIL 2 4.946.357
CUARTIL 3 5.708.950
DECIL 5 4.946.357
DECIL 7 5.552.705
PERCENTIL 30 4.399.785
PERCENTIL 50 4.946.357
8
Gráfica:
6,000,000
5,000,000
4,000,000
3,000,000
2,000,000
Personas SinEmpleo
1,000,000
Frecuencia Absoluta
-
106
113
120
127
134
141
148
155
1
8
36
15
22
29
43
50
57
64
71
78
85
92
99
Meses
MEDIA 7.207.189
MEDIANA 4.946.357
MODA Amodal
CUARTIL 1 4.221.136
CUARTIL 2 4.946.357
CUARTIL 3 5.708.950
DECIL 5 4.946.357
DECIL 7 5.552.705
PERCENTIL 30 4.399.785
PERCENTIL 50 4.946.357
9
Gráfica:
DESEMPLEO EN COLOMBIA
9,000,000
8,000,000
7,000,000
PERSONAS SIN EMPLEO
6,000,000
5,000,000
4,000,000
3,000,000
2,000,000
1,000,000
-
103
109
115
121
127
133
139
145
151
157
1
7
13
19
25
31
37
43
49
55
61
67
73
79
85
91
97
MESES
1. En el período de tiempo de la muestra (159 meses), la cantidad de personas sin empleo fue un
valor fluctuante, con una leve tendencia hacia la disminución.
2. En los 159 meses del estudio sobre desempleo en Colombia, el número de personas sin empleo
en promedio fue de 4.945.286.
3. La menor cantidad de personas sin empleo fue de 2.282.953.
10
4. La mayor cantidad de personas sin empleo fue de 7.874.204.
5. MODA: El conjunto de datos es AMODAL, ya que no se repiten datos.
6. MEDIANA: El valor de la mediana se encuentra en la posición 80 de los datos y corresponde a
4.946.357. Este valor divide el conjunto de datos en dos partes iguales. En el 50% de los meses
estudiados, la cantidad de personas sin empleo estuvo entre 2.282.953 y 4.939.903 y en el otro
50% entre 4.966.378 y 7.874.204.
7. En el 25 % de la muestra, la cantidad de personas sin empleo estuvo entre 2.282.953 y
4.221.136.
8. Entre el 25% y el 50% de la muestra, la cantidad de personas sin empleo estuvo entre
4.221.136 y 4.946.357.
9. En el 75% de la muestra, la cantidad de personas sin empleo fue de 5.708.950.
10. En el 70% de la muestra (D7), la cantidad de personas sin empleo fue 5.552.705.
11. Para el percentil 30 (30%) de la muestra, la cantidad de personas sin empleo fue de
4.399.758.
1. Se puede observar de la grafica que durante el periodo de Enero de 2004 a Marzo de 2017
el número de personas sin empleo en Colombia es variante, ya que durante diferentes
periodos tiene índices altos y bajos, pero para marzo de 2017 se evidencia una
disminución.
2. Media: El número de personas sin empleo en Colombia durante Enero de 2004 a Marzo
de 2017 (159 meses), en promedio fue de 4.945.286, lo que se considera un valor
significativo con respecto a la población de Colombia.
3. Mediana: El 50% de las personas en Colombia que estaban sin empleo estaban entre
2.282.953 y 4.939.903 y el otro 50% estaban sin empleo entre 4.966.378 y 7.874.204.
4. Moda: No se tiene datos repetidos o tendencia de personas sin empleo a través de los 159
meses, estamos frente a una variable que no tiene moda (Amodal).
5. El valor mínimo de personas sin empleo fue 2.282.953
6. El valor mínimo de personas sin empleo fue 7.874.204
7. El 25% de las personas sin empleo entre marzo de 2013, estuvieron entre el valor mínimo
2282953 y 4.221.136.
8. Entre el 25% y el 50% de la muestra, la cantidad de personas sin empleo estuvo entre
4.221.136 y 4.946.357.
11
9. Para el cuartil 2, se tiene como caso especial, primero porque su valor representa la mitad
de la serie de datos, igual que la mediana. Segundo, bajo esté valor se encuentra el 50%
de la serie de datos y tercero, sobre ese valor calculado se encuentra el otro 50% de la
serie de datos, para este caso las personas sin empleo en Colombia se encuentran
4.946.357.
10. Para el percentil 30 (30%) de la muestra, el número de personas sin empleo fue de
4.399.758.
11. Desviación Estándar: Teniendo en cuenta que esta medida de dispersión presenta un
valor considerable comparado con los datos, podemos concluir que el número de personas
sin empleo presenta una característica heterogénea, con un constante incremento.
12. Rango: Representa la diferencia entre el mes que más personas sin empleo tiene y el que
menos personas sin empleo tiene.
12
MEDIDAS DE DISPERSIÓN
VARIABLE DISCRETA
Definir las medidas de dispersión y las fórmulas utilizadas para datos no agrupados (variables
discretas).
VARIANZA: Se define como la media aritmética de los cuadrados de las desviaciones respecto
a la media aritmética.
RANGO 5.591.251
DESVIACIÓN 1.063.464,497
VARIANZA 1,13096E+12
RANGO 5.591.251
DESVIACIÓN 254.548.720
VARIANZA 64.795.050.709.251.000
La Varianza nos permite establecer la mayor o menor dispersión de los valores de la variable con
respecto a su Media Aritmética. Dado que los valores obtenidos a partir de la aplicación de las
fórmulas son muy altos, resulta complicado establecer conclusiones definitivas con respecto a la
dispersión. Por su parte, el cálculo de la Desviación Típica nos permite concluir que el valor de la
Media Aritmética es representativo de la muestra.
14
Estudiante 2: Zyanya Jesruzka Suarez
Variable discreta: Personas sin empleo
Desviación Estándar: Teniendo en cuenta que esta medida de dispersión presenta un valor
considerable comparado con los datos, podemos concluir que el número de personas sin empleo
presenta una característica heterogénea, con un constante incremento.
Rango: Representa la diferencia entre el mes que más personas sin empleo tiene y el que menos
personas sin empleo tiene.
La Varianza nos permite establecer la mayor o menor dispersión de los valores de la variable con
respecto a su Media Aritmética. Dado que los valores obtenidos a partir de la aplicación de las
fórmulas son muy altos, resulta complicado establecer conclusiones definitivas con respecto a la
dispersión.
Definir cada una de las medidas de tendencia central y las fórmulas utilizadas para datos
agrupados (variables continuas).
MEDIA: Se define como la suma de los valores de una cantidad dada de números dividido entre
la cantidad de números.
15
MEDIANA: Se define como el valor que divide una distribución de datos ordenados en dos
mitades, es decir, se encuentra en el centro de la distribución.
MODA: Se trata del valor más frecuente en un conjunto de datos. Se considera como el valor
más representativo o típico de una serie de valores. Es simbolizada como Mo. Si dos valores
tienen la misma frecuencia se dice que el conjunto es bimodal. Cuando más de dos valores
ocurren con la misma frecuencia y ésta es la más alta, todos los valores son modas, por lo que el
conjunto de datos recibe el nombre de multimodal o polimodal.
CUARTILES, DECILES Y PERCENTILES: Son medidas que se utilizan para determinar los
intervalos dentro de los cuales quedan proporcionalmente repartidos los términos de la
distribución.
Los cuartiles dividen la distribución en cuatro partes iguales, de manera que cada una tendrá el
25% de las observaciones. Los tres puntos de separación de los valores son los cuartiles. El
cuartil inferior (Q1) es aquel valor de la variable que representa el 25% de las observaciones y a
la vez, es superado por el 75% restante. El segundo cuartil (Q2) corresponderá a la mediana de la
distribución. El tercer cuartil (Q3) es aquel valor que representa el 75% y es superado por el 25%
restante de las observaciones.
16
Los deciles dividen el conjunto de datos en 10 partes iguales, de manera que se obtienen nueve
valores que dividen la frecuencia total en diez partes iguales. El primer decil (D1) es igual al
valor que supera al 10% de las observaciones y es superado por el 90% restante y así para cada
uno de los deciles.
17
El centil o percentil divide en cien partes iguales la distribución. El primer percentil (P1) es
igual al valor que supera al 1% de las observaciones y es superado por el 99% restante y así
sucesivamente.
n 159
Min 7,27
Max 17,00
Rango 9,73
K 8,313041247
A 1,22
Frecuencia
Número de Límite Límite Marca de Frecuencia
absoluta
clases inferior superior clase absoluta f
acumulada
1 7,27 8,49 7,9 11 11
2 8,49 9,70 9,1 2 13
3 9,70 10,92 10,3 67 80
4 10,92 12,14 11,5 45 125
5 12,14 13,35 12,7 22 147
6 13,35 14,57 14,00 8 155
7 14,57 15,79 15,2 3 158
8 15,79 17,00 16,4 1 159
TOTAL 159
18
Histograma:
DESEMPLEO EN COLOMBIA
80
70
60
50
MESES
40
30
20
10
0
7,27 - 8,49 - 9,70 - 10,92 - 12,14 - 13,3 5- 14,57 - 15,79 -
8,49 9,70 10,92 12,14 13,35 14,57 15,79 17,00
TASA
Polígono de frecuencias:
19
DESEMPLEO EN COLOMB IA
80
70
60
50
MESES
40
30
20
10
0
1 2 3 4 5 6 7 8
INTERVALOS
fk-1 2
fk+1 45
Ak 1,22
Lk 9,7
MODA 9,75
n/2 79,5
n 159
Fk-1 13
fk 67
Ak 1,22
Lk 9,7
MEDIANA 10,91
n 159
Min 76,7
Max 136,8
Rango 60,05
K 8,313041247
A 7,51
Histograma:
40
Indice de Precio desde Enero/2004-
35
Marzo/2017
30
25
Frecuencia
20
15
10
0
76,7-84,21 84,21 - 91,72 - 99,22 - 106,73 - 114,24 - 121,74 - 129,25 -
91,72 99,22 106,73 114,24 121,74 129,25 136,76
Indice del Precio
Polígono de frecuencias:
22
Indice del precio desde Enero/2004-
40
Marzo/2017
F 35
r
30
e
c 25
u
20
e
n 15
c
10
i
a 5
Indice de Precio
fk-1 28
fk+1 16
Ak 7,51
Lk 106,73
MODA 111,51
MEDIANA
n/2 79,5
n 159
Fk-1 85
fk 35
Ak 7,51
Lk 106,73
MEDIANA 105,55
23
K(n/100) K(n/100)
n n
Fk-1 Fk-1
fk fk
Ak A
Lk Lk
P50% P25%
Q1 89,14 Q3 126,71
K(n/4) 79,5
n 159
FK 24
fk 16
c 7,51
Lk 84,2
Q2 110,25
n 159
Min 7,27
Max 17,00
Rango 9,73
K 8,313041247
A 1,22
24
Frecuencia
Número de Límite Límite Marca de Frecuencia
absoluta
clases inferior superior clase absoluta f
acumulada
1 7,27 8,49 7,9 11 11
2 8,49 9,70 9,1 2 13
3 9,70 10,92 10,3 67 80
4 10,92 12,14 11,5 45 125
5 12,14 13,35 12,7 22 147
6 13,35 14,57 14,00 8 155
7 14,57 15,79 15,2 3 158
8 15,79 17,00 16,4 1 159
TOTAL 159
25
Histograma:
DESEMPLEO EN COLOMBIA
50
45
40
35
30
MESES
25
20
15
10
0
7,27 - 8,49 8,49 - 9,70 9,70 - 10,9210,92 - 12,1412,14 - 13,3513,3 5- 14,5714,57 - 15,7915,79 - 17,00
TASA
Polígono de frecuencias:
26
DESEMPLEO EN COLOMBIA
50
45
40
35
30
MESES
25
20
15
10
5
0
1 2 3 4 5 6 7 8
INTERVALOS
fk-1 30
fk+1 46
Ak 1,22
Lk 9,7
MODA 10,18
n/2 79,5
n 159
Fk-1 13
fk 67
Ak 1,22
Lk 9,7
MEDIANA 10,91
27
Ak 1,22 A 1,22
Lk 9,7 Lk 9,7
P50% 10,91 P25% 10,19
1. La mayor tasa de desempleo estuvo en el intervalo comprendido entre 9,7 y 10,92. La menor
tasa de desempleo se registró en el intervalo comprendido entre 15,79 y 17.
2. Durante los 159 meses del estudio sobre desempleo en Colombia, la tasa de desempleo en
promedio fue de 11,12 un valor relativamente alto, ya que dicha tasa osciló entre 7,27% y 17%.
Este valor comparado con las cifras de los países desarrollados es un mal indicador, ya que en
dichas naciones la tasa de desempleo, corresponde a un valor de una sola cifra.
3. El 50% de los valores de la variable tasa de desempleo oscilaron entre 7,27% y 10,91%. El
otro 50% de la muestra, varió entre 10,91% y 17%.
4. En los 159 meses del estudio, la tasa de desempleo más frecuente fue un valor aproximado al
9,75%.
28
5. Q1 y Q2 son iguales a P25 y P50. El cuartil Q3 nos permite concluir que un 75% de los valores
de la variable tasa de desempleo, oscilan entre 7,27 % y 11,98%. El 25% restante de la muestra,
tiene valores que van entre 11,98% y 17%.
6. D5 igual a Q2, P50 y a la Mediana. El decil D7 nos permite concluir que un 70% de los valores
de la variable tasa de desempleo, oscilan entre 7,27 % y 11,77%. El 30% restante de la muestra,
tiene valores que van entre 11,77% y 17%.
7. Un 25% de la muestra de la variable tasa de desempleo estuvo entre 7,27% y 10,19% y el 75%
restante entre 10,19% y 17%.
1. El índice de precio en Colombia que más se repite es el que oscila entre 106-114, durante
el periodo de enero de 2004 a marzo de 2017.
2. La media aritmética o promedio del índice de precio estuvo en promedio entre enero de
2004 a marzo 2017 en 104,34.
3. índice de precio que más se repitió entre Enero del año 2004 y Marzo de 2017, estuvo en
111,51.
4. El 50 % de los meses en los que estamos estudiando el índice de precio estuvo entre el
dato mínimo 78 y la mediana 105.55. El otro 50% de los meses en los que estamos
estudiando el índice de precio estuvo entre la mediana 105.55 y el dato máximo que fue
de 137.
1. Durante los 159 meses del estudio sobre desempleo en Colombia, la tasa de desempleo en
promedio fue de 11,12 un valor relativamente alto, ya que dicha tasa osciló entre 7,27% y 17%.
Este valor comparado con las cifras de los países desarrollados es un mal indicador, ya que en
dichas naciones la tasa de desempleo, corresponde a un valor de una sola cifra.
3. El 50% de los valores de la variable tasa de desempleo oscilaron entre 7,27% y 10,91%. El
otro 50% de la muestra, varió entre 10,91% y 17%.
4. En los 159 meses del estudio, la tasa de desempleo más frecuente fue un valor aproximado al
9,75%.
29
5. Q1 y Q2 son iguales a P25 y P50. El cuartil Q3 nos permite concluir que un 75% de los valores
de la variable tasa de desempleo, oscilan entre 7,27 % y 11,98%. El 25% restante de la muestra,
tiene valores que van entre 11,98% y 17%.
6. D5 igual a Q2, P50 y a la Mediana. El decil D7 nos permite concluir que un 70% de los valores
de la variable tasa de desempleo, oscilan entre 7,27 % y 11,77%. El 30% restante de la muestra,
tiene valores que van entre 11,77% y 17%.
7. Un 25% de la muestra de la variable tasa de desempleo estuvo entre 7,27% y 10,19% y el 75%
restante entre 10,19% y 17%.
30
MEDIDAS DE DISPERSIÓN
VARIABLE CONTINUA
Definir las medidas de dispersión y las fórmulas utilizadas para datos agrupados (variables
continuas).
VARIANZA: Se define como la media aritmética de los cuadrados de las desviaciones respecto
a la media aritmética.
31
Estudiante 1: Gloria Edilsa Romero Lozano
Variable continua: Tasa de Desempleo (%)
RANGO 9,73
DESVIACIÓN 1,535551051
VARIANZA 2,35791703
RANGO 60,05
DESVIACIÓN 15,87
VARIANZA 251,95
RANGO 9,73
DESVIACIÓN 1,535551051
VARIANZA 2,35791703
0,138048639
COEFICIENTE DE VARIACIÓN
La Varianza nos permite establecer la mayor o menor dispersión de los valores de la variable con
respecto a su Media Aritmética. El valor obtenido muestra que no se presenta una gran dispersión
y nos permite concluir que el valor obtenido para la Media es representativo. El cálculo de la
32
Desviación Estándar o Típica, ratifica las conclusiones que se obtuvieron a partir del cálculo de la
Varianza.
La Varianza nos permite establecer la mayor o menor dispersión de los valores de la variable con
respecto a su Media Aritmética. El valor obtenido es muy alto.
La Varianza nos permite establecer la mayor o menor dispersión de los valores de la variable con
respecto a su Media Aritmética. El valor obtenido muestra que no se presenta una gran dispersión
y nos permite concluir que el valor obtenido para la Media es representativo. El cálculo de la
Desviación Estándar o Típica, ratifica las conclusiones que se obtuvieron a partir del cálculo de la
Varianza.
33
CONCLUSIONES
2. Una medida de tendencia central es un valor representativo de una serie de datos, ordenados
según su magnitud. Es un valor típico, situado en el centro de la distribución de los valores que
toma la muestra de una variable cuantitativa.
3. Dado que la información que arrojan las medidas de tendencia central no siempre proporcionan
conclusiones contundentes frente al conjunto de datos, se requiere trabajar con las medidas de
dispersión, las cuales nos facilitan el análisis y la interpretación de los datos de una variable
cuantitativa.
4. El desarrollo de la actividad, le permitió a los integrantes del grupo colaborativo, asimilar los
conceptos básicos requeridos y generar una gran expectativa en cuanto a las temáticas que serán
estudiadas en las actividades posteriores.
34
REFERENCIAS BIBLIOGRÁFICAS
Cuarta y Quinta Webconferencia del Curso Estadística Descriptiva. Director nacional del curso,
profesor Milton Fernando Ortegón Pava.
Ortegón Pava, Milton Fernando. (2010). Módulo del Curso Estadística Descriptiva, Universidad
Nacional Abierta y a Distancia.
35