Está en la página 1de 20

UNIDAD 2: PASO 3 ANALISIS DE LA INFORMACION

PRESENTADO POR

PRESENTADO A:

Manuel Francisco Cifuentes

GRUPO: 204040_69

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA – UNAD

ESTADISTICA DESCRIPTIVA

ABRIL DE 2018

INTRODUCCIÓN
A través del siguiente trabajo se da a conocer una problemática planteada como lo es la evolución

del desempleo en Colombia junto con los aspectos sociales y políticos que intervienen. De acuerdo

a la base de datos suministrada se realiza un análisis de la información tomando como referente una

variable cuantitativa discreta y una continua, a las cuales se les aplicara las medidas de tendencia

central y de dispersión, de esta manera poder generar datos de estudio representados de forma

gráfica las cifras obtenidas de la muestra, por medio de histogramas y polígonos de frecuencia.

JUSTIFICACION
La información obtenida a través de recolección de datos del desempleo es analizar datos

complejos para lograr procesar la información e interpretar mediante la media, mediana, moda,

cuartiles, deciles y percentiles los datos, buscando aplicar el uso de diagramas estadísticos de

barras para variables cuantitativas discretas y continuas.


OBJETIVOS

1. Objetivo general

Interpretar una base de datos en identificar las medidas de tendencia central y de

dispersión.

2. Objetivos específicos

 Definir las medidas de tendencia central y dispersión para variables cuantitativas

discretas y continuas.

 Elaboración de tabla de frecuencias para datos agrupados e histograma y polígono de

frecuencias.

 Aplicar los conceptos básicos de estadística para el desarrollo de la actividad


Cálculo e interpretación de las medidas univariantes de tendencia central y de dispersión

para la variable discreta.

Para los cálculos obtenidos con la variable discreta “exportaciones millones” (Jesús rojas)

MEDIDAS DE TENDENCIA CENTRAL


   

Para el desarrollo de las medidas de tendencia central se ha escogido la variable cuantitativa "
exportaciones millones" de la base de datos desempleo en Colombia

   
MEDIDA RESULTADO  
Media 3.162.253  
Mediana 2.998.435  
Moda 1.399.027  
   
CUARTILES
  k dato valor  
q1 25% (25/100)*159 40 2.499.278
fórmula para hallar los
q2 50% (50/100)*159 80 2.998.435
cuartiles L=(K/100)*n
q3 75% (75/100)*159 120 4.571.396
   
DECILES
   
d5 50% (50/100)*159 80 2.998.435  
d7 70% (70/100)*159 112 4.571.396  
   
PERCENTILES
   
p30 30% (30/100)*159 48 2.499.278  
p50 50% (50/100)*159 80 2.998.435      
Para los cálculos obtenidos con la variable “índice de precios” (Viviana Castañeda)

 Medidas de dispersión

MEDIDAS DE DISPERCION
N 159
MX 136,76
MIN 76,70
RANGO 60,05
N° DE INTERVAL0S 8
AMPLITUD 7,50657
AMPLITUD FINAL 8

 Medidas de tendencia central

MEDIDAS DE TENDENCIA
CENTRAL
media 104,3
mediana 104,5
moda #N/A

 Medidas de variación

MEDIDAS DE VARIACION
rango 1,78292417
varianza 248,427365
desviación estándar 15,7615788
coeficiente de
evaluación 0,15086778

DATO MAYOR 136,8


DATO MENOR 76,7

 Cuartiles
cuartil posición valor
Q1 40 91,5
Q2 80 104,6
Q3 119 113,7

 Deciles

decil posición valor


D5 80 104,6
D7 111 112,9

 Percentiles

percentil posición valor


P25 40 91,5
P50 80 104,6

Para los cálculos obtenidos con la variable “Cantidad de empresas” (Katherinne Arévalo)

MEDIDAS DE DISPERSION
RANGO 1,4931826
VARIANZA 632315113,5
DESVIANCION ESTANDAR 25145,87667
COEFICIENTE DE
VARIACION 0

DATO MAYOR 308.278

DATO MENOR 206.457

MEDIDAS DE
TENDENCIA CENTRAL
MEDIA= 253.144
MEDIANA
= 253.452
MODA= #N/A

Cuartil k   posición valor


(25/100*159
Q1 25% ) 40 231.307
(50/100*159
Q2 50% ) 80 253.452
(75/100*159
Q3 75% ) 120 272.194

Decil     posición valor


D5 50% (50/100*159 40 231.307
(70/100*159
D7 70% ) 111 269.308

Percentil     posición valor


(30/100*159
P30 30% ) 48 234.202
(50/100*159
P50 50% ) 80 253.452
Cálculo e interpretación de las medidas univariantes de tendencia central y de dispersión

para la variable continúa.

TABLA DE FECUENCIA PARA DATOS AGRUPADOS


LIMITE LIMITE MARCA DE FREC FRE. ABS. FREC FREC. REL. FREC FREC. POR.
INFERIOR SUPERIOR CLASE ABSOLUTA ACUMULADA RELATIVA ACUMULADA PORCENTUAL ACUMULADA
    xi fi Fi hi Hi hi % Hi %
48,97 50,97 49,97 8,00 8,00 0,050314465 0,05 5,03 5,03
50,97 52,97 51,97 35,00 43,00 0,220125786 0,27 22,01 27,04
52,97 54,97 53,97 30,00 73,00 0,188679245 0,46 18,87 45,91
54,97 56,97 55,97 29,00 102,00 0,182389937 0,64 18,24 64,15
56,97 58,97 57,97 39,00 141,00 0,245283019 0,89 24,53 88,68
58,97 60,97 59,97 15,00 156,00 0,094339623 0,98 9,43 98,11
60,97 62,97 61,97 2,00 158,00 0,012578616 0,99 1,26 99,37
62,97 64,97 63,97 1,00 159,00 0,006289308 1,00 0,63 100,00
      159,00   1   100,00  
Para los cálculos obtenidos con la variable continua “personas con empleo” (Jesús rojas)

MEDIDA RESULTADO  
Media 55  
Mediana 56  
Moda #N/A  
   
CUARTILES
  k dato valor
q1 25% (25/100)*159 40 52,77
q2 50% (50/100)*159 80 55,55
q3 75% (75/100)*159 120 58,12
   
DECILES
   
d5 50% (50/100)*159 80 55,55
d7 70% (70/100)*159 112 57,48
   
PERCENTILES
   
p30 25% (25/100)*159 40 52,77
p50 50% (50/100)*159 80 55,55
Para los cálculos obtenidos con la variable “personas con empleo” (Viviana Castañeda)

TABLA DE FECUENCIA PARA DATOS AGRUPADOS


FRE. ABS. FREC. REL.
LIMITE LIMITE MARCA DE FREC ACUMULAD FREC ACUMULAD FREC FREC.POR.
INFERIOR SUPERIOR CLASE ABSOLUTA A RELATIVA A PORCENTUAL ACUMULADA
    xi fi Fi hi Hi hi % Hi %
76,7 84,7 80,7 25 25 0,1572327 0,16 15,72 15,72
84,7 92,7 88,7 22 47 0,13836478 0,30 13,84 29,56
92,7 100,7 96,7 14 61 0,08805031 0,38 8,81 38,36
100,7 108,7 104,7 34 95 0,21383648 0,60 21,38 59,75
108,7 116,7 112,7 29 124 0,18238994 0,78 18,24 77,99
116,7 124,7 120,7 18 142 0,11320755 0,89 11,32 89,31
124,7 132,7 128,7 9 151 0,05660377 0,95 94,97 94,97
132,7 140,7 136,7 8 159 0,05031447 1,00 5,03 100,00
                 

 Medidas de dispersión

MEDIDAS DE DISPERCION
N 159
MX 136,76
MIN 76,70
RANGO 60,05
N° DE INTERVAL0S 8
AMPLITUD 7,50657
AMPLITUD FINAL 8

 Medidas de tendencia central

MEDIDAS DE TENDENCIA
CENTRAL
media 104,3
mediana 104,5
moda #N/A
 Medidas de variación

MEDIDAS DE VARIACION
rango 1,78292417
varianza 248,427365
desviación estándar 15,7615788
coeficiente de
evaluación 0,15086778

DATO MAYOR 136,8


DATO MENOR 76,7

 Cuartiles

cuartil posición valor


Q1 40 91,5
Q2 80 104,6
Q3 119 113,7

 Deciles

decil posición valor


D5 80 104,6
D7 111 112,9

 Percentiles

percentil posición valor


P25 40 91,5
P50 80 104,6
Para los cálculos obtenidos con la variable “Valor Dólar” (Katherinne Arévalo)

Marca Frecuencia
de Absoluta
Número de Líimite Límite clases Frecuencia Acumulada F.Relativa F Porcentual
clases inferior superior (X) Absoluta(f) (F) F.Relativa (h) Acumulada(H) F.Porcentual Acumulada
1 1.713 1.930 1.822 65 65 0,408805031 0,40880503 40,88050314 40,88050314

21
2 1.930 2.147 2.039 86 0,132075472 0,5408805 13,20754717 54,08805031

3 2.147 2.364 2.256 28 114 0,176100629 0,71698113 17,61006289 71,69811321

4 2.364 2.580 2.472 12 126 0,075471698 0,79245283 7,547169811 79,24528302

5 2.580 2.797 2.689 14 140 0,088050314 0,88050314 8,805031447 88,05031447

6 2.797 3.014 2.906 6 146 0,037735849 0,91823899 3,773584906 91,82389937

7 3.014 3.230 3.122 4 150 0,025157233 0,94339623 2,51572327 94,33962264

8 3.230 3.447 3.339 3 153 0,018867925 0,96226415 1,886792453 96,22641509

  3.447 3.664 3.556 6 159 0,037735849 1 3,773584906 100


159 1 100

MEDIDAS DE
MEDIDAS DE DISPERSION TENDENCIA CENTRAL
N=NUMERO DE
DATOS 159 MEDIA= 2.235
MIN=DATO MINIMO 1.713 MEDIANA= 2.066
MAX=DATO MAXIMO 3.664 MODA= #N/A
RANGO 1.950
K=NUMERO DE
INTERVALOS 8
A=AMPLITUD 1.942
AMPLITUD FINAL 2

MEDIDAS DE DISPERSION
RANGO 2,138937536
VARIANZA 219374,1607
DESVIANCION ESTANDAR 468,3739539
COEFICIENTE DE
VARIACION 0

DATO MAYOR 3664


DATO MENOR 1713

Cuartil k   posición valor


(25/100*159
Q1 25% ) 40 1.885
(50/100*159
Q2 50% ) 80 2.066
(75/100*159
Q3 75% ) 120 2.514

Decil     posición valor


D5 50% (50/100*159 40 2.183
(70/100*159
D7 70% ) 111 2.339

Percentil     posición valor


(25/100*159
P25 25% ) 40 1.885
(50/100*159
P50 50% ) 80 2.066
ANÁLISIS E INTERPRETACIÓN DE LA INFORMACIÓN OBTENIDA.

Para los cálculos obtenidos con la variable “personas con empleo” (Viviana Castañeda)

Media: Teniendo en cuenta el estudio realizado por el DANE se inicia con un valor de

(20.439.222) y se termina con un valor de (30.489.716) sobre la variable personas con empleo,

indicando que el número de personas promedio con empleo es de 25.286.286

Mediana: Revisando los datos ordenados de esta variable, vemos que en la posición central está

el valor (25286285,91) por eso no se refleja un aumento significativo en la empleabilidad del

periodo

Varianza: Para demostrar la variabilidad de personas con empleo obtenemos una distribución de

5.99061E+12

Desviación estándar: Para la  medida del grado de dispersión de los datos con respecto al valor

promedio de la variable personas con empleo  es de 2447572,268

Cuartiles: Estos valores dividen la información en 3 partes, refleja un panorama de

incertidumbre respecto al desempleo en Colombia. También se observa que coincide este valor

con la mediana de la misma variable.

Deciles 5 y 7: el decil 5, corresponde exactamente a la mediana y al cuartil 2 de la variable

(25.173.301). Con esta información, podemos deducir que este porcentaje no varía
Para los cálculos obtenidos con la variable “exportaciones mil” (Angélica castro)

Media: Teniendo en cuenta el estudio realizado por el DANE sobre la variable exportaciones mil,

indica que el número de exportaciones promedio es de 3.162.253

Varianza: Para demostrar la variabilidad de exportaciones mil obtenemos una distribución de

1.498.028.435

Desviación estándar: Para la medida del grado de dispersión de los datos con respecto al valor

Promedio de la variable exportaciones mil es de 1.223.940


Para los cálculos obtenidos con la variable “cantidad de empresas” (Katherinne Arévalo)

Media: la cantidad de empresas con las cuales se inicia (206.457) para el mes de Enero del 2007
y con (308.278) terminando en Junio del 2016, podemos decir que el valor obtenido como media,
es de (253,144)
Mediana: podemos ver que en la posición central está el valor (253,452) aunque se hubiera
esperado un aumento de empleo para las personas

Moda: ningún dato se repitió, para este caso en particular, se dice que la moda es amodal.

Cuartiles:

Q1: Corresponde al 25% de los datos por lo tanto su posición es 40 con un valor de 231.307.

Q2: Podemos observar que es el 50% de los datos con una posición de 80 y su valor corresponde
a 253.452.

Q3: con un 75 % de los datos su posición es de 120 con un valor de 272.194.

Deciles 5 y 7:

D5: Este decil corresponde al 50% de los datos con una posición de 40 lo cual el valor es
de231.307.

D7: Con l 70% de los datos y una posición de 111 el valor correspondiente es de 269.308.
Percentiles 30 y 50:

P30: En cuanto al percentil del 30% de los datos cuenta con una posición de 48 y el valor es de
234.202.

P50: en este percentil se puede observar que el 50 % tiene un valor de 253.452 en la posición 80.

Para los cálculos obtenidos con la variable “personas con empleo” (Jesús rojas)

Media: Teniendo en cuenta, el estudio realizado por el DANE sobre el desempleo en Colombia y

los 159 datos recolectados para la variable “personas con empleo” el promedio aproximado del

mismo se sitúa en los 3.162.253

Mediana: El 50% de los 159 datos recolectados de personas con empleo están entre los   siendo

esta última la mediana aproximada y el otro 50% se encuentra  entre el 2.998.435

Varianza: Para la variabilidad de personas con empleo se obtiene una distribución de

5.991E+12

Cuartiles:

Q1: el primer cuartil el cual representa al cuarto de los valores de la variable el cual se ubica en el
dato 40 con valor de 2.499.278 millones de exportaciones que corresponde al 2007

Q2: el segundo cuartil representa la mitad de los valores de la variable el cual lo ubicamos en el
dato 80 con valor de 2998435 millones de exportaciones que corresponde al 2010

Q3: el tercer cuartil representa las tres cuartas partes del valor de los datos de la variable ubicada
en el dato 120 con un valor de 4571396 millones de exportaciones y corresponde al 2013

Deciles 5 y 7:

D5: En el decir 5 podemos decir que el 50 % de las exportaciones están por debajo de los
2.998.435
D7: Para el decil 7 se determina que el 70% de las exportaciones durante estos años esta por
debajo de los 4.571.396

Percentiles 30 y 50:

P30: Para el percentil 30 se define que el 30% de las exportaciones están por debajo de los
2.499.278 millones y el 70% por encima de este

P50: Para el percentil 50 se define que el 50% de las exportaciones está por debajo de los
2.998.435 millones y el 50 % por encima de este.

CONCLUSIONES

 En el desarrollo del presente trabajo se estudiaron temas fundamentales como lo son el

desempleo en Colombia y el manejo de los diagramas estadísticos y caracterización de

variables, lo cual es fundamental a la hora de interpretar las bases de datos de encuestas.

 Con la ayuda de gráficos se logró la representación de la información estudiada en la base

de datos, edemas de la implementación de las variables cuantitativas.

 De aquí la gran importancia de la investigación que cada estudiante realiza para el buen

desarrollo de los ejercicios planteados ya que son temas que vamos a tener que practicar e

utilizar durante todas las temáticas que se verán en dicho curso.


REFERENCIAS BIBLIOGRÁFICAS

 García, J.E (2005).Análisis de Datos Unidimensionales.et al. Madrid: Paraninfo. Página

26 -51 Recuperado de:http://go.galegroup.com/ps/i.do?id=GALE

%7CCX4052300007&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=03f8699ec7ccf10e8745

c0ceb7b85bf1

 Montero, J. M. (2007). Características de Una Distribución de Frecuencias. Statistical

Descriptive.   Cengage Learning Paraninfo, S.A. Paginas 18-57. Recuperado

de:http://go.galegroup.com/ps/i.do?id=GALE

%7CCX4052100008&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=99feba20c3312cbea60

961107ffc27a0
 García, M.S.(2004).Introducción a la estadística económica y empresarial. Paraninfo.

Páginas  74 – 98. Recuperado de:http://go.galegroup.com/ps/i.do?id=GALE

%7CCX4052900012&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=4a9b0a469e755a43272

07c94b4c0d549

También podría gustarte