Está en la página 1de 18

ESTADISTICA DESCRIPTIVA

APORTE COLABORATIVO

Estudiantes
ANDRES MAURICIO RENDON OCAMPO
CODIGO: 1116240054

Grupo del curso


100105_177

Presentado a
FRANCISCO CABRERA DIAZ

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA - UNAD


ESCUELA DE CIENCIAS BÁSICAS TECNOLOGÍA E INGENIERÍA
MAYO 26 DE 2018
PALMIRA

1
INTRODUCCIÓN
Con el presente trabajo se pretende describir la problemática planteada durante
todo el periodo académico, el cual consistió en organizar y analizar la información
de la base de datos de desempleo en Colombia de los años 2004 a 2017.
Posterior a esto se describe la información de acuerdo a los resultados obtenidos
de los distintos métodos como tablas de contingencias, tablas de frecuencias,
histogramas, encontrando valores como media, mediana, rango, cuartiles,
deciles, percentiles y por último utilizando los métodos de regresión y correlación
lineal, de manera que se encontrara los modelos matemáticos según las
variables seleccionadas.
Con el desarrollo de este trabajo se finaliza la fase 5 del curso de estadística
descriptiva de la Universidad Nacional Abierta y a Distancia.
En el trabajo se consolida el trabajo individual de los integrantes del curso que
participaron en el foro dejando sus aportes, análisis e interpretación de la
información del informe estadístico.

2
JUSTIFICACIÓN
El presente trabajo contribuye al crecimiento de conocimientos para ser aplicados
en el campo profesional de cada uno de los integrantes, puesto que se recopila
los conceptos adquiridos durante el periodo, detallando y relacionando las
variables con las que se trabajó. De manera que se exponen diferentes tipos de
variable para estudio.

3
OBJETIVOS
Realizar un informe estadístico detallado que permita mostrar las temáticas
desarrolladas y aplicadas en el curso de estadística descriptiva. (Diana Ávila,
2018).

Aplicar los conceptos de frecuencia, marca de clase y distribución de frecuencias


a un conjunto de datos estadísticos con la base de datos de desempleo en
Colombia. (Diana Ávila, 2018)

4
DE acuerdo a la información solicitada del informo anexo pantallazo de los laboratorios
presentados.
Tabla de frecuencias para datos agrupados, seleccionando como Variable Discreta a personas sin empleo

n 159
Intervalos f h F H
Min 2282953
Max 7874204 2282953 2904203 6 3,773584906 6 3,77358491 2593578
Rango 5591251 2904203 3525453 8 5,031446541 14 8,80503145 3214828
K 8,313041247 9 3525453 4146703 24 15,09433962 38 23,8993711 3836078
A 621250,11 621250 4146703 4767953 33 20,75471698 71 44,6540881 4457328
4767953 5389203 33 20,75471698 104 65,408805 5078578
5389203 6010453 32 20,12578616 136 85,5345912 5699828
6010453 6631703 14 8,805031447 150 94,3396226 6321078
6631703 7252953 6 3,773584906 156 98,1132075 6942328
7252953 7874203 3 1,886792453 159 100 7563578
TOTAL 159

Nota: La frecuencia absoluta (f) se calcula realizando conteo en la aparición de datos en cada intérvalo

HISTOGRAMA Y POLÍGONO DE FRECUENCIAS PARA VARIABLE DISCRETA - PERSONAS SIN EMPLEO

Intervalos f Intervalos f

2282953 2904203 6 2282953 a 2904203 6


2904203 3525453 8 2904204 a 3525453 8
3525453 4146703 24 3525454 a 4146703 24
4146703 4767953 33 4146704 a 4146703 33
4767953 5389203 33 4767954 a 5389203 33
5389203 6010453 32 5389204 a 6010453 32
6010453 6631703 14 6010454 a 6631703 14
6631703 7252953 6 6631704 a 7252953 6
7252953 7874203 3 7252954 a 7874203 3
total 159

5
Personas sin empleo del año 2004 al 2017
35
30
25
Cantidad

20
15
10
5
0
2282953 a 2904204 a 3525454 a 4146704 a 4767954 a 5389204 a 6010454 a 6631704 a 7252954 a
2904203 3525453 4146703 4146703 5389203 6010453 6631703 7252953 7874203

Intervalos
Series1 Series2

Frecuencia
Número de Límite Marca de Frecuencia
n 159 Límite superior absoluta
clases inferior clase (X) absoluta (f)
Min 42131988 acumulada f *X
Max 49064312 1 2282953 2904203 2593578 6 6 15561468
Rango 6932324 2 2904203 3525453 3214828 8 14 25718624
K 8,31304125 9 3 3525453 4146703 3836078 24 38 92065872
A 770258,22 4 4146703 4767953 4457328 33 71 147091824
5 4767953 5389203 5078578 33 104 167593074
6 5389203 6010453 5699828 32 136 182394496
7 6010453 6631703 6321078 14 150 88495092
8 6631703 7252953 6942328 6 156 41653968
9 7252953 7874203 7563578 3 159 22690734
Total 159
783265152
MEDIA 4926195,92

MARCA DE CLASE= SUMAR LOS EXTREMOS DE LOS INTERVALOS Y DIVIDIR ENTRE 2

6
MEDIDAS DE TENDENCIA CENTRAL - ENCONTRANDO LA MEDIANA

Frecuencia Frecuencia absoluta


n 159 Número de clases Límite inferior Límite superior Marca de clase
absoluta f acumulada
Min 42131988
Max 49064312 1 2282953 2904203 2593578 6 6
Rango 6932324 2 2904203 3525453 3214828 8 14
K 8,31304125 9 3 3525453 4146703 3836078 24 38
A 770258,22 4 4146703 4767953 4457328 33 71
5 4767953 5389203 5078578 33 104
6 5389203 6010453 5699828 32 136
7 6010453 6631703 6321078 14 150
8 6631703 7252953 6942328 6 156
9 7252953 7874203 7563578 3 159
Total 159

n/2 79,5
n 159
Fk-1 71
fk 33
Ak 770258,22
Lk 4767953

MEDIANA 4966352,85

MEDIANA PARA DATOS AGRUPADOS

n es el tamaño de la muestra o la suma de todas las frecuencias.


Fk-1 es la frecuencia absoluta acumulada de la clase anterior de la clase de la mediana.
fk es la frecuencia absoluta de la clase de la mediana.
Ak es la amplitud de la clase de la mediana.
Lk es el límite real inferior de la clase de la mediana.

7
MEDIDAS DE TENDENCIA CENTRAL - ENCONTRANDO LA MODA

Frecuencia
Número de Límite Límite Marca de Frecuencia
absoluta
n 159 clases inferior superior clase absoluta f
acumulada
Min 42131988
Max 49064312 1 2282953 2904203 2593578 6 6
Rango 6932324 2 2904203 3525453 3214828 8 14
K 8,31304125 9 3 3525453 4146703 3836078 24 38
A 770258,22 4 4146703 4767953 4457328 33 71
5 4767953 5389203 5078578 33 104
6 5389203 6010453 5699828 32 136
7 6010453 6631703 6321078 14 150
8 6631703 7252953 6942328 6 156
9 7252953 7874203 7563578 3 159
Total 159

fk-1 24
fk+1 33
Ak 621250,111
Lk 4146703

MODA 4408281,99

MODA PARA DATOS AGRUPADOS

Donde:
fk-1 es la frecuencia absoluta de la clase anterior en donde se encuentra el dato
más frecuente.
fk+1 es la frecuencia absoluta de la clase posterior en donde se encuentra el dato
más frecuente.
Ak es la amplitud de la clase en donde se encuentra el dato más frecuente.
Lk es el límite real inferior de la clase en donde se encuentra el dato más frecuente.

8
MEDIDAS DE TENDENCIA CENTRAL - ENCONTRANDO LOS CUARTILES

Frecuencia
Número de Límite Límite Marca de Frecuencia absoluta
n 159 clases inferior superior clase absoluta f acumulada
Min 42131988 F
Max 49064312 1 2282953 2904203 2593578 6 6
Rango 6932324 2 2904203 3525453 3214828 8 14
K 8,31304125 9 3 3525453 4146703 3836078 24 38
A 770258,22 4 4146703 4767953 4457328 33 71
5 4767953 5389203 5078578 33 104
n/2 79,5 6 5389203 6010453 5699828 32 136
n/4 39,75 7 6010453 6631703 6321078 14 150
3*n/4 119,25 8 6631703 7252953 6942328 6 156
Q1 9 7252953 7874203 7563578 3 159
Q2 Total 159
Q3
K(n/100) 79,5 K(n/100) 39,75
n 159 n 159
Fk-1 71 Fk-1 38
PRIMER CUARTIL = 4146703,08 fk 33 fk 33
SEGUNDO CUARTIL = 4927971,97 Ak 770258,22 A 770258,22
TERCER CUARTIL = 5389203,74 Lk 4767953 Lk 4146703

Q2= PERCENTIL 50 Q2 4966352,85 Q1 4187550,03 Q1= PERCENTIL 30

K(n/100) 119,25
n 159
Fk-1 104
fk 32
Ak 1,56
Lk 5389203

Q3 5389203,74

9
Lk = Límite real inferior de la clase del percentil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del percentil k.
fk = Frecuencia de la clase del percentil k
c = Longitud del intervalo de la clase del percentil k

10
MEDIDAS DE TENDENCIA CENTRAL - ENCONTRANDO DECILES

n 159 Frecuencia
Número de Límite Límite Marca de Frecuencia absoluta
clases inferior superior clase absoluta f acumulada
Min 42131988,00 F
Max 49064312,00 1 2282953 2904203 2593578 6 6
Rango 6932324 2 2904203 3525453 3214828 8 14
K 8,31304125 9 3 3525453 4146703 3836078 24 38
A 770258,22 4 4146703 4767953 4457328 33 71
5 4767953 5389203 5078578 33 104
6 5389203 6010453 5699828 32 136
7 6010453 6631703 6321078 14 150
8 6631703 7252953 6942328 6 156
9 7252953 7874203 7563578 3 159
Total 159
QUINTO DECIL = 4927971,97
SEPTIMO DECIL = 5526631,28 n/2 79,5 K(n/100) 111,3
n 159 n 159
Fk-1 71 Fk-1 38
fk 33 fk 33
Ak 770258,22 A 770258,22
Lk 4767953 Lk 4146703

DECIL 5 = PERCENTIL 30 D5 4966352,85 D7 5857609,90 DECIL 7= percentil 50

11
Lk = Límite real inferior de la clase del percentil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del percentil k.
fk = Frecuencia de la clase del percentil k
c = Longitud del intervalo de la clase del percentil k

12
MEDIDAS DE TENDENCIA CENTRAL - ENCONTRANDO PERCENTILES

Frecuencia
Número de Límite Límite Marca de Frecuencia absoluta
n 159 clases inferior superior clase absoluta f acumulada
Min 7874204,00 F
Max 49064312,00 1 2282953 2904203 2593578 6 6
Rango 41190108,00 2 2904203 3525453 3214828 8 14
K 8,31304125 9 3 3525453 4146703 3836078 24 38
A 4576678,67 4 4146703 4767953 4457328 33 71
5 4767953 5389203 5078578 33 104
6 5389203 6010453 5699828 32 136
7 6010453 6631703 6321078 14 150
8 6631703 7252953 6942328 6 156
9 7252953 7874203 7563578 3 159
Total 159

PERCENTIL 50% = 4767953,40 K(n/100) 79,5 K(n/100) 47,7


PERCENTIL 30% = 4146703,46 n 159 n 159
Fk-1 71 Fk-1 38
fk 33 fk 33
Ak 1,56 A 1,56
Lk 4767953 Lk 4146703

P50% 4767953,40 P30% 4146703,46

Lk = Límite real inferior de la clase del percentil k


n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del percentil k.
fk = Frecuencia de la clase del percentil k
c = Longitud del intervalo de la clase del percentil k

13
Realizar el diagrama de dispersión de dichas variables y determinar el tipo
De asociación entre las variables.

Tasa de empleo (%)


80.00
y = 1E-06x + 26.943
60.00 R² = 0.8576
Axis Title

40.00
20.00
0.00
- 5,000,000 10,000,000 15,000,000 20,000,000 25,000,000 30,000,000 35,000,000
Axis Title

Grafico tasa desempleo.

- Encuentre el modelo matemático que permite predecir el efecto de una variable


sobre la otra. Es confiable?
El modelo matemático que permite predecir el efecto de una variable sobre la otra es
Y=a+bX
y = 1E-06x + 26,943 R² = 0,8576
Se puede asegurar que la ecuación de la recta es confiable porque el R² está cercano a 1
y tiene un grado de alto de confiabilidad.
- Determine el porcentaje de explicación del modelo y el grado de relación de las
dos variables.
El R² afirma además que el modelo explica el 85,7% de la información y el valor de r
coeficiente de correlación lineal es excelente porque el 0,8576 está muy cercano al
extremo 1 positivo que es la correlación perfecta positiva.

Soy andres Mauricio Rendon Ocampo estudiante de Ingenieria de Sistemas. Los datos
estadísticos del desempleo en Colombia desde el año 2004 a marzo de 2017, se
visualizan en el grafico 1
Como variable se toma la tasa de desempleo en Colombia en la cual a través de
los datos presentados se puede identificar una media de 25295905,7 de todos
los datos presentados en la encuesta de desempleo en Colombia entre el año
2014 a 2017 y dentro de los intervalos se identifica que el más frecuencia de 159
meses entre los años 2004 a 2017.

14
15
16
CONCLUSIONES

 Por medio de las distintas gráficas se mostró información que se obtuvo


aplicando las fórmulas de frecuencias, facilitando la interpretación de la
solución a los problemas planteados.

 Se obtuvo información que permitió analizar y comparar variables


cualitativas a través de tablas de contingencia, la cual facilita
interpretación en los datos y se visualiza de una mejor manera para hacer
conclusiones respecto a los resultados obtenidos.

 Entre menor se hace la dispersión es más significativo el valor medio de


nuestros elementos, ya que garantiza una mayor exactitud.

 Con el resultado del cálculo del rango, se obtiene una idea de la


dispersión de los datos: cuanto mayor es el rango, más dispersos están
los datos de un conjunto

 Se puede apoyar con el cálculo de la desviación típica para interpretar de


mejor manera la varianza entre los elementos.

 Entre menor se hace la dispersión es más significativo el valor medio de


nuestros elementos, ya que garantiza una mayor exactitud.

 Con el resultado del cálculo del rango, se obtiene una idea de la


dispersión de los datos: cuanto mayor es el rango, más dispersos están
los datos de un conjunto

 Se puede apoyar con el cálculo de la desviación típica para interpretar


de mejor manera la varianza entre los elementos.

 De acuerdo al grado de correlación lineal mientras el valor sea más


cercano a uno se puede indicar que la correlación tiende a ser perfecta.

17
Recomendaciones

18

También podría gustarte