Está en la página 1de 23

PASO 5 PRESENTACION DE RESULTADOS

ESTADÍSTICA DESCRIPTIVA

PRESENTADO POR :

PETERSON DE LA ROSA

DIEGO AMARIS

GRUPO 100105_328

PRESENTADO A :

EDGAR GABRIEL DIAZ

(TUTOR)

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA

DICIEMBRE DE 2019
INTRODUCCIÓN

Las mediadas de tendencia central como su nombre lo indica, son medidas

estadísticas que se utilizan para describir, resumir y localizar datos recolectados mediante

encuestas o formularios en campo. Es así ubican e identifican el resultado de la muestra y

busca el punto más cercano alrededor del cual se centran todos los datos consolidados; da a

conocer la importancia de estas en la interpretación de datos, el dominar y forzar las

habilidades en el manejo de Excel con el fin de desenvolvernos en el área en el cual la

estadística descriptiva hace parte fundamental en el ámbito profesional.


JUSTIFICACION

En el siguiente trabajo se evidencia el resultado de cada uno de los estudiantes en

dominar, conocer e interpretar datos obtenidos de la base planteada, partiendo de los

fundamentos en los que se centra la estadística como disciplina aplicada en todos los

campos de la actividad humana. Por ende en el mundo de hoy es considerado de gran

importancia por que suministra los mejores instrumentos de investigación, no solo para

observar y recompilar toda una gama de información incubada dentro de un mismo entorno

o fuera de ello, sino también en el control de ciertas actividades desarrolladas como son :

producción, ventas, organización, proyecciones o estimaciones a corto, mediano y largo

plazo, procesos encaminados a facilitar la conceptualización y toma de decisiones de unos

datos plasmados en tablas y gráficos.


OBJETIVOS

 Elaborar gráficos de representación de la distribución de frecuencias de los datos

estadísticos.

 Aplicar adecuadamente las medidas univariantes

 Calcular acertadamente las medidas de tendencia central

 Interpretar los resultados obtenidos en el análisis de los datos aplacando las medidas

univariantes

 Responder a las preguntas de alternativa de solución

 Elaborar informe descriptivo de la problemática planteada.


Actividad 2 procesamiento de variables

Descripción de la actividad Colaborativa

Caracterizar la variable cualitativa presentando: tabla de frecuencias, diagrama de barras o


circular, moda, tabla de contingencias y conclusiones.

Tabla de frecuencias variable cualitativa 1

OPTIMISMO DE POBLACIÓN

DATOS F.AC FABS.ACU F.REL F.R.ACUM %F.REL %F.R.ACU


UMU MULADA TIVA ULADA TIVA MULADA
LADA
Buena 48 48 0,96 0,96 96 96
Muy Baja 2 50 0,04 1 4 100
50 1,00

Tabla de frecuencias variable cualitativa 2

FACILIDAD DE CRÉDITO

DATO F.ACUMU FABS.ACU F.RELT F.R.ACUM %F.RE %F.R.ACU


S LADA MULADA IVA ULADA LTIVA MULADA
Media 12 12 0,24 0,24 24 24
Alta 24 36 0,48 0,72 72 72
Baja 14 50 0,28 1 28 100
50 1
VARIABLES CUALITATIVAS SELECCIONADAS
Optimismo
Año
Población Facilidad Crédito Bancos
Variable Cualitativa 1 (V1) variable cualitativa 2 (V2)
2.005 Buena Media
2.005 Muy Baja Media
2.005 Buena Media
2.005 Buena Media
2.005 Buena Media
2.005 Buena Media
2.005 Buena Media
2.005 Buena Media
2.005 Buena Media
2.005 Buena Media
2.005 Buena Media
2.005 Buena Media
2.006 Buena Alta
2.006 Buena Alta
2.006 Buena Alta
2.006 Buena Alta
2.006 Buena Alta
2.006 Buena Alta
2.006 Buena Alta
2.006 Buena Alta
2.006 Buena Alta
2.006 Buena Alta
2.006 Buena Alta
2.006 Buena Alta
2.007 Buena Alta
2.007 Buena Alta
2.007 Buena Alta
2.007 Buena Alta
2.007 Buena Alta
2.007 Buena Alta
2.007 Buena Alta
2.007 Buena Alta
2.007 Buena Alta

2.007 Buena Alta


2.007 Buena Alta

2.007 Buena Alta


2.008 Buena Baja
2.008 Buena Baja
2.008 Buena Baja
2.008 Buena Baja
2.008 Buena Baja
2.008 Buena Baja
2.008 Buena Baja
2.008 Buena Baja
2.008 Buena Baja
2.008 Buena Baja
2.008 Buena Baja
2.008 Buena Baja
2.009 Muy Baja Baja
2.009 Buena Baja
50

Diagrama de barras V1
Diagrama De Barras V2

MODA
Moda = buena

TABLA DE CONTINGENCIA

Variables Buena Muy Baja Media Alta Baja


Optimismo de
población 48 2 0 0 0
Facilidad de
crédito 0 0 12 24 14

Total general 48 2 12 24 14
100
Conclusiones del procesamiento de variables

 La información tomada para el desarrollo de la actividad corresponde a la base de


datos del DANE,
 En cuanto al desempleo en Colombia y su evolución. De esta base de datos se toma
y ajusta una muestra de 50 datos para realizar el trabajo que se pide en la actividad

 Las variables cualitativas que se seleccionaron para el análisis son: Optimismo de


población y Facilidad de crédito.

Variable cuantitativa Discreta y Continua

Descripción de la actividad colaborativa

Para la variable discreta elegida, se deberán calcular las medidas univariantes de

tendencia central: Media, Mediana, Moda. Todos los cuartiles. Así mismo deberán calcular

las medidas invariantes de dispersión: Rango, Varianza, Desviación típica y Coeficiente de

variación.

Para la variable continúa elegida, se deberán calcular las medidas univariantes de tendencia

central: Media, Mediana, Moda. Todos los cuartiles Así mismo deberán calcular las

medidas univariantes de dispersión: Rango, Varianza, Desviación típica y Coeficiente de

variación.

VARIABLE DISCRETA, MEDIDAS DE TENDENCIA CENTRAL

Numero datos 50 DATOS


Min 9,42
Max 14,25
Rango 4,83 resta entre mayor y el menor
K = numero de intervalos 6,64 7
A= Amplitud 0,69 rango/ numero intervalos
Tasa de desempleo
(%)

13,22
14,23
12,95
12,06
12,31
11,52
12,00
11,75
11,17
9,96
10,21
10,33
13,41
13,00
11,34

12,01
11,88
10,61
12,39
12,79
12,89
11,35
10,94
11,78
13,90
12,83
11,93
10,90
11,53
11,16
11,16
10,73
10,84
10,05
9,42
9,89
13,08
11,99
11,22
11,13
10,84
11,17
12,06
11,22
10,95
10,12
10,80
10,61
14,25
12,49

MEDIA 11,65
MEDIANA 10,01
MODA #N/A

Q1 10,01200557
Q2 10,79655622
Q3 13,21560686

MEDIDAS UNIVARIANTES DE DISPERSION

RANGO 4,83
VARIANZA 1,313770697
DESVIACION TÍPICA 1,146198367
COEFICIENTE DE VARIACIÓN 0,098409509

VARAIBLE CONTINUA, MEDIAS DE TENDENCIA CENTRAL

Producción por personaión


por persona
660.587
666.942
673.284
679.613
685.929
692.232
698.522
704.799
711.064
717.316
723.555
729.781
735.995

742.196
748.384
754.560
760.724
766.875
773.013
779.139
785.253
791.355
797.444
803.521
809.586
815.638
821.679
827.707
833.724
839.728
845.720
851.701
857.669
863.626
869.571
875.504
881.425
887.334
893.232
899.118
904.993
910.856
916.707
922.547
928.375
934.192
939.997
945.792
951.574
957.346

Medidas de tendencia central

Numero datos 50 DATOS


Min 660.587
Max 957.346
Rango 296.759 resta entre mayor y el menor
K = numero de intervalos 6,64 7
A= Amplitud 42.394 rango/ número intervalos

Medidas de tendencia
central

Medi Mediana El inmediato mayor en


= a= 811.510 = n/2 25 la Frecuencia
absoluta acumulada
serà la mediana
Mediana
= 28

Ahora aplicando la fórmula: = 6.056

Me = 811.995

Moda = 8

Por
fórmula:

∆1 = fmod -fmod-1 1
∆2 = fmod -fmod+1 8

Moda = 919.662

CUARTILES
Cuartil 1 Cuartil 2
K(n/4) 12,5 Posiciòn K(50/4) 25 Posiciòn
n 50 n 50
Fk-1 7 Fk-1 21
fk 14 fk 28
A 42.394 A 42.394
k 1 k 2
Li 702.981 Li 787769,43
Q1 = 292.826 Q2 = 118.595

Cuartil 3 Cuartil 4
K(50/4) 37,5 Posiciòn K(50/4) 50 Posiciòn
n 50 n 50
Fk-1 35 Fk-1 42
fk 42 fk 50
A 42.394 A 42.394
k 3 k 4
Li 872.558 Li 914951,86
Q3 = 54.461 Q4 = 153.175
MEDIDAS UNIVARIANTES DE DISPERSIÓN

Varianza:
= 694.762.331.026.068.000.000

Desviaciòn tìpica
= 26.358.344.618

Coefic.de Variaciòn: 3.248.061 %

Regresión y correlación entre variables cuantitativas

Identificar dos variables cuantitativas de la situación estudiada que puedan

estar relacionadas y:

a. Realizar el diagrama de dispersión de dichas variables y determinar el

tipo de asociación entre las variables.

b. Encontrar el modelo matemático que permite predecir el efecto de una

variable sobre la otra. ¿Es confiable?

c. Determinar el grado de relación de las dos variables.

d. Relacionar la información obtenida con el problema.


Tasa de desempleo (%)
Año
(X) Tasa de empleo (%) (Y)
2.005 13,22 52,39
2.005 14,23 51,69
2.005 12,95 52,20
2.005 12,06 52,84
2.005 12,31 52,85
2.005 11,52 52,52
2.005 12,00 54,05
2.005 11,75 53,06
2.005 11,17 53,68
2.005 9,96 55,42
2.005 10,21 54,69
2.005 10,33 55,16
2.006 13,41 52,05
2.006 13,00 52,56
2.006 11,34 53,96
2.006 12,01 52,06
2.006 11,88 52,67
2.006 10,61 54,23
2.006 12,39 52,86
2.006 12,79 50,87
2.006 12,89 49,99
2.006 11,35 51,20
2.006 10,94 50,82
2.006 11,78 50,88
2.007 13,90 48,97
2.007 12,83 51,21
2.007 11,93 50,43
2.007 10,90 52,30
2.007 11,53 51,08
2.007 11,16 51,53
2.007 11,16 51,34
2.007 10,73 51,26
2.007 10,84 52,07
2.007 10,05 54,56
2.007 9,42 54,06
2.007 9,89 52,43
2.008 13,08 50,13
2.008 11,99 51,90
2.008 11,22 53,00
2.008 11,13 52,93
2.008 10,84 52,74
2.008 11,17 50,78
2.008 12,06 51,61
2.008 11,22 51,48
2.008 10,95 52,11
2.008 10,12 52,72
2.008 10,80 51,33
2.008 10,61 52,22
2.009 14,25 50,33
2.009 12,49 52,20

a. realizar el diagrama de dispersión de dichas variables


y determinar el tipo de asociación entre las variables.

Tasa de empleo (%) (Y)


56.00
55.00
54.00
53.00
52.00
51.00
50.00
49.00
48.00
0.00 5.00 10.00 15.00

Y : Dependiente
X: Independiente

Tipo de asociación= inversa porque cuando aumenta el desempleo, disminuye la tasa de empleo.
b. encontrar el modelo matemático que permite predecir
una variable sobre la otra. ¿Es confiable?

X Y X*Y X² Y²
13,22 52,39 692,46 174,72 2.744,37

14,23 51,69 745,42 202,47 2.671,72

12,95 52,20 678,32 167,66 2.724,44

12,06 52,84 631,84 145,47 2.791,78

12,31 52,85 644,64 151,42 2.792,79

11,52 52,52 603,67 132,79 2.758,51

12,00 54,05 628,44 143,91 2.921,81

11,75 53,06 615,77 138,17 2.814,90

11,17 53,68 585,25 124,81 2.881,52

9,96 55,42 521,51 99,10 3.071,60

10,21 54,69 534,73 104,19 2.991,25

10,33 55,16 541,38 106,80 3.042,78

13,41 52,05 702,43 179,79 2.709,70

13,00 52,56 681,01 168,99 2.762,37

11,34 53,96 594,28 128,69 2.911,36

12,01 52,06 629,16 144,24 2.710,46

11,88 52,67 622,55 141,22 2.774,31

10,61 54,23 555,67 112,51 2.941,42

12,39 52,86 649,03 153,49 2.793,87

12,79 50,87 670,14 163,64 2.587,97


12,89 49,99 675,27 166,16 2.498,55

11,35 51,20 594,84 128,93 2.621,86

10,94 50,82 573,01 119,64 2.582,96

11,78 50,88 617,26 138,83 2.588,86

13,90 48,97 727,93 193,08 2.397,70

12,83 51,21 671,92 164,51 2.622,82

11,93 50,43 624,84 142,26 2.542,74

10,90 52,30 571,21 118,89 2.735,01

11,53 51,08 603,96 132,91 2.608,72

11,16 51,53 584,89 124,65 2.655,80

4,10 11,16 51,34 584,61 124,53 2.635,77

10,73 51,26 562,18 115,16 2.627,81

10,84 52,07 567,68 117,42 2.711,04

10,05 54,56 526,37 100,96 2.976,48

9,42 54,06 493,26 88,66 2.922,02

9,89 52,43 518,31 97,89 2.748,93

13,08 50,13 685,17 171,06 2.513,04

11,99 51,90 627,88 143,65 2.693,53

11,22 53,00 588,02 125,99 2.809,28

11,13 52,93 583,03 123,86 2.801,83

10,84 52,74 567,78 117,47 2.781,85

11,17 50,78 585,29 124,82 2.578,40


12,06 51,61 631,98 145,54
2.663,95

11,22 51,48 587,57 125,80 2.650,12

10,95 52,11 573,55 119,87 2.715,74

10,12 52,72 530,32 102,48 2.779,07

10,80 51,33 565,85 116,67 2.634,56

10,61 52,22 555,66 112,50 2.726,89

14,25 50,33 746,44 203,02 2.532,63

12,49 52,20 654,24 155,97 2.724,80

Σ 582,36 2.611 30.508,02 6.847,28 136.481,68

n= 50
(n)² = 2.500

PARA EL PUNTO B

Se aplica la ecuación Y = ax + b dónde:

b = 1.525.401 - (50)(2,611)/50*6.8487,28 - 2,500 =


= 1.525.401 - 130.550/ 339.864 = 1.394.851/339.864 =

a = 2,611-(4,10*50)/(50))/50 = 2.611-(205)/50))/50 = 2.606,9/50 = 52,13

Y = 52,13X + 4,10 que es el modelo


Entonces matemático.

Se puede afirmar que la ecuación de la recta no es confiable porque R²


Está lejano a 1 y tiene un grado alto de desconfianza.

El modelo es el adecuado para predecir la variable dependiente (Y)


A partir de los valores observados en la variable independiente (X).
c. determinar el grado de relación de las dos variables.

∑𝑌 ∑𝑋
ŷ= 𝑛 = 52,23 x= 𝑛 = 11,65

ŷ² = 2727,78

136.481,68 − (52,13 )( 2.611) − (4,10)( 30.508,02)



= 50 − 2
Σ

136.481,68 − 136.111 − 125.082.882 = √2.605.885.653 = -51.048


se = √ =
48

-
2675,55 -18,0794061

R = -4
Entonces el grado de correlación de las variables es de 4,00, es una correlación imperfecta.

d. relacionar la información
obtenida con el problema.

El caso analizado es el relacionado con la escogencia de dos variables de las


base de datos sobre el desempleo en Colombia, 2016 (16-4), cuyas variables
escogidas
Fueron: tasa de desempleo (X) y personas sin empleo (Y). El grado de
correlación de las variables es perfecto ya que dio como resultado 4.
Lo anterior indica que la tasa de desempleo es
inversamente proporcional a la tasa de desempleo.
ACTIVIDAD 3

Descripción de la actividad colaborativa.

Finalmente, el grupo deberá responder a la pregunta: ¿Qué alternativa de solución plantea

para la problemática estudiada?

POSIBLE ALTERNATIVA DE SOLUCION

Aunque el sector agrícola es clave para cualquier país, en Colombia esa actividad ha venido

perdiendo peso dentro del conjunto de la economía. Tanto que la participación del agro en

el producto interno bruto PIB, es hoy apenas de 9%, según Rafael mejía presidente de la

sociedad de agricultores de Colombia SAC, obedece a la falta de una verdadera política

estatal y coherente de largo plazo

Sin embargo una de las posibles alternativas de solución de esta problemática del

desempleo en Colombia, se plantea que debe haber más participación del gobierno en el

control del PIB, y así mismo involucrar a entidades financieras el cual promuevan

prestamos, crédito a las pymes con bajo interés y facilidades de pago, para dar iniciativa en

la creación de proyectos productivos en las regiones.


Bibliografía

https://www.dane.gov.co/

https://studylib.es/doc/811241/medidas-estad%C3%ADsticas-univariantes-1.1.-medidas-de-
tendenc...

https://www.portaleducativo.net/primero-medio/50/graficos-estadisticos

También podría gustarte