Está en la página 1de 30

1

Presentado por:

Profesor:

Curso:
2

Tabla de contenido
3. Resumen........................................................................................................................3

4.Problemática o fenómeno de interés...............................................................................4

5. Metodología...................................................................................................................5

5.1 Fuente de datos........................................................................................................5

5.2 Tratamiento y validación de la calidad de los datos................................................6

5.3 Métodos a aplicar sobre los datos para dar respuesta a las preguntas.....................6

6. Resultados......................................................................................................................7

6.1 Descripción general de la base de datos..................................................................7

6.2 Análisis descriptivo.................................................................................................9

6.2.1 Variable1: Ingtotug2018...................................................................................9

6.2.3 Variable 3 Ingotug2018..................................................................................12

6.3 Análisis inferencial................................................................................................15

6.3.1 Preguntas sobre media y proporciones...........................................................15

6.3.2 Análisis de regresión......................................................................................25

7. Conclusiones generales...............................................................................................28

Bibliografía......................................................................................................................30
3

3. Resumen

A partir de la selección de una base de datos del DANE en la que se resumen datos
relacionados con los hogares colombianos segmentados por regiones, se seleccionan 2
variables cuantitativas que resumen los ingresos promedio mensuales de los hogares en
la ciudad de Bogotá para los años 2018 y 2019, adicionalmente se seleccionan 2
variables cualitativas que resumen el número de encuestados por ciudad. A partir del
análisis descriptivo de las variables cualitativas, se concluye que la ciudad de Bogotá
fue la que más encuestados tuvo en todo el país. El análisis descriptivo de las 2
variables cuantitativas devela que la mayoría de los hogares presentan ingresos bajos o
medios, siendo los altos, datos prácticamente atípicos en la distribución. Sin embargo,
estos pocos altos son muy altos a comparación del promedio, lo que deja entrever un
problema de desigualdad social bastante arraigado en términos de ingresos. Se aplican
pruebas de hipótesis a los datos muestrales obtenidos y se concluye que no hay mayor
variación de los datos ingresos según la variación del salario mínimo y de pobreza para
los 2 años de estudio en cuestión. Finalmente se establece un modelo de regresión con
alto grado de correlación que permite estimar el ingreso esperado de una familia para el
año 2019, a partir del que tuvo en el año 2018.
4

4.Problemática o fenómeno de interés

La pobreza es un fenómeno que tiene incidencia en todo el mundo, en unas

regiones del mundo más que en otras, dentro del ámbito general la pobreza se define

como “escasez o carencia de lo necesario para vivir”, sin embargo, ese es un concepto

muy general que adquiere un significado diferente de acuerdo con las condiciones

socioeconómicas específicas que presenta cada país. De acuerdo con el Banco Mundial

(2018), en general se dice que una persona es pobre si vive con menos de 1.9 dólares

diarios de ingresos. Por supuesto que esta es una definición bastante relativa ya que el

costo de vida difiere mucho entre los diferentes países, en el caso específico de

Colombia, de acuerdo con el (DANE, 2019, p.4), “ una persona en Colombia no

pertenece a este grupo si sus ingresos son superiores a los $283.828 en zonas

metropolitanas, y de $257.433 en zonas rurales en 2019, para el año 2018 y 2019 este

valor sería de $275.000 y $250.000 respectivamente. Para el caso de hogares, éste sería

clasificado como pobre si el ingreso total del hogar está por debajo de $1.029.732 en

2018 y 1002480 para 2019”.

El DANE es la entidad encargada de “la planeación, levantamiento, procesamiento,

análisis y difusión de las estadísticas oficiales de Colombia, es por esto que ofrece más

de 100 investigaciones en aspectos industriales, económicos, agropecuarios,

poblacionales y de calidad de vida encaminadas a soportar la toma de decisiones en ese

país”.

Una de las estadísticas que publica el DANE cada año es la de “Medición de Pobreza

Monetaria y Desigualdad”, en la cual se incluyen una serie de datos relacionados con la

economía de los hogares y las personas. Como ya se definió, el principal indicador para

medir la pobreza es el ingreso por persona o por hogar, por lo que el análisis de los

datos de ingreso para los hogares colombianos es una manera de develar el estado de la
5

pobreza en el país para un año en específico, basándose en los parámetros de media

aritmética, diferencia de medias, diferencia de proporciones y correlación entre

variables para establecer modelo predictivo.

5. Metodología

5.1 Fuente de datos

La base de datos con nombre “COLOMBIA - Medición de Pobreza Monetaria y

Desigualdad “recoge información cualitativa y cuantitativa sobre la economía de los

hogares en Colombia. Esta información es importante a la hora de consolidar una base

de datos nacional con información relevante sobre el desarrollo social en el país.

Con relación a la base de datos; de acuerdo con el [CITATION DAN17 \l 3082 ],

“para la medición de la pobreza monetaria se requieren dos elementos principalmente:

el valor de las líneas de pobreza y el ingreso per-cápita disponible de los hogares. La

línea de indigencia corresponde al valor de una canasta básica de alimentos y la de

pobreza al valor de una canasta que incluye además de alimentos otros bienes básicos.

Esta medición consiste en determinar cuántos hogares carecen de ingresos suficientes

para comprar dichas canastas”

El análisis de estos datos a la luz de las herramientas estadísticas es esencial para

desglosar el significado de estos en pro de tomar decisiones para el presente y para el

futuro desde una base con indicadores claros.

Las variables son clasificadas utilizando unos códigos que sirven como abreviación

de su nombre, lo que facilita su identificación y tratamiento a la hora de manipularlos,

de igual manera, se realiza un clasificación de acuerdo con el tipo de variable,

cualitativa, cuantitativa y continua o discreta.


6

Hay variables que a pesar de ser cualitativas tienen una asignación cuantitativa que

facilita su interpretación. Estos números por sí solos no representan nada, pero cuando

se analizan de acuerdo con lo que representa su asignación, cobran significado.

5.2 Tratamiento y validación de la calidad de los datos

Medición de pobreza y desigualdad 2018 (DANE)

http://microdatos.dane.gov.co/index.php/catalog/545/get_microdata

Pobreza Medición de pobreza y desigualdad 2019 (DANE)

http://microdatos.dane.gov.co/index.php/catalog/608/get_microdata

5.3 Métodos a aplicar sobre los datos para dar respuesta a las preguntas

Para el estudio que se va a llevar a cabo en este trabajo, se eligieron las 2 variables

cuantitativas continuas Ingotug2018, Ingotug2019, estas están definidas como “Ingreso

total por hogar de la unidad de gasto antes de imputación de arriendo a propietarios y

usufructuarios” para los 12 meses del año 2018 y 2019 respectivamente en la ciudad de

Bogotá. Estas variables se prestan para establecer preguntas relacionadas con el ingreso

medio para ambos años y la proporción basados en muestras y luego cotejándolos con

datos reales de la población contenidos en la base de datos. Sobre estas variables, se

aplicarán los siguientes métodos de estadística inferencial:

 Media: De acuerdo con los datos de la muestra, se puede calcular la media para

establecer el ingreso promedio por hogar en determinada región del país para los

años 2018 y 2019.

 Proporción: Se puede establecer la proporción de hogares que están por debajo

de la línea de pobreza de acuerdo con la definición nacional de pobreza de

acuerdo al umbral de ingresos para el año 2018 y 2019.


7

 Diferencia de medias: Se puede hacer una comparación de medias para la

pobreza en los 2 años de estudio y así analizar qué tan probable es que haya una

disminución del ingreso medio desde el año 2018 al año 2019.

 Diferencia de proporciones: De acuerdo con la proporción de ingresos que

establecen la condición de “pobre” según los umbrales establecidos, es posible

determinar qué tanto disminuyó esta proporción del año 2018 al año 2019.

 Correlación entre variables: Se puede determinar qué tan correlacionadas están

las variables para una ciudad específica de manera que se pueda establecer un

modelo de regresión para predecir cómo se va a comportar la economía para los

años venideros.

6. Resultados

6.1 Descripción general de la base de datos.

Base de datos: Hogares 2018.csv

Origen: DANE 2018.

Variable1: Ingtotug2018

Tipo de variable: Cuantitativa Continua.

Tamaño de la muestra: 12549 hogares.

Tamaño de la población: 824.807 hogares en la ciudad de Bogotá. (Bogotá como

vamos, 2018)

Variable 2: Encuestados por Ciudad en el país 2018.

Tipo de variable: Cualitativa nominal.

Tamaño de la muestra: 230.908hogares.


8

Tamaño de la población: 14.200.000 hogares en Colombia [CITATION EFE19 \l 3082 ]

Base de datos: Hogares 2018.csv

Origen: DANE 2018

Variable 3. Intotug2018

Tipo de variable: Cuantitativa Continua.

Tamaño de la muestra: 12783 hogares.

Tamaño de la población: 824.807 hogares en la ciudad de Bogotá. (Bogotá como

vamos, 2018).

Variable 4. Encuestados por ciudad en el país 2018.

Tipo de variable: Cualitativa nominal.

Tamaño de la muestra: 231.127 hogares.

Tamaño de la población: 14.200.000 hogares en Colombia [CITATION EFE19 \l 3082 ]

6.2 Análisis descriptivo

6.2.1 Variable1: Ingtotug2018

La siguiente es la tabla de frecuencias para la variable cuantitativa Ingtotug2018, así

como las respectivas medidas de tendencia central, posición y dispersión. La agrupación

se hizo por medio de la opción de tablas dinámicas para Excel, luego de determinar el

valor máximo, valor mínimo, rango, número de clases y amplitud. Todos los

estadísticos se calcularon como muestra, ya que esto es una muestra de la población

total.
9

Frecuencia
Frecuencia
Frecuencia Frecuencia relativa
Intervalo acumulada
absoluta fi relativa hi acumulada
Fi
Hi
0-3101190 9303 9303 74,13% 74,13%
3101190-6202380 2307 11610 18,38% 92,52%
6202380-9303570 557 12167 4,44% 96,96%
9303570-12404760 199 12366 1,59% 98,54%
12404760-15505950 80 12446 0,64% 99,18%
15505950-18607140 54 12500 0,43% 99,61%
18607140-21708330 17 12517 0,14% 99,74%
21708330-24809520 8 12525 0,06% 99,81%
24809520-27910710 13 12538 0,10% 99,91%
27910710-31011900 4 12542 0,03% 99,94%
34113090-37214280 4 12546 0,03% 99,98%
37214280-40315470 1 12547 0,01% 99,98%
40315470-43416660 1 12548 0,01% 99,99%
43416660-46517850 1 12549 0,01% 100,00%
Total 12549      
Media 2621879

Moda 800000

Mediana 1842072

Cuartil 1 1005000

Cuartil 2 1842072

Cuartil 3 3174186

Desviación Estándar 2836392,88

Coeficiente de variación 108%


Tabla 1. Tabla de frecuencias variable Ingtotug2018. Fuente: Elaboración propia.
10

Ingresos por hogar en Bogotá (Pesos Colombianos)


80.00%
70.00%
60.00%
50.00%
40.00%
30.00%
20.00%
10.00%
0.00%
4 8 2 6 0 4 8 2 6 0 4 2 0 4
444 888 333 777 222 666 110 555 999 444 888 777 666 110
9 8 8 7 7 6 6 5 4 4 3 2 1 1
28 57 86 15 44 73 02 31 60 89 18 76 34 63
0- 4 4- 8 8- 2 -1 6 -1 0 -1 4 -2 8 -2 2 -2 6 -2 0 -3 8 -3 6 -4 0 -4
94
4
88
8 33 77 22 66 10 55 99 44 32 21 66
28 57 683 577 472 366 261 155 049 944 733 522 416
8 11 14 17 20 23 26 28 34 40 43

Figura 1. Ingresos por hogar en Bogotá 2019. Fuente: Elaboración propia.

De acuerdo con la tabla de frecuencias para la muestra de variable ingresos por hogares

para el año 2019, se concluye que el 74% de los hogares en Bogotá tienen ingresos

inferiores a los $3.101.190 pesos. El 25% tiene ingresos inferiores a $1.050.000, el 50%

a $1.842.000 y apenas un 2% ingresos superiores a $9.000.000. El ingreso promedio por

hogar para este año es de $2.621.879.

6.2.2 Variable 2: Encuestados por Ciudad en el país 2018

Al ser esta variable de tipo cualitativo, se le realiza tabla de frecuencias aboslutas y

relativas contando los valores de cada ciudad en la base de datos a través de la opción

de tablas dinámicas. Se calcula únicamente la moda por ser cualitativa.

Frecuencia
Frecuencia Frecuencia absoluta Frecuencia
Ciudad relativa
absoluta fi acumulada Fi relativa
acumulada
Armenia 7950 7950 3,44% 3,44%
Barranquilla 9243 17193 4,00% 7,45%
Bogotá 10389 27582 4,50% 11,95%
Bucaramanga 7352 34934 3,18% 15,13%
Cali 9324 44258 4,04% 19,17%
Cartagena 7627 51885 3,30% 22,47%
Cucuta 6927 58812 3,00% 25,47%
Florencia 6965 65777 3,02% 28,49%
Ibagué 7659 73436 3,32% 31,80%
11

Manizales 8707 82143 3,77% 35,57%


Medellín 12550 94693 5,44% 41,01%
Montería 6698 101391 2,90% 43,91%
Neiva 8045 109436 3,48% 47,39%
Pasto 7160 116596 3,10% 50,49%
Pereira 7825 124421 3,39% 53,88%
Popayán 8673 133094 3,76% 57,64%
Quíbdó 5985 139079 2,59% 60,23%
Resto Urbano 24158 163237 10,46% 70,69%
Riohacha 7779 171016 3,37% 74,06%
Rural 22388 193404 9,70% 83,76%
Santa Marta 8343 201747 3,61% 87,37%
Sincelejo 7537 209284 3,26% 90,64%
Tunja 6843 216127 2,96% 93,60%
Valledupar 7169 223296 3,10% 96,70%
Villavicencio 7612 230908 3,30% 100,00%
Total 230908
Moda Rural
Tabla 2. Encuestados por ciudad 2018. Fuente: Elaboración propia.

Encuestados por ciudad


12.00%

10.00%

8.00%

6.00%

4.00%

2.00%

0.00%
ia lla tá ga ali na ta ia ué es lín ía va to ra án dó no ha al ta jo ja ar io
en qui ogo an C ge ucu enc ag izal del nter Nei Pas erei pay uíb rba hac Rur ar cele Tun dup enc
m n B m
Ar rra a rta C Flor Ib an Me Mo P Po Q U io M
a in l e ic
a l i ll a v
a car Ca M s to R a nt S V
B Bu Re S V

Figura 2. Encuestados por ciudad 2018. Fuente: Elaboración propia.

La zona rural fue la que más encuestados presentó, con un 9.7% del total, valor

equivalente a 22388 encuestados. Bogotá es la ciudad que más encuestados registró, con
12

12550, lo que equivale a un 5.44% del total, incluso más que la capital Bogotá, con

10389 encuestados, lo que equivale a un 4,5% del total.

6.2.3 Variable 3 Ingotug2018

La siguiente es la tabla de frecuencias para la variable cuantitativa Ingtotug2018, así

como las respectivas medidas de tendencia central, posición y dispersión. La agrupación

se hizo por medio de la opción de tablas dinámicas para Excel, luego de determinar el

valor máximo, valor mínimo, rango, número de clases y amplitud. Todos los

estadísticos se calcularon como muestra, ya que esto es una muestra de la población

total.

Frecuencia
Frecuencia Frecuencia Frecuencia relativa
Intervalo acumulada
absoluta fi relativa hi acumulada Hi
Fi
0-3557143 9933 9933 77,71% 77,71%
3557143-7114286 2036 11969 15,93% 93,64%
7114286-10671429 470 12439 3,68% 97,32%
10671429-14228572 177 12616 1,38% 98,70%
14228572-17785715 79 12695 0,62% 99,32%
17785715-21342858 32 12727 0,25% 99,57%
21342858-24900001 18 12745 0,14% 99,71%
24900001-28457144 13 12758 0,10% 99,81%
28457144-32014287 11 12769 0,09% 99,90%
32014287-35571430 4 12773 0,03% 99,93%
35571430-39128573 5 12778 0,04% 99,97%
39128573-42685716 1 12779 0,01% 99,98%
42685716-46242859 1 12780 0,01% 99,98%
46242859-49800002 2 12782 0,02% 100,00%
Total 12782      
Media 2766169      
Moda 1000000      
1919330,6
Mediana
7      
1031047,1
Cuartil 1
7      
Cuartil 2 1919331      
Cuartil 3 3306727
13

Desviación Estándar 3136451,1


Coeficiente de
113%
variación
Tabla 3. Tabla de frecuencias variable Ingotug2018. Fuente: Elaboración propia.

Ingreso por hogar en pesos Colombianos 2018


90.00%
80.00%
70.00%
60.00%
50.00%
40.00%
30.00%
20.00%
10.00%
0.00%
43 86 29 72 15 58 01 44 87 30 73 16 59 02
5 71 142 714 285 857 428 000 571 142 714 285 857 428 000
35 1 6 2 7 3 9 4 0 5 1 6 2 8
0- -7 10 14 17 21 24 28 32 35 39 42 46 49
143 8 6- 2 9- 7 2- 1 5- 5 8- 0 1- 4 4- 8 7- 3 0- 7 3- 1 6- 5 9-
57 14
2 14 85 57 28 00 71 42 14 85 57 28
35 71 067 422 778 134 490 845 201 557 912 268 624
1 1 1 2 2 2 3 3 3 4 4

Figura 3. Ingresos por hogar en Bogotá 2018. Fuente: Elaboración propia.

De acuerdo con la tabla de frecuencias para la muestra de variable ingresos por hogares

para el año 2018, se concluye que el 77.71% de los hogares en Bogotá tienen ingresos

inferiores a los $3.557.143 pesos. El 25% tiene ingresos inferiores a $1.031.047, el 50%

a $1.919.331 y el 75% tiene ingresos por debajo de $3.306.727. El ingreso promedio

por hogar para este año es de $2.766.169.

Variable 4. Encuestados por ciudad en el país 2018.

Al ser esta variable de tipo cualitativo, se le realiza tabla de frecuencias aboslutas y

relativas contando los valores de cada ciudad en la base de datos a través de la opción

de tablas dinámicas. Se calcula únicamente la moda por ser cualitativa.

Frecuencia
Frecuencia
Frecuencia absoluta Frecuencia
Ciudad relativa
absoluta fi acumulada relativa
acumulada
Fi
ARMENIA 7921 7921 3,43% 3,43%
14

BARRANQUILLA 9403 17324 4,07% 7,50%


BOGOTA 10567 27891 4,57% 12,07%
BUCARAMANGA 7382 35273 3,19% 15,26%
CALI 9421 44694 4,08% 19,34%
CARTAGENA 7600 52294 3,29% 22,63%
CUCUTA 6726 59020 2,91% 25,54%
FLORENCIA 6905 65925 2,99% 28,52%
IBAGUE 7517 73442 3,25% 31,78%
MANIZALES 8695 82137 3,76% 35,54%
MEDELLIN 12782 94919 5,53% 41,01%
MONTERIA 7098 102017 3,07% 43,91%
NEIVA 7964 109981 3,45% 47,39%
PASTO 7084 117065 3,06% 50,49%
PEREIRA 7983 125048 3,45% 53,88%
POPAYAN 8424 133472 3,64% 57,64%
QUIBDO 5820 139292 2,52% 60,23%
RESTO URBANO 24420 163712 10,57% 70,69%
RIOHACHA 7825 171537 3,39% 74,06%
RURAL 22154 193691 9,59% 83,76%
SANTA MARTA 8480 202171 3,67% 87,37%
SINCELEJO 7636 209807 3,30% 90,64%
TUNJA 6564 216371 2,84% 93,60%
VALLEDUPAR 7168 223539 3,10% 96,70%
VILLAVICENCIO 7588 231127 3,28% 100,00%
Total general 231127      
Moda Rural
Tabla 4. Encuestados por ciudad 2018. Fuente: Elaboración propia.

Ciudades Encuestadas 2018


12.00%

10.00%

8.00%

6.00%

4.00%

2.00%

0.00%
IA A LI A E IN VA RA O A A A O
EN OT CA UT GU LL EI EI IBD CH RT NJ N CI
G C A E N R A A U E
AR
M
BO CU IB ED PE QU OH M T IC
M RI TA LAV
N L
SA VI

Figura 4. Encuestados por ciudad 2018. Fuente: Elaboración propia.


15

La zona rural fue la que más encuestados presentó, con un 9.59% del total, valor

equivalente a 22154 encuestados. Bogotá es la ciudad que más encuestados registró, con

12782, lo que equivale a un 5.53% del total, incluso más que la capital Bogotá, con

10567 encuestados, lo que equivale a un 4,57 % del total.

6.3 Análisis inferencial

6.3.1 Preguntas sobre media y proporciones

Intervalo de confianza del 90% y del 95% para la media de las Variables 1 y 3

(Intotug2018, Intotug2019).

Variable Intotug2018:

Intervalo de confianza del 95%:

Como n es mucho mayor a 30 y estamos trabajando con desviación estándar muestral:

S
X́ ± Zα /2( )
√n

Reemplazando los valores obtenidos de:

X́ =2.621.879

S=2.836.393

n=12549

Z(0.25)=1.96
16

2.836 .393
2.621 .879± 1.96( )
√ 12549

(2.572.252, 2.671.506)

Intervalo de confianza del 95% para la media de los ingresos de los hogares en el año

2019.

Intervalo de confianza del 90%:

Como la confianza ya es del 90%, el valor de Z queda:

Z(0.5)=1.65

Luego queda:

2.836 .393
2.621 .879± 1.65( )
√ 12549

(2.580.101, 2.663.657)

Es un intervalo de confianza del 90% para los ingresos del año 2019.

Variable Intotug2018:

Como n es mucho mayor a 30 y estamos trabajando con desviación estándar muestral:

S
X́ ± Zα /2( )
√n

Reemplazando los valores obtenidos de:

X́ =2.766 .169

S=3.136.451

n=12782
17

Zα /2=1.96

3.136 .451
2.766 .169 ±1.96( )
√ 12782

(2.711.794, 2.820.543)

Intervalo de confianza del 95% para la media de los ingresos de los hogares en el año

2018.

Intervalo de confianza del 90%:

Como la confianza ya es del 90%, el valor de Z queda:

Z(0.5)=1.65

Luego queda:

3.136 .451
2.766 .169 ±1.65( )
√ 12782

(2.720.394, 2.811.943)

Es un intervalo de confianza del 90% para los ingresos del año 2018.

Intervalo de confianza del 95% para la diferencia de medias:

Como las 2 muestras son mayores a 30 y la desviación estándar es muestral, se utiliza:

´
S 1 2 S 22
( X 2¿− X´ 1)± Zα /2

n1 n2
+ ¿

Reemplazando:

2.836 .3932 3.136 .4512


(2.766 .169−2.621.879)± 1.96
√ 12549
+
12782
18

(70673, 217907)

Es un intervalo del 95% para la diferencia de medias de los ingresos para hogares en el

2018 y 2019.

Intervalo de confianza del 90% para la diferencia de medias:

2.836 .3932 3.136 .4512


(2.766 .169−2.621.879)± 1.65
√ 12549
+
12782

(82316.7, 206263)

Es un intervalo del 90 % para la diferencia de medias de los ingresos para hogares en el

2018 y 2019.

Intervalo de confianza del 95% para la proporción año 2019

Para estimar un intervalo para la proporción, vamos a establecer para el año 2019, la

proporción de personas pobres según el umbral definido por el DANE de $1.029.732.

Para llegar a la proporción aproximada que representa este valor, se calcular la

probabilidad utilizando la distribución normal con la media y la desviación estándar que

ya se tiene, utilizando la función en Excel:

=DISTR.NORM.N(1029732;2766169;3136451;VERDADERO)

Obteniendo un valor de 28,99%

Es decir que de acuerdo con la definición del DANE; 28,99% de los hogares en Bogotá

estarían bajo la línea de pobreza.

Luego el intervalo de confianza para este valor sería:


19

^p ( 1− ^p )
^p ± Zα /2
√ n

Como n es grande, se utiliza ^p= p

0.2899 (1−0.2899 )
0.2899 ±1.96
√ 12782

(0.28203, 0.29776)

Es un intervalo para la proporción de pobreza en el año 2018. Es decir, que la pobreza

real para hogares, con una confianza del 95%, puede estar entre 28.20% y 29.78%.

Intervalo de confianza del 90% para la proporción año 2018

0.2899 ( 1−0.2899 )
0.2899 ±1.65
√ 12782

(0.28321, 0.29658)

Es un intervalo para la proporción de pobreza en el año 2018. Es decir, que la pobreza

real para hogares, con una confianza del 90%, puede estar entre 28.32% y 29.66%.

Intervalo de confianza del 95% para la proporción año 2019

Con el valor de $1.002.480 por hogar como umbral de pobreza para el año 2019, se

calcula el porcentaje utilizando la distribución normal utilizando la función:

=DISTR.NORM.N(1002480;2621879;2836393;VERDADERO)

Obteniendo un valor de umbral de pobreza de 28.40%

Como n es grande, se utiliza ^p= p

0.2840 ( 1−0.2840 )
0.2840 ± 1.96
√ 12549
20

(0.27611,0.29188)

Es un intervalo para la proporción de pobreza en el año 2019. Es decir, que la pobreza

real para hogares, con una confianza del 95%, puede estar entre 27.61% y 29.18%.

Intervalo de confianza del 90% para la proporción año 2019

0.2840 (1−0.2840 )
0.2840 ± 1.65
√ 12549

(0.2773,0.2906)

Es un intervalo para la proporción de pobreza en el año 2019. Es decir, que la pobreza

real para hogares, con una confianza del 90%, puede estar entre 27.73% y 29.06%.

Prueba de Hipótesis con α =0.05

Prueba de Hipótesis para la diferencia de medias entre los ingresos del año 2018 y

2019.

En este apartado, se va a plantear una prueba de hipótesis para saber si la media real de

ingresos para el año 2019 es mayor a la del 2018 en el incremento del salario mínimo en

ese año, valor de $43.525*4= $174.111(Considerando una familia de 4 personas)

[CITATION ElP17 \l 3082 ]

Se desea saber si este incremento corresponde a un incremento para les medias reales.

La hipótesis nula es:

Ho: μ ( 2018 ) −μ ( 2019 )=$ 174.111

La hipótesis alternativa es:


21

H 1: μ ( 2018 )−μ ( 2019 ) < $ 174.111

Como las muestras son grandes y se utiliza la desviación estándar muestral, el

estadístico de prueba es:

( X´ 2− X´ 1 )−δo
Zc=
S 12 S 22
√ +
n 1 n2

( 2.766 .169−2.621.879 )−174.111


Zc=
2.836 .3932 3.136 .4512
√ 12549
+
12782

Zc=−0.79

0.05
Como la significancia con la que estamos trabajando es Z =1.96
2

El criterio de rechazo es:

0.05
{
RR= Zc← Z
2 }
Como −0.79>−1.96, no se rechaza la hipótesis nula y se rechaza H1. Lo que quiere

decir que hay evidencia muestral suficiente de que entre 2018 y 2019 no hay una

disminución media de ingresos de acuerdo con el incremento del salario mínimo entre

dichos años.

Prueba de hipótesis para la proporción de pobreza:

Vamos a determinar si la pobreza aumentó a partir de los porcentajes de pobreza según

el umbral del Dane definidos de 28,99% para 2018 y de 28,4% para 2019 α =0.05
22

Ho: p ( 2018 ) =p ( 2019 )

H 1: p ( 2018 ) > p ( 2019 )

El estadístico de prueba es:

p 1− p 2
Zc=
p1q1 p2q2
√ n1
+
n2

0.2899−0.2840
Zc=

√ (0.2899)(0.7101) (0.2840)(0.716)
12782
+
12549

Zc=1.04

Como 1.04<1.96

Rechazamos la hipótesis de que

p ( 2018 ) > p (2019 )

Es decir, no hay evidencia muestral suficiente para afirmar que la pobreza aumentó en

2018 con respecto a 2019.

Gráficos combinados
23

Ingreso promedio por hogar 2018 vs 2019


90.00%
80.00%
70.00%
60.00%
50.00%
40.00%
30.00%
20.00%
10.00%
0.00%
1 2 3 4 5 6 7 8 9 10 11 12 13 14

2018 2017 2017

Figura 5. Comparativo ingreso por hoja años 2018 y 2019 Fuente: Elaboración propia.

Encuestas por ciudad 2018 vs 2019


12.00%
10.00%
8.00%
6.00%
4.00%
2.00%
0.00%
IA A LI A E IN VA RA DO A A A IO
EN OT CA CUT GU E LL EI EI IB A CH A RT U NJ NC
M G A D N R U H T E
AR BO CU IB E PE Q O M IC
M RI TA LAV
N L
SA VI

2018 2017

Figura 6. Comparativo encuestas por ciudad 2018 vs 2019. Fuente: Elaboración propia.

Boxplot 2018
24

Figura 7. Boxplot 2018. Fuente: Elaboración propia.

Boxplot 2019

Figura 8. Boxplot 2019. Fuente: Elaboración propia.


25

En los Boxplot de los años 2018 y 2019, se puede observar como la gran mayoría de

datos se encuentran en la parte baja de la gráfica, lo que indica ingresos bajos para la

gran mayoría de habitantes de la ciudad de Bogotá. Los puntos flotantes en la parte de

arriba indica la presencia de datos atípicos en ambas distribuciones, lo que quiere decir

que los ingresos muy elevados son verdaderamente poco comunes en los hogares de la

ciudad.

6.3.2 Análisis de regresión

Para efectuar el análisis de regresión de la variable Ingresos de 2018 vs Ingresos de

2019, lo primero que se hace es estandarizar el número de datos de manera que ambas

bases de datos tengan la misma cantidad, el reajuste se hizo en la base de datos del 2018

ya que esta tenía originalmente más datos que la del 2019, posteriormente, se procedió a

organizar cada base de datos de mayor a menor, para que cada dato quedara

correlacionado de manera pareja con su par de cada año, el resultado es el siguiente

gráfico de correlación:

2018 VS 2017

60000000

50000000
f(x) = 1.11 x − 128468.96
40000000 R² = 1

30000000

20000000

10000000

0
0 10000000 20000000 30000000 40000000 50000000

Figura 9. Gráfico de correlación año 2018 vs 2019. Fuente: Elaboración propia.

Interpretación de parámetros
26

El gráfico se ajustó a un modelo lineal obteniendo como resultado la siguiente ecuación

de regresión:

y = 1,1058x – 128469

Donde y corresponde al ingreso promedio mensual del año 2018 y x al ingreso

promedio mensual del año 2019. La pendiente m es el cambio de la variable en y con

respecto a la variable en x.

El coeficiente de determinación es:

R2=0.9984

Este se interpreta como que la variable Y se ve representada en un 99.84% por la

variable X, es decir, si se tiene un valor determinado de ingreso de una familia para el

año 2019, se puede predecir con una fiabilidad del 99.84% el ingreso para el año 2018.

El coeficiente de correlación es:

R=√ 0.9984=0.9991

Este, al ser positivo, quiere decir que ambas variables están correlacionadas

positivamente, es decir, en la medida en la que una aumenta, la otra lo hace en

proporción directa, esto significa que se puede esperar que si el ingreso en el 2019 de

una familia es bajo, siga siendo bajo en 2018, lo mismo pasa si este es medio o alto, el

valor tan cercano a 1 indica que hay una alta correlación entre las variables.

Validación de supuestos

El modelo planteado sirve para predecir el ingreso promedio mensual de una familia en

2018 a partir de su ingreso promedio mensual en el 2019. Supongamos que una familia
27

obtiene en 2019 un ingreso promedio mensual de $2.300.000, utilizando el modelo, se

puede predecir que esa misma familia el ingreso en 2018 de la siguiente manera:

y=1.1058 x−128469

y=1.1058 ($ 2.300 .000)−128469

y=$ 2.414 .871

Es decir, se espera que esa misma familia en 2018 tenga unos ingresos mensuales

promedio de $2.414.871.

Conclusiones

Se observa una correlación bastante buena entre las variables de ingresos mensuales

promedio para los años 2018 y 2019, aunque no está garantizado que cada pareja de

datos corresponda a ingresos de la misma familia, si obtiene un estimativo de la tasa

promedio de cambio de ingresos de un año a otro para valores que están dentro del

mismo rango.

Viendo este incremento desde un punto de vista macroeconómico, este no

necesariamente quiere decir que el poder adquisitivo promedio haya mejorado, ya que

hay que tener en cuenta factores como el aumento del IPC, la devaluación de la moneda,

entre otros aspectos para poder concluir un verdadero aumento del ingreso.

7. Conclusiones generales

 El Departamento Administrativo Nacional de Estadística de Colombia (DANE),

lleva un registro de muchos datos que tienen que ver con el desenvolvimiento

social de los habitantes de Colombia, estos se recaudan por medio de encuestas a


28

muestras poblacionales grandes, lo que incrementa el grado de confianza de las

estimaciones realizadas con estos datos.

 El análisis estadístico adecuado de los datos que recolecta el DANE, les permite

a los gobernantes identificar los problemas sociales que más aquejan al grueso

de la población y hacia dónde se dirige el país, lo que posibilita el trazar planes

estratégicos más eficientes y con mayor impacto social.

 Las variables Ingtotug 2018, Ingtotug 2019 resumen el ingreso familiar

promedio mensual para una familia de 4 personas, ambas recogen datos que

aunque son bastante numerosos, apenas representan un porcentaje muy bajo de

la población, sin embargo, son apropiados para ser sometidos a análisis

estadísticos descriptivos e inferenciales en pro de sacar conclusiones importantes

para la economía de los años 2018 y 2019.

 La variable encuestados por ciudad para los años 2018 y 2019 permite saber qué

tantas personas se están encuestando por ciudad, con base al análisis realizado a

esta variable cualitativa, se puede concluir que Bogotá es la ciudad del país

donde más se encuestaron hogares, incluso por delante de la Bogotá, la capital

de la república.

 El análisis descriptivo a las variables de ingresos de 2018 y 2019 deja entrever la

enorme disparidad en los ingresos de la ciudad, con un rango de $43.416.667

para 2019 y $49.800.000 para el año 2019, se devela un problema de

desigualdad de ingresos muy grande en la ciudad, un fenómeno que no es nuevo

y que se ha dado a conocer por varios estudios independientes.

 El diagrama de Boxplot ratifica la disparidad en los ingresos, ya que la mayoría

se encuentra en la parte baja de la escala, y en la parte superior, hay unos valores

bastante elevados que hacen las veces de datos atípicos, es decir, hay familias
29

con ingresos muy elevados pero estos no son mayoría, este fenómeno también se

percibe al analizar las tablas de frecuencia.

 Los intervalos de confianza develan que por los tamaños de muestras elevados,

se tienen márgenes relativamente estrechos de error, lo que incrementa la

fiabilidad de las inferencias obtenidas.

 La prueba de hipótesis para la diferencia de medias indica que no hay evidencia

muestral suficiente de que el ingreso promedio mensual para el año 2018 sea

menor que el del 2019 de acuerdo con el incremento del salario mínimo

mensual.

 Según la prueba de hipótesis para la diferencia de proporciones, se concluye que,

aunque la proporción muestral de pobreza para el año 2018 es mayor que para el

año 2019, no hay suficiente evidencia muestral para asegurar que la proporción

real de pobreza es mayor para dicho año, se podría decir que, de acuerdo con la

aceptación de la hipótesis nula para esta prueba, las proporciones de pobreza

tienden a estar más o menos estables para los 2 años de estudio.

 El modelo de regresión lineal presentado está diseñado para predecir un

resultado entre los 2 años de estudio, con un alto grado de correlación se podría

estimar cuánto ganó una familia en 2018 a partir de su ingreso en 2019. Sin

embargo, hay muchas otras variables a tener en cuenta que no se contemplaron

en este modelo, por lo que este puede resultar un poco simplista y reduccionista

de la realidad, sin embargo, sirve de guía.

Bibliografía
DANE. (2018). COLOMBIA - Gran Encuesta Integrada de Hogares - GEIH. Obtenido

de http://microdatos.dane.gov.co/index.php/catalog/427/datafile/F19/V3380
30

DANE. (Mayo de 2019). Definición de pobreza en Colombia. Obtenido de

https://www.dane.gov.co/files/investigaciones/condiciones_vida/pobreza/2018/b

t_pobreza_monetaria_18.pdf

Dinero. (2018). Inflación total de 2017 cerró en 4,09% impulsada por la vivienda.

Obtenido de https://www.dinero.com/economia/articulo/inflacion-total-de-2017-

en-colombia-ipc/253916

EFE. (Julio de 2018). Colombia tiene 48,2 millones de habitantes, según el Censo

Nacional de Población. Obtenido de

https://www.efe.com/efe/america/sociedad/colombia-tiene-48-2-millones-de-

habitantes-segun-el-censo-nacional-poblacion/20000013-4016430

Mundial, B. (2018). 1,90 DÓLARES AL DÍA: ¿QUÉ SIGNIFICA ESO? Obtenido de

https://bit.ly/2WlTSXq

País, E. (2018). Así quedó el salario mínimo para el 2018 en Colombia. Obtenido de

https://www.elpais.com.co/economia/salario-minimo-2018-asi-quedo-el-

aumento-en-colombia.html

Vamos, B. C. (Abril de 2016). ¿Cómo vamos en vivienda? Obtenido de

https://www.bogotacomovamos.org/vivienda-y-servicios-p-blicos-0/

También podría gustarte