Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Presentado por:
Profesor:
Curso:
2
Tabla de contenido
3. Resumen........................................................................................................................3
5. Metodología...................................................................................................................5
5.3 Métodos a aplicar sobre los datos para dar respuesta a las preguntas.....................6
6. Resultados......................................................................................................................7
7. Conclusiones generales...............................................................................................28
Bibliografía......................................................................................................................30
3
3. Resumen
A partir de la selección de una base de datos del DANE en la que se resumen datos
relacionados con los hogares colombianos segmentados por regiones, se seleccionan 2
variables cuantitativas que resumen los ingresos promedio mensuales de los hogares en
la ciudad de Bogotá para los años 2018 y 2019, adicionalmente se seleccionan 2
variables cualitativas que resumen el número de encuestados por ciudad. A partir del
análisis descriptivo de las variables cualitativas, se concluye que la ciudad de Bogotá
fue la que más encuestados tuvo en todo el país. El análisis descriptivo de las 2
variables cuantitativas devela que la mayoría de los hogares presentan ingresos bajos o
medios, siendo los altos, datos prácticamente atípicos en la distribución. Sin embargo,
estos pocos altos son muy altos a comparación del promedio, lo que deja entrever un
problema de desigualdad social bastante arraigado en términos de ingresos. Se aplican
pruebas de hipótesis a los datos muestrales obtenidos y se concluye que no hay mayor
variación de los datos ingresos según la variación del salario mínimo y de pobreza para
los 2 años de estudio en cuestión. Finalmente se establece un modelo de regresión con
alto grado de correlación que permite estimar el ingreso esperado de una familia para el
año 2019, a partir del que tuvo en el año 2018.
4
regiones del mundo más que en otras, dentro del ámbito general la pobreza se define
como “escasez o carencia de lo necesario para vivir”, sin embargo, ese es un concepto
muy general que adquiere un significado diferente de acuerdo con las condiciones
socioeconómicas específicas que presenta cada país. De acuerdo con el Banco Mundial
(2018), en general se dice que una persona es pobre si vive con menos de 1.9 dólares
diarios de ingresos. Por supuesto que esta es una definición bastante relativa ya que el
costo de vida difiere mucho entre los diferentes países, en el caso específico de
pertenece a este grupo si sus ingresos son superiores a los $283.828 en zonas
metropolitanas, y de $257.433 en zonas rurales en 2019, para el año 2018 y 2019 este
valor sería de $275.000 y $250.000 respectivamente. Para el caso de hogares, éste sería
clasificado como pobre si el ingreso total del hogar está por debajo de $1.029.732 en
análisis y difusión de las estadísticas oficiales de Colombia, es por esto que ofrece más
país”.
Una de las estadísticas que publica el DANE cada año es la de “Medición de Pobreza
economía de los hogares y las personas. Como ya se definió, el principal indicador para
medir la pobreza es el ingreso por persona o por hogar, por lo que el análisis de los
datos de ingreso para los hogares colombianos es una manera de develar el estado de la
5
5. Metodología
pobreza al valor de una canasta que incluye además de alimentos otros bienes básicos.
Las variables son clasificadas utilizando unos códigos que sirven como abreviación
Hay variables que a pesar de ser cualitativas tienen una asignación cuantitativa que
facilita su interpretación. Estos números por sí solos no representan nada, pero cuando
http://microdatos.dane.gov.co/index.php/catalog/545/get_microdata
http://microdatos.dane.gov.co/index.php/catalog/608/get_microdata
5.3 Métodos a aplicar sobre los datos para dar respuesta a las preguntas
Para el estudio que se va a llevar a cabo en este trabajo, se eligieron las 2 variables
usufructuarios” para los 12 meses del año 2018 y 2019 respectivamente en la ciudad de
Bogotá. Estas variables se prestan para establecer preguntas relacionadas con el ingreso
medio para ambos años y la proporción basados en muestras y luego cotejándolos con
Media: De acuerdo con los datos de la muestra, se puede calcular la media para
establecer el ingreso promedio por hogar en determinada región del país para los
pobreza en los 2 años de estudio y así analizar qué tan probable es que haya una
determinar qué tanto disminuyó esta proporción del año 2018 al año 2019.
las variables para una ciudad específica de manera que se pueda establecer un
años venideros.
6. Resultados
Variable1: Ingtotug2018
vamos, 2018)
Variable 3. Intotug2018
vamos, 2018).
se hizo por medio de la opción de tablas dinámicas para Excel, luego de determinar el
valor máximo, valor mínimo, rango, número de clases y amplitud. Todos los
total.
9
Frecuencia
Frecuencia
Frecuencia Frecuencia relativa
Intervalo acumulada
absoluta fi relativa hi acumulada
Fi
Hi
0-3101190 9303 9303 74,13% 74,13%
3101190-6202380 2307 11610 18,38% 92,52%
6202380-9303570 557 12167 4,44% 96,96%
9303570-12404760 199 12366 1,59% 98,54%
12404760-15505950 80 12446 0,64% 99,18%
15505950-18607140 54 12500 0,43% 99,61%
18607140-21708330 17 12517 0,14% 99,74%
21708330-24809520 8 12525 0,06% 99,81%
24809520-27910710 13 12538 0,10% 99,91%
27910710-31011900 4 12542 0,03% 99,94%
34113090-37214280 4 12546 0,03% 99,98%
37214280-40315470 1 12547 0,01% 99,98%
40315470-43416660 1 12548 0,01% 99,99%
43416660-46517850 1 12549 0,01% 100,00%
Total 12549
Media 2621879
Moda 800000
Mediana 1842072
Cuartil 1 1005000
Cuartil 2 1842072
Cuartil 3 3174186
De acuerdo con la tabla de frecuencias para la muestra de variable ingresos por hogares
para el año 2019, se concluye que el 74% de los hogares en Bogotá tienen ingresos
inferiores a los $3.101.190 pesos. El 25% tiene ingresos inferiores a $1.050.000, el 50%
relativas contando los valores de cada ciudad en la base de datos a través de la opción
Frecuencia
Frecuencia Frecuencia absoluta Frecuencia
Ciudad relativa
absoluta fi acumulada Fi relativa
acumulada
Armenia 7950 7950 3,44% 3,44%
Barranquilla 9243 17193 4,00% 7,45%
Bogotá 10389 27582 4,50% 11,95%
Bucaramanga 7352 34934 3,18% 15,13%
Cali 9324 44258 4,04% 19,17%
Cartagena 7627 51885 3,30% 22,47%
Cucuta 6927 58812 3,00% 25,47%
Florencia 6965 65777 3,02% 28,49%
Ibagué 7659 73436 3,32% 31,80%
11
10.00%
8.00%
6.00%
4.00%
2.00%
0.00%
ia lla tá ga ali na ta ia ué es lín ía va to ra án dó no ha al ta jo ja ar io
en qui ogo an C ge ucu enc ag izal del nter Nei Pas erei pay uíb rba hac Rur ar cele Tun dup enc
m n B m
Ar rra a rta C Flor Ib an Me Mo P Po Q U io M
a in l e ic
a l i ll a v
a car Ca M s to R a nt S V
B Bu Re S V
La zona rural fue la que más encuestados presentó, con un 9.7% del total, valor
equivalente a 22388 encuestados. Bogotá es la ciudad que más encuestados registró, con
12
12550, lo que equivale a un 5.44% del total, incluso más que la capital Bogotá, con
se hizo por medio de la opción de tablas dinámicas para Excel, luego de determinar el
valor máximo, valor mínimo, rango, número de clases y amplitud. Todos los
total.
Frecuencia
Frecuencia Frecuencia Frecuencia relativa
Intervalo acumulada
absoluta fi relativa hi acumulada Hi
Fi
0-3557143 9933 9933 77,71% 77,71%
3557143-7114286 2036 11969 15,93% 93,64%
7114286-10671429 470 12439 3,68% 97,32%
10671429-14228572 177 12616 1,38% 98,70%
14228572-17785715 79 12695 0,62% 99,32%
17785715-21342858 32 12727 0,25% 99,57%
21342858-24900001 18 12745 0,14% 99,71%
24900001-28457144 13 12758 0,10% 99,81%
28457144-32014287 11 12769 0,09% 99,90%
32014287-35571430 4 12773 0,03% 99,93%
35571430-39128573 5 12778 0,04% 99,97%
39128573-42685716 1 12779 0,01% 99,98%
42685716-46242859 1 12780 0,01% 99,98%
46242859-49800002 2 12782 0,02% 100,00%
Total 12782
Media 2766169
Moda 1000000
1919330,6
Mediana
7
1031047,1
Cuartil 1
7
Cuartil 2 1919331
Cuartil 3 3306727
13
De acuerdo con la tabla de frecuencias para la muestra de variable ingresos por hogares
para el año 2018, se concluye que el 77.71% de los hogares en Bogotá tienen ingresos
inferiores a los $3.557.143 pesos. El 25% tiene ingresos inferiores a $1.031.047, el 50%
relativas contando los valores de cada ciudad en la base de datos a través de la opción
Frecuencia
Frecuencia
Frecuencia absoluta Frecuencia
Ciudad relativa
absoluta fi acumulada relativa
acumulada
Fi
ARMENIA 7921 7921 3,43% 3,43%
14
10.00%
8.00%
6.00%
4.00%
2.00%
0.00%
IA A LI A E IN VA RA O A A A O
EN OT CA UT GU LL EI EI IBD CH RT NJ N CI
G C A E N R A A U E
AR
M
BO CU IB ED PE QU OH M T IC
M RI TA LAV
N L
SA VI
La zona rural fue la que más encuestados presentó, con un 9.59% del total, valor
equivalente a 22154 encuestados. Bogotá es la ciudad que más encuestados registró, con
12782, lo que equivale a un 5.53% del total, incluso más que la capital Bogotá, con
Intervalo de confianza del 90% y del 95% para la media de las Variables 1 y 3
(Intotug2018, Intotug2019).
Variable Intotug2018:
S
X́ ± Zα /2( )
√n
X́ =2.621.879
S=2.836.393
n=12549
Z(0.25)=1.96
16
2.836 .393
2.621 .879± 1.96( )
√ 12549
(2.572.252, 2.671.506)
Intervalo de confianza del 95% para la media de los ingresos de los hogares en el año
2019.
Z(0.5)=1.65
Luego queda:
2.836 .393
2.621 .879± 1.65( )
√ 12549
(2.580.101, 2.663.657)
Es un intervalo de confianza del 90% para los ingresos del año 2019.
Variable Intotug2018:
S
X́ ± Zα /2( )
√n
X́ =2.766 .169
S=3.136.451
n=12782
17
Zα /2=1.96
3.136 .451
2.766 .169 ±1.96( )
√ 12782
(2.711.794, 2.820.543)
Intervalo de confianza del 95% para la media de los ingresos de los hogares en el año
2018.
Z(0.5)=1.65
Luego queda:
3.136 .451
2.766 .169 ±1.65( )
√ 12782
(2.720.394, 2.811.943)
Es un intervalo de confianza del 90% para los ingresos del año 2018.
´
S 1 2 S 22
( X 2¿− X´ 1)± Zα /2
√
n1 n2
+ ¿
Reemplazando:
(70673, 217907)
Es un intervalo del 95% para la diferencia de medias de los ingresos para hogares en el
2018 y 2019.
(82316.7, 206263)
2018 y 2019.
Para estimar un intervalo para la proporción, vamos a establecer para el año 2019, la
=DISTR.NORM.N(1029732;2766169;3136451;VERDADERO)
Es decir que de acuerdo con la definición del DANE; 28,99% de los hogares en Bogotá
^p ( 1− ^p )
^p ± Zα /2
√ n
0.2899 (1−0.2899 )
0.2899 ±1.96
√ 12782
(0.28203, 0.29776)
real para hogares, con una confianza del 95%, puede estar entre 28.20% y 29.78%.
0.2899 ( 1−0.2899 )
0.2899 ±1.65
√ 12782
(0.28321, 0.29658)
real para hogares, con una confianza del 90%, puede estar entre 28.32% y 29.66%.
Con el valor de $1.002.480 por hogar como umbral de pobreza para el año 2019, se
=DISTR.NORM.N(1002480;2621879;2836393;VERDADERO)
0.2840 ( 1−0.2840 )
0.2840 ± 1.96
√ 12549
20
(0.27611,0.29188)
real para hogares, con una confianza del 95%, puede estar entre 27.61% y 29.18%.
0.2840 (1−0.2840 )
0.2840 ± 1.65
√ 12549
(0.2773,0.2906)
real para hogares, con una confianza del 90%, puede estar entre 27.73% y 29.06%.
Prueba de Hipótesis para la diferencia de medias entre los ingresos del año 2018 y
2019.
En este apartado, se va a plantear una prueba de hipótesis para saber si la media real de
ingresos para el año 2019 es mayor a la del 2018 en el incremento del salario mínimo en
Se desea saber si este incremento corresponde a un incremento para les medias reales.
( X´ 2− X´ 1 )−δo
Zc=
S 12 S 22
√ +
n 1 n2
Zc=−0.79
0.05
Como la significancia con la que estamos trabajando es Z =1.96
2
0.05
{
RR= Zc← Z
2 }
Como −0.79>−1.96, no se rechaza la hipótesis nula y se rechaza H1. Lo que quiere
decir que hay evidencia muestral suficiente de que entre 2018 y 2019 no hay una
disminución media de ingresos de acuerdo con el incremento del salario mínimo entre
dichos años.
el umbral del Dane definidos de 28,99% para 2018 y de 28,4% para 2019 α =0.05
22
p 1− p 2
Zc=
p1q1 p2q2
√ n1
+
n2
0.2899−0.2840
Zc=
√ (0.2899)(0.7101) (0.2840)(0.716)
12782
+
12549
Zc=1.04
Como 1.04<1.96
Es decir, no hay evidencia muestral suficiente para afirmar que la pobreza aumentó en
Gráficos combinados
23
Figura 5. Comparativo ingreso por hoja años 2018 y 2019 Fuente: Elaboración propia.
2018 2017
Figura 6. Comparativo encuestas por ciudad 2018 vs 2019. Fuente: Elaboración propia.
Boxplot 2018
24
Boxplot 2019
En los Boxplot de los años 2018 y 2019, se puede observar como la gran mayoría de
datos se encuentran en la parte baja de la gráfica, lo que indica ingresos bajos para la
arriba indica la presencia de datos atípicos en ambas distribuciones, lo que quiere decir
que los ingresos muy elevados son verdaderamente poco comunes en los hogares de la
ciudad.
2019, lo primero que se hace es estandarizar el número de datos de manera que ambas
bases de datos tengan la misma cantidad, el reajuste se hizo en la base de datos del 2018
ya que esta tenía originalmente más datos que la del 2019, posteriormente, se procedió a
organizar cada base de datos de mayor a menor, para que cada dato quedara
gráfico de correlación:
2018 VS 2017
60000000
50000000
f(x) = 1.11 x − 128468.96
40000000 R² = 1
30000000
20000000
10000000
0
0 10000000 20000000 30000000 40000000 50000000
Interpretación de parámetros
26
de regresión:
y = 1,1058x – 128469
respecto a la variable en x.
R2=0.9984
año 2019, se puede predecir con una fiabilidad del 99.84% el ingreso para el año 2018.
R=√ 0.9984=0.9991
Este, al ser positivo, quiere decir que ambas variables están correlacionadas
proporción directa, esto significa que se puede esperar que si el ingreso en el 2019 de
una familia es bajo, siga siendo bajo en 2018, lo mismo pasa si este es medio o alto, el
valor tan cercano a 1 indica que hay una alta correlación entre las variables.
Validación de supuestos
El modelo planteado sirve para predecir el ingreso promedio mensual de una familia en
2018 a partir de su ingreso promedio mensual en el 2019. Supongamos que una familia
27
puede predecir que esa misma familia el ingreso en 2018 de la siguiente manera:
y=1.1058 x−128469
Es decir, se espera que esa misma familia en 2018 tenga unos ingresos mensuales
promedio de $2.414.871.
Conclusiones
Se observa una correlación bastante buena entre las variables de ingresos mensuales
promedio para los años 2018 y 2019, aunque no está garantizado que cada pareja de
promedio de cambio de ingresos de un año a otro para valores que están dentro del
mismo rango.
necesariamente quiere decir que el poder adquisitivo promedio haya mejorado, ya que
hay que tener en cuenta factores como el aumento del IPC, la devaluación de la moneda,
entre otros aspectos para poder concluir un verdadero aumento del ingreso.
7. Conclusiones generales
lleva un registro de muchos datos que tienen que ver con el desenvolvimiento
El análisis estadístico adecuado de los datos que recolecta el DANE, les permite
a los gobernantes identificar los problemas sociales que más aquejan al grueso
promedio mensual para una familia de 4 personas, ambas recogen datos que
La variable encuestados por ciudad para los años 2018 y 2019 permite saber qué
tantas personas se están encuestando por ciudad, con base al análisis realizado a
esta variable cualitativa, se puede concluir que Bogotá es la ciudad del país
de la república.
bastante elevados que hacen las veces de datos atípicos, es decir, hay familias
29
con ingresos muy elevados pero estos no son mayoría, este fenómeno también se
Los intervalos de confianza develan que por los tamaños de muestras elevados,
muestral suficiente de que el ingreso promedio mensual para el año 2018 sea
menor que el del 2019 de acuerdo con el incremento del salario mínimo
mensual.
aunque la proporción muestral de pobreza para el año 2018 es mayor que para el
año 2019, no hay suficiente evidencia muestral para asegurar que la proporción
real de pobreza es mayor para dicho año, se podría decir que, de acuerdo con la
resultado entre los 2 años de estudio, con un alto grado de correlación se podría
estimar cuánto ganó una familia en 2018 a partir de su ingreso en 2019. Sin
en este modelo, por lo que este puede resultar un poco simplista y reduccionista
Bibliografía
DANE. (2018). COLOMBIA - Gran Encuesta Integrada de Hogares - GEIH. Obtenido
de http://microdatos.dane.gov.co/index.php/catalog/427/datafile/F19/V3380
30
https://www.dane.gov.co/files/investigaciones/condiciones_vida/pobreza/2018/b
t_pobreza_monetaria_18.pdf
Dinero. (2018). Inflación total de 2017 cerró en 4,09% impulsada por la vivienda.
Obtenido de https://www.dinero.com/economia/articulo/inflacion-total-de-2017-
en-colombia-ipc/253916
EFE. (Julio de 2018). Colombia tiene 48,2 millones de habitantes, según el Censo
https://www.efe.com/efe/america/sociedad/colombia-tiene-48-2-millones-de-
habitantes-segun-el-censo-nacional-poblacion/20000013-4016430
https://bit.ly/2WlTSXq
País, E. (2018). Así quedó el salario mínimo para el 2018 en Colombia. Obtenido de
https://www.elpais.com.co/economia/salario-minimo-2018-asi-quedo-el-
aumento-en-colombia.html
https://www.bogotacomovamos.org/vivienda-y-servicios-p-blicos-0/