Está en la página 1de 18

ESTIMACIÓN DE LA POBLACIÓN PERUANA AL 2032 MEDIANTE LA

REGRESIÓN CUADRÁTICA Y EXPONENCIAL

Número de páginas: 16
2

INTRODUCCIÓN

Durante la pandemia se sufrió la pérdida de muchas vidas humanas a

nivel global, también presencié muchos casos de embarazos en adolescentes.

Estos hechos hicieron que me nazca el interés con respecto al tema que

abarcará esta investigación, donde las matemáticas nos ayuden a estimar la

población peruana al 2032.

Mi objetivo es estimar la población peruana al 2032 mediante el modelo

de regresión cuadrática y exponencial, En primer lugar, los años con los que se

tiene ejecutará esta investigación van desde el año 1980 a 2020; porque

consideré que con esta cantidad será suficiente trabajar, dichos datos tendrán

una diferencia de 5 años. La cantidad de población peruana en estos años serán

recopilados del Instituto Nacional de Estadística e Informática del Perú (INEI).

Luego de ello, se realizará una dispersión de datos en el programa Microsoft

Excel; el cual también nos facilitará el proceso de cálculo con los dos modelos

matemáticos. Por lo tanto, está investigación será desarrollada en base a esta

pregunta: ¿En qué medida la regresión cuadrática y exponencial nos permiten

estimar la población peruana?

Estimar nos permite predecir una cantidad aproximada, en este caso nos

referimos a población. al mismo tiempo la estimación también es muy usada en

el campo de la economía.

Roldán (2019) menciona que “Un modelo matemático es un modelo que

utiliza fórmulas matemáticas para representar la relación entre distintas

variables, parámetros y restricciones” (párr. 1). Por lo tanto; en esta exploración

se trabaja con el modelo regresión cuadrática y exponencial, dicho modelo nos


3

permitirá estimar la población peruana con respecto a los datos que obtuvimos,

de tal manera que también podamos estimar la población futura del Perú.

La estimación de la población peruana es lo que se busca en esta

investigación, Westreicher (2020) señala que “la estimación es un cálculo que se

realiza a partir de la evaluación estadística. Dicho estudio suele efectuarse sobre

una muestra y no sobre toda la población objetivo” (párr. 2). En otras palabras,

en esta exploración calcularemos la población peruana con la fórmula de

regresión cuadrática y exponencial, con los resultados de ambos modelos se

hará una comparación entre la dispersión de datos y la estimación que hicimos.

Luego de ellos estimaremos la población peruana en el año 2032.

Explicado dichos términos, procederemos a trabajar con el modelo de

regresión cuadrática y exponencial con los que estimaremos la población

peruana que posiblemente haya en el 2032. Dicho resultado se considera que

no puede ser tan certero, considerando los factores que pueden influir en la

varianza de la población durante el lapso de ese tiempo.


4

Datos

A continuación, se presentarán los datos de la población peruana que se

obtuvieron del Instituto Nacional de Estadísticas e Informática (INEI). Dichos

datos son una proyección que la misma Institución nos brinda, de las cuales se

tomó entre los años de 1980 al 2020 con una diferencia de 5 años cada una.

Tabla 1

Población peruana de 1980 a 2020

Población peruana proyectada por


el INEI

Años Población
1980 17531898
1985 19747819
1990 22031627
1995 24242600
2000 26390142
2005 27722342
2010 28692915
2015 29964499
2020 32625948
Nota. Perú: Estimaciones y Proyecciones de la población Nacional, por Año Calendario
y Edad Simple, 1952-2050 (pp. 15-16), 2019, por Instituto Nacional de Estadísticas e Informática
(https://m.inei.gob.pe/media/principales_indicadores/libro_bol_esp_24_1.pdf). Derechos
reservados del Instituto Nacional de Estadísticas e Informática.

Como podemos observar, según el INEI proyectó que la población

peruana crece significativamente desde el año 1980 al año 2020, los datos de la

población tienen un intervalo de 5 años de diferencia. Como primer dato tenemos

el año 1980 que empieza con una población de 17531819 habitantes y como

dato final tome al año 2020 con una población proyectada por el INEI de

32625948.
5

Dispersión de datos

Ahora procederemos a procesar los datos obtenidos del INEI en un gráfico

utilizando el programa de Excel con los datos brindados en la Tabla 1.

Los resultados se muestran en el siguiente gráfico:

Figura 1

Dispersión de datos sobre la población peruana

Población Peruana Proyectada


INEI
33000000 32625948
Población peruana (en millones)

31000000
29000000 28692915
27000000
26390142
25000000
23000000
22031627
21000000
19000000
17000000 17531898

15000000
1975 1980 1985 1990 1995 2000 2005 2010 2015 2020 2025
Años

Nota. Perú: Estimaciones y Proyecciones de la población Nacional, por Año Calendario


y Edad Simple, 1952-2050 (pp. 15-16), 2019, por Instituto Nacional de Estadísticas e Informática
(https://m.inei.gob.pe/media/principales_indicadores/libro_bol_esp_24_1.pdf). Derechos
reservados del Instituto Nacional de Estadísticas e Informática.

Ahora se puede observar con mayor relevancia el crecimiento poblacional

del Perú. Y resaltando lo dicho anteriormente la proyección que se tiene del INEI;

es que la población peruana crece significativamente entre los años de 1980 a

2020. Por lo tanto, buscaremos un modelo de regresión que más se ajuste con

la dispersión de datos del gráfico, y en base a su función nos permitirá estimar

la población futura del Perú.


6

Luego de buscar los modelos de regresión que más se ajuste a la

dispersión de datos que nos presenta la Figura 1. El modelo de regresión con el

que se planteó trabajar y comparar los datos de dispersión son dos tipos: la

regresión cuadrática y la exponencial, y realizar una comparación de resultados

de estos dos modelos tipos de regresión. De tal manera, que a través de la

regresión podamos estimar la población peruana en el año 2023.

Figura 2

Regresión cuadrática

Nota. Regresión, por A. Sánchez Alberca, 2021, Aprende con Alf


(https://aprendeconalf.es/docencia/estadistica/manual/regresion/). Derechos reservados de
Aprende con Alf.
7

Figura 3

Regresión exponencial

Nota. Regresión, por A. Sánchez Alberca, 2021, Aprende con Alf


(https://aprendeconalf.es/docencia/estadistica/manual/regresion/). Derechos reservados de
Aprende con Alf.

Podemos observar que hay una cierta similitud entre la dispersión de

datos mostrada en la Figura 1 y estos dos tipos de regresión. Por lo tanto, con

estos dos modelos de regresión, estimaremos la población desde 1980 a 2020,

a través de Excel.

Regresión cuadrática

La fórmula de la curva de regresión cuadrática, la cual nos ayudará a

estimar la población desde el año 1980 a 2020 será:

𝑦 = 𝑎0 + 𝑎1 𝑥 + 𝑎2 𝑥 2

Para encontrar los valores de a0, a1 y a2; se utilizará la fórmula:

𝑛𝑎0 + (∑ 𝑥𝑖 ) 𝑎1 + (∑ 𝑥𝑖2 ) 𝑎2 = ∑ 𝑦𝑖

(∑ 𝑥𝑖 ) 𝑎0 + (∑ 𝑥𝑖2 ) 𝑎1 + (∑ 𝑥𝑖3 ) 𝑎2 = ∑ 𝑥𝑖 𝑦𝑖
8

(∑ 𝑥𝑖2 ) 𝑎0 + (∑ 𝑥𝑖3 ) 𝑎1 + (∑ 𝑥𝑖4 ) 𝑎2 = ∑ 𝑥𝑖2 𝑦1

Para facilitarnos el largo proceso, usaremos el Excel y estos son los

resultados:

Tabla 2

Resultados de x, y; y sus respectivas sumatorias

x y xy x^2 x^3 x^4 (x^2) y


1 17532 17531.898 1 1 1 17531.898
6 19748 118486.914 36 216 1296 710921.484
11 22032 242347.897 121 1331 14641 2665826.87
16 24243 387881.6 256 4096 65536 6206105.6
21 26390 554192.982 441 9261 194481 11638052.6
26 27722 720780.892 676 17576 456976 18740303.2
31 28693 889480.365 961 29791 923521 27573891.3
36 29964 1078721.964 1296 46656 1679616 38833990.7
41 32626 1337663.868 1681 68921 2825761 54844218.6
Sumatoria= 189 228949.79 5347088.38 5469 177849 6161829 161230842

Como se puede apreciar ajustamos la variable x (años); la cual la

cambiamos al número de años al cual los años desde 1980 a 2020 pertenece;

los cuales tienen un intervalo de 5 años de diferencia, para que los resultados no

sean tan elevados y tenga coincidencia con la dispersión de datos. Y la variable

y (población), la cual la cambiamos dividiendo el valor entre 1000, para que los

resultados no sean tan elevados y sea más fácil el proceso.

Ahora las sumatorias de los datos de x; y lo reemplazamos en la fórmula

para encontrar el valor de a0, a1 y a2.

9𝑎0 + (189)𝑎1 + (5469)𝑎2 = 228949.79

(189)𝑎0 + (5469)𝑎1 + (177849)𝑎2 = 5347088.38

(5469)𝑎0 + (177849)𝑎1 + (6161829)𝑎2 = 161230842


9

Excel nos facilitó este resultado:

𝒂𝟎 = 17123.7156
𝒂𝟏 = 476.878119
𝒂𝟐 = −2.7964189

Ahora estos valores serán insertados en la función de la curva de

regresión cuadrática.

𝑦 = 17123.7156 + 476.878119𝑥 − 2.7964189𝑥 2

Con esta fórmula, ahora procederemos hacer la estimación de la

población peruana, desde el año 1980 a 2020; con los datos brindados de x; y

en la Tabla 2.

Estimación de población del año 1980 (1):

𝑦 = 17123.7156 + 476.878119(1) − 2.7964189(1)2


𝑦 = 17123.7156 + 476.878119 − 2.7964189
𝑦 = 17597.797
Estimación de población del año 1985 (6):

𝑦 = 17123.7156 + 476.878119(6) − 2.7964189(6)2


𝑦 = 17123.7156 + 2861.268716 − 100.6710795
𝑦 = 19884.3132
Así sucesivamente; hasta el año 2020 (41) donde la estimación es:

𝑦 = 17123.7156 + 476.878119(41) − 2.7964189(41)2


𝑦 = 17123.7156 + 19552.0029 − 4700.780128
𝑦 = 31974.938
Resultados de estimación:

La población que fue reducida en la Tabla 2, ahora los resultados de las

estimaciones se volverán a modificar. A estas estimaciones se les multiplicará


10

por 1000, con el mismo valor que anteriormente lo dividimos, así tener un

resultado más preciso.

Tabla 3

Resultados de estimación con la regresión cuadrática

Población peruana proyectada


Población
Años Población
estimada
1980 17531898 17597797
1985 19747819 19884313
1990 22031627 22031008
1995 24242600 24037882
2000 26390142 25904935
2005 27722342 27632168
2010 28692915 29219579
2015 29964499 30667169
2020 32625948 31974938

Se procederá a calcular el error absoluto y relativo que hay entre la

población peruana y la estimación a través de la regresión cuadrática. Donde el

error absoluto es la diferencia entre la población estimada y la población brindada

por el INEI. Y el error relativo el cual está en %, es la proporción del error con

respecto a la población, y verificar la precisión de la medición.

Tabla 4

Error absoluto y relativo en la estimación de población, con la regresión cuadrática.

Error Relativo
Años Población Población estimada Error Absoluto
(%)
1980 17531898 17597797 65899 0.38
1985 19747819 19884313 136494 0.69
1990 22031627 22031008 -619 0.00
1995 24242600 24037882 -204718 -0.84
2000 26390142 25904935 -485207 -1.84
2005 27722342 27632168 -90174 -0.33
2010 28692915 29219579 526664 1.84
2015 29964499 30667169 702670 2.35
2020 32625948 31974938 -651010 -2.00
11

Regresión exponencial

Nos permite encontrar la ecuación de la función exponencial, en nuestro

caso se estimará los valores futuros de y (población).

La fórmula en la cual se rige la regresión exponencial es la ecuación de

crecimiento exponencial:

𝒚 = 𝒂𝒆𝒃𝒙 Torres (2015).

Donde que x es la variable independiente (años), y es la variable

dependiente (población), a es la población inicial en este caso y b es tasa de

crecimiento anual de una población. Por último, tenemos a “e” Euler que tiene un

valor aproximado de 2.71828.

Ahora procederemos a estimar la población a través de la ecuación de la

regresión exponencial. En este caso esta ecuación ya nos lo brinda el programa

de office Excel:

Figura 4

Recta de regresión exponencial y su ecuación

Población Peruana Proyectada


INEI
33000000 y = 17531898e0.0147x
Población peruana (en millones)

32625948
30000000
28692915
27000000
26390142
24000000
22031627
21000000

18000000 17531898
15000000
1975 1980 1985 1990 1995 2000 2005 2010 2015 2020
Años desde 1980-2020
12

Como podemos observar el valor de a es 17531898 ya que este es el

primer valor que nos brinda la figura. Por otro lado, b tiene el valor de 0.0147;

facilitado por Microsoft Exel.

Ahora con la ecuación de regresión exponencial proporcionada, podemos

estimar la población peruana.

𝑦 = 17531898𝑒 0.0147𝑥
Tabla 5

Se agrego una columna más “N° de año”

Población peruana proyectada


Años N° de año Población
1980 1 17531898
1985 6 19747819
1990 11 22031627
1995 16 24242600
2000 21 26390142
2005 26 27722342
2010 31 28692915
2015 36 29964499
2020 41 32625948

Como se puede apreciar en la tabla, se agregó una columna; la cual

representa el número de año y se consideró el intervalo de 5 años de diferencia

que existe entre los años de 1980 a 2020. Por el motivo de hacer más fácil el

proceso de estimación.

Para el año 1980 (1) tenemos:

1980 = 17531898𝑒 0.0147(1)

1980 = 17531898𝑒 0.0147

1980 = 17791520.54
13

Para el año 1985 (6) la estimación es:

1985 = 17531898𝑒 0.0147(6)

1985 = 17531898𝑒 0.0882

1985 = 19148453.68

Así sucesivamente hasta el año 2020 (41), donde el resultado de

estimación es:

2020 = 17531898𝑒 0.0147(41)

2020 = 17531898𝑒 0.6027

2020 = 32031569.54

Al reemplazar el año por el número de año, fue más predecible estimar la

población. Si se utilizaba los años de 1890 a 2020 para estimar la población, los

resultados de esta ecuación no tendrían relación con la dispersión de datos de

la Figura 1 y haciendo que los resultados sean muy elevados.

Resultados de estimación:

Tabla 6

Resultados de estimación con la ecuación de regresión exponencial.

Población peruana proyectada

Años N° de año Población Población estimada

1980 1 17531898 17791520


1985 6 19747819 19148454
1990 11 22031627 20608878
1995 16 24242600 22180687
2000 21 26390142 23872376
2005 26 27722342 25693087
2010 31 28692915 27652661
2015 36 29964499 29761689
2020 41 32625948 32031570
14

Como se puede apreciar los resultados que se obtuvo a través de la

ecuación de regresión exponencial; si tienen cierta aproximación con los datos

que nos brinda el INEI.

Como lo hicimos anteriormente, se calculará el error absoluto y relativo

que hay entre la población peruana y la estimación a través de la ecuación de

regresión exponencial.

Tabla 7

Error absoluto y relativo en la estimación de población, con la regresión exponencial.

Error Relativo
Años Población Población estimada Error Absoluto
(%)
1980 17531898 17791520 259622 1.48
1985 19747819 19148454 -599365 -3.04
1990 22031627 20608878 -1422749 -6.46
1995 24242600 22180687 -2061913 -8.51
2000 26390142 23872376 -2517766 -9.54
2005 27722342 25693087 -2029255 -7.32
2010 28692915 27652661 -1040254 -3.63
2015 29964499 29761689 -202810 -0.68
2020 32625948 32031570 -594378 -1.82
Comparación entre los dos modelos propuestos

Posteriormente, comparamos las estimaciones resultantes de la ecuación

de regresión cuadrática y la ecuación de regresión exponencial; con la dispersión

de datos de la Figura 1.
15

Figura 5

Comparación de la recta de regresión cuadrática y exponencial; con la dispersión de

datos.

36000000
Población Peruana (en millnes)

33000000

30000000

27000000

24000000
Dispersión de
21000000 datos_INEI
Regresión
Cuadrática
18000000 Regresión
Exponencial
15000000
1975 1980 1985 1990 1995 2000 2005 2010 2015 2020 2025
Años

El modelo con el que se propone estimar los años 2022, 2027 y 2032, es

con el modelo de regresión exponencial.

𝑦 = 17531898𝑒 0.0147𝑥

Donde 2022 tomará el número de año (43), por la diferencia de 2 años

que existe entre el 2020. El año 2027 adquirirá el valor de (48) y el año 2032

tendrá el valor de (53).

Utilizamos la fórmula para la estimar la población en dichos años:

2022 = 17531898𝑒 0.0147(43)

2022 = 17531898𝑒 0.6321

𝟐𝟎𝟐𝟐 = 𝟑𝟐𝟗𝟖𝟕𝟐𝟕𝟖

2027 = 17531898𝑒 0.0147(48)

2027 = 17531898𝑒 0.7056

𝟐𝟎𝟐𝟕 = 𝟑𝟓𝟓𝟎𝟑𝟏𝟔𝟗
16

2032 = 17531898𝑒 0.0147(53)

2032 = 17531898𝑒 0.7791

𝟐𝟎𝟑𝟐 = 𝟑𝟖𝟐𝟏𝟎𝟗𝟒𝟒

Por lo tanto, la estimación que se tiene a través de la ecuación de

regresión exponencial es de 38210944 millones de habitantes aproximadamente

que el Perú tendrá en el año 2032. Si bien el modelo de regresión cuadrática es

la que más se ajusta a la dispersión de datos; el error absoluto y relativo son

mucho menos que el modelo de regresión exponencial, no se lo consideró para

estimar la población futura, porque este de modelo nos permite encontrar

parámetros de una parábola. Si notamos en la Figura 5, se puede visualizar que

la recta de regresión cuadrática tiene una pequeña concavidad hacia abajo. Por

lo tanto, se asume que habrá descendencia de valores si se calcula años futuros.

Conclusión

En esta investigación se obtuvieron los resultados exitosamente, y se

logró encontrar el modelo matemático que mejor se ajuste a la dispersión de

datos que inicialmente se graficó con los datos que obtuvimos del Instituto

Nacional de Estadística e Informática. A lo largo del todo el desarrollo de esta

investigación se puede notar que hicimos una comparación de dos modelos

matemáticos; regresión cuadrática y exponencial, llegando a la conclusión que

la regresión exponencial se ajustaba más a la dispersión de datos brindados por

el INEI, a pesar de que el modelo de regresión cuadrática tiene un error absoluto

mucho menos que el modelo de regresión exponencial. Al mismo tiempo, los

elementos y materiales tecnológicos nos permitieron que el proceso de esta


17

investigación sea más corto, también fue crucial al momento del cálculo para

obtener resultados más precisos.

Inicialmente, se pretendía trabajar con los datos censales brindados por

el INEI, pero al ser de intervalos muy diferentes entre años censales, y tener muy

pocos datos para llegar a cabo esta investigación, se optó trabajar con datos de

proyecciones poblacionales que la misma institución nos brinda, y se

seleccionaron los datos de 1980 a 2020 con un intervalo de 5 años de diferencia

cada uno de los datos. Agregar a ello, que una de las dificultades en está

exploración, fue el manejo de las herramientas tecnológicas, en este caso el

programa de Microsoft Excel.

Con estos datos se logró el objetivo de esta investigación. Los

procedimientos que se siguieron en esta investigación fueron pertinentes y

apropiados para que los resultados de estos sean válidos y tengan coherencia

para la estimación de la población. También hay que considerar que los

procedimientos de cálculo del error absoluto y relativo ayudaron a determinar

cuál de los modelos matemáticos tenía mejor ajuste en la dispersión de datos.


REFERENCIAS

Instituto Nacional de Estadísticas e Informáticas. (2019). Lima. Consultado el 5


de septiembre del 2022.
https://m.inei.gob.pe/media/principales_indicadores/libro_bol_esp_24_1.
pdf
Roldán, P. N. (3 de enero del 2019). Modelo matemático. Economipedia.
Consultado el 16 de septiembre de 2022.
https://economipedia.com/definiciones/modelo-matematico.html
Sánchez Alberca, A. (7 de octubre del 2021). Regresión. Aprende con Alf.
Consultado el 9 de octubre del 2022.
https://aprendeconalf.es/docencia/estadistica/manual/regresion/
Torres, F. (25 de diciembre del 2015). Pronóstico con Tendencia Exponencial.
Excel Free Blog. Consultado el 4 de octubre del 2022.
https://www.excelfreeblog.com/pronostico-con-tendencia-exponencial-
en-excel/
Westreicher, G. (8 de marzo del 2020). Estimación. Economipedia. Consultado
el 16 de septiembre del 2022.
https://economipedia.com/definiciones/estimacion.html

También podría gustarte