Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2. METODOLOGÍA Y ACLARACIONES.
La metodología que se usó para poder hacer este estudio estadístico fue hacer un modelo lineal, un modelo
polinomial en este caso cuadrático debido a la poca cantidad de datos que se brindaron, un modelo
logarítmico y, por último, un modelo exponencial. Se hicieron estos cuatro modelos para cada población con
el fin de poder comparar cada uno de ellos para así seleccionar el modelo que mejor describa la población
de cada municipio en función del tiempo.
Antes de hacer los análisis para cada uno de los municipios es importante aclarar dos temas. El primero es
que para el estudio estadístico hecho solo se tuvieron en cuenta cuatro datos, lo que índica que al tener tan
pocos datos acerca de la población de los municipios el estudio no es muy bueno. Como segundo tema, se
va a dejar claro ciertos conceptos estadísticos y a su vez las funciones empleadas en el programa “R” para
poder saber que modelo es el que mejor se ajusta y sus justificaciones.
3. CONCEPTOS.
3.4. Función lm en R.
s=
√ ∑ ( y i− ^yi ) 2 .
i=1
n−2
Es importante saber que procedimiento utiliza el programa R para poder calcular los coeficientes de
cada uno de los modelos regresión. Para esto, el programa tiene una función llamada “lm” la cual
aplica el método de mínimos cuadrados para modelos lineales. Los modelos logarítmicos,
exponenciales y potenciales al poder linealizarse, R podrá calcular sus coeficientes sin problema
alguno. Es importante tener en cuenta que se tiene que ingresar los datos en la función “lm” de forma
lineal.
Ya aclarando los conceptos se procederá hacer el análisis estadístico para cada uno de los municipios.
4. ANAPOIMA.
Inicialmente, se hizo un gráfico de dispersión para dar la idea de lo que podría suceder con la población
de Anapoima en función del tiempo. El gráfico se muestra a continuación.
Con el gráfico de dispersión podemos observar que los datos tienen una tendencia lineal, por lo cual, no
damos una idea de que uno de los modelos que mejor se ajuste para el municipio de Anapoima sea un
modelo lineal o logarítmico.
Para poder definir que modelo es mejor, se aplica la metodología mencionada anteriormente y la
información la adjuntamos en unas tabas. Las tablas de resultados de todos los modelos se
muestran a continuación.
MODELO LINEAL
MODELO LINEAL
MODELO LOGARÍTMICO
MODELO EXPONENCIAL
β1
0,0319 0,06 (-0,00364 ; 0,0674)
MODELO EXPONENCIAL
Al ver los resultados en las tablas, lo que se había dicho por el gráfico de dispersión era cierto. Se puede
observar que los modelo con mejores resultados son el logarítmico y el lineal, también ambos modelos
cuentan con el error estándar de estimación más bajos y que sus coeficientes de determinación son los más
altos son, es decir, con menos error y con una explicación de varianza más alto. Pero para poder elegir uno,
nos fijamos en las más mínimas diferencias y es que el modelo logarítmico cuenta por muy poco con
mejores características, por lo tanto, el modelo que mejor describe a la población de Anapoima en función
del tiempo es el modelo logarítmico. A continuación, se mostrará una tabla de como están definidos todos
los modelos.
MODELOS ANAPOIMA
Como último, para el análisis del municipio de Anapoima se presentará un gráfico del modelo que mejor se
ajusta a describir la población del municipio de Anapoima comparado con los datos de la población en
función del tiempo. Esto con el fin de poder tener claridad en que tanto se acerca el modelo a los datos
reales. A continuación, se mostrará el gráfico del modelo logarítmico del municipio de Anapoima.
Observando el gráfico del modelo logarítmico comparado con los datos reales de la población, se puede
observar que el modelo logarítmico es un modelo que explica de buena manera a la población en función
del tiempo del municipio de Anapoima. El modelo puede tener sus errores a comparación de los datos reales
pero estos errores no son muy altos.
5. Ricaurte.
Al igual que en municipio de Anapoima para Ricaurte se hará un gráfico de dispersión, este con el fin de
poder darnos una idea de que tipo de tendencia podría llevar. A continuación, se presentará el grafico
de dispersión del municipio de Ricaurte.
En este gráfico de dispersión de la población del municipio de Ricaurte en el tiempo muestra que hay cierta
curvatura, lo cual significa que de momento la idea que se puede dar es que el modelo que mejor se adapte
sea el exponencial. Para poder dar un veredicto se mostrarán las tablas con los resultados de cada modelo.
MODELO LINEAL
βCOEFICIENTE
0
VALOR COEFICIENTE PRUEBA DE HIPÓTESIS INTERVALO DE CONFIANZA
914,10 0,135 (-701,22 ; 2529,41)
β1
143,39 0,0172 (61,40 ; 225,36)
MODELO LINEAL
MODELO LOGARÍTMICO
COEFICIENTE
β VALOR COEFICIENTE PRUEBA DE HIPÓTESIS INTERVALO DE CONFIANZA
0
-2177491 0,0177 (-3440068 ; -914914,1)
β1
286882 0,0176 (120775,5 ; 452988,4)
MODELO LOGARÍTMICO
MODELO EXPONENCIAL
β0
COEFICIENTE VALOR COEFICIENTE PRUEBA DE HIPÓTESIS INTERVALO DE CONFIANZA
1263,478 4,05E-05 (1039,012 ; 1536,431)
β1
0,04739 0,0023 (0,0374 ; 0,0573)
MODELO EXPONENCIAL
Al analizar los resultados contenidos en la tabla se observa que los mejores resultados están en el modelo
exponencial, ya que su coeficiente de determinación es de 0,9953, esto quiere decir que el modelo
exponencial explica un 99,53% de la varianza a comparación de otros como el lineal y el logarítmico que no
pasan del 96%. Otros puntos a favor del modelo exponencial es que la desviación estándar de los residuales
es muy baja a comparación de los otros dos modelos, esto quiere decir que en promedio hay menos error de
predicción y sus coeficientes de determinación son significativos, esto se comprobó con prueba de hipótesis
e intervalos de confianza. Como conclusión se llega que el modelo que mejor explica a la población de
Ricaurte en función del tiempo es el modelo exponencial. A continuación, se muestra la tabla con todos los
modelos.
MODELOS RICAURTE
Y =914,10+143,39
MODELOx LINEAL
Y =−2177491+
MODELO286882 ln x
LOGARÍTMICO
× e0,04739
MODELO
Y =1263,478 x
EXPONENCIAL
Al igual que con el municipio de Anapoima, como último se procederá a mostrar el gráfico del modelo que
mejor se ajusta a los datos reales comparado con los datos reales, esto con el fin de poder justificar que es
un buen modelo y que tanto se acerca a los datos reales. A continuación, se mostrará el gráfico.
Como se dijo anteriormente, el modelo que mejor se ajustaba a los datos reales era el modelo exponencial,
en este punto se logra observar una muy buena precisión ya que este modelo se acerca mucho a los puntos,
los cuales representan los datos reales. Con esto podemos aclarar y justificar que el modelo exponencial es
un buen modelo para describir a la población de Ricaurte en función de los años.
6. La mesa.
Al igual que con los dos municipios anteriores, haremos un gráfico de dispersión con el fin de saber con
anticipación o poder darnos una idea de que tipo de tendencia sigue la población del municipio de la Mesa
en función del tiempo. A continuación, se mostrará el gráfico de dispersión.
Al observar el gráfico de dispersión del municipio de La Mesa, observamos cierta similitud con el gráfico del
municipio de Anapoima, esto quiere decir que de momento se espera que existan dos modelos que
describan bien la población en función del tiempo de este municipio sean el lineal y el logarítmico. A
continuación, se mostrarán las tablas con los resultados de cada modelo.
MODELO LINEAL
MODELO LINEAL
COEFICIENTE DE DETERMINACIÓN ERROR ESTÁNDAR DE ESTIMACIÓN
0,9745 959,1
MODELO LOGARÍTMICO
βCOEFICIENTE
0
VALOR COEFICIENTE PRUEBA DE HIPÓTESIS INTERVALO DE CONFIANZA
-5100859 0,0127 (-7600650 ; -2601067)
β1
672573 0,0127 (343697 ; 1001449)
MODELO LOGARÍTMICO
MODELO EXPONENCIAL
COEFICIENTE
β VALOR COEFICIENTE PRUEBA DE HIPÓTESIS INTERVALO DE CONFIANZA
0
6594,162059 1,00E-04 (4425,18 ; 9826,25)
β1
0,030838 0,022 (0,010 ; 0,051)
MODELO EXPONENCIAL
MODELOS LA MESA
Y =6252,41+335,96 x
MODELO LINEAL
Y =−5100859+ 672573 ln x
MODELO
LOGARÍTMICO
MODELO EXPONENCIAL Y =6594,162059× e0,030838 x
Al igual que con los dos anteriores municipios, como último se mostrará un gráfico el cual representa como
se comporta el modelo que mejor se ajusta a describir la población de La Mesa que en este caso es el
modelo logarítmico, comparado con los datos reales. Esto con el fin de poder justificar de que es un buen
modelo y que tanto se acerca a los datos reales. A continuación, se mostrará el gráfico.
Analizando en gráfico se logra observar que no hay errores tan grandes entre los datos reales comparado
con los del modelo, esto ratifica que el modelo logarítmico tiene un coeficiente de determinación alto y un
error de estimación estándar bajo. Con este gráfico, podemos justificar que el modelo logarítmico es un
buen modelo para poder describir a la población del municipio de La Mesa en función del tiempo.