Está en la página 1de 18

Universidad Autónoma de Querétaro.

Facultad de Contaduría y Administración.

Licenciatura en Actuaría.

Semestre 2023-2.

MATERIA: Teoría del Seguro.


Docente: María del Consuelo Patricia Torres
Falcón.

Alumno: Angeles Vega Samuel.

Expediente: 283324.
Grupo: 17

Trabajo Final: Pronostico


Noviembre 2023

1
Contenido
Introducción ........................................................................................................................................ 3
Metodología. ....................................................................................................................................... 4
Regresión Lineal .............................................................................................................................. 6
Regresión Polinomial....................................................................................................................... 6
𝑅2 𝑂𝑏𝑡𝑒𝑛𝑖𝑑𝑎................................................................................................................................... 7
Modelo Polinomial .......................................................................................................................... 8
Resultados ........................................................................................................................................... 9
Conclusiones ..................................................................................................................................... 13
Referencias ........................................................................................................................................ 17

2
Introducción
La presente investigación se enfoca en desarrollar un modelo predictivo para
estimar el número de pólizas de seguros adquiridas en el Estado de Nuevo León.
Para ello, se empleará una metodología basada en la obtención de pronósticos a
partir de una extensa base de datos proporcionada por la Comisión Nacional de
Seguros y Fianzas, abarcando el periodo desde el año 2009 hasta el 2022.

Dada la naturaleza trimestral de los datos y la disponibilidad de información hasta


el año 2022, se plantea la tarea de proyectar las pólizas aseguradas para el año
2023. Este análisis se torna esencial para comprender y anticipar las dinámicas del
mercado de seguros en Nuevo León.

El enfoque metodológico seleccionado para este propósito implica la aplicación de


técnicas de Regresión Polinomial. Si bien se considera también la Regresión Lineal,
se llevará a cabo una evaluación detallada para determinar cuál de las dos técnicas
se ajusta mejor a la estructura de los datos.

La elección entre Regresión Lineal y Regresión Polinomial dependerá de la


complejidad subyacente en la relación entre las variables. Mientras que la Regresión
Lineal es preferible cuando la relación es lineal y directa, la Regresión Polinomial es
más adecuada para modelar relaciones no lineales y capturar patrones más
complejos.

En este documento, se detallarán los pasos necesarios para la obtención de este


modelo predictivo, brindando transparencia y rigor en el proceso de análisis y
permitiendo una comprensión clara de las decisiones metodológicas tomadas. A
través de esta investigación, se busca contribuir a una mejor comprensión de las
tendencias en la adquisición de pólizas de seguros en Nuevo León y proporcionar
herramientas predictivas valiosas para la toma de decisiones en el ámbito
asegurador.

3
Metodología.
La metodología consiste en obtener un pronóstico de las pólizas aseguradas a partir
de una base de datos obtenida de la comisión nacional de Seguros y Fianzas.
Enfocándose en un Estado en específico de nuestro país, en este caso, Nuevo
León.
Por el formato de la Comisión Nacional de Seguros y Fianzas, los formatos que
otorga es de forma trimestral, abarcando desde el año 2009 al 2022. Por ende, se
realizaría un pronóstico de pólizas adquirida para el año 2023.
El método que se utilizaría es: Regresión Polinomial, sin dejar a un lado una
pequeña comparación con la Regresión Lineal.
La elección entre Regresión Lineal y Regresión Polinomial dependería de la
estructura subyacente de los datos. Si hay una relación lineal clara, la regresión
lineal puede ser preferible debido a su simplicidad y menor riesgo de sobreajuste.
Sin embargo, los datos muestran una relación no lineal, la regresión polinomial
puede ser más apropiada para capturar la complejidad del fenómeno que se está
modelando.
Se muestra a detalle los pasos que se realizarían para poder obtener este modelo
en este siguiente diagrama:

4
5
Regresión Lineal
Es una técnica simple pero poderosa que busca modelar la relación entre una
variable independiente 𝑋 y una variable dependiente 𝑌 a través de una línea recta.
La forma general de la ecuación de regresión lineal es:
𝑌 = 𝑚𝑥 + 𝑏
En donde:
𝑚 = es la pendiente de la línea
𝑏 = es la intersección con el eje Y
El objetivo de la regresión lineal es encontrar los valores de 𝑚 y 𝑏 que minimizan
la suma de los cuadrados de las diferencias entre los valores observados de 𝑌 y
los predichos por la línea.
Para obtener la pendiente (𝑚) en el método de mínimos cuadrados es:

∑𝑛𝑖=𝑛(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅)


𝑚 =
∑𝑛𝑖=𝑛(𝑥𝑖 − 𝑥̅ )2

En donde:
𝑥̅ = es el Promedio de datos independientes.
𝑦̅ = es el Promedio de datos dependientes.

Y la fórmula para la intersección (𝑏)

𝑏 = 𝑦̅ − 𝑚𝑥̅

Regresión Polinomial
La regresión polinomial es una extensión de la regresión lineal que permite
modelar relaciones no lineales. En lugar de ajustarse a una línea, la regresión
polinomial utiliza una función polinómica de grado 𝑘.

𝑌 = 𝛽0 + 𝛽1 𝑋 + 𝛽2 𝑋 2 + ⋯ + 𝛽𝑘 𝑥 𝑘 + 𝜀

Donde:
𝛽0 , 𝛽1 , … , 𝛽𝑘 son coeficientes de polinomio.

6
𝜀 = error residual.
La obtención de los coeficientes en la regresión polinomial implica resolver un
sistema de ecuaciones, y puede hacerse mediante técnicas como la matriz de
Vandermonde o el método de mínimos cuadrados.
La regresión lineal es preferible cuando la relación entre las variables es
aproximadamente lineal, mientras que la regresión polinomial es útil cuando los
datos exhiben patrones no lineales. Sin embargo, es crucial tener en cuenta que la
regresión polinomial puede ser susceptible al sobreajuste, especialmente con
polinomios de alto grado.

𝑅2 𝑂𝑏𝑡𝑒𝑛𝑖𝑑𝑎

El coeficiente de determinación es una medida de la proporción de la varianza en


la variable dependiente que es predecible a partir de las variables independientes
en un modelo de regresión. En el contexto de la regresión polinomial, el 𝑅 2 se
utiliza para evaluar qué tan bien el modelo se ajusta a los datos.
El 𝑅 2 varía entre 0 y 1 y puede interpretarse como lo siguiente:
𝑅 2 = 0 El modelo no explica ninguna variabilidad en la variable dependiente.
𝑅 2 = 1 El modelo explica toda variabilidad en la variable dependiente
En nuestro caso, se optaría por un Modelo Polinomial grado 6 otorgando un
𝑅 2 = 0.90
Un 𝑅 2 de 0.90 indica que el modelo de regresión, en este caso, la regresión
polinomial, explica el 90% de la variabilidad total en la variable dependiente a
través de las variables independientes incluidas en el modelo. En otras palabras,
el 90% de la dispersión de los datos alrededor de la media de la variable
dependiente ha sido capturada y explicada por el modelo.
Esto refleja un:
 Alto Grado de explicación: Un 𝑅 2 de 0.90 sugiere que el modelo tiene un
alto grado de capacidad para explicar y predecir las variaciones en los
datos observados.

 Buen ajuste del modelo

 Poca variabilidad no explicada: Solo el 10% de la variabilidad total en la


variable dependiente no es explicada por el modelo.

7
 Buena capacidad predictiva: Se puede esperar que el modelo tenga una
buena capacidad predictiva, al menos dentro del rango de datos utilizados
para construir el modelo. Sin embargo, es importante tener precaución y
realizar validaciones adicionales, especialmente si el modelo se aplica a
nuevos datos fuera del rango de entrenamiento.

Modelo Polinomial

Con la modelación se obtendría la ecuación:

𝑦 = −16.985𝑥 6 + 675.99𝑥 5 − 9138.5𝑥 4 + 47828𝑥 3 − 81773𝑥 2 + 51885𝑥 + 2000000

Con la forma de gráfica:

Regresión Polinomial
2,500,000

2,000,000

1,500,000

1,000,000
y = -16.985x6 + 675.99x5 - 9138.5x4 + 47828x3 - 81773x2 + 51885x + 2E+06
R² = 0.9031
500,000

0
0 2 4 6 8 10 12 14 16

En donde podemos ver que el gráfico de dispersión muestra un comportamiento


tanto creciente (en algunos puntos) y decreciente en otros. En el eje de las x
muestra el año en el que se estaría analizando (enumerando 1=año 2009, 2=año
2010, hasta llegar al año 2022). En el eje de las y muestra la cantidad de pólizas
adquiridas.
Podemos observar que del año 2009 al año 2014 hay un incremento en el número
de pólizas adquiridas, arrancando con un promedio anual de 1,662,994 (año 2009)
hasta 2,167,463 (año 2014), y vemos un declive hasta el año 2016 con 1,296,410
teniendo un dato atípico de 1,552,618 para el año 2017 (atípico, pero puede
dejarse) Teniendo como punto más bajo el año 2019 con 967,069 y más alto el
último año que es el 2022 con 2,221,086.

8
Resultados

9
10
11
12
Conclusiones

13
14
15
16
Referencias

17
18

También podría gustarte