Está en la página 1de 6

Capítulo 8

Credibilidad
Howard C. Mahler y Curtis Gary Dean
Traducción: Fernández Orellana, Manuel Ignacio
1. Introducción
La teoría de la credibilidad brinda herramientas que nos permiten tratar con la aleatoriedad
de los datos que son utilizados para predecir ya sea sucesos futuros o costos. Por ejemplo, una
compañía de seguros utiliza la información pasada de un asegurado o grupo de asegurados para
estimar el costo de cobertura futura. Pero resulta que los siniestros surgen de eventos aleatorios.
El costo anual promedio en concepto de pago de siniestros en los últimos años recientes puede ser
una pobre estimación de los costos para el próximo año. La precisión esperada de esta estimación
es una función de la variabilidad en los montos de siniestros. Este dato por sí solo no es aceptable
a los fines de la tarificación.
Más que confiar únicamente en las observaciones recientes, pueden obtenerse mejores
estimaciones a partir de una combinación entre este dato con otro tipo de información. Por
ejemplo, supongamos que la experiencia reciente indica que a los carpinteros se les debería cobrar
una tarifa de $5 (por cada $100 de salario ) para seguros de riesgos de trabajo. Si la tarifa vigente
es de $10. ¿Cuál debería ser la nueva tarifa? Debería ser de $5, $10, o algún valor intermedio? La
teoría de la credibilidad se utiliza para ponderar adecuadamente y juntar estas dos estimaciones.
La fórmula básica para el cálculo de los estimadores ponderados de credibilidad es:
Estimación=Z [Observación]+(1-z) [Otra información]

Z se denomina la credibilidad asignada a cada observación. Nos referimos a 1-Z generalmente
como el complemento de la credibilidad. Si el volumen de datos observados es grande y
difícilmente varía demasiado de un período a otro, entonces Z será cercano a la unidad. Por otro
lado, si la observación consiste en unos pocos datos, entonces Z estará cerca de cero y un mayor
peso se le otorgará a la otra información.

La tarifa vigente de $10 en el ejemplo de arriba es la “Otra información”. Representa una


estimación o una hipótesis previa de la tarifa a cargar en ausencia de la información de la
experiencia reciente. En caso de sí estar disponible la información reciente, entonces estamos en
condiciones de calcular una estimación actualizada, combinando la información reciente con la
hipótesis previa. Al respecto, el uso de la credibilidad implica una estimación lineal de la
veradera expectativa y surge como resultado de un compromiso entre la observación y la hipótesis
a priori. La tarifa para carpinteros de seguros de riesgos de trabajo es de Z$5+(1-Z)$10 en este
modelo.

Página 1 de 6
El siguiente es un ejemplo que muestra cómo la credibilidad nos puede ayudar a realizar mejores
estimaciones:
Ejemplo 1.1: En una población grande de conductores de automóviles, el conductor promedio
tiene un accidente cada cinco años o, equivalentemente, la frecuencia anual es de .20 accidentes
por año. Un conductor seleccionado al azar de la población tuvo tres accidentes a lo largo de los
últimos cinco años, resultando en una frecuencia de .60 accidentes por año. ¿Cuál es la
estimación suya de la frecuencia esperada futura para este conductor? ¿Es .20, .60 o algún valor
en el medio?
[Solución: Si no contáramos con otra información además de que el conductor provino de la
población, estaríamos inclinados a elegir .20. Sin embargo, efectivamente sabemos que la
frecuencia observada del conductor fue de 0.60. ¿Debería esta ser nuestra estimación para la
frecuencia de accidentes futura? Probablemente no. Existe cierta correlación entre la frecuencia
de accidentes anteriores y la frecuencia de accidentes futuros, pero no están perfectamente
correlacionados. Los accidentes ocurren al azar e incluso los buenos conductores con una
frecuencia de accidentes esperada baja también tendrán accidentes. Por el otro lado, pueden
transcurrir muchos años sin que un mal conductor experimente un accidente. Una mejor
respuesta que .20 o bien .60 probablemente sea un valor intermedio: la frecuencia de accidentes
futura esperada del conductor= Z .60 + (1-Z) .20

La clave para terminar de encontrar la solución para este ejemplo sería el cálculo de Z.
¿Cuánta credibilidad se le debería asignar a la información acerca del conductor? Las siguientes
dos secciones se ocupan del cálculo de Z.

En primer lugar, en la sección 2 se tratará el modelo de credibilidad clásico, también conocido


como credibilidad de fluctuaciones limitadas porque pretende limitar el efecto que las
fluctuaciones aleatorias en las observaciones tendrán sobre las estimaciones efectuadas. El factor
de credibilidad Z es una función de la varianza esperada de las observaciones versus la varianza
máxima tolerada en el primer término de la fórmula de credibilidad, Zx[observación].
A continuación se desarrolla el enfoque de credibilidad de Bülhmann en la sección 3. A este
modelo se lo conoce como credibilidad de mínimos cuadrados. La idea con este enfoque consiste
en la minimización del error cuadrático entre la estimación y el verdadero valor esperado de la
cantidad a ser estimada.
La teoría de la credibilidad depende de la disponibilidad de datos a priori o información
colateral que pueda ser ponderada con las observaciones recientes. Otra forma de combinar las
observaciones recientes con la información previa para realizar una mejor estimación, es el
análisis Bayesiano. El fundamento de este análisis es el Teorema de Bayes. Aquello se tratará en
la sección 4. Resulta que las estimaciones de credibilidad de Bülhmann son el mejor ajuste lineal

Página 2 de 6
por mínimos cuadrados de los estimadores Bayesianos. Por esta misma razón a la credibilidad de
Bülhmann también se la conoce como credibilidad Bayesiana.
En algunas situaciones las fórmulas resultantes del análisis Bayesiano coinciden exactamente
con aquellos surgidos a partir de la estimación de credibilidad de Bülhmann; esto es, el estimador
Bayesiano es una ponderación lineal entre la información reciente y previa, con pesos Z y (1-Z)
donde Z es el factor de credibilidad de Bülhmann. En la sección 5 esto se demuestra en el caso
especial del proceso de frecuencia Gamma- Poisson.
La última sección discute ciertos temas prácticos a la hora de aplicar la teoría de la
credibilidad, incluyendo algunos ejemplos de cómo calcular los parámetros de credibilidad.
Los apéndices incluyen algunas consideraciones acerca de las distribuciones de frecuencia e
intensidad, así como las soluciones de los ejercicios.

2. Credibilidad Clásica
2.1 Introducción
En el enfoque de Credibilidad Clásica, uno lo que determina es cuántos datos uno necesita
para asignarles un 100% de credibilidad. Esta cantidad de datos se denomina criterio de
credibilidad total o estándar para credibilidad total. Si uno dispone de esta cantidad de
datos o más, entonces Z=1.00; si uno observa menos que esta cantidad de datos entonces
0 ≤ Z<1.
Por ejemplo, si observáramos 1,000 carpinteros que trabajan full-time, entonces uno le
asignaría una credibilidad del 100% a sus datos. 1 Entonces si observáramos 2,000 carpinteros full-
time también en ese caso les asignaríamos un 100% de credibilidad. A 100 trabajadores se le
podría asignar un 32% de credibilidad. En este caso, a la observación se le ha asignado una
credibilidad parcial, es decir, menos que la credibilidad total. El tema de las próximas
secciones consiste justamente en cómo determinar el nivel de credibilidad que se le debe asignar a
distintos volúmenes de datos.
Existen cuatro conceptos básicos que trataremos en Credibilidad Clásica:
1. Cómo determinar el criterio de credibilidad total cuando estimamos frecuencias
2. Cómo determinar el criterio de credibilidad total cuando estimamos intensidades
3. Cómo determinar el criterio de credibilidad total cuando estimamos primas puras (costos
siniestrales)
4. Cómo determinar el valor de credibilidad parcial a ser asignado cuando uno dispone de
una cantidad menor de datos respecto a la necesaria para credibilidad total.

1
Para riesgos de trabajo esos datos consistirían en monto de siniestros y monto de salarios medidos en dólares.
Página 3 de 6
Ejemplo 2.1.1: La frecuencia siniestral observada es de 120. La credibilidad que se le otorga a este
dato es 25%. El complemento de la credibilidad se le aplica a la estimación previa de 200. ¿Cuál
es la nueva estimación de la frecuencia siniestral?
[Solución: 0.25 B120 + 1 @ 0.25 B200 = 180 ]
` a

2.2 Credibilidad Total para la Frecuencia


Supongamos que modelamos a la frecuencia siniestral mediante un proceso Poisson, con un
promedio de 500 siniestros anuales. Entonces, ocurrirá que el número observado de reclamos
variará de un año a otro entorno a la media de 500. Esta distribución de Poisson puede ser
aproximada mediante una Distribución Normal con una media de 500 y una varianza de 500.
La aproximación Normal puede ser utilizada para estimar cuán apartados de la media se
encuentran los resultados observados. Por ejemplo, ¿cuán seguido uno espera observar más de
ww
w
w
w
ww
w
w
w
ww
w
w
w
ww
500 reclamos? El desvío estándar es de p500 = 22.36. Entonces 550 reclamos se corresponde más
o menos con 50/22.36=2.24 desvíos estándar más grandes respecto a la media. Como
Φ 2.24 = 0.9875 , existe aproximadamente un 1.25% de probabilidad de observar más de 550
` a

siniestros. 2
Por lo tanto, existe un 1.25% de probabilidad de que el número observado de siniestros exceda
el número esperado de siniestros en un 10% o más. De forma análoga, la probabilidad de observar
menos de 450 siniestros es aproximadamente 1.25%. Por lo que la probabilidad de observar un
número de reclamos que se encuentre por fuera del rango -10% por debajo hasta 10% por encima
del número de siniestros medio es de aproximadamente 2.5%. En otras palabras, la probabilidad
de observar un F 10% respecto del número esperado de siniestros es de 97.5% en este caso.

En forma general, uno puede escribir esto algebraicamente. La probabilidad P de que una
observación X esté dentro de un F k de la media μ es:

La última expresión se deduce a partir de sustraer miembro a miembro por μ y luego dividiendo
X
f
f
ff
f
f@
f
f
ff
f
ff
f

f
f
ff
f
ff
por el desvío estándar σ. Asumiendo la aproximación normal, la cantidad u= está
σ
normalmente distribuida. Para una distribución Poisson con un valor esperado de siniestros n,
w
w
w
ww
tenemos μ =n y σ = pn . La probabilidad de que el número de siniestros observados N se
encuentre dentro de un F k% del valor esperado μ = n es:

En términos de la función de distribución acumulada de la normal unitaria, Φ u :


` a

2
Para ser más precisos, en realidad la probabilidad debería ser calculada contemplando un factor de corrección por
continuidad. La probabilidad de ocurrencia de más de 550 siniestros es aproximadamente
h i
550.5
ff
f
ff
f
ff
f
ff
f
ff
f
ff
f
f@
f
f
ff
f
ff
f
f500
f
f
ff
f
ff
f
ff
f
ff
f
ff
1 @ Φj p w k= 1 @ Φ 2.258 = 1 @ 0.9880 = 1.20%
` a
w
ww
w
ww
w
ww
w
ww
w
w
500
Página 4 de 6
Por lo tanto, para la aproximación normal a la Poisson:

O equivalentemente:

Ejemplo 2.2.1: Si el número de siniestros se comporta como una distribución Poisson, hallar la
probabilidad de encontrarse en un F 5% de una media de 100 siniestros usando la aproximación
normal de la Poisson.

La siguiente es una tabla que muestra los valores de P correspondientes a valores de k=10%, 5%,
2.5%,1%, y 0.5%, y para 10, 50, 100, 500, 1000, 5000, y 10000 reclamos:

(Título : probabilidad de estar en un rango de +-k% de la media)


1º columna: número de siniestros esperados
Procediendo a la inversa, dados los valores de P y k, entonces uno está en condiciones de hallar
el número esperado de siniestros n 0 tal que la probabilidad de estar en un +-k% de la media sea
de P. Este n 0 puede ser calculado a partir de la fórmula . Sea y tal que
1f
f
f+f
f
f
ff
ff
fP
f
f
ff
f
ff
f
f
Φ y = . Entonces dado P, y se halla a partir de la tabla de la distribución normal.
` a
2
c2
w
ww
w
w
ww
w
w
w
Despejando a n 0 a partir de la relación k pn 0 = y surge que n0 = k / y . Si el objetivo es
b

encontrarse en un +-k% de la frecuencia media con una probabilidad de al menos P, entonces se


tiene que la estándar para credibilidad total es

donde y es tal que

A continuación se presentan valores de y tomados de una tabla de distribución normal


correspondientes a ciertos valores seleccionados de P:

Página 5 de 6
Página 6 de 6

También podría gustarte