Estadística Bayesiana y Riesgos
Manuel Mendoza Ramírez
Instituto Tecnológico Autónomo de México
Seminario Aleatorio. Contribuciones Recientes de la Estadística a la Actuaría en México.
ITAM. México, D.F. Noviembre 23, 2007.
Estadística Bayesiana y Solvencia
Manuel Mendoza Ramírez
Instituto Tecnológico Autónomo de México
Seminario Aleatorio. Contribuciones Recientes de la Estadística a la Actuaría en México.
ITAM. México, D.F. Noviembre 23, 2007.
Contenido
Introducción
Condición de solvencia
Formulación estadística
Alternativa Bayesiana
Ejemplos
Consideraciones finales
Introducción
Actuaría y Riesgos Financieros
La incertidumbre está implícita y es inevitable en el origen de las Ciencias
Actuariales
Una parte de la Actuaría se ocupa del estudio de los fenómenos (aleatorios)
que pueden producir las llamadas pérdidas contingentes
La información disponible se utiliza para pronosticar el comportamiento futuro
de las pérdidas
Introducción
Modelos
Una componente fundamental es la distribución de pérdidas
Pérdida Esperada
0
-4 -2 0 2 4
Introducción
Modelos
Una componente fundamental es la distribución de pérdidas
Pérdida Esperada
0
-4 -2 0 2 4
Introducción
Supuestos
En forma natural se incorporan supuestos en el proceso de modelado. Por
ejemplo, la hipótesis de independencia entre frecuencia y severidad de las
pérdidas
0.0 0.0
-3 -3
Frecuencia Severidad
Introducción
Supuestos
En forma natural se incorporan supuestos en el proceso de modelado. Por
ejemplo, la hipótesis de independencia entre frecuencia y severidad de las
pérdidas
L=SF E(L ) = E(S) E(F)
Solvencia
Pérdidas Extremas
Un análisis estadístico debe incluir una descripción completa de la distribución
de interés. En Actuaría, en particular, es conveniente describir las pérdidas
extremas
Siniestralidad
Extrema
0
-4 -2 0 2 4
Solvencia
Pérdidas Extremas
Para las agencias reguladoras es importante establecer un margen de
solvencia.
Margen
de
Solvencia
0
-4 -2 0 2 4
Solvencia
Pérdidas Extremas
Para las agencias reguladoras es importante establecer un margen de
solvencia.
E(L)
Cuantil (1-a)
0
-4 -2 0 2 4
Solvencia
Condición de Solvencia
Un sistema de seguros es solvente si cuenta con recursos suficientes para
hacer frente a sus obligaciones.
Un sistema es (1 – a )-solvente si cuenta con recursos para hacer frente a sus
obligaciones con probabilidad 1 - a.
E(L)
a
0
-4 -2 0 2 4
Formulación Estadística
Dos series históricas:
• X1, X2, ... , XT (primas)
• Y1, Y2, ... , YT (reclamaciones)
Objetivo:
• Determinar el valor q1,T 1 tal que P( YT 1 q1,a 1 ) a
Y
a
YT
Formulación Estadística
La serie de siniestralidad relativa
Yi
• W1, W2, ... , WT donde Wi ( i = 1,...,T )
Xi
• W1, W2, ... , WT se suelen considerar i.i.d. (estabilidad)
• El interés se concentra en el valor q1a tal que
W
P( W q1a ) a
W
Formulación Estadística
Entonces, para la siguiente observación,
YT 1
• P( WT 1 q1a ) a
W P( q1a ) a
W
X T 1
De manera que
• P( YT 1 (q1a )( XT 1 )) a
W q1,a 1 (q1a )( XT 1 )
YT W
Formulación Estadística
Datos históricos
180% 180%
Accidentes y enfermedades Agrícola y animales
150% 150%
120% 120%
90% 90%
60% 60%
30% 30%
0% 0%
1980 1985 1990 1995 2000 1970 1975 1980 1985 1990 1995 2000
Formulación Estadística
Datos históricos
180% 180%
Automóviles Responsabilidad Civil
150% 150%
120% 120%
90% 90%
60% 60%
30% 30%
0% 0%
1970 1975 1980 1985 1990 1995 2000 1970 1975 1980 1985 1990 1995 2000
Formulación Estadística
Datos históricos
180% 180%
Marítimo y transportes Incendio
150% 150%
120% 120%
90% 90%
60% 60%
30% 30%
0% 0%
1970 1975 1980 1985 1990 1995 2000 1970 1975 1980 1985 1990 1995 2000
Formulación Estadística
Distribución para W
Problema estadístico
• Estimar los cuantiles de la distribución de W
Normalidad como primera aproximación
• El cálculo es extremadamente simple ( q1a W z(1a ) W )
W ˆ ˆ
• Los datos históricos no son compatibles con el supuesto
Formulación Estadística
Distribución para W
Aproximar la densidad de W con mezclas de normales
T
f (w ) 1
T N( w | w ,
i1
i
2
)
w1,...,wT valores observados; 2 se determina con un criterio de ajuste.
Formulación Estadística
0.08 Distribución para W
Accidentes y
enfermedades
0.06
0.04
0.02
0.00
40 60 80 100
Formulación Estadística
0.05 Distribución para W
Automóviles
0.04
0.03
0.02
0.01
0.00
40 60 80 100 120 140 160
Formulación Estadística
Distribución para W
La mezcla captura el patrón de asimetría
No incorpora el efecto de estimación de los parámetros
Formulación Estadística
Modelo Condicional
En cada periodo de tiempo: ( i = 1,.... )
Xi = primas emitidas
Wi = tasa de siniestralidad relativa
Yi = siniestralidad
Formulación Estadística
Distribución para W
{ X1, X2, .... } una serie de observaciones correlacionadas
{ W1, W2, .... } realizaciones i.i.d. de un modelo P(W | f)
{ Y1, Y2, .... } debe su aleatoriedad a { Xi }, { Wi } y son
correlacionadas como resultado de la correlación en { Xi }
Formulación Estadística
Distribución para W
La distribución de YT+1, dado XT+1 = x, está totalmente
determinada por la de WT+1.
Basta entonces
• Asignar una distribución P( WT+1 | f )
• Estimar el cuantil de interés para W
• Estimar del cuantil condicional de YT+1
Alternativa Bayesiana
Características Generales
Fundado sobre una base axiomática
Inferencia problema de decisión
Proceso de aprendizaje basado en la fórmula de Bayes
Final Verosimilitud Inicial
Alternativa Bayesiana
Características Generales
Fórmula de Bayes
p( | datos ) p( datos | ) p( )
Mecanismo general para la producción de pronósticos
Distribución Predictiva
p( X | datos ) = p( X | ) p( | datos ) d
Alternativa Bayesiana
Análisis Predictivo
Dado XT+1 = x, el comportamiento de YT+1, está determinado
por WT+1 :
Algoritmo, si se adopta un modelo P( WT+1 | f )
• Asignar una inicial para f y combinarla con la información
histórica para obtener la final para f,
• Determinar la distribución predictiva para WT+1
• Calcular el cuantil predictivo condicional para YT+1, dado XT+1
Alternativa Bayesiana
Distribución para W
La selección del modelo P( W | f ) constituye un reto
interesante.
La Normal no es, en general, una buena elección.
(Asimetría, valores positivos)
Una mezcla de Normales también presenta inconvenientes.
Alternativa Bayesiana
Distribución para W
Una posibilidad es suponer que una transformación de W
es Normal.
(Transformación de Box-Cox)
La introducción de da lugar a otro problema de decisión
(la selección de un valor concreto para ).
Alternativa Bayesiana
Distribución para W
Con propósitos de ilustración
Yi Wi Xi ln(Yi ) ln(Wi ) ln( Xi )
Vi Ui c i
Vi ln(Yi ) , Ui ln(Wi ) , c i ln( Xi )
Alternativa Bayesiana
Distribución para W
En particular, VT 1 UT1 c T1
Dado un valor fijo de XT+1 (cT+1 constante),
predictiva para UT+1 predictiva para VT+1
predictiva para YT+1
Alternativa Bayesiana
El problema en estos términos es muy simple
• Datos: D = { U1, U2, ..., UT } i.i.d. N(,) (-1 = 2 )
• f = (, ); Distribución inicial de referencia: P(, ) -1
Distribución Final: P( , | D ) = Normal - Gamma
Distribución Predictiva Final: P( UT+1 | D ) = Student
Alternativa Bayesiana
Análisis Predictivo
• Predictiva Final: P( UT+1 | D ) = Student , UT+1 = ln(WT+1)
VT+1 = UT+1 + cT+1, cT+1 = ln(XT+1)
(dado XT+1)
• Predictiva Final: P( VT+1 | D ) = Student , VT+1 = ln(YT+1)
• Predictiva Final: P( YT+1 | D ) = log - Student
Alternativa Bayesiana
Análisis Predictivo
El cuantil de orden (1-a) de la distribución predictiva de YT+1, dado XT+1,
resulta:
T 1/ T
w i exp( t (1--1α ) [(1 1 / T) SU ] 1 / 2 )
~2
Y(1 - α )
T 1 XT 1 T
i 1
donde
~2
t (1--1a ) es el cuantil de una Student con T-1 g. de l. y SU
T
1
T 1 (ui u)
2
Alternativa Bayesiana
El supuesto de independencia
Una alternativa al supuesto de independencia es un modelo auto regresivo
estacionario de primer orden:
Para i = 1:
U1 ~ N ( , )
mientras que para i = 2,..., T+1:
U i | U i - 1 ~ N ( ( U i - 1 ), / ( 1 2 ) )
Alternativa Bayesiana
El supuesto de independencia
El modelo es estacionario
Ui ~ N( , ) para i = 1, 2,..., T+1
La distribución conjunta de U1, U2, ..., UT+1 está determinada por los
parámetros , y . El modelo de independencia se recupera con = 0.
U i | U i - 1 ~ N ( ( U i - 1 ), / ( 1 2 ) )
Alternativa Bayesiana
Modelo correlación común
El modelo requiere la especificación de una distribución inicial para los tres
parámetros , y .
A partir del algoritmo propuesto por Berger & Bernardo (1992) se
determinó la distribución inicial de referencia para la parametrización
ordenada { }, { }, { } (invariante ante permutaciones).
( 1 2 ) 1 / 2
P( , , ) -1
( 1 2 )
Alternativa Bayesiana
Modelo correlación común
La distribución final de , y no tiene una expresión analítica completa.
El efecto se reproduce para la distribución predictiva de UT+1.
Simulación (Gibbs Sampler y Metropolis -Hastings)
Alternativa Bayesiana
Modelo correlaciones diferentes
El modelo se puede generalizar
Para i = 1:
U1 ~ N ( , )
mientras que para i = 2,..., T+1:
U i | U i - 1 ~ N ( i 1 ( U i - 1 ), / ( 1 i2 1) )
Alternativa Bayesiana
Modelo correlaciones diferentes
El modelo, para las T+1 observaciones, involucra a los parámetros , ,
1, 2, ..., T. Para eliminar problemas de estimabilidad se introduce una
estructura parcialmente jerárquica
T
P( μ , τ, ρ 1,..., ρ T | θ) τ -1
P( ρ
i 1
i |θ )
en donde
θ
P( ρ i | θ ) θ
( 1 ρ i ) θ 1 ; -1 < i < 1
2
y, por simplicidad, P( θ | ) exp(- θ) ; θ0
Alternativa Bayesiana
Modelo correlaciones diferentes
De nuevo, la distribución final para , , 1, ..., T no tiene una expresión
analítica completa.
Asimismo, el efecto se reproduce para la distribución predictiva de UT+1.
Simulación (Gibbs Sampler y Metropolis -Hastings)
Mendoza, M. y Nieto-Barajas, L. E. (2006). Bayesian Solvency analysis with auto correlated observations.
Applied Stochastic Models in Business and Industry, 22, 169-180.
Alternativa Bayesiana
Propósito del modelado
Una distribución más flexible y general que la Normal
Posibilidad de incorporar patrones de dependencia
Empleo de una herramienta de pronóstico general
Procedimientos más robustos
para el cálculo de los factores
Ejemplos
Severidad
relativa
180%
Automóviles
150%
120%
90%
60%
30%
0%
1970 1975 1980 1985 1990 1995 2000
Año
Ejemplos
Ejemplos
Severidad
relativa
180%
Automóviles
150%
Cuantiles 95%
120%
Independencia
90%
60%
30%
0%
1970 1975 1980 1985 1990 1995 2000
Año
Ejemplos
Ejemplos
Severidad
relativa
180%
Automóviles
150%
120% Cuantiles 95%
Independencia
90% común
60%
30%
0%
1970 1975 1980 1985 1990 1995 2000
Año
Ejemplos
Ejemplos
Severidad
relativa
180%
Automóviles
150%
Cuantiles 95%
120%
Independencia
90%
común
distintas
60%
30%
0%
1970 1975 1980 1985 1990 1995 2000
Año
Ejemplos
Ejemplos
Siniestralidad 180%
Relativa
Accidentes y enfermedades
150%
120%
90%
60%
30%
0%
1980 1985 1990 1995 2000
Año
Ejemplos
Ejemplos
Siniestralidad 180%
Relativa
Accidentes y enfermedades
150%
120% Cuantiles 95%
Independencia
90%
60%
30%
0%
1980 1985 1990 1995 2000
Año
Ejemplos
Ejemplos
Siniestralidad 180%
Relativa
Accidentes y enfermedades
150%
120% Cuantiles 95%
Independencia
90% común
60%
30%
0%
1980 1985 1990 1995 2000
Año
Ejemplos
Ejemplos
Siniestralidad 180%
Relativa
Accidentes y enfermedades
150%
120% Cuantiles 95%
Independencia
90% común
distintas
60%
30%
0%
1980 1985 1990 1995 2000
Año
Ejemplos
Consideraciones finales
El valor del factor modifica si se cambia el modelo
El modelo se debe seleccionar por su capacidad predictiva
El análisis hace patente el riesgo de modelo
Los modelos se deben evaluar periódicamente
Es conveniente considerar modelos alternativos