Modelos predictivos en sector asegurador
Por Nicole Moriano
Física matemática Estudios: Física, Illinois Institute of Technology | Maestría en Ciencias Actuariales, Escuela Colombiana de Ingeniería Julio Garavito. (En curso)
Desde hace ya varios años, en actuaría se han utilizado los modelos lineales generalizados (GLM, por sus siglas en inglés) como los métodos predictivos para la estimación de frecuencia, severidad y prima pura en el sector asegurador. Recientemente, con el auge del big data y el machine learning han surgido alternativas para la realización de estos cálculos. Sin embargo, a pesar del auge de la aplicación de estos procesos en diversos modelos, no existen aún suficientes artículos académicos que se enfoquen en la comparación de la precisión entre los modelos. (Society of Actuaries, 2019)
Aunque la existencia de nuevas tecnologías es una motivación para encontrar aplicaciones interesantes en el sector asegurador, las limitaciones de los GLM también han impulsado dicha exploración. Algunas de las críticas a los GLM radican en que este asume credibilidad total, las predicciones del modelo dependen de la mezcla de factores para determinar la puntuación de los datos y en que la función de enlace puede agregar sesgo al modelo. Sin embargo, a pesar de sus limitaciones el GLM ha generado resultados confiables y es utilizado actualmente como el estándar de oro en el sector.
En el sector automóviles, por ejemplo, el cálculo de la prima proyectada al próximo año, ajustada de acuerdo con el histórico de reclamaciones en el año anterior, para el ramo de daños a terceros se realiza teniendo en cuenta la clasificación del riesgo. Esta clasificación del riesgo se basa en una indicación de relatividad generada a partir de un sistema de puntuaciones, bonus malus system. (Jae Youn, Cheung, Oh, & Woo, 2022).
Como ejemplo de implementación de big data y machine learning, Chalk realiza un algoritmo para predecir las causas de accidentes aéreos, en este caso, se utiliza big data para realizar un Word Count de las palabras encontradas en los registros de causales y con el uso de una regresión logística se genera una puntuación a cada palabra o par de palabras. (Chalk, 2016)
Pero, la pregunta que aún esta sin responder es cual de todos los modelos brinda predicciones más precisas, o, como se compara el desempeño de cada modelo en cada ramo del sector asegurador?
En salud hay pocos estudios comparativos de la precisión de los modelos. Algunos de ellos son aquel presentado por Hartman et al, en el que se determina la precisión de predicción de un método de ensamble de potenciación de gradiente, comparado con los resultados de una regresión logística de las reclamaciones en salud asociadas a pacientes de alto costo. (Hassani, Unger, & Beneki, 2020) Y el artículo de Duncan et al, en el que se compara un modelo lineal con LASSO, MARS, random forest, gradient boosting y arboles de decisiones aplicados a la predicción del costo de las reclamaciones en salud. (Society of Actuaries, 2019)
En conclusión, existen diversas técnicas predictivas utilizadas en el sector asegurador, incluso en el sector salud, sin embargo no hay una vasta literatura que compare los modelos con respecto a su precisión. Por tal razón es importante identificar cual es el modelo óptimo para cada ramo, considerando la disponibilidad de información, la calidad del dato y el recurso humano disponible para dicho objetivo.
Bibliografía
Chalk, A. (2016). A Practical Introduction to Machine Learning Concepts for Actuaries. Casualty Actuarial Society E-Forum.
Hassani, H., Unger, S., & Beneki, C. (2020). Big Data and Actuarial Science. Big Data and Cognitive Computing, DOI:10.3390/bdcc4040040.
Jae Youn, A., Cheung, E., Oh, R., & Woo, J.-K. (2022). Optimal Realitivities in a Modified Bonus-Malus System With Long Memory Transition Rules Frequency-Severity Dependence. Variance.
Landry, D., & Martin, S. (2022). Policy Level Unreported Frequency Model for Pure IBNR Estimation. Variance. Society of Actuaries. (2019). Machine Learning Methods For insurance Applications, A Survey.
Se presentan las principales actualizaciones de la transición entre el 2024 y el 2025 para el sistema de salud en Colombia