Principes de tarification de base

Slides:



Advertisements
Présentations similaires
Introduction à l’analyse
Advertisements

Probabilités et statistiques au lycée
Exemple concret de situation problème
Introduction aux statistiques
La régression logistique: fondements et conditions d’application
Inférence statistique
C1 Bio-statistiques F. KOHLER
Inférence statistique
Nombre de sujets nécessaires en recherche clinique
CALCUL LITTERAL 3° Avon 2010 Bernard Izard 05-LT I – NOTATIONS
Les tests d’hypothèses
RESOLUTION DE SYSTEME Soit à résoudre le système : 2x + 3 y = 26
variable aléatoire Discrète
Concepts avancés en mathématiques et informatique appliquées
COURS 5 Les tableaux croisés, le chi-carré et la corrélation
La Régression Multiple
Modèles de Leontieff Montage préparé par : André Ross
Exemple concret de situation problème
Cours Corporate finance Eléments de théorie du portefeuille Le Medaf
Régression linéaire simple
Comprendre la variation dans les données: Notions de base
Espaces vectoriels Montage préparé par : S André Ross
Méthodes de prévision (STT-3220) Section 4 Concepts fondamentaux de séries chronologiques Version: 8 novembre 2004.
Méthodes de prévision (STT-3220)
Ajustements c2 non-linéaires
Faculté des arts et des sciences Mathématiques et statistique Partie 1 Évaluations des réserves.
Faculté des arts et des sciences Mathématiques et statistique Partie 2 Principes de tarification de base.
Faculté des arts et des sciences Mathématiques et statistique Partie 1 Évaluations des réserves.
La corrélation et la régression
Les modèles linéaires (Generalized Linear Models, GLM)
Corrélation Principe fondamental d’une analyse de corrélation
Factorisation de trinômes
Gestion de Fichiers Hachage (suite). 2 Plan du cours daujourdhui Prédiction de la distribution des enregistrements Réduction des collisions en augmentant.
Régression linéaire (STT-2400)
Faculté des arts et des sciences Mathématiques et statistique Partie 1 Évaluations des réserves.
Faculté des arts et des sciences Mathématiques et statistique Partie 1 Évaluations des réserves.
Les familles de fonctions
Théorie de l’échantillonnage (STT-6005)
La régression multiple
Principes de tarification de base
Faculté des arts et des sciences Mathématiques et statistique Partie 2 Principes de tarification de base.
Régression linéaire (STT-2400)
Programmation linéaire en nombres entiers : les méthodes de troncature
Chapitre 5 Prévisions.
1 SYSTEMES D’EQUATIONS Bruno DELACOTE Collège de MASEVAUX Type d ’activité : leçon illustrée AVERTISSEMENT : Certaines images, dont les images clip art,
Régression linéaire (STT-2400)
Principes de tarification de base
Présentation de la méthode des Eléments Finis
Examen partiel #1 Mercredi le 4 octobre de 13h30 à 15h20
Régression linéaire multiple : hypothèses & interprétation. Partie 2.
Probabilités et Statistiques
Cours de mathématiques économiques
1 SYSTEMES D’EQUATIONS Bruno DELACOTE Collège de MASEVAUX Type d ’activité : leçon illustrée.
Activité 1 sommaire Vous avez redécouvert ce que l'on appelle le principe 68%-95%-99,7% : Ce principe est valable pour des distributions de fréquences.
Programmation linéaire en nombres entiers
Marquez cette valeur sur le diagramme à points de la question 6. La moyenne réelle des nombres de lettres par mots dans la population de l'ensemble des.
Présentation du marché obligataire
Probabilités et Statistiques Année 2010/2011
Outils d’analyse: la méthode des moindres carrées
L’erreur standard et les principes fondamentaux du test de t
CHAPITRE 5. La théorie de l’assurance
Méthode des moindres carrés (1)
Séries chronologiques univariées (STT-6615)
Échantillonnage (STT-2000) Section 5 Types d’erreur de sondage. Version: 22 août 2003.
Faculté des arts et des sciences Mathématiques et statistique Partie 2 Principes de tarification de base.
Régression linéaire (STT-2400)
Faculté des arts et des sciences Mathématiques et statistique Partie 1 Évaluations des réserves.
Analyse des données. Plan Lien entre les statistiques et l’analyse des données Propagation des erreurs Ajustement de fonctions.
Méthodes de prévision (STT-3220)
Pierre Joli Cours de Mathématique Pierre Joli
Transcription de la présentation:

Principes de tarification de base Mathématiques et statistique Partie 2 Principes de tarification de base

Classification Multivariée Mathématiques et statistique Classification Multivariée Nous avons vu comment revoir la tarification des variables de tarification une à la fois (Classification Univariée) . Cependant, ces techniques ont tendance à être biaisées, car elle ne prenne pas compte pleinement de la corrélation qu'il peut exister entre les variables de tarification. Mettre à niveau la prime ou ajuster la prime pure ne corrige que partiellement ce problème, car la tarification courante n'est qu'une approximation des « vrais » relativités affectant la prime pure. Quelques exemples de corrélations existantes : - Certains territoires possèdent des valeurs de maisons plus élevés que d'autres - Les jeunes conducteurs ont tendance à conduire des vieux véhicules - Les jeunes conducteurs ont généralement des cotes de crédit plus basses ...

Procédure du Biais Minimum Mathématiques et statistique Procédure du Biais Minimum Les procédures de Biais Minimum ont été très populaires lors de la 2e moitié du 20e siècle en classification et sont principalement des méthodes univariées standardisées et itératives. Chacune d'entre elles consistent à sélectionner une structure de tarification et une fonction de biais. Structure de Tarification - Additive - Multiplicative - Mixte Fonction de Biais - Balance Principle - Moindres Carrés - Khi Carré - Maximum de Vraisemblance

Fonction de Biais Mathématiques et statistique La fonction de biais sera utilisée afin de comparer les primes pures observées aux primes pures indiquées et de mesurer la différence. Chaque côté de l'équation doit être pondéré par les expositions afin d'ajuster pour la distribution des risques. Balance Principle Sous cette fonction, la somme des primes pures indiquées pondérées doit être égale à la somme des primes pures observées pondérées pour chaque niveau de chacune des variables de tarification. Les changements de tarification pour chacune des variables se feront selon un processus itératif. Somme [Expositions * Prime Pures observées] = Somme [Expositions * Taux de base*Relativités] Car Prime Pure Indiquée = Taux de base * Relativités indiqués

Fonction de Biais Mathématiques et statistique Exemple 1 : Pour un système de tarification à deux variables (sexe et type de territoire), calculer les relativités pour ces deux variables à la l'aide de 2 itérations du « Balance Principle » et à partir des primes pures observés et de la distribution des unités d'exposition ci-dessous :

Fonction de Biais Mathématiques et statistique Exemple 1 : Solution : Soit les relativités suivantes : S1/S2 = Hommes / Femmes T1/T2 = Urbain / Rurale - Assumons un taux de base de 100 $. Les équations ci-dessous doivent balancer : Hommes : 170* 650$ + 90* 300$ = 100$*170*s1*t1 + 100$*90*s1*t2 Femmes : 105* 250$ + 110* 240$ = 100$*105*s2*t1 + 100$*110*s2*t2 Urbain : 170* 650$ + 105* 250$ = 100$*170*s1*t1 + 100$*105*s2*t1 Rurale : 90* 300$ + 110* 240$ = 100$*90*s1*t2 + 100$*110*s2*t2

Fonction de Biais Mathématiques et statistique Exemple 1 : Suite... Cette équation sera résolu de façon itérative, comme point de départ, on va généralement commencer par les relativités obtenues à partir d'une analyse univariée (i.e. Prime pure du niveau / prime pure du niveau de base) sur une variable choisie au hasard, ici le type de territoire: T1= 497 / 267 = 1.86 T2= 1.00 En remplaçant ces valeurs dans les équations de sexe on obtient : Hommes : 137,500$ = 100$*170*s1*1.86 + 100$*90*s1*1.00 137,500$ = 40,620*s1 S1= 3.39

Fonction de Biais Mathématiques et statistique Exemple 1 : Suite... Pour les Femmes : Femmes : 52,650$ = 100$*105*s2*1.86 + 100$*110*s2*1.00 52,650$ = 30,530*s2 S2= 1.72 Une fois les relativités de sexe obtenue, nous avons complété une itération de la procédure. Il faudra en compléter plusieurs jusqu'à ce que les changements des relativités obtenues soient mineurs. En utilisant nos nouvelles relativités de sexe dans les équations des types de territoires, on obtient : Urbain : 136,750$ = 100$*170*3.39*t1 + 100$*105*1.72*t1 136,750$ = 75,690 * t1 T1= 1.81 ce qui est différent de 1.86

Fonction de Biais Mathématiques et statistique Exemple 1 : Suite... Pour les territoires ruraux : Rurale : 53,400$ = 100$*90*3.39*t2 + 100$*110*1.72*t2 53,400$ = 49,430$*t2 T2= 1.08 (différent de 1.00) 2e Itération : Hommes : 137,500$ = 100$*170*s1*1.81 + 100$*90*s1*1.08 137,500$ = 40,490*s1 S1= 3.40 (très prêt de 3.39, on commence déjà à converger)

Fonction de Biais Mathématiques et statistique Exemple 1 : Pour les Femmes (2e itération) : Femmes : 52,650$ = 100$*105*s2*1.81 + 100$*110*s2*1.08 52,650$ = 30,885*s2 S2= 1.70 Pour cette exercice, nous allons arrêter ici, après la 2e itération. Ensuite, il nous reste seulement à re-balancer les relativités selon les niveaux de bases (choisie arbitrairement) : S1 = 3.40 / 1.70 = 2.00 S2 = 1.70 / 1.70 = 1.00 T1 = 1.81 / 1.08 = 1.68 T2 = 1.08 / 1.08 = 1.00 Le niveau prime pure de base doit aussi être ajuster pour les normalisations : 100*1.08*1.72 = 185.76

Fonction de Biais Mathématiques et statistique Balance Principle Au lieu d'utiliser des primes pures, des ratios sinistres-primes pourraient aussi être utilisés principalement à cause qu'ils produisent généralement des résultats plus stables lorsque les risques ne sont pas distribués uniformément. Pour y arriver, il faudra remplacer la prime pure dans les calculs précédents par le ratio-sinistre prime multiplier par la relativité courante de la cellule en question. La raison pourquoi on doit multiplier par la relativité courante est qu'on doit enlever la tarification des variables analysés de la prime pour ensuite les ré-évaluer. Par exemple, pour un risque en particulier : RSP = Sinistres / Prime = Sinistres / (Niveau de base * Relativités Courantes)

Structure de Tarification Mathématiques et statistique Structure de Tarification Les calculs nécessaire afin d'ajouter plusieurs autres variables (ou plusieurs autres niveaux) de tarification rendent le processus beaucoup plus complexe et nécessite l'utilisation d'un ordinateur. Pour cette raison, les questions d'examens ne devraient pas contenir plus de deux variables. En utilisant le « Balance Principle », les relativités doivent multiplier le taux de base seulement si la structure de l'algorithme est multiplicative (ce qui est généralement le cas). Si la structure est additive, nous allons plutôt travailler avec des rabais/surcharges et non des relativités. Le côté droit de la formule devient donc : Somme [Expositons * Taux de base*( 1 + Somme des Rabais/Surcharges)] Pour un algorithme mixte : Somme [Expositions*Taux de base*(Relativités+Somme des Rabais/Surcharges)]

Modélisation GLM Mathématiques et statistique Un GLM est un modèle linéaire généralisé et est la technique de classification standard utilisé dans plusieurs marchés à travers le monde (principalement en lignes personnelles). À cause de sa complexité, elle est moins transparente que les techniques univariées plus simples, mais l'est quand même beaucoup plus que d'autres méthodes avancées tel que les réseaux de neurones. Contrairement à une régression linéaire standard, les GLMS ont des hypothèses plus souples : - Un GLM n'assume pas l'hypothèse de normalité - La variance n'est pas nécessairement constante - Une fonction (appelé la « link function ») définie la relation entre les variables réponses (fréquence, sévérité, prime pure) et la combinaison linéaire des variables de tarification (age, sexe, territoire...)

Modélisation GLM Mathématiques et statistique Le choix de la « link function » va dépendre de la structure de l'algorithme : - Additive = Fonction Identité (1.00) - Multiplicative = Fonction logarithmique Les distributions utilisées pour remplacer l'hypothèse de normalité font généralement partie de la famille des lois exponentielles. Par exemple, les standards de l'industrie pour l'assurance automobile sont: - Réclamations = Loi Poisson - Sévérité = Loi Gamma - Prime Pure = Loi mixte Poisson/Gamma (appelé Loi Tweedie) Une fois les paramètres du GLM sélectionnés, la méthode du maximum de vraisemblance est ensuite utilisée afin de minimiser l'erreur produite entre l'expérience observé et les résultats sortant du modèle.

Modélisation GLM Mathématiques et statistique On se rappelle qu'un modèle linéaire tente d'exprimer une variable observée Y par une combinaison de plusieurs variables Xi (ici X1 à X...) plus une variable d'erreur Ɛ suivant une N(0,σ2) . Y = β1X1 + β2X2 + β3X3 + …. + Ɛ Sous forme matricielle et pour plusieurs variables observées, cette formule devient : Y = E(Y) + Ɛ avec E(Y)= X * β Y = [ Y1 Y2 Y3 ... ]-1 β = [ β1 β2 β3 ... ]-1 Chaque variable de tarification Xi sera représenté par un vecteur Xi = [ X1i X2i X3i ... ]-1 qui définit la présence d'un niveau d'une variable de tarification (Xi = 1 si la variable observé Yi est à ce niveau, sinon 0 pour le niveau de base)

Modélisation GLM Mathématiques et statistique Pour un modèle GLM, ces formules deviennent : - La variable d'erreur Ɛ suit une loi provenant de la famille des lois exponentielle (i.e. Poisson, Gamma,...) - La relation entre les variables observées et la combinaison linéaire des variables de tarification suit une fonction g (link function) : E(Y)= g-1(X*β) Par exemple si g est une fonction logarithmique, la structure de l'algorithme devient multiplicative : Y1 = Exp(β1X11 + β2X21 + …) = Exp(β1X11) * Exp(β2X21) * Exp(β3X31) ... Où les Exp(βi) sont les relativités estimés.

Modélisation GLM Mathématiques et statistique Si au contraire g est égale à la fonction identité, la structure de l'algorithme devient additive : E(Y)= g-1(X*β) = X*β E(Y1) = β1X11 + β2X21 + … = β1X11+β2X21+β3X31 ... Où les βi sont les rabais/surcharges estimés.

Modélisation GLM Mathématiques et statistique Exemple de résultat sortant d'un logiciel modélisant des GLMs:

Modélisation GLM Mathématiques et statistique Exemple 2 : À partir des primes pures moyennes ci-dessous, estimer les relativités à charger à partir d'un GLM où l'erreur suit une Poisson et la structure de l'algorithme est multiplicative.

Modélisation GLM Mathématiques et statistique Exemple 2 : Suite... Définissons tout d'abord les différents vecteurs, dans cet exemple, il y a quatre variables observées : Hommes-Urbains, Hommes-Ruraux, Femmes-Urbains et Femmes-Ruraux Et trois variables prédictives : B1 = Hommes , B2 = Femmes , B3 = Urbain/Rurale Note : Les Hommes/Femmes ne peuvent pas être regroupés ensembles car il faut au moins une variable présente pour le niveau de base

Modélisation GLM Mathématiques et statistique Exemple 2 : Suite... Pour un algorithme multiplicatif, on choisit la fonction logarithmique comme « link function ». L'inverse de cette fonction est la fonction exponentielle. Pour notre vecteur contenant nos variables prédictives, on obtient :

Modélisation GLM Mathématiques et statistique Exemple 2 : Suite... On doit maintenant résoudre l'équation matricielle à l'aide de la technique du maximum de vraisemblance : La fonction de la loi Poisson est : On doit donc évaluer cette fonction pour tous les yi et ensuite prendre le logarithme afin de se faciliter des calculs:

Modélisation GLM Mathématiques et statistique Exemple 2 : Suite... Comme ui = g-1(Xi * β) ce qui représente l'estimé de la moyenne pour la variable observée y, on obtient : Finalement, si on remplace les variables par les données de cette exemple :

Modélisation GLM Mathématiques et statistique Exemple 2 : Suite... Afin de trouver le maximum de vraisemblance, on dérive l'équation en fonction des trois bétas, pour obtenir :

Modélisation GLM Mathématiques et statistique Exemple 2 : Suite... Comme on recherche les relativités =Exp(βi), on doit résoudre les équations suivante : R1*(R3+1) = 1300 R2*(R3+1) = 600 R3*(R1+R2) = 1200 Pour finalement obtenir : R1 = 478.95, R2 = 221.05, R3 = 1.714 Si les hommes sont le niveau de bases, les relativités sont rebalancés à : R1 = 478.95/ 478.95 = 1.00 et R2 = 221.05/ 478.95 = 0.462

Modélisation GLM Mathématiques et statistique Comme vous avez plus le remarquer, les concepts derrières les GLMs sont relativement complexes. Pour cette raison, une compréhension complète ne sera pas attendue pour l'examen. Les sujets pouvant être testés seront : - Compréhension de la théorie derrière un GLM (i.e. hypothèses de base) - Définir les différents vecteurs/matrice pour résolution d'un GLM (sans résolution) et expliquer brièvement les étapes nécessaires à la résolution

Mathématiques et statistique Exercices Voici quelques exercices des examens antérieurs de la CAS pertinents à la matière de cette section : Exam 8 – Fall 2010 : #3, #4 Exam 9 – Fall 2010 : #3, #4 Exam 9 - Fall 2009 : #3, #5 Exam 9 – Fall 2008 : #6, Note Les exercices sont disponibles sur la site de la CAS à l'adresse suivante : http://www.casact.org/admissions/studytools/exam9/ et http://www.casact.org/admissions/studytools/exam8/