La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Principes de tarification de base

Présentations similaires


Présentation au sujet: "Principes de tarification de base"— Transcription de la présentation:

1 Principes de tarification de base
Mathématiques et statistique Partie 2 Principes de tarification de base

2 Classification Multivariée
Mathématiques et statistique Classification Multivariée Nous avons vu comment revoir la tarification des variables de tarification une à la fois (Classification Univariée) . Cependant, ces techniques ont tendance à être biaisées, car elle ne prenne pas compte pleinement de la corrélation qu'il peut exister entre les variables de tarification. Mettre à niveau la prime ou ajuster la prime pure ne corrige que partiellement ce problème, car la tarification courante n'est qu'une approximation des « vrais » relativités affectant la prime pure. Quelques exemples de corrélations existantes : - Certains territoires possèdent des valeurs de maisons plus élevés que d'autres - Les jeunes conducteurs ont tendance à conduire des vieux véhicules - Les jeunes conducteurs ont généralement des cotes de crédit plus basses ...

3 Procédure du Biais Minimum
Mathématiques et statistique Procédure du Biais Minimum Les procédures de Biais Minimum ont été très populaires lors de la 2e moitié du 20e siècle en classification et sont principalement des méthodes univariées standardisées et itératives. Chacune d'entre elles consistent à sélectionner une structure de tarification et une fonction de biais. Structure de Tarification - Additive - Multiplicative - Mixte Fonction de Biais - Balance Principle - Moindres Carrés - Khi Carré - Maximum de Vraisemblance

4 Fonction de Biais Mathématiques et statistique
La fonction de biais sera utilisée afin de comparer les primes pures observées aux primes pures indiquées et de mesurer la différence. Chaque côté de l'équation doit être pondéré par les expositions afin d'ajuster pour la distribution des risques. Balance Principle Sous cette fonction, la somme des primes pures indiquées pondérées doit être égale à la somme des primes pures observées pondérées pour chaque niveau de chacune des variables de tarification. Les changements de tarification pour chacune des variables se feront selon un processus itératif. Somme [Expositions * Prime Pures observées] = Somme [Expositions * Taux de base*Relativités] Car Prime Pure Indiquée = Taux de base * Relativités indiqués

5 Fonction de Biais Mathématiques et statistique
Exemple 1 : Pour un système de tarification à deux variables (sexe et type de territoire), calculer les relativités pour ces deux variables à la l'aide de 2 itérations du « Balance Principle » et à partir des primes pures observés et de la distribution des unités d'exposition ci-dessous :

6 Fonction de Biais Mathématiques et statistique Exemple 1 : Solution :
Soit les relativités suivantes : S1/S2 = Hommes / Femmes T1/T2 = Urbain / Rurale - Assumons un taux de base de 100 $. Les équations ci-dessous doivent balancer : Hommes : 170* 650$ + 90* 300$ = 100$*170*s1*t $*90*s1*t2 Femmes : 105* 250$ + 110* 240$ = 100$*105*s2*t $*110*s2*t2 Urbain : 170* 650$ + 105* 250$ = 100$*170*s1*t $*105*s2*t1 Rurale : 90* 300$ + 110* 240$ = 100$*90*s1*t $*110*s2*t2

7 Fonction de Biais Mathématiques et statistique Exemple 1 : Suite...
Cette équation sera résolu de façon itérative, comme point de départ, on va généralement commencer par les relativités obtenues à partir d'une analyse univariée (i.e. Prime pure du niveau / prime pure du niveau de base) sur une variable choisie au hasard, ici le type de territoire: T1= 497 / 267 = 1.86 T2= 1.00 En remplaçant ces valeurs dans les équations de sexe on obtient : Hommes : 137,500$ = 100$*170*s1* $*90*s1*1.00 137,500$ = 40,620*s1 S1= 3.39

8 Fonction de Biais Mathématiques et statistique Exemple 1 : Suite...
Pour les Femmes : Femmes : 52,650$ = 100$*105*s2* $*110*s2*1.00 52,650$ = 30,530*s2 S2= 1.72 Une fois les relativités de sexe obtenue, nous avons complété une itération de la procédure. Il faudra en compléter plusieurs jusqu'à ce que les changements des relativités obtenues soient mineurs. En utilisant nos nouvelles relativités de sexe dans les équations des types de territoires, on obtient : Urbain : 136,750$ = 100$*170*3.39*t $*105*1.72*t1 136,750$ = 75,690 * t1 T1= 1.81 ce qui est différent de 1.86

9 Fonction de Biais Mathématiques et statistique Exemple 1 : Suite...
Pour les territoires ruraux : Rurale : 53,400$ = 100$*90*3.39*t $*110*1.72*t2 53,400$ = 49,430$*t2 T2= 1.08 (différent de 1.00) 2e Itération : Hommes : 137,500$ = 100$*170*s1* $*90*s1*1.08 137,500$ = 40,490*s1 S1= 3.40 (très prêt de 3.39, on commence déjà à converger)

10 Fonction de Biais Mathématiques et statistique
Exemple 1 : Pour les Femmes (2e itération) : Femmes : 52,650$ = 100$*105*s2* $*110*s2*1.08 52,650$ = 30,885*s2 S2= 1.70 Pour cette exercice, nous allons arrêter ici, après la 2e itération. Ensuite, il nous reste seulement à re-balancer les relativités selon les niveaux de bases (choisie arbitrairement) : S1 = 3.40 / 1.70 = 2.00 S2 = 1.70 / 1.70 = 1.00 T1 = 1.81 / 1.08 = 1.68 T2 = 1.08 / 1.08 = 1.00 Le niveau prime pure de base doit aussi être ajuster pour les normalisations : 100*1.08*1.72 =

11 Fonction de Biais Mathématiques et statistique Balance Principle
Au lieu d'utiliser des primes pures, des ratios sinistres-primes pourraient aussi être utilisés principalement à cause qu'ils produisent généralement des résultats plus stables lorsque les risques ne sont pas distribués uniformément. Pour y arriver, il faudra remplacer la prime pure dans les calculs précédents par le ratio-sinistre prime multiplier par la relativité courante de la cellule en question. La raison pourquoi on doit multiplier par la relativité courante est qu'on doit enlever la tarification des variables analysés de la prime pour ensuite les ré-évaluer. Par exemple, pour un risque en particulier : RSP = Sinistres / Prime = Sinistres / (Niveau de base * Relativités Courantes)

12 Structure de Tarification
Mathématiques et statistique Structure de Tarification Les calculs nécessaire afin d'ajouter plusieurs autres variables (ou plusieurs autres niveaux) de tarification rendent le processus beaucoup plus complexe et nécessite l'utilisation d'un ordinateur. Pour cette raison, les questions d'examens ne devraient pas contenir plus de deux variables. En utilisant le « Balance Principle », les relativités doivent multiplier le taux de base seulement si la structure de l'algorithme est multiplicative (ce qui est généralement le cas). Si la structure est additive, nous allons plutôt travailler avec des rabais/surcharges et non des relativités. Le côté droit de la formule devient donc : Somme [Expositons * Taux de base*( 1 + Somme des Rabais/Surcharges)] Pour un algorithme mixte : Somme [Expositions*Taux de base*(Relativités+Somme des Rabais/Surcharges)]

13 Modélisation GLM Mathématiques et statistique
Un GLM est un modèle linéaire généralisé et est la technique de classification standard utilisé dans plusieurs marchés à travers le monde (principalement en lignes personnelles). À cause de sa complexité, elle est moins transparente que les techniques univariées plus simples, mais l'est quand même beaucoup plus que d'autres méthodes avancées tel que les réseaux de neurones. Contrairement à une régression linéaire standard, les GLMS ont des hypothèses plus souples : - Un GLM n'assume pas l'hypothèse de normalité - La variance n'est pas nécessairement constante - Une fonction (appelé la « link function ») définie la relation entre les variables réponses (fréquence, sévérité, prime pure) et la combinaison linéaire des variables de tarification (age, sexe, territoire...)

14 Modélisation GLM Mathématiques et statistique
Le choix de la « link function » va dépendre de la structure de l'algorithme : - Additive = Fonction Identité (1.00) - Multiplicative = Fonction logarithmique Les distributions utilisées pour remplacer l'hypothèse de normalité font généralement partie de la famille des lois exponentielles. Par exemple, les standards de l'industrie pour l'assurance automobile sont: - Réclamations = Loi Poisson - Sévérité = Loi Gamma - Prime Pure = Loi mixte Poisson/Gamma (appelé Loi Tweedie) Une fois les paramètres du GLM sélectionnés, la méthode du maximum de vraisemblance est ensuite utilisée afin de minimiser l'erreur produite entre l'expérience observé et les résultats sortant du modèle.

15 Modélisation GLM Mathématiques et statistique
On se rappelle qu'un modèle linéaire tente d'exprimer une variable observée Y par une combinaison de plusieurs variables Xi (ici X1 à X...) plus une variable d'erreur Ɛ suivant une N(0,σ2) . Y = β1X1 + β2X2 + β3X3 + …. + Ɛ Sous forme matricielle et pour plusieurs variables observées, cette formule devient : Y = E(Y) + Ɛ avec E(Y)= X * β Y = [ Y1 Y2 Y3 ... ]-1 β = [ β1 β2 β3 ... ]-1 Chaque variable de tarification Xi sera représenté par un vecteur Xi = [ X1i X2i X3i ... ]-1 qui définit la présence d'un niveau d'une variable de tarification (Xi = 1 si la variable observé Yi est à ce niveau, sinon 0 pour le niveau de base)

16 Modélisation GLM Mathématiques et statistique
Pour un modèle GLM, ces formules deviennent : - La variable d'erreur Ɛ suit une loi provenant de la famille des lois exponentielle (i.e. Poisson, Gamma,...) - La relation entre les variables observées et la combinaison linéaire des variables de tarification suit une fonction g (link function) : E(Y)= g-1(X*β) Par exemple si g est une fonction logarithmique, la structure de l'algorithme devient multiplicative : Y1 = Exp(β1X11 + β2X21 + …) = Exp(β1X11) * Exp(β2X21) * Exp(β3X31) ... Où les Exp(βi) sont les relativités estimés.

17 Modélisation GLM Mathématiques et statistique
Si au contraire g est égale à la fonction identité, la structure de l'algorithme devient additive : E(Y)= g-1(X*β) = X*β E(Y1) = β1X11 + β2X21 + … = β1X11+β2X21+β3X31 ... Où les βi sont les rabais/surcharges estimés.

18 Modélisation GLM Mathématiques et statistique
Exemple de résultat sortant d'un logiciel modélisant des GLMs:

19 Modélisation GLM Mathématiques et statistique
Exemple 2 : À partir des primes pures moyennes ci-dessous, estimer les relativités à charger à partir d'un GLM où l'erreur suit une Poisson et la structure de l'algorithme est multiplicative.

20 Modélisation GLM Mathématiques et statistique Exemple 2 : Suite...
Définissons tout d'abord les différents vecteurs, dans cet exemple, il y a quatre variables observées : Hommes-Urbains, Hommes-Ruraux, Femmes-Urbains et Femmes-Ruraux Et trois variables prédictives : B1 = Hommes , B2 = Femmes , B3 = Urbain/Rurale Note : Les Hommes/Femmes ne peuvent pas être regroupés ensembles car il faut au moins une variable présente pour le niveau de base

21 Modélisation GLM Mathématiques et statistique Exemple 2 : Suite...
Pour un algorithme multiplicatif, on choisit la fonction logarithmique comme « link function ». L'inverse de cette fonction est la fonction exponentielle. Pour notre vecteur contenant nos variables prédictives, on obtient :

22 Modélisation GLM Mathématiques et statistique Exemple 2 : Suite...
On doit maintenant résoudre l'équation matricielle à l'aide de la technique du maximum de vraisemblance : La fonction de la loi Poisson est : On doit donc évaluer cette fonction pour tous les yi et ensuite prendre le logarithme afin de se faciliter des calculs:

23 Modélisation GLM Mathématiques et statistique Exemple 2 : Suite...
Comme ui = g-1(Xi * β) ce qui représente l'estimé de la moyenne pour la variable observée y, on obtient : Finalement, si on remplace les variables par les données de cette exemple :

24 Modélisation GLM Mathématiques et statistique Exemple 2 : Suite...
Afin de trouver le maximum de vraisemblance, on dérive l'équation en fonction des trois bétas, pour obtenir :

25 Modélisation GLM Mathématiques et statistique Exemple 2 : Suite...
Comme on recherche les relativités =Exp(βi), on doit résoudre les équations suivante : R1*(R3+1) = 1300 R2*(R3+1) = 600 R3*(R1+R2) = 1200 Pour finalement obtenir : R1 = , R2 = , R3 = 1.714 Si les hommes sont le niveau de bases, les relativités sont rebalancés à : R1 = / = 1.00 et R2 = / = 0.462

26 Modélisation GLM Mathématiques et statistique
Comme vous avez plus le remarquer, les concepts derrières les GLMs sont relativement complexes. Pour cette raison, une compréhension complète ne sera pas attendue pour l'examen. Les sujets pouvant être testés seront : - Compréhension de la théorie derrière un GLM (i.e. hypothèses de base) - Définir les différents vecteurs/matrice pour résolution d'un GLM (sans résolution) et expliquer brièvement les étapes nécessaires à la résolution

27 Mathématiques et statistique
Exercices Voici quelques exercices des examens antérieurs de la CAS pertinents à la matière de cette section : Exam 8 – Fall 2010 : #3, #4 Exam 9 – Fall 2010 : #3, #4 Exam 9 - Fall 2009 : #3, #5 Exam 9 – Fall 2008 : #6, Note Les exercices sont disponibles sur la site de la CAS à l'adresse suivante : et


Télécharger ppt "Principes de tarification de base"

Présentations similaires


Annonces Google