Comparaison des données de ventes : Données internes, GERS, IMS/SDM-XPONENT Mai 2007
Données étudiées On a étudié les données de vente provenant de 3 sources : Données Internes / GERS et SDM-XPONENT. Les laboratoires qui ont bien voulu participer à cette phase d’analyse sont : ASTRAZENECA, BAYER, CEPHALON, JANSSEN, LILLY, PIERRE FABRE, SCHERING, UCB Les données couvraient les périodes 2004/2005/2006, dans la suite du travail on s’est concentré sur 2005 et 2006 (tout en faisant intervenir les données 2004). On a éliminé les produits dont on n’avait pas les 3 séries, ou bien dont l’une des séries semblait être complètement différente des 2 autres. 62 produits ou formes galéniques ont été utilisés dans les calculs (50 formes galéniques et 18 produits (certains n’étant présents que sous une forme)). Mai 2007
Approches utilisées 2 approches ont été utilisées : une classique avec des moyennes mobiles (sur 3 mois) et une plus originale basée sur des régressions. Mai 2007
Moyennes mobiles Trimestres calendaires LABO GERS XPONENT 1er T 2005 58 076 57 193 58 024 2ème T 2005 55 164 57 405 57 861 3ème T 2005 53 002 52 465 53 938 4ème T 2005 55 082 55 300 54 759 1er T 2006 55 025 54 730 55 049 2ème T 2006 51 709 52 098 53 952 3ème T 2006 50 873 49 726 53 359 4ème T 2006 51 620 52 234 53 578 1er T 2007 48 014 49 655 52 165 Voici les moyennes (Formes galéniques) des ventes sur les 3 séries (Uniquement trimestres calendaires) : On voit un phénomène de surestimation qui a tendance à s’atténuer au 4ème trimestre 2006, mais persiste en 2007. Mai 2007
Moyennes mobiles Mois par mois MM (sur 3 mois) LABO GERS XPONENT mars-05 58 076 57 193 58 024 avr-05 60 185 59 040 58 541 mai-05 59 316 59 696 59 326 juin-05 55 164 57 405 57 861 juil-05 52 720 55 278 56 829 août-05 52 173 51 534 54 703 sept-05 53 002 52 465 53 938 oct-05 54 398 53 306 53 298 nov-05 55 983 56 730 54 484 déc-05 55 082 55 300 54 759 janv-06 53 491 54 325 55 409 févr-06 52 924 52 827 54 335 mars-06 55 025 54 730 55 049 avr-06 53 047 53 106 53 654 mai-06 53 117 53 437 54 740 juin-06 51 709 52 098 53 952 juil-06 53 341 52 635 54 959 août-06 50 336 49 895 53 870 sept-06 50 873 49 726 53 359 oct-06 52 891 51 330 53 527 nov-06 54 370 53 992 53 997 déc-06 51 620 52 234 53 578 janv-07 49 276 50 969 53 430 févr-07 48 481 49 404 52 146 mars-07 48 014 49 655 52 165 avr-07 47 289 48 174 49 764 Voici les moyennes (Formes galéniques) des ventes sur les 3 séries (mois par mois, moyenne mobile sur 3 mois) : On voit un phénomène de surestimation qui commence en mai 2006 puis disparaît en octobre 2006, puis réapparaît en décembre 2006 jusqu’en avril 2007. Mai 2007
Moyennes mobiles Mois par mois Mai 2007
Approche par régression L’approche par régression suppose que la donnée mesurée (Gers ou Xponent) est très corrélée avec les données de ventes labos. (c’est le cas comme on va le voir). Si l’estimation de manière générale est très bonne, et si des phénomènes particuliers se produisent, les données mesurées devraient s’écarter des données prédites pendant une certaine période. L’intérêt est que l’on travaille au niveau de chaque individu, que l’on détermine la meilleure période à prendre en compte et enfin que l’on puisse analyser finement les différences (résidus de la régression). On cherche (sans prétention de vouloir découvrir un modèle de prévision) une régression entre la donnée mensuelle GERS ou XPONENT et les données internes laboratoires. Concrètement on va mettre, pour 1 mois donné n du prestataire, comme variables candidates les mois n, n-1, …, n-5 du labo (soit un période de 6 mois). On effectue une régression pas à pas qui introduit une à une les variables et s’arrête lorsque la variable suivante n’apporte plus d’information supplémentaire à la régression. Concernant les données fournies, on a en fait 1488 (62 produits ou formes sur 24 mois) données mensuelles GERS (idem XPONENT) avec les 6 mois historiques labos. Mai 2007
Qualité des régressions La qualité des régressions est excellente pour chacune des 2 mesures comme on peut le voir ci dessous : Mai 2007
Comparaison données mesurées et estimées Comme on peut le voir la donnée estimée suit de très prêt la donnée mesurée. Et cependant il y a un problème…. Mai 2007
Analyse des résidus en volume Les résidus sont la différence entre la donnée mesurée et la donnée estimée On voit qu’il y a des mois qui suivent mal la règle générale : exemple Août 2005 suivi d’une correction en Sept 2005. Mais d’une manière générale les résidus (qui par construction ont une somme nulle) se répartissent aléatoirement de part et d’autre de l’axe 0. Par contre de mai à septembre 2006, on a une série de 5 points pour Xponent qui sont tous du même côté (+) de l’axe : donnée mesurée plus importante qu’attendue selon l’estimation. Ce phénomène est transitoire, il disparaît en novembre 2006 et a l’air de repartir un peu en décembre 2006. A compter du mois de janvier 2007, on a toujours une tendance à la surestimation mais de manière irrégulière. Mai 2007
Analyse des résidus en nb de produits Les volumes peuvent masquer d’autres phénomènes : par exemple 2-3 produits à fort volume surestimés peuvent masquer un grand nombre de produits sous-estimés (ou vice-versa), d’ou une analyse des résidus en nb de produits estimés vs nb de produits mesurés.. On voit que les volumes masquent certaines choses : pour le GERS, en moyenne 16 produits sur 50 ont une mesure > au calcul de la régression et donc 34 ont une mesure < à l’estimation. on a donc tendance à surestimer par calcul beaucoup de produits (donc le volume de quelques produits masque ce phénomène). Pour Xponent, c’est beaucoup plus équilibré sur l’ensemble de la période on a en moyenne 26 produits mesurés / 50 supérieur à leur estimation. Le problème est que pour le Gers ce phénomène reste toujours autour de 16 / 50 au cours des 24 mois avec de fortes amplitudes sur certains mois, alors que pour Xponent, la proportion de produit surestimés augmente dans le 2ème semestre 2006, mais à tendance à bien se rétablir courant 2007. Mai 2007
Conclusions Quelque soit la méthode, il semble bien qu’il y ait eu une surestimation systématique des données Xponent par rapport aux données internes des labos (pour les éléments fournis en tout cas) de Mai à Septembre 2006. (et encore plus par rapport au GERS qui a décroché négativement pendant 2 mois à ce moment là). Ce phénomène semble transitoire et se serait résorbé en Novembre 2006, mais est relancé au cours du 1er trimestre 2007. Mai 2007