Comparaison des données de ventes : Données internes, GERS, IMS/SDM-XPONENT Mai 2007
Données étudiées On a étudié les données de vente provenant de 3 sources : Données Internes / GERS et SDM-XPONENT. Les laboratoires qui ont bien voulu participer à cette phase d’analyse sont : ASTRAZENECA, BAYER, CEPHALON, JANSSEN, LILLY, PIERRE FABRE, SCHERING, UCB Les données couvraient les périodes 2004/2005/2006, dans la suite du travail on s’est concentré sur 2005 et 2006 (tout en faisant intervenir les données 2004). On a éliminé les produits dont on n’avait pas les 3 séries, ou bien dont l’une des séries semblait être complètement différente des 2 autres. 62 produits ou formes galéniques ont été utilisés dans les calculs (50 formes galéniques et 18 produits (certains n’étant présents que sous une forme)). Mai 2007
Approches utilisées 2 approches ont été utilisées : une classique avec des moyennes mobiles (sur 3 mois) et une plus originale basée sur des régressions. Mai 2007
Moyennes mobiles Trimestres calendaires Voici les moyennes (Formes galéniques) des ventes sur les 3 séries (Uniquement trimestres calendaires) : On voit un phénomène de surestimation qui a tendance à s’atténuer au 4ème trimestre. Mai 2007
Moyennes mobiles Mois par mois Voici les moyennes (Formes galéniques) des ventes sur les 3 séries (mois par mois, moyenne mobile sur 3 mois) : On voit un phénomène de surestimation qui commence en mai 2006 puis disparaît en octobre 2006. Mai 2007
Approche par régression L’approche par régression suppose que la donnée mesurée (Gers ou Xponent) est très corrélée avec les données de ventes labos. (c’est le cas comme on va le voir). Si l’estimation de manière générale est très bonne, et si des phénomènes particuliers se produisent, les données mesurées devraient s’écarter des données prédites pendant une certaine période. L’intérêt est que l’on travaille au niveau de chaque individu, que l’on détermine la meilleure période à prendre en compte et enfin que l’on puisse analyser finement les différences (résidus de la régression). On cherche (sans prétention de vouloir découvrir un modèle de prévision) une régression entre la donnée mensuelle GERS ou XPONENT et les données internes laboratoires. Concrètement on va mettre, pour 1 mois donné n du prestataire, comme variables candidates les mois n, n-1, …, n-5 du labo (soit un période de 6 mois). On effectue une régression pas à pas qui introduit une à une les variables et s’arrête lorsque la variable suivante n’apporte plus d’information supplémentaire à la régression. Concernant les données fournies, on a en fait 1488 (62 produits ou formes sur 24 mois) données mensuelles GERS (idem XPONENT) avec les 6 mois historiques labos. Mai 2007
Qualité des régressions La qualité des régressions est excellente pour chacune des 2 mesures comme on peut le voir ci dessous : Mai 2007
Comparaison données mesurées et estimées Comme on peut le voir la donnée estimée suit de très prêt la donnée mesurée. Et cependant il y a un problème…. Mai 2007
Analyse des résidus en volume Les résidus sont la différence entre la donnée mesurée et la donnée estimée On voit qu’il y a des mois qui suivent mal la règle générale : exemple Août 2005 suivi d’une correction en Sept 2005. Mais d’une manière générale les résidus (qui par construction ont une somme nulle) se répartissent aléatoirement de part et d’autre de l’axe 0. Par contre de mai à septembre 2006, on a une série de 5 points pour Xponent qui sont tous du même côté (+) de l’axe : donnée mesurée plus importante qu’attendue selon l’estimation. Ce phénomène est transitoire, il disparaît en novembre 2006 et a l’air de repartir un peu en décembre 2006(-> tester 1er semestre 2007?). Mai 2007
Analyse des résidus en nb de produits Les volumes peuvent masquer d’autres phénomènes : par exemple 2-3 produits à fort volume surestimés peuvent masquer un grand nombre de produits sous-estimés (ou vice-versa), d’ou une analyse des résidus en nb de produits estimés vs nb de produits mesurés.. On voit que les volumes masquent certaines choses : pour le GERS, en moyenne 16 produits sur 50 ont une mesure > au calcul de la régression et donc 34 ont une mesure < à l’estimation. on a donc tendance à surestimer par calcul beaucoup de produits (donc le volume de quelques produits masque ce phénomène). Pour Xponent, c’est beaucoup plus équilibré sur l’ensemble de la période on a en moyenne 26 produits mesurés / 50 supérieur à leur estimation. Le problème est que pour le Gers ce phénomène reste toujours autour de 16 / 50 au cours des 24 mois avec de fortes amplitudes sur certains mois, alors que pour Xponent, la proportion de produit surestimés augmente dans le 2ème semestre 2006. Mai 2007
Conclusions Quelque soit la méthode, il semble bien qu’il y ait eu une surestimation systématique des données Xponent par rapport aux données internes des labos (pour les éléments fournis en tout cas) de Mai à Septembre 2006. (et encore plus par rapport au GERS qui a décroché négativement pendant 2 mois à ce moment là). Ce phénomène semble transitoire et se serait résorbé en Novembre 2006, sans pouvoir prédire l’avenir (1er semestre 2007 ?). Mai 2007