La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Le SIDV Système décisionnel pour lexploitation des remontées des données de validations télébillettiques.

Présentations similaires


Présentation au sujet: "Le SIDV Système décisionnel pour lexploitation des remontées des données de validations télébillettiques."— Transcription de la présentation:

1 Le SIDV Système décisionnel pour lexploitation des remontées des données de validations télébillettiques

2 Le STIF Le STIF imagine, organise et finance les transports publics pour tous les Franciliens. Au cœur du réseau de transports dIle-de-France, le STIF fédère tous les acteurs (voyageurs, élus, constructeurs, transporteurs, gestionnaires dinfrastructures, …). Il investit et innove pour améliorer le service rendu aux voyageurs. Le STIF, composé de la Région Ile-de-France, de la Ville de Paris et des sept autres départements franciliens, porte la vision de lensemble des transports franciliens (train, RER, métro, tramway, T Zen et bus). Ainsi, il décide et pilote les projets de développement et de modernisation de tous les transports, dont il confie lexploitation à des transporteurs. 2

3 La région Ile de France 12 millions dhabitants (18% de la pop française) 6 millions demplois km de lignes ferrées (métro + RER + trains) desservant environ 450 gares ou stations 4 lignes de tramway km de lignes de bus, arrêts desservis par environ lignes 2.6 milliards de voyages annuels sur les réseaux ferrés 1.3 milliards de voyages annuels sur les réseaux de bus … soit environ 4 milliards de voyages par an en transports en commun 3

4 Le projet SIDV Lhistorique Les données La CNIL Type dexploitations 4

5 Historique du projet Création des titres sur support télébillettique Au début, il y avait le titre « papier »… Et une technologie de type carte à puce en plein développement …. Deux systèmes amenés à se croiser… 5

6 Historique du projet En 2001, passage des cartes Intégrale sur passe Navigo, puis … La carte IR Etudiant en 2002 …. et la carte IR Scolaire en 2003 En 2004, une expérimentation de la Carte Orange sur passe Navigo a été menée dans le 12e arrondissement de Paris. En 2005, cette expérimentation est élargie aux zones 1 et 2 En 2006, il n'est plus distribué de coupons magnétiques aux usagers possédant un passe Navigo et mi-mai 2006, cest au tour de tous les Franciliens, quelles que soient leurs zones, de pouvoir disposer de leur abonnement Carte Orange sur passe Navigo. Cependant, le choix entre passe Navigo et carte orange « magnétique » est toujours possible En septembre 2007, le STIF introduit une nouvelle version du passe Navigo, le passe Navigo Découverte. Cette nouvelle version donne désormais accès à Navigo à l'ensemble des usagers non franciliens et répond aux injonctions de la CNIL. En 2009, la carte orange disparait définitivement !!! 6

7 Le projet SIDV Lhistorique Les données La CNIL Type dexploitations 7

8 Les données remontées Les données collectées sont de 2 types: Des données issues des informations contenues dans le passe Navigo Des données sur les actes de validations, remontées via les valideurs des différents transporteurs …. données auxquelles on ajoute des données de « référentiels » STIF Données remontées: contrats + validations 8

9 Les données remontées Les données remontées : Les données issues des informations contenues dans le passe Navigo Les données sur les actes de validations, remontées via les valideurs des différents transporteurs - Une date et une heure - Une nature (entrée, sortie, correspondance) - Et un lieu (station, gare, arrêt, ligne, mission, …) - Un contrat (titre) - Un numéro unique (anonyme) - Un profil (donnant droit à titre particulier) - Une validité (date, zone, OD, …) 9

10 Les données remontées Quelques chiffres: o Environ 10 millions de validations remontées par jour ouvrable (5 millions un samedi, 3 millions un dimanche) près de 2,5 milliards de validations par an o Des données conservées de 2 à 5 ans 6 To de données stockés sur nos serveurs ! 10

11 Les données remontées La qualité et lexhaustivité des données dépendent : o Des titres de transports hors télébillettique (environ 15% du trafic ferré, un peu plus sur les réseaux de surface) o De léquipement en valideurs (en sortie, en entrée…). Environ 20% du trafic SNCF se situe dans des gares « ouvertes » o Des contraintes dexploitation pour les opérateurs (ouvertures des tourniquets, pannes de valideurs, …) o Du comportement des usagers (comment mesurer le taux de validation ou assurer la validation systématique) o Et des référentiels parfois « absents »: le passage des arrêts sur les lignes de bus dépend parfois du machiniste 11

12 Le système mis en œuvre 12 analyser, exploiter, comprendre Reporting Extraction et au-delà Zone tampon Vérification, Nettoyage, Optimisation Vérification des contraintes d'intégrité référentielle. Passé un certain nombre de jours, on considère que les données qui sont systématiquement rejetées le seront toujours. On purge alors ces données et elles ne pourront plus être recyclées. jusquà J+30 Référentiel STIF Collecte des données Réception entre J+2 et J+5 Historiser à J+30 Entrepôt Données de Référentiel Données de Validation A2 Validation Jour J A1

13 Le projet SIDV Lhistorique Les données La CNIL Type dexploitations 13

14 Le système danonymisation Dans sa « délibération portant autorisation unique de mise en œuvre de traitements automatisés de données à caractère personnel relatifs à la gestion des applications billettiques par les exploitants et les autorités organisatrices de transport publics (décision d'autorisation unique n° AU-015) », les préoccupations de la CNIL sont notamment: –« L'autorité organisatrice de transport doit mettre en œuvre, dans la mesure du possible, les moyens nécessaires pour la préservation d'une alternative au titre nominatif quel que soit le type d'abonnements. Elle doit ainsi prévoir des abonnements sur des titres qui préservent l'anonymat des déplacements. » –Art.2: « les données de validation : date, heure, lieu de la validation ne peuvent être collectées et associées aux données d'identification de l'abonné (par exemple, son numéro de carte) que dans le cadre du traitement de la détection de la fraude ; ces données, non associées aux numéros de carte ou à quelque autre moyen d'identification directe des abonnés, peuvent être collectées à des fins statistiques » 14

15 Le système danonymisation –Art 4: « Dans le cadre des traitements mis en œuvre, les données de validation font l'objet d'une anonymisation à bref délai. Cette anonymisation est réalisée soit par la suppression complète du numéro de carte, soit par la suppression conjointe de la date, de l'heure et du lieu de passage, soit encore par l'application au numéro de carte d'un algorithme cryptographique de « hachage » public réputé fort. » –Art 5: Si l'anonymisation utilise un algorithme de « hachage », celui-ci est irréversible et doit recourir à une clé cryptographique renouvelable selon une périodicité au moins annuelle. Les composants ou les clés sont répartis entre plusieurs organismes ou plusieurs personnes habilitées, chacune ne disposant au plus que d'un composant ou clé, afin de garantir l'objectif de sécurité visé. » 15

16 Le système danonymisation Pour répondre aux souhaits de la CNIL: o Aucune donnée concernant lindividu porteur de la carte (CSP, âge, résidence,..) ne remonte dans le système. Ces données sont collectées au niveau transporteur uniquement. o Un système de double anonymisation du N° de carte (chez les transporteurs et au STIF) o Un changement trimestriel des clés danonymisation o Des durées de conservation adaptées aux usages ( de 2 à 5 ans) o Une infrastructure informatique permettant un niveau de sécurité en rapport avec le risque o Des éléments de sécurisation au niveau de lexploitation des données o Une gestion des habilitations et des profils des utilisateurs du système o Et la création dun pass « anonyme » attaché à aucun fichier client. 16

17 Le projet SIDV Lhistorique Les données La CNIL Type dexploitations 17

18 Aujourdhui, une semaine donnée, environ 1 million de personnes utilisent un forfait Navigo, une carte intégrale, une IR. Les remontées de validation sont fiables et le système est rodé. On peut donc: Disposer dune information homogène : oGrâce à lintégration tarifaire oPar lacquisition de données issues de lensemble des opérateurs de transport de la Région Apporter des mesures précises et « indépendantes » aux différents stades des prises de décisions du STIF : oConnaître plus précisément les usages des titres et de la mobilité pour évaluer les manques et carences oEvaluer et simuler limpact de mesures nouvelles oMesurer lincidence des décisions du STIF sur lusage des transports collectifs (consommation des titres, fréquentation des nouveaux services…) Les oportunités 18

19 3 exploitations particulières Adéquation offre / demande 19

20 Corrélation offre/trafic en période vacances Contexte : Problème dadéquation offre-demande remonté par les courriers voyageurs Le changement « offre dhiver » / « offre dété » seffectuerait une semaine trop tôt en juillet, entrainant un service non adapté à la demande des usagers Objectif : Illustrer lévolution de la fréquentation Problématique dadéquation offre – demande en été Proposer des arguments en faveur du maintien dune offre « dhiver » la seconde semaine de juillet Compensation en mettant en place une offre « d été » la dernière semaine de décembre pour garantir le même niveau doffre sur lannée 20

21 Corrélation offre/trafic en période vacances 21 RER B - Fréquentation journalière (JO) moyenne en heure de pointe du matin

22 Corrélation offre/trafic en période vacances 22 Conclusion de lanalyse : Le passage à lhoraire de juillet seffectue une semaine trop tôt Mise en évidence dune baisse de fréquentation de lordre de 10% par rapport au mois précédent correspondant à une baisse de loffre de lordre de 20% La fréquentation des deux dernières semaines de décembre, et en particulier celle de la dernière semaine, apparaît compatible avec un service réduit de juillet Ce quapporte lanalyse des DV : Apport déléments concrets dans le cadre dune négociation avec les transporteurs Limites : Fréquentation incomplète : biais lié à labsence du magnétique Gares du tronçon central non prises en compte dans lanalyse car il nest pas possible daffecter les validations des gares de correspondance à une ligne ferrée

23 3 exploitations particulières Zoom sur le rabattement gare 23

24 Zoom : le Rabattement OBJECTIFS DE LANALYSE DU RABATTEMENT AUX GARES L'analyse des périmètres de rabattement sur les gares a pour objectif de connaître la structure géographique et temporelle du bassin de rabattement à une gare de façon à mieux analyser : Lusage des lignes en rabattement l'aménagement (organisation des arrêts de bus, parking, …) autour de la gare. L'analyse du rabattement des bus sur les gares a pour objectif de : connaître la part de trafic de lignes de bus liée à un rabattement sur une gare ou plusieurs gares, connaître la part des validations en gare en provenance des modes bus, connaître par différence le rabattement sur la gare via les autres modes de transport (pied, vélo, voiture, …).

25 Zoom : le Rabattement Le rabattement/correspondance sur une gare consiste en l'utilisation d'un mode de transport permettant la correspondance avec cette gare. Sont distingués : la correspondance via le réseau ferré (métro, RER, train, …), le rabattement en bus/tramway, le rabattement via un autre mode de transport (pied, vélo, voiture, …). Le schéma ci-dessous présente les différents modes de rabattement ou correspondance à une gare.

26 Zoom : le Rabattement Dans le SIDV, on peut étudier: Rabattement vers une gare: -Le nombre de validations à une gare et les cartes ayant réalisées ces validations -Pour ces mêmes cartes, les validations précédentes ayant été réalisées moins de 45 minutes AVANT la validation en gare. On va alors restituer le mode, la station, la ligne …. de cette validation « précédente ». -OU Rabattement depuis une ligne de bus: -Les validations sur une ligne de bus et les cartes ayant réalisées ces validations -Pour ces mêmes cartes, les validations suivantes ayant été réalisées moins de 45 minutes APRES la validation bus. On va alors restituer la station ou la gare de cette validation « suivante ».

27 Zoom : le Rabattement Le 8 mars 2012, 4661 validations dentrée, dont 1114 cartes avec une validation réalisée moins de 45 minutes avant 1109 de ces validations ont été réalisés sur un mode de surface…….

28 Zoom : le Rabattement Ces 1109 validations peuvent être réparties par lignes et tranche horaire …….

29 3 exploitations particulières Restructuration dun pole 29

30 La restructuration Pointe du Lac Avant lexploitations du SIDV, un autre type dexploitations plus « classique », celui de fiches contrat RATP : Charge inter-arrêts JOB Exploitation des matrices OD JOB Mesure des descendants bus à une gare (<> rabattement avec emprunt du ferré)

31 La restructuration Pointe du Lac Compléter désormais par des exploitations SIDV : Gares de rabattement depuis les arrêts bus : vision ligne

32 La restructuration Pointe du Lac SIDV : part du rabattement vers gares au niveau des arrêts bus vision arrêt

33 La restructuration Pointe du Lac SIDV : gares de rabattement depuis les arrêts bus : vision multi-lignes

34 Le SIDV En résumé …. o Le système peut être considéré comme rodé. Les validations remontent correctement et exhaustivement, mais : les données sont sensibles et nécessite un traitement important les informations remontées sont nombreuses, parfois complexes et dépendent fortement de paramètres « exogènes » au système (taux de validation, qualité des référentiels, …) les risques de mauvaises interprétation aussi (journée particulière, valideurs en panne,..) Et encore: Seul le STIF peut réaliser certains types danalyse car il dispose de données multi- opérateurs Nécessite une expertise et une organisation importante pour faire connaitre les potentialités de loutil et ses limites, cibler les besoins de chacun, apporter un éclairage nouveau …. Nécessite de faire le travail à la main (pas de cartographie des pôles et de la position de chaque ligne de contrôle accessible facilement) Nécessite de travailler encore plus sur les référentiels, sur la connaissance des biais éventuels, et sur lexhaustivité des données (contrat STIF/transporteurs), daméliorer la qualité des données, ….. 34


Télécharger ppt "Le SIDV Système décisionnel pour lexploitation des remontées des données de validations télébillettiques."

Présentations similaires


Annonces Google