Spécificité : le croisement de trois compétences
Infographie : L’Antisèche du Parisien magazine
Dataviz : la page DataMatch de Paris-Match
Journalisme de données ou journalisme statistique ? Analyser des jeux de données pour produire de l’information. Statistique descriptive : Ensemble de techniques pour décrire un jeu de données. Statistique inférentielle : Utiliser les données pour apprendre quelque chose sur un paramètre auquel on s’intéresse. En général, le data-journalisme reste dans une démarche descriptive. Journalisme statistique : utiliser la statistique inférentielle pour répondre à des questions journalistiques.
EuroMillions : Quels numéros faut-il jouer ? Question : Une chance sur 116 millions de remporter la cagnotte mais a-t-on toujours la même probabilité de partager les gains ? Réponse : Si tous les joueurs jouent parfaitement au hasard : pas de stratégie gagnante Si certains joueurs ont des numéros fétiches, alors il faut jouer les numéros les moins souvent joués. Problème : Comment savoir si certains numéros sont plus joués que d'autres ?
Problème et intuition Données disponibles : Pas de données sur ce que jouent les joueurs Pour chaque tirage, on a les numéros et les étoiles tirés ainsi que le nombre de vainqueurs à chaque rang. Exemple : date : 09 mars 2014, boules : 2-20-27-33-45, étoiles : 6-10, vainqueurs au rang 1,2,3 : 28, etc Intuition : Utiliser le nombre moyen de vainqueurs quand un numéro est tiré pour estimer ce que jouent les joueurs. Le nombre de vainqueurs à chaque tirage est un sondage sur les stratégies des joueurs.
Résultats Numéros les plus souvent joués : 21 : joué dans 13% des grilles 37 : joué dans 8,5% des grilles Combinaisons les plus souvent jouées : 21-11-13-12-35 1-9 : 1 fois sur 40 millions 37-48-1-36-25 4-11 : 1 fois sur 300 millions
Quelle est la probabilité de partager le gain ? Si la probabilité qu'une grille soit jouée suit une loi de Bernouilli de paramètre p, le nombre de vainqueurs sachant que N grilles sont jouées suit une loi de Poisson de paramètres N * p. Résultat : Combinaison la plus souvent jouée : 40% de chances qu'il y ait au moins un autre vainqueur. Combinaison la moins souvent jouée : 6,5% de chances qu'il y ait au moins un autre vainqueur. En jouant les nombres les moins souvent joués, j'ai 6 fois moins de chances de partager le gain.
Pour en savoir plus Notre Site : www.askmedia.fr Notre Blog : www.askmedia.fr/blog Notre Twitter : @askmedia_