Des mathématiques élémentaires

Slides:



Advertisements
Présentations similaires
La place accordée à l’expression des salariés sur leur travail et leurs conditions de travail dans l’entreprise Résultats sondage exclusif CSA/ANACT.
Advertisements

2003 – TGMP EN CHIFFRES Les Agences Les Agences
Contexte et justification
Mais vous comprenez qu’il s’agit d’une « tromperie ».
ORTHOGRAM PM 3 ou 4 Ecrire: « a » ou « à » Référentiel page 6
Reporting de la Cellule Nationale Droit dOption Situation au 31 décembre 2011.
CHAPITRE 8 LES ALIMENTS 3/25/2017 Des fruits Madame Craven.
Additions soustractions
1 Plus loin dans lutilisation de Windows Vista ©Yves Roger Cornil - 2 août
1 Tournée Capital Souffle - du 03 octobre au 13 novembre Analyse des questionnaires recueillis sur les stands lors des actions régionales Capital.
Test statistique : principe
Les nombres.
Les numéros 70 –
ACTIVITES Les nombres entiers (2).
Xavier Mouranche Registre e-MUST Evaluation en Médecine dUrgence des Stratégies Thérapeutiques de lInfarctus du Myocarde.
Cours MIAGE « Architectures Orientées Services » Henry Boccon-Gibod 1 Orchestration de Web Services Module 5 Exercice Pratique à l'usage de l'environnement.
BILAN D’ACTIVITE DE LA CELLULE DES TRANSFERTS IN-UTERO D’ILE DE FRANCE
Comparaison d'une distribution observée à une distribution théorique
1. Les caractéristiques de dispersion. 11. Utilité.
CONFORMITE d’une distribution expérimentale à une distribution théorique Professeur Pascale FRIANT-MICHEL > Faculté de Pharmacie
Septembre 2008 La croissance 2.0 vue par les PME Principaux résultats Contacts TNS Sofres : Département Stratégies dopinion Emmanuel RIVIÈRE / Mathilde.
Acquisition de matériel Année 2006 ACQUISITION DE MATERIEL (Prévision) HT TVATTC Ordinateur 835,28 163,72 999,00 Photocopieur 3 989,00 781, ,84.
LES TRIANGLES 1. Définitions 2. Constructions 3. Propriétés.
Ecriture simplifiée d'une somme de relatifs
Données statistiques sur le droit doption au 31/01 8 février 2012.
Correspondances en Onco-Urologie - Vol. III - n° 3 – juillet-août-septembre VESSIE Daprès James ND et al., N Engl J Med 2012;366:16:
Technologies et pédagogie actives en FGA. Plan de latelier 1.Introduction 2.Les technologies en éducation 3.iPads 4.TNI 5.Ordinateurs portables 6.Téléphones.
Révision (p. 130, texte) Nombres (1-100).
La législation formation, les aides des pouvoirs publics
ASSEMBLEE GENERALE COMITE REGIONAL AERONAUTIQUE AUVERGNE ANNEE 2012.
Support de la conférence de François Chesnais autour de son livre : Les dettes illégitimes. Quand les banques font main basse sur les politiques publiques.
La méthodologie………………………………………………………….. p3 Les résultats
1 Juin 2010 Sondage auprès des jeunes Marocains résidant en Europe ( France, Espagne, Italie, Belgique, Pays-Bas et Allemagne ) Juin 2010 Réf. : TL251.
PROMOTION 2012 Les résultats. Baccalauréat général et technologique Filière STG CFE STG COM RH STG MERC LES 1ES 2S1S2S3TOTAL Nb de candidats
COMPTE ADMINISTRATIF BUDGET VILLE EXERCICE juin 2009.
Par Clément en vacances sur la Côte dAzur Le 23 février Découverte Junior Découverte Junior – Gérard Villemin.
La mesure de tendance centrale
Section de fonctionnement Dépenses 2012
QUALIPREF Synthèse de lenquête de satisfaction réalisée du 2 avril au 25 mai 2012 après réception de 306 questionnaires.
Présentation générale
Et la disparition de notre
Calcul mental Calcul mental Année scolaire Classe de …
Décomposer un nombre en facteurs premiers.
Les nombres.
Les quartiers Villeray – La Petite-Patrie et les voisinages
Fierté envers les symboles et institutions canadiens Jack Jedwab Association détudes canadiennes 26 novembre 2012.
Conseil Administration AFRAC – 2 décembre Toulouse 1 Fermes de références Palmipèdes à foie gras Synthèse régionale – Midi Pyrénées Exercice
2011 ma première année de running Ma 1 ère course : le 23 janvier 2011 à Mornas (vaucluse) Trial de 11,5 km 300m de dénivelé : 212 ème sur 335 en 1h04.
Les chiffres & les nombres
Les Monnaies et billets du FRANC Les Monnaies Euro.
DUMP GAUCHE INTERFERENCES AVEC BOITIERS IFS D.G. – Le – 1/56.
Les maths en francais 7ième année.
La Distribution des Données
Année universitaire Réalisé par: Dr. Aymen Ayari Cours Réseaux étendus LATRI 3 1.
Jean-Marc Léger Président Léger Marketing Léger Marketing Les élections présidentielles américaines.
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
1 INETOP
Veuillez trouver ci-joint
Aire d’une figure par encadrement
Écart moyen et écart type
Copyright 2011 – Les Chiffres Copyright 2011 –
Les fondements constitutionnels
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
Mise en forme en Mathématiques
1/65 微距摄影 美丽的微距摄影 Encore une belle leçon de Macrophotographies venant du Soleil Levant Louis.
1 - Programme de Seconde (juin 2009) Statistique et probabilités
CALENDRIER-PLAYBOY 2020.
Annexe Résultats provinciaux comparés à la moyenne canadienne
La formation des maîtres et la manifestation de la compétence professionnelle à intégrer les technologies de l'information et des communications (TIC)
Transcription de la présentation:

Des mathématiques élémentaires pour débusquer des fraudes ou des erreurs en économiE ou ailleurs …

Un peu de math…

Logarithme Le logarithme d’un nombre positif a, noté log a, est la puissance à laquelle il faut élever 10 pour obtenir a. log 1000 = 3 car 103 = 1000 log 0,01 = -2 car 10-2 = 0,01 log 2  0,301 car 100,301  2

Premier chiffre significatif 4 4853,746 0,003911  4 0,003911 3 

Notation scientifique 4853,746 0,003911 = 4,853746  103 mantisse 3,911  10-3 = mantisse

Loi de Benford…

Loi de Benford Expériences: Nombres extraits de coupures de journaux Prix relevés au hasard dans un magasin: prix sur un assez long ticket de caisse (ou assemblage de plusieurs), prix figurant sur une publicité, … Résultats des élections présidentielles françaises 2012 Résultats sportifs Nombre d’habitants de communes Altitudes de montagnes, longueurs de fleuves, … PIB d’un ensemble de pays Cours de la bourse Nombres extraits de comptabilité d’entreprises …

Premier chiffre significatif effectif fréquence 1 2 3 4 5 6 7 8 9 Total

Nombre d’habitants de communes

Premier chiffre significatif Nombre d’habitants des 36722 communes françaises au 1/1/2009 Premier chiffre significatif effectif fréquence 1 2 3 4 5 6 7 8 9 Total 11096 30,1 % 17,6 % 6682 4644 12,5 % 3450 9,7 % 2962 7,9 % 6,7 % 2411 2062 5,8 % 1801 5,1 % 1608 4,6 % 36716 100 %

Premier chiffre significatif du nombre d’habitants des communes françaises au 1er janvier 2009 36716 données (+ 6 communes vides!)

Premier chiffre significatif du nombre d’habitants des communes belges au 1er janvier 2011 589 données (aucune commune vide)

Loi de Benford

1881 Simon Newcomb (1835-1909)

1938 Frank Benford(1883-1948)

Un ensemble de valeurs numériques suit la loi des nombres anormaux lorsque, pour chaque chiffre c (donc de 1 à 9), la proportion de valeurs commençant par c vaut Benford

chiffre significatif c Premier chiffre significatif c Fréquence théorique 1 2 3 4 5 6 7 8 9 log( (1+1)/1) = log 2 = 0,301 log ((2+1)/2) = log 3/2 = 0,176 log ((3+1)/3) = log 4/3 = 0,125 log ((4+1)/4) = log 5/4 = 0,097 log ((5+1)/5) = log 6/5 = 0,079 log ((6+1)/6) = log 7/6 = 0,067 log ((7+1)/7) = log 8/7 = 0,058 log ((8+1)/8) = log 9/8 = 0,051 log ((9+1)/9) = log 10/9 = 0,046 1 Total

Nombre d’habitants de communes

Premier chiffre significatif du nombre d’habitants des communes françaises au 1er janvier 2009 36716 données (+ 6 communes vides!)

Premier chiffre significatif du nombre d’habitants des communes belges au 1er janvier 2011 589 données (aucune commune vide)

PIB en 2011

Premier chiffre significatif du PIB de (presque) tous les pays en 2011 183 données

Superficie des principaux pays

Premier chiffre significatif de la superficie des principaux pays du monde 88 données

Nombre de voies à des élections

Nombre de votes obtenus par les listes sur tout le royaume de Belgique, à la chambre le 13 juin 2010 Circonscription - Kieskring Circonscription d'Anvers - Kieskring Antwerpen Circonscription de Bruxelles-Hal-Vilvorde - Kieskring Brussel-Halle-Vilvoorde Circonscription de Louvain - Kieskring Leuven Circonscription du Brabant wallon - Kieskring Waals-Brabant Circonscription de Flandre occidentale - Kieskring West-Vlaanderen Circonscription de Flandre orientale - Kieskring Oost-Vlaanderen Circonscription de Hainaut - Kieskring Henegouwen Circonscription de Liège - Kieskring Luik Circonscription de Limbourg - Kieskring Limburg Circonscription de Luxembourg - Kieskring Luxemburg Circonscription de Namur - Kieskring Namen TOTAL - TOTAAL 1 Vlaams Belang 177'012 41'917 30'338   71'200 117'817 68'413 506'697 2 VIVANT 6'211 3 Lijst Dedecker 25'081 9'442 9'907 60'210 30'463 15'474 150'577 4 Open Vld 120'935 59'840 45'814 106'265 166'278 64'741 563'873 5 PS 139'660 51'146 348'184 216'827 45'869 92'857 894'543 6 MR 159'912 81'421 126'608 135'118 31'459 71'099 605'617 7 FN 5'476 20'129 7'986 33'591 8 CDH 67'324 29'331 82'924 84'393 50'564 45'905 360'441 9 CD&V 170'260 57'902 51'328 180'702 147'151 100'643 707'986 10 sp.a 156'976 38'689 56'176 118'803 135'212 97'011 602'867 11 N-VA 336'631 101'991 85'399 188'317 269'049 154'230 1'135'617 12 ecolo 66'681 37'152 67'993 83'791 18'853 38'577 313'047 13 GROEN! 84'314 25'186 30'905 49'533 70'297 25'754 285'989 BELG.UNIE 5'734 3'389 5'429 2'618 3'495 20'665 EGALITE 5'670 FN+ 11'553 Front des gauches 4'162 1'686 5'442 6'833 1'206 1'405 20'734 LSP 2'841 600 1'443 1'907 6'791 MP Education 2'572 MSplus 1'031 1'293 135 368 2'827 N 610 PIRATE PARTY 2'200 PROBRUXSEL 7'201 PTB+ 2'365 12'136 18'706 1'194 4'456 38'857 PTB+PVDA+ 9'313 PVDA+ 22'132 3'703 6'489 11'950 8'644 52'918 Parti Pensionné PP 6'688 Parti Populaire 21'143 11'461 19'852 18'642 3'922 8'985 84'005 R.W.F. 1'550 4'768 11'414 8'474 2'249 7'288 35'743 RESPECT 5'630 V.I.T.A.L. 2'259 VRIJHEID 1'576 W+ 1'136 1'679 1'675 1'367 5'857 WALLONIE D'ABORD 3'113 3'009 13'795 9'170 2'929 4'626 36'642 1'096'182 834'106 315'746 227'474 785'221 955'754 722'740 605'822 534'910 160'998 288'414 6'527'367

Premier chiffre significatif des nombres de votes à la chambre 178 données

Elections présidentielles 2012 2ème tour http://elections.interieur.gouv.fr/PR2012/

Résultats des élections présidentielles françaises 192 100 % pour les 96 départements métropolitains 2ème tour, 6 mai 2012 Premier chiffre significatif effectif fréquence 1 2 3 4 5 6 7 8 9 Total 66 34,4 % 15,6 % 30 27 14,1 % 19 9,9 % 10 5,2 % 4,7 % 9 12 6,3 % 10 5,2 % 9 4,7 % 192 100 %

Premier chiffre significatif des nombres de votes aux élections présidentielles, 2ème tour, 6 mai 2012 192 données

Elections présidentielles 2012 1er tour http://elections.interieur.gouv.fr/PR2012/

57 - Moselle

Résultats des élections présidentielles françaises 960 100 % pour les 96 départements métropolitains 1er tour, 22 avril 2012 Premier chiffre significatif effectif fréquence 1 2 3 4 5 6 7 8 9 Total 260 27,1 % 18 % 173 122 12,7 % 98 10,2 % 77 8 % 7,4 % 71 55 5,7 % 54 5,6 % 50 5,2 % 960 100 %

Premier chiffre significatif des nombres de votes aux élections présidentielles, 1er tour, 22 avril 2012 960 données

Prix dans des magasins

1er chiffre significatif des prix de pubs françaises, en automne 2012 145 données (prix du 26 septembre au 7 octobre 2012)

1er chiffre significatif des prix de pubs françaises, en automne 2012 239 données (prix du 26 septembre au 2 octobre 2012)

1er chiffre significatif des prix de pubs françaises, en automne 2012 882 données (prix du 25 septembre au 2 octobre 2012)

1er chiffre significatif des prix de pubs françaises, en automne 2012 145, 239 et 882 données (fin septembre - début octobre 2012)

1er chiffre significatif des prix de pubs françaises, en automne 2012 1266 données (fin septembre - début octobre 2012)

1er chiffre significatif des prix de pubs suisses, semaine 3 en 2010

1er chiffre significatif des prix de pubs suisses, semaine 3 en 2010

1er chiffre significatif des prix de pubs belges 236 données (7 au 13 juillet 2010)

Loi de Benford généralisée

Benford Benford généralisé avec c entier entre 1 et 9 Benford généralisé avec a et b réels entre 1 et 10

avec x réel entre 1 et 10

log((3+1)/3) = 0,125 log((2+1)/2) = 0,176 log((1+1)/1) = 0,301

P (2ème chiffre significatif = 3) 1er chiffre significatif i P ( 2ème chiffre significatif = 3 / 1er chiffre significatif = i ) = P ( i,3  mantisse  i,4 ) = log (i,4 / i,3) 1 2 3 4 5 6 7 8 9 P (2ème chiffre significatif = 3) log (1,4 / 1,3) = 0,032 log (2,4 / 2,3) = 0,018 log (3,4 / 3,3) = 0,013 log (4,4 / 4,3) = 0,010 log (5,4 / 5,3) = 0,008 log (6,4 / 6,3) = 0,007 log (7,4 / 7,3) = 0,006 log (8,4 / 8,3) = 0,005 log (9,4 / 9,3) = 0,005 0,104

2ème chiffre significatif i P ( 2ème chiffre significatif = i ) 1 2 3 4 5 6 7 8 9 Total 0,120 0,114 0,109 0,104 0,100 0,097 0,093 0,090 0,088 0,085 1

3ème chiffre significatif i P ( 3ème chiffre significatif = i ) 1 2 3 4 5 6 7 8 9 Total 0,1018 0,1014 0,1010 0,1006 0,1002 0,0998 0,0994 0,0990 0,0986 0,0983 1

Avec la loi de Benford généralisée, plus un chiffre est loin à droite du 1er chiffre significatif, plus il est distribué uniformément, plus il se distribue donc conformément à notre intuition…

Invariance…

1er chiffre significatif des prix de pubs françaises, en automne 2012 1266 données (fin septembre - début octobre 2012)

1er chiffre significatif des prix de pubs suisses, semaine 3 en 2010

Invariance par changement d’unités Si une série de données suit la loi de Benford généralisée, alors cette loi est également suivie après un changement d’unités! 1961 Roger Pinkham Prix : €  FS  $ Longueur: km  miles

est l’unique formulation pour obtenir une loi invariante  Roger Pinkham a même montré que: La loi de Benford est l’unique formulation pour obtenir une loi invariante par changement d’échelle.

Un peu de poésie…

c’est forcément la loi de Benford… Existe-t-il dans la nature, une sorte de loi universelle régissant la proportion de chacun des chiffres 1 à 9 comme 1er chiffre significatif ? Si une telle loi existe, elle doit forcément être valable indépendamment des unités de mesure humaines et par conséquent, en tenant compte du résultat de Pinkham, c’est forcément la loi de Benford…

Analyse des chiffres…

Revenus imposables de 14'414 compagnies américaines (d’après S. W. Smith, 2007)

Détection de fraudes (erreurs ou falsifications de données) dans les comptabilités ! Etats-Unis   L’Américain Mark Nigrini (www.nigrini.com) a amassé dès le début des années 1990 un grand nombre de preuves empiriques qui justifient l’usage de la loi de Benford comme indicateur de fraude.

Analyse des chiffres Depuis quand? Fait quoi? Comment? Pourquoi? Où? Discipline récente S’assure de la cohérence interne et de la vraisemblance de grandes quantités de données numériques Exploration systématique des chiffres des données Repérage d’anomalies de fréquences dans les chiffres et détection de données manipulées, falsifiées ou inventées Depuis une vingtaine d’années: Canada, USA Récemment: Introduction en Europe

Détection de fraudes (erreurs ou falsifications de données) dans les comptabilités ! Constatations expérimentales 1) Des données « honnêtes » suivent assez souvent la loi de Benford. 2) Si la fraude est délibérée, elles suivent rarement la loi de Benford.

L’éloignement à la loi de Benford peut amener une suspicion de fraude Attention! L’éloignement à la loi de Benford peut amener une suspicion de fraude mais ce n’est en aucun cas une preuve, d’autant plus que des comptabilités tout à fait honnêtes peuvent s’en éloigner très fortement ! Rien ne permet d’affirmer non plus que des données comptables qui suivent la loi de Benford sont nécessairement honnêtes!

Exemple de fraude détectée notamment grâce au non-respect de la loi de Benford En 1993, Wayne J. Nelson, employé du Trésor de l’état d’Arizona, est reconnu coupable d’avoir détourné près de 2 millions de dollars en versant à des personnes fictives 23 chèques dont voici les montants:

Date d’émission Montants en dollars 9 octobre 1992 1927.48 27902.31 19 octobre 1992 96879.27 91806.47 84991.67 90831.83 93766.67 88338.72 94639.49 83709.28 96412.21 88432.86 71552.16 14 octobre 1992 86241.90 72117.46 81321.75 97473.96 93249.11 89658.17 87776.89 92105.83 79949.16 87602.93 Total 1878687.58

Indices de fraude ?

Date d’émission Montants en dollars 9 octobre 1992 1927.48 27902.31 19 octobre 1992 96879.27 91806.47 84991.67 90831.83 93766.67 88338.72 94639.49 83709.28 96412.21 88432.86 71552.16 14 octobre 1992 86241.90 72117.46 81321.75 97473.96 93249.11 89658.17 87776.89 92105.83 79949.16 87602.93 Total 1878687.58 96 91 84 86 90 93 72  81 88 97 94 93 83 89 87   96 88 92 71 79 87

Indices de fraude Les chiffres significatifs sont à l’opposé de la loi de Benford (plus de 90 % commencent par 7, 8 ou 9).

Date d’émission Montants en dollars 9 octobre 1992 1927.48 27902.31 19 octobre 1992 96879.27 91806.47 84991.67 90831.83 93766.67 88338.72 94639.49 83709.28 96412.21 88432.86 71552.16 14 octobre 1992 86241.90 72117.46 81321.75 97473.96 93249.11 89658.17 87776.89 92105.83 79949.16 87602.93 Total 1878687.58 96 91 84 86 90 93 72  81 88 97 94 93 83 89 87   96 88 92 71 79 87

Indices de fraude Les chiffres significatifs sont à l’opposé de la loi de Benford (plus de 90 % commencent par 7, 8 ou 9). Valeurs d’abord petites, puis les montants et leurs fréquences ont augmenté.

Date d’émission Montants en dollars 9 octobre 1992 1927.48 27902.31 19 octobre 1992 96879.27 91806.47 84991.67 90831.83 93766.67 88338.72 94639.49 83709.28 96412.21 88432.86 71552.16 14 octobre 1992 86241.90 72117.46 81321.75 97473.96 93249.11 89658.17 87776.89 92105.83 79949.16 87602.93 Total 1878687.58 96 91 84 86 90 93 72  81 88 97 94 93 83 89 87   96 88 92 71 79 87

Indices de fraude Les chiffres significatifs sont à l’opposé de la loi de Benford (plus de 90 % commencent par 7, 8 ou 9). Valeurs d’abord petites, puis les montants et leurs fréquences ont augmenté. Tous les montants restent inférieurs à 100000 dollars. (Des montants supérieurs auraient sans doute dû être visés par un supérieur hiérarchique.)

Date d’émission Montants en dollars 9 octobre 1992 1927.48 27902.31 19 octobre 1992 96879.27 91806.47 84991.67 90831.83 93766.67 88338.72 94639.49 83709.28 96412.21 88432.86 71552.16 14 octobre 1992 86241.90 72117.46 81321.75 97473.96 93249.11 89658.17 87776.89 92105.83 79949.16 87602.93 Total 1878687.58 96 84 86 90 93 72  93 81 88 97 93 83 89 87   96 87 88 92 71 79 87

Indices de fraude Les chiffres significatifs sont à l’opposé de la loi de Benford (plus de 90 % commencent par 7, 8 ou 9). Valeurs d’abord petites, puis les montants et leurs fréquences ont augmenté. Tous les montants restent inférieurs à 100000 dollars. (Des montants supérieurs auraient sans doute dû être visés par un supérieur hiérarchique.) Les paires de premiers chiffres 87, 88, 93 et 96 ont été utilisées deux fois dans les 23 montants.

Etude minutieuse récente : A Etude minutieuse récente : A. Saville, Université de Prétoria, Afrique du Sud, 2006. Test statistique de la loi de Benford appliqué à 17 compagnies connues pour avoir manipulé leurs comptes : la loi de Benford n’était respectée dans aucun des 17 cas ! Test également appliqué à 17 compagnies « honnêtes » afin de détecter des faux positifs : 4 comptabilités ne satisfaisaient pas la loi de Benford.

Comptes d’une école neuchâteloise…

Premier chiffre significatif des comptes d’une école neuchâteloise en 2011 …

1er chiffre significatif des comptes d’une école neuchâteloise en 2011 105 données

Détection de fraudes plus générales Une étude de psychologie expérimentale (menée par A. Dickmann - Zurich) a montré que des sujets auxquels on demande de créer des données les produisent sans respecter la loi de Benford, même s’ils connaissent celle-ci. Au mieux, on retrouve une certaine conformité pour le 1er chiffre significatif. Mais dès qu’on s’intéresse au 2ème chiffre significatif, la distribution devient … à peu près n’importe quoi!

1er chiffre significatif des comptes d’une école neuchâteloise en 2011 105 données

2ème chiffre significatif des comptes d’une école neuchâteloise en 2011 105 données

3ème chiffre significatif des comptes d’une école neuchâteloise en 2011 105 données

Formation continue…

Pour les statisticiens…

Hypothèse nulle H0: « Les données suivent la loi de Benford. » Test d’hypothèse Les écarts entre les données comptables et la loi de Benford sont-ils significatifs? Hypothèse nulle H0: « Les données suivent la loi de Benford. » Degré de fiabilité:  (= 0,01 ou 0,02 ou 0,05 ou 0,10) est le risque d’erreur de première espèce qui quantifie le risque de rejeter l’hypothèse H0 alors qu’elle est vraie.

– effectifs théoriques données loi théorique Effectifs réels – effectifs théoriques xi effectif ni probabilité théorique (Benford) Pi Effectif théorique Npi 1 32 0,301 2 20 0,176 3 15 0,125 4 10 0,097 5 7 0,079 6 9 0,067 0,058 8 0,051 0,046 Somme N 31,608 0,392 0,154 0,005 18,490 1,510 2,281 0,123 13,119 1,881 3,540 0,270 10,176 -0,176 0,031 0,003 16 15,343 8,314 0,657 0,431 0,028 7,029 6,089 12 16,265 -4,265 18,188 1,118 5,371 4,805 1,547 = 105 = 105

Tabulation de la distribution du khi-carré 2  Aire =  Aire = 1 – 

Conclusion: Nous n’avons pas de raison de rejeter l’hypothèse nulle H0 qui dit que les données suivent la loi de Benford.  A méditer… Attention, cette conclusion est moins forte que de dire: les données suivent la loi de Benford…

Contre-exemples

Série de nombres construite avec un générateur de nombres aléatoires Numéros gagnants à une loterie Vos tailles Numéros de téléphone dans votre répertoire Numéros des maisons d’une rue …

Exemples « mathématiques »

1ère apparition de ce chiffre 1er chiffre sign. de 2n 1ère apparition de ce chiffre comme 1er C.S. 1 2 4 3 8 16 5 32 6 64 7 128 256 9 512 10 1024

1ère apparition de ce chiffre 1er chiffre sign. de 2n 1ère apparition de ce chiffre comme 1er C.S. 11 2048 2 12 4096 4 13 8192 8 14 16384 1 15 32768 3 16 65536 6 17 131072 18 262144 19 524288 5 20 1048576

1ère apparition de ce chiffre 1er chiffre sign. de 2n 1ère apparition de ce chiffre comme 1er C.S. 21 2097152 2 22 4194304 4 23 8388608 8 24 16777216 1 25 33554432 3 26 67108864 6 27 134217728 28 268435456 29 536870912 5 30 1073741824

1ère apparition de ce chiffre 1er chiffre sign. de 2n 1ère apparition de ce chiffre comme 1er C.S. 31 2147483648 2 32 4294967296 4 33 8589934592 8 34 17179869184 1 35 34359738368 3 36 68719476736 6 37 1.37439E+11 38 2.74878E+11 39 5.49756E+11 5 40 1.09951E+12

1ère apparition de ce chiffre 1er chiffre sign. de 2n 1ère apparition de ce chiffre comme 1er C.S. 41 2.19902E+12 2 42 4.39805E+12 4 43 8.79609E+12 8 44 1.75922E+13 1 45 3.51844E+13 3 46 7.03687E+13 7 47 1.40737E+14 48 2.81475E+14 49 5.6295E+14 5 50 1.1259E+15

1ère apparition de ce chiffre 1er chiffre sign. de 2n 1ère apparition de ce chiffre comme 1er C.S. 51 2.2518E+15 2 52 4.5036E+15 4 53 9.0072E+15 9 54 1.80144E+16 1 55 3.60288E+16 3 56 7.20576E+16 7 57 1.44115E+17 58 2.8823E+17 59 5.76461E+17 5 60 1.15292E+18

On constate qu’au plus l’exposant n grandit, au plus les fréquences d’apparitions des chiffres 1 à 9 comme 1ers chiffres significatifs se rapprochent des fréquences de la loi de Benford. Vladimir Arnold et André Avez ont démontré qu’asymptotiquement la suite 2n satisfait la loi de Benford.

1er chiffre significatif des n 1ers nombres de la suite 2n

1er chiffre significatif des n 1ers nombres de la suite 2n

1 1 2 3 5 8 13 21 34 … Le mathématicien suisse Paul Jolissaint a démontré que la célèbre suite de Fibonacci 1 1 2 3 5 8 13 21 34 … déjà connue pour plein de propriétés sympathiques ou amusantes, suit elle aussi asymptotiquement la loi de Benford !

Pourquoi des suites numériques issues du monde réel se conforment-elles raisonnablement à la loi de Benford ? Quelques tentatives d’explications… Ainsi des suites de nombres s’étalant sur plusieurs ordres de grandeur et de manière assez régulière s’approcheraient relativement bien de la loi de Benford.

Peut-être qu’un jour, quelque principe général qui nous échappe encore aujourd’hui, amènera une explication. Jean-Paul Delahaye