Télécharger la présentation
1
Des mathématiques élémentaires
pour débusquer des fraudes ou des erreurs en économiE ou ailleurs …
2
Un peu de math…
3
Logarithme Le logarithme d’un nombre positif a, noté log a, est la puissance à laquelle il faut élever 10 pour obtenir a. log 1000 = 3 car 103 = 1000 log 0,01 = -2 car = 0,01 log 2 0,301 car 100,301 2
4
Premier chiffre significatif
4 4853,746 0,003911 4 0,003911 3
5
Notation scientifique
4853,746 0,003911 = 4, 103 mantisse 3,911 10-3 = mantisse
6
Loi de Benford…
7
Loi de Benford Expériences: Nombres extraits de coupures de journaux
Prix relevés au hasard dans un magasin: prix sur un assez long ticket de caisse (ou assemblage de plusieurs), prix figurant sur une publicité, … Résultats des élections présidentielles françaises 2012 Résultats sportifs Nombre d’habitants de communes Altitudes de montagnes, longueurs de fleuves, … PIB d’un ensemble de pays Cours de la bourse Nombres extraits de comptabilité d’entreprises …
8
Premier chiffre significatif
effectif fréquence 1 2 3 4 5 6 7 8 9 Total
9
Nombre d’habitants de communes
12
Premier chiffre significatif
Nombre d’habitants des 36722 communes françaises au 1/1/2009 Premier chiffre significatif effectif fréquence 1 2 3 4 5 6 7 8 9 Total 11096 30,1 % 17,6 % 6682 4644 12,5 % 3450 9,7 % 2962 7,9 % 6,7 % 2411 2062 5,8 % 1801 5,1 % 1608 4,6 % 36716 100 %
13
Premier chiffre significatif du nombre d’habitants
des communes françaises au 1er janvier 2009 36716 données (+ 6 communes vides!)
14
Premier chiffre significatif du nombre d’habitants
des communes belges au 1er janvier 2011 589 données (aucune commune vide)
15
Loi de Benford
16
1881 Simon Newcomb ( )
17
1938 Frank Benford( )
18
Un ensemble de valeurs numériques suit la loi des nombres anormaux
lorsque, pour chaque chiffre c (donc de 1 à 9), la proportion de valeurs commençant par c vaut Benford
19
chiffre significatif c
Premier chiffre significatif c Fréquence théorique 1 2 3 4 5 6 7 8 9 log( (1+1)/1) = log 2 = 0,301 log ((2+1)/2) = log 3/2 = 0,176 log ((3+1)/3) = log 4/3 = 0,125 log ((4+1)/4) = log 5/4 = 0,097 log ((5+1)/5) = log 6/5 = 0,079 log ((6+1)/6) = log 7/6 = 0,067 log ((7+1)/7) = log 8/7 = 0,058 log ((8+1)/8) = log 9/8 = 0,051 log ((9+1)/9) = log 10/9 = 0,046 1 Total
21
Nombre d’habitants de communes
22
Premier chiffre significatif du nombre d’habitants
des communes françaises au 1er janvier 2009 36716 données (+ 6 communes vides!)
23
Premier chiffre significatif du nombre d’habitants
des communes belges au 1er janvier 2011 589 données (aucune commune vide)
24
PIB en 2011
27
Premier chiffre significatif du PIB de (presque) tous les pays en 2011
183 données
28
Superficie des principaux pays
31
Premier chiffre significatif de la superficie
des principaux pays du monde 88 données
32
Nombre de voies à des élections
33
Nombre de votes obtenus par les listes sur tout le royaume de Belgique, à la chambre le 13 juin 2010
Circonscription - Kieskring Circonscription d'Anvers - Kieskring Antwerpen Circonscription de Bruxelles-Hal-Vilvorde - Kieskring Brussel-Halle-Vilvoorde Circonscription de Louvain - Kieskring Leuven Circonscription du Brabant wallon - Kieskring Waals-Brabant Circonscription de Flandre occidentale - Kieskring West-Vlaanderen Circonscription de Flandre orientale - Kieskring Oost-Vlaanderen Circonscription de Hainaut - Kieskring Henegouwen Circonscription de Liège - Kieskring Luik Circonscription de Limbourg - Kieskring Limburg Circonscription de Luxembourg - Kieskring Luxemburg Circonscription de Namur - Kieskring Namen TOTAL - TOTAAL 1 Vlaams Belang 177'012 41'917 30'338 71'200 117'817 68'413 506'697 2 VIVANT 6'211 3 Lijst Dedecker 25'081 9'442 9'907 60'210 30'463 15'474 150'577 4 Open Vld 120'935 59'840 45'814 106'265 166'278 64'741 563'873 5 PS 139'660 51'146 348'184 216'827 45'869 92'857 894'543 6 MR 159'912 81'421 126'608 135'118 31'459 71'099 605'617 7 FN 5'476 20'129 7'986 33'591 8 CDH 67'324 29'331 82'924 84'393 50'564 45'905 360'441 9 CD&V 170'260 57'902 51'328 180'702 147'151 100'643 707'986 10 sp.a 156'976 38'689 56'176 118'803 135'212 97'011 602'867 11 N-VA 336'631 101'991 85'399 188'317 269'049 154'230 1'135'617 12 ecolo 66'681 37'152 67'993 83'791 18'853 38'577 313'047 13 GROEN! 84'314 25'186 30'905 49'533 70'297 25'754 285'989 BELG.UNIE 5'734 3'389 5'429 2'618 3'495 20'665 EGALITE 5'670 FN+ 11'553 Front des gauches 4'162 1'686 5'442 6'833 1'206 1'405 20'734 LSP 2'841 600 1'443 1'907 6'791 MP Education 2'572 MSplus 1'031 1'293 135 368 2'827 N 610 PIRATE PARTY 2'200 PROBRUXSEL 7'201 PTB+ 2'365 12'136 18'706 1'194 4'456 38'857 PTB+PVDA+ 9'313 PVDA+ 22'132 3'703 6'489 11'950 8'644 52'918 Parti Pensionné PP 6'688 Parti Populaire 21'143 11'461 19'852 18'642 3'922 8'985 84'005 R.W.F. 1'550 4'768 11'414 8'474 2'249 7'288 35'743 RESPECT 5'630 V.I.T.A.L. 2'259 VRIJHEID 1'576 W+ 1'136 1'679 1'675 1'367 5'857 WALLONIE D'ABORD 3'113 3'009 13'795 9'170 2'929 4'626 36'642 1'096'182 834'106 315'746 227'474 785'221 955'754 722'740 605'822 534'910 160'998 288'414 6'527'367
34
Premier chiffre significatif des nombres de votes à la chambre
178 données
35
Elections présidentielles 2012
2ème tour
39
Résultats des élections présidentielles françaises 192 100 %
pour les 96 départements métropolitains 2ème tour, 6 mai 2012 Premier chiffre significatif effectif fréquence 1 2 3 4 5 6 7 8 9 Total 66 34,4 % 15,6 % 30 27 14,1 % 19 9,9 % 10 5,2 % 4,7 % 9 12 6,3 % 10 5,2 % 9 4,7 % 192 100 %
40
Premier chiffre significatif des nombres de votes
aux élections présidentielles, 2ème tour, 6 mai 2012 192 données
41
Elections présidentielles 2012
1er tour
43
57 - Moselle
44
Résultats des élections présidentielles françaises 960 100 %
pour les 96 départements métropolitains 1er tour, 22 avril 2012 Premier chiffre significatif effectif fréquence 1 2 3 4 5 6 7 8 9 Total 260 27,1 % 18 % 173 122 12,7 % 98 10,2 % 77 8 % 7,4 % 71 55 5,7 % 54 5,6 % 50 5,2 % 960 100 %
45
Premier chiffre significatif des nombres de votes
aux élections présidentielles, 1er tour, 22 avril 2012 960 données
46
Prix dans des magasins
47
1er chiffre significatif des prix de pubs françaises, en automne 2012
145 données (prix du 26 septembre au 7 octobre 2012)
48
1er chiffre significatif des prix de pubs françaises, en automne 2012
239 données (prix du 26 septembre au 2 octobre 2012)
49
1er chiffre significatif des prix de pubs françaises, en automne 2012
882 données (prix du 25 septembre au 2 octobre 2012)
50
1er chiffre significatif des prix de pubs françaises, en automne 2012
145, 239 et 882 données (fin septembre - début octobre 2012)
51
1er chiffre significatif des prix de pubs françaises, en automne 2012
1266 données (fin septembre - début octobre 2012)
52
1er chiffre significatif des prix de pubs suisses,
semaine 3 en 2010
53
1er chiffre significatif des prix de pubs suisses,
semaine 3 en 2010
54
1er chiffre significatif des prix de pubs belges
236 données (7 au 13 juillet 2010)
55
Loi de Benford généralisée
56
Benford Benford généralisé
avec c entier entre 1 et 9 Benford généralisé avec a et b réels entre 1 et 10
57
avec x réel entre 1 et 10
58
log((3+1)/3) = 0,125 log((2+1)/2) = 0,176 log((1+1)/1) = 0,301
59
P (2ème chiffre significatif = 3)
1er chiffre significatif i P ( 2ème chiffre significatif = 3 / 1er chiffre significatif = i ) = P ( i,3 mantisse i,4 ) = log (i,4 / i,3) 1 2 3 4 5 6 7 8 9 P (2ème chiffre significatif = 3) log (1,4 / 1,3) = 0,032 log (2,4 / 2,3) = 0,018 log (3,4 / 3,3) = 0,013 log (4,4 / 4,3) = 0,010 log (5,4 / 5,3) = 0,008 log (6,4 / 6,3) = 0,007 log (7,4 / 7,3) = 0,006 log (8,4 / 8,3) = 0,005 log (9,4 / 9,3) = 0,005 0,104
60
2ème chiffre significatif i P ( 2ème chiffre significatif = i )
1 2 3 4 5 6 7 8 9 Total 0,120 0,114 0,109 0,104 0,100 0,097 0,093 0,090 0,088 0,085 1
62
3ème chiffre significatif i P ( 3ème chiffre significatif = i )
1 2 3 4 5 6 7 8 9 Total 0,1018 0,1014 0,1010 0,1006 0,1002 0,0998 0,0994 0,0990 0,0986 0,0983 1
64
Avec la loi de Benford généralisée,
plus un chiffre est loin à droite du 1er chiffre significatif, plus il est distribué uniformément, plus il se distribue donc conformément à notre intuition…
65
Invariance…
66
1er chiffre significatif des prix de pubs françaises, en automne 2012
1266 données (fin septembre - début octobre 2012)
67
1er chiffre significatif des prix de pubs suisses,
semaine 3 en 2010
68
Invariance par changement d’unités
Si une série de données suit la loi de Benford généralisée, alors cette loi est également suivie après un changement d’unités! 1961 Roger Pinkham Prix : € FS $ Longueur: km miles
69
est l’unique formulation pour obtenir une loi invariante
Roger Pinkham a même montré que: La loi de Benford est l’unique formulation pour obtenir une loi invariante par changement d’échelle.
70
Un peu de poésie…
71
c’est forcément la loi de Benford…
Existe-t-il dans la nature, une sorte de loi universelle régissant la proportion de chacun des chiffres 1 à 9 comme 1er chiffre significatif ? Si une telle loi existe, elle doit forcément être valable indépendamment des unités de mesure humaines et par conséquent, en tenant compte du résultat de Pinkham, c’est forcément la loi de Benford…
72
Analyse des chiffres…
73
Revenus imposables de 14'414 compagnies américaines (d’après S. W. Smith, 2007)
74
Détection de fraudes (erreurs ou falsifications de données) dans les comptabilités !
Etats-Unis L’Américain Mark Nigrini ( a amassé dès le début des années 1990 un grand nombre de preuves empiriques qui justifient l’usage de la loi de Benford comme indicateur de fraude.
75
Analyse des chiffres Depuis quand? Fait quoi? Comment? Pourquoi? Où?
Discipline récente S’assure de la cohérence interne et de la vraisemblance de grandes quantités de données numériques Exploration systématique des chiffres des données Repérage d’anomalies de fréquences dans les chiffres et détection de données manipulées, falsifiées ou inventées Depuis une vingtaine d’années: Canada, USA Récemment: Introduction en Europe
76
Détection de fraudes (erreurs ou falsifications de données) dans les comptabilités !
Constatations expérimentales 1) Des données « honnêtes » suivent assez souvent la loi de Benford. 2) Si la fraude est délibérée, elles suivent rarement la loi de Benford.
77
L’éloignement à la loi de Benford peut amener une suspicion de fraude
Attention! L’éloignement à la loi de Benford peut amener une suspicion de fraude mais ce n’est en aucun cas une preuve, d’autant plus que des comptabilités tout à fait honnêtes peuvent s’en éloigner très fortement ! Rien ne permet d’affirmer non plus que des données comptables qui suivent la loi de Benford sont nécessairement honnêtes!
78
Exemple de fraude détectée notamment grâce au non-respect de la loi de Benford
En 1993, Wayne J. Nelson, employé du Trésor de l’état d’Arizona, est reconnu coupable d’avoir détourné près de 2 millions de dollars en versant à des personnes fictives 23 chèques dont voici les montants:
79
Date d’émission Montants en dollars 9 octobre 1992 1927.48 27902.31 19 octobre 1992 96879.27 91806.47 84991.67 90831.83 93766.67 88338.72 94639.49 83709.28 96412.21 88432.86 71552.16 14 octobre 1992 86241.90 72117.46 81321.75 97473.96 93249.11 89658.17 87776.89 92105.83 79949.16 87602.93 Total 1878687.58
80
Indices de fraude ?
81
Date d’émission Montants en dollars 9 octobre 1992 1927.48 27902.31 19 octobre 1992 96879.27 91806.47 84991.67 90831.83 93766.67 88338.72 94639.49 83709.28 96412.21 88432.86 71552.16 14 octobre 1992 86241.90 72117.46 81321.75 97473.96 93249.11 89658.17 87776.89 92105.83 79949.16 87602.93 Total 1878687.58 96 91 84 86 90 93 72 81 88 97 94 93 83 89 87 96 88 92 71 79 87
82
Indices de fraude Les chiffres significatifs sont à l’opposé de la loi de Benford (plus de 90 % commencent par 7, 8 ou 9).
83
Date d’émission Montants en dollars 9 octobre 1992 1927.48 27902.31 19 octobre 1992 96879.27 91806.47 84991.67 90831.83 93766.67 88338.72 94639.49 83709.28 96412.21 88432.86 71552.16 14 octobre 1992 86241.90 72117.46 81321.75 97473.96 93249.11 89658.17 87776.89 92105.83 79949.16 87602.93 Total 1878687.58 96 91 84 86 90 93 72 81 88 97 94 93 83 89 87 96 88 92 71 79 87
84
Indices de fraude Les chiffres significatifs sont à l’opposé de la loi de Benford (plus de 90 % commencent par 7, 8 ou 9). Valeurs d’abord petites, puis les montants et leurs fréquences ont augmenté.
85
Date d’émission Montants en dollars 9 octobre 1992 1927.48 27902.31 19 octobre 1992 96879.27 91806.47 84991.67 90831.83 93766.67 88338.72 94639.49 83709.28 96412.21 88432.86 71552.16 14 octobre 1992 86241.90 72117.46 81321.75 97473.96 93249.11 89658.17 87776.89 92105.83 79949.16 87602.93 Total 1878687.58 96 91 84 86 90 93 72 81 88 97 94 93 83 89 87 96 88 92 71 79 87
86
Indices de fraude Les chiffres significatifs sont à l’opposé de la loi de Benford (plus de 90 % commencent par 7, 8 ou 9). Valeurs d’abord petites, puis les montants et leurs fréquences ont augmenté. Tous les montants restent inférieurs à 100000 dollars. (Des montants supérieurs auraient sans doute dû être visés par un supérieur hiérarchique.)
87
Date d’émission Montants en dollars 9 octobre 1992 1927.48 27902.31 19 octobre 1992 96879.27 91806.47 84991.67 90831.83 93766.67 88338.72 94639.49 83709.28 96412.21 88432.86 71552.16 14 octobre 1992 86241.90 72117.46 81321.75 97473.96 93249.11 89658.17 87776.89 92105.83 79949.16 87602.93 Total 1878687.58 96 84 86 90 93 72 93 81 88 97 93 83 89 87 96 87 88 92 71 79 87
88
Indices de fraude Les chiffres significatifs sont à l’opposé de la loi de Benford (plus de 90 % commencent par 7, 8 ou 9). Valeurs d’abord petites, puis les montants et leurs fréquences ont augmenté. Tous les montants restent inférieurs à 100000 dollars. (Des montants supérieurs auraient sans doute dû être visés par un supérieur hiérarchique.) Les paires de premiers chiffres 87, 88, 93 et 96 ont été utilisées deux fois dans les 23 montants.
89
Etude minutieuse récente : A
Etude minutieuse récente : A. Saville, Université de Prétoria, Afrique du Sud, 2006. Test statistique de la loi de Benford appliqué à 17 compagnies connues pour avoir manipulé leurs comptes : la loi de Benford n’était respectée dans aucun des 17 cas ! Test également appliqué à 17 compagnies « honnêtes » afin de détecter des faux positifs : 4 comptabilités ne satisfaisaient pas la loi de Benford.
90
Comptes d’une école neuchâteloise…
91
Premier chiffre significatif des comptes d’une école neuchâteloise en 2011
…
92
1er chiffre significatif des comptes d’une école neuchâteloise en 2011
105 données
93
Détection de fraudes plus générales
Une étude de psychologie expérimentale (menée par A. Dickmann - Zurich) a montré que des sujets auxquels on demande de créer des données les produisent sans respecter la loi de Benford, même s’ils connaissent celle-ci. Au mieux, on retrouve une certaine conformité pour le 1er chiffre significatif. Mais dès qu’on s’intéresse au 2ème chiffre significatif, la distribution devient … à peu près n’importe quoi!
95
1er chiffre significatif des comptes d’une école neuchâteloise en 2011
105 données
96
2ème chiffre significatif des comptes d’une école neuchâteloise en 2011
105 données
97
3ème chiffre significatif des comptes d’une école neuchâteloise en 2011
105 données
98
Formation continue…
101
Pour les statisticiens…
102
Hypothèse nulle H0: « Les données suivent la loi de Benford. »
Test d’hypothèse Les écarts entre les données comptables et la loi de Benford sont-ils significatifs? Hypothèse nulle H0: « Les données suivent la loi de Benford. » Degré de fiabilité: (= 0,01 ou 0,02 ou 0,05 ou 0,10) est le risque d’erreur de première espèce qui quantifie le risque de rejeter l’hypothèse H0 alors qu’elle est vraie.
103
– effectifs théoriques
données loi théorique Effectifs réels – effectifs théoriques xi effectif ni probabilité théorique (Benford) Pi Effectif théorique Npi 1 32 0,301 2 20 0,176 3 15 0,125 4 10 0,097 5 7 0,079 6 9 0,067 0,058 8 0,051 0,046 Somme N 31,608 0,392 0,154 0,005 18,490 1,510 2,281 0,123 13,119 1,881 3,540 0,270 10,176 -0,176 0,031 0,003 16 15,343 8,314 0,657 0,431 0,028 7,029 6,089 12 16,265 -4,265 18,188 1,118 5,371 4,805 1,547 = 105 = 105
104
Tabulation de la distribution du khi-carré 2
Aire = Aire = 1 –
105
Conclusion: Nous n’avons pas de raison de rejeter l’hypothèse nulle H0
qui dit que les données suivent la loi de Benford. A méditer… Attention, cette conclusion est moins forte que de dire: les données suivent la loi de Benford…
106
Contre-exemples
107
Série de nombres construite avec un générateur de nombres aléatoires
Numéros gagnants à une loterie Vos tailles Numéros de téléphone dans votre répertoire Numéros des maisons d’une rue …
108
Exemples « mathématiques »
109
1ère apparition de ce chiffre
1er chiffre sign. de 2n 1ère apparition de ce chiffre comme 1er C.S. 1 2 4 3 8 16 5 32 6 64 7 128 256 9 512 10 1024
110
1ère apparition de ce chiffre
1er chiffre sign. de 2n 1ère apparition de ce chiffre comme 1er C.S. 11 2048 2 12 4096 4 13 8192 8 14 16384 1 15 32768 3 16 65536 6 17 131072 18 262144 19 524288 5 20
111
1ère apparition de ce chiffre
1er chiffre sign. de 2n 1ère apparition de ce chiffre comme 1er C.S. 21 2 22 4 23 8 24 1 25 3 26 6 27 28 29 5 30
112
1ère apparition de ce chiffre
1er chiffre sign. de 2n 1ère apparition de ce chiffre comme 1er C.S. 31 2 32 4 33 8 34 1 35 3 36 6 37 E+11 38 E+11 39 E+11 5 40 E+12
113
1ère apparition de ce chiffre
1er chiffre sign. de 2n 1ère apparition de ce chiffre comme 1er C.S. 41 E+12 2 42 E+12 4 43 E+12 8 44 E+13 1 45 E+13 3 46 E+13 7 47 E+14 48 E+14 49 5.6295E+14 5 50 1.1259E+15
114
1ère apparition de ce chiffre
1er chiffre sign. de 2n 1ère apparition de ce chiffre comme 1er C.S. 51 2.2518E+15 2 52 4.5036E+15 4 53 9.0072E+15 9 54 E+16 1 55 E+16 3 56 E+16 7 57 E+17 58 2.8823E+17 59 E+17 5 60 E+18
115
On constate qu’au plus l’exposant n grandit,
au plus les fréquences d’apparitions des chiffres 1 à 9 comme 1ers chiffres significatifs se rapprochent des fréquences de la loi de Benford. Vladimir Arnold et André Avez ont démontré qu’asymptotiquement la suite 2n satisfait la loi de Benford.
116
1er chiffre significatif des n 1ers nombres de la suite 2n
117
1er chiffre significatif des n 1ers nombres de la suite 2n
118
1 1 2 3 5 8 13 21 34 … Le mathématicien suisse Paul Jolissaint
a démontré que la célèbre suite de Fibonacci … déjà connue pour plein de propriétés sympathiques ou amusantes, suit elle aussi asymptotiquement la loi de Benford !
119
Pourquoi des suites numériques issues du monde réel se conforment-elles raisonnablement à la loi de Benford ? Quelques tentatives d’explications… Ainsi des suites de nombres s’étalant sur plusieurs ordres de grandeur et de manière assez régulière s’approcheraient relativement bien de la loi de Benford.
120
Peut-être qu’un jour, quelque principe général qui nous échappe encore aujourd’hui, amènera une explication. Jean-Paul Delahaye
Présentations similaires
© 2024 SlidePlayer.fr Inc.
All rights reserved.