La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Des mathématiques élémentaires

Présentations similaires


Présentation au sujet: "Des mathématiques élémentaires"— Transcription de la présentation:

1 Des mathématiques élémentaires
pour débusquer des fraudes ou des erreurs en économiE ou ailleurs …

2 Un peu de math…

3 Logarithme Le logarithme d’un nombre positif a, noté log a, est la puissance à laquelle il faut élever 10 pour obtenir a. log 1000 = 3 car 103 = 1000 log 0,01 = -2 car = 0,01 log 2  0,301 car 100,301  2

4 Premier chiffre significatif
4 4853,746 0,003911 4 0,003911 3

5 Notation scientifique
4853,746 0,003911 = 4,  103 mantisse 3,911  10-3 = mantisse

6 Loi de Benford…

7 Loi de Benford Expériences: Nombres extraits de coupures de journaux
Prix relevés au hasard dans un magasin: prix sur un assez long ticket de caisse (ou assemblage de plusieurs), prix figurant sur une publicité, … Résultats des élections présidentielles françaises 2012 Résultats sportifs Nombre d’habitants de communes Altitudes de montagnes, longueurs de fleuves, … PIB d’un ensemble de pays Cours de la bourse Nombres extraits de comptabilité d’entreprises

8 Premier chiffre significatif
effectif fréquence 1 2 3 4 5 6 7 8 9 Total

9 Nombre d’habitants de communes

10

11

12 Premier chiffre significatif
Nombre d’habitants des 36722 communes françaises au 1/1/2009 Premier chiffre significatif effectif fréquence 1 2 3 4 5 6 7 8 9 Total 11096 30,1 % 17,6 % 6682 4644 12,5 % 3450 9,7 % 2962 7,9 % 6,7 % 2411 2062 5,8 % 1801 5,1 % 1608 4,6 % 36716 100 %

13 Premier chiffre significatif du nombre d’habitants
des communes françaises au 1er janvier 2009 36716 données (+ 6 communes vides!)

14 Premier chiffre significatif du nombre d’habitants
des communes belges au 1er janvier 2011 589 données (aucune commune vide)

15 Loi de Benford

16 1881 Simon Newcomb ( )

17 1938 Frank Benford( )

18 Un ensemble de valeurs numériques suit la loi des nombres anormaux
lorsque, pour chaque chiffre c (donc de 1 à 9), la proportion de valeurs commençant par c vaut Benford

19 chiffre significatif c
Premier chiffre significatif c Fréquence théorique 1 2 3 4 5 6 7 8 9 log( (1+1)/1) = log 2 = 0,301 log ((2+1)/2) = log 3/2 = 0,176 log ((3+1)/3) = log 4/3 = 0,125 log ((4+1)/4) = log 5/4 = 0,097 log ((5+1)/5) = log 6/5 = 0,079 log ((6+1)/6) = log 7/6 = 0,067 log ((7+1)/7) = log 8/7 = 0,058 log ((8+1)/8) = log 9/8 = 0,051 log ((9+1)/9) = log 10/9 = 0,046 1 Total

20

21 Nombre d’habitants de communes

22 Premier chiffre significatif du nombre d’habitants
des communes françaises au 1er janvier 2009 36716 données (+ 6 communes vides!)

23 Premier chiffre significatif du nombre d’habitants
des communes belges au 1er janvier 2011 589 données (aucune commune vide)

24 PIB en 2011

25

26

27 Premier chiffre significatif du PIB de (presque) tous les pays en 2011
183 données

28 Superficie des principaux pays

29

30

31 Premier chiffre significatif de la superficie
des principaux pays du monde 88 données

32 Nombre de voies à des élections

33 Nombre de votes obtenus par les listes sur tout le royaume de Belgique, à la chambre le 13 juin 2010
Circonscription - Kieskring Circonscription d'Anvers - Kieskring Antwerpen Circonscription de Bruxelles-Hal-Vilvorde - Kieskring Brussel-Halle-Vilvoorde Circonscription de Louvain - Kieskring Leuven Circonscription du Brabant wallon - Kieskring Waals-Brabant Circonscription de Flandre occidentale - Kieskring West-Vlaanderen Circonscription de Flandre orientale - Kieskring Oost-Vlaanderen Circonscription de Hainaut - Kieskring Henegouwen Circonscription de Liège - Kieskring Luik Circonscription de Limbourg - Kieskring Limburg Circonscription de Luxembourg - Kieskring Luxemburg Circonscription de Namur - Kieskring Namen TOTAL - TOTAAL 1 Vlaams Belang 177'012 41'917 30'338 71'200 117'817 68'413 506'697 2 VIVANT 6'211 3 Lijst Dedecker 25'081 9'442 9'907 60'210 30'463 15'474 150'577 4 Open Vld 120'935 59'840 45'814 106'265 166'278 64'741 563'873 5 PS 139'660 51'146 348'184 216'827 45'869 92'857 894'543 6 MR 159'912 81'421 126'608 135'118 31'459 71'099 605'617 7 FN 5'476 20'129 7'986 33'591 8 CDH 67'324 29'331 82'924 84'393 50'564 45'905 360'441 9 CD&V 170'260 57'902 51'328 180'702 147'151 100'643 707'986 10 sp.a 156'976 38'689 56'176 118'803 135'212 97'011 602'867 11 N-VA 336'631 101'991 85'399 188'317 269'049 154'230 1'135'617 12 ecolo 66'681 37'152 67'993 83'791 18'853 38'577 313'047 13 GROEN! 84'314 25'186 30'905 49'533 70'297 25'754 285'989 BELG.UNIE 5'734 3'389 5'429 2'618 3'495 20'665 EGALITE 5'670 FN+ 11'553 Front des gauches 4'162 1'686 5'442 6'833 1'206 1'405 20'734 LSP 2'841 600 1'443 1'907 6'791 MP Education 2'572 MSplus 1'031 1'293 135 368 2'827 N 610 PIRATE PARTY 2'200 PROBRUXSEL 7'201 PTB+ 2'365 12'136 18'706 1'194 4'456 38'857 PTB+PVDA+ 9'313 PVDA+ 22'132 3'703 6'489 11'950 8'644 52'918 Parti Pensionné PP 6'688 Parti Populaire 21'143 11'461 19'852 18'642 3'922 8'985 84'005 R.W.F. 1'550 4'768 11'414 8'474 2'249 7'288 35'743 RESPECT 5'630 V.I.T.A.L. 2'259 VRIJHEID 1'576 W+ 1'136 1'679 1'675 1'367 5'857 WALLONIE D'ABORD 3'113 3'009 13'795 9'170 2'929 4'626 36'642 1'096'182 834'106 315'746 227'474 785'221 955'754 722'740 605'822 534'910 160'998 288'414 6'527'367

34 Premier chiffre significatif des nombres de votes à la chambre
178 données

35 Elections présidentielles 2012
2ème tour

36

37

38

39 Résultats des élections présidentielles françaises 192 100 %
pour les 96 départements métropolitains 2ème tour, 6 mai 2012 Premier chiffre significatif effectif fréquence 1 2 3 4 5 6 7 8 9 Total 66 34,4 % 15,6 % 30 27 14,1 % 19 9,9 % 10 5,2 % 4,7 % 9 12 6,3 % 10 5,2 % 9 4,7 % 192 100 %

40 Premier chiffre significatif des nombres de votes
aux élections présidentielles, 2ème tour, 6 mai 2012 192 données

41 Elections présidentielles 2012
1er tour

42

43 57 - Moselle

44 Résultats des élections présidentielles françaises 960 100 %
pour les 96 départements métropolitains 1er tour, 22 avril 2012 Premier chiffre significatif effectif fréquence 1 2 3 4 5 6 7 8 9 Total 260 27,1 % 18 % 173 122 12,7 % 98 10,2 % 77 8 % 7,4 % 71 55 5,7 % 54 5,6 % 50 5,2 % 960 100 %

45 Premier chiffre significatif des nombres de votes
aux élections présidentielles, 1er tour, 22 avril 2012 960 données

46 Prix dans des magasins

47 1er chiffre significatif des prix de pubs françaises, en automne 2012
145 données (prix du 26 septembre au 7 octobre 2012)

48 1er chiffre significatif des prix de pubs françaises, en automne 2012
239 données (prix du 26 septembre au 2 octobre 2012)

49 1er chiffre significatif des prix de pubs françaises, en automne 2012
882 données (prix du 25 septembre au 2 octobre 2012)

50 1er chiffre significatif des prix de pubs françaises, en automne 2012
145, 239 et 882 données (fin septembre - début octobre 2012)

51 1er chiffre significatif des prix de pubs françaises, en automne 2012
1266 données (fin septembre - début octobre 2012)

52 1er chiffre significatif des prix de pubs suisses,
semaine 3 en 2010

53 1er chiffre significatif des prix de pubs suisses,
semaine 3 en 2010

54 1er chiffre significatif des prix de pubs belges
236 données (7 au 13 juillet 2010)

55 Loi de Benford généralisée

56 Benford Benford généralisé
avec c entier entre 1 et 9 Benford généralisé avec a et b réels entre 1 et 10

57 avec x réel entre 1 et 10

58 log((3+1)/3) = 0,125 log((2+1)/2) = 0,176 log((1+1)/1) = 0,301

59 P (2ème chiffre significatif = 3)
1er chiffre significatif i P ( 2ème chiffre significatif = 3 / 1er chiffre significatif = i ) = P ( i,3  mantisse  i,4 ) = log (i,4 / i,3) 1 2 3 4 5 6 7 8 9 P (2ème chiffre significatif = 3) log (1,4 / 1,3) = 0,032 log (2,4 / 2,3) = 0,018 log (3,4 / 3,3) = 0,013 log (4,4 / 4,3) = 0,010 log (5,4 / 5,3) = 0,008 log (6,4 / 6,3) = 0,007 log (7,4 / 7,3) = 0,006 log (8,4 / 8,3) = 0,005 log (9,4 / 9,3) = 0,005 0,104

60 2ème chiffre significatif i P ( 2ème chiffre significatif = i )
1 2 3 4 5 6 7 8 9 Total 0,120 0,114 0,109 0,104 0,100 0,097 0,093 0,090 0,088 0,085 1

61

62 3ème chiffre significatif i P ( 3ème chiffre significatif = i )
1 2 3 4 5 6 7 8 9 Total 0,1018 0,1014 0,1010 0,1006 0,1002 0,0998 0,0994 0,0990 0,0986 0,0983 1

63

64 Avec la loi de Benford généralisée,
plus un chiffre est loin à droite du 1er chiffre significatif, plus il est distribué uniformément, plus il se distribue donc conformément à notre intuition…

65 Invariance…

66 1er chiffre significatif des prix de pubs françaises, en automne 2012
1266 données (fin septembre - début octobre 2012)

67 1er chiffre significatif des prix de pubs suisses,
semaine 3 en 2010

68 Invariance par changement d’unités
Si une série de données suit la loi de Benford généralisée, alors cette loi est également suivie après un changement d’unités! 1961 Roger Pinkham Prix : €  FS  $ Longueur: km  miles

69 est l’unique formulation pour obtenir une loi invariante
 Roger Pinkham a même montré que: La loi de Benford est l’unique formulation pour obtenir une loi invariante par changement d’échelle.

70 Un peu de poésie…

71 c’est forcément la loi de Benford…
Existe-t-il dans la nature, une sorte de loi universelle régissant la proportion de chacun des chiffres 1 à 9 comme 1er chiffre significatif ? Si une telle loi existe, elle doit forcément être valable indépendamment des unités de mesure humaines et par conséquent, en tenant compte du résultat de Pinkham, c’est forcément la loi de Benford…

72 Analyse des chiffres…

73 Revenus imposables de 14'414 compagnies américaines (d’après S. W. Smith, 2007)

74 Détection de fraudes (erreurs ou falsifications de données) dans les comptabilités !
Etats-Unis L’Américain Mark Nigrini ( a amassé dès le début des années 1990 un grand nombre de preuves empiriques qui justifient l’usage de la loi de Benford comme indicateur de fraude.

75 Analyse des chiffres Depuis quand? Fait quoi? Comment? Pourquoi? Où?
Discipline récente S’assure de la cohérence interne et de la vraisemblance de grandes quantités de données numériques Exploration systématique des chiffres des données Repérage d’anomalies de fréquences dans les chiffres et détection de données manipulées, falsifiées ou inventées Depuis une vingtaine d’années: Canada, USA Récemment: Introduction en Europe

76 Détection de fraudes (erreurs ou falsifications de données) dans les comptabilités !
Constatations expérimentales 1) Des données « honnêtes » suivent assez souvent la loi de Benford. 2) Si la fraude est délibérée, elles suivent rarement la loi de Benford.

77 L’éloignement à la loi de Benford peut amener une suspicion de fraude
Attention! L’éloignement à la loi de Benford peut amener une suspicion de fraude mais ce n’est en aucun cas une preuve, d’autant plus que des comptabilités tout à fait honnêtes peuvent s’en éloigner très fortement ! Rien ne permet d’affirmer non plus que des données comptables qui suivent la loi de Benford sont nécessairement honnêtes!

78 Exemple de fraude détectée notamment grâce au non-respect de la loi de Benford
En 1993, Wayne J. Nelson, employé du Trésor de l’état d’Arizona, est reconnu coupable d’avoir détourné près de 2 millions de dollars en versant à des personnes fictives 23 chèques dont voici les montants:

79 Date d’émission Montants en dollars 9 octobre 1992 1927.48 27902.31 19 octobre 1992 96879.27 91806.47 84991.67 90831.83 93766.67 88338.72 94639.49 83709.28 96412.21 88432.86 71552.16 14 octobre 1992 86241.90 72117.46 81321.75 97473.96 93249.11 89658.17 87776.89 92105.83 79949.16 87602.93 Total 1878687.58

80 Indices de fraude ?

81 Date d’émission Montants en dollars 9 octobre 1992 1927.48 27902.31 19 octobre 1992 96879.27 91806.47 84991.67 90831.83 93766.67 88338.72 94639.49 83709.28 96412.21 88432.86 71552.16 14 octobre 1992 86241.90 72117.46 81321.75 97473.96 93249.11 89658.17 87776.89 92105.83 79949.16 87602.93 Total 1878687.58 96 91 84 86 90 93 72  81 88 97 94 93 83 89 87   96 88 92 71 79 87

82 Indices de fraude Les chiffres significatifs sont à l’opposé de la loi de Benford (plus de 90 % commencent par 7, 8 ou 9).

83 Date d’émission Montants en dollars 9 octobre 1992 1927.48 27902.31 19 octobre 1992 96879.27 91806.47 84991.67 90831.83 93766.67 88338.72 94639.49 83709.28 96412.21 88432.86 71552.16 14 octobre 1992 86241.90 72117.46 81321.75 97473.96 93249.11 89658.17 87776.89 92105.83 79949.16 87602.93 Total 1878687.58 96 91 84 86 90 93 72  81 88 97 94 93 83 89 87   96 88 92 71 79 87

84 Indices de fraude Les chiffres significatifs sont à l’opposé de la loi de Benford (plus de 90 % commencent par 7, 8 ou 9). Valeurs d’abord petites, puis les montants et leurs fréquences ont augmenté.

85 Date d’émission Montants en dollars 9 octobre 1992 1927.48 27902.31 19 octobre 1992 96879.27 91806.47 84991.67 90831.83 93766.67 88338.72 94639.49 83709.28 96412.21 88432.86 71552.16 14 octobre 1992 86241.90 72117.46 81321.75 97473.96 93249.11 89658.17 87776.89 92105.83 79949.16 87602.93 Total 1878687.58 96 91 84 86 90 93 72  81 88 97 94 93 83 89 87   96 88 92 71 79 87

86 Indices de fraude Les chiffres significatifs sont à l’opposé de la loi de Benford (plus de 90 % commencent par 7, 8 ou 9). Valeurs d’abord petites, puis les montants et leurs fréquences ont augmenté. Tous les montants restent inférieurs à 100000 dollars. (Des montants supérieurs auraient sans doute dû être visés par un supérieur hiérarchique.)

87 Date d’émission Montants en dollars 9 octobre 1992 1927.48 27902.31 19 octobre 1992 96879.27 91806.47 84991.67 90831.83 93766.67 88338.72 94639.49 83709.28 96412.21 88432.86 71552.16 14 octobre 1992 86241.90 72117.46 81321.75 97473.96 93249.11 89658.17 87776.89 92105.83 79949.16 87602.93 Total 1878687.58 96 84 86 90 93 72  93 81 88 97 93 83 89 87   96 87 88 92 71 79 87

88 Indices de fraude Les chiffres significatifs sont à l’opposé de la loi de Benford (plus de 90 % commencent par 7, 8 ou 9). Valeurs d’abord petites, puis les montants et leurs fréquences ont augmenté. Tous les montants restent inférieurs à 100000 dollars. (Des montants supérieurs auraient sans doute dû être visés par un supérieur hiérarchique.) Les paires de premiers chiffres 87, 88, 93 et 96 ont été utilisées deux fois dans les 23 montants.

89 Etude minutieuse récente : A
Etude minutieuse récente : A. Saville, Université de Prétoria, Afrique du Sud, 2006. Test statistique de la loi de Benford appliqué à 17 compagnies connues pour avoir manipulé leurs comptes : la loi de Benford n’était respectée dans aucun des 17 cas ! Test également appliqué à 17 compagnies « honnêtes » afin de détecter des faux positifs : 4 comptabilités ne satisfaisaient pas la loi de Benford.

90 Comptes d’une école neuchâteloise…

91 Premier chiffre significatif des comptes d’une école neuchâteloise en 2011

92 1er chiffre significatif des comptes d’une école neuchâteloise en 2011
105 données

93 Détection de fraudes plus générales
Une étude de psychologie expérimentale (menée par A. Dickmann - Zurich) a montré que des sujets auxquels on demande de créer des données les produisent sans respecter la loi de Benford, même s’ils connaissent celle-ci. Au mieux, on retrouve une certaine conformité pour le 1er chiffre significatif. Mais dès qu’on s’intéresse au 2ème chiffre significatif, la distribution devient … à peu près n’importe quoi!

94

95 1er chiffre significatif des comptes d’une école neuchâteloise en 2011
105 données

96 2ème chiffre significatif des comptes d’une école neuchâteloise en 2011
105 données

97 3ème chiffre significatif des comptes d’une école neuchâteloise en 2011
105 données

98 Formation continue…

99

100

101 Pour les statisticiens…

102 Hypothèse nulle H0: « Les données suivent la loi de Benford. »
Test d’hypothèse Les écarts entre les données comptables et la loi de Benford sont-ils significatifs? Hypothèse nulle H0: « Les données suivent la loi de Benford. » Degré de fiabilité:  (= 0,01 ou 0,02 ou 0,05 ou 0,10) est le risque d’erreur de première espèce qui quantifie le risque de rejeter l’hypothèse H0 alors qu’elle est vraie.

103 – effectifs théoriques
données loi théorique Effectifs réels – effectifs théoriques xi effectif ni probabilité théorique (Benford) Pi Effectif théorique Npi 1 32 0,301 2 20 0,176 3 15 0,125 4 10 0,097 5 7 0,079 6 9 0,067 0,058 8 0,051 0,046 Somme N 31,608 0,392 0,154 0,005 18,490 1,510 2,281 0,123 13,119 1,881 3,540 0,270 10,176 -0,176 0,031 0,003 16 15,343 8,314 0,657 0,431 0,028 7,029 6,089 12 16,265 -4,265 18,188 1,118 5,371 4,805 1,547 = 105 = 105

104 Tabulation de la distribution du khi-carré 2
Aire =  Aire = 1 – 

105 Conclusion: Nous n’avons pas de raison de rejeter l’hypothèse nulle H0
qui dit que les données suivent la loi de Benford.  A méditer… Attention, cette conclusion est moins forte que de dire: les données suivent la loi de Benford…

106 Contre-exemples

107 Série de nombres construite avec un générateur de nombres aléatoires
Numéros gagnants à une loterie Vos tailles Numéros de téléphone dans votre répertoire Numéros des maisons d’une rue

108 Exemples « mathématiques »

109 1ère apparition de ce chiffre
1er chiffre sign. de 2n 1ère apparition de ce chiffre comme 1er C.S. 1 2 4 3 8 16 5 32 6 64 7 128 256 9 512 10 1024

110 1ère apparition de ce chiffre
1er chiffre sign. de 2n 1ère apparition de ce chiffre comme 1er C.S. 11 2048 2 12 4096 4 13 8192 8 14 16384 1 15 32768 3 16 65536 6 17 131072 18 262144 19 524288 5 20

111 1ère apparition de ce chiffre
1er chiffre sign. de 2n 1ère apparition de ce chiffre comme 1er C.S. 21 2 22 4 23 8 24 1 25 3 26 6 27 28 29 5 30

112 1ère apparition de ce chiffre
1er chiffre sign. de 2n 1ère apparition de ce chiffre comme 1er C.S. 31 2 32 4 33 8 34 1 35 3 36 6 37 E+11 38 E+11 39 E+11 5 40 E+12

113 1ère apparition de ce chiffre
1er chiffre sign. de 2n 1ère apparition de ce chiffre comme 1er C.S. 41 E+12 2 42 E+12 4 43 E+12 8 44 E+13 1 45 E+13 3 46 E+13 7 47 E+14 48 E+14 49 5.6295E+14 5 50 1.1259E+15

114 1ère apparition de ce chiffre
1er chiffre sign. de 2n 1ère apparition de ce chiffre comme 1er C.S. 51 2.2518E+15 2 52 4.5036E+15 4 53 9.0072E+15 9 54 E+16 1 55 E+16 3 56 E+16 7 57 E+17 58 2.8823E+17 59 E+17 5 60 E+18

115 On constate qu’au plus l’exposant n grandit,
au plus les fréquences d’apparitions des chiffres 1 à 9 comme 1ers chiffres significatifs se rapprochent des fréquences de la loi de Benford. Vladimir Arnold et André Avez ont démontré qu’asymptotiquement la suite 2n satisfait la loi de Benford.

116 1er chiffre significatif des n 1ers nombres de la suite 2n

117 1er chiffre significatif des n 1ers nombres de la suite 2n

118 1 1 2 3 5 8 13 21 34 … Le mathématicien suisse Paul Jolissaint
a démontré que la célèbre suite de Fibonacci déjà connue pour plein de propriétés sympathiques ou amusantes, suit elle aussi asymptotiquement la loi de Benford !

119 Pourquoi des suites numériques issues du monde réel se conforment-elles raisonnablement à la loi de Benford ? Quelques tentatives d’explications… Ainsi des suites de nombres s’étalant sur plusieurs ordres de grandeur et de manière assez régulière s’approcheraient relativement bien de la loi de Benford.

120 Peut-être qu’un jour, quelque principe général qui nous échappe encore aujourd’hui, amènera une explication. Jean-Paul Delahaye


Télécharger ppt "Des mathématiques élémentaires"

Présentations similaires


Annonces Google