La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

LA STATISTIQUE SON HISTOIRE ET SES APPLICATIONS. LA STATISTIQUE QUELLE EST CETTE DISCIPLINE ? Petit Robert Etude méthodique des faits sociaux par des.

Présentations similaires


Présentation au sujet: "LA STATISTIQUE SON HISTOIRE ET SES APPLICATIONS. LA STATISTIQUE QUELLE EST CETTE DISCIPLINE ? Petit Robert Etude méthodique des faits sociaux par des."— Transcription de la présentation:

1 LA STATISTIQUE SON HISTOIRE ET SES APPLICATIONS

2 LA STATISTIQUE QUELLE EST CETTE DISCIPLINE ? Petit Robert Etude méthodique des faits sociaux par des procédés numériques (classements, dénombrements, inventaires chiffrés, recensements) destinée à renseigner et à aider les gouvernements. Ensemble de techniques dinterprétation mathématique appliquées à des phénomènes pour lesquels une étude exhaustive de tous les facteurs est impossible, à cause de leur grand nombre et de leur complexité.

3 LA STATISTIQUE BIBLIOGRAPHIE J. J. DROESBEKE et P. TASSI, Histoire de la statistique, Que sais-je ? n°2527, PUF, Faut-il se fier aux statistiques ? Tangente, n°77 (octobre - novembre 2000). G. BRONNER, Coïncidences, Vuibert, 2007.

4 « Statistique » : du latin statisticum (ce qui se rapporte à lEtat) Gottfried Achenwall (1746) : premier enseignement de la statistique (Allemagne) En fait, origine plus ancienne : mot déjà utilisé dans un texte administratif de Colbert (vers 1666)

5 Chefs dEtats : connaître leur puissance : population, richesses, potentiel militaire… idée de recensement Premiers recensements : * Sumériens : 5000 à 2000 av J.-C. * Egyptiens : recensements systématiques de la population Etats forts avec un système administratif fort

6 Au début, la statistique a consisté à observer des faits Statistique descriptive XIV e siècle : début des enregistrements des actes civils (naissances, mariages, décès)

7

8 Nombre de morts dans les hôpitaux militaires britanniques (guerre de Crimée) Florence Nightingale ( ) gris : maladies évitables brun : blessures mortelles rose : autres causes

9 XVII e siècle : Probabilités estimations, prévisions Extrapolation à partir dune partie de la population (W. Petty: estimation de la population londonienne, 1686) Juger daprès un échantillon: (problème de la représentativité) Statistique inférentielle

10 XX e siècle : développement des sondages (U.S.A.) * 1885 : création de lInstitut International de la Statistique (IIS) * 1895 – 1925 : débat sur la représentativité (IIS) - A. Kiaer (Norvège) : « une partie pour le tout » réactions violentes * Après 1925 : « Comment tirer léchantillon ? »

11 Date cruciale : 3 novembre 1936 Election présidentielle américaine F. Roosevelt versus G. Landon Magazine Literary Digest : personnes (téléphone) Landon G. Gallup : personnes Roosevelt Principe de la validité dun sondage accepté

12 Recensements, sondages 1666: Colbert 1746: Achenwall 1885: IIS 1936: Roosevelt vs Landon 1938: IFOP 1946: INSEE Valeurs typiques 1602: moy. arith. Tycho Brahé 1722: moy. pond. Roger Cotes 1757: médiane Boscovich 1805: variance Legendre, Gauss 1874: moy. géom. moy. Harm. W.S. Jevons Graphiques 1637: Descartes 1786: diag. en barres diag. en secteurs W. Playfair 1855: diag. pol. F. Nightingale 1874: Pyram. des âges Surf. de corrélation Indices 1707: nombre indice Fleetwood 1738: indice des prix Dutot 1865: Laspeyres 1875: Paasche Ajustement, corrélation, régression Legendre-Gauss Moindres carrés 1888 et 1896: Galton et K. Pearson Coef. de Corrélation. 1904: K. Pearson, Khi-deux 1904 Spearmann, rho 1938: Kendall Tau

13 La statistique fait partie de la culture ANGLO-SAXONNE Culture probabiliste indispensable Enorme retard en France

14 Causes : - Statistique: parent pauvre des probabilités et des mathématiques - Forte imprégnation cartésienne - L«incertain» est antipédagogique (déstabilisant …) - Nette préférence pour lenseignement de certitudes - Association obligatoire avec une autre discipline (bio., gestion,...) (lapproche pluridisciplinaire est encore mal acceptée)

15 Conséquences : * Bon sens statistique insuffisamment développé * La présentation de données statistiques : un exercice « difficile » * « Un chiffre ne peut être quexact, exempt de toute indétermination » Risque de manipuler lopinion

16 Exemples : moyenne, médiane cote de popularité des hommes politiques classement des hôpitaux, des lycées… rapports d«experts» …

17 Connaître, cest mesurer (Brunschvicg) La statistique nous dit: * Comment effectuer les mesures * Comment extraire linformation des mesures

18 INFORMATION Principale matière première du XXI e siècle Sa production et son exploitation statisticiens

19 LA VARIABILITE En général, dans une population, la variabilité est un critère de qualité, voire une nécessité (pour la survie) Exception : lindustrie Le statisticien doit savoir : - appréhender - analyser - « gérer » la variabilité La variabilité est une entrave à linférence statistique Qualité de la variabilité

20 moyenne variance 2 proportion Moyenne x variance s 2 proportion x/n PopulationEchantillon ( x 1, x 2,...., x n ) tirage Inférence statistique inconnues

21 LA STATISTIQUE DESCRIPTIVE LA STATISTIQUE INFERENTIELLE Série statistique univariée Série statistique bivariée La modélisation Les plans dexpériences Les sondages Lestimation Les tests statistiques Les séries chronologiques Lanalyse des données Le data mining

22 LA MODELISATION En général, une observation dépend dun grand nombre de facteurs cause multifactorielle les effets des facteurs ne sont pas simplement additifs (présence dinteractions)

23 LA MODELISATION (suite) Le statisticien va tenter : didentifier les facteurs prépondérants évaluer leur importance relative expliciter le lien de ces facteurs « causaux » avec le caractère étudié, à laide dun modèle mathématique

24 Exemple : variable expliquée : prix dune voiture variables explicatives : cylindrée, puissance, vitesse, largeur, longueur, poids … prix = ,8 puissance + 9,8 poids (CV DIN) (kg)

25 Exemple: biométrie foetale Log 10 EPF = 1, ,02253 PC + 0,01645 PA + 0,06439 LF (Weiner et al., 1985) EPF: estimation poids fœtal (en g) PC: périmètre crânien (mm) PA: périmètre abdominal (mm) LF: longueur fémur (mm)

26 Statisticiens Interlocuteurs privilégiés des décideurs dans tous les secteurs dactivité : ( politique, économique, scientifique, industriel … ) et à tous les niveaux : (collecte de données, conception des systèmes dinformation, contrôle de la production, analyse et restitution des données, etc.)

27 Diversification des métiers de la statistique Discipline transversale par excellence

28 DOMAINES D UTILISATION DE LA STATISTIQUE STATISTIQUES OFFICIELLES (I.N.S.E.E.) PRESSE – MEDIAS BANQUES – ASSURANCES SCIENCES DE LA VIE ENVIRONNEMENT ( Foresterie, pêche …) SANTE SCIENCES HUMAINES ENTREPRISES – INDUSTRIE ( R&D, contrôle de qualité, études de marché, management … ) FINANCE RECHERCHE FONDAMENTALE ET APPLIQUEE etc …

29 et même … LA POESIE !

30 BANQUES Probabilité quun client rembourse son crédit ? Cette probabilité peut être exprimée en fonction : - du montant moyen de son compte courant - de la durée du crédit - du montant du crédit - du sexe - de la situation familiale etc …

31 ASSURANCES (calcul des primes) Assurance décès - Taux dintérêt - Tables de mortalité - Frais de gestion Assurance-auto Tarif unique ou différencié ?

32 Le risque dépend de nombreux facteurs : * Assuré : - Age - Sexe - Profession - Résidence - Expérience, etc … * Véhicule : - Modèle - Puissance, etc …

33 Etude du « risque ou coût » (actuariat) par des méthodes de régression « juste tarif » mieux résister à la concurrence problèmes de déontologie et déthique

34 SCIENCES DE LENVIRONNEMENT Surveillance dun milieu (qualité dune eau,…) Estimation de leffectif dune population Toxicologie de lenvironnement, analyse du risque Epidémiologie environnementale Prévision des effets du réchauffement climatique Phénomènes extrêmes (vagues, cyclones, …) Prévision des épisodes de pollution (ozone) etc.

35 Estimation du nombre de jours/an avec des températures > 35°C Période (Météo-France, 2007)

36 SANTE – BIOLOGIE Biométrie Imagerie médicale Génétique (trouver les gènes « coupables ») Epidémiologie Statistique de la preuve en sciences forensiques Diagnostic médical (aide au diagnostic) Essais cliniques etc.

37 Comparaison de deux traitements contre le VIH (Essai Trianon-ANRS81, INSERM U738)

38 Pharmacocinétique Concentration de théophylline (médicament contre lasthme) chez 12 individus pendant 24 heures (IUT de Paris, département STID)

39 LES ESSAIS CLINIQUES Comparaison de plusieurs traitements Essais cliniques randomisés en double-aveugle Abstraction des aspects psychologiques : médecin et malade Introduction du hasard dans lexpérience médicale

40 Exemple : un nouveau médicament a-t-il des effets secondaires ? Effectifs observés Traitement Placebo Nausées OuiNon

41 Exemple : un nouveau médicament a-t-il des effets secondaires ? Effectifs observés - Effectifs Théoriques Traitement Placebo Nausées OuiNon 15 9,535 40,5 4 9,546 40,5 2 = 7,86 Probabilité critique : 1%

42 Les risques derreur Pas deffets secondaires Effets secondaires Décision Correcte Décision du statisticien Situation réelle Pas deffets secondaires Effets secondaires Décision erronée Promotion dun mauvais médicament Décision erronée Perte dun bon médicament

43 Poème de 429 mots découvert en 1985 Question : Shakespeare en est-il lauteur ? Le vocabulaire du poème sécarte-t-il de façon statistiquement significative du vocabulaire shakespearien connu ? * Méthode basée sur létude comparative : - de la fréquence des répétitions et - de l étendue du vocabulaire échantillons successifs de 429 mots dans lœuvre complète

44 Lœuvre complète comprend mots distincts sur un total de mots, répartis de la manière suivante : mots apparaissent une fois mots deux fois mots trois fois etc … 846 mots apparaissent plus de cent fois. La structure des répétitions est comparée à celle des œuvres de Marlowe, Ben Jonson …

45 Lhypothèse : « Shakespeare est lauteur du sonnet » est remplacée par lhypothèse : « La structure des répétitions est comparable à celle de lœuvre de Shakespeare » Conclusion : le sonnet a bien été écrit par Shakespeare ; la probabilité derreur est faible

46 DEBOUCHES Banques Sociétés de placement collectif Compagnies dassurance Services de marketing Sociétés de sondage Environnement Industrie pharmaceutique, santé (biostatistique) Industrie agroalimentaire Services de contrôle de la qualité de la production (automobile, eau, etc.)...

47 à méditer … Le hasard est la somme de nos ignorances (Laplace) Le hasard, cet hôte indésirable de la pensée humaine … (Gérard Bronner)


Télécharger ppt "LA STATISTIQUE SON HISTOIRE ET SES APPLICATIONS. LA STATISTIQUE QUELLE EST CETTE DISCIPLINE ? Petit Robert Etude méthodique des faits sociaux par des."

Présentations similaires


Annonces Google