SON HISTOIRE ET SES APPLICATIONS

Slides:



Advertisements
Présentations similaires
La pondération de l’enquête Sans Domicile 2012
Advertisements

Du positionnement épistémologique à la méthodologie de recherche
STATISTIQUE INFERENTIELLE L ’ESTIMATION
Présentation des programmes de terminale STG Juin 2006.
Test statistique : principe
- I - Les Classifications de l’O.M.S.
De lanalyse des données … … au Datamining Aide à la prise de décision.
Quelques clés pour une lecture critique des essais thérapeutiques
Analyse d’articles étude des biais
Echantillonnage Professeur Francis GUILLEMIN > Ecole de santé publique - Faculté de Médecine.
Epidémiologie : types d’enquêtes
4 février 2005DESS Economie et Gestion des Cliniques et Etablissements pour personnes âgées 1 La prise en compte des critères économiques dans lanalyse.
Simulation de management Principes d’une simulation de gestion
Méthodes statistiques. Ajustements et corrélation
Dr DEVILLE Emmanuelle J D V 12/07/2006
l'approche ergonomique
MATHÉMATIQUES Sciences et Technologies de la Gestion.
variable aléatoire Discrète
Probabilités et statistique en TS
Enseignement de la Culture Générale 2ème année
Traitement de données socio-économiques et techniques d’analyse :
Probabilités et statistiques
François LINOSSIER Technicien en Restauration Collective
Applications des statistiques
Régression linéaire simple
Howell, Chap. 1 Position générale
Comprendre la variation dans les données: Notions de base
Comprendre le monde de l’entreprise
Algorithme de lecture critique: validité interne
ELEMENTS DE COURS 1. LERIDON H., TOULEMON L. (1997) – Démographie. Approche Statistiques et dynamique des populations. Paris, Economica. 2. FALISSARD.
Les maths, l’actuariat ? Volontiers …
La corrélation et la régression
La corrélation et la régression
Corrélation Principe fondamental d’une analyse de corrélation
Théorie de l’échantillonnage (STT-6005)
La régression multiple
Échantillonnage (STT-2000) Section 3 Utilisation de variables auxiliaires. Version: 8 septembre 2003.
Travail de génétique Direct genetic, maternal and litter effects on behaviour in German shepherd dogs in Sweden Evrard Aurélie Kastler Tiphaine Schumacher.
Statistique Descriptive Analyse des données
Épidémiologie Notions élémentaires Réalisation pratique d’un enquête
Master 1 – Sciences du Langage –
Approches de Santé publique, épidémiologie
Biostatistiques Quand on souhaite étudier une (ou des) caractéristique(s) sur un ensemble d’individus ou d’objets, il est difficile, voir impossible, d’observer.
Apport du Data Mining pour prédire la facture de patients hospitalisés
Lotfi Hrizi Ingénieur statisticien Atelier régional sur l’évaluation des recensements Tunis – Tunisie décembre 2009.
Les dépenses d’éducation. Un indicateur fondamental : la dépense intérieure d’éducation Elle comprend - les dépenses d’enseignement et de formation continue.
Echantillonage pour une Evaluation d’Impact
Mher Joulakian Biblio du 18/02/14. Généralités Epidémiologie évaluative Stratégies thérapeutiques/diagnostiques Programmes de dépistage/prévention Pratiques.
Nonpharmaceutical interventions implemented by US cities during the JAMA 8 août 2007 Markel H et al.
Février 2010 La nouvelle classe de seconde des lycées d’enseignement général & technologique.
VARIABLES ET MESURES DE FREQUENCES Pr. KELLIL M 1.
SYSTEMES d’INFORMATION séance 1 : Introduction et définitions
Principes Fondamentaux de l ’ É conomie et de la Gestion.
Présentation du cours de Statistique de première année AgroParisTech
STATISTIQUE INFERENTIELLE LES TESTS STATISTIQUES
L’erreur standard et les principes fondamentaux du test de t
Concepts en santé publique
Échantillonnage (STT-2000) Section 5 Types d’erreur de sondage. Version: 22 août 2003.
Bienvenue!  Professeur : Dr. David Beaudoin.  Disponibilité : Mardi 15h30-17h local  Disponibilité d’Antoine Gautier: Mardi et Jeudi à compter.
Probabilités et statistique MQT-1102
Lectures Volume du cours: Sections 12.1 à 12.6 inclusivement.
Comparaison de plusieurs moyennes observées
Il faut en choisir deux :  Le premier se choisit parmi :
 Champ des mathématiques  Ensemble de méthodes et de techniques  Permet une analyse objective  Facilitées aujourd’hui par les tableurs.
Lecture critique des essais cliniques. But Juger de : - La validité scientifique - L’intérêt clinique Modifier ou ne pas modifier la pratique.
Chapitre 6 Les tests d ’ hypoth è se 1 – Comparer des moyennes ou des proportions.
Biostatistique pour le troisième cycle P. Leroy, F. Farnir 2013.
Bienvenue au cours MAT-350 Probabilités et statistiques.
CONCEPTS FONDAMENTAUX Concepts liés au développement humain
Transcription de la présentation:

SON HISTOIRE ET SES APPLICATIONS LA STATISTIQUE SON HISTOIRE ET SES APPLICATIONS

LA STATISTIQUE QUELLE EST CETTE DISCIPLINE ? Petit Robert Etude méthodique des faits sociaux par des procédés numériques (classements, dénombrements, inventaires chiffrés, recensements) destinée à renseigner et à aider les gouvernements. Ensemble de techniques d’interprétation mathématique appliquées à des phénomènes pour lesquels une étude exhaustive de tous les facteurs est impossible, à cause de leur grand nombre et de leur complexité.

G. BRONNER, Coïncidences, Vuibert, 2007. LA STATISTIQUE BIBLIOGRAPHIE J. J. DROESBEKE et P. TASSI, Histoire de la statistique, Que sais-je ? n°2527, PUF, 1997. Faut-il se fier aux statistiques ? Tangente, n°77 (octobre - novembre 2000). G. BRONNER, Coïncidences, Vuibert, 2007.

« Statistique » : du latin statisticum (ce qui se rapporte à l’Etat) Gottfried Achenwall (1746) : premier enseignement de la statistique (Allemagne) En fait, origine plus ancienne : mot déjà utilisé dans un texte administratif de Colbert (vers 1666)

Etats forts avec un système administratif fort Chefs d’Etats : connaître leur puissance : population, richesses, potentiel militaire…  idée de recensement Premiers recensements : * Sumériens : 5000 à 2000 av J.-C. * Egyptiens : recensements systématiques de la population Etats forts avec un système administratif fort

 Statistique descriptive Au début, la statistique a consisté à observer des faits  Statistique descriptive XIVe siècle : début des enregistrements des actes civils (naissances, mariages, décès)

Nombre de morts dans les hôpitaux militaires britanniques (guerre de Crimée) Florence Nightingale (1820-1910) gris : maladies évitables brun : blessures mortelles rose : autres causes

 Statistique inférentielle XVIIe siècle : Probabilités  estimations, prévisions Extrapolation à partir d’une partie de la population (W. Petty: estimation de la population londonienne, 1686) Juger d’après un échantillon: (problème de la représentativité)  Statistique inférentielle

XXe siècle : développement des sondages (U.S.A.) * 1885 : création de l’Institut International de la Statistique (IIS) * 1895 – 1925 : débat sur la représentativité (IIS) A. Kiaer (Norvège) : « une partie pour le tout »  réactions violentes * Après 1925 : « Comment tirer l’échantillon ? »

Date cruciale : 3 novembre 1936 Election présidentielle américaine F. Roosevelt versus G. Landon Magazine Literary Digest : 2000 000 personnes (téléphone)  Landon G. Gallup : 3 000 personnes  Roosevelt Principe de la validité d’un sondage accepté

Recensements, sondages 1666: Colbert 1746: Achenwall 1885: IIS 1936: Roosevelt vs Landon 1938: IFOP 1946: INSEE -5000 -2900 1600 1700 1800 1900 2000 Graphiques 1637: Descartes 1786: diag. en barres diag. en secteurs W. Playfair 1855: diag. pol. F. Nightingale 1874: Pyram. des âges Surf. de corrélation Ajustement, corrélation, régression 1805-1806 Legendre-Gauss Moindres carrés 1888 et 1896: Galton et K. Pearson Coef. de Corrélation. 1904: K. Pearson, Khi-deux 1904 Spearmann, rho 1938: Kendall Tau Valeurs typiques 1602: moy. arith. Tycho Brahé 1722: moy. pond. Roger Cotes 1757: médiane Boscovich 1805: variance Legendre, Gauss 1874: moy. géom. moy. Harm. W.S. Jevons Indices 1707: nombre indice Fleetwood 1738: indice des prix Dutot 1865: Laspeyres 1875: Paasche

Culture probabiliste indispensable La statistique fait partie de la culture ANGLO-SAXONNE Culture probabiliste indispensable Enorme retard en France

• Causes : Statistique: parent pauvre des probabilités et des mathématiques Forte imprégnation cartésienne L’«incertain» est antipédagogique (déstabilisant …) Nette préférence pour l’enseignement de certitudes - Association obligatoire avec une autre discipline (bio., gestion,...) (l’approche pluridisciplinaire est encore mal acceptée)

• Conséquences : * Bon sens statistique insuffisamment développé * La présentation de données statistiques : un exercice « difficile » * « Un chiffre ne peut être qu’exact , exempt de toute indétermination »  Risque de manipuler l’opinion

Exemples : moyenne, médiane cote de popularité des hommes politiques classement des hôpitaux, des lycées… rapports d’«experts» …

Connaître, c’est mesurer (Brunschvicg) La statistique nous dit: * Comment effectuer les mesures * Comment extraire l’information des mesures

INFORMATION Principale matière première du XXIe siècle Sa production et son exploitation statisticiens

Qualité  de la variabilité LA VARIABILITE En général, dans une population, la variabilité est un critère de qualité , voire une nécessité (pour la survie) Exception : l’industrie Le statisticien doit savoir : - appréhender - analyser - « gérer » la variabilité La variabilité est une entrave à l’inférence statistique Qualité  de la variabilité

inconnues moyenne  variance 2 proportion  Population Echantillon ( x1 , x2 , ...., xn ) moyenne  variance 2 proportion  Moyenne x variance s2 proportion x/n tirage inconnues Inférence statistique

LA STATISTIQUE DESCRIPTIVE LA STATISTIQUE INFERENTIELLE Série statistique univariée Série statistique bivariée La modélisation Les plans d’expériences Les sondages L’estimation Les tests statistiques Les séries chronologiques L’analyse des données  Le data mining

LA MODELISATION En général, une observation dépend d’un grand nombre de facteurs cause multifactorielle les effets des facteurs ne sont pas simplement additifs (présence d’interactions)

LA MODELISATION (suite)  Le statisticien va tenter : d’identifier les facteurs prépondérants évaluer leur importance relative expliciter le lien de ces facteurs « causaux » avec le caractère étudié, à l’aide d’un modèle mathématique

prix = 1775 + 103,8 puissance + 9,8 poids Exemple : variable expliquée : prix d’une voiture variables explicatives : cylindrée, puissance, vitesse, largeur, longueur, poids … prix = 1775 + 103,8 puissance + 9,8 poids (CV DIN) (kg)

Exemple: biométrie foetale Log10 EPF = 1,6961 + 0,02253 PC + 0,01645 PA + 0,06439 LF (Weiner et al., 1985) EPF: estimation poids fœtal (en g) PC: périmètre crânien (mm) PA: périmètre abdominal (mm) LF: longueur fémur (mm)

( politique, économique, scientifique, industriel … ) Statisticiens Interlocuteurs privilégiés des décideurs • dans tous les secteurs d’activité : ( politique, économique, scientifique, industriel … ) et • à tous les niveaux : (collecte de données, conception des systèmes d’information, contrôle de la production, analyse et restitution des données, etc.)

Diversification des métiers de la statistique Discipline transversale par excellence

DOMAINES D’ UTILISATION DE LA STATISTIQUE STATISTIQUES OFFICIELLES (I.N.S.E.E.) PRESSE – MEDIAS BANQUES – ASSURANCES SCIENCES DE LA VIE ENVIRONNEMENT ( Foresterie, pêche …) SANTE SCIENCES HUMAINES ENTREPRISES – INDUSTRIE ( R&D, contrôle de qualité, études de marché, management … ) FINANCE RECHERCHE FONDAMENTALE ET APPLIQUEE etc …

et même … LA POESIE !

BANQUES Probabilité qu’un client rembourse son crédit ? Cette probabilité peut être exprimée en fonction : - du montant moyen de son compte courant - de la durée du crédit - du montant du crédit - du sexe - de la situation familiale etc …

ASSURANCES (calcul des primes) Assurance décès - Taux d’intérêt - Tables de mortalité - Frais de gestion Assurance-auto Tarif unique ou différencié ?

• Le risque dépend de nombreux facteurs : * Assuré : - Age - Sexe - Profession - Résidence - Expérience, etc … * Véhicule : - Modèle - Puissance, etc …

problèmes de déontologie et d’éthique • Etude du « risque ou coût » (actuariat) par des méthodes de régression « juste tarif » mieux résister à la concurrence problèmes de déontologie et d’éthique

SCIENCES DE L’ENVIRONNEMENT Surveillance d’un milieu (qualité d’une eau,…) Estimation de l’effectif d’une population Toxicologie de l’environnement, analyse du risque Epidémiologie environnementale Prévision des effets du réchauffement climatique Phénomènes extrêmes (vagues, cyclones, …) Prévision des épisodes de pollution (ozone) etc.

Estimation du nombre de jours/an avec des températures > 35°C Période 2090-2099 (Météo-France, 2007)

SANTE – BIOLOGIE Biométrie Imagerie médicale Génétique (trouver les gènes « coupables ») Epidémiologie Statistique de la preuve en sciences forensiques Diagnostic médical (aide au diagnostic) Essais cliniques etc.

Comparaison de deux traitements contre le VIH (Essai Trianon-ANRS81, INSERM U738)

Pharmacocinétique Concentration de théophylline (médicament contre l’asthme) chez 12 individus pendant 24 heures (IUT de Paris, département STID)

LES ESSAIS CLINIQUES Comparaison de plusieurs traitements Essais cliniques randomisés en double-aveugle Abstraction des aspects psychologiques : médecin et malade Introduction du hasard dans l’expérience médicale

Exemple : un nouveau médicament a-t-il des effets secondaires ? Effectifs observés Nausées Oui Non Traitement 15 35 Placebo 4 46

Exemple : un nouveau médicament a-t-il des effets secondaires ? Effectifs observés - Effectifs Théoriques Nausées Oui Non Traitement 15 9,5 35 40,5 Placebo 4 9,5 46 40,5 2 = 7,86  Probabilité critique : 1%

Les risques d’erreur Pas d’effets secondaires Effets secondaires Décision du statisticien Pas d’effets secondaires Effets secondaires Situation réelle Pas d’effets secondaires Décision erronée Perte d’un bon médicament Décision Correcte Décision erronée Promotion d’un mauvais médicament Décision Correcte Effets secondaires

Poème de 429 mots découvert en 1985 Question : Shakespeare en est-il l’auteur ?  Le vocabulaire du poème s’écarte-t-il de façon statistiquement significative du vocabulaire shakespearien connu ? * Méthode basée sur l’étude comparative : - de la fréquence des répétitions et - de l’ étendue du vocabulaire  échantillons successifs de 429 mots dans l’œuvre complète

• L’œuvre complète comprend 31 534 mots • L’œuvre complète comprend 31 534 mots distincts sur un total de 884 647 mots, répartis de la manière suivante : • 14 376 mots apparaissent une fois • 4 343 mots deux fois • 2 292 mots trois fois etc … • 846 mots apparaissent plus de cent fois. La structure des répétitions est comparée à celle des œuvres de Marlowe, Ben Jonson …

L’hypothèse : « Shakespeare est l’auteur du sonnet » est remplacée par l’hypothèse : « La structure des répétitions est comparable à celle de l’œuvre de Shakespeare » Conclusion : le sonnet a bien été écrit par Shakespeare ; la probabilité d’erreur est faible

DEBOUCHES Banques Sociétés de placement collectif Compagnies d’assurance Services de marketing Sociétés de sondage Environnement Industrie pharmaceutique, santé (biostatistique) Industrie agroalimentaire Services de contrôle de la qualité de la production (automobile, eau, etc.) ...

à méditer … Le hasard est la somme de nos ignorances (Laplace) Le hasard, cet hôte indésirable de la pensée humaine … (Gérard Bronner)