La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Eléments de Statistiques Professeur Philippe Corten Université Libre de Bruxelles Ho Chi Min Ville – Mars 2004.

Présentations similaires


Présentation au sujet: "Eléments de Statistiques Professeur Philippe Corten Université Libre de Bruxelles Ho Chi Min Ville – Mars 2004."— Transcription de la présentation:

1 Eléments de Statistiques Professeur Philippe Corten Université Libre de Bruxelles Ho Chi Min Ville – Mars 2004

2 Plan Général 1. Notions de probabilité et de statistique Quest-ce quune probabilité? Quest-ce quune probabilité? Impact du nombre dessais et de classes Impact du nombre dessais et de classes Probabilité et causalité Probabilité et causalité 2. Paramètres de base en statistiques

3 Notions de probabilité Quest-ce quune probabilité? Quest-ce quune probabilité? La probabilité est la chance quun phénomène x se produise, étant donné que loccurrence du phénomène répond à la loi du hasard. On ne pourra faire de calcul de probabilité que si lon se trouve dans une situation expérimentale dichotomique où le résultat est soit juste (1), soit faux (0). Il ne peut pas y avoir de résultats à moitié justes ou à moitié faux (principe de falsifiabilité)

4 Notions de probabilité Exemples: 1. Le jet de dé 2. Le jet dune pièce de monnaie Concrètement: 1. Un dé a six faces et si les chances de tomber sur une face sont identiques (dé non biaisé) la chance de tomber sur une quelconque de ces faces (par exemple 5) est a priori de 1/6 et la probabilité de tomber sur nimporte quelle autre face est de (1-1/6)= 5/6 2. Un pièce de monnaie a deux faces et si elle est non biaisée la chance a priori de tomber sur face est de ½ et la probabilité de ne pas tomber sur face (tomber sur pile) est de (1-1/2)= 1/2

5 Notions de probabilité « Urne » finie ou infinie? « Urne » finie ou infinie? Si lon se trouve dans le cas dune urne infinie (tirage de loterie où lon remet la boule dans lurne, jet de dé, jet de pièce de monnaie), à chaque tirage la chance a priori reste la même Si lon se trouve dans le cas dune urne infinie (tirage de loterie où lon remet la boule dans lurne, jet de dé, jet de pièce de monnaie), à chaque tirage la chance a priori reste la même Concrètement: une urne contient 12 boules. On a déjà fait 11 tirages et jai perdu. Au douzième tirage jai toujours autant de chances a priori, ni plus, ni moins. Concrètement: une urne contient 12 boules. On a déjà fait 11 tirages et jai perdu. Au douzième tirage jai toujours autant de chances a priori, ni plus, ni moins. Si lon se trouve dans le cas dune urne finie (tirage où lon ne remet pas la boule dans lurne), à chaque tirage la chance a priori augmente Si lon se trouve dans le cas dune urne finie (tirage où lon ne remet pas la boule dans lurne), à chaque tirage la chance a priori augmente Concrètement: une urne contient 12 boules. On a déjà fait 11 tirages et lon na toujours pas tiré ma boule, fatalement au dernier tirage je suis sûr que cest ma boule (p=1) Concrètement: une urne contient 12 boules. On a déjà fait 11 tirages et lon na toujours pas tiré ma boule, fatalement au dernier tirage je suis sûr que cest ma boule (p=1) Application: courbes de survie Application: courbes de survie

6 Notions de probabilité Est-ce quen toutes circonstances, la probabilité est égale au nombre de chances a priori ? Est-ce quen toutes circonstances, la probabilité est égale au nombre de chances a priori ?NON La probabilité va dépendre La probabilité va dépendre du nombre de fois où lon effectue une expérience du nombre de fois où lon effectue une expérience du nombre de permutations possibles du nombre de permutations possibles

7 Notions de probabilité Nombre de répétitions de lexpérience: plus souvent je jette la pièce, plus ma moyenne va sapprocher de la chance a priori. Nombre de répétitions de lexpérience: plus souvent je jette la pièce, plus ma moyenne va sapprocher de la chance a priori. Conséquence: on ne peut faire de statistiques que sur un grand nombre Conséquence: on ne peut faire de statistiques que sur un grand nombre

8 Notions de probabilité Nombre de classes ou de permutations possibles: plus jai de classes moins grande est la probabilité de tomber spécifiquement sur telle ou telle permutation. Nombre de classes ou de permutations possibles: plus jai de classes moins grande est la probabilité de tomber spécifiquement sur telle ou telle permutation.

9 Notions de probabilité Donc deux paramètres influencent la notion de probabilité Donc deux paramètres influencent la notion de probabilité 1. La fréquence 2. La dispersion

10 Notions de probabilité Concrètement Concrètement Plus je répète une expérience, ou plus le nombre dindividus dans mon échantillon est grand plus jai de chances davoir un test statistique significatif Plus je répète une expérience, ou plus le nombre dindividus dans mon échantillon est grand plus jai de chances davoir un test statistique significatif => réduire mon seuil de probabilité => réduire mon seuil de probabilité Si échantillon = 50 : p=0,05 Si échantillon = 50 : p=0,05 Si échantillon =100 : p=0,01 Si échantillon =100 : p=0,01 Si échantillon = : p=0,001 Si échantillon = : p=0,001 Si échantillon = : p=0,0001 Si échantillon = : p=0,0001 Etc… Etc…

11 Notions de probabilité Le seuil de signification est le degré de tolérance que jadmets dans le fait de rejeter ou non un résultat. Le seuil de signification est le degré de tolérance que jadmets dans le fait de rejeter ou non un résultat. Si p=0,05 jadmets que dans 5% des cas je déclare un test faux alors quil ne lest pas (et vice versa) Si p=0,05 jadmets que dans 5% des cas je déclare un test faux alors quil ne lest pas (et vice versa) Si p=0,01 je tolère 1% derreur Si p=0,01 je tolère 1% derreur Etc… Etc… Concrètement: si avec une même variable je fais 100 tests statistiques et que jai admis un p=0,05. Au moins 5x je vais déclarer le test significatif alors que cest un pur fruit du hasard! Concrètement: si avec une même variable je fais 100 tests statistiques et que jai admis un p=0,05. Au moins 5x je vais déclarer le test significatif alors que cest un pur fruit du hasard! Donc plus je répète un test, plus je dois être exigeant dans le seuil de signification. Donc plus je répète un test, plus je dois être exigeant dans le seuil de signification.

12 Notions de probabilité !!! NE PAS CONFONDRE TEST STATISTIQUE SIGNIFICATIF ET CAUSALITE Un test statistique définit un lien d indépendance entre deux variables et en rien un lien de causalité

13 Notions de probabilité Ce lien (ou labsence de lien) peut être dû au hasard (exemple: il y a une corrélation entre le nombre de moustachus à Washington et le nombre de Rabbins en Pennsylvanie, ou cf supra le seuil statistique) au hasard (exemple: il y a une corrélation entre le nombre de moustachus à Washington et le nombre de Rabbins en Pennsylvanie, ou cf supra le seuil statistique) à une tautologie (exemple quels sont les critères dinclusion pour être dans la catégorie femme: avoir des seins et des ovaires?) à une tautologie (exemple quels sont les critères dinclusion pour être dans la catégorie femme: avoir des seins et des ovaires?) à une variable supérieure (exemple: en Alsace il y a une corrélation entre le nombre de cigognes sur une maison et le nombre denfants. Mais plus il y a denfants, plus la maison est grande et plus la maison est grande plus elle a de cheminées) à une variable supérieure (exemple: en Alsace il y a une corrélation entre le nombre de cigognes sur une maison et le nombre denfants. Mais plus il y a denfants, plus la maison est grande et plus la maison est grande plus elle a de cheminées) Labsence de lien peut être dû au fait que vous navez pas mis les bonnes variables dans votre questionnaire. On ne fait de statistiques que sur les questions qui ont été posées. Labsence de lien peut être dû au fait que vous navez pas mis les bonnes variables dans votre questionnaire. On ne fait de statistiques que sur les questions qui ont été posées.

14 Notions de probabilité Quoiquil en soit un test ne donne jamais le sens du lien! Quoiquil en soit un test ne donne jamais le sens du lien! Exemple1: Exemple1: il y a lien entre délinquance et toxicomanie. Cela ne dit pas que parce quon est toxicomane on devient délinquant ou si quand on est délinquant on a plus de risque de devenir toxicomane. Exemple 2: Exemple 2: il y a un lien entre dépression et alcoolisme. Cela ne dit pas si on devient alcoolique parce quon est déprimé ou si on se déprime parce quon devient alcoolique

15 Plan général 1. Notions de probabilité et de statistique 2. Paramètres de base en statistiques Distribution paramétrique ou non paramétrique Distribution paramétrique ou non paramétrique Tendance centrale: mode, moyenne, médiane Tendance centrale: mode, moyenne, médiane Dispersion: Déviation standard Dispersion: Déviation standard Forme de distribution: asymétrie, bimodale… Forme de distribution: asymétrie, bimodale…

16 Paramètres de base en statistiques Tests paramétriques ou non paramétriques? Tests paramétriques ou non paramétriques? 1. Non paramétriques: genre, oui - non, différents types de maladies… 2. Paramétriques: poids, taille, âge… 3. Quasi-paramétriques: Nombre denfants (avoir 1,15 enfants nexiste pas) Nombre denfants (avoir 1,15 enfants nexiste pas) Jamais – parfois – souvent – toujours Jamais – parfois – souvent – toujours Quotidien – hebdomadaire – mensuel – annuel Quotidien – hebdomadaire – mensuel – annuel Classes dâge Classes dâge Classes de durée de séjour… Classes de durée de séjour…

17 Paramètres de base en statistiques Tendance centrale: mode Tendance centrale: mode Surtout non paramétriques Surtout non paramétriques Nombre denfants par famille (moyenne = 3,44), mode = 2 Nombre denfants par famille (moyenne = 3,44), mode = 2 Tendance centrale: moyenne. Tests paramétriques Poids moyen de 10 patients (moyenne= 69,2 kg)

18 Paramètres de base en statistiques Tendance centrale: médiane Tendance centrale: médiane Surtout lorsque courbe exponentielle décroissante (courbe de survie) Surtout lorsque courbe exponentielle décroissante (courbe de survie) Aussi appelée demi- vie Aussi appelée demi- vie Exemple nombre de sortants soins intensifs: Exemple nombre de sortants soins intensifs: Médiane: 50% sortis en moins de 24 h Médiane: 50% sortis en moins de 24 h Moyenne: 2 jours Moyenne: 2 jours

19 Paramètres de base en statistiques Mesure de la dispersion: Mesure de la dispersion: la déviation standard Entre -1 et + 1 sd : 68% des observations sont contenues Entre -1 et + 1 sd : 68% des observations sont contenues Entre -2 et +2 sd: 95% des observations sont contenues Entre -2 et +2 sd: 95% des observations sont contenues Entre -3 et + 3sd: 99.8% des observations sont contenues Entre -3 et + 3sd: 99.8% des observations sont contenues

20 Paramètres de base en statistiques Asymétrie Asymétrie Plus une distribution est asymétrique plus on risque que le mode, la moyenne et la médiane ne se superposent pas. Plus une distribution est asymétrique plus on risque que le mode, la moyenne et la médiane ne se superposent pas. Mesure le Skewness Mesure le Skewness Attention distributions bimodales et en U! Quel est le sens de la moyenne dans ce cas? Toujours faire les statistiques descriptives


Télécharger ppt "Eléments de Statistiques Professeur Philippe Corten Université Libre de Bruxelles Ho Chi Min Ville – Mars 2004."

Présentations similaires


Annonces Google