La statistique Définitions et méthodes
La statistique est la branche des mathématiques qui collecte, classe, analyse et interprète des données afin den tirer des conclusions et de faire des prévisions. En sciences, lanalyse de données issues dexpériences ou détudes statistiques est un élément essentiel de la recherche. À cette fin, elle utilise un vocabulaire qui lui est spécifique.
Population : ensemble des individus, objets ou évènements ayant des caractéristiques communes et sur lequel porte létude. Les premières études de la statistique portaient sur les populations humaines. Le terme « population » est resté mais aujourdhui, en statistique, ce terme désigne aussi bien des objets, des phénomènes que des humains. Exemple:Si on sintéresse à la qualité de leau des piscines dune municipalité, la population étudiée est « les piscines ». Caractère : le sujet de létude. Dans lexemple des piscines, le caractère étudié est « la qualité de leau ».
Échantillon : Cest un sous-ensemble dune population. Il est parfois impossible détudier tous les éléments dune population. On élabore alors un sous-ensemble possédant, le plus possible, les caractéristiques de la population. Exemple: On ne pourrait pas étudier toute la population des morues qui vivent en mer; cependant, on pourrait faire létude des morues capturées par plusieurs pêcheurs. On aurait alors un échantillon. Taille : le nombre déléments qui composent léchantillon. Remarque : Construire un échantillon représentatif dune population est très important. Il existe, en statistique, une branche qui est spécialisée dans la construction des échantillons, la théorie de léchantillonnage.
Procédés déchantillonnage Lorsque la population est homogène. On peut utiliser 3 procédés qui sont plus ou moins aléatoires : Cest-à-dire, lorsque lensemble des individus qui la composent se ressemblent par rapport au caractère étudié. Exemple: On sintéresse à lintention de votes des gens dune municipalité concernant lélection dun maire. - léchantillonnage aléatoire; - léchantillonnage systématique; - léchantillonnage par grappes.
Procédés déchantillonnage Lorsque la population est homogène. - léchantillonnage aléatoire : Exemple : dans un bottin téléphonique, on choisit 200 noms nimporte comment. on choisit les éléments complètement au hasard. - léchantillonnage systématique : on choisit au hasard un point de départ et, ensuite, on utilise toujours le même procédé pour choisir les autres éléments. Exemple : dans un bottin téléphonique, on prend un nom à tous les 25 noms. - léchantillonnage par grappes : on prend tous les individus dun même groupe, les groupes étant choisis au hasard. Exemple : on prend tous les élèves dun groupe de mathématique 306 mais dans plusieurs écoles différentes.
Lorsque la population est hétérogène. Cest à dire quand les éléments ont des caractéristiques différentes. Procédés déchantillonnage On utilise léchantillonnage par strates. Exemple : On voudrait connaître les préférences alimentaires des étudiants dune école secondaire. Filles gars Sec Sec Sec Total Élèves de lécole
Il sagit alors de construire un échantillon proportionnel à la population. Filles gars Sec Sec Sec Total Élèves de lécole On veut construire un échantillon de 60 personnes. Combien de filles de sec 1, y aura-t-il ? filles de sec 1 total des élèves filles de léchantillon taille de léchantillon = x 60 = x = 7,5 donc 8 filles x = 60 X
On collecte différentes informations quantitatives et/ou qualitatives et on les organise pour quelles nous apprennent des choses. Exemples dinformations qualitatives: Exemples dinformations quantitatives: sexe, couleur des yeux, opinion politique, … lâge, le poids, le salaire, le nombre de bactéries, etc.; tout ce qui représente une quantité donc mesurable.
Procédés de collecte de données Il existe plusieurs procédés de collecte de données : - le questionnaire écrit; - lentrevue en personne; - lentrevue téléphonique; - lobservation directe; - lobservation de listes ou de documents; - la collecte par instruments; - etc.
Sources de biais - un mauvais échantillonnage; - la non-pertinence et la formulation des questions; - lattitude du sondeur; - les erreurs de mesure; - le rejet dune partie de léchantillon; - la subjectivité dans la présentation des résultats; Plusieurs raisons peuvent fausser une étude statistique; parmi les principales, on retrouve : - etc.
Pour étudier les données recueillies lors dun sondage, denquêtes ou de recensements, il existe différents outils statistiques : - les tableaux de distribution : - les mesures de dispersion : le tableau de données condensées et le tableau de données groupées en classes. létendue de la distribution, létendue interquartile, létendue des quarts. - les mesures de tendance centrale : la moyenne, la médiane, le mode. Cette année, nous étudierons : - les diagrammes : lhistogramme et le diagramme de quartiles.
Différentes sortes de graphiques : Graphique à bandes Ce graphique donne des quantités exactes. Graphique circulaire Il montre très clairement limportance dune répartition.
Graphique à ligne brisée Il permet de montrer la continuité dun phénomène. Taille des élèves dun groupe de 6 e année Histogramme Il permet de regrouper des données Le diagramme de quartiles Il représente la concentration ou la dispersion de données statistiques.
Quelques données statistiques proches de nous.
Répartition du nombre de diplômés en fonction du domaine détude et du sexe. Québec, 2005.
Taux de chômage au Canada et dans les provinces ( )
SAAQ, Québec.
Pyramide normale de population babyboom Pyramide de référence