La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Chapitre 8: La gestion des données

Présentations similaires


Présentation au sujet: "Chapitre 8: La gestion des données"— Transcription de la présentation:

1 Chapitre 8: La gestion des données
Consulte les pages 366 et 367 pour les concepts et vocabulaire clés

2 Chapitre 8: Prépare-toi
Avant de commencer le chapitre 8, il faut réviser ces concepts: Représenter des données Les diagrammes à boîte et à moustaches Les mesures de tendance centrale Interpoler et Extrapoler des valeurs

3 8.1: Les diagrammes de dispersion
Statistique Canada collectionne et organise des données pour aider les Canadiens à mieux comprendre leur pays: sa population, ses ressources, son économie, sa société et sa culture.

4 Les diagrammes de dispersion
Un diagramme de dispersion est un diagramme qui permet de représenter graphiquement des couples de données numériques. Il sert à voir des relations entre deux variables.

5 La droite la mieux ajustée
La droite la mieux ajustée est la droite qui passe par les points représentés dans un diagramme de dispersion ou qui passe le plus près possible de ces points.

6 Une valeur aberrante Une valeur aberrante est une donnée qui ne suit pas la régularité qui se dégage des autres données. Cette donnée semble très à l’écart de la plupart des données.

7 Interpoler des valeurs
Interpoler des valeurs veut dire l’estimer des valeurs qui se trouvent entre des données connues.

8 Extrapoler des valeurs
Extrapoler des valeurs veut dire l’estimer des valeurs qui se trouvent à l’extérieur des données connues.

9 Les variables indépendantes
Dans une relation, la variable indépendante est la variable qui détermine la valeur de la variable dépendante. Par exemple, avec la vitesse, distance/temps, le temps est la variable indépendante parce que la distance le dépend. D’habitude, la variable indépendante est x KOBE

10 Les variables dépendantes
Dans une relation, la variable dépendante est la variable dont la valeur est déterminée par la variable indépendante Par exemple, avec la vitesse, distance/temps, la distance est la variable dépendante parce que la distance dépend sur le temps pour sa valeur. D’habitude, la variable dépendante est y

11 Les types des données Il y a deux types: des données continus
des données discrètes

12 Des données continues Si une variable peut représenter n’importe quel nombre réel, les données sont des données continus. Quand les données sont rattachées ensemble pour former une droite, cela représente des données continues. Un exemple des données continus est la température.

13 Des données discrètes Si la variable ne peut pas être n’importe quel nombre réel (i.e. un nombre décimal), les données sont des données discrètes. Quand les données ne sont pas rattachées ensemble, cela représente des données discrètes. Un exemple des données discrètes sont comme le nombre des pages dans un livre.

14 Une corrélation #1 Pour mieux comprendre et mieux organiser les données, Statistique Canada trace des diagrammes de dispersion pour déterminer une corrélation entre deux variables.

15 Une corrélation #2 Une corrélation est la mesure de la dispersion des points autour d’une droite dans un diagramme de dispersion (le degré de relation entre deux variables)

16 Les adjectifs d’une corrélation
La corrélation entre 2 variables peuvent être: Forte Faible Positive Négative N’est pas apparente

17 Une corrélation forte Si la plupart des points sont groupés autour d’une droite, la corrélation est forte.

18 Une corrélation faible
Si les points sont dispersés, mais montrent une tendance générale, la corrélation est faible.

19 La corrélation positive
Une corrélation positive veut dire que la relation entre les variables est positive. Par exemple, quand la variable indépendante augmente, la variable dépendante augmente alors la pente est positive (elle monte de gauche à droite)

20 La corrélation négative
Une corrélation négative veut dire que la relation entre les variables est négative. Par exemple, quand la variable indépendante augmente, la variable dépendante diminue alors la pente est négative (elle descend de gauche à droite)

21 Une corrélation n’est pas apparente
Si les points sont dispersés et ils ne montrent pas de tendance générale, il n’y a pas de corrélation ou la corrélation n’est pas apparente.

22 Une relation Une relation est une régularité entre deux ensembles de nombres. Une relation = « a relationship »

23 Les types des relations
Avec la gestion des données, il y a 2 types de relations: Une relation linéaire (elle forme une ligne droite) Une relation non linéaire (elle ne forme pas de ligne droite)

24 8.2: Analyser des données et faire des prévisions
Pour analyser les données, il est utile à représenter les données à l’aide d’un diagramme de dispersion. Puis, trace, à vue, la droite la mieux ajustée.

25 La qualité de l’ajustement de la droite
Une grille de corrélation est un guide pour indiquer de la qualité de l’ajustement de ta droite.

26 Une grille de corrélation
La qualité de l’ajustement +1 L’ajustement parfait sur une droite de pente positive. Forte et positive La plupart des points sont groupés autour d’une droite de pente positive. Faible et positive Les points sont dispersés, mais montrent une tendance générale positive. Aucune relation apparente. Faible et négative Les points sont dispersés, mais montrent une tendance générale négative. Forte et négative La plupart des points sont groupés autour d’une droite de pente négative. -1 L’ajustement parfait sur une droite de pente négative.

27 8.3: Représenter des données
Voici 6 types de représenter des données: (9ième année) Un diagramme de dispersion Un histogramme Un diagramme circulaire Un diagramme à tiges et à feuilles Un diagramme à boîte et à moustaches Un diagrammes à bandes

28 Un diagramme à bandes Un diagramme à bandes est un diagramme qui représente des données à l’aide de bandes horizontales ou verticales. Il sert à comparer des catégories.

29 Un diagramme circulaire
Un diagramme circulaire est un diagramme qui représente un ensemble de données par un cercle divisé en secteurs. Il sert à comparer des catégories entre elles et à comparer chaque catégorie à l’ensemble complet.

30 Un diagramme à tiges et à feuilles
Un diagramme à tiges et à feuilles est une façon d’organiser des données numériques qui représente une partie de chaque nombre par une tige et l’autre partie par une feuille.

31 Un histogramme Un histogramme est un diagramme à bandes juxtaposés qui représente des données groupées par intervalles.

32 Un diagramme à boîte et à moustaches
Un diagramme à boîte et à moustaches est un diagramme qui indique la médiane et l’étendue d’un ensemble de données numériques.

33 Le fonction des diagrammes à boîte et à moustaches
Un diagramme à boîte et à moustaches illustre la dispersion des données autour de la médiane d’un ensemble de données.

34 Le vocabulaire des diagrammes à boîtes et à moustaches
La boîte contient ou représente au moins 50% des données. La plus petite valeur et la plus grande se nomment la valeur minimum et la valeur maximum respectivement. Le quartile inférieur est la médiane de la moitié inférieure des données. Le quartile supérieur est la médiane de la moitié supérieure des données.

35 Comment choisir la représentation la plus appropriée
Le diagramme le plus approprié dépend du type de données que tu veux communiquer.

36 Les indices pour choisir la représentation correcte #1
Les diagrammes à ligne brisée et les diagrammes de dispersion servent à analyser des tendances. Les histogrammes, les diagrammes à boîte et à moustaches et les diagrammes à tiges et à feuilles servent à analyser l’étendue des données.

37 Les indices pour choisir la représentation correcte #2
Les diagrammes à bandes et les diagrammes circulaire servent à comparer des catégories.

38 Les mesures de tendance centrale
Le mesure de tendance centrale est la valeur qui représente le centre d’un ensemble de données.

39 Les types de mesure de tendance centrale
Il y a trois types de mesure de tendance centrale: La moyenne La médiane Le mode

40 La moyenne La moyenne est la somme des valeurs d’un ensemble divisé par le nombre de valeurs dans l’ensemble. L’avantage de la moyenne: elle donne des renseignements sur la somme des valeurs. Le désavantage de la moyenne: les valeur aberrantes ont une incidence sur elle.

41 Le médiane La médiane est la valeur du milieu quand les données d’un ensemble sont placées par ordre croissant. L’avantage de la médiane: les valeurs aberrantes ont peu d’incidence sur elle. Le désavantage de la médiane: elle ne fournit aucun renseignements sur la somme des valeurs.

42 Le mode Le mode est la valeur la plus courante dans un ensemble de données. L’avantage du mode: il est facile à trouver dans des tableaux de fréquence, des diagrammes, des diagrammes à bandes ou des histogrammes. Le désavantage du mode: il peut changer énormément quand il y a ajout de nouvelles données.


Télécharger ppt "Chapitre 8: La gestion des données"

Présentations similaires


Annonces Google