Les attributs, leurs types, leurs valeurs Christelle Scharff IFI Juin 2004.

Slides:



Advertisements
Présentations similaires
Eléments d'algèbre linéaire
Advertisements

3. Logique et mathématiques De la logique aux mathématiques.
Regroupement (clustering)
Regroupement (clustering)
Spécification et qualité du logiciel
LE CALCUL LITTÉRAL AU COLLÈGE
Addition et soustraction des nombres relatifs (1)
Addition de nombres relatifs
Addition et soustraction des nombres relatifs (13)
Les Structures. Introduction : Imaginons que lon veuille afficher les notes dune classe délèves par ordre croissant avec les noms et prénoms de chaque.
Dossier TICE Excel.
Christelle Scharff IFI Juin 2004
Le modèle de Bayes Christelle Scharff IFI La classification de Bayes Une méthode simple de classification supervisée Basée sur lutilisation du Théorème.
Traitement de données socio-économiques et techniques d’analyse :
Partie 1 Etude de l'existant
Différence de relatifs
Addition et soustraction des nombres entiers
Chapitre 7: Les polynômes
Les éléments de base de l’algorithmique
Chapitre 2: Les régularités et les relations
FDD et Arbres de Décision
RESUMES Module II1 SOMMAIRE CYCLE 1 : Saisir – Afficher – Données
Méthode des k plus proches voisins
Théorie des graphes Un peu de vocabulaire.
Cours de 3ème SAGE P Chapitre 1 Calcul numérique.
Les graphiques pour la vélocité
LES NOMBRES RELATIFS I DEFINITION 1° Activité 1 page 80
OPERATIONS SUR LES NOMBRES EN ECRITURE FRACTIONNAIRE
Cours de 3ème SAGE P Module1 Révisions Calculs numériques.
LIFI-Java 2004 Séance du Jeudi 9 sept. Cours 1. La notion de langage Décrire une tâche à effectuer –programme Écrire à un haut niveau –facile pour lutilisateur.
Les expressions algébriques Les termes semblables.
La chaleur et la température
L’opposé d’un nombre..
Le Bloc Case Cours LCS N°3 Présenté par Mr: LALLALI.
1 Math au cycle 2 Quelques rappels sur les nombres Le document « Le nombre au cycle 2 » La soustraction : quelques repères Janvier 2011.
Activité 1 sommaire Vous avez redécouvert ce que l'on appelle le principe 68%-95%-99,7% : Ce principe est valable pour des distributions de fréquences.
Specifications de Systemes Logiciels المواصفات الشكلية Software Specifications Chapitre 7.
8.1 LES NOMBRES COMPLEXES cours 26. Avec la venue de: Doigts Dettes Tartes Distances.
Nombres entiers positifs et négatifs Exercice de réchauffement A13 Dans ton cahier Hilroy, écris la date, le titre, et le résultat d’apprentissage Copie.
Les expressions algébriques
Différence de relatifs
Chapitre 7 Calcul littéral.
STATISTIQUES DESCRIPTIVES
La recherche au service du communicateur: Cours 9 Automne 2006 L’analyse de données.
Le langage Racket (Lisp)
?...1…-13…( )…+…-… …-(-2)…-(5-7)…-2+6…?
La température décris si un objet est chaud ou froid.
VARIABLES ET MESURES DE FREQUENCES Pr. KELLIL M 1.
La température décris si un objet est chaud ou froid.
TIPE Les dames chinoises
Chapitre 1 Nombres relatifs.
Chaleur et température
Les nombres relatifs 2.
Codage de l’information
La mesure.
MATHEMATIQUES en 5°.
L’addition des entiers relatifs
Énergie Thermique et la chaleur
Opérations sur les nombres relatifs
Les nombres relatifs 2.
M. YAMANAKA – Cours de mathématiques. Classe de 4ème.
La comparaison et la mise en ordre des nombres rationnels
La Météo Quel temps fait-il? Il fait + adjectif Il fait beau / lourd / humide / orageux. Il fait mauvais / doux / frais. Il fait froid. Il fait chaud.
Opérations sur les nombres relatifs Chapitre 1 Classe de 4ème.
Les dossiers patients d’un hôpital contiennent les attributs suivants : – nom – code postal – pression systolique en mm de mercure. – s’il est porteur.
Des variables et des données. Dans le domaine de la statistique le mot variable signifie une idée différente de celle dans l’algèbre ou les fonctions.
Mathématiques – Calcul mental
Mathématiques – Calcul mental
Mathématiques – Calcul mental
Mathématiques – Calcul mental
Transcription de la présentation:

Les attributs, leurs types, leurs valeurs Christelle Scharff IFI Juin 2004

Attributs Un attribut a un type et des valeurs contraintes par ce type Le type dun attribut peut être: Ordinal Nominal Intervalle Ratio

Attributs à valeurs nominales Les valeurs sont des symboles (des noms) Exemple: Les valeurs de Temps sont {Ensoleillé, Pluvieux, Neigeux, Gris} Aucune relation (ordre ou distance) entre les nominaux nexiste Seuls des tests dégalité peuvent être exécutés Exemple de règle: If Temps = Pluvieux Then Match = No

Attributs à valeurs ordinales Une notion dordre simpose sur les ordinaux Mais il nest pas possible de calculer directement des distances entre des valeurs ordinales Les opérations daddition et de soustraction ne sont pas possibles Exemple: La température est décrite par les adjectifs {chaud, froid, moyen}, et chaud > moyen > froid Exemple de règle: If température > froid Then match = Yes

Attributs de type intervalle Les intervalles impliquent une notion dordre, et les valeurs sont mesurées dans des unités spécifiques et fixées La somme, la différence et le produit de 2 intervalles ne sont pas possibles (car le point zéro nexiste pas) Exemples: La température exprimée en degrés Celsius ou Fahrenheit Lattribut année

Attributs de type rapport (ratio) Toutes les opérations mathématiques sont autorisées sur les attributs de ce type Exemple: Lattribut distance On peut comparer 2 distances On peut additionner 2 distances La distance entre un objet et lui-même est zéro

Les types des attributs en pratique En général: nominaux et ordinaux Les attributs nominaux sont aussi appelés attributs discrets Mais le terme discret implique une notion dordre Les attributs ordinaux sont aussi appelés attributs numériques Mais le terme numérique implique certaines opérations Cas particulier: Les attributs de type booléen

Transformation dordinaux en booléens Un attribut de type ordinal à n valeurs peut être transformé en n-1 attributs de type booléen Cette solution est plus appropriée que dutiliser un attribut de type nominal

Les attributs numériques Les numériques sont identifiés aux réels Les attributs numériques sont interprétés comme des ordinaux si les opérateurs de relation sont utilisés Les attributs numériques sont interprétés comme des rapports sil est nécessaire de calculer des distances

Nominal versus Ordinal Lutilisation dun ordinal peut permettre de simplifier les règles Exemple: Age prend les valeurs {Jeune, Adulte, Âgé} Si Age est un attribut nominal: If Age = Jeune Then Loisirs = Yes If Age = Adulte Then Loisirs = Yes If Age = Âgé Then Loisirs = No Si Age est un attribut ordinal: If Age <= Adulte Then Loisirs = Yes If Age = Âgé Then Loisirs = No

Valeurs manquantes Les données ne sont pas toujours collectées pour être fouillées Les valeurs sont manquantes parce que: inconnues, non nécessaires, non enregistrées… Exemples: Non-fonctionnement du matériel, mesure non possible, temps… Parfois, une valeur manquante doit être détectée et ajoutée, car elle signifie quil y a un problème dans les données Exemple: Examen médical

Valeurs incohérentes Les données ne sont pas toujours collectées pour être fouillées Les valeurs sont incohérentes parce que: des erreurs (délibérées ou non), des omissions, des duplications ont été introduites… Exemples: Erreurs typographiques dans les nominaux Erreurs de mesure…

WEKA: Le format ARFF Attributs numériques et nominaux

FDD et attributs Les algorithmes de FDD dépendent beaucoup des types des attributs Les valeurs manquantes et incohérentes doivent être détectées et traitées spécialement par les algorithmes

Réferences I. H. Witten, and E. Frank. Data Mining : Practical Machine Learning Tools and Techniques with Java Implementations. Morgan Kaufmann.