Par: France CHAMPAGNE et Guy TREMBLAY

Slides:



Advertisements
Présentations similaires
Mais vous comprenez qu’il s’agit d’une « tromperie ».
Advertisements

Explorer un espace d’états
Licence pro MPCQ : Cours
Distance inter-locuteur
1 IXERP consulting. L archivage consiste à extraire de la base de données opérationnelle les informations qu' il n est plus nécessaire de conserver «
DTD Sylvain Salvati
Affichage interactif, bidimensionnel et incrémental de formules mathématiques Hanane Naciri et Laurence Rideau INRIA Sophia Antipolis CARI'2000.
Scenari-Plateform Module Audio / Ircam Développé par Paul Rouget
Les technologies XML Cours 3 : Les APIS XML Janvier Version 1.0 -
Algorithme et structure de données
Introduction : Compilation et Traduction
FLSI602 Génie Informatique et Réseaux
Laboratoire SAFARI , UQAM
JOME, un Composant Logiciel pour le Télé-Enseignement des Mathématiques via le WEB, Compatible OpenMath et MathML Laurent DIRAT OVE / I3S-UNSA.
12 novembre 2012 Grégory Petit
Les fonctions.
Les requêtes La Requête est une méthode pour afficher les enregistrements qui répondent à des conditions spécifiques. La requête est donc un filtre.
3, Promenade Venezia VERSAILLES SelfScore Immobilier
Développement d’applications web
Etude des Technologies du Web services
Évaluation des IHM et ergonomie
Recherche d’un thème de projet Identification d’un besoin
Algorithmique et Programmation
Bibliothèque standard du C++
Croissance et extremums
Les conditions d’efficacité de l’enseignement magistral
Arbre Rouge Noir.
Création d'un diaporama Création d'un diaporama
SÉMINAIRE DE LANCEMENT DES COURS EN LIGNE
Les fichiers indexés (Les B-arbres)
Introduction à l’algorithmique
IFT313 Révision finale Département d’informatique
Représentation des systèmes dynamiques dans l’espace d’état
Représentation des systèmes dynamiques dans l’espace d’état
La statistique descriptive

IFT 6800 Atelier en Technologies d’information
ELE6306 : Test de systèmes électroniques Projet de cours Chaîne de scan unique: Reconfiguration = Optimisation Louis-Martin Côté Professeur : A. Khouas.
Fourmis artistiques ou l'art artificiel pictural et musical
MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
1 Enquête sur les personnes-ressources de lIDD et leurs représentants : profil régional de lOuest Gaëtan Drolet Formation des formateurs février.
1 Enquête sur les personnes-ressources de lIDD et leurs collègues désignés: profil régional du Québec Gaëtan Drolet Formation des formateurs février.
Projet de Master première année 2007 / 2008
LORTHOGRAPHE. Les nouveaux programmes prévoient entre 2h 30 (horaire minimum) et 3h30 (horaire maximum) pour la grammaire, lorthographe, le vocabulaire.
Programmation dynamique
Rappel Modèle analyse-synthèse de la compilation
Sensibilisation a la modelisation

MAGIE Réalisé par Mons. RITTER J-P Le 24 octobre 2004.
GNU Free Documentation License
Notre projet La classe va écrire des chansons
Introduction à Visual Studio C++ (VC++)
Technologies web et web sémantique TP3 - XML. XML eXtensible Markup Language (langage extensible de balisage) – Caractéristiques: méta-langage = un langage.
Arbres binaires et tables de hachage
Sciences de l ’Ingénieur
Modèle de conception et de production à la SOFAD Journée d’échange du CLIFAD Trois-Rivières, le 3 décembre 2004 Jean-Simon Labrecque, Chargé de projets.
Initiation à la conception des systèmes d'informations
Soutenance du mémoire de synthèse
Module : Langage XML (21h)
L T I Laboratoire de Téléinformatique 2 Projet de semestre Parseur XML basé sur la DTD : Buts –Utiliser la grammaire définissant un type de fichiers XML.
Ajouts et retraits dans un arbre de connexion Nicolas Thibault et Christian Laforest, Équipe OPAL Laboratoire IBISC (regroupement LaMI et LSC), Évry 8.
Page Evaluation par les pairs avec le Numérique : un retour d’expériences dans un MOOC (Courlis)
8PRO107 Éléments de programmation Les tableaux. Étude de cas 1 Description du problème : Lire une liste d’entiers et l’afficher d’abord dans le même ordre.
31/05/2007Projet Master 11 Présentation ludique de la recherche opérationnelle à la fête de la science Année universitaire 2006/2007 Sylvain FIX Julien.
Initiation aux bases de données et à la programmation événementielle
LES TABLEAUX Définition: Création d’un tableau:
Théorie Les signes employés pour écrire la musique 1
Visual Information Solutions IDL 7.0 Pour une utilisation optimale d’IDL.
M. BENJELLOUN : 2005 Le but final est de programmer un jeu où l'ordinateur choisira un nombre aléatoire entre 0 et 100 que vous devez deviner.
Transcription de la présentation:

Par: France CHAMPAGNE et Guy TREMBLAY Application de la distance d’édition à la correction de dictées musicales Par: France CHAMPAGNE et Guy TREMBLAY

Description du problème L’apprentissage du solfège est essentiel dans la formation de tout bon musicien Un outil de correction automatique permettrait à un étudiant d’être autonome et de s’auto-évaluer Première ébauche d’un tel outil (basé sur l’algorithme de distance d’édition): CADiM = Correcteur Automatique de Dictées Musicales

Plan de la présentation Les particularités d’une dictée musicale Les erreurs typiques des étudiants Une heuristique pour la correction des dictées La distance d’édition et son application aux dictées La représentation symbolique des dictées L’outil CADiM Les résultats obtenus

Particularités d’une dictée musicale Une suite de sons formant une mélodie est jouée par un enseignant à une classe d’étudiants La dictée est morcelée en court fragments mémorisables Chaque fragment est joué plusieurs fois L’étudiant doit reconnaître le fragment et le transcrire dans la notation musicale standard

Particularités d’une dictée musicale Monodique = un seul son est entendu à la fois => séquence de sons À chaque son est associé une note qui décrit: La hauteur du son La durée du son

Particularités d’une dictée musicale Une dictée mélodique peut donc être représentée par une chaîne de symboles formée d’une suite de couples (h, d) où: h = la hauteur du son; d = sa durée.

Particularités d’une dictée musicale L’alphabet H définit les hauteurs de sons (nom des notes) H = {Do, Ré, Mi, Fa, Sol, La, Si, Silence} L’alphabet D définit les durées possibles d’une note ou d’un silence D = {ronde, blanche, noire, croche, double-croche}

Exemple d’un segment musical Arpège = {(Do, noire), (Mi, noire), (Sol, noire pointée), (Mi, croche), (Do, croche), (Silence, croche) (Sol, noire), (Do, blanche)}

2. Les erreurs typiques Les erreurs typiques faites par les étudiants ont été identifiées suite à une rencontre avec une experte du domaine: Mme Luce Beaudet Mme Beaudet est Professeure agrégée à la Faculté de Musique de l’Université de Montréal et responsable de la formation auditive.

Exemple: Frère Jacques

Quelques erreurs courantes (hauteurs de son) Mauvaise note Une note en trop Manque une note

Quelques erreurs courantes (durée) Durée trop courte Durée fragmentée Déplacement du rythme Durées consolidées

3. Heuristique pour la correction de dictées musicales On attribue un pointage différent aux erreurs de hauteur ou de rythme Les erreurs de hauteur sont considérées plus graves et ont donc un coût plus élevé Pondération typique utilisée par Mme Beaudet: 88% pour les erreurs de hauteur 12% pour les erreurs de rythme

Exemple La dictée « Frère Jacques » comprend 32 notes et 32 temps. Le coût d’une erreur sera donc: Coût d’une erreur de hauteur: 88/32 = 2,75 Coût d’une erreur de rythme: 12/32 = 0,38

Exemple (suite) Un étudiant a fait 10 erreurs de hauteur de son et 5 erreurs de rythme. 10 * 2,75 (coût hauteur) = 27,5 5 * 0,38 (coût rythme) = 1,9 Total = 29,4 (70,6%)

Définition des coûts Chauteur Crythme (h,d) Soit t = unité de temps Pourcentage hauteur / nombre de notes Crythme (h,d) Soit t = unité de temps (d / t) * Pourcentage rythme / nombre de notes

4. La distance d’édition Utilisation classique de la distance d’édition: La recherche dans des textes La biologie computationnelle Le traitement de signal

La distance d’édition Distance entre deux chaînes A et B = nombre minimum d’opérations pour transformer la chaîne A en la chaîne B Trois opérations élémentaires : Ajouter un caractère Supprimer un caractère Remplacer un caractère

Distance d’édition entre PARUTION et PARTISAN PAR _ TION -- Supprimer U PARTI S ON -- Insérer S PARTIS A N -- Remplacer O par A PARTISAN Total: 3 opérations.

Équations récursives définissant la distance d’édition Soit C(i,j), le coût pour passer de la chaîne A[1..i] à la chaîne B[1..j] C(0,0) = 0 cas C(i,0) = C(i-1,0) + Coût supprimer(A[i]) de C(0,j) = C(0,j-1) + Coût ajouter(B[j]) base C(i,j) = C(i-1,j-1) + Coût échanger(A[i],B[j]) cas min C(i-1,j) + Coût supprimer(A[i]) récursif C(i,j-1) + Coût ajouter(B[j])

5. Distance d’édition appliquée aux dictées musicales Bases de données (MIR) Requête fredonnée (query by humming) Similarité par contour, par texture, … Analyse musicologique etc.

Mongeau et Sankoff 1990 Ont cherché à adapter directement l’algorithme de distance d’édition à des segments musicaux. Ont établi une charte de poids pour chaque type d’intervalle selon leur degré de consonance. Ont introduit deux nouvelles opérations pour les variations de rythme: la fragmentation et la consolidation

Opérations de fragmentation et consolidation

Notre algorithme de correction Basé sur Mongeau et Sankoff Utilise les opérations de consolidation et de fragmentation Diffère par les fonctions de coûts Note finale = 100 – la distance obtenue

Notre distance d’édition C(0,0) = 0 cas C(i,0) = C(i-1,0) + Coût supprimer(A[i]) de C(0,j) = C(0,j-1) + Coût ajouter(B[j]) base C(i,j) = C(i-1,j-1) + Coût échanger(A[i],B[j]) C(i-1,j) + Coût supprimer(A[i]), C(i,j-1) + Coût ajouter(B[j]) min C(i-1,j-k) + Coût échanger(A[i], B[j-k+1..j]) fragmentation C(i-k,j-1) + Coût échanger(A[i-k+1..i], B[j]) consolidation

Les fonctions de coût échanger(A[i], B[j]) supprimer(A[i]) (A[i] ≠h B[j]) * Chauteur + (A[i] ≠d B[j]) * Crythme(B[j]) supprimer(A[i]) Chauteur + Crythme(A[i]) ajouter(B[j]) Chauteur + Crythme(B[j]) échanger(A[i], B[j-k+1..j]) HauteursDifférentes(B[j-k+1..j], A[i]) * Chauteur + Crythme(A[i]) échanger(A[i-k+1..i], B[j]) HauteursDifférentes(A[i-k+1..j], B[j]) * Chauteur + Crythme(B[j])

6. Représentation symbolique d’une dictée musicale Représentation des dictées doit inclure La hauteur et la durée de chaque note L’ordre de succession des notes Doit représenter l’ensemble des éléments correspondant au système standard de notation musicale

Formats de représentation musicale existants MIDI SMDL NIFF Humdrum Formats basés sur XML

Avantages des formats basés sur XML Lisibles (encodage ASCII) Peuvent être lus à l’aide d’analyseurs syntaxiques et manipulés à l’aide de DOM ou SAX

Formats basés sur XML MusicXML 4ML MML MusiXML Nous avons choisi MusicXML parce que il offre une description détaillée et complète du système de notation musicale il propose un plugiciel permettant la conversion automatique d’une dictée en format Finale au format MusicXML

Représentation d’une note en MusicXML <pitch> <step>C</step> <alter>1</alter> <octave>4</octave> </pitch> <duration>1</duration> <type>whole</type> </note>

Représentation de cette note sous forme d’arborescence Pitch Duration Type 1 Whole Step Alter Octave C 1 4

Étapes pour la transformation d’une dictée musicale Entrée à la main dans Finale 2000 Logiciel d’édition de partition Transformée en fichier MusicXML à l’aide du plugiciel fournit par Recordare Lue et transformée en arborescence par notre outil (avec DOM) Transformée en séquence de notes {(Do,noire), (Mi,noire), (Sol, noire),…}

6. L’outil CADiM Développé en Java Utilise l’algorithme de distance d’édition décrit précédemment Compare les dictées de tout un groupe d’étudiants avec la dictée originale et donne une note pour chaque dictée (note sur 100)

Architecture de CADiM Dictée du professeur (MusicXML) Note = 78,3 Dictée prof. Note = 78,3 Affichage des erreurs (optionnel) Analyseur xml2jdom (Java) jdom2seq (Java) Algorithme de distance d’édition (Java) Solution étudiant Solution d’un étudiant (MusicXML) Solutions de tous les étudiants (liste des fichiers) DTD MusicXML

7. Résultats Deux séries de tests : Dictées fictives avec « Frère Jacques » Dictées réelles d’un cours d’apprentissage du solfège à l’Université de Montréal Les dictées ont été soumises à Mme Beaudet afin de comparer les résultats des deux méthodes de correction

Résultats « Frère Jacques » Copie Correction Mme Beaudet Correction CADiM Différence 1 91,00 91,75 0,75 2 11,00 38,25 27,25 3 98,00 95,75 -2,25 4 93,38 -4,62 5 95,00 94,50 -0,50 6 83,00 82,75 -0,25 7 89,88 -0,12

Résultats dictée réelle Copie Correction Mme Beaudet Correction CADiM Différence 1 97,00 97,64 0,64 2 45,00 38,64 -6,31 3 85,00 84,67 -0,33 4 40,00 51,25 11,25 5 67,00 66,97 -0,03 6 52,00 55,58 3,58 7 69,33 2,33 8 100,00 0,00 9 87,00 86,25 -0,75 10 60,00 61,06 1,06 11 87,42 0,42

Fidélité à la correction de Mme Beaudet En moyenne = Différence de moins de 4%! Explication des écarts : Note très faible Saut d’octave Facteur humain

8. Travaux futurs Mettre au point des méthodes permettant de reconnaître les faiblesses d’un étudiant Développer un tutoriel pour l’apprentissage du solfège

Questions et commentaires?