Master 2 recherche en informatique Parcours 4 Des données aux connaissances : apprentissage, modélisation et indexation des contenus multimédias et des données symboliques
Domaine Des données porteuses d’un sens complexe : Données biologiques, médicales, génomiques Textes, images, vidéos, sons, paroles, musique Signaux, alarmes, messages Fichiers, bases de données, logs
Domaine Des traitements sur ces données Décrire, modéliser Classer, trier, ranger, organiser Visualiser, naviguer Rechercher, trouver, découvrir Résumer, condenser, ré-organiser Diagnostiquer, détecter, décider
Domaine Un enjeu : Des traitements sur le sens Des traitements ont du sens
Tronc commun Module ADM - Analyse des données et modélisations stochastiques obligatoire 1 module au choix entre ASR - Introduction à l'algorithmique des applications et des systèmes répartis OPT - Optimisation numérique et combinatoire
Modules spécifiques ARD - Acquisition et représentation des données AS - Apprentissage supervisé DSS - Apprentissage sur des données séquentielles symboliques FAV - Analyse des documents et des flux audiovisuels pour l'indexation CDD - Gestion de larges collections de documents décrits
Une autre lecture Traitements (apprentissage, statistiques) généraux non supervisés - ADM supervisés - AS Données (acquisition, représentation) - ARD Traitements spécifiques Données symboliques (langue, génome…) - DSS Données numériques (images, son…) - FAV Grandes collections - CDD
Emploi du temps Tronc commun : le jeudi, 10 semaines ARD et AS : jusqu’à Toussaint DSS, FAV, CDD : après Toussaint BIBL, COLQ, META, RAS… Stage
Planning de travail 20 h de cours / module => au moins 30h de travail à côté ! Apprentissage des cours Lecture d’articles, de livres, synthèses Travaux expérimentaux Programmation Traitement et analyse de données
Évaluation Tronc commun : examen écrit 5 autres modules : contrôle continu Exposé, compte rendu écrit Sur articles À partir du travail expérimental Épreuve écrite
Pour démarrer ! L’indexation multimédia Description et recherche automatiques sous la dir. de Patrick GROS Hermès - Lavoisier Documentation IRISA Sur commande (mais cher : 95 EUR)
Et ensuite ? Pattern Recognition and Machine Learning Christopher M. Bishop Springer
Et encore ? Un atelier mathématique Pour rediscuter des notions de bases utiles : fonctions, dérivées, intégrales, matrices, probabilités... Pour faciliter un travail personnel Ce n’est pas un cours de math ! En fonction des disponibilités de l’animateur bénévole ! (2 à 4h / semaine)
Stages : quelles équipes ? DREAM : diagnostic, raisonnement et apprentissage, modélisation IMADOC : reco de documents, de l’écriture LIS : systèmes d’information logique METISS : signaux sonores et parole SYMBIOSE : modèles biologiques, bioinfo TEXMEX : multimédia, grands volumes
D’autres équipes… BUNRAKU : graphique et réalité virtuelle CORDIAL (Lannion) : dialogue oral homme machine FLUMINANCE : analyse et contrôle de flux de fluides dans des séquences d’images LAGADIC : robotique et vision PILGRIM (Lannion) : bases de données, flou SERPICO : organisation et coordination dynamique de complexes moléculaires TEMICS : compression d’images, tatouage VISAGES : imagerie médicale
Exemples de sujets IMADOC DREAM Introduction de mécanismes probabilistes dans un analyseur grammatical bidimensionnel Commandes gestuelles avec prédiction de trajectoires graphiques DREAM Prise en compte de la qualité des données pour la fouille de données
Exemples de sujets TEXMEX METISS Suivi de sujets d'actualité dans les flux télévisuels Pour une navigation facile, pertinente et individualisée dans une base de documentaires vidéos METISS Analyse et modélisation statistique de l’interprétation de morceaux de musique
Contact Patrick.Gros@irisa.fr 02 99 84 74 28 Site Web du master www.irisa.fr/master Pages des modules Mailing list Également : adresse des enseignants