COMPARAISON DES LOGICIELS DE TRAITEMENT DES DONNEES TEXTUELLES par Network of Excellence in Text Mining & its application in Statistics COMPARAISON DES LOGICIELS DE TRAITEMENT DES DONNEES TEXTUELLES par Sofia Triantafyllidou Maître du stage : Antoine Spinakis Professeur responsamble : Nicolas Loménie Inserer le logo de quantos et de la MST
TEXT MINING OU TEXT DATA MINING Network of Excellence in Text Mining & its application in Statistics TEXT MINING OU TEXT DATA MINING Sortir l’information pertinente à partir des données textuelles, non structurées A partir des textes non structurés, créer une forme intermédiaire (FI) des données qui va servir à l’extraction de l’information souhaitée. On considère qu’en ce qui consèrne le text mining, il y a un potentiel commercial plus important que celui de data mining car une étude recent a montré que 80% de l’information qu’une entreprise dispose se trouve dans des documents de text.
LE CADRE DU TEXT MINING Forme intermédiaire basée sur les documents Network of Excellence in Text Mining & its application in Statistics LE CADRE DU TEXT MINING Forme intermédiaire basée sur les documents classification catégorisation visualisation Mettre un titre Traduire Donner un exemple (voir dans le doc acrobat : text_mining_survey.pdf) Parler des domaines d’application (faire eventuellement un transperant) Forme intermédiaire basée sur des concepts modèle de prédiction visualisation Affinement du text Extraction de l’information
APERCU DU PROCESSUS DE COMPARAISON Network of Excellence in Text Mining & its application in Statistics APERCU DU PROCESSUS DE COMPARAISON 1ère phase: preparation du processus d’evaluation 1ère étape Sélection des logiciels text mining à comparer 2ème étape Description générale de ces logiciels 3èmeétape Présentation des critères d’évaluation 2ème phase: comparaison des logiciels TM seléctionés Il faut parler des critères de selection de ces logiciels 4èmeétape Comparaison des outils de text mining selon les critères d’évaluation
LOGICIELS SELECTIONES Network of Excellence in Text Mining & its application in Statistics LOGICIELS SELECTIONES ALCESTE ATLAS.ti Hyperbase IBM Intelligent Miner for Text Intex Lexico NUD*IST SAS Text Miner SPAD Sphinx Lexica SPSS STING Technology Watch from IBM Temis on Line Miner
CRITERES D’EVALUATION Network of Excellence in Text Mining & its application in Statistics CRITERES D’EVALUATION CARACTERISTIQUES TECHNIQUES PROCESSUS DU TRAITEMENT DES DONNEES TEXTUELLES METHODES D’ANALYSE PRESENTATION DES RESULTATS METHODES DE VISUALISATION AUTOMATISMES Traduire Automation
EXEMPLE DE PRESENTATION DES RESULTATS Network of Excellence in Text Mining & its application in Statistics EXEMPLE DE PRESENTATION DES RESULTATS QUARACTERISTIQUES TECHNIQUES