La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Les logiciels de gestion et visualisation de l'information de l'I.R.I.T. : La Plate-forme TETRALOGIE Bernard DOUSSET dousset@irit.fr Institut de Recherche.

Présentations similaires


Présentation au sujet: "Les logiciels de gestion et visualisation de l'information de l'I.R.I.T. : La Plate-forme TETRALOGIE Bernard DOUSSET dousset@irit.fr Institut de Recherche."— Transcription de la présentation:

1 Les logiciels de gestion et visualisation de l'information de l'I.R.I.T. : La Plate-forme TETRALOGIE
Bernard DOUSSET Institut de Recherche en Informatique de Toulouse (IRIT) Equipe Systèmes d’Information Généralisés (SIG) Université Paul Sabatier (Toulouse III)

2 Plan de la présentation
Historique Définitions et buts La veille stratégique L’analyse de données La plate-forme Architecture Interactivité Travail en équipe Principe général Contribution en analyse textuelle en analyse exploratoire en visualisation Conclusion bilan perspectives 07/11/2003 TETRALOGIE

3 Cycle de l’intelligence économique
Veille stratégique Historique Historique Architecture Contribution Conclusion Définitions et buts I Secteurs d’activité diffuser l’information endogène Connaissance valider et diffuser l’information exogène Connaissance Décideur synthétiser Connaissance Cycle de l’intelligence économique Informations élaborées analyser & interpréter diffusion restreinte mémoriser & organiser Scénarios élaborer Stratégie choisir Informations utiles évaluer & collecter Cibles déterminer & hiérarchiser Sources identifier & sélectionner 07/11/2003 TETRALOGIE

4 Etudier l’environnement et l’évolution
Historique Architecture Contribution Conclusion Historique Définitions et buts II Etudier l’environnement et l’évolution Des marchés Des coopérations Des alliances Des participations De l'innovation Des ruptures Des modes Des implantations Des transferts de technologie Des dépôts de brevets Des équipes de recherche De la terminologie Des bases documentaires Des publications De la publicité Des appels d'offres 07/11/2003 TETRALOGIE

5 Le processus de veille stratégique comporte cinq phases :
Historique Architecture Contribution Conclusion Historique La veille stratégique Le processus de veille stratégique comporte cinq phases : la sélection des données utiles : terminologie, dates, acteurs (auteurs, organismes, pays…) la préparation des données : pré-traitements : nettoyages [Zipf49], synonymies [Porter80] transformations : modèle de représentation des données [Salton89] l’analyse des données: classifications, règles d'associations, séquences, ... l’interprétation et l’évaluation : basées en grande partie sur les visualisations l’exploitation et donc la prise de décision 07/11/2003 TETRALOGIE

6 Analyses multidimensionnelles
Historique Architecture Contribution Conclusion Historique L’analyse de données Analyses multidimensionnelles Fondements : Spearman & Pearson dès 1904 Analyse canonique et ACP : [Hotteling35] Analyse des correspondances : [Hirschfeld35] et [Guttman41] Analyse procustéennes : [Schonemann65] En France Analyse Factorielle des Correspondances : [Benzécri73] Analyse de deux tableaux : [Lafosse85] Compléments en analyse procustéenne : [Fichet87] 07/11/2003 TETRALOGIE

7 Classifications Historique Architecture Contribution Conclusion
L’analyse de données Classifications Taxonomie par CAH [Sokal63] Centres mobiles [Forgy65] Nuées dynamiques [Diday71] Partitionnements Itératifs : Minimisation de la coupure [KL70], [FM82] Spectraux : VP de la matrice de Laplace [Hall70], [Hagen91] Multi-niveaux : regroupement + itératif KMETIS [Karypis98] Stochastiques : Markov CLustering [Van Dongen00] 07/11/2003 TETRALOGIE

8 Plate-forme Tétralogie
Historique Architecture Contribution Conclusion Historique Plate-forme Tétralogie Espace paramétrique en 3D : T. Benjamaà (Thèse) 1987 Trilogie 3D (ACP, AFC, CAH, CPP) Analyse textuelle, évolution : T. Dkaki (Thèse) 1993 1° Plate-forme Tétralogie 4D 1998 Visualisation interactive de CAH (DEA), signaux faibles (Stage) 1999 Conception de système d’IE : M. Salle (Thèse et Medesiie) 2002 Ingénierie du besoin en IE : T. Zid (Thèse et Medesiie) 2003 Grands graphes, géostratégie : S. Karouach (Thèse) 2004 Adéquation aux profile des entreprises : S. Hussein (Thèse) 2005 Morphing de graphes évolutifs : E. Loubier (en Thèse) 2007 Le portail Xplor (Analyses en ligne) : I. Ghalamallah (en Thèse) 07/11/2003 TETRALOGIE

9 Pourquoi un système interactif?
Historique Etat de l’art Contribution Conclusion Architecture Interactivité I Pourquoi un système interactif? En Amont de l’analyse l’interactivité sert à : mettre au point les équations de recherche évaluer les corpus (volume, pertinence, bruit) choisir et valider le ou les formats de sortie superviser la collecte du corpus contrôler les dictionnaires (forme et volume) choisir les filtres +, -, thématiques, ... valider les synonymies et l’indexation (Multi-termes) 07/11/2003 TETRALOGIE

10 Pourquoi un système interactif?
Historique Etat de l’art Contribution Conclusion Architecture Interactivité II Pourquoi un système interactif? Pendant l’analyse l’interactivité permet de sélectionner et contrôler les matrices de croisement choisir des méthodes à déployer piloter ces méthodes (localement ou à distance) extraire les connaissances via les visualisations choisir des vues à conserver consulter les experts via le réseau restituer l’analyse au décideur 07/11/2003 TETRALOGIE

11 Connexions entre acteurs de la veille
Historique Etat de l’art Contribution Conclusion Architecture Travail en équipe Connexions entre acteurs de la veille Documentaliste Décideur BD Web CD Serveur Expert Analyste 07/11/2003 TETRALOGIE

12 Historique Etat de l’art Contribution Conclusion Architecture Cooc
Principe général Cooc Corpus 4 3 2 1' 1 Méta-données Méta Niv. Dico 3 1 2 BD Web CD 3 D X 07/11/2003 TETRALOGIE

13 Extraction des dictionnaires
Historique Architecture Contribution Conclusion Contribution en analyse textuelle Dictionnaire + ou - Extraction des dictionnaires Courbe de charge Dictionnaire de synonymes 07/11/2003 TETRALOGIE

14 Détection des multi-termes
Historique Architecture Contribution Conclusion Contribution en analyse textuelle Détection des multi-termes Dictionnaire de mots vides Dictionnaire de multi-termes Dictionnaire de synonymes Seuil de détection statistique Traitement morphologique Traitement syntaxique Traitement statistique 07/11/2003 TETRALOGIE

15 Croisements 2D Historique Architecture Contribution Conclusion
en analyse textuelle Croisements 2D Filtre positif ou négatif Dictionnaire de synonymes Matrice carrée Courbe de charge Matrice asymétrique 07/11/2003 TETRALOGIE

16 Croisements 3D Historique Architecture Contribution Conclusion
en analyse textuelle Croisements 3D Dictionnaire de synonymes Filtre Troisième variable 07/11/2003 TETRALOGIE

17 en analyse exploratoire
Historique Architecture Contribution Conclusion Contribution en analyse exploratoire Algorithmes de tris de matrices Tri par classes de connexité Tri par blocs diagonaux 07/11/2003 TETRALOGIE

18 en analyse exploratoire
Historique Architecture Contribution Conclusion Contribution en analyse exploratoire Analyse en composantes principales (ACP) s’applique aux données quantitative comme les tableaux individus x variables elle utilise un espace réduit de 2 à 4 D deux cartes en sont déduites celle des coordonnées des individus cercle de corrélation des variables Analyse en composantes principales (ACP) Cercle des corrélations Cartes des coordonnées en 4D Synchronisation 07/11/2003 TETRALOGIE

19 en analyse exploratoire
Historique Architecture Contribution Conclusion Contribution en analyse exploratoire Analyse factorielle des correspondances (AFC) s’applique aux données qualitatives comme les matrices binaires, de contingence, de cooccurrence c’est un ACP sur les profils elle ne génère qu’une carte la proximité entre modalités des deux variables a un sens on peut manipuler séparément la carte des colonnes et exporter son azimut sur la carte complète Analyse factorielle des correspondances (AFC) 07/11/2003 TETRALOGIE

20 en analyse exploratoire
Historique Architecture Contribution Conclusion Contribution en analyse exploratoire Analyse factorielle des correspondances multiple (AFCM) nous l’appliquons aux matrices de cooccurrences 3D la 3° variable est le plus souvent le temps L ’AFC peut être appliquée à un des tableaux (les autres sont projetés) à tous les tableaux empilés à la somme des tableaux ( cas statique) Chaque ligne est représentée par une série de points On peut tracer des trajectoires Analyse factorielle des correspondances multiple (AFCM) 07/11/2003 TETRALOGIE

21 en analyse exploratoire
Historique Architecture Contribution Conclusion Contribution en analyse exploratoire Analyse procustéenne (de Procuste ou Procrustes) Celui qui allonge en tirant, devenu le symbole de l’uniformité "Dans la légende grecque, Procruste est un bandit qui hante la route près d'Eleusis. Il invite des voyageurs, qu’il étend sur un des deux lits qui meublent son logis, l'un très long, l'autre très court. Si l'hôte est trop grand pour le petit lit, Procuste lui ampute les jambes, s'il occupe l'autre, Procuste l'étire jusqu'à ce qu’il cadre avec le lit." 07/11/2003 TETRALOGIE

22 en analyse exploratoire
Historique Architecture Contribution Conclusion Contribution en analyse exploratoire Analyse procustéenne Enlever: la translation moyenne la rotation moyenne l’homothétie moyenne G1 G2 G3 G4 G2 G3 Evolution non standard G1 G4 G4 07/11/2003 TETRALOGIE

23 en analyse exploratoire
Historique Architecture Contribution Conclusion Contribution en analyse exploratoire Classification ascendante hiérarchique (CAH) Classification ascendante hiérarchique (CAH) méthode non supervisée on a le choix de la distance (euclidienne, max , sigma, …) on a le choix du mode d’agrégation (centre, inf, sup, moyenne) elle part des éléments disjoints et agrège les plus proches elle construit des classes imbriquées la hiérarchie peut être représentée par un dendogramme plusieurs niveaux de coupure sont possibles on peut exporter la classification Niveau de coupure à 8 classes Niveau de coupure à 4 classes 07/11/2003 TETRALOGIE

24 en analyse exploratoire
Historique Architecture Contribution Conclusion Contribution en analyse exploratoire Classification par partition CPP (Centres mobiles) supervisée k classes 1 représentant choix en 3D coloration icônes 4 classes 6 classes 07/11/2003 TETRALOGIE

25 Mise en évidence de signaux faibles
Historique Architecture Contribution Conclusion Contribution en visualisation Cartes géostratégiques faibles . Distribution linéaire Evolution de la coloration Choix d’une échelle non linéaire Sélection des données Mise en évidence de signaux faibles 07/11/2003 TETRALOGIE

26 Pondération par des données externes
Historique Architecture Contribution Conclusion Contribution en visualisation Pondération par des données externes Carte en valeurs absolues Carte pondérée par la population Choix de la pondération Carte pondérée par le PNB Carte pondérée par la superficie 07/11/2003 TETRALOGIE

27 Etude de l’évolution par animation
Historique Architecture Contribution Conclusion Contribution en visualisation Etude de l’évolution par animation en fonction du temps: matrice PA-DP par défilement de chaque variable par sélection de groupes de variables en mode absolu ou relatif en fonction du codage en fonction du niveau de coupure (CAH) 07/11/2003 TETRALOGIE

28 Segmentation et importation de classes
Historique Architecture Contribution Conclusion Contribution en visualisation Segmentation et importation de classes Carte en mode relatif : étude de tendances Pays non présents dans la dernière période Pays en récession . Pays en forte croissance Exportation d’une classification Effectifs des classes Niveau de coupure 07/11/2003 TETRALOGIE

29 Dessins de graphes Historique Architecture Contribution Conclusion
en visualisation Dessins de graphes Convergence rapide du placement des sommets Placement circulaire en fonction d’un tri Placement initial aléatoire . Algorithme de [Fruchterman91] Force d’attraction : Force de répulsion : 07/11/2003 TETRALOGIE

30 Partitionnement MCL Historique Architecture Contribution Conclusion
en visualisation Partitionnement MCL Graphe des classes Graphe partitionné Extraction des classes 07/11/2003 TETRALOGIE

31 Philosophie de notre plate-forme Tétralogie
Historique Architecture Contribution Conclusion Conclusion Bilan Philosophie de notre plate-forme Tétralogie c’est un ensemble cohérent de prototypes inter-opérants, qui utilise un standard unique pour le format des données, son interface graphique est homogène, et permet le partage des ressources et des méthodes via le réseau. Son utilisation en recherche support d’évaluation de méthodes, d’outils et de produits d’IE, vaste base d’exemples, à l’échelle, déjà analysés. Domaine d’application : la veille stratégique veille scientifique (scientométrie, indicateurs, évaluation) veille technologique (propriété industrielle, produits, procédés) veille économique (marchés, concurrents, substituts, …) 07/11/2003 TETRALOGIE

32 En analyses multidimensionnelles
Historique Architecture Contribution Conclusion Conclusion Perspectives En pré-traitement prendre en compte d’autres mesures de proximités améliorer le traitement sémantique => indexation à jour rechercher les passages pertinents (Web, texte intégral, …) En analyses multidimensionnelles étendre l’utilisation des analyses multiples (3D) mieux naviguer dans le corpus depuis les cartes factorielles mieux utiliser la visualisation des connexions locales En classifications implanter d’autres algorithmes (fourmis, k-means, k-metis, ...) réaliser la classification conjointe des lignes et des colonnes proposer un partitionnement adapté aux matrices 3D 07/11/2003 TETRALOGIE

33 En restitution des analyses
Historique Architecture Contribution Conclusion Conclusion Perspectives En amont des analyses reformulation de requêtes par les classes sémantiques (Thèse) filtrage par analyse de la variance => éliminer le bruit amélioration des techniques de synonymie (DEA) analyse du besoin en intelligence économique (Thèse fin 2003) prise en compte directe des formats html et xml En restitution des analyses génération automatique de rapports en hypertexte (DEA) mise en ligne des analyses (Collaborations) bases de données multidimensionnelles (Collaboration, Thèse?) mise au point d’indicateurs spécifiques (scientométrie, ...) produits ciblés d’intelligence économique (brevets, alertes, …) 07/11/2003 TETRALOGIE


Télécharger ppt "Les logiciels de gestion et visualisation de l'information de l'I.R.I.T. : La Plate-forme TETRALOGIE Bernard DOUSSET dousset@irit.fr Institut de Recherche."

Présentations similaires


Annonces Google