CH3. Les moyens mis en œuvre pour faire de la veille Processus mis en œuvre pour surveiller l’environnement Détermination des besoins d’information Sources d’information Traitements automatiques Diffusion : les livrables de la veille 1
Finalité La veille dans un domaine donné est une activité de surveillance permanente des connaissances sur ce domaine pour y déceler des signaux révélateurs de changements importants. La veille traque le repérage de ressources pertinentes et permet de maintenir un flux constant d’informations appropriées dans des champs d’intérêt précis. 2
Les objectifs stratégiques de la veille Anticiper Limiter les risques Progresser Innover Grandir Détecter les changements Détecter les dangers Détecter les écarts Détecter les idées nouvelles Détecter les partenaires 3
http://www.decisionnel.net/veille/ 4
1. Identification d’un problème décisionnel Décideur 2. Transformation de ce problème décisionnel en un problème de recherche d’information 3. Identification et validation des sources 4 collecte et sélection 5 traitement de l’information 6. Mise en forme des résultats Veilleur 7. Interprétation et prise de décision 5
La détermination des besoins POURQUOI fait-on de la veille, sur quoi, pour qui pendant combien de temps ? QUI va le faire ? Qui va être impliqué durablement dans le projet ? Avec quels moyens techniques et humains et combien cela va-t-il coûter ? Où va-t-on la faire (étendue géographique, linguistique) ? Pendant combien de temps ? et à quelle fréquence ? COMMENT va-t-on s’y prendre, avec quels outils, sur quels contenus, sources, avec l’aide de quels experts ? A QUI cela va-t-il servir, sous quelle forme doit-on diffuser les résultats, à quelle fréquence ? quels sont les destinataires 6
Nouvelle problématique Données Intelligence Information Disposer de données fiables, ciblées et anticipatrices 7
Qualification de l’information dans le contexte de veille L’information est évaluée ce qui la rend crédible Elle est sélectionnée ce qui permet de la hiérarchiser Elle est qualifiée elle est analysée et critiquée Elle est communiquée elle est accessible et fait sens Elle est (généralement) fraîche elle décrit l’actualité Elle a une valeur ajoutée, elle est donc utile 8
L’information formelle 9
L’information informelle 10
Web visible et web invisible 11 Source Digimind, Découvrir et exploiter le web invisible pour la veille stratégique
12 Source Digimind, Découvrir et exploiter le web invisible pour la veille stratégique
Répartition des sites du « deep web » 13 Source Digimind, Découvrir et exploiter le web invisible pour la veille stratégique
2 méthodes complémentaires pour identifier les sources d’information La méthode par mots-clés Requête par mots-clés sur les moteurs et métamoteurs Monitoring mot-clé La méthode sourcing Identification des sources d’exploration, abonnement aux flux RSS Pré-sourcing 14
Sources d’information à surveiller dans la méthode sourcing OPAC, catalogues d'éditeurs et de libraires Sites Web et portails thématiques Banques de données Dépôts d’archives ouvertes (mémoires, thèses, articles, rapports, …) Blogs, forums, listes de diffusion et wikis Bookmarks, pages de liens Agendas d’événements et de manifestations Presse Web invisible Etc. 15
Définition Sérendipité est un néologisme issu de l’anglais "serendipity". On définit la sérendipité comme le résultat d’une démarche qui consiste à trouver quelque chose d’intéressant de façon imprévue, en cherchant autre chose, voire rien de particulier. 16
Adresses mentionnées 1. Trouver des sites portails ou des sites fédérateurs Cismef.org - legifrance.gouv.fr - indexa.fr Opendirectory - Signets de la BNF – wikipedia http://www.tradeworlds.com/ http://www.objectifgrandesecoles.com/pro/secteurs/index.htm 17
Adresses mentionnées 3. Trouver des sites pointant vers une source déjà connue Exemple link :www.digimind.fr 18
La veille automatisée « … désigne tout le processus de traitement des informations jugées sensibles, depuis leur mise à disposition au système jusqu’à leur livraison à l’utilisateur sous différentes formes, en général condensées et graphiques. Ces formes de présentation plus suggestives permettent à l’utilisateur final de d’accroître sa compréhension du sujet. » (Ibekwe : 231) 19
La fouille de textes d’après (Ibekwe, 2007 : 41) Statistiques probabilités Informatique IA apprentissage Linguistique Visualisation de l’information La fouille de textes Extraction d’information Catégorisation de textes Classification de textes Filtrage d’information Résumé automatique Question-réponse Recherche d’information Découverte de motifs Criminalité (détection de fraudes) Détection d’opinion Veille commerciale et concurrentielle Découverte scientifique Veille S&T 20
La classification automatique 2 méthodes de statistique exploratoire multidimensionnelle Le clustering : former des groupes afin de structurer des données L’analyse factorielle : réduire le nombre de variables et visualiser les données
Yippy.com 22
http://www.exalead.com/search/ 23
http://www.cluuz.com/ 24
La cartographie d’information Une représentation graphique de données statistiques ou visualisation de données permet de donner des tendances.
Comment représenter un document dans un espace à deux dimensions ? D1 = je je vais D2 = je je je je vais vais D3 = je vais vais D4 = vais vais Représentation des documents sous la forme de vecteurs Va1 = {1, 1} Va2 = {1, 1} Va3 = {1, 1} Va4 = {0, 1} Vb1 = {2, 1} Vb2 = {4, 2} Vb3 = {1, 2} Vb4 = {0, 2} 26
Représentation vectorielle des documents D1, D2, D3, D4 (critère de fréquence) Fréquence du mot vais 1 2 3 4 V2 V1 V3 V4 27 Fréquence du mot je
Quintura.com 28
http://www.search-cube.com/# 29
http://miner3d.com/ 30
Le résumé automatique Un résumé automatique est une transformation réductrice d’un texte source vers un texte cible par extraction du contenu. Identification des concepts saillants Taux de compression inférieur à 1/3 du texte source
https://www.copernic.com/fr/products/summarizer// 32
http://libots.sourceforge.net/ 33
La traduction automatique La traduction automatique est une traduction effectuée par ordinateur, sans intervention humaine Il existe deux types de systèmes Fondé sur des règles linguistiques Fondé sur des statistiques
http://www.bmsoftware.com/globalinkpowertranslator6.htm 35
http://www.softissimo.com/ 36
http://www.synapse-fr.com/ 37
http://www.systran.co.uk/ 38
L’analyse sémantique de textes Ces méthodes sont souvent utilisées pour extraire des informations, par ex. détecter des motifs ou trouver des noms propres (les entités nommées)
http://labs.translated.net/extraction-terminologie/ 40
http://www.temis.com/ 41
Transformer du texte brut en information à valeur ajoutée Extrait Rachat Cible Acquéreur Lieu Date Montant Warner-Lambert Co. was acquired by Pfizer Inc. en 2000 Warner-Lambert Co. Pfizer Inc. in 2000 Cible Company Action Acquisition Acquéreur Company Lieu Temps ? Organise Catégorise Concurrents Produits Métiers 42
http://www.wolframalpha.com/ 43
Requête : 11 september 44
Les produits bruts Le RSS (Really Simple Syndication) est un système d’alerte qui permet d’être prévenu dès que de nouvelles informations sont publiées sur des sites web ou rendues disponibles par des moteurs de recherche où des bases de données. [Serge Courrier : p6]
Les agents d’alerte ou de surveillance : Update Scanner
http://www.pragtec.com/vigilus_smart.html
http://www.website-watcher.fr/
Newsletter Une newsletter, ou lettre d'information (terme recommandé en par la DGLF), ou infolettre ou cyberlettre est un document d'information envoyé de manière périodique par courrier électronique à une liste de diffusion regroupant l'ensemble des personnes qui y sont inscrites. [Wikipedia]