1 Chip User's Club, Paris 16/10/20081 Sur les traces de OADymPPac … Le projet OADymPPac (Outils pour l'Analyse Dynamique et la mise au Point de Programmes avec Contraintes) auquel a participé Cosytec s'est terminé officiellement en L'un de ses thèmes concernait la réalisation de traces. On verra ici qu'il a tout juste servi à poser quelques jalons. C'est à suivre ses traces que nous nous inviterons ici, jusque dans leurs conséquences épistémologiques. Pierre Deransart UR INRIA-Paris-Rocquencourt
2 Chip User's Club, Paris 16/10/20082 Un budget de 162 M HT dont 20% de ressources propres 2900 scientifiques dont1000 doctorants 100 post doctorants 300 ingénieurs R&D 1500 emplois budgétaires dont 570 chercheurs 740 ingénieurs, techniciens et administratifs 300 stagiaires 8 centres de recherche INRIA (en 2008) 3700 personnes Chiffres clés Janvier 2007
3 Chip User's Club, Paris 16/10/20083 Localisations Équipe-projet INRIA hors site Centre de recherche INRIA INRIA Nancy Grand Est INRIA Grenoble Rhône-Alpes INRIA Sophia Antipolis Méditerranée INRIA Rennes Bretagne Atlantique INRIA Bordeaux Sud-Ouest Metz INRIA Lille Nord Europe Lannion Marseille Lyon Montpellier INRIA Saclay Île-de-France Siège Nantes Besançon Strasbourg INRIA Paris Rocquencourt Pau
4 Chip User's Club, Paris 16/10/20084 Nancy - Grand Est Paris - Rocquencourt Sophia Antipolis - Méditerranée Rennes - Bretagne Atlantique Grenoble - Rhône-Alpes Les centres de recherche Bordeaux - Sud-Ouest Saclay - Île-de-France Lille - Nord Europe
5 Chip User's Club, Paris 16/10/20085 Try to remember…. Sur la route de Rocquencourt par Pissaro … 2004, cest si loin…
6 Chip User's Club, Paris 16/10/20086
7 7 CONTEXTE, HISTOIRE De DiSCiPl à OADymPPaC DiSCiPl ( ): améliorer le débogage des solveurs de contraintes: a produit des prototypes qui restent des outils « ad-hoc » pour la correction et lanalyse de performances. Ce projet a mis en évidence lutilité dapproches semi automatiques basées sur lanalyse visuelle des traces. Livre: P. Deransart and M. Hermenegildo and J. Maluszynski, Analysis and Visualization Tools for Constraint Programming, LNCS 1870, 2000 OADymPPaC ( ) URL: participants: A. Aggoun, T. Baudel, P. Deransart, M. Ducassé, F.Fages, J.D. Fekete, N. Jussien, C. de Sainte-Marie, … Challenges pris en compte: Interopérabilité des outils : séparation forte entre production de la trace et production dimages et analyse visuelle Passage à léchelle: possibilité de traiter des milliers de variables et contraintes en utilisant des IHM spécialisés Il en est résulté des analyseurs sophistiqués (prototypes et produits), mais limités à un seul domaine. Plusieurs problèmes ont été mis en évidence.
8 Chip User's Club, Paris 16/10/20088 PROBLEMES une question: cette approche est-elle généralisable? 1.Interprétation de la trace: donner un sens à une trace, modèles de reconstruction (analyse de trace, sémantique interprétative). 2.Sémantique de la génération de la trace pour une famille de processus observés (modèle de génération de trace, sémantique observationnelle). 3.Gestion du flot de trace entre lobservé et lobservant : filtrage, pilote de traceur, équilibrage des tâches, interactions, propriétés du transfert du flot (efficacité, préservation des sémantiques, fidélité) Liens avec domaines dapplications: event-condition-action models, analyse de flot de données (data stream), analyses comportementales (sciences cognitive)
9 Chip User's Club, Paris 16/10/20089 Les deux traces dun processus (Traces intégrales) Deux traces pour un processus Trace virtuelle T V = SO Trace effective T A = SI TVTV TETE I E E: extraction I: interprétation (reconstruction) E ° I = I ° E = i Notion de FIDELITE:
10 Chip User's Club, Paris 16/10/ Petit exemple (extrait de trace Prolog) goal:-p(X),eq(X,b). p(a). p(b). eq(X,X). chrono nu(u) lp(u) port pd(u) Etat virtuel atteint Call goal S Call p(X) S Exit p(a) S Call eq(a,b) S Fail eq(a,b) S Redo p(a) S Exit p(b) S Call eq(b,b) S Exit eq(b,b) S Exit goal S11
11 Chip User's Club, Paris 16/10/ Mais si on na que ça …? nu(u) port 1 Call 2Call 2Exit 3Call 3Fail 2Redo 2Exit 4Call 4Exit 1 Exit Que voit-on ?
12 Chip User's Club, Paris 16/10/200812
13 Chip User's Club, Paris 16/10/ PLAN: mises en perspective et challenges 1.Construction de traceurs pour lanalyse (dynamique) de programmes 2.Modélisation et abstraction 3.Fouille de données et interrogation de flots de données, Modèles ECA et WEB sémantique 4.Analyse du comportement humain 5.Cerveau, prothèse mémoire 6.Épistémologie Idée: les traces sont partout, travailler sur les traces, cest aussi travailler sur les idées
14 Chip User's Club, Paris 16/10/ Partout ? Gérard Berry 2007
15 Chip User's Club, Paris 16/10/ Construction de traceurs pour lanalyse (dynamique) de programmes 1.Développement perpétuel du traceur (trace intégrale) 2.Filtrage et interrogation de trace (langage de sélection dévénements), Pilote de traceur 3.Interactions (traceur serveur / analyseurs clients) 4.Optimisation de la communication (mais fidélité) 5.Approche MDA «composants traces » (enrichissement, fusion, abstraction, sélection) 6.Généricité
16 Chip User's Club, Paris 16/10/ C4RBCP T chrome V T CHR V T Rslam V T V Et interrogation
17 Chip User's Club, Paris 16/10/ Grand Challenge 1: conception et manipulation de traces (« algèbre de traces ») Enrichissement Sélection Fusion Abstraction Généricité
18 Chip User's Club, Paris 16/10/ Modélisation et abstraction Trace intégrale Niveaux dabstractions imbriqués
19 Chip User's Club, Paris 16/10/ Modélisation et abstraction (généricité)
20 Chip User's Club, Paris 16/10/ Grand Challenge 2: modèles de production de trace (SO) Linterprétation abstraite fournit un cadre théorique possible pour la SO Représentation possible de SO avec le « Fluent calculus » Implantation, simulations et vérifications possibles de traceurs pour un domaine de processus (« model checking », Clarke, Emerson, Sifakis, Turing 2007) Analyse théorique de traces (liens avec les théories de trace, The Book of Traces, 1995),
21 Chip User's Club, Paris 16/10/ Fouille de données et interrogation de flots de données WEB sémantique, Modèles ECA Trafic ADSL brut à la recherche du sens…
22 Chip User's Club, Paris 16/10/ Fouille de données vue comme analyse de trace Utilisation dalgorithmes danalyse de flots de données pour identifier les objets tracés (traces optimisées) Recherche de zones suspectes dans les programmes (Zaidman & al, 2005) Techniques de « model checking » pour pour détecter des intrusions (Garavel & al. 2004) sur des traces dexécution Observations de symétries (OADymPPaC)
23 Chip User's Club, Paris 16/10/ Analyse de flot de données vue comme analyse de traces dorigine inconnue Analyse de flux massifs (algorithmes probabilistes, Rabin 1980) Langage dinterrogation de flots de données (Arasu, 2002) Interactions entre observateur/observé et entre traces (modèles ECA et WEB sémantique, Alferes et al. 2004)
24 Chip User's Club, Paris 16/10/ Grand Challenge 3: interpréter les traces (SI) Utilisation dalgorithmes danalyse de flots de données pour identifier les objets tracés (identification des observables) Langage dinterrogation de traces: filtrage efficace Tracer les manipulations de connaissances
25 Chip User's Club, Paris 16/10/ Analyse du comportement humain Problème de confiance dans les données Formalisation des contextes (fusion de données), traces des contextes et du comportement humain Construction de scénarios à partir de traces Jusquoù peut-on ou doit-on aller? Approche des limites de lautomatisation
26 Chip User's Club, Paris 16/10/ Confiance dans les données (accès à la connaissance) Base de connaissance = système de règles = calculs Lutilisation requiert plus que du calcul: exploration, repérages, raisonnement (sans stratégie prédéfinie) Exemple: problème de certification des sites internet (ex loi du 13 août 2004 sur la certification des sites internet dédiés à la santé (Haute Autorité à la Santé)) HON code (Health On the Net): ex Qualification des rédacteurs Justification des affirmations Séparation contenus éditoriaux et publicitaires Transparence du financement Confidentialité des données personnelles, traces de la visite …
27 Chip User's Club, Paris 16/10/ Construction dun monde virtuel (Lyon1/INRETS) Trace virtuelle Trace effective
28 Chip User's Club, Paris 16/10/ An Infernal Example Le Monde de l'Intellligence, num 11 janv-fev-mars 08 Sudoku infernal p 60 (par Bernard Gervais)
29 Chip User's Club, Paris 16/10/200829
30 Chip User's Club, Paris 16/10/ Expérience Construire et comparer des traces dobservation du joueur et dobservation de lautomate permettant Danalyser le comportement du joueur Didentifier la règle utilisée par le joueur De mesurer la satisfaction du joueur De comparer avec la résolution automatique Didentifier les points de réelle difficulté du joueur De corréler de la difficulté pour le joueur et la difficulté théorique
31 Chip User's Club, Paris 16/10/ Grand Challenge 4: Analyse dun domaine de connaissance Construction de scénarios Limites de la formalisation (début du travail « humain ») La capacité à construire de « bonnes » traces est déterminant pour mener à bien une analyse
32 Chip User's Club, Paris 16/10/ Cerveau: lieu privilégié de fusions
33 Chip User's Club, Paris 16/10/ Trace effective T w t = séquence non bornée dévènements de trace w t de la forme w t : (t, A t ) t : chrono: temps de la trace A t : ensemble de valeurs dattributs
34 Chip User's Club, Paris 16/10/ La mémoire Mémoire personnelle: Memex (Vannevar Bush, 1945) Accumulation dévénements de trace (multimédia) Mécanismes liés à la mémorisation humaine: Axes (Chapoutier, 2006): Sensoriel Temporel (travail, épisodique / référence, durable) Abstrait (mémoire procédurale et mémoire implicite) Chaque mémoire a son mode de rappel (implicite, inconscient / explicite, conscient)
35 Chip User's Club, Paris 16/10/ Gand Challenge 5: artéfact de mémoire personnelle Axes: digitalisation/numérisation (sensoriel), rémanence et support (temporel), rappel conscient (abstrait) Vers une prothèse mémorielle? base de stances (Kiss, Quinqueton 2004) mécanismes de déduction et de rappel (LISFS, logical information system, Padiolo, Sogonneau, Ridoux 2004) mécanismes de tri (ontologies) et doubli Système de gestion de connaissances personnelles
36 Chip User's Club, Paris 16/10/ Épistémologie vue comme théorie de la connaissance Discrétisation-spatialisation/numérisation/manipulation Etapes: 20 siècles après début du néolithique premières numérations (astro) 12ième siècle AC système alphabétique (grammatisation) Imprimerie permet à lécrit denvahir la société 17ième siècle machine outil (reproduction du geste discrétisé) 1834 discrétisation sons et images Économie de limmatériel (gestion des connaissances) Le traitement de linformation joue un rôle dominant dans tous les domaines dactivité (industrie ou recherche) et dont la base repose sur une accumulation continue de traces….
37 Chip User's Club, Paris 16/10/ Grand Challenge 6: société vue comme systèmes de traces en interactions Le réseau numérique, à l'origine d'un nouveau modèle industriel Conférence de Bernard StieglerBernard Stiegler Les nouvelles technologies : révolution culturelle et cognitive Conférence de Michel SerresMichel Serres etc…
38 Chip User's Club, Paris 16/10/ Sur les traces de …. Thank you! Jusquoù ne risque-t-on pas daller trop loin? Lhomme réinventé?
39 Chip User's Club, Paris 16/10/ PROBLEMES REFORMULÉS une question: cette approche est-elle généralisable? 1. Méthode de construction de trace identification dobservables et définition des événements de trace selon les besoins dobservations 2. Interrogation des traces capacité à caractériser des sous-traces 3. Communication observé/observant dualité des traces ou lobservateur observé: interactions et moyens 4. Gestion du flot de trace: transmission, optimisation, restitution (propriétés, fidélité). 5. Positionnement en ingénierie dapplications besoin dune méthodologie
40 Chip User's Club, Paris 16/10/ [ Palmer,Gibbons, Faloutsos2, Siganos 2001] Internet graph: 285k nodes, 430kedges.
41 Chip User's Club, Paris 16/10/ Trace intégrale virtuelle T v t = séquence non bornée dévènements de trace de la forme e t :(t, a t, S t ) t: chrono: temps de la trace a t : type dévénement: un identificateur caractérisant le type daction qui a produit la transition de létat S t-1 à S t. a t appartient à un ensemble fini R. S t = p 1,t..., p n,t : valeurs des paramètres au temps t. S t est létat intégral virtuel courant