La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

1 Proposition du lancement conjoint SECC/SR dune nouvelle action spécifique CNRS/STIC Claude Jard, IRISA/ENS Cachan-Bretagne, Rennes Jean-Bernard Stéfani,

Présentations similaires


Présentation au sujet: "1 Proposition du lancement conjoint SECC/SR dune nouvelle action spécifique CNRS/STIC Claude Jard, IRISA/ENS Cachan-Bretagne, Rennes Jean-Bernard Stéfani,"— Transcription de la présentation:

1 1 Proposition du lancement conjoint SECC/SR dune nouvelle action spécifique CNRS/STIC Claude Jard, IRISA/ENS Cachan-Bretagne, Rennes Jean-Bernard Stéfani, INRIA/Rhône-Alpes, Grenoble Réunion du RTP/SECC, Paris, le 16 juin 2003 Observation et supervision de systèmes complexes, répartis et dynamiques

2 2 Les enjeux : self-management n Avec l'avènement d'une informatique ubiquitaire, commande et administration de systèmes prennent une importance cruciale. n En effet, compte tenu des niveaux de complexité, des temps et des échelles de réaction impliqués, ces fonctions ne pourront être mises en oeuvre avec le seul moyen de « lhumain dans la boucle ». n D'où lenjeu que constitue la mise en place d'infrastructures auto- administrables, auto-reconfigurables, et, dans la mesure du posible, auto-réparables, tout en offrant des garanties de sûreté et de qualité dans leur comportement et les services offerts. Comment concevoir un observateur (outil capable d'inférer l'état d'un système à partir des observations disponibles) pour un système distribué, asynchrone, ouvert, reconfiguré dynamiquement, et de taille gigantesque ?

3 3 Des verrous scientifiques n Dynamicité : les caractéristiques, la configuration et la charge des systèmes concernés ne sont pas fixées à l'avance et peuvent évoluer au cours du temps (nouveaux éléments ajoutés ou enlevés dynamiquement, mobilité physique et logique, occurrences de pannes). n Répartition: les systèmes visés impliquent plusieurs éléments interconnectés, géographiquement dispersés, et doivent être conçus comme des collections de domaines de ressources et d'administration autonomes. n Multi-échelle : les systèmes visés comportent des éléments de traitement, de stockage et de communication de l'information caractérisés par des capacités très variables et mobilisables à des échelles différentes (hiérarchies de réseaux de processeurs et de noeuds de stockage). n Extrême irrégularité : les systèmes visés se caractérisent par une très forte hétérogénéité de leurs éléments et de leurs modes d'organisation; ils comportent des éléments aux capacités et aux fonctions très diverses, accessibles à des conditions et en fonction de politiques d'accès multiples et en constante évolution.

4 4 Le travail de prospective de laction : le traitement conjoint des aspects « observation » (système) et « supervision/diagnostic » (algorithme) n Les fonctions d'observation et de supervision sont des fonctions de base de la commande et de l'administration, intervenant dans toutes les fonctions de gestion standards (configurations, performances, fautes, sécurité, et coûts). n En présence de systèmes aussi complexes que de grands systèmes répartis, l'observation ne saurait être découplée de fonctions de diagnostic et d'analyse permettant de caractériser l'état d'un système. Laction devra émettre des propositions pour essayer de combler le fossé actuel entre les recherches sur le contenant (architecture système, composants logiciels) et celles sur le contenu (algorithmes de diagnostic et supervision, généralement fondés sur des modèles formels).

5 5 Quelques sujets de réflexion (I) n Instrumentation dynamique : l'observation d'un système repose à la base sur la pose de sondes (matérielles ou logicielles) permettant de détecter événements et changements d'états pertinents. Dans des systèmes hautement dynamiques, combinant différentes couches et niveaux de composants, il devient nécessaire de pouvoir poser des sondes d'observation à différents niveaux, non prédéterminés, et de pouvoir établir des corrélations entre les observations effectuées à ces différents niveaux (exemple du suivi de la consommation de ressources). n Gestion d'événements : l'observation suppose la capture d'événements pertinents au cours de l'exécution d'un système. Dans le cas d'un grand système réparti hautement dynamique, la capture d'événements pose des problèmes de détection et des problèmes de passage à l'échelle.

6 6 Quelques sujets de réflexion (II) n Modèles de systèmes et modèles de programmation : les constructions systèmes envisagées devraient idéalement être spécifier de manière formelle. Cela s'avère ici crucial pour connecter les outils d'observation à des outils spécialisés qui dépendent d'une modélisation précise du système, comme les outils de diagnostic pour la détection et le traitement d'événements. n Algorithmique répartie de diagnostic : fondée sur un modèle de production et propagation des événements (par ex. alarmes), elle doit non seulement être modulaire, mais aussi permettre de prendre en compte lévolution dynamique du système, éventuellement même par une modification en ligne du modèle. La robustesse de cette algorithmique demande à être particulièrement soignée vis-à-vis de lincomplétude inévitable du modèle et des observations.

7 7 Les équipes pilotantes Il s agit d une nouvelle coopération n Nouvelle équipe « télécom » en cours de construction à lIrisa (A. Benveniste, C. Jard) : équipe pluridisciplinaire mixte Irisa/ENS Cachan- Bretagne, capitalisant plusieurs années de collaboration sur le thème du diagnostic des réseaux de télécommunications (projets RNRT Magda) n Equipe SARDES (JB. Stéfani) : équipe mixte Inria/LSR, développant une approche formalisée de la construction des systèmes répartis. La pluridisciplinarité de laction se reflète par cette proposition de double reconnaissance RTP/SECC (pour laspect modèles formels et systèmes complexes) et RTP/SR (pour laspect systèmes répartis et composants logiciels). C. Jard et JB. Stéfani sont respectivement dans les comités de pilotage de ces RTP.

8 8 Des équipes partenaires n LIP6, Paris : L. Seinturier, P. Sens) - tissage dynamique d'aspects, détection de fautes, journalisation n LAAS, Toulouse (J.C. Fabre) - détection de fautes n LORIA, Nancy (O. Festor) - gestion de réseaux Partenaires étrangers intéressés par ce travail de prospective : ETH, Zurich (G. Alonso) - instrumentation dynamique, tissage dynamique d'aspects EPFL, Lausanne (R. Guerraoui) - canaux de notification (architecture, filtrage, routage), détection de fautes Univ. Michigan, US, (S. Lafortune) - diagnostic SED + contacts industriels des équipes : France-Telecom, Alcatel,...

9 9 Mode de travail Des réunions de travail régulières et ouvertes dans lobjectif : n de partager les avancées et réflexions des équipes sur les sujets de laction, n de rédiger un document de prospective avec des propositions de développement de ce nouveau sujet scientifique. n Si possible, développer un support à la réflexion en installant une plate- forme d expérimentation liant les partenaires du projet (chercher un autre appui logistique et financier)

10 10 The diagnosis problem : definition diagnoser telecommunications network supervision Fault propagation – causality Alarm interleaving – concurrence Distributed processing

11 11 The diagnosis problem : SDH example ADM alarm TF notification State_Change() alarm LOS notification State_Change() + vertical propagation alarm TF alarm LOS + vertical propagation OpticalSPITTPBdir ALS

12 12 Fault model-based approach Managed Objects (MIB) Topology / ConnectionsDevice (NE) specificities Diagnosis process alarms Fault Model diagnosed fault scenario(s) Experts knowledge Can be automated

13 13 Fault model-based approach: model inversion n Fault model replicates the fault behaviour of the network initial faults, their propagation, and the observed alarms n Diagnosis algorithms inverse the model! distributed dynamic programming methods n Uncertainties in the behaviour probabilities can be introduced in the model Diagnosis process observed alarms Fault model diagnosed fault scenario(s) fault scenario generated alarms

14 14 Fault model-based approach : methodology SDH Ring physical network topology network elements connections model > Behavioural model Montrouge n Structural model

15 15 Fault model-based approach : behavioural model n Elementary Sequence Diagram (UML extension) pre-condition: attributes, received messages action: sending messages, changing attribute values post-condition: attributes, sent messages Managed Object

16 16 Fault model-based approach : behavioural model detection of the emission interruption and respective actions detection of the emission interruption and respective actions detection of the absence of signal caused by the distant device detection of the absence of signal caused by the distant device automatic laser switch mechanism automatic laser switch mechanism actions in case of the absence of signal actions in case of the absence of signal

17 17 Fault model-based approach : correlation tree St OuenAubervilliers MontrougeGentilly TF LOS TF LOS MS-AIS disabled AU-AIS disabled AU-AIS disabled


Télécharger ppt "1 Proposition du lancement conjoint SECC/SR dune nouvelle action spécifique CNRS/STIC Claude Jard, IRISA/ENS Cachan-Bretagne, Rennes Jean-Bernard Stéfani,"

Présentations similaires


Annonces Google