Administrez vos plateformes selon les meilleures pratiques Mercredi 10 février 2010 Vincent Douhairie itSMF France - Président Commission Expertise Jean-Philippe Dupuich Microsoft - Consultant IT Operations
AGENDA Introduction : des conseils pour gérer votre infrastructure? Un référentiel : ITIL® (IT Infrastructure Library) Un cadre de travail: MOF (Microsoft Operations Framework) Une sélection de processus orientés « Administration » Transition : Changement, Actifs et Configurations, Connaissances Exploitation : Evénements, Incidents et Problèmes Pour aller plus loin… Conclusion
Introduction : des conseils pour gérer votre infrastructure? Un besoin exprimé… Beaucoup d’innovations Plus d’exigences des métiers La maitrise des ressources ($) … et nécessaire Position centrale de l’IT Position frontale de l’IT 70 à 80 % des défaillances non « techniques » Une session adaptée … Incontournable référentiel ! Pragmatiquement… Mais encore? … à une démarche volontaire! Repartez avec une idée Repartez avec un projet
(IT Infrastructure Library) Un référentiel : ITIL® (IT Infrastructure Library)
Qu’est-ce que l’ITIL? Un référentiel de Meilleures Pratiques pour la Gestion des Services IT Un ensemble de 5 livres principaux (V3) Un standard du marché Une approche par les processus Une focalisation sur le service et le client Une recherche de l’équilibre et de l’optimisation coût/qualité (efficience)
ITIL : Le Cycle de Vie du Service Domaines d’expertise Connaissance et compétences Méthodes de gouvernance Respect des standards Etudes de cas Modèles Adaptabilité Gains rapides Qualifications Aide à l’étude le Management Introduction pour Amélioration continue Conception Exploitation Stratégie Transition
ITIL : Etapes et Processus Processus de gouvernance du cycle de vie des services Processus opérationnels du cycle de vie des services Amélioration continue Stratégie Conception Transition Exploitation Demande Développement de la stratégie Mesure du service Portefeuille des services Finances Catalogue des services Niveau de service Capacité Disponibilité Continuité Rapport Sécurité de l’information Sous-traitance Planification et Support Changements Présenter la liste des processus par domaine décrits dans la V3 d’ITIL: Présenter l’évolution par rapport à la version V2. Bon nombre de processus ont été repris, Gestion des Incidents, Gestion des Changements, Gestion de la Capacité, Etc. Certains ont été « splittés » Gestion des SLAs et Gestion du Catalogue de Service Gestion de demandes (issues de la Gestion des Incidents) D’autres ont été ajoutés Gestion de la ss-traitance Gestion des accès Gestion des évènements. Actifs et Configurations Mise en production et déploiement Tests et validation Amélioration Evaluation Connaissance Evènements Incidents Demandes Problèmes Accès 8 Opérations ITIL V3 Les Fondamentaux Version 4.3 8/233
Un cadre de travail: MOF (Microsoft Operations Framework)
Qu’est-ce que MOF? Un ensemble de guides gratuits à destination des organisations informatiques afin de créer, exploiter et supporter des services IT avec un rapport attente/ investissement/ risque maitrisé MOF organise ses activités et ses processus sous forme de fonctions de gestion de services (Service Management Functions – SMF) regroupées en phases qui reflètent le cycle de vie des services IT MOF décrit des modèles pragmatiques (équipes, risques…) pour une mise en œuvre facilitée
MOF : Phases, SMF et MR
Une sélection de processus orientés « Administration » Transition : Changement, Actifs et Configurations, Connaissances
Transition ITIL : Changements Gestion des Changements, changements présents dans toutes les phases : Lancés comme support de la stratégie de l’organisation Conçus pour fournir de la valeur Construits et mis en production lors de la phase de transition Revus en exploitation Continuellement améliorés Quels changements ? Quelle trace ? Quelle mémoire ? Pour quoi faire ? Les connaissances Les prises de décision
Gestion des Changements Transition Gestion des Changements Création RFC (Demande de Changement) Autorisation Changement Mise à jour planning Enregistrement RFC Demande de travaux Mise à jour CMS Coordination implém. Changement Revue RFC Demande de travaux Revue et clôture Changement Evaluation Changement Rapport d’évaluation date
ITIL : Connaissance Utiliser la connaissance des services Transition ITIL : Connaissance Utiliser la connaissance des services Répondre aux besoins de la gouvernance IT Contrôler la politique qualité Garantir la rentabilité Maîtriser les services Suivre l’activité Satisfaire le client
ITIL : Connaissance Formaliser la connaissance des services Requêtes Transition ITIL : Connaissance Formaliser la connaissance des services Requêtes Analyse Rapports Modélisation Surveillance itSMF France Expertise VDO itSMF France Expertise VDO
ITIL : Connaissance Fédérer et organiser la connaissance des services Transition ITIL : Connaissance Fédérer et organiser la connaissance des services Modèles, cartographie, structures, synchronisation, réconciliation… Fédérer et organiser la connaissance des services Modèles, cartographie, structures, synchronisation, réconciliation… itSMF France Expertise VDO itSMF France Expertise VDO
ITIL : Connaissance , SKMS Transition ITIL : Connaissance , SKMS
ITIL : Actifs et Configurations Transition ITIL : Actifs et Configurations Disposer de sources fiables et structurées
ITIL : Actifs et Configurations Transition ITIL : Actifs et Configurations Fédérer et organiser l’information
ITIL : Actifs et Configurations Transition ITIL : Actifs et Configurations Traiter l’information
ITIL : Actifs et Config., CMS Transition ITIL : Actifs et Config., CMS
Un élément central du framework MOF : couche « Gérer » Un élément central du framework Une « couche » et non une « Phase » Changement et Configuration au sein d’une même fonction (SMF) La connaissance par le biais des compétences (Fonction « Equipe »)
Une approche Configuration : DCM (Desired Configuration Monitoring) Objectifs Périmètres Réduire les coûts associés aux configurations non conformes. Accroître la responsabilisation grâce à des normes de performance bien définies, des mesures précises et des communications actives. Anticiper les problèmes en élaborant des plans efficaces pour réduire les éventuelles perturbations lors des changements, des publications de versions et de la gestion de la configuration. Créer une culture de gestion proactive où la responsabilisation amène à des objectifs clairs. Transformer la gestion des changements d’une tâche réactive en une activité planifiée et prévisible. Service Mapping Service Mapping – Décomposition du Service IT Construction de la Carte de Service Définition des attributs Gestion des Changements Calendrier Microsoft IT des changements et de la publication de produits Outil Scorecard pour la configuration, les changements et la publication de produits Gestion de la Configuration Outil Desired Configuration Monitoring Modèles de configuration de Microsoft IT Publication de produits Modèle de stratégie de publication de produits de Microsoft IT Modèles de plan de publication de produits de Microsoft IT Conseils sur les rôles Livrables Carte de Service (Service Map) Plan de mise à jour Calendrier de gestion de changement Scorecard de gestion de changement Modèle de site Sharepoint
Une approche Changement : SUM (Software Update Management) Objectifs Périmètres Mettre en place un processus de gestion des correctifs basé sur les meilleures pratiques recommandées par Microsoft Evaluer la maturité du processus de gestion des correctifs à la gestion des correctifs et proposer des axes d'amélioration Améliorer le temps de déploiement des mises à jour Limiter les interruptions de service liées au passage de correctifs Phase 1- Evaluer La phase d’évaluation consiste à identifier les objectifs de la mission lors d’une réunion de lancement. A la suite de cette réunion, une évaluation du processus existant est réalisée et un plan d’actions listant les écarts identifiés est bâti. Phase 2- Créer Définition du processus cible et des rôles et les responsabilités. Cette phase s’appuie sur les recommandations et les écarts identifiés lors de la phase 1. Phase 3- Tester et Optimiser Mise en place d’une méthodologie d’évaluation du processus défini lors de la phase 2. Une série de réunion est planifiée à 30, 60 et 90 jours pour valider la mise en place du processus, discuter des axes d’améliorations et proposer des actions correctives. Livrables Rapport final détaillé (définition de la cible, analyse de l’existant, analyse d’écarts, SMAP, SLA/OLA, Facteurs critiques de succès) Matrice de flux et de rôles et responsabilités Outils d’analyse des risques Guide d’implémentation Plan d’amélioration continue et Plan projet détaillé (activités mensuelles)
Une approche Connaissance : RKM (Roles and Knowledge Management) Objectifs Périmètres Optimisation du planning, du management et l'exécution des tâches opérationnelles. Construction de la Carte de Service (SMAP), Identifier le périmètre des Responsabilités Optimisation des Rôles et Responsabilités Evaluation et affectation des tâches (Documentation requise, durée et fréquence de la tâche, responsabilité de la tâche/documentation, tâches a automatisée ?) Liste à jour des tâches opérationnelles et les instructions associées pour réaliser ces tâches, pour chaque technologie Microsoft en place. Mise à disposition d'un Portal collaboratif autour des tâches opérationnelles IT et de la documentation Rôles et Responsabilités Définition des bonnes pratiques pour les Responsabilités Attribution des responsabilités pour avoir une exécution efficace Définition des rôles pour une plus grande productivité et un meilleur partage des connaissances Tâches Amélioration de l'utilisation des ressources Assurance que les tâches recommandées pas Microsoft sont effectuées Attribution des tâches pour avoir une exécution efficace Amélioration dans le but d'être plus proactif Technologies Maintien de l'infrastructure dans un état optimisé et manageable Utilisation des outils de management pour l'automatisation Livrables 10 (ou plus si besoin) ateliers Carte de Service (SMAP) Modèle de l'organisation, définitions des rôles et responsabilités (Matrice RACI, Fiches métier) Liste des tâches (durée, récurrence), Attribution des tâches (assignées aux Rôles) Content Pack, liste à jour des tâches opérationnelles et les instructions associées, pour chaque technologie Microsoft en place. Portal collaboratif autour des tâches opérationnelles IT et de la documentation
Une sélection de processus orientés « Administration » Exploitation : Evénements, Incidents et Problèmes
Exploitation ITIL : Evènements Un évènement est un fait détectable ou perceptible qui a de l’importance pour l’infrastructure informatique ou la qualité des services délivrés. Pour une gestion efficace des opérations, les évènements inattendus se doivent d’être détectés par des outils de surveillance (monitoring) active ou passive des composants. Une Alerte est une notification émise par un outil de surveillance lorsque se produit un évènement inattendu ou lorsque l’état d’un composant informatique n’est plus conforme aux normes établies.
Gestion des Evènements Exploitation Gestion des Evènements Incident? Génération notifications Exception NON Gestion des Incidents Clôture évènements Détection événements OUI Revue Action Filtrage évènements Effective? Signification? date
ITIL : Incidents Incident : Exploitation ITIL : Incidents Incident : Une interruption ou une dégradation de la qualité d’un service non planifiée. Défaillance d’un élément de configuration qui n’a pas encore d’effet sur la qualité de service est un incident. Un incident majeur = impact le + élevé Solution de contournement : Manière connue de restaurer rapidement le service suite à un incident sans pour autant traiter les causes profondes du problème.
Gestion des Incidents Identification incidents Priorisation Incidents NON Clôture incidents Diagnostic initial Enregistrement incidents Escalade? Escalade N2/N3 OUI Catégorisation incidents NON Request? Investigation Diagnostic Résolution et restauration date
ITIL : Problèmes Problème Exploitation ITIL : Problèmes Problème Evénement dont la cause est inconnue occasionnant un incident significatif ou plusieurs incidents présentant les mêmes symptômes. Erreur connue Un problème dont la cause est connue et pour laquelle potentiellement une solution de contournement ou une alternative permanente est identifiée. Base de Données des Erreurs Connues (Known Error Database – KEDB) : L’objectif de la KEDB est de conserver la connaissance sur la résolution des incidents et problèmes traités afin d’accélérer leur diagnostic et leur résolution s’ils se reproduisent.
Gestion des Problèmes Détection problèmes Investigation Diagnostic Exploitation Gestion des Problèmes Détection problèmes Investigation Diagnostic Base erreurs connues Contour-nement? Enregistrement problèmes Clôture problèmes Création erreur connue Catégorisation problèmes Résolution NON Priorisation problèmes Change-ment? Gestion Changements OUI date
De la Production… à la consommation! MOF : phase « Opérer » De la Production… à la consommation! Maitriser votre vitrine Industrialiser vos activités Analyser votre IT Pro activité !
Une approche évènement : PMOM (Proactive Monitoring with Operation Manager) Objectifs Périmètres Passer d’un mode Réactif vers un mode Proactif Réduire les coûts opérationnels en implémentant un processus de monitoring et de suivi optimisé Augmenter l’efficacité des équipes IT par l’usage d’un outil Réduire la complexité et les coûts Simplifier l’identification des disfonctionnements Faciliter leurs résolutions rapide pour rétablir les services Prévenir de potentiels autres problèmes IT Utiliser efficacement les ressources IT Réduire le temps passé à identifier et résoudre les incidents Les acteurs de l’IT peuvent passer moins de temps à gérer les crises et plus de temps à délivrer de nouveaux service à vos clients / votre business. Approche basée sur le Service IT Introduction aux bonnes pratiques de l'IT Services Management Compréhension de l'environnement client Cartographie du Service Identification des composants qui font le Service IT Construction de la Carte de Service Définition des attributs Processus et outils permettant la gestion proactive des incidents et des problèmes basé sur l’expérience de Microsoft IT Livrables Processus (6 sessions) Cartographie des dépendances du Service => SMAP Rapport personnalisé et adaptation du processus Optimisation des alertes Définition des rôles et attribution Matrice d’escalade des incidents Revue des Problèmes Majeur et tendances Réduction du ratio alerte/incident Technologie Carte de Service (Service Map), outil « Service Map Designer » Paramétrage de PMOM et SCOM, outil « Management Pack PMOM »
Une approche Problème : Workshop Processus (ex: Problem Management) Activités du processus Chaque étape de l’organigramme des flux est découpée en tâches et activités individuelles, et pour lesquelles sont détaillés les éléments permettant de les mener à bien. Les activités à détailler dans le workshop sont : Contrôle des problèmes Identification et enregistrement du Problème Classification du Problème Investigation et diagnostic sur le Problème Demande de changement Contrôle des erreurs Identification et enregistrement de l’Erreur Evaluation de l’Erreur Enregistrement de la résolution de l’Erreur Fermeture de l’Erreur et des problèmes associés Mode pro-actif Analyse des tendances Initialisation d’actions préventives Workshop #2 Définition des rôles et responsabilités Les rôles suivants doivent être définis (de sorte que l’on puisse en extraire une fiche de poste) : Gestionnaire des Problèmes Gestionnaire des Incidents Centre de Service Niveau 1 Niveau 2 Niveau 3 Workshop #3 Organigramme des flux du processus L’organigramme doit prendre en compte les éléments suivants : Passage d’un incident à un problème. Règles d’escalade Demande de RFC Workshop #4 Documents et outils associés au processus Tous les documents et modèles documentaires sont réalisés une fois le processus et les procédures définies. Cela permet de s’assurer que toutes les informations obligatoires sont présentes.
Pour aller plus loin… Démarrer : où en êtes vous? S’outiller : la gamme System Center Partager : itSMF France
Démarrez par une évaluation Démarrez par une évaluation! (ex: Risk and Health Assessment Program for IT Operations – OpsRAP) Objectifs Périmètre Le déroulement de la mission OpsRAP permettra de: Fournir un bilan de santé des processus et fonctions de la gestion des Services IT Étudier de manière approfondie les processus clés nécessaires à la gestion du business IT Évaluer les rôles et responsabilités, l’assignation des tâches Prioriser les domaines sur lesquels il est nécessaire de se focaliser afin d’obtenir des quick-wins et de réduire de manière significative les risques Effectuer un transfert de compétences entre le consultant et les équipes de Service Management du client L'OpsRAP s’appuie sur les bonnes pratiques ITIL, MOF et sur la norme ISO/IEC 20 000 sur le périmètre suivant : 1. Service Strategy and Improvement – comment le SI est aligné sur la stratégie de l’entreprise, quels sont les plans d’amélioration continue mis en place en termes de service et de ROI est réalisé (sur le plan opérationnel mais aussi tout au long du cycle de vie du service et au niveau de la valeur business). 2. Service Design – comment est conçu un service pour qu’il soit implémentable dans le SI, avec étude des éléments (pré-requis, architecture, développement de la solution, métriques et résultats attendues) qui composent le service. 3. Service Transition – comment sont gérées, entres autres, la gestion des changements, la gestion des mises en production et la gestion des configurations ; tester et vérifier que tout est bien documenté avant de passer en production. 4. Service Operations – comment sont gérées les activités, opérations quotidiennes. Livrables Un rapport au format PDF de tous les risques/problèmes identifiés classés, avec une explication, une présentation des bonnes pratiques, une proposition de remédiation et une zone de commentaires Une présentation au format PowerPoint en support à la restitution Un fichier Excel détaillant le plan de remédiation et les actions associées (qui, quoi, quand, etc.)
System Center : au cœur des processus ! Orchestrate People, Process &Technology Deploy OS & Applications Assess Inventory & Compatibility Backup, Repair & Restore Manage User Access Monitor Performance & Configuration
Echanger , partager : itSMF France Les prochains rendez-vous à ne pas manquer : Le vendredi 12 mars à Grenoble : Les Rencontres pour l’Innovation du Service Le mardi 19 octobre au CNIT Paris La Défense : Conférence annuelle itSMF France Informations et contacts : http://www.itsmf.fr l.brunet@itsmf.fr
Conclusion Contacts : Equipe IT Operations Consultant Microsoft : frpremof@microsoft.com Informations itSMF France : info@itsmf.fr J-Ph. Dupuich : jean-philippe.dupuich@microsoft.com Vincent Douhairie : vincent.douhairie@amettis.fr