Des partenaires qui collaborent ensemble depuis de nombreuses années Investissement conjoint de 300M$ en R&D annoncé en 2006 Forte implication dans les Microsoft Technology Centers Partenariat sur le programme SQL Always On Conduite conjointe de projets afin de sécuriser les projets, engagements contractuels communs de bout en bout Des clients communs en production sur des applications Business Critical, certains depuis plusieurs années et versions FNAC.com Ciments Français (environnement SAP) Caisse Nationale des Caisses dEpargne LOréal Crédit Agricole
Assurer la production quotidienne des opérations en fournissant la puissance nécessaire aux applications Fournir un tableau de bord de pilotage de lactivité et danticipation des besoins Garantir une qualité de service stable et conforme au SLA en protégeant les données et leur accès Pannes matérielles et logicielles Erreurs humaines et agressions Facteurs externes liés à lélectricité, le réseau, la climatisation, lincendie…
Garantir la continuité des opérations Méthodologie Redondance et performances Solutions de haute-disponibilité Le point de vue de larchitecte, expériences projets Mettre en œuvre aux standards ITIL Supporter, changer, exploiter, optimiser Accompagner lexploitation au quotidien Le support technique, élément clé de la réactivité Anticiper les pannes
Réduire la perception de l'indisponibilité pour les utilisateurs Dialogue entre des responsables infrastructures et les clients internes Démarche application par application Quelle est la Qualité de Service attendue par les utilisateurs ? Combien d'utilisateurs utilisent-ils cette application? Est-il possible de chiffrer la perte d'une heure d'interruption de service? Quels sont les risques à couvrir en priorité? Quelle est la fréquence des pannes? Quelles sont les ressources déjà en place et quel est le budget d'investissement disponible?
RPO: Point de redémarrage JoursHeuresMinutes Transactions Désastre Corruption des données Erreurs humaines Perte de serveurs Opérations de maintenance Pannes du stockage Causes des interruptions de service 99.9%99.99%99.999% % 8.75h/an52min/an5.2min/an32sec/an Jours HeuresMinutes SecondesInstantané RTO: Temps de redémarrage Coûts
Redondance des composants LAN, SAN doublés Serveurs (alimentations, ventilation, RAID …) Baie de stockage (contrôleurs, cache, RAID …) Performance serveur SMP vs NUMA 32-bit, x64 ou IA64 Attachements SAN Performance dune baie de stockage Choix de la performance vs capacité Dépend de la performance du (des) contrôleur(s) et … du nombre de disques dont il(s) dispose(nt) pour exercer cette puissance Effet limité du cache en environnement transactionnel Overhead : réplication à distance, duplication de volumes … Répartition des profils dIO (random, séquentiel) Performance du back-end prédictible Tests : Microsoft SQLIOSim
Le principal enjeu est la restauration Qualité et rapidité de la restauration Protection multiple des données, protection des copies Capacité de reprise sur erreur humaine Utilisation des sauvegardes pour alimenter dautres plateformes (assurance qualité, dw) Selon les besoins, technologies complémentaires SQL Server 2005 Database Snapshot System Center Data Protection Manager HP Business Copy Snapshot Snapclone (copie complète) Orchestration via VSS (Volume Shadow copy Services) t t0t0 t2t2 T1T1 tape lib
SolutionRPORTOBascule automatique Impact sur les performances SQL2005 Database Mirroring mode Synchrone 100% Oui avec témoin Faible avec Network Roundtrip < 10msec Cluster local MSCS100%H+1minOui Reconnexion client Non
Miroir Données Log SQL Server Témoin Principal Données Log SQL Server Application commit
App A App B App A Cluster Adresse Serveur Virtuel
SolutionRPORTOBascule automatique Impact sur les performances SQL2005 Log ShippingH-15minH+30minNonFaible lié à lactivité IO SQL2005 Database Mirroring mode Asynchrone 99%H+5minNonFaible lié à lactivité IO Réplication de volumes à distance 100% en synchrone H+30minNonEn fonction de la distance Géo-cluster100%H+5minOui Reconnexion client Non
Principal Secondaire(s) Svg Journaux Réapplication des Journaux Copie des Journaux Principal
App A App B App A Cluster WAN App B App A App B App A App B HP Continuous Access
App A App B App A Cluster WAN App B App A Failover Failback HP Continuous Access + Cluster extension
Architecture type incluant sécurité locale (physique) et site de secours (logique) Cas de pannes RPO 100% RTO 1 minute Bascule automatique Maintient de la QOS Cas de désastre RPO 99% RTO 5 minutes Bascule manuelle Mode dégradé App A Cluster DB Mirroring asynchrone
Groupe Casino - Leader de la vente par Internet Application de Front-office Catalogues produits Gestion du panier de commande Plusieurs Clusters SQL Server HP Proliant DL585 Baies de stockage SAN en miroir Log shipping vers site de secours Évolution vers DB mirroring asynchrone à létude
La granularité est lapplication Disposer de ressources garanties pour la production Éliminer les Single Point Of Failure Dimensionner larchitecture en fonction de limpact du secours Définir la QOS en mode secours Protéger le système principal contre la panne du système de secours Anticiper les évolutions et les maintenances Entrainer les équipes sur la procédure de secours Le référentiel de mesure est lindisponibilité perçue par lutilisateur Détecter les pannes et les interruptions de service Définir les modes de bascule vers le secours et le retour arrière Rendre transparente la bascule
La mise en œuvre une solution simple est un gage defficacité Inutile de sécuriser la machine ou lapplication au-delà de la sécurité définie pour les données La simplicité permet de tester facilement Prendre en considération le plan de secours simultanément à la conception de lapplication ou à lévaluation dun progiciel Inclure la maintenance des postes utilisateurs Plus la procédure est simple, plus elle sera respectée ! Construire un système réaliste et évolutif Cas de panne RPO/RTO
Mettre en œuvre un plan de secours par lots Réduire les délais entre 2 lots Étapes intermédiaires concrètes offrant un premier niveau de service Pérenniser la connaissance, lexpérience et les équipes Conduire le projet au succès Conduire le projet au succès Rassurer sur le contrôle des délais et des budgets Rassurer sur le contrôle des délais et des budgets Acceptation et compréhension par les utilisateurs et léquipe projet Le nouveau système mempêche de livrer à temps le patch Les temps de réponse se sont dégradées avec le plan de secours Je ne comprend pas les nouvelles règles de sécurité, cest trop contraignant Communiquer, accompagner le changement Communiquer, accompagner le changement Créer des binômes avec les représentants des clients internes Créer des binômes avec les représentants des clients internes
Un Datacenter de 20TB et 200CPU x86, x64, IA64 mono & dual core Une équipe darchitectes pour vous aider dans vos choix technologiques Une démarche de conseil et daccompagnement Partage de l'expérience Microsoft et validation de l'architecture technologique Mise en place de Proof Of Concept Contacter votre interlocuteur Microsoft ou HP
Garantir la continuité des opérations Garantir la continuité des opérations Méthodologie Méthodologie Redondance et performances Redondance et performances Solutions de haute-disponibilité Solutions de haute-disponibilité Le point de vue de larchitecte, expériences projets Le point de vue de larchitecte, expériences projets Mettre en œuvre aux standards ITIL Supporter, changer, exploiter, optimiser Accompagner lexploitation au quotidien Le support technique, élément clé de la réactivité Anticiper les pannes
Le référentiel ITIL (Information Technology Infrastructure Library) a pour objectif de proposer des guides de best-practices en terme de gestion des services informatiques (administration, déploiement, support) dans une logique dévolution constante Gestion des niveaux de services et de configurations Gestion des changements et des mises en production Gestion des problèmes et incidents Microsoft et HP sont des membres actifs et contributeurs de la communauté ITIL et proposent des offres de services conjointes Microsoft Operation Framework HP IT Service Management Garantir le déroulement des opérations, contrôler les coûts et réduire les risques dun système en évolution constante
Supporter: résoudre rapidement les problèmes Niveau de contrat de support, rôles et obligations des membres de l'équipe Anticipation, métriques de référence Changer: garantir la stabilité Maintenance, évolutions applicatives Stabilité des performances Exploiter: valider l'efficacité opérationnelle et le TCO Supervision, sécurité, sauvegarde, administration Optimiser: coûts, performances, capacités, disponibilité Stockage, plan de secours et de continuité, montée en charge
Le modèle de processus MOF Revue dimplémentation Revue de mise à disposition de lapplication Revue de SLA Revue des opérations Changer ExploiterSupporter Optimiser Gestion de capacité Gestion de la disponibilité Optimisation des coûts Gestion des ressources Continuité de service Gestion de sécurité Help Desk, suivi des incidents, escalade Gestion des problèmes « Failover » & « Recovery » Gestion du changement Gestion de configuration Gestion des révisions Supervision et instrumentation Administration systèmes, services dannuaire, produits, réseaux, sécurité Sauvegardes, restaurations Travaux batch Microsoft Services (consulting et support) propose des prestations de services pour vous accompagner de « bout en bout », depuis les phases amont de réflexions, jusquà lexploitation des solutions conçues
Garantir la continuité des opérations Garantir la continuité des opérations Méthodologie Méthodologie Redondance et performances Redondance et performances Solutions de haute-disponibilité Solutions de haute-disponibilité Le point de vue de larchitecte, expériences projets Le point de vue de larchitecte, expériences projets Mettre en œuvre aux standards ITIL Mettre en œuvre aux standards ITIL Supporter, changer, exploiter, optimiser Supporter, changer, exploiter, optimiser Accompagner lexploitation au quotidien Le support technique, élément clé de la réactivité Anticiper les pannes
Enquêtes régulières sur les incidents support, la satisfaction globale, mise en place dun COS Points dactivité réguliers TAM / CSM Suivi du plan de services et des actions Point sur les projets majeurs Bilan 4 mois et 9 mois Gestion des escalades avec les équipes support Mise en place de services proactifs, gestion des compétences et planification des services Coordination des ressources Respect des délais Mise en place dun plan de service Axes de travail principaux Plan de support Planification des actions Informations techniques Transfert dinformations techniques Rapports mensuels dactivité Consommation du contrat Analyse des incidents Demandes traitées par le TAM Mise en place de Post-Mortems pour les incidents critiques Réunion dorientations et dinitialisation des services Présentation du contrat Définition des rôles Analyse de lexistant Organisation du client et interlocuteurs clés Identification des projets Connaissance et analyse du contexte du client Connaissance de votre contexte Méthodologie Coordination
Client Ingénieur Support (spécialiste) Responsable Technique de Compte (TAM) Manager Support Manager Situation Critique Responsable Technique de Compte (TAM) Manager Support Manager Situation Critique Ingénieur dEscalade (CPR) Développement de correctifs (QFE) Développement de correctifs (QFE) Client Support Groupe de développement CPR (Critical Problem Résolution) : Une équipe mondiale d'ingénieurs de haut niveau dont le but est de trouver des solutions aux problèmes critiques. En étroite collaboration avec les équipes de développement. Support partenaire
CPR (Critical Problem Résolution) : Une équipe mondiale d'ingénieurs de haut niveau dont le but est de trouver des solutions aux problèmes critiques. En étroite collaboration avec les équipes de développement. Client Ingénieur Support (spécialiste) Responsable Technique de Compte (TAM) Manager Support Manager Situation Critique Responsable Technique de Compte (TAM) Manager Support Manager Situation Critique Ingénieur dEscalade (CPR) Développement de correctifs (QFE) Développement de correctifs (QFE) Client Support Groupe de développement
Tester la stratégie de sauvegarde et restauration (régulièrement) Sur un autres système et/ou sur le system de production Noter le temps pour faire une restauration complète Prendre une image de son système en activité normale SQL Trace pour la capture des événements Readtrace pour générer des rapports dactivités SSMS Reports (en SP2 possibilité de rapports personnalisés) Que va demander le support Problèmes de performance, les rapports dactivité « normale » Les ERRORLOG donc penser à les conserver et archiver SQLdiag utilitaire de collecte dinformations
Simplicité Évolutivité Réalisme Anticipation Dialogue Maitrise des coûts Performances Maitrise du projet
SQL Server – Microsoft France Programme SQL Always On Webcast Technet
Sinformer - Un portail dinformations, des événements, une newsletter bimensuelle personnalisée Se former - Des webcasts, des articles techniques, des téléchargements, des forums pour échanger avec vos pairs Bénéficier de services - Des cursus de formations et de certifications, des offres de support technique Visual Studio Abonnement MSDN Premium Abonnement TechNet Plus : Versions déval + 2 incidents support
© 2007 Microsoft France Votre potentiel, notre passion TM