Yearly User CC-Lyon Summary J. Brunner CPPM Antares.

Slides:



Advertisements
Présentations similaires
Stockage et sauvegarde
Advertisements

Le stockage DAS,NAS,SAN.
Plan de formation Chapitre 1 : Présentation de SAP
GESTION D’IMPRISSION SOUS WINDOWS & LINUX
Botnet, défense en profondeur
Comment Protéger les bases SQL avec System Center Data Protection Manager 2007.
La sécurité en toute simplicité Solution daccès logique By ADDEXA.
Le serveur NAS Network Attached Storage, (NAS) désigne un périphérique de stockage relié à un réseau dont la principale fonction est le stockage de données.
Module 10 : Gestion et analyse de l'accès réseau
Module 7 : Résolution de noms NetBIOS à l'aide du service WINS
2-Generalites FTP:Protocole De transfert de fichiers sur un réseau TCP/IP. Permet de copier des fichiers depuis ou vers un autre ordinateur du reseaux,d'administrer.
Système de stockage réseaux NAS - SAN
Module 13 : Implémentation de la protection contre les sinistres
Dynamisez la gestion de votre atelier CNC.
Retour sur l'allocation d'espace Exemple sur une table facture (sans les tables associées) N° fact, N° Client, N° Cde, date Cde, date fact, date réglement,
Module 1 : Préparation de l'administration d'un serveur
Serveurs Partagés Oracle
Gestion des bases de données
Support des services et des serveurs
Module 8 : Maintenance des logiciels à l'aide des services SUS
Protéger Exchange avec System Center Data Protection Manager 2007
Gérer la sécurité des mots de passe et les ressources
Positionnement : Outil de supervision et d’administration spécialiste Les management packs de l’éditeur et la base de connaissance embarquée Rapidité.
Module 8 : Surveillance des performances de SQL Server
KRIKORIAN Pierre HILMI Brahim
Bases de données Open Source Pierre Crépieux 13/03/2008.
Agrégation de Liens A Guyancourt le
Heatbeat au LAL Marec erwan Charbonnel Jaclin.
EGEE is a project funded by the European Union under contract IST Noeud de Grille au CPPM.
Logs, backup, maintenance
Calcul CMS: bilan CCRC08 C. Charlot / LLR LCGFR, 3 mars 2008.
2-mars-2009Eric Lançon1 Nouvelles d’ATLAS Reunion LCG 2 mars 2009 Lyon.
CMS ATLAS LHCb CERN Tier 0 Centre at CERN National Centres Lab a Russia Lab c Uni n Lab b Manno Canada Uni y Uni x Tier3 physics department  Ge  Germany.
FTP : File Transfer Protocol (protocole de transfert de fichier ) est un protocole de communication destiné à l'échange informatique de fichiers sur.
PLAN Correction du RUSH 3
Positionnement : Outil de supervision et d’administration spécialiste Les management packs de l’éditeur et la base de connaissance embarquée Rapidité.
Tier1 at the CC-IN2P3 March Current state at the CC-IN2P3 storage, computation, network...
Déploiement LCG-2 Etat actuel au CC-IN2P3 Fabio Hernandez Centre de Calcul de l’IN2P3 Lyon, 22 juillet 2004.
GRID et ORACLE Travail de Session Par:Sofien Araoud Alain Boulanger Pour le Cours: INF7115 Session: Hiver 2004 Professeur: M. Robert Godin À la Recherche.
Service Challenge 4 – Tests de Débit Bilan pour le Tier-1 LCG-France Fabio Hernandez Responsable Technique LCG-France Centre de Calcul de l’IN2P3
Culture générale Deux types de stockage
PLAN ● L'instance – Création – Démarrer, Arréter et surveiller – Connexion / Utilisateurs ● Optimisations et interconnexions ● Administration et sauvegardes.
Centralisation des sites web d’ELTA & Mise en place d’un serveur NAS
Palaiseau Réunion CCIN2P3/LCG 22/07/2004 Distribution des données CMS Distribution des données et préparation de l’analyse Production MC distribuée et.
Initiation au web dynamique Licence Professionnelle.
Réalisé par : Grégory CORDIER Promotion : RIE03 UE : Management Social & Humain Réalisé par : Grégory CORDIER Promotion : RIE03 UE : Management Social.
Initiation à Oracle Server
V- Identification des ordinateurs sur le réseau
LHCb DC06 status report (LHCb Week, 13/09/06) concernant le CC : –Site currently fine / stable 3% of simulatated events 30% of reconstructed events –Site.
Mission 1 : Mise en place d’un cluster DHCP
-Transporter specifications sent for comments to Markus and Jean-Louis -We would like to have a mecanum transporter -Feedback from SEAQX: -For the same.
PubMed/Filtres (Cours de base: Module 5). Table des matières  Filtres par date de publication  Filtres par langage  Filtres par âge  Filtres par type.
10 février 2016 Informatique et Réseaux – Domaine de responsabilités.
RozoFS KPI’s edition /04/2014. © Fizians Ce document ne peut être reproduit ou communiqué sans autorisation écrite. 2 RozoFS high level architecture.
Système de récupération de données pour EMC Avamar.
TOUT SAVOIR SUR L’OFFRE INFORMATIQUE NOTRE PARTENAIRE : DELL.
Haute disponibilité pour les bases de données Osman AIDEL.
VEILLE TECHNOLOGIQU E LE CLOUD R. Mars al A. Guel louz B. Covo lo C. Eise nhauer G. Monn el.
PetaSky: Expérimentations avec HadoopDB et Hive 1 Amin Mesmoudi.
BaBar France 18/01/2010 Vincent Poireau 1 Page d’aide :
Migration du système de sauvegarde d’une infrastructure locale à un système centralisé IN2P3 101/06/2016 HEPIX Spring 2013 Muriel Gougerot (LAPP) and Remi.
Guide-Share Présentation du 24 novembre Didier SANSON 10/12/2004 © Natexis Banques Populaires Sommaire Nos solutions de backup Les sauvegardes.
Catalogues de fichiers de données. David Bouvet2 Problématique Possibilité de répliquer les fichiers sur divers SE  nécessité d’un catalogue de fichiers.
8 avril 2005Comité lcg France1 Comité LCG France du 8 avril 2005 Philippe GAILLARDON Équipe stockage URL Marchés de stockage.
Projet LCG: Vue d’Ensemble Fabio Hernandez Responsable Technique LCG-France Centre de Calcul de l’IN2P3 Rencontre IN2P3/STIC Grenoble, 25.
20-mars-2008Eric Lançon1 Activités ATLAS sur le nuage Français Emprunts a K. Bernardet, C. Biscarat, S. Jezequel, G. Rahal.
Page 1 Département Office Département des constructions et des technologies de l'information Département de l'instruction publique SIEF MEMO.
WINS Windows Internet Name Service. What is WINS?  It does name resolution (?!) DNS resolves IP numbers and FQDN ARP resolves IP numbers and MAC addresses.
CALCUL ATLAS LCG France (CC IN2P3 Lyon) 30 Avril SOMMAIRE Data Challenge 2 (DC2) d’ATLAS Utilisation du CC IN2P3.
Transcription de la présentation:

Yearly User CC-Lyon Summary J. Brunner CPPM Antares

Man Power Situation 2 Permanent Non-Permanent Setup of LCG

Budget development 3 Setup of LCG Approximately constant over last decade

Budget share 4

Development of Power Consumption Cooling crisis finished Power need reduced However price increases 5

Number of Cores in Batch Farm Doubled since 2009 : (!) Shared between GridEngine and LCG 6

Batch farm usage About 75 groups, slight increase over time 7

Batch farm usage 2012 Clear dominance HEP, Astro 10% Mhrs HS06 per month

Batch farm usage 2013 Still dominance HEP, Astro 13.6% Mhrs HS06 new groups per monthLSST, Euclid

Batch farm sharing (2012) HEP = LHC Astro : Antares 2 nd user –Total 0.171*0.1 = 1.7% –18000 * 1.7% = 300 cores –2 Mhrs HS06 per month KM3Net : Could take role of Antares 10

Batch farm in 2012 per month Large availability, smooth distribution –Broken –Wait –Run 11

Batch farm in 2013 per month Less smooth : GE upgrade, SL5  SL6 –Broken –Wait –Run 12

Antares batch farm usage 2012 Between 1-2 Mhrs per month 13

Antares batch farm usage 2013 About 3 Mhrs per month, little antares_prod 14

Antares batch farm usage Long term trend khrs in HS06 per year Real usage starts with data taking …

Mass Storage Tapes on HPSS with large buffer disks HEP even more dominant as for CPU 16

Antares mass storage 2013 About 200 TB per year on tape (HPSS) –Processed data plus MC (raw data 5TB/year) Currently about 100 TB on disk (sps) Delicate point : Garbage collections ! Most stored files ARE garbage 17

Services de base de données 18 Client Oracle Services Mysql Services PostgreSQL Services Internet

Infrastructure : Oracle 12 machines in production mode –13 DB clusters (11gR2) –56 TB total –515 accoutns 10 DBs with Data Guard (11gR2) 2 emergency servers 19

Infrastructure : Oracle RACDGAccountsSize Internal applications CC2Y GB Development2N72500 GB GRID services2Y46500 GB EDMS2N2016 GB Backup catalogs2Y1710 GB Symod : monitoring tools CC2Y36600 GB Experiments2Y GB IRODS2Y39200 GB Atlas4N GB AMI4Y59420 GB Opera2Y GB 20

Data Guard Infrastructure : Oracle 21 Switch FC 4GB/s 12 Serveurs avec double alimentation Lien 1GB/s Oracle PILLAR Redondance disque : RAID 50 + Spare 185 To SATA 30 To FC Lien 4GB/s Public IBM V7000 Redondance disque : RAID 6 + Spare 170 To SATA Lien 10 GB/s …

Infrastructure : Mysql 2 machines de production pour Mysql –4 serveurs Mysql (Actif – Passif ) –599 Bases de données –600 comptes –80 Go utilisés 1 machine de test pour LSST (5 To) 1 machine dédiée aux besoins spécifiques à certaines expériences –L’administration du serveur Mysql est gérée par l’expérience 22

Infrastructure : PostgreSQL 2 machines de production pour PostgreSQL 2 serveurs PostgreSQL ( Actif – Passif) –69 Bases de données –77 comptes –77 Go utilisés 2 serveurs PostgreSQL ( Maître –Esclave) –1 Base de données et 1 seul compte –440 Mo utilisés 3 serveurs PostgreSQL ( Maître –Esclave) E-tricks –Maître CC / esclave Impérial College et Luxembourg 23

Infrastructure : Mysql / PostgreSQL 24 Switch FC 4GB/s Lien 1GB/s Oracle PILLAR Redondance disque : RAID 50 + Spare 185 To SATA 30 To FC Lien 4GB/s Public Lien 10 GB/s IBM V7000 Redondance disque : RAID 6 + Spare 170 To SATA Mysql PostgreSQL Mysql LSST

Network connections Network managed by CC-Lyon Traffic load map One end point : Antares site 25

Network : External lines Antares-CPPM 100 Mbit/sec 30,000 Euro/year Similar situation with Modane (LSM) 26

Networking : Renater Plan for 2014 Connect Antares/Km3Net (IMP) directly to RENATER network 1GBit/sec Investment –50,000 Euro Yearly gain –30,000 Euro 27

GPU So far not supported at CC-Lyon No plan to install farm with GPUs Test GPUs are available We are invited to formulate a clear request Important for KM3Net simulations !! 28

END 29

Plan L’accès aux services de BDDs L’architecture des services Configuration des clients Infrastructure Sauvegarde Bilan 2013 Planning

L’accès aux services de BDDs 31 IP virtuelle Oracle MyAppService = (DESCRIPTION = (ADDRESS = (PROTOCOL = TCP)(HOST = myserver)(PORT = 1521)) (CONNECT_DATA = (SERVER = DEDICATED) (SERVICE_NAME = myservice) ) Oracle/Mysql/PostgreSQL Easy connect myserver:1521/myservice

Plan L’accès aux services de BDDs L’architecture des services Configuration des clients Infrastructure Sauvegarde Bilan 2013 Planning

L’architecture des services Mysql / PostgreSQL –Mode Actif – Passif –Basculement Automatique 33 Mysql Actif Node 01 Volume Logique Volume logique PACEMAKER Node 02 ccmysql Actif Mysql Actif ccmysql Actif Shared disk ccmysql:xxxx/myservice

L’architecture des services PostgreSQL –Basculement Manuel –Mode Maître / Esclave 34 PgSQL Actif Volume Logique Volume logique ccpgsql Actif PgSQL Actif en Read disk ccpgsql:xxxx/myservice ccpgsql Actif PgSQL Actif Node 01Node 02

L’architecture des services Oracle –Mode Actif - Actif –Répartition en fonction de la charge –Basculement Automatique –Oracle Recommande un client > 10g 35 Oracle Actif ASM ccdboraXX Actif Oracle Actif CRS ccorascanxx:xxxx/myservice Shared disk Node 01Node 02

CRS L’architecture des services 36 ASM Oracle Inactif ccdbora05 Actif Oracle Actif ASM ccdbora01 Actif Oracle Actif CRS Shared disk Réplication Data Guard Oracle Actif PRODUCTION SECOURS

Plan L’accès aux services de BDDs L’architecture des services Configuration des clients Infrastructure Sauvegarde Bilan 2013 Planning

Configuration des clients 38 IP virtuelle Oracle TNS MyAppService = (DESCRIPTION = (ADDRESS = (PROTOCOL = TCP)(HOST = myserver)(PORT = 1521)) (CONNECT_DATA = (SERVER = DEDICATED) (SERVICE_NAME = myservice) ) Oracle/Mysql/PostgreSQL Easy connect myserver:1521/myservice -> Le client est connecté au serveur, il émet une requête mais le serveur est en panne. Le client recevra un TCP timeout au bout de 2 heures (valeur par défaut sous linux) Adapter la configuration TCP suivant vos besoins. -> Capturer les erreurs de connexion dans votre code pour réinitialiser le processus de reconnexion

CRS Configuration des clients 39 ASM Oracle Actif ccdbora05 Actif Oracle Actif ASM ccdbora01 Actif Oracle Actif CRS Shared disk Oracle Data Guard Oracle Easy connect myserver:1521/myservice

TNS : Transparent Network Substrate (DESCRIPTION_LIST= (LOAD_BALANCE=off) (FAILOVER=on) (DESCRIPTION= (ENABLE=BROKEN) (CONNECT_TIMEOUT=5)(RETRY_COUNT=3) (ADDRESS_LIST= (LOAD_BALANCE=on) (ADDRESS=(PROTOCOL=TCP)(HOST=myprodserver.in2p3.fr)(PORT=1521))) (CONNECT_DATA=(SERVICE_NAME=myservice.in2p3.fr)) ) (DESCRIPTION= (ENABLE=BROKEN) (CONNECT_TIMEOUT=5) (RETRY_COUNT=3) (ADDRESS_LIST= (LOAD_BALANCE=on) (ADDRESS=(PROTOCOL=TCP)(HOST=mystdbyserver.in2p3.fr)(PORT=1521))) (CONNECT_DATA=(SERVICE_NAME=myservice.in2p3.fr) ) Configuration des clients 40

Configuration des clients Capturer les erreurs de connexion dans votre code pour réinitialiser le processus de reconnexion Toutes nos base de données destinées à la production sont sous Data Guard Centraliser les chaînes de connexion le plus possible Configuration des paramétres TCP suivant vos besoins de disponibilité L’usage des librairies 11g est fortement recommandé 41

Plan L’accès aux services de BDDs L’architecture des services Configuration des clients Infrastructure Sauvegarde Opérations de Maintenance Planning

Plan L’accès aux services de BDDs L’architecture des services Configuration des clients Infrastructure Sauvegarde Opérations de Maintenance Planning

Sauvegarde Mysql –Sauvegarde complète avec journaux de transactions –Période : Toutes les nuits –Méthode : Mysqldump ( SQL format) –Destination : sur disque et bande –Rétention : 180 jours –Sauvegarde des journaux de transactions –Période : Toutes les 6 heures –Destination : bande –Rétention : 180 jours 44

Sauvegarde PostgreSQL –Sauvegarde complète avec journaux de transactions –Période : Toutes les nuits –Méthode : pgdump (SQL format) + pgbackup –Destination : bande + disque –Rétention : 180 jours –Sauvegarde des journaux transactions –Période : Toutes les 6 heures –Destination : bande –Rétention : 180 jours 45

Sauvegarde Oracle –Sauvegarde complète avec journaux de transactions –Période : Une fois par semaine –Méthode : RMAN –Destination : Bande –Rétention : 30 jours –Sauvegarde incrémentale avec journaux de transactions –Période : 6 / 7 jours –Méthode : RMAN –Destination : Bande –Rétention : 30 jours 46

Bon à savoir Possibilité de restaurer une base de données / un compte à un instant précis dans le passé Avant de mettre à jour, en production, votre modèle données, demandez une sauvegarde personnaliser Identification de l’auteur d’une commande ( Oracle) Possibilité de rembobiner l’exécution d’une commande DELETE / UPDATE / INSERT (Sur Oracle seulement) IMPORTANT : EN CAS D’ERREUR DE MANIPULATION RELEVEZ L’HEURE DE L’OPERATION 47

Plan L’accès aux services de BDDs L’architecture des services Configuration des clients Infrastructure Sauvegarde Bilan 2013 Planning

Bilan 2013 Mise en place de l’infrastructure Data guard Renouvellement des machines Opera Mise à jour des 5 serveurs Mysql en 5.6 Mise à jour des 5 serveurs PostgreSQL en 9.2 Mise en place d’une infrastructure pour LSST et E-tricks OTRS : –21 incidents résolus –25 demandes traités 49

Planning 2014 Client Oracle sur AFS –Plateforme RHEL6 : Client Oracle disponible A PARTIR DE LA VERSION –Contrôler que toutes vos applications fonctionnent sur les librairies 11g Oracle : Migration d’Oracle vers –Eventuellement migration en fin d’année en 12C –Migration via Data Guard avec arrêt de service de l’ordre de la minute –Renouvellement de 5 machines Oracle et des switches FC Remplacement de la fonctionnalité Oracle STREAMS par Golden gate 50

Planning 2014 Mysql : Migration vers Mariadb 5.7 PostgreSQL : Migration vers PostgreSQL 9.3 Etude d’une plateforme Galera pour MariaDB (innodb) 51

Planning 2014 Procédure de renouvellement des comptes –3 incidents de SQL injection –Non respect de la charte informatique Publication des identifiants de connexion sur Internet Mise à jour de la liste des responsables de compte Une notification par mail sera envoyée à chaque responsable pour confirmer le renouvellement du ou des comptes –Sans réponse les 3 premiers mois, le compte sera verrouillé –Sans réponse dans les 6 mois qui suivent le verrouillage du compte, les données seront supprimées. 52

53 QUESTION ? Privilégier un contact via OTRS