MONITORING RÉSEAU AVEC PERFSONAR EN FRANCE : DÉPLOIEMENT ET EXPLOITATION Frédéric Schaer, CEA / DSM / IRFU / SEDI / LIS.

Slides:



Advertisements
Présentations similaires
CEA DSM Irfu Mises à jour de sécurité… … et la pratique F.SCHAER.
Advertisements

Nombre de job slot par machine Server_priv/node. Node1 np=2 Règle de 1 core = 1 job slot = 2 Go. Sur un bi-processeur bi-core on annonce alors np=4 Pas.
Fabio HERNANDEZ Responsable Grid Computing Centre de Calcul de l'IN2P3 - Lyon Lyon, 30 avril 2004 Déploiement LCG-2 au CC-IN2P3 Etat d’avancement.
GCstar Gestionnaire de collections personnelles Christian Jodar (Tian)
TuxFamily.org 07/09/ Présentation TuxFamily.org - (CC-by-sa)1 Historique ● 1999 : Lancement du projet d'hébergement ● Janvier 2004 : Piratage et.
1 Introduction Nouveau cadre de travail du service général.
Travailler à l'ensimag avec son matériel personnel (dans les locaux Ensimag ou depuis l'extérieur) 1.Introduction 2.La clé USB Ensilinux 3.Rappels : Accès.
Les Logiciels Libres en pratique Samedi 25 mars 2006 Toulibre
Réseau "Détecteurs semi-conducteurs" Journée instrumentation, Paris, 25 novembre 2013.
Gérald Masquelier Antoine Mottier Cédric Pronzato Les Firewalls.
Formation 1 - Formation INTEGRATION CONTINUE Intégration continue et méthodes agile.
Messagerie Open Source à la DGCP Implémentation réalisée par IBM et Pilot Systems Sylvain Viollon.
Windows NT/2000/XP Enjeux et contraintes techniques Douzième partie La sécurité C. Casteyde Document diffusé sous licence GNU FDL.
Fonctionnement interne d'un routeur (kurose p ) Eugen Dedu IUT Belfort-Montbéliard, R&T1, France avril 2009.
Février 2006X. Belanger / Guilde Introduction à. Février 2006X. Belanger / Guilde Qu'est ce que Samba ? ● Implémentation libre du protocole CIFS/SMB (client.
Scanning. Responsable : Remy FABREGES Objectif : découvrir des failles de sécurité, s’introduire dans la passerelle Outils : nmap, rooktits.
P.1 Mémoire de fin d’études Responsable en Ingénierie Réseaux Guillaume Jeanney Mise en place d’une solution de supervision LOGO ENTREPRISE.
Supervision Netflow / Cacti Etat de l’Art 16 Décembre 2009 Mastère Spécialisé Sécurité des Systèmes d’Information Projet 2009 / 2010 Frédéric BERTRAND.
Mise en place d’un système de partage de fichiers
L’IPv6.
Présentation Scribe NG Serveur pédagogique.
Sécurité - Configuration du PIX
Configuration - Diagnostics en ligne
Firewall Pfsense / Ipcop / Amon Présentation des firewalls
Situation Clued0 Eric Kajfasz (CPPM) Reunion D0-France 08/11/04
Tunnel pour paquets IP Multicast
SmarTeam-Coord : mandat, composition, activités
Circuits Omegapix2 3D Olivier Le Dortz, LPNHE Paris PPS Weekly Meeting 11 Mars
Séminaire EOLE Beaune Septembre 2007
Présentation et démonstration Jerry Bull, Université de Montréal
Modèle opérationnel de la grille
Réunion Opérations France Grilles – 6 juin 2017
Sécurité - Configuration de
Lustre au DAPNIA.
QoS - Appliquer la QoS à des Sous-interfaces
Module S41 Chapitre 9  Configuration de Microsoft Windows 7 pour fonctionner sur des réseaux Microsoft.
RI3 : Réseau des informaticiens de l’IN2P3 et de l’IRFU
Comment fonctionne RADIUS?
Etat des services grid de production
Point sur avancement du service de monitoring NAGIOS
Windows 7 NTFS.
Pierre Girard LCG-France Tier
2ème coloque LCG-France
Développement d’une application Android destinée aux commerciaux
Réunion coordination WLCG Lyon, le 13 mars 2008
Internet – s 3 choses à toujours garder en tête concernant internet:
Architecture de clients Duniter
Le Projet GRIF Efficient Handling and processing of
Exploitation et déploiement
TreqS TReqS 1.0.
Journées LCG-France Point IPv6
SRT2 APACHE.
Prise en main Emmanuel Braux Institut Mines Telecom / Télécom Bretagne
Introduction à la conception de site web
Janvier 2018 L3VPN RENATER LHCONE Janvier 2018
Outils et principes de base. Exemple d’application  Gestion de données d’enquête : Interface de saisie en ligne  insère directement les données dans.
Résolution d’un problème en 4eme : Vitesse d’un véhicule sur l’A9
IPv6 : État des lieux et perspectives
TGV Trigger Générique Vme Face avant Tri d’événements de physique
Introdution  Le test appartient à l'activité de Vérification et de Validation d'une application, qui consiste à déterminer si cette dernière a été développée.
Colloque organisé par le GTI MP – 18/10/2018
Michel Jouvin Comité des utilisateurs 14 Mai 2007
DC04 CMS Objectif Status Planning
TEST. API OK CONNECTION OK.
Packet Filtering: iptables
#weareswissbasketball
Intégration GRIF Michel Jouvin Comité Technique GRIF 28 Novembre 2005.
RE161 Répartition des adresses IP Le problème de la répartition des adresses IP dans le réseau doit être résolu avec comme objectifs : –de rendre le réseau.
FORMATION DANE NC RNE Le 05/09/2018
Transcription de la présentation:

MONITORING RÉSEAU AVEC PERFSONAR EN FRANCE : DÉPLOIEMENT ET EXPLOITATION Frédéric Schaer, CEA / DSM / IRFU / SEDI / LIS

DÉPLOIEMENT 2

RAPPELS 2 hôtes distincts recommandés pour wLCG  Bandwith  Latency Services réseau  httpd/apache  Des services démarrent des tests à la demande De nombreux ports ouverts perfsonarPS : validé pour CentOS5, i686  Fonctionne sous SL perfsonarMDM : validé pour RHEL, Debian, i686 etx86_64  Fonctionne sous SL, debian squeeze (wheezy ?) 3

DÉPLOIEMENT : PERFSONAR MDM V3.3 : 03/12/2010 4

DÉPLOIEMENT – MÉTHODES 5

DÉPLOIEMENT : PERFSONAR PS V3.2.2 : 20/04/2012 6

DÉPLOIEMENT : 3 METHODES La méthode netinstall-CD  Pas d’intégration au système de déploiement  Centos et non SL ou RHEL  Configs NTP/DNS/iptables/sudo/ssh/… ? La méthode LiveCD  Soit disant la méthode classique  Mêmes reproches que netinstall  En plus : mises à jour de sécurité ?? Le netinstall re-engineering  Permet d’utiliser l’OS de son choix  Etude du kickstart du netinstall officiel  Réécriture dans le système de déploiement  Appliqué à l’IRFU pour puppet : très peu de choses à faire au final (v3.2.2)  Appliqué pour quattor pour la version  Nécessite de ré-étudier les nouveaux KS pour les nouvelles releases (bugfixs). 7

DEPLOIEMENT PERFSONAR-PS - BIS 8

VERSIONS PERFSONAR ET MESHES Quattor : v3.2.1  Bidouille wLCG pour utiliser des MESH o Casse l’accès au registry global  Attention : o Redéfinit les serveurs NTP et DNS o Stoppe les firewalls Netinstall/manuelle/puppet/yum : permet d’utiliser la v  Contient des bug fixes  Toujours la même bidouille wLCG v3.3rc2 depuis le 14/3/2013  Contient une gestion native des mesh  RHEL 6.4 ?  Mais wLCG est-il prêt à l’utiliser ?  Mais toujours en RC 9

EXPLOITATION 10

LES MYTHES - 1 Un firewall diminue les performances perfsonar  Injustifié  Firewall IRFU : o Iptables  statefull  30 règles en input 2300 MO acceptés en 1J 2100 MO droppés ET logués  20 règles en output  IRFU IN2P3-CC o 892Mbits/s en moyenne o 0 à 4ms latency o Mais problèmes NTP/latence négative  CPPM IN2P3-CC o 810Mbits/s en moyenne o 2 à 4ms  Choix des perfsonar difficile, cf après 11

LES MYTHES

LES MYTHES – 2 BIS

MYTHES - 3 Un (full) mesh, c’est bien (?)  Actuellement : 1 test de bandwith *gigabit* de 30s toutes les 18000s o 600 slots disponibles o 11 slots utilisés par la MESH FR  Pour 100 sites o 1gbit utilisé durant 1/6 du temps  sur chaque site  Dans chaque sens  Sans compter les tests de latence  MESH FR + config locale IRFU ->all T1s o “Throughput tests will be running 12% of the time”  Last but not least : tests perfsonar-PS bidirectionnels ! o teste IRFU CPPM en bidirectionel MAIS ! o teste CPPM IRFU o Démultiplication de la bande passante utilisée ??  11 sites, x11 ? 14

PROBLEMES A RÉGLER Problèmes NTP  Certains tests affichent une latence négative (ex. IRFU  CC)  Utilisation de serveurs ntp différents. Filtrage NTP Beaucoup de perfsonars ne fonctionnent pas (correctement)  Pas en bidirectionnel (que que soit l’initiateur de test) o clrperf-owamp.in2p3.fr, psonar1.lal.in2p3.fr  Pas en bidirectionnel (seulement sur certains réseaux ?) o perfsonar1.icepp.jp : NOK côté CC, OK pour IRFU, OK côté japon vers CC ! Certains perfsonars semblent dysfonctionner o Reboot => amélioration des choses (5 minutes) o Tests erratiques : connection timeouts, closed  Debugging = coordination o 2 administrateurs système ( source et destination ) o 1 admin réseau o Du temps ? 15

PROBLÈMES À RÉGLER - 2 Résultats perfsonar incohérents avec stats kernel  1 test = 1gbit/s * 30s = 125 MiB/s * 30s = 3750MiB  Output ifconfig après 24H : Qui, officiellement et durablement, gère les meshs ?  Pour l’instant atlas/Eric Lançon (officiel ?)  Aidé parfois de (non officiel) Pourquoi le mesh wLCG est-il vide ?  CF Fichier wlcg ici : CF Fichier wlcg ici :   Mais bon, cf mythe 3… Quelles procédures de déploiement des mesh ?  Validations de syntaxe ?  Validation de la politique de tests ( * -> * ?) ? 16

PROBLEMES À RÉGLER – BANDWITH Bwth < 10mbits/s | NA Bwth < 100mbits/s Probleme resultats 1 numéro par site 0 vers 10, initié par 0 10 vers 0, initié par 10 17

PROBLEMES À RÉGLER – PACKET LOSS No test OR > 10 pour 600 < 10 pour 600 Probleme resultats Latence moyenne < 2 pour 600 Paquets perdus : (couleur) paquets perdus 0->10 avec 0 comme initiateur 18

PROBLEMES À RÉGLER – PACKET LOSS Interprétation :  Quelques pertes IRFU->*  LAL ne schedule aucun test  Mais LAL répond aux tests extérieurs  LPNHE, LPC et CPPM (4,5,7) répondent aux tests entrants initiés à l’extérieur  mais ne réussissent PAS à inititier sur les autres perfsonars des tests entrant o Filtrage sortant ?? 19

PROBLEMES À RÉGLER – PACKET LOSS 30 minutes plus tard… aucune perte de paquet (jaune) détectée. 20

BASIC DEBUGGING Bandwith : Latency : bwctl -f m -t 30 -i 1 -x -w 5M -c perfsonar03 owping lpnhe-gs9085.in2p3.fr 21

QUESTIONS EN SUSPENS Un wiki « perfsonar wLCG ops FR » est-il opportun ? La France peut/veut elle pousser ps-MDM (seule) ? « confidentialité » ?  A part les s ? 22