Dept. TSI, Telecom ParisTech, Institut Mines-Télécom

Slides:



Advertisements
Présentations similaires
Branche Développement Cnet La communication de ce document est soumise à autorisation du Cnet © France Télécom - (Nom du fichier) - D1 - 11/01/2014 Diffusion.
Advertisements

Coopération/Distribution DEA Informatique Nancy. Content 4 Introduction - Overview 4 Coordination of virtual teams : –explicit interaction model –explicit.
Minimisation Techniques 1 Assimilation Algorithms: Minimisation Techniques Yannick Trémolet ECMWF Data Assimilation Training Course March 2006.
Les loisirs/Les passe-temps
29e CONFÉRENCE INTERNATIONALE DES COMMISSAIRES À LA PROTECTION DES DONNÉES ET DE LA VIE PRIVÉE 29 th INTERNATIONAL CONFERENCE OF DATA PROTECTION AND PRIVACY.
Exercice #14 1. I like science class because it is interesting.
Unité 2 La vie courante Leçon 3 Bon appétit
Révision des entiers positifs et négatifs. Résous (+2) x (-1)
Improving large-scale search engines with semantic annotations Damaris Fuentes-Lorenzo, Norberto Fernández, Jesús A. Fisteus, Luis Sánchez.
Learning Intention: To learn about the Euro currency.
How many colours can you remember?. Les vêtements I will learn about clothing and be able to use my knowledge of the colours to describe my clothing.
Les numéros à 1000 LEARNING TO COUNT TO Do you know from 1-20? The basis for counting to 1000 is knowing the numbers from 1-20 unneufdix-sept deuxdixdix-huit.
PERFORMANCE One important issue in networking is the performance of the network—how good is it? We discuss quality of service, an overall measurement.
Proposition d’une heuristique efficace pour l’ordonnancement des machines parallèles 1 Benjamin Vincent Nikolay Tchernev Christophe Duhamel Libo Ren 21e.
Traffic Sign Recognition Jacob Carlson Sean St. Onge Advisor: Dr. Thomas L. Stewart.
Master II BioInfo - Galaxy – Session Décembre 2016
Le big data: un changement radical pour les sociétés
5 Mins 2y+8=20 3f+2=2f+6 6t+1=t+11 3x+2=2x+7 2m+ 7=25 3j-2=19 8+j=15
To learn which sports to use with ‘je joue’ and which
WP5 : Initial design of the glider
Appel Futur & Ruptures 2016 Thèses d’excellence
Celebrating the Mathematics of Pierre Deligne.
Technologies de l’intelligence d’affaires Séance 13
1 Prévision d’une série chronologique par lissage exponentiel Michel Tenenhaus.
1 S Transmission Methods in Telecommunication Systems (4 cr) Transmission Channels.
Technologies de l’intelligence d’affaires
Strengths and weaknesses of digital filtering Example of ATLAS LAr calorimeter C. de La Taille 11 dec 2009.
Bonjour! C’est mardi! C’est la semaine de la fête annuelle de l’école. Thèmre: Voyage à travers les E.U. (Etats Unis) Soyez prêts à présenter les mini-projets:
Indirect Object Pronouns
These slides correspond to the description of the Virtual Retina simulator. The all work has been published in Journal of Computational Neuroscience 2008.
ELT Conversation IATEFL 50th Anniversary, 15 APRIL 2016
Big Data, Machine Learning & Targeting sur 400 Millions de users
The consequences of the.
G. Peter Zhang Neurocomputing 50 (2003) 159–175 link Time series forecasting using a hybrid ARIMA and neural network model Presented by Trent Goughnour.
Introduction to Computational Journalism: Thinking Computationally JOUR479V/779V – Computational Journalism University of Maryland, College Park Nick Diakopoulos,
Royaume de Maroc Université Hassan Premier Settat Faculté des Sciences et Techniques de Settat LA CLASSIFICATION K-MEANS SOUS R /MATLAB Master :Automatique.
La grille EGEE dans le monde et à Orsay
Generating Random Genomic Sequences and Structures with GenRGenS
Quelle est la date aujourd’hui?
CHAPITRE 5: Méthodes multivariables
CHAPTER 10: Discrimination Linéaire
Information available in a capture history
Point de départ In Level 1, you learned to use indirect and direct object pronouns. Now you will learn to use these pronouns together. © 2015 by Vista.
HOW DATA SCIENCE IS HELPING IN ARTIFICIAL INTELLIGENCE ? BOUAZIZ – AZZIZIGROUP A 01/10/20181.
“ Modélisation des effets des changements climatiques et des activités humaines sur la distribution d'espèces invasives de plantes Directeur de recherche:
IL EST HYPERCOOL!.
9-1 What is Creativity?. 9-2 Creativity is… Person Process Produce Press.
Quelle est la date aujourd’hui?
4.1.5 Je peux parler de mon avenir
Quelle est la date aujourd’hui?
Bienvenue Au monde des Pronoms.
Global Challenge Capteur de nuit Leçon 2.
Mon pays préféré Standard:
Point de départ You’ve learned how the passé composé can express past actions. Now you’ll learn another past tense, the imparfait (imperfect). © 2015.
4C Telling Exact Time.
Du / De la / Des L/O to learn to ask for ‘some’ of an item
Le temps (The weather) K. Holmes.
Jour 7 MOT DE PASSE:Jouir de - to enjoy
University : Ammar Telidji Laghouat Faculty : Technology Department : Electronics 3rd year Telecommunications Professor : S.Benghouini Student: Tadj Souad.
Le Climat : Un dialogue entre Statistique et Dynamique
Les couleurs.
Franck VIOLLET Direction des risques de marché et de modèle HSBC-CCF
Journée 2ème: introduction
La Maison.
Français 10/30/17 Ecrivez six phrases; trois cours que tu aimes et trois cours que tu n’aimes pas. What has three teeth and sixty feet? Le monde – the.
Mon rêve serait d’être chirurgien.
Over Sampling methods IMBLEARN Package Realised by : Rida benbouziane.
M’SILA University Information Communication Sciences and technology
Transcription de la présentation:

Dept. TSI, Telecom ParisTech, Institut Mines-Télécom Alexandre Gramfort Dept. TSI, Telecom ParisTech, Institut Mines-Télécom alexandre.gramfort@telecom-paristech.fr Projet Résilience Jan, 2015

Objectif Data challenges (10 minutes) Informations générales (15 minutes) Développer les outils de machine learning pour analyser les logs des machines sous SlapOS et “Apprendre à predire les pannes” Contraintes: Données volumineuses: Algorithmes avec complexité (quasi-)linéaire en mémoire et temps de calcul Nécessité de traiter les données sous forme de flot (pas tout en mémoire) Algorithmes supervisés et non-supervisés pour traiter des données non-étiquetées Facilité de déploiement des modèles sur le cloud

Choix Technologique Data challenges (10 minutes) Informations générales (15 minutes) http://scikit-learn.org

source: https://www.openhub.net/p/scikit-learn Scikit-Learn en quelques mots Data challenges (10 minutes) Informations générales (15 minutes) source: https://www.openhub.net/p/scikit-learn

source: https://www.openhub.net/p/scikit-learn Qui utilise Scikit-Learn? Data challenges (10 minutes) Informations générales (15 minutes) source: https://www.openhub.net/p/scikit-learn

Travail effectué Data challenges (10 minutes) Informations générales (15 minutes) Implémentation des méthodes de l’état de l’art en classification supervisé: Averaged stochastic gradient descent (ASGD) [1] Stochastic Average Gradient (SAG) [2] Implémentation d’un algorithme non-supervisé de clustering online: BIRCH [3] [1] Large-Scale Machine Learning with Stochastic Gradient Descent, Léon Bottou, http://leon.bottou.org/publications/pdf/compstat-2010.pdf [2] Minimizing Finite Sums with the Stochastic Average Gradient, Mark Schmidt, Nicolas Le Roux, Francis Bach, http://arxiv.org/abs/1309.2388 [3] Tian Zhang, Raghu Ramakrishnan, Maron Livny BIRCH: An efficient data clustering method for large databases.http://www.cs.sfu.ca/CourseCentral/459/han/papers/zhang96.pdf

Résultats: clustering BIRCH Data challenges (10 minutes) Informations générales (15 minutes) http://scikit-learn.org/dev/modules/generated/sklearn.cluster.Birch.html

Résultats: clustering BIRCH Data challenges (10 minutes) Informations générales (15 minutes) BIRCH has an almost linear complexity BIRCH scales to massive datasets like the logs of SlapOS http://scikit-learn.org/dev/modules/generated/sklearn.cluster.Birch.html

Résultats: Classification supervisée : Data challenges (10 minutes) Informations générales (15 minutes) The SAG solvers is about 10 times faster to reach optimal performance compared to alternative solvers present before in scikit-learn.

Résultats: Prédiction de panne dans le cloud Data challenges (10 minutes) Informations générales (15 minutes)