7 DataScience Courses at ENSAE

Slides:



Advertisements
Présentations similaires
Primary French Presentation 2 Saying How You Are.
Advertisements

Est-ce que tu aides à la maison? Le Lundi Le Vendredi Le Mercredi Le Weekend Le but: To learn how to use the negative in French with chores ________________________.
How to solve biological problems with math Mars 2012.
Laboratoire de Bioinformatique des Génomes et des Réseaux Université Libre de Bruxelles, Belgique Introduction Statistics.
Double/multiple degree agreement ALMA MATER STUDIORUM – UNIVERSITÀ DI BOLOGNA Université D’Evry-Val-D’Essonne Ludwig-Maximilians-Universität in München.
UEO 3: Langue des affaires Semestre 6 Mme. Mountain.
Français 2, 12 janvier 2015 Ouvrez vos livres à la page 68. Faites #14. Ecrivez-le. What kind of tree can you find in a kitchen? le haricot – bean. C’est.
Experiments, Schedule & Access to the hall. Magdalena Kowalska.
J’aime: I like Je n’aime pas: I don’t like
Unité 2 La vie courante Leçon 3 Bon appétit. Thème et Objectifs Everyday life in France In this unit, you will learn how to get along in France. You will.
Les verbes français Objective: Understand the tense of the verbs and how to conjugate your very first verb.
I can use longer and more complex sentences by understanding and using comparisons.
La mémoire(1): Comment bien travailler
Telling time. To ask what time it is in French, say: Quelle heure est-il? To answer that say for exemple: Il est deux heures. (it’s 2 o’clock) → Always.
DESSINER ET GRIFFONNER LES LIGNES ET LES FORMES. Useful Verbs Utiliser – to use Créer – to create Représenter – to represent Donner – to give Démontrer.
PERFORMANCE One important issue in networking is the performance of the network—how good is it? We discuss quality of service, an overall measurement.
J’habite dans une petite maison. J’habite dans une maison jumellé.
Community Phylogenetics Hélène Morlon Amaury Lambert.
FSA/INGI - 5 septembre 2006 Application du Reinforcement Learning à un jeu de Markov de type évasion-poursuite Lionel Dricot Promoteur : Professeur Marco.
Chapitre 5. Modèles probabilistes continus Variable aléatoire continue et loi de probabilité continue Loi uniforme Loi exponentielle Loi normale Loi normale.
1MPES2 Multiply Polynomials
Où? d’Unité 3, leçon 6.
Présentation du cours Document No. 1.1
Dept. TSI, Telecom ParisTech, Institut Mines-Télécom
1 S Transmission Methods in Telecommunication Systems (4 cr) Transmission Channels.
Technologies de l’intelligence d’affaires Séance 14
1MPES2 Remarkable Identities
Statistics & Econometrics Statistics & Econometrics Statistics & Econometrics Statistics & Econometrics Statistics & Econometrics Statistics & Econometrics.
Chapitre 6: Réduction de dimensionnalité paramétrique
Les gammes de valeurs des paramètres
POPULATION GROWTH IN AFRICA EXHIBITOR: Papa Abdoulaye Diouf.
LOG770 Annexe A Éléments de probabilité
Basic Business Statistics, 10e © 2006 Prentice-Hall, Inc. Chap 1-1 Chapter 1 Introduction and Data Collection Basic Business Statistics 10 th Edition.
G. Peter Zhang Neurocomputing 50 (2003) 159–175 link Time series forecasting using a hybrid ARIMA and neural network model Presented by Trent Goughnour.
Author : Moustapha ALADJI PhD student in economics-University of Guyana Co-author : Paul ROSELE Chim HDR Paris 1-Pantheon Sorbonne Economics / Management.
Atelier sous régional sur l'intégration des données administratives, des données de masse et des informations géospatiales pour la compilation des indicateurs.
Les méthodes non paramétriques
CHAPTER 2: Apprentissage supervisé
CHAPTER 2: Apprentissage supervisé
Efficacité des algorithmes
CHAPITRE 5: Méthodes multivariables
Quelle est la date aujourd’hui?
CHAPTER 10: Discrimination Linéaire
Information available in a capture history
MATLAB Basics With a brief review of linear algebra by Lanyi Xu modified by D.G.E. Robertson.
Les formes et les couleurs
CS 790Q Biometrics Face Recognition Using Dimensionality Reduction PCA and LDA M. Turk, A. Pentland, "Eigenfaces for Recognition", Journal of Cognitive.
Quelle est la date aujourd’hui?
Systèmes ADAS: Assistant de contrôle de direction et de voies
Reconnaissance de formes: lettres/chiffres
Oral presentation - IRA
Progress check Learning:
Progress check Learning:
POWERPOINT PRESENTATION FOR INTRODUCTION TO THE USE OF SPSS SOFTWARE FOR STATISTICAL ANALISYS BY AMINOU Faozyath UIL/PG2018/1866 JANUARY 2019.
INTELLIGENCE ARTIFICIELLE
Calcul de précision dans le cas d’échantillons rotatifs: le cas des statistiques EU-SILC au Luxembourg 10e COLLOQUE FRANCOPHONE SUR LES SONDAGES, Lyon,
Paul Eluard Dans Paris.
L’école La maîtresse La cour En classe En rangs Le surveillant Le directeur Le chouchou Les camarades L’élève Les cahiers Le bureau Sage Embêté Meilleur.
Panorama of Recommender Systems to Support Learning
1 Numerical geometry of non-rigid shapes Introduction Introduction Alexander Bronstein, Michael Bronstein © 2008 All rights reserved. Web: tosca.cs.technion.ac.il.
4C Telling Exact Time.
Le Passé Composé (Perfect Tense)
Lequel The Last Part.
INTELLIGENCE ARTIFICIELLE
Le Climat : Un dialogue entre Statistique et Dynamique
Franck VIOLLET Direction des risques de marché et de modèle HSBC-CCF
INS Tunisia, Towards a fully SDMX compliant Information system
Over Sampling methods IMBLEARN Package Realised by : Rida benbouziane.
IMPROVING PF’s M&E APPROACH AND LEARNING STRATEGY Sylvain N’CHO M&E Manager IPA-Cote d’Ivoire.
Transcription de la présentation:

7 DataScience Courses at ENSAE Guillaume Lecué

ENSAE – Ecole Nationale de la Statistique et de l’Administration Economique

How to enter the building Bring an ID register on-line for your course

First semester starting next week: Statistical learning theory by Arnak Dalalyan Estimation non paramétrique by Cristina BUTUCEA Statistiques en grandes dimensions by Alexander Tsybakov Modèles à chaînes de Markov cachées et méthodes de Monte Carlo séquentielles by Nicolas Chopin Second semester starting last week of January: Geometric Methods in Machine Learning by Marco Cuturi Online learning and aggregation by Pierre Alquier A mathematical introduction to Compressed Sensing by Guillaume Lecué

Courses organisation Each course is about 20 - 30 hours long (course + TD + TP) Courses are mainly theoretical but closely related to applications (for some of them) Prerequisites: strong background in probability theory, mathematical analysis, convex optimization

Statistical Learning Theory Lecturer: Arnak Dalalyan Examen écrit Course contents (20h de cours / TD) Basic notions Three main problems of statistical learning: regression, classification and density estimation. Bayes predictor and links between the three main problems. Empirical risk minimization Density Estimation piecewise linear estimation bias-variance tradeoff minimax risk over the Holder classes Adaptive estimation bandwidth selection by minimizing an unbiased risk estimator Lepski's method thresholding in nonparametric regression

Course contents (24h de cours + 12 heures de TD/TP) Estimation non paramétrique Lecturer: Cristina BUTUCEA Examen écrit + petit projet en binôme Course contents (24h de cours + 12 heures de TD/TP) Infinite dimensional model or models with an increasing number of parameters Estimation Kernel methods Projection estimators (wavelet and Fourier basis) local polynomial, splines Hypothesis Testing hypothesis separation aggregation of test Confidence interval: combining estimation and test to construct confidence interval

Course contents (14 heures de cours et 8 heures de TD) Statistiques en grandes dimensions Lecturer: Alexandre Tsybakov Examen écrit Course contents (14 heures de cours et 8 heures de TD) Modèle de suites Gaussiennes Sparsité et procédures de seuillage Régression linéaire en grande dimension. Méthodes BIC, LASSO, Dantzig, square root lasso Inégalité d’oracle et sélection des variables Estimation de matrices de grande dimension de faible rang Sparse PCA Inférence sur les réseaux et modèle stochastique à blocs

Modèles à chaînes de Markov cachées et méthodes de Monte Carlo séquentielles Lecturer: Nicolas Chopin Examen : projet Course contents Modèles à chaîne de Markov cachée : modèle supposant un processus markovien X_t observé imparfaitement et avec bruit. Nombreuses applications en épidémiologie (X_t=nombre d'infectés), écologie (X_t= nombre d'individus), robotique/navigation/pistage (X_t=position du robot ou du véhicule), finance (X_t=volatilité de l'actif sous- jacent), etc. Filtrage (Apprentissage séquentiel) de tels modèles requiert le développement de méthodes de Monte Carlo spécifiques, permettant un traitement séquentiel rapide des données.

Geometric Methods in Machine Learning Lecturer: Marco Cuturi Examen : Mémoire avec implémentation (python) Goal: present recent methodological advances in machine learning grounded on geometric principles. data analysis in metric (DTW, Wasserstein, etc...) Kernel methods for structured data dimensionality reduction (Johnson-Lindenstrauss) for visualization (MDS, LLE/ISOMAP, kernel-PCA, …) and embedding (word embeddings, auto- encoders)

Course contents (21 heures de cours / TD) Online learning and aggregation Lecturer: Pierre Alquier Examen : Ecrit Course contents (21 heures de cours / TD) Apprentissage séquentiel Algorithme de gradient en ligne Agrégation (à poids exponentiels) en ligne Liens avec l'apprentissage statistique Introduction aux problèmes de bandits

Course contents (21 heures de cours / TD /TP) Compressed sensing Lecturer: Guillaume Lecué Examen : oral + notebook python Course contents (21 heures de cours / TD /TP) Complexité algorithmique relaxation convexe matrices aléatoires Algorithmes grandes matrices de faible rang détection de communautés dans les graphes