La présentation est en train de télécharger. S'il vous plaît, attendez

La présentation est en train de télécharger. S'il vous plaît, attendez

Projet nouveau Cursus :

Présentations similaires


Présentation au sujet: "Projet nouveau Cursus :"— Transcription de la présentation:

1 Projet nouveau Cursus :
Dominante Mathématiques et Data Sciences Titre de la présentation

2 Objectifs de la dominante MDS en sortie
La dominante Mathématiques et Data Sciences vise à former des ingénieurs maîtrisant la construction/l’utilisation/l’adaptation de modèles mathématiques évolués, potentiellement dans tous les champs scientifiques. Les modèles et leurs simulations sont un outil moderne crucial de conception et de prédiction de performance. L’observation (et l’extrapolation) de la situation actuelle amène au constat que deux grands axes méthodologiques se dégagent : l’élaboration de modèles adaptés à partir des données, sans entrer dans la description des phénomènes l’élaboration de modèles mathématiques qui décrivent et s’appuient sur la compréhension fine des phénomènes, la maîtrise quantifiée de leurs approximations, adaptés à la simulation numérique Ces deux aspects constituent des paradigmes complémentaires dans l’activité de l’ingénieur confronté à la conception et à la prédiction. Pour concilier ces deux vues, un tronc commun pourrait être mis en place :

3 CONTENU du tronc commun
Topologie, convergence, précision, robustesse, maîtrise de l’approximation Analyse fonctionnelle Modélisation multi-échelle de comportements fluctuants Processus stochastiques et leur dynamique d’évolution Analyse et prédiction pour des ensembles de données Statistiques Analyse et prédiction pour des données observées séquentiellement Séries temporelles Apprentissage non-supervisé, apprentissage supervisé, régression logistique, méthodes à noyaux, apprentissage profond, classification, régression Machine Learning Métriques de performance, recherche de la solution performante Optimisation Paradigmes Map-Reduce, et approches classiques du Calcul Haute Performance Bases d’algorithmique distribuée et parallèle

4 Dominante Mathématiques et Data Sciences ; Mention : Modélisation mathématique et Simulation numérique des Systèmes Complexes Définition / Libellé : Cette mention vise à former les ingénieurs qui conçoivent des modèles mathématiques adaptés à la simulation efficaces des systèmes complexes. Les points-clés sont la vision d’ensemble sur la chaîne qui mène de l’observation au produit et la compréhension fine des phénomènes. Cela nécessite un sens critique aigu et une prise de recul permanente, pour assurer la robustesse de la démarche et l’optimisation de la solution en termes techniques, économiques et de satisfaction du client. Les bases mathématiques et algorithmiques fournies aux élèves-ingénieurs de la mention les amèneront à être très rapidement performants. Il n’y a pas de premier emploi spécifique, mais plutôt une mise sur trajectoire d’ingénieurs de très haut niveau, qui construiront les outils futurs et seront des décideurs éclairés. Secteurs d’emploi et entreprises (dont partenaires) : compétences demandées dans toute entreprise dont l’activité mobilise de la simulation numérique, et dans de nombreux domaines applicatifs : Finance et assurance ; Transport : Aéronautique, Automobile, etc ; Energie : conception, distribution, maintenance ; Santé / pharma ; Météo ; Recherche académique et R&D tous secteurs Volume d’ingénieurs CS envisagé / an : 50 (demande moyenne par secteur mais forte sur l’ensemble) Types de problématiques d’ingénieur traitées dans la mention : Modélisation aléatoire et déterministe de phénomènes fluctuants (ex : marchés financiers) Maîtrise des risques industriels par modélisation et simulation de process dangereux sans expérimentation (ex : catastrophe nucléaire) Conception / optimisation de solutions innovantes par modélisation – simulation num (ex : aviation) Mise sur trajectoire : échelle de temps plus longue, positionné sur on forme pas pour le premier emploi, pas de cohorte, observation ; robustesse ; spectre large; ingénieurs à la pointe (pas de confort) ; invention de solutions et techno pertinentes/adaptées/optimisées technico/économique/satisfaction du client ; performance ; physique, éco, à recaler avec des données, validation entre les deux ; . outils génériques + état d’esprit ; bases de math qui permettent de décideurs ; Ruptures technologies associées (cf. liste segmentation de sortie) : Systèmes complexes (multiphysique, multi-échelle, interaction hard/soft, …) Virtualisation (conception)

5 exemples de problematiques
Evolution de l’imagerie du sous-sol chez Total

6 CONtenu Modèles mathématiques pour des phénomènes fluctuants
Systèmes dynamiques continus et discrets Equations intégro-différentielles EDP et analyse numérique multi-échelles, analyse asymptotique Modèles aléatoires et maîtrise des risques Processus stochastiques discrets et continus (chaînes de Markov, diffusions…) et leur dynamique d’évolution : calcul différentiel et équations aux dérivées partielles stochastiques Modélisation des risques financiers, risques biologiques, risques nucléaires… Maîtrise des risques, incertitudes par rapport aux performances d’une conception entièrement numérique Algorithmique parallèle et large échelle Algorithmes vectoriels, multi-cœurs et distribués Métriques de performance Exploitation de plates-formes de calcul Parcours fondamental entre Math et Physique Distributions, opérateurs Géométrie différentielle Systèmes désordonnés Groupes et algèbres de Lie

7 Dominante Mathématiques et Data Sciences ; Mention : Sciences des Données et de l’Information
Définition / Libellé : Cette mention forme des ingénieurs maîtrisant et concevant des méthodes d’analyse des jeux de données complexes à l’échelle de l’entreprise jusqu’à des données web-scale, l’enjeu étant de prévoir des phénomènes à venir et de parer à des défaillances, de disposer d’une aide à la décision dans une démarche d’optimisation, d’identifier toutes les traces d’activité d’une entité et de la reconstituer… Le Machine Learning et le traitement de l’information sont au cœur de cette mention, ainsi que les mathématiques statistiques et le traitement statistique du signal, et l’informatique distribuée du Data Engineering. Cette mention de Data Science se déclinera sur Gif avec plus d’enseignement en statistiques et sur Metz avec plus d’enseignement en informatique. Secteurs d’emploi et entreprises (dont partenaires) : Services, Commerce, Supply Chain… Transports, Fabrication/Production industrielle, Energie…. Industries du Web, e-commerce, systèmes de recommandation, services de sécurité… Robotique intelligente, Aide aux personnes (AAL) Santé / pharma Indication du volume d’ingénieurs CS concernés par an : 100 (50 à Gif et 50 à Metz) feedback -> optimisation ; large échelle; exploitation de données (Expérimentales); moins dans la phénoménologie; photo instantanée vs dynamique d’évolution Types de problématiques d’ingénieur traitées dans la mention : Analyse de données d’entreprises, de transactions, de comportements, et optimisation des process Analyse de flux de signaux et de BdD d’historiques, détection d’anomalies, compression de données : maintenance préventive, prévention des risques, et optimisation des installations Recherche d’information large échelle : moteurs de recherche, e-commerce, traque d’activité Ruptures technologies associées (cf. liste segmentation de sortie) : Data Sciences, big data, stockage et gestion de données massives Automatisation des métiers du savoir, IA, machine learning

8 Exemples de problematiques
Source : Livre blanc MathWorks sur le Machine Learning Météo et grande distribution Système de recommandation pour Netflix

9 CONtenu Mathématiques de l’analyse de données et du traitement de l’information Statistiques non paramétriques, régression, clustering Apprentissage Bayésien, par renforcement, modèles Markoviens… Apprentissage statistique (Machine Learning), Deep Learning… Recherche d’information, Analyse de graphes Optimisation discrète et distribuée, optimisation large échelle Distributions et traitement du signal Techniques de visualisation de données volumineuses Informatique large échelle du Big Data Exploitation des bases de données NoSQL large échelle Algorithmique et env. distribués du Map-Reduce (Hadoop, Spark…) Algorithmique parallèle du Machine Learning (cluster, GPU…) Méthodologie de mise en production de l’analyse de données Dimensionnement et choix de plate-forme, Organisation de la chaîne de traitement du flux de données

10 parcours De manière transverse aux mentions, deux parcours sont proposés aux élèves : Parcours Mathématiques et Physique, à l’interface entre les dominantes PNT et MDS, qui emprunte certains des cours du tronc commun de la dominante MDS et de la mention Modélisation mathématique et Simulation numérique des systèmes complexes, pour répondre à une demande de formation en sciences fondamentales de très haut niveau tout en bénéficiant du cursus CentraleSupélec Parcours Mathématiques Financières, dans la dominante MDS, qui, à l’issue des cours du tronc commun de la dominante MDS, se nourrit de cours de la mention Modélisation mathématique et Simulation numérique des Systèmes Complexes et de cours de la mention Sciences des Données et de l’Information, pour anticiper les besoins dans le secteur financier d’ingénieurs à la pointe modélisation/data.


Télécharger ppt "Projet nouveau Cursus :"

Présentations similaires


Annonces Google