Programme de la filière « Mathématiques pour l'ingénierie de la simulation »

 

Les enseignements de cette filière ont lieu à Saint-Étienne (École des Mines et Univ. Jean Monnet). Inscription obligatoire sur le site stéphanois. 

 

PREMIER SEMESTRE

1- « Analyse appliquée : des lois de la physique à l’analyse fonctionnelle »     

UE obligatoire, commune aux quatre parcours ; 6 crédits. 

  • De la physique aux équations aux dérivées partielles. Deuxième loi de Newton. Bilan des forces (gradient de pression, viscosité, Coriolis, gravité). Loi de continuité. Les grandes équations : Navier-Stokes, Euler.
  • Espaces de Sobolev. Grands théorèmes : injections, inégalité de Poincaré, théorème de Rellich. Extensions, calcul fonctionnel.
  • Théorie variationnelle elliptique. Lemmes de Lions-Stampacchia et Lax-Milgram. Problèmes de Dirichlet et de Neumann. Théorie spectrale des problèmes aux limites. Méthode de Galerkin.
  • Problèmes paraboliques. Construction de solutions approchées, estimations sur les solutions approchées et compacité. Passage à la limite.
  • Problèmes hyperboliques scalaires. Notions de solutions faibles, non unicité. Solution entropique. Construction de solutions de viscosité.
  • Prise en compte des conditions aux limites pour les problèmes elliptiques et paraboliques.
  • Méthodes numériques : éléments finis, différences finies, volumes finis, méthodes spectrales. Comparaison entre les différentes approches. 

 

2- « Modélisation stochastique et statistique » 

UE obligatoire, commune aux quatre parcours ; 6 crédits. 

Cette UE est composée de deux parties : une partie "Processus stochastiques, modèles et méthodes numériques" (20h CM), et une partie "Modélisation statistique" (16h CM). La partie 1 est un complément des cours de théorie des probabilités de L3 et M1, orienté vers la modélisation des phénomènes aléatoires dépendant du temps. Son but est de présenter d'une part les outils théoriques de la modélisation par processus de Markov et d'autre part les algorithmes classiques de simulation de ces processus. La partie 2 a pour objectif de présenter quelques modèles fondamentaux en statistique : le modèle linéaire tout d'abord, puis le modèle linéaire généralisé permettant de gérer des situations plus variées, et enfin les principaux modèles permettant d'aborder les données temporelles. 

-- Partie 1 : "Processus stochastiques, modèles et méthodes numériques"

Généralité sur les processus, mouvement brownien. Martingales. Intégrale stochastique. Equations différentielles stochastiques, équation de Kolmogorov pour les processus de diffusion. Approximation et simulation de diffusion. Méthodes de Monte Carlo par Chaînes de Markov pour la simulation. Processus de Poisson, Chaînes de Markov à temps continu. Notion de générateur.

-- Partie 2 : " Modélisation statistique".

Rappels sur le modèle linéaire multiple, l'inférence dans ce modèle et les tests associés, ainsi que l'analyse des résidus et la sélection de modèles. Modèle linéaire généralisé : théorie et inférence. Cas particulier de la régression logistique. Modèles pour des données temporelles. Rappels de séries chronologiques. 

 

3- « Initiation au calcul scientifique intensif » 

UE obligatoire, commune aux quatre parcours ; 6 crédits. 

Ce cours a pour objectif de sensibiliser les futurs utilisateurs du calcul scientifique au développement de méthodologies de calcul sur les architectures contemporaines. Ces dernières ont un impact direct sur les performances en temps d‘exécution des algorithmes numériques. Cette problématique a conduit au développement et l’analyse de nouvelles méthodologies de calculs numériques, adaptées à ces architectures multicoeurs, pour la résolution d’EDP/EDO/EDA. L'accent sera mis à la fois sur l'aspect technologique et algorithmique, et sur leurs applications déterministes et stochastiques.

Programme du cours :
1) Introduction aux architectures de calcul :
Notions de base sur les architectures de calcul. Outils de programmation : langages, compilation, optimisation. Aspects théoriques du calcul réparti. Arithmétique flottante. Complexité, structures de données. Langage C++.
2) Algèbre linéaire :
Rappels sur les matrices, normes matricielles et le conditionnement. Calcul de valeurs propres et vecteurs propres : méthode de la puissance, puissance inverse Inversion de système linéaire : méthodes directes méthodes directes par factorisation (LU, QR), méthodes itératives classiques (Jacobi, de Gauss-Seidel et de relaxation), SOR, méthode de Krylov, GMRES. Préconditionnement. Résolution des grands systèmes linéaires creux, techniques de stockages creux. Résolution de systèmes non-linéaires : méthode de Newton.
3) Méthodes de décompositions de domaines - mémoire distribuée (MPI) :
Décomposition de domaine de type Schur primal, décomposition de domaine de type Schur Dual (FETI). Accélération de la convergence du problème interface (GCR, GMRES). Méthodes de Schwarz généralisées, Analyse de la convergence de ces méthodes (introduction de l’opérateur de correspondance Dirichlet-Neumann), Analyse de la propagation de l’erreur en espace, Accélération de la convergence de la méthode de Schwarz par Aitken. Préconditionneurs parallèles RAS de méthodes de Krylov. Décomposition de domaine en temps de problèmes non linéaires (EDO), conditions de transmission pour le couplage de modèles.
4) Algorithmes stochastiques - mémoire partagée (openMP / R-parallel) :
Algorithmes embarrassingly parallel (bootstrap, Monte-Carlo), ordonnancement des tâches et nombres pseudo- aléatoires en parallèle. Parallélisation d'un algorithme de type Monte Carlo Markov Chain (MCMC) et/ou d'un algorithme de classification de données (clustering hiérarchique CAH). Algèbre linéaire creux pour les chaînes de Markov. Utilisation de la mémoire et masse de données. 

 

4- « Exploitation mathématique des simulateurs » 

UE associée à la filière  « Maths pour l'ingénierie de la simulation » ; 6 crédits.

Le recours à la simulation numérique est de plus en plus fréquent lorsqu'on souhaite étudier ou optimiser des systèmes complexes (écoulements à grande échelle, modélisation de l'infiniment petit, crash tests numériques de véhicules, ...). Les simulateurs nécessitent souvent des temps de calcul importants ce qui les rend difficiles voire impossibles à exploiter quand ils sont utilisés de façon itérative (méthodes d'optimisation, propagation d’incertitudes par Monte-Carlo).

Les simulateurs sont alors remplacés par des « méta-modèles » obtenus par différentes méthodes, à partir d’un nombre limité d’exécutions du simulateur. L'objectif est de détailler les méthodes mathématiques qui peuvent être utilisées pour estimer certaines grandeurs d'intérêt (tels que les optimums, la valeur moyenne, ou l'influence de différentes variables) à partir d'un nombre limité d'évaluations à l’aide du simulateur.

Contenu :

  • Techniques de méta-modélisation : Le cours présentera un panorama des techniques de méta-modélisation: régression, réseaux de neurones, polynômes de chaos, processus gaussiens... Il se focalisera en suite sur la modélisation par processus gaussiens. Cette technique sera abordée du point de vue probabiliste mais le parallèle avec les espaces de Hilbert à noyaux reproduisant (RKHS) sera aussi développé.
  • Propagation d'incertitudes et analyse de sensibilité : Le but est d'utiliser les métamodèles vus précédemment pour répondre aux questions habituellement posées lors de l'utilisation de simulateurs numériques.
  • Planification d'expériences numériques : Ce cours abordera les méthodes classiques et séquentielles pour la planification d'expériences numériques. Le couplage avec les méthodes d'optimisation sera développé pendant un TP sur deux séances.
  • Optimisation continue : méthodes globales. Ce cours se focalisera sur les méthodes d'optimisation basées sur l'utilisation de métamodèles. Une attention particulière sera portée sur la recherche de minimums globaux. 

 

SECOND SEMESTRE

5 -  « Apprentissage statistique » 

UE associée à la filière  « Maths pour l'ingénierie de la simulation » ; 6 crédits.

Le but de cette UE est d'étudier différents modèles probabilistes et méthodes algorithmiques spécifiques pour l’apprentissage de données et de les mettre en œuvre sous R.

A l’issue de ce cours l’étudiant saura :

- comprendre les différents modèles statistiques de l'apprentissage supervisé et non supervisé, ainsi que les méthodes de validation de ces modèles ;

- reconnaitre la nature du problème posé et de mettre en œuvre les modèles appropriés - analyser et de faire une critique des résultats obtenus

- faire un rapport professionnel, synthétisant les résultats obtenus

Contenu :

  • Généralités : compromis biais/variance, validation d’un modèle.
  • Visualisation et réduction de dimension : analyse en composantes principales, analyse discriminante descriptive. Analyse factorielle des correspondances. Exercices pratiques avec études de cas - mise en œuvre informatique
  • Apprentissage non supervisé: règles d’association. En plus du cours théorique, un TP (ou une étude de cas) sera réalisé.
  • Apprentissage supervisé pour l’approximation : méthodes linéaires (régressions), réseaux de neurones, arbres, etc. Application à une étude de cas.
  • Apprentissage supervisé pour la classification : méthodes linéaires (analyse discriminante, régression logistique), méthode des plus proches voisins, machines à vecteur support (SVM). Application à une étude de cas 

 

6-  « Méthodes stochastiques de résolution des EDP » 

UE associée à la filière  « Maths pour l'ingénierie de la simulation » ; 6 crédits.

L’objectif théorique de cette UE est de donner une interprétation des EDPs en termes statistiques (vision « microscopique »). En particulier, on donnera une représentation probabiliste des EDP usuelles à partir de l’espérance de fonctionnelles calculées sur des trajectoires stochastiques. Ainsi ce cours de spécialité devrait permettre aux étudiants de lier les deux premiers modules du tronc commun.

L’objectif pratique sera de mettre en place des méthodes de résolution alternatives basées sur les représentations probabilistes précédentes et les techniques de simulation Monte-Carlo.

Des compléments seront abordés, présentant des méthodes « mixtes » utilisant à la fois des techniques déterministes (EF) et des techniques purement statistiques ou probabilistes (ACP).

Contenu :

  • -  Lien entre EDPs paraboliques ou elliptiques et processus aléatoires.
  • -  Représentation probabiliste des solutions des EDPs.
  • -  Méthodes de résolution des EDPs par techniques de Monte Carlo.
  • -  EDPs à coefficients aléatoires – Application aux domaines minces.
  • -  Problèmes à frontières aléatoires.
  • -  Méthodes de décomposition orthogonale propre (POD) pour la simplification de modèles. Méthodes POD-Galerkin. 

 

 

7- « Anglais scientifique » 

UE obligatoire, commune aux quatre parcours ; 3 crédits. 

Cette UE a pour objectif de faire acquérir aux étudiants des compétences en anglais scientifique, avec une focalisation plus particulière sur la rédaction de documents destinés à une publication dans des revues mathématiques. L'enseignement s'effectuera sous la forme de lectures commentées d'articles, de rédaction de rapports et de présentations orales, le tout en anglais. 

 

8- « Stage d'initiation à la recherche en ingénierie mathématique » 

UE obligatoire, commune aux quatre parcours ; 21 crédits. 

Le stage est encadré par un enseignant du master et un cadre de l'entreprise ou du laboratoire d'accueil. L'étudiant devra prendre en charge :

  • la recherche d'un stage dans une entreprise ou un laboratoire d'accueil pour une durée de 16 semaines minimum,
  • la rédaction d'un mémoire de synthèse structuré,
  • la soutenance orale de ce mémoire devant un jury composé au minimum des deux directeurs de stage.

Cette UE inclut aussi des cours de bureautique, préparation de CV, recherche de stage et d’emploi. Par ailleurs, elle inclut une initiation à la recherche par la participation à une série de séminaires de recherche.