Programme de la filière « Mathématiques pour la biologie et la médecine : théorie et applications »

 

Les enseignements de cette filière ont lieu à l'Univ. Lyon 1 et à Écully (École Centrale)

 

PREMIER SEMESTRE

1- « Analyse appliquée : des lois de la physique à l’analyse fonctionnelle »     

UE obligatoire, commune aux quatre parcours ; 6 crédits. 

  • De la physique aux équations aux dérivées partielles. Deuxième loi de Newton. Bilan des forces (gradient de pression, viscosité, Coriolis, gravité). Loi de continuité. Les grandes équations : Navier-Stokes, Euler.
  • Espaces de Sobolev. Grands théorèmes : injections, inégalité de Poincaré, théorème de Rellich. Extensions, calcul fonctionnel.
  • Théorie variationnelle elliptique. Lemmes de Lions-Stampacchia et Lax-Milgram. Problèmes de Dirichlet et de Neumann. Théorie spectrale des problèmes aux limites. Méthode de Galerkin.
  • Problèmes paraboliques. Construction de solutions approchées, estimations sur les solutions approchées et compacité. Passage à la limite.
  • Problèmes hyperboliques scalaires. Notions de solutions faibles, non unicité. Solution entropique. Construction de solutions de viscosité.
  • Prise en compte des conditions aux limites pour les problèmes elliptiques et paraboliques.
  • Méthodes numériques : éléments finis, différences finies, volumes finis, méthodes spectrales. Comparaison entre les différentes approches. 

 

2- « Modélisation stochastique et statistique » 

UE obligatoire, commune aux quatre parcours ; 6 crédits. 

Cette UE est composée de deux parties : une partie "Processus stochastiques, modèles et méthodes numériques" (20h CM), et une partie "Modélisation statistique" (16h CM). La partie 1 est un complément des cours de théorie des probabilités de L3 et M1, orienté vers la modélisation des phénomènes aléatoires dépendant du temps. Son but est de présenter d'une part les outils théoriques de la modélisation par processus de Markov et d'autre part les algorithmes classiques de simulation de ces processus. La partie 2 a pour objectif de présenter quelques modèles fondamentaux en statistique : le modèle linéaire tout d'abord, puis le modèle linéaire généralisé permettant de gérer des situations plus variées, et enfin les principaux modèles permettant d'aborder les données temporelles. 

-- Partie 1 : "Processus stochastiques, modèles et méthodes numériques"

Généralité sur les processus, mouvement brownien. Martingales. Intégrale stochastique. Equations différentielles stochastiques, équation de Kolmogorov pour les processus de diffusion. Approximation et simulation de diffusion. Méthodes de Monte Carlo par Chaînes de Markov pour la simulation. Processus de Poisson, Chaînes de Markov à temps continu. Notion de générateur.

-- Partie 2 : " Modélisation statistique".

Rappels sur le modèle linéaire multiple, l'inférence dans ce modèle et les tests associés, ainsi que l'analyse des résidus et la sélection de modèles. Modèle linéaire généralisé : théorie et inférence. Cas particulier de la régression logistique. Modèles pour des données temporelles. Rappels de séries chronologiques. 

 

3- « Initiation au calcul scientifique intensif » 

UE obligatoire, commune aux quatre parcours ; 6 crédits. 

Ce cours a pour objectif de sensibiliser les futurs utilisateurs du calcul scientifique au développement de méthodologies de calcul sur les architectures contemporaines. Ces dernières ont un impact direct sur les performances en temps d‘exécution des algorithmes numériques. Cette problématique a conduit au développement et l’analyse de nouvelles méthodologies de calculs numériques, adaptées à ces architectures multicoeurs, pour la résolution d’EDP/EDO/EDA. L'accent sera mis à la fois sur l'aspect technologique et algorithmique, et sur leurs applications déterministes et stochastiques.

Programme du cours :
1) Introduction aux architectures de calcul :
Notions de base sur les architectures de calcul. Outils de programmation : langages, compilation, optimisation. Aspects théoriques du calcul réparti. Arithmétique flottante. Complexité, structures de données. Langage C++.
2) Algèbre linéaire :
Rappels sur les matrices, normes matricielles et le conditionnement. Calcul de valeurs propres et vecteurs propres : méthode de la puissance, puissance inverse Inversion de système linéaire : méthodes directes méthodes directes par factorisation (LU, QR), méthodes itératives classiques (Jacobi, de Gauss-Seidel et de relaxation), SOR, méthode de Krylov, GMRES. Préconditionnement. Résolution des grands systèmes linéaires creux, techniques de stockages creux. Résolution de systèmes non-linéaires : méthode de Newton.
3) Méthodes de décompositions de domaines - mémoire distribuée (MPI) :
Décomposition de domaine de type Schur primal, décomposition de domaine de type Schur Dual (FETI). Accélération de la convergence du problème interface (GCR, GMRES). Méthodes de Schwarz généralisées, Analyse de la convergence de ces méthodes (introduction de l’opérateur de correspondance Dirichlet-Neumann), Analyse de la propagation de l’erreur en espace, Accélération de la convergence de la méthode de Schwarz par Aitken. Préconditionneurs parallèles RAS de méthodes de Krylov. Décomposition de domaine en temps de problèmes non linéaires (EDO), conditions de transmission pour le couplage de modèles.
4) Algorithmes stochastiques - mémoire partagée (openMP / R-parallel) :
Algorithmes embarrassingly parallel (bootstrap, Monte-Carlo), ordonnancement des tâches et nombres pseudo- aléatoires en parallèle. Parallélisation d'un algorithme de type Monte Carlo Markov Chain (MCMC) et/ou d'un algorithme de classification de données (clustering hiérarchique CAH). Algèbre linéaire creux pour les chaînes de Markov. Utilisation de la mémoire et masse de données. 

 

4- « Modélisation mathématique en épidémiologie » 

UE associée à la filière « Mathématiques pour la biologie et la médecine » ; 6 crédits.

Objectifs du cours : Présenter des modèles mathématiques (déterministes et stochastiques) simples et avancés pour la propagation d'une épidémie. Apprendre les techniques liées à l'analyse mathématique et numérique de modèles déterministes et stochastiques au sein d'une population donnée. Les modèles abordés dans ce cours sont essentiellement des modèles compartimentaux de type SIR, SIS, SIRS avec une possible prise en compte de la démographie et de l'hétérogénéité spatiale.

Programme du cours :

  • Introduction à la modélisation mathématique en épidémiologie. Présentation d'étude de cas historiques.
  • Modèles déterministes homogènes en espace : Modèle SIR de Kermack-McKendrick; Seuil d'épidémie; Modèle SEIR avec phase d'exposition; Modèle structuré en âge; Extinction, persistance; Stratégie de vaccination.
  • Modèles déterministes spatiaux : Equation de Fisher; Ondes progressives; Théorème de KPP; Modèle SIR avec diffusion; Modèle structuré en âge et espace.
  • Analyse numérique dédiée : Rappel général sur les schémas numériques (différences finies, volumes finis); Cas test de simulation numérique d'équations de transport, de diffusion et de transport-diffusion ; Simulation numérique des modèles SIS/SIR/SEIR sans prise en compte de la démographie, puis avec prise en compte de la démographie.
  • Processus de contact sur un graphe (ou modèle SIS stochastique). [Cette partie nécessitera quelques rappels de processus Markoviens en temps continu.]
  • Cas du graphe-complet (ou étude du modèle SIS stochastique en "champ-moyen'').
  • Transition de phase pour le processus de contact sur Z^d.
  • Graphes aléatoires et épidémiologie. Présentation de quelques modèles célèbres de réseaux aléatoire comme les graphes d'Erdös-Renyi, le modèle de Barabasi-Albert} (attachement préférentiel).
  • Percolation et résilience. Etude du processus de contact sur ces réseaux aléatoires et stratégie(s) pour éviter la propagation d'un virus. 

SECOND SEMESTRE

5 -  « Dynamique de populations - Partie I » 

UE associée à la filière  « Mathématiques pour la biologie et la médecine » ; 3 crédits.

Cette UE permet d’acquérir des bases solides sur les modèles usuels en dynamique des populations. Les formalismes de systèmes dynamiques les plus courants seront introduits : Processus stochastiques, équations différentielles ordinaires et stochastiques, systèmes discrets. L’accent sera mis sur l’étude qualitative des systèmes dynamiques et des méthodes de résolution et d’analyse numérique.

Programme du cours :

Processus stochastique de naissance et de mort
Équation maîtresse, Équation de Fokker-Planck, Algorithme de simulation stochastique. Lien avec les systèmes déterministes. Exemples de modèles de prolifération cellulaire.
Systèmes d’EDO nonlinéaire
Existence/unicité des solutions, Théorème de Hartman-Grobman, Linéarisation et stabilité linéaire, Classification des points fixes, Bifurcations de co-dimension 1 pitchfork, col-nœud, transcritique, Hopf, bifurcations de co-dimension 2*, systèmes bistables. Étude numérique avec logiciels d’analyse de stabilité et de continuation de bifurcation. Exemples de la dynamique des populations cellulaires (dynamique du HIV, croissance tumorale, cycle cellulaire) et en écologie/épidémiologie (Lotka-Volterra, modèles SIR,...).

Systèmes couplés en grande dimension
Oscillateurs (oscillateur de phase, modèle de Goodwin), Réseaux, Synchronisation d’oscillateurs. Étude du Modèle de Kuramoto, Entrainement de systèmes périodiques. Exemples et étude numérique de modèles pour la synchronisation d’oscillateurs circadiens, synchronisation du cycle cellulaire par l’horloge circadienne.

Systèmes discrets
Existence/unicité des solutions, Linéarisation et stabilité linéaire, comparaison avec les EDO, Application de Poincaré, Bifurcations de doublement de périodes, Chaos. Applications : Équation logistique, Matrices de Leslie. 

 

6 -  « Dynamique de populations - Partie II » 

UE associée à la filière  « Mathématiques pour la biologie et la médecine » ; 3 crédits.

Cette UE complète l’UE “Dynamique de populations (Partie I)”. Elle permet d’acquérir des connaissances approfondies sur l’étude de modèles usuels en dynamique des populations. Elle se base pour cela sur l’utilisation d’équations à retard et de modèles stochastiques, dont les propriétés fondamentales (stabilité, convergence) sont étudiées en lien avec les applications.

Programme du cours :

** Équations à retard en dynamique de populations.
Origine et motivation des équations à retard (théorie du contrôle, dynamique de populations, épidémiologie, modèles proies-prédateurs...) et lien avec les équations de transport hyperboliques, via les modèles structurés.
Différents formalismes (retards discrets, retard continu distribué, retard dépendant de l’état), propriétés fondamentales et comportement asymptotique : étude de la stabilité des solutions stationnaires (équation caractéristique et stabilité locale, fonctions de Lyapunov et stabilité globale) et existence de bifurcations de Hopf (solutions périodiques). Applications à la modélisation de dynamiques cellulaires (prolifération, différenciation, mort cellulaires).
** Équations stochastiques en dynamique des populations.
Processus de branchement : processus de Galton-Watson, processus de branchement multi-types.
Etude théorique des modèles de branchement. Influence de la dépendance en âge. Processus de coalescence et généalogie des processus de branchements. Simulation et inférence statistique des processus de branchement. Application à la modélisation des lignées cellulaires et de la différenciation. 

 

7-  « Statistique pour la grande dimension en génomique » 

UE associée à la filière « Mathématiques pour la biologie et la médecine  »   ; 6 crédits.

Objectif : L’objectif de ce cours est d’enseigner aux étudiants les outils et connaissances nécessaires pour appréhender des problèmes de grande dimension rencontrés en génomique. Plus précisément, il s'agit d'enseigner les notions permettant d'appliquer les techniques bien établies, d'appréhender la littérature récente sur le sujet et de développer de nouvelles solutions. Les outils et connaissances en jeu sont issus de différentes disciplines : la biologie/génomique pour appréhender le problème à traiter, la statistique pour anticiper les écueils des méthodes existantes, imaginer des approches adaptées et étudier leurs propriétés, l’analyse convexe pour la dérivation d’un problème d’optimisation adapté, et l’informatique pour l’implémentation de la méthode (i.e., la résolution du problème d’optimisation) ainsi que les comparaisons à l’état de l’art.

Synopsis : Dans ce cours, qui s’articule autour des quatre parties détaillées ci-dessous, sont abordés les thèmes suivants : description du type de données rencontrées en génomique (partie A) et des problèmes statistiques que posent ces données (parties A et B); présentation des solutions proposées dans la littérature (partie B), des propriétés statistiques des estimateurs correspondants (parties B et D) et des méthodes utilisées pour résoudre les problèmes d’optimisation sous-jacents (partie C).

Programme du cours :
A. Introduction aux données et problématiques rencontrées en génomique
1. Notion de biologie moléculaire : ADN, gènes, réplication, séquençage, annotation des génomes, épissage alternatif. 2. Génétique/génomique : locus, variation de séquence, recombinaison, déséquilibre de liaison.
3. Etude d’association génétique et régression pénalisée : types d’étude, structure des données, Lasso.
4. Essor technologique et grande dimension en génomique
B. Principe général de la minimisation du risque structurel
1. Problèmes d’inférence liés aux données de grande dimension : sur-apprentissage, compromis biais-variance, minimisation du risque structurel, complexité de Rademacher, symétrisation, dimension de Vapnik-Chervonenkis
2. Estimateurs pénalisés et minimisation du risque structurel
3. Exemples de pénalités classiques (et propriétés fondamentales) : Ridge (norme l2), Laplacien de graphe, Lasso (norme l1), norme trace, norme fused, elastic-net, group lasso. Lien avec l’estimation bayésienne.
4. Approches « non-paramétriques » : random forest, bagging, boosting, k- plus proches voisins.
5. Sélection des paramètres par sous-échantillonnage (cross-validation)
6. TP : comparaison de méthodes par simulation numérique.
C. Optimisation convexe non lisse
1. (Rappels sur les) fonctions convexes différentiables : définitions, existence et unicité, conditions d’optimalité.
2. Fonctions convexes non-différentiables : sous-différentielle, conjuguée, opérateur proximal.
3. Algorithme de points fixes : convergence, opérateur contractant, opérateur α-moyenné, Forward-Backward.
4. TP : minimisation d'un critère convexe non-lisse pour des problèmes de débruitage et de classification.
D. Propriétés statistiques des estimateurs Lasso
1. Généralités autour du Lasso : propriétés de sélection liées à la norme l1, lien avec le soft-thresholding, chemin de régularisation.
2. Consistance en terme de sélection de variable (sous conditions d’irrépresentabilité)
3. Consistance en terme d’erreur d’estimation et de prédiction (sous conditions de type Restricted Eigenvalue)
4. TD : extension au cas de la régression logistique. 

 

8- « Anglais scientifique » 

UE obligatoire, commune aux quatre parcours ; 3 crédits. 

Cette UE a pour objectif de faire acquérir aux étudiants des compétences en anglais scientifique, avec une focalisation plus particulière sur la rédaction de documents destinés à une publication dans des revues mathématiques. L'enseignement s'effectuera sous la forme de lectures commentées d'articles, de rédaction de rapports et de présentations orales, le tout en anglais. 

 

9- « Stage d'initiation à la recherche en ingénierie mathématique » 

UE obligatoire, commune aux quatre parcours ; 21 crédits. 

Le stage est encadré par un enseignant du master et un cadre de l'entreprise ou du laboratoire d'accueil. L'étudiant devra prendre en charge :

  • la recherche d'un stage dans une entreprise ou un laboratoire d'accueil pour une durée de 16 semaines minimum,
  • la rédaction d'un mémoire de synthèse structuré,
  • la soutenance orale de ce mémoire devant un jury composé au minimum des deux directeurs de stage.

Cette UE inclut aussi des cours de bureautique, préparation de CV, recherche de stage et d’emploi. Par ailleurs, elle inclut une initiation à la recherche par la participation à une série de séminaires de recherche.