Machine Learning

Programme de l'Unité d'enseignement:

Méthodes et outils modernes pour l’apprentissage de modèles statistiques à partir de données et l’aide à la décision. L'UE sensibilise les étudiants aux différents problèmes qui se posent lorsqu’on cherche à extraire des connaissances dans les données pour résoudre des tâches de classification, d’estimation de densité de probabilité, et de régression. En TP, les étudiants se familiarisent avec R et scikit-learn sous Python.

Apprentissage supervisé, non-supervisé (classification automatique) et estimation de densité.
Principes généraux de l’estimation statistique.
Arbres de décision et forêts aléatoires,
Séparateurs à Vaste Marge (SVM)
Bootstrapping, Bagging, Boosting
Applications biologie, maintenance prédictive, marketing, business intelligence etc.
Prédiction de séries chronologiques
Problèmes liés au passage à l’échelle seront abordés.

Mutualisation: entre les parcours SITN, Data Science maths et Data Science informatique.