Data mining

Programme de l'Unité d'enseignement:

Méthodes et outils modernes de fouille de données pour l’aide à la décision. Ce cours permet de poser les fondamentaux de la fouille de données et de sensibiliser les étudiants aux différents problèmes rencontrés en fouille de données. Nous aborderons ainsi les thèmes suivants:

  •  Processus KDD
  •  Motifs ensemblistes (itemsets, règles d’association) et algorithmes/explorations classiques
  •  Fouille de motifs sous contraintes : étude et exploitation des propriétés des contraintes (anti-monotonie, contraintes convertibles, convexité)
  • Langage de motifs plus sophistiqués (concepts formels, séquences, graphes, graphes dynamiques, …)
  • (Bi|Co)-Clustering
  • Ouverture vers les problématiques actuelles.

Les différents concepts abordés seront illustrés sur des applications réelles (systèmes de recommandation, analyse de logs, analyse de réseaux sociaux, fouille d’opinion, détection d’événements, etc.). Leur mise en oeuvre sera effectué sur des plateformes libres (Weka, Knime, scikit-learn). Un intérêt particulier sera donné sur les problèmes liés au passage à l’échelle des différentes approches étudiées.

Mutualisation: entre les parcours Data Science maths et Data Science informatique.