Data Visualization

Programme de l'Unité d'enseignement:

L’objectif de ce cours est de comprendre les principes de base visualisation d’information, et de maîtriser les outils permettant de visualiser de manière efficace des données, selon quatre axes :
Collecte de donnée web (“scraping”): On exposera la structure DOM de pages web, et scriptera des robots en Python afin de chercher les données là où elles se trouvent. On étudiera les API les plus populaires et les problématiques de nettoyage de données.
Principes de design: Il s’agit de comprendre les principes permettant de représenter efficacement des données (comment encoder différentes dimensions ? avec quels effets perceptifs ? principes de Tufte, etc.). Nous critiquerons des visualisations populaires, et proposerons des alternatives. Nous nous appuierons sur le logiciel de visualisation Tableau.
Aspects mathématiques et algorithmiques: Nous verrons que les données en hautes dimensions, ou trop nombreuses, peuvent poser des problèmes de visualisation. Nous étudierons des méthodes de clustering et réduction de dimension.
Visualisation interactive: Nous verrons enfin les principes de base d’interaction. Et verrons comment créer des visualisations interactives pour le Web grâce à la bibliothèque javascript d3.js.
Les étudiants rendront par ailleurs un projet en fin de semestre. Il s’agira d’une visualisation interactive web, avec screencast et rendu d’un rapport sous forme d’article scientifique.
 

Mutualisation: entre les parcours Data Science maths et Data Science informatique.